Departamento de Engenharia de Electrnica e Telecomunicaes
e de Computadores
Integrao de Informao Geogrfica
Ester Fernandes Gonalves (Bacharel)
Dissertao de natureza cientfica realizada para obteno do grau de Mestre em Engenharia Informtica e de Computadores
Orientadores: Professor-adjunto Porfrio Pena Filipe, ISEL Professor-adjunto Paulo Medeiros de Arajo, ISEL
Jri: Presidente: Professor-coordenador Manuel Martins Barata, ISEL Vogais: Professor-adjunto Porfrio Pena Filipe, ISEL Professor-adjunto Paulo Medeiros de Arajo, ISEL Professor-adjunto Joo Carlos Amaro Ferreira, ISEL
Maro de 2010
ii
i RESUMO A integrao de informao geogrfica disponvel em diferentes formatos levanta a necessidade de criar mecanismos de resoluo de incompatibilidades, tendo em vista facilitar a partilha e reutilizao de informao. No mbito desta dissertao, prope-se uma arquitectura que efectue a integrao de informao geogrfica. A arquitectura processa diferentes fontes de informao geogrfica com diferentes formatos. A informao geogrfica apresentada nas entradas transformada atendendo a um formato de representao interno e, aps ser realizada a sua integrao, disponibilizada em mltiplos formatos de sada. A arquitectura proposta modular e inclui o mdulo de leitura das entradas, o mdulo que associa as fontes de informao aos respectivos formatos, o mdulo de converso dos dados de entrada no formato de representao interno e o mdulo de integrao que gera os dados nos diferentes formatos de sada. Com o objectivo de avaliar experimentalmente a arquitectura, foi desenvolvido um prottipo. Foram processados exemplos de informao geogrfica relativos a cenrios de integrao que cobrem as funcionalidades da arquitectura, nomeadamente a incluso de novos formatos de informao geogrfica e a integrao de fontes de informao homogneas ou heterogneas. Os resultados obtidos confirmam que a arquitectura proposta adequada integrao de fontes de informao geogrfica e que uma contribuio vlida para a resoluo de problemas de interoperabilidade em sistemas de informao geogrfica.
ii
iii ABSTRACT The integration of spatial information available in different formats raises the need to establish mechanisms for resolution of conflicts, in order to facilitate the sharing and reuse of information. In this context, this thesis proposes an architecture that performs the integration of geographic information. The architecture handles many different sources of geographic information in different formats. The geographic information presented as input is transformed into a given format of internal representation, and after being integrated, is made available in multiple output formats. The proposed architecture is modular, including the module of input reading, the module that links the sources of information to their formats, the conversion module of input data into the format of internal representation and the integration module that generates the data in different output formats. With the aim to experimentally evaluate the architecture, a prototype was developed. Samples of spatial information were processed relating to integration scenarios that cover the architectural features, including the addition of new formats of spatial information, and the integration of homogeneous and heterogeneous information sources. The results confirm that the proposed architecture is suitable for integration of sources of geographic information and is a valuable contribution to the resolution of interoperability issues in geographic information systems.
iv
v PALAVRAS-CHAVE Sistemas de Informao Geogrfica, Geoprocessamento, Georeferenciao, Caracterstica geogrfica KEYWORDS Geographic Information Systems, Geoprocessing, Georeferentiation, Feature
vi
vii AGRADECIMENTOS O trabalho desenvolvido no mbito desta tese no teria sido possvel sem o contributo de vrias pessoas, aos quais no posso deixar de reiterar os meus agradecimentos. Ao professor Porfrio Pena Filipe, pela orientao paciente, a clareza de ideias, a constante insistncia nos pontos a melhorar e todo o apoio dado ao longo deste processo. Ao professor Paulo Arajo, pela enorme disponibilidade e o contributo sempre presente em todo o processo de desenvolvimento do trabalho e nas constantes e interminveis revises. Ao Eng. Pedro Machado, do Banco BPI, pelo apoio financeiro e logstico que facilitou o desenvolvimento deste trabalho. Eng. Sandra Castro, especialista em SIGs da ESRI, pelo enorme contributo na compreenso do funcionamento dos Sistemas de Informao Geogrfica, e ainda pelo tempo que dispensou, sempre com uma enorme disponibilidade. Ao Eng. Pedro Lopes, da Oracle, pela disponibilidade e apoio no esclarecimento de questes tcnicas, e por contribuir com uma viso global da integrao tcnica da informao geogrfica. minha famlia, sempre presente com uma palavra de apoio, e empurrando-me constantemente em direco a esta meta. Aos meus pais, Matilde e Antnio, pelo amor e carinho incondicionais que sempre demonstraram, e pelo constante apoio sempre presente em todas as vertentes pessoais e profissionais. s minhas irms, por serem maravilhosas como s elas sabem ser. Um agradecimento muito especial minha irm Rute, pela valiosa ajuda na reviso e formatao, pela discusso de aspectos relacionados com o tema desta dissertao, e sobretudo pela infinita pacincia e apoio que sempre, e incondicionalmente, disponibiliza.
viii Aos meus amigos, pela fora constante, sempre impulsionando para levar este trabalho a bom porto. Para todos estes, e tambm para todos aqueles que no nomeio por nome, mas que de alguma forma contriburam para este desfecho, o meu sincero obrigada.
22 de Maro de 2010
ix NDICE 1. INTRODUO................................................................................................................ 1 1.1. Motivao........................................................................................................... 2 1.2. Contribuio....................................................................................................... 3 1.3. Organizao da Dissertao ............................................................................. 5 2. SISTEMAS DE INFORMAO GEOGRFICA...................................................................... 7 2.1. A Interoperabilidade........................................................................................... 8 2.2. Projeces, sistemas de coordenadas e registo............................................... 9 2.2.1. Geoide e Elipsoide.................................................................................. 10 2.2.2. Sistemas de coordenadas ...................................................................... 11 2.2.3. Datums.................................................................................................... 12 2.2.4. Projeces de mapas.............................................................................. 12 2.3. Captura de informao geogrfica .................................................................. 12 2.4. Metadados ....................................................................................................... 13 2.5. Tipos de Formatos de Ficheiros Geogrficos.................................................. 14 2.5.1. Tipo de Formato Raster .......................................................................... 15 2.5.2. Tipo de Formato Vectorial....................................................................... 16 2.5.3. Formato Raster e Formato Vectorial Comparao.............................. 18 2.5.4. Traduo de Raster para Vectorial ......................................................... 18 2.6. Tipos de Informao num Mapa...................................................................... 19 2.6.1. Informao Geogrfica ........................................................................... 19 2.6.2. Informao sobre os Atributos................................................................ 20 2.6.3. Informao de visualizao .................................................................... 20 2.7. Os Sistemas de Informao Geogrfica.......................................................... 20 3. REPRESENTAO DE INFORMAO GEOGRFICA........................................................ 23 3.1. Integrao de Informao Geogrfica............................................................. 23 3.2. Tipos de Formatos de Ficheiros ...................................................................... 24 3.2.1. Formatos Vectoriais ................................................................................ 24 3.2.2. Formatos Raster ..................................................................................... 26 3.3. Integrao de Formatos de Ficheiros Geogrficos ......................................... 27 3.3.1. DPLAN Sistema de Planeamento de Distribuio............................... 27 3.3.1.1 DPLAN: O Problema........................................................................... 27
x 3.3.1.2 DPLAN: Desenho da soluo .............................................................28 3.3.1.3 DPLAN: A Implementao..................................................................28 3.3.2. SIG Empresarial Orientao a Servios ..............................................29 3.3.2.1 SIG Empresarial: O Problema ............................................................29 3.3.2.2 SIG Empresarial: Desenho da soluo...............................................29 3.3.2.3 SIG Empresarial: A Implementao ...................................................29 3.3.2.4 SIG Empresarial: A Arquitectura.........................................................30 3.3.3. ATIS Sistema de Controlo de Trfego .................................................32 3.3.3.1 ATIS: O Problema...............................................................................32 3.3.3.2 ATIS: Desenho da soluo .................................................................34 3.3.3.3 ATIS: A Implementao......................................................................34 3.3.4. DISPRO A web based GIS ..................................................................36 3.3.4.1 DISPRO: O Problema.........................................................................37 3.3.4.2 DISPRO: Desenho da soluo ...........................................................38 3.3.4.3 DISPRO: A Implementao ................................................................38 3.3.5. Open Format Converter ..........................................................................40 3.3.5.1 OFC: O Problema ...............................................................................40 3.3.5.2 OFC: Desenho da soluo..................................................................41 3.3.5.3 OFC: A Implementao ......................................................................41 3.4. Concluses sobre as arquitecturas analisadas ...............................................44 3.5. Identificao de trabalho em aberto ................................................................45 4. OPENGISINTEGRATOR PROPOSTA DE INTEGRAO DE INFORMAO GEOGRFICA....47 4.1. Descrio do OpenGisIntegrator .....................................................................47 4.2. Componentes Lgicos do OpenGisIntegrator .................................................49 4.2.1. Controller .................................................................................................50 4.2.2. DataRW Engine.......................................................................................50 4.2.2.1 Leitura dos Ficheiros de Entrada........................................................51 4.2.2.2 Escrita dos Ficheiros de Sada ...........................................................51 4.2.3. Converter Engine ....................................................................................52 4.2.3.1 Interface Recognizer ...........................................................................52 4.2.3.2 Converter Processor ...........................................................................54 4.2.4. Integrator Engine.....................................................................................57 4.3. Formato de Representao Interno.................................................................59 4.4. Resoluo de Conflitos....................................................................................61 4.4.1. Tipos de Conflitos....................................................................................61 4.4.2. Mtodos de Resoluo de Conflitos .......................................................61 4.4.2.1 Mtodos de Verificao ......................................................................62 4.4.2.2 Mtodos de Adio .............................................................................63
xi 4.4.2.3 Mtodos de Actualizao.................................................................... 63 4.4.2.4 A Integrao ....................................................................................... 63 4.5. Fluxo de Integrao de Ficheiros Putting It All Together ............................. 64 4.5.1. Dados de Entrada ................................................................................... 65 4.5.2. Converso dos Dados de Entrada.......................................................... 65 4.5.3. Integrao dos Dados de Entrada .......................................................... 65 4.5.4. Gerao do Ficheiro de Sada................................................................ 65 4.5.5. Resumo do Processo.............................................................................. 66 4.6. OpenGisIntegrator - A Proposta de Arquitectura............................................. 66 5. AVALIAO EXPERIMENTAL........................................................................................ 67 5.1. Interface Grfica do Prottipo.......................................................................... 67 5.2. Parametrizaes de Configuraes ................................................................ 68 5.2.1. Premissas ............................................................................................... 68 5.2.2. Implementao do Processo de Integrao ........................................... 68 5.3. Cenrios de Avaliao..................................................................................... 70 5.3.1. Avaliao da Arquitectura....................................................................... 70 5.3.1.1 Avaliao da Escalabilidade da Arquitectura ..................................... 70 5.3.1.2 Avaliao da Integrao de Ficheiros de Formatos Diferentes.......... 72 5.3.1.3 Avaliao dos Ficheiros de Sada em Diferentes Formatos .............. 73 5.3.2. Avaliao da Integrao das Caractersticas Geogrficas..................... 75 5.3.2.1 Avaliao da Integrao de Pontos.................................................... 75 5.3.2.2 Avaliao da Integrao de Linhas .................................................... 78 5.3.2.3 Avaliao da Integrao de Polgonos............................................... 81 5.4. O Prottipo....................................................................................................... 83 6. CONCLUSES E TRABALHO FUTURO ........................................................................... 85 6.1. Concluses ...................................................................................................... 85 6.2. Trabalho Futuro ............................................................................................... 86
xii
xiii NDICE DE TABELAS Tabela 1 - Mtodos de captura de informao geogrfica ............................................... 13 Tabela 2 - Comparao de formatos Raster e Vectorial .................................................. 18 Tabela 3 - Tipos de Informao em Mapas Digitais ......................................................... 19 Tabela 4 - Exemplos de Formatos Vectoriais................................................................... 25 Tabela 5 - Exemplos de Formatos Raster ........................................................................ 26 Tabela 6 - Princpios INSPIRE.......................................................................................... 37 Tabela 7 - OpenGisIntegrator - Componentes Lgicos.................................................... 49 Tabela 8 - OpenGisIntegrator - Responsabilidades do Controller.................................... 50 Tabela 9 - OpenGisIntegrator - Mtodos das Interfaces .................................................. 56 Tabela 10 - OpenGisIntegrator - Classes do formato de Representao Interno............ 60 Tabela 11 - Tipos de Conflitos na Integrao Geogrfica ................................................ 61 Tabela 12 - Classe feature - Tipos de Mtodos................................................................ 62 Tabela 13 - Parametrizaes do Prottipo ....................................................................... 69
xiv
xv NDICE DE FIGURAS Figura 1 - Contexto de Integrao de Informao.............................................................. 4 Figura 2 - Mapa de casos de clera do Dr. John Snow...................................................... 7 Figura 3 - Sistemas de coordenadas................................................................................ 11 Figura 4 - Imagem no formato Raster............................................................................... 15 Figura 5 - Imagem com informao Vectorial ................................................................... 16 Figura 6 - DPLAN Processo de integrao anterior ...................................................... 28 Figura 7 - DPLAN Novo processo de integrao........................................................... 28 Figura 8 - SIG Empresarial Arquitectura do sistema ..................................................... 30 Figura 9 - SIG Empresarial Parte do ficheiro XML de registo........................................ 31 Figura 10 - SIG Empresarial Pedido GetMap a partir de uma nica fonte.................... 32 Figura 11 - SIG Empresarial Pedido GetMap a partir de vrias fontes ......................... 32 Figura 12 - ATIS Arquitectura proposta ......................................................................... 35 Figura 13 - DISPRO Arquitectura .................................................................................. 39 Figura 14 - DISPRO Implementao do WMS da OGC................................................ 39 Figura 15 - DISPRO Integrao do WMS...................................................................... 40 Figura 16 - Open Format Converter Arquitectura........................................................... 41 Figura 17 - OFC Estrutura da herana dos objectos do Geo-Core............................... 42 Figura 18 - OFC Exemplo de ficheiro XML de configurao ......................................... 43 Figura 19 - OpenGisIntegrator - Diagrama de Contexto................................................... 47 Figura 20 - OpenGisIntegrator - Arquitectura ................................................................... 48 Figura 21 - OpenGisIntegrator - O DataRW Engine......................................................... 51 Figura 22 - OpenGisIntegrator - Gerao dos Ficheiros de Sada................................... 51 Figura 23 - OpenGisIntegrator - Arquitectura detalhada do Interface Recognizer ........... 53 Figura 24 - OpenGisIntegrator - Identificao de Interfaces dos Ficheiros de Sada....... 53 Figura 25 - OpenGisIntegrator - Arquitectura detalhada do Converter Processor ........... 54 Figura 26 - OpenGisIntegrator - Converso dos Ficheiros de Sada ............................... 54 Figura 27 - OpenGisIntegrator - Diagrama de Classes do Converter Processor ............. 55 Figura 28 - OpenGisIntegrator - Detalhe da Arquitectura do Integrator Engine............... 57 Figura 29 - OpenGisIntegrator - Instncias da classe input_data .................................... 58 Figura 30 - OpenGisIntegrator - Detalhe do Integrator Engine......................................... 58 Figura 31 - OpenGisIntegrator - Diagrama de Classes da Representao Interna ......... 59
xvi Figura 32 - OpenGisIntegrator - Diagrama de Sequncia Ficheiros de Entrada...........64 Figura 33 - OpenGisIntegrator - Diagrama de Sequncia Ficheiros de Sada..............64 Figura 34 - Prottipo do OpenGisIntegrator......................................................................67 Figura 35 - Integrao de Pontos - Ficheiro #1.................................................................76 Figura 36 - Integrao de Pontos - Ficheiro #2.................................................................77 Figura 37 - Integrao de Pontos - Ficheiro de Sada......................................................77 Figura 38 - Integrao de Linhas - Ficheiro #1 .................................................................79 Figura 39 - Integrao de Linhas - Ficheiro #2 .................................................................79 Figura 40 - Integrao de Linhas - Ficheiro de Sada.......................................................80 Figura 41 - Integrao de Polgonos - Ficheiro #1............................................................81 Figura 42 - Integrao de Polgonos - Ficheiro #2............................................................82 Figura 43 - Integrao de Polgonos - Ficheiro de Sada .................................................83
1 1. INTRODUO In ancient maps of the world, expanses of unknown territory might hold a warning to would-be explorers: Here there be monsters. For today's explorers seeking to navigate and understand the world of science, the monsters are the untamed collections of data that inhabit a largely uncharted landscape. [Arlington, 2004]
Desde sempre, o ser humano sentiu necessidade de comunicar. Desde formas de comunicao ancestrais, como pinturas rupestres em paredes de cavernas, at aos dias de hoje, em que a comunicao se tornou possvel a longas distncias, permitidas pelos avanos tecnolgicos, a troca de informao sempre desempenhou um papel central na evoluo de civilizaes. Actualmente, os mtodos de acesso informao so diferentes dos mtodos utilizados tradicionalmente durante centenas de anos. At h bem pouco tempo atrs, a informao estava disponvel em obras de referncia, livros e outros suportes fsicos disponveis em bibliotecas, muitos deles autenticados por autoridades nas matrias em estudo. Hoje em dia, a informao est disponvel atravs de computadores, que permitem o acesso rpido a um mundo de informao. A difuso da informao conduziu necessidade de a analisar e interpretar, de forma a conhecer o mundo que rodeia o homem e tentar compreende-lo. O acesso a informao geogrfica no excepo. Tambm neste campo se assistiu mudana na forma como a informao est disponvel. A tomada de decises baseadas em geografia uma tarefa bsica do pensamento humano. Compreender a geografia e a relao das pessoas com os locais permite tomar decises informadas sobre a forma como os seres humanos vivem. neste contexto que surgem os Sistemas de Informao Geogrfica, vulgarmente abreviado por SIGs 1 . Um SIG um sistema computacional de armazenamento, acesso, manipulao, anlise, e apresentao de dados referenciados geograficamente [Hall et al, 2003].
1 Em ingls, GIS, sigla para Geographic Information System, ou Geographical Information System
2 Hoje em dia, os SIGs so cada vez mais populares. Esto presentes em sistemas de navegao para automveis, em aplicaes a trs dimenses na Internet ou como ferramentas de visualizao de mapas interactivos [Bryntse, 2007]. Um SIG permite tratar informao geogrfica computacionalmente. A diferena principal entre um sistema de informao convencional e um SIG que este ltimo tem a capacidade de armazenar atributos que descrevem os diferentes tipos de informao geogrfica. [Casanova et al., 2005] refere duas responsabilidades como sendo as principais de um SIG: 1. Permitir inserir e integrar informaes geogrficas numa nica base de dados 2. Disponibilizar funcionalidades de consulta, manipulao e anlise dos contedos da base de dados geogrficos Os SIGs so ferramentas tecnolgicas que permitem compreender a geografia do terreno e tomar decises com base nesse conhecimento. Permitem pesquisar e analisar informao espacial, e perceber, visualizar, compreender, questionar, interpretar e visualizar essa informao, de modo a revelar relaes, padres e tendncias [ESRI, 2008]. 1.1. Motivao [Stoimenov, 2006] descreve um cenrio de integrao de informao geogrfica relativa a um objecto geogrfico existente numa comunidade local, alvo de interesse por parte de diferentes organizaes. Cada organizao tem uma viso e um entendimento diferentes desse objecto. De acordo com isso, cada organizao produz diferentes conjuntos de dados, ou atributos, que descrevem o mesmo objecto real. Alguns atributos so comuns a todas as organizaes da comunidade local, alguns so comuns a algumas delas, e cada organizao pode ter atributos especficos por conjunto de dados. Para alm disso, as diferentes organizaes podem usar termos diferentes para os mesmos atributos (sinnimos) ou o mesmo termo para diferentes atributos (homnimos). A forma como as diferentes organizaes gerem os atributos que descrevem um mesmo objecto geogrfico ilustra bem o modo como um mesmo objecto pode ser alvo de diferentes interpretaes, descrito com diferentes designaes. Integrar informao geogrfica sobre o objecto em estudo, recorrendo a informao proveniente de diferentes modelos de dados das diferentes organizaes pode levar a srios conflitos na integrao e interpretao da informao geogrfica. Em [Stoimenov, 2006] sugere-se como soluo para a transferncia de dados entre diferentes SIGs a existncia de uma arquitectura e um conjunto de normas para dados
3 geoespaciais. Uma das importantes estratgias para a interoperabilidade a converso de diferentes formatos de dados em estruturas de dados comuns. Este tipo de estrutura de dados baseia-se usualmente num formato especfico adoptado por um SIG existente. No entanto, impossvel conceber que a comunidade adopte uma arquitectura geoespacial ou uma norma de dados nica. Isto significa que os esforos de normalizao por si s no produzem a interoperabilidade. Nos ltimos anos, o OGC surgiu como uma fora na tendncia para a postura aberta. O OGC um consrcio de vendedores de SIGs, agncias e instituies acadmicas, que introduziu abordagens para a gesto efectiva de tecnologia de interoperabilidade em cooperao com a indstria e as universidades. Identificou ainda a necessidade de partilha aberta de dados geogrficos e a troca de servios SIG abertos. Apesar das iniciativas de normalizao, o uso de normas como o nico esforo vlido para atingir a interoperabilidade no amplamente aceite. A heterogeneidade surge naturalmente a partir de um mercado livre de ideias e produtos, e por essa razo, a ideia de banir a heterogeneidade por decreto invivel [Stoimenov, 2006]. Como uma consequncia das duas principais caractersticas do sistema, fontes de dados distribudos e a sua heterogeneidade, a interoperabilidade entre sistemas um processo pesado. 1.2. Contribuio A dificuldade na comunicao de informao geoespacial entre diferentes fontes reside no tanto na incompatibilidade dos formatos de dados, mas sobretudo na heterogeneidade dos modelos de dados. Estes modelos, categorizados de acordo com estruturas e esquemas prprios do sistema que os utiliza, so um obstculo interoperabilidade e consequentemente integrao. Este problema constitui uma limitao na capacidade dos sistemas trocarem informao entre si, dificultando a interoperabilidade entre diferentes sistemas. A interoperabilidade levanta a necessidade de conceber mecanismos que facilitem a resoluo de incompatibilidades ou heterogeneidades entre diferentes modelos de dados, de forma a permitir a partilha e reutilizao da informao envolvida. Neste cenrio, alcanar a interoperabilidade plena um desafio de investigao relevante [Kavouras et al., 2002]. Tipicamente, so utilizadas abordagens empricas para resolver as heterogeneidades de forma a facilitar a transmisso e reutilizao de informao. No entanto, as abordagens empricas apenas lidam com problemas especficos e no providenciam uma soluo uniforme e abrangente. Assim, o desenvolvimento de metodologias especficas e formais para resolver sistematicamente as heterogeneidades e associar diferentes normas de categorizao so um passo essencial para a integrao de informao geogrfica.
4 Perante este cenrio, prope-se nesta dissertao contribuir para a integrao de informao geogrfica representada em diferentes modelos de dados. A proposta descrita nesta dissertao descreve como uma soluo possvel para o problema de integrao de informao em diferentes formatos uma arquitectura que suporte a integrao da informao. A Figura 1 apresenta um diagrama representativo do contexto da transformao que concretiza a integrao da informao. A figura mostra os dados provenientes das diferentes fontes SIG 1 , SIG 2 , , SIG n , que podem ser dados provenientes de outras aplicaes ou sistemas, ou simplesmente fontes de informao autnomas, como ficheiros, ou ligaes a bases de dados. A estes dados aplicado um mecanismo de transformao. Este mecanismo visa adaptar para um formato pr-definido a informao recebida, e apresentar a informao integrada resultante a um visualizador, que os apresenta ao utilizador.
Figura 1 - Contexto de Integrao de Informao O objectivo da integrao de informao a integrao de diferentes perspectivas existentes sobre um mesmo objecto real georreferenciado, localizado numa rea geogrfica especfica de interesse para o utilizador. O foco desta dissertao a definio de uma arquitectura que permita implementar processos de integrao ou transformao desta informao.
5 1.3. Organizao da Dissertao A presente dissertao, sob o tema Integrao de Informao Geogrfica, encontra-se organizada da forma descrita em seguida. A descrio de conceitos e metodologias de Sistemas de Informao Geogrfica, bem como a anlise de casos estudados apresentada em dois captulos, os captulos 2 e 3. O captulo 2 descreve os Sistemas de Informao Geogrfica, explicando o que so e abordando alguns conceitos essenciais deste tipo de sistemas. O captulo 3 descreve mtodos de representao geogrfica, onde se analisam tecnologias e metodologias desenvolvidas e adoptadas na integrao de informao. O captulo 4 apresenta a proposta de integrao de informao geogrfica, onde detalhada a arquitectura da soluo desenhada. O captulo 5 descreve os resultados da avaliao experimental da arquitectura proposta, feita com recurso a um prottipo da soluo, tambm descrito neste captulo. Por ltimo, o captulo 6 apresenta as concluses obtidas e identifica trabalhos futuros a desenvolver.
6
7 2. SISTEMAS DE INFORMAO GEOGRFICA Um Sistema de Informao Geogrfica, vulgarmente designado por SIG, um sistema informtico com capacidade para armazenar, consultar, alterar, analisar e apresentar informao espacial, referenciada geograficamente [Hall et al, 2003]. Relacionar eventos com localizaes geogrficas no uma abordagem recente. Em 1854, o Dr. John Snow, um mdico britnico considerado um dos fundadores da epidemiologia, utilizou a referenciao geogrfica para identificar a fonte de um surto de clera em Londres [Rosenberg]. Snow desenhou um mapa que representava a localizao dos locais de habitao das vtimas e onde se situavam as bombas de gua que serviam essas zonas. A Figura 2 apresenta o mapa desenhado por Snow.
Figura 2 - Mapa de casos de clera do Dr. John Snow John Snow defendia que a clera era disseminada pela gua consumida, opinio contestada na poca pela classe mdica. Ao desenhar o mapa que relacionava os casos de clera com as bombas que forneciam a gua, Snow identificou um aglomerado de focos da doena junto de uma das bombas, situada em Broad Street. Quando a bomba foi fechada, os casos diminuram. Relacionando ocorrncias de um evento com informao geogrfica, neste caso, a localizao dos casos de clera e das bombas de gua, Snow pde chegar a concluses sobre o surto de clera que assolava Londres.
8 Esta histria ilustra bem como um SIG permite relacionar informao referenciada geograficamente e chegar a concluses com base na anlise da informao referente a uma determinada zona geogrfica em estudo. O desenvolvimento de SIGs tal como os conhecemos hoje iniciou-se na dcada de 60, quando passou a ser possvel fazer anlise computacional de objectos geogrficos. Actualmente, os SIGs tornam-se cada vez mais populares num vasto nmero de reas de actuao. Ao sobrepor diferentes camadas de mapas, podem ser encontradas e analisadas novas relaes. Um exemplo de utilizao de informao geogrfica em diferentes camadas um mapa que permita visualizar um conjunto de ruas, ao qual sobreposta uma camada que mostre a densidade populacional naquela zona. Com base nas relaes encontradas entre as diferentes camadas, so calculados os melhores pontos de colocao de paragens de autocarro [Ekhlund et al, 2003]. Como ferramenta de processamento e anlise de informao geogrfica, um SIG composto por um conjunto de componentes que fazem com que o sistema funcione. Para isso, essencial lidar com questes geogrficas criticas, essenciais a ter em conta na anlise geogrfica da informao. So abordadas em seguida questes essenciais a ter em conta num SIG. 2.1. A Interoperabilidade Interoperabilidade significa abertura na indstria de software, j que a disponibilizao de estruturas de dados internas permitem aos utilizadores dos SIGs construir aplicaes que integram componentes de software de diferentes programadores. Interoperabilidade tambm significa que deve haver troca livre de dados entre sistemas, porque cada sistema deve ter conhecimento dos formatos de dados de outros sistemas [Stoimenov, 2006]. Embora a distribuio de dados geogrficos possa oferecer numerosas vantagens sobre bases de dados geogrficas isoladas, h problemas tcnicos e institucionais de partilha e interoperabilidade de informao geogrfica. O Open Geospatial Consortium, ou OGC, um consrcio de entidades pblicas e privadas que trabalham no sentido de definir normas a respeitar nos SIGs, define a interoperabilidade no software como a capacidade de diferentes sistemas geridos localmente trocarem dados e instrues em tempo real que lhes permitam disponibilizar servios computacionais (como servios entre cliente e servidor ou servios web). O desafio da interoperabilidade balancear a necessidade de compatibilidade que os utilizadores tm com a autonomia e a heterogeneidade dos sistemas que interoperam entre si [OGC, 2009].
9 A interoperabilidade tambm se refere interoperabilidade ao longo do tempo, tendo em conta as evolues dos sistemas mantendo a compatibilidade, quer com verses anteriores, quer com verses futuras. Em tempos, os protocolos criados para a Internet (IP Internet Protocols) foram introduzidos como protocolos para comunicao entre redes, ou seja, para movimentar informao entre diferentes redes. A ligao entre redes abriu caminho para a utilizao nica dos protocolos IP. O resultado foi a Internet, que disponibiliza uma plataforma interoperavel com suporte a uma enorme proliferao de servios e aplicaes. este o modelo que se pretende para uma plataforma interopervel de geoprocessamento [OGC, 2009]. 2.2. Projeces, sistemas de coordenadas e registo Os mapas podem mostrar dados em diferentes escalas. A informao sobre mapas num SIG deve ser manipulada de modo a que se registe, ou se adapte, a informao obtida a partir de outros mapas. Antes que os dados digitais possam ser analisados, podem sofrer outras manipulaes projeces e converso de coordenadas, por exemplo que os integram no SIG. O planeta Terra pode ser representado por diferentes modelos, cada um fornecendo um conjunto diferente de coordenadas (por exemplo, latitude, longitude, elevao) para qualquer ponto dado na superfcie da Terra. O modelo mais simples assumir que a Terra uma esfera perfeita. medida que mais medidas da Terra foram acumuladas, os modelos tornaram-se mais sofisticados e mais precisos. De facto, h modelos que se aplicam a diferentes reas da Terra para providenciar maior preciso na informao. Por exemplo, o datum do Norte da Amrica, de 1927, o NAD27, funciona bem no Norte da Amrica, mas no na Europa. A projeco uma componente fundamental da construo de mapas. um meio matemtico utilizado para transferir informao a partir de um modelo da Terra, que representa uma superfcie curva de trs dimenses, para um meio de duas dimenses papel ou o ecr de um computador. Diferentes projeces so usadas para diferentes tipos de mapas porque cada projeco serve em particular determinadas utilizaes. Por exemplo, uma projeco que represente com preciso as formas dos continentes ir distorcer os seus tamanhos relativos. Hoje em dia, o utilizador comum est consciente da existncia da utilizao de GPS para localizaes em termos de latitude, longitude e altitude, atravs das potencialidades de ferramentas como o Google Earth e at de SIGs. No entanto, a maioria das pessoas interpreta mal o que so latitude e longitude. [Sajeevan, G., 2008] explica a diferena. As coordenadas autlicas so o que geralmente se designa por latitude e longitude, em que a Terra assumida como se tivesse uma forma esfrica. No dia a dia, as
10 coordenadas vistas nos mapas como os dos GPS so latitudes e longitudes geodsicas. tambm imperativo o datum do mapa em uso. Se o datum for alterado, qualquer localizao seleccionada pode ter diferentes coordenadas geodsicas. Assume-se tipicamente que a longitude o ngulo medido a partir do meridiano de Greenwich, e que a latitude o ngulo medido a partir da linha do equador [Sajeevan, G., 2008]. Mas nem sempre assim , como explica a seco seguinte. 2.2.1. Geoide e Elipsoide Os parmetros envolvidos na representao de caractersticas de superfcies topogrficas irregulares (a 3 dimenses) em superfcies planas (a 2 dimenses) so do tipo geoide, esferide e de projeco. O geoide a superfcie equipotencial da gravidade da terra, em que a gravidade em cada ponto igual sua fora ao nvel do mar. a forma que a terra assumiria ao nvel do mar, se toda a sua superfcie nesse nvel fosse lquida. A utilizao de geoides como base para a computao seria difcil dado que se trata de uma superfcie irregular e no tem uma expresso matemtica completa. Consequentemente, uma superfcie mais suave, uma Elipsoide, que melhor se adequa a uma superfcie geoide considerada. O termo elipside e esferide so frequentemente utilizados. Uma elipside, tambm chamada de elipside de trs eixos, tem eixos desiguais. Rodar uma elipse sobre os seus eixos menor e maior pode gerar um esferide. Uma elipside de revoluo e a elipside de dois eixos tambm descrevem um esferide. Uma elipside representada por dois eixos, um semi-maior e um semi-menor (ou respectivamente excentricidade ou achatamento). A altura ortomtrica medida a partir da superfcie do geoide, e a altura geodsica medida a partir da superfcie da elipside. Enquanto a altura ortomtrica de uma localizao se mantm constante, a altura geodsica altera-se com o datum. Consequentemente, importante calcular a nova altura ao longo da latitude e da longitude durante a transformao de projeco, no caso da altura geodsica. A altura do geoide a distncia da superfcie da elipside ate superfcie do geoide e pode ter valores positivos ou negativos. As elipsides podem ser categorizadas como locais, regionais e globais. Vrias elipsides so formadas para melhor se adaptar a determinadas regies da terra. Uma elipside seleccionada dependendo dos requisitos da aplicao e das exigncias de preciso. Por exemplo, o elipside global WGS84 pode ser usado quando a aplicao abrange todo o planeta, dado que melhor se aproxima da forma da terra, embora possa no ser to adequada para uma parte em particular da terra [Sajeevan, G., 2008].
11 2.2.2. Sistemas de coordenadas Alguns sistemas de coordenadas importantes no contexto dos mapas so mostrados na Figura 3. Sistemas rectangulares normais, que utilizam coordenadas Cartesianas, so os sistemas de coordenadas convencionais XYZ normalmente utilizados. As coordenadas autlica e geodsica so duas categorias dos sistemas de coordenadas geogrficas.
Figura 3 - Sistemas de coordenadas As coordenadas autlicas baseiam-se na forma esfrica da terra. Embora a forma da terra seja mais elipside do que esfrica, os cartgrafos ainda usam a esfera autlica para mapeamentos e clculos geodsicos. Uma esfera com a mesma rea de superfcie que uma elipside com o valor aproximado da rea da superfcie da terra chamada de esfera autlica. Os conceitos vulgarmente conhecidos como latitude e longitude so na realidade latitudes e longitudes autlicas. A latitude geodsica numa localizao o ngulo entre o plano equatorial e uma linha normal ao esferide de referncia. Linhas normais a superfcies esferoidais no passam pelo centro, excepto para as latitudes 0 e 90. Mas a normal passar sempre pelo centro da esfera, no caso das latitudes autlicas. Assim, as latitudes autlicas e geodsicas em qualquer localizao x so sempre diferentes. A longitude geodsica numa localizao o ngulo entre o plano de referncia e o plano que passa pela localizao, sendo ambos os planos perpendiculares ao plano equatorial. A altura geodsica, ou altura elipsoidal, a distncia entre uma localizao definida e a superfcie de uma elipside de referncia numa direco normal elipside. A latitude autlica () baseia-se na esfera, e a latitude geodsica () baseia-se no esferide. O sistema de coordenadas geodsicas, que se baseia no esferide, geralmente o seguido em SIGs e em mapeamentos relacionados. Mapas utilizados, por exemplo, no Google Earth so representados em latitude e longitude geodsicas [Sajeevan, G., 2008].
12 2.2.3. Datums Um datum descreve a posio, orientao e as relaes em escala de uma elipside de referncia para a terra. Consequentemente, um nmero de datums pode ser gerado usado um nico elipside. O WGS84 o datum usado nos GPS e o seu centro o centro da massa da terra. parte dos parmetros da elipside, mais parmetros so exigidos para definir um datum trs para definir a posio e trs para definir o ngulo de rotao com referncia para um sistema de coordenadas Cartesiano a trs dimenses com a sua origem a coincidir com o centro da massa da terra. No sistema Cartesiano espacial fixado para a terra (XYZ) o eixo Z coincide com o eixo rotacional da terra, o plano XY o plano equatorial mdio perpendicular a este eixo e o plano XZ o plano meridional mdio de Greenwich. 2.2.4. Projeces de mapas Mapear envolve transferir localizaes de superfcies topogrficas para uma superfcie geoidal e subsequentemente para uma superfcie elipside. A informao numa superfcie elipside pode ser transferida para uma superfcie vulgar usando um tipo de projeco adequado. Azimutal, cnica ou cilndrica so trs famlias principais de projeces. Nenhum mapa mantm uma escala, direco, distncia ou rea uniforme. O Google Earth usa uma projeco cilndrica simples com um datum WGS84 para a sua imagem de base. A transformao das projeces numa aplicao de software uma funo importante exigida para alterar os parmetros das projeces de mapas, j que parmetros de projeces com dados disponveis a partir de diferentes fontes podem ser diferentes daqueles que se destinam a um objectivo em particular [Sajeevan, G., 2008]. 2.3. Captura de informao geogrfica Introduzir informao no sistema consome muito do tempo dos utilizadores de SIGs. Existe uma variedade de mtodos utilizados para inserir dados num SIG, onde sero armazenados num formato digital.
13 A Tabela 1 descreve mtodos de captura de informao geogrfica. Suporte Descrio Papel Digitalizao a partir de mapas existentes em papel. O resultado guardado num formato Raster, que pode posteriormente ser processado para produzir informao Vectorial. COGO Coordinate Geometry Mtodo de insero e anlise de dados em que a insero comea num ponto, num dado ngulo ou numa determinada direco, durante uma distncia definida, e continua nesse ngulo ou nessa direco at que a caracterstica geogrfica seja completamente delineada. Deteco remota Deteco a partir de sensores anexados a uma plataforma. Os sensores so cmaras ou digitalizadores; as plataformas so tipicamente aparelhos de aviao (aeronaves) e satlites. Fotografias areas Digitalizao de caractersticas a partir de pares de fotografias digitais. A fotografia digital de alta qualidade j utilizada, descartando a necessidade de digitalizao. Sensores remotos via satlite Utilizao de pacotes de sensores para passivamente medir a relevncia de partes do espectro electromagntico ou ondas de rdio que foram enviados a partir de um sensor activo, como um radar. Os dados detectados remotamente obtm dados Raster que podem posteriormente ser processados utilizando diferentes bandas para identificar objectos e classes de interesse, como a cobertura do terreno. Tabela 1 - Mtodos de captura de informao geogrfica Alm da informao geogrfica capturada e inserida num SIG, tambm necessrio inserir informao sobre os atributos geogrficos que incluem informao adicional sobre os objectos representados no sistema. Aps inserir dados num sistema, geralmente necessrio edit-los, para remover erros, ou para continuar o processamento dos dados. Por exemplo, numa rede de estradas as linhas devem ligar-se aos ns numa interseco. Para mapas digitalizados, as manchas no mapa de origem podem precisar de ser removidas, pois um ponto de sujidade pode ser confundido com um ponto de interseco [StateMaster, 2007]. 2.4. Metadados Os metadados so uma parte essencial dos SIGs. Metadados so dados sobre dados. Os metadados descrevem o contedo, o estado, a localizao, ou outras caractersticas de um determinado dado. Podem ser armazenados em qualquer formato, como um ficheiro de texto, uma estrutura XML, ou um registo de uma base de dados. O objectivo dos Metadados permitir identificar se um determinado dado existe, a qualidade da informao constante nesses dados, como est acessvel e como pode ser utilizado [Casanova et al., 2005].
14 Os metadados so utilizados com diferentes objectivos. So listados em seguida os tipos de informao disponibilizada em SIGs com recurso a metadados: Informao detalhada sobre mtodos de obteno de dados, tcnicas de integrao e anlise, aplicados aos dados de origem exigida como suporte preparao de relatrios cientficos; Informao sobre a preciso dos conjuntos de dados, histria de processamento, e procedimentos de armazenamento exigidos para gerir e utilizar com eficcia os dados dentro de uma organizao; Informao sobre especificaes de projeces, escalas, formatos de troca, formatos de compresso e de ficheiros que devem acompanhar as transferncias de dados para outras organizaes; Descries adequada dos conjuntos de dados ao nvel do contedo, qualidade e o alcance geogrfico disponveis para disponibilizar nas consultas dos utilizadores; Descries sumrias do contedo e da qualidade, bem como informaes de contactos; Informao sobre software de acesso a conjuntos de dados, bem como parmetros de software necessrios para consultas e visualizaes de dados. Por causa do tamanho reduzido que tm em comparao com a informao que descrevem, os metadados so mais facilmente partilhveis. A criao e partilha de metadados tornam a informao sobre dados existentes imediatamente disponvel para qualquer utilizador que a procure [ESRI, Metadata and GIS, 2002]. 2.5. Tipos de Formatos de Ficheiros Geogrficos Os ficheiros so estruturas lgicas utilizadas para armazenar informao geogrfica. Os formatos dos ficheiros so importantes porque em regra os SIGs no suportam todos os formatos. Ao pretender utilizar informao que no esteja num formato que o SIG em uso suporta, ser necessrio transform-lo, encontrar outro conjunto de dados, ou at encontrar um outro SIG. Quase todos os SIGs tm o seu prprio formato de representao interno [GeoComm.com, 2009]. Estes formatos so desenhados para uso optimizado dentro do sistema e frequentemente so proprietrios. No so desenhados para serem utilizados fora dos sistemas nativos. Muitos sistemas suportam no entanto transferncias de ficheiros em vrios formatos. Alguns formatos so desenhados como formatos de transferncia e so utilizados para importar ou exportar dados de, ou para, o SIG, por isso so geralmente normalizados ou bem documentados.
15 Se as necessidades de informao a utilizar forem simples, a preocupao principal ser o formato interno suportado pelo SIG. Se as necessidades forem mais complexas, importante conhecer um conjunto vasto de formatos de transferncia, em especial quando se pretender misturar informao de diferentes fontes. Os formatos de transferncia sero exigidos para importar alguns conjuntos de dados para o SIG [GeoComm.com, 2009]. Os dados nos SIGs representam objectos do mundo real (estradas, utilizao de terrenos, elevaes) com dados digitais. Os objectos reais podem ser divididos em duas abstraces: objectos discretos (por exemplo, uma casa), e informao contnua (por exemplo, a taxa de precipitao, ou elevaes do terreno). Existem dois mtodos alargados utilizados para armazenar dados num SIG para ambas as abstraces: Raster e Vectorial [StateMaster, 2007]. 2.5.1. Tipo de Formato Raster O formato Raster essencialmente qualquer tipo de imagem digital representada em grelha. Por exemplo, em fotografia digital o pixel a unidade mais pequena utilizada numa imagem. Uma combinao destes pixis compe uma imagem [StateMaster, 2007]. geralmente utilizado para armazenar informao sobre imagens, como mapas em papel digitalizados ou fotografias areas. tambm utilizado para armazenar dados capturados por satlite ou outros sistemas de captao area de imagens. Um exemplo deste formato mostrado na Figura 4.
Figura 4 - Imagem no formato Raster
16 As imagens destes sistemas de captao area so frequentemente referidas como informao detectada remotamente. Ao contrrio de outros ficheiros Raster, que definem a resoluo em termos de tamanho de clula e dots per inch (dpi), a resoluo em imagens detectadas remotamente expressa-se em metros, que indicam o tamanho da rea do terreno coberto por cada clula [GeoComm.com, 2009]. A informao no formato Raster consiste em linhas e colunas de clulas, cada clula contendo um nico valor. Podem ser imagens em que cada pixel ou clula contm um cdigo de cor. Valores adicionais guardados para cada clula podem ser valores discretos, como a utilizao do terreno, ou valores contnuos, como temperatura, ou um valor nulo, se no existir informao. Uma clula Raster armazena um nico valor, mas pode incluir mais informao, utilizando bandas Raster para representar cores RGB (red, green, blue), mapas de cores (um mapeamento entre um cdigo temtico e um valor RGB), ou uma tabela de valores associada, com uma linha para cada valor nico de clula. A resoluo de um conjunto de dados Raster a largura da clula em unidades de terreno [Smith, Goodchild, Longley, 2007]. A informao no formato Raster armazenada em vrios formatos: desde uma estrutura base, como por exemplo o formato TIF, ou o formato JPEG, ou at um BLOB (Binary Large OBject) armazenado directamente numa base de dados relacional. O armazenamento em bases de dados, quando correctamente indexado, permite tipicamente a rpida devoluo da informao Raster, mas exige um espao considervel de armazenamento [StateMaster, 2007]. 2.5.2. Tipo de Formato Vectorial Muitos SIGs baseiam-se em tecnologia Vectorial, por isso os formatos Vectoriais so mais comuns. So tambm os mais complexos pois h diversas formas de armazenar coordenadas, atributos, ligaes a atributos, estruturas de bases de dados, e informao a disponibilizar. A Figura 5 mostra um exemplo de uma imagem com elementos Vectoriais que representam focos de interesse: pontos representam poos, linhas representam rios, e um polgono representa um lago.
Figura 5 - Imagem com informao Vectorial
17 Num SIG, as caractersticas geogrficas so frequentemente expressas em Vectores, sendo essas caractersticas consideradas como formas geogrficas. Diferentes caractersticas geogrficas so expressas em diferentes tipos geomtricos [StateMaster, 2007]: Pontos: So utilizados como caractersticas geogrficas e que so representadas por um simples ponto de referncia, que indicam uma simples localizao. Por exemplo, a localizao de poos, picos de elevao de terreno ou trilhos so representados como pontos. Os pontos podem tambm ser utilizados para representar reas quando visualizados em pequena escala. Por exemplo, cidades num mapa do mundo podem ser representadas como pontos em vez de polgonos. No so possveis quaisquer formas de medio com pontos; Linhas: So utilizadas como caractersticas lineares, como rios, estradas, caminhos- de-ferro, trilhos e linhas topogrficas. Tal como com os pontos, caractersticas lineares visualizadas em pequena escala so representadas como linhas em vez de polgonos. As linhas permitem medir a distncia; Polgonos: So utilizados para representar caractersticas geogrficas que cobrem uma determinada rea da superfcie terrestre. Essas caractersticas podem incluir lagos, limites de parques, edifcios, limites de cidades, ou utilizaes de terreno. Os polgonos transmitem o mximo de informao possvel deste tipo de ficheiros. Os polgonos permitem medir permetro e rea. Cada um destes tipos geomtricos est descrito numa base de dados, que descreve tambm os seus atributos. Por exemplo, uma base de dados que descreve lagos pode conter a profundidade de um lago, a qualidade da gua ou o nvel de poluio. Esta informao pode ser utilizada para fazer um mapa que descreva um determinado atributo do conjunto de dados. Diferentes tipos geomtricos podem tambm ser comparados. Ou pode ser usado um SIG para identificar todos os poos (ponto geomtrico) que estejam num raio de 1 quilmetro de um lago (polgono geomtrico) que tenha um nvel alto de poluio. Os formatos Vectoriais podem ser feitos de forma a respeitar a integridade espacial atravs da aplicao de regras topogrficas, como por exemplo, os polgonos no se podem sobrepor. Dados Vectoriais podem tambm ser utilizados para representar continuamente fenmenos variveis. Linhas de contorno ou redes triangulares irregulares (TIN Triangule Irregular Networks) so utilizados para representar elevaes ou outros valores variveis contnuos. Estas redes gravam valores em pontos de localizao, que so ligados por linhas para formar um conjunto irregular de tringulos. A face dos tringulos representa a superfcie do terreno. Dados no espaciais adicionais podem ser armazenados em conjunto com os dados espaciais representados pelas coordenadas de um Vector geomtrico ou pela posio
18 de uma clula Raster. Em dados Vectoriais, os dados adicionais contm atributos da caracterstica geogrfica. Por exemplo, um polgono que representa uma floresta pode tambm ter um valor identificativo e informao sobre as espcies de rvores [StateMaster, 2007]. 2.5.3. Formato Raster e Formato Vectorial Comparao Existem algumas vantagens em usar o formato Raster ou o Vectorial para representar a realidade, dependendo da utilizao que se pretende. A Tabela 2 apresenta algumas caractersticas a ter em conta ao optar por um ou outro formato. Formato Raster Formato Vectorial Armazenamento de dados de toda a rea coberta. Armazenamento de dados apenas da rea necessria. Fcil implementao de operaes em sobreposio. Difcil implementao de operaes em sobreposio Visualizao dos dados como imagem que, dependendo da resoluo, pode ser de fraca qualidade. Visualizao dos dados como grficos com qualidade Vectorial. Dependendo da resoluo, os dados armazenados podem ser 10 a 100 vezes maiores que os dados Vectoriais. O tamanho de um ficheiro para dados Vectoriais tipicamente mais pequeno. A actualizao mais difcil. Mais fcil de actualizar e manter. No possuem todos os atributos das caractersticas. Suportam maior nmero de atributos. - Permite a combinao de diferentes camadas Vectoriais. - Compatveis com bases de dados relacionais, beneficiando das operaes disponveis sobre bases de dados. Tabela 2 - Comparao de formatos Raster e Vectorial 2.5.4. Traduo de Raster para Vectorial A reestruturao da informao pode ser executada por um SIG com o objectivo de a converter para diferentes formatos. Por exemplo, um SIG pode ser usado para converter uma imagem de satlite de um mapa para uma estrutura Vectorial gerando linhas volta de todas as clulas com a mesma classificao, enquanto determina a relao espacial da clula. O processamento de dados mais avanados pode ocorrer com o tratamento de imagens, uma tcnica desenvolvida nos finais dos anos 60 pela NASA e pelo sector privado para disponibilizar o realce de contrastes e uma variedade de outras tcnicas, que incluem a utilizao de transformadas de Fourier [StateMaster, 2007].
19 Visto que os dados digitais so capturados e armazenados de diversas formas, as duas fontes de dados podem no ser inteiramente compatveis. Assim, um SIG deve ter a capacidade de converter informao geogrfica de uma estrutura para a outra. 2.6. Tipos de Informao num Mapa Qualquer mapa digital tem capacidade de armazenar mais informao que um mapa em papel que mostre a mesma rea, mas geralmente no claro primeira vista que tipo de informao o mapa inclui. Por exemplo, h geralmente mais informao disponvel num mapa digital do que aquela que se visualiza no ecr. necessrio compreender que tipos de dados esto includos no mapa de modo a que possam ser utilizados apropriadamente. A Tabela 3 descreve os tipos de informao tipicamente existentes em mapas digitais [GeoComm.com, 2009]: Tipo de Informao Descrio Geogrfica Disponibiliza a posio e as formas de caractersticas geogrficas especficas Sobre os Atributos Disponibiliza informao no geogrfica adicional sobre cada caracterstica De visualizao Descreve como as caractersticas iro aparecer no ecr Tabela 3 - Tipos de Informao em Mapas Digitais Alguns mapas digitais no incluem estes trs tipos de informao. Por exemplo, geralmente os mapas Raster no incluem informao dos atributos e muitas fontes de dados Vectoriais no incluem informao de visualizao. Detalham-se em seguida os trs tipos de informao: 2.6.1. Informao Geogrfica A informao geogrfica num mapa digital disponibiliza a posio e a forma de cada caracterstica do mapa. Por exemplo, a informao geogrfica de um mapa de estradas a localizao de cada estrada no mapa. Num mapa Vectorial, a posio da caracterstica normalmente expressa como um par XY ou uma tripla XYZ, utilizando o sistema de coordenadas definido para o mapa. Muitos sistemas de informao geogrfica Vectoriais suportam os trs objectos geomtricos fundamentais: Pontos: Um par de coordenadas simples; Linha: Dois ou mais pontos numa sequncia especfica; Polgono: Uma rea delimitada por uma linha.
20 Alguns sistemas tambm suportam entidades mais complexas, como regies, crculos, elipses, arcos e curvas [GeoComm.com, 2009]. 2.6.2. Informao sobre os Atributos Os atributos descrevem caractersticas especficas do mapa, mas no so inerentemente grficos. Por exemplo, um atributo associado a uma estrada pode ser o nome ou a data em que foi pavimentada a ltima vez. Os atributos so frequentemente armazenados em bases de dados separadas da poro grfica do mapa. Os atributos pertencem apenas aos mapas Vectoriais; raramente so associados a imagens Raster [GeoComm.com, 2009]. Os SIGs mantm hiperligaes internas que unem a entidade grfica do mapa sua informao de atributos. A natureza dessas hiperligaes varia conforme os sistemas. Em alguns sistemas os links esto implcitos e o utilizador no tem qualquer controle sobre isso. Noutros sistemas existem links explcitos que o utilizador pode modificar. Os links nestes sistemas tomam a forma de chaves da base de dados. Cada caracterstica do mapa tem uma chave armazenada. Esta chave identifica o registo especfico da base de dados que contm os atributos de informao da caracterstica. Se surgirem problemas, importante saber como o software estabelece e mantm as hiperligaes de atributos [GeoComm.com, 2009]. 2.6.3. Informao de visualizao A informao de visualizao num mapa digital descreve como o mapa visualizado ou parcelado. Informao de visualizao comum inclui a cor das caractersticas, a grossura das linhas e os tipos de linhas (slida, pontilhada, tracejada, simples ou dupla), como os nomes das estradas e outras caractersticas so mostradas no mapa, e se os lagos, parques ou outras reas so codificadas com cores. Muitos conjuntos de dados no incluem informao de visualizao. Por exemplo, os ficheiros USGS Digital Line Graph no disponibilizam informao de visualizao nenhuma. Cada caracterstica contm um atributo que descreve a entidade mas no indica as caractersticas de visualizao. Os utilizadores e o seu SIG tem de interpretar esses atributos e decidir como cada um ir ser visualizado. 2.7. Os Sistemas de Informao Geogrfica Um SIG uma ferramenta de anlise de informao geogrfica. Nesta seco foram abordados conceitos essenciais que so tomados em considerao na integrao dessa informao a ser utilizada em SIGs.
21 As questes relacionadas com a interoperabilidade entre sistemas geogrficos com modelos de dados diferentes revestem-se de importncia quando se fala de troca de informao entre sistemas que utilizam formatos diferentes. Um sistema que pretenda utilizar informao de outro sistema, guardada em outro formato diferente daquele que utiliza, tem que forosamente garantir a interoperabilidade entre esses sistemas, sob pena de no poder reutilizar os dados. A diversidade nos formatos de dados origina-se frequentemente na forma como so capturados. As diferentes formas de captura de dados geogrficos dependem no s da forma como a captura feita, mas tambm do formato escolhido pelo utilizador que efectua a captura e armazenamento no formato digital. A disponibilizao de diferentes formatos conduz por um lado necessidade de converso da informao para formatos diferentes daquele em que originalmente foram gravados, mas tambm a necessidades de edio da informao geogrfica sempre que se pretenda acrescentar informao geogrfica, como acontece no caso dos ficheiros Vectoriais. Os tipos de formatos so tambm tomados em considerao, pois dependendo do formato em que est armazenada a informao, a utilizao tambm variar. No possvel obter atributos geogrficos de um ficheiro Raster, por exemplo. No entanto, possvel converter a informao no formato Raster para o Vectorial. Assim, trabalhar com SIGs obriga necessariamente a conhecer ambos os tipos de formatos geogrficos com que necessrio lidar, os formatos Raster e os formatos Vectoriais. A troca de dados entre sistemas exige ainda que se conheam as escalas utilizadas nos ficheiros geogrficos. Se um SIG tiver disponveis para trabalhar dois ficheiros com informao geogrfica com datums diferentes, a utilizao da informao dos ficheiros necessita ser adaptada, de modo a que o SIG possa trabalhar a informao geogrfica recorrendo a dados geograficamente compatveis. Conhecer o funcionamento dos SIGs facilita a compreenso do processo de integrao de informao geogrfica armazenada em diferentes formatos. O prximo captulo aborda um conjunto de arquitecturas analisadas, que integram informao geogrfica utilizando diferentes abordagens.
22
23 3. REPRESENTAO DE INFORMAO GEOGRFICA Existem diversas razes para o aumento do interesse na integrao de informao proveniente de diferentes fontes. O nmero de SIGs tem vindo a aumentar e consequentemente as bases de dados de suporte a estes SIGs aumentam mesma velocidade. Estas bases de dados so a componente mais dispendiosa do custo total dos SIGs. Assim, partilhar esta informao entre sistemas de diferentes entidades, agncias e empresas uma das formas de reduzir custos e aumentar a quantidade e qualidade da informao [Moyer, Niemann, 1993]. Numa primeira fase, logrou-se conhecer o mundo dos SIGs, os seus conceitos e as suas metodologias. A fase seguinte descreve a investigao de trabalhos relacionados no campo da integrao de informao geogrfica provenientes de diferentes fontes e armazenada em diferentes formatos, e na anlise do trabalho de normalizao dos formatos de transferncia de dados entre SIGs diferentes. 3.1. Integrao de Informao Geogrfica A integrao de informao geogrfica proveniente de diferentes fontes, a ser utilizada num mesmo suporte, implica necessariamente interoperabilidade entre os dados provenientes dessas diferentes fontes [Reichardt, 2004]. Como j referido, a interoperabilidade significa abertura ou a capacidade de trocar informaes livremente entre sistemas. O OGC define a interoperabilidade como a capacidade de comunicar, executar programas, ou transferir informao entre vrias unidades funcionais de uma forma que exija que um utilizador tenha pouco ou nenhum conhecimento das caractersticas nicas dessas unidades. A inexistncia de interoperabilidade impede a partilha de informao e de recursos informticos, levando a que as organizaes gastem mais do que o necessrio em dados, software e hardware [Reichardt, 2004]. Quando falamos de informao geogrfica, falamos de diferentes tipos de informao. Informao sobre a localizao, sobre o formato dos objectos geogrficos, sobre as relaes existentes entre diferentes caractersticas e fenmenos geogrficos. Isso torna a informao geogrfica complexa, fundamentalmente porque existem tambm
24 diferentes sistemas de geoprocessamento, com a funo de criar, armazenar, processar e mostrar informao geoespacial nos formatos que a suportam. Na comunidade geoespacial, o significado de interoperabilidade mantm-se ambguo, tal como os benefcios de ser interoperavel. Assim, sugerido o seguinte mandato: Para um sistema ser interoperavel, a equipa que o gere deve estar activamente empenhada no processo contnuo de garantir que os sistemas, procedimentos e cultura de uma organizao so geridos de forma a maximizar oportunidades para a troca e reutilizao de informao e servios, seja interna ou externamente [OGC, 2005]. As especificaes de interfaces abertas possibilitam aos fornecedores de contedos, programadores e integradores focar-se em entregar produtos e servios mais potentes para consumidores em menos tempo, com menor custo, e mais flexveis [OGC, 2005]. O OGC vem fornecer algumas ajudas ao se constituir como um organismo de gesto de normas que facilitam a interoperabilidade. 3.2. Tipos de Formatos de Ficheiros A informao geogrfica gerida pelos SIGs pode ser simplesmente descrita como informao geogrfica qual podem ser ligados atributos. Informao geogrfica toda a informao que se relaciona com espao, como por exemplo, uma estrada ou um lago. As caractersticas geogrficas da informao podem ser descritas como uma matriz (dados Raster), ou como pontos, linhas e polgonos (dados Vectoriais). Os formatos suportados pelos SIGs descrevem a forma como as caractersticas geogrficas foram gravadas. muito importante considerar o formato da informao de um SIG porque os sistemas raramente suportam todos os tipos de formatos. Ao pretender utilizar informao geogrfica gravada num formato particular no suportado pelo SIG em uso, ser necessrio ou transformar os dados ou simplesmente utilizar outro SIG. Quase todos os SIGs tm os seus prprios formatos de armazenamento da informao. Estes formatos foram criados para optimizar a eficincia do prprio programa, e no foram desenhados para ser utilizados em outros programas. No entanto, muitos SIGs suportam outros formatos, disponibilizando funes de importao e exportao de conjuntos de dados. Estas funes esto geralmente bem documentadas e normalizadas [GISCentrum, 2009]. 3.2.1. Formatos Vectoriais Muitos SIGs baseiam-se em tecnologia Vectorial. Estes mtodos so mais complexos pois h diversas formas de gravar coordenadas, atributos, estruturas de dados e informao de visualizao.
25 A Tabela 4 apresenta alguns formatos de ficheiros Vectoriais de SIGs mais comuns [GISCentrum, 2009 e GeoComm.com, 2009]. Formato Nome Descrio ARCExport ARCExport Formato de transferncia da ESRI, em ASCII ou comprimido para um binrio, utilizado para transferir ficheiros entre diferentes verses do ARCInfo. DGN MicroStation Design Files Formato interno utilizado pela Bentley Systems Inc.s MicroStation, um programa de CAD (Computer Aided Design). Contm informao de visualizao detalhada. DLG Digital Line Graphs Formato de transferncia utilizado pelo USGS (United States Geological Survey), que representa informao Vectorial apresentada em mapas impressos em papel. DWG Autodesk Drawing Files Formato interno proprietrio do AutoCAD, um software de CAD (Computer- Aided Design). O AutoCAD consegue converter qualquer ficheiro DWG para um ficheiro DXF sem perda de informao grfica. DXF Autodesk Drawing eXchange Format Formato comum de transferncia de dados para informao Vectorial. Inclui informao de visualizaao bastante completa, e quase todos os programas grficos o conseguem ler. E00 ARC/INFO interchange file Formato de transferncia da ESRI utilizado pelo ARCInfo. Permite combinar informao descritiva e espacial para ficheiros Vectoriais e Raster num nico ficheiro ASCII. GML Geography Markup Language Normalizao XML para trocar e gravar informao geogrfica Vectorial, com um Schema XML que descreve schemas aplicacionais, bem como o transporte e armazenamento de informao geogrfica. KF85 Kommunfrbundets transfereringsformat (ISOK) Armazena tanto caractersticas geomtricas como atributos. Consiste num ficheiro fsico que pode ter qualquer extenso. A extenso .k85 adicionada ao nome base do ficheiro KF85 quando escreve o ficheiro. MIF/MID MapInfo Interchange Format Formato de transferncia, utilizado pela MapInfo, possvel de ser lido tambm por outros SIGs. SDTS Spatial Data Transfer System Formato de transferncia desenvolvido pelo governo norte-americano. Pode ser tanto binrio como em ASCII, mas geralmente binrio. Pode codificar praticamente todos os conceitos geogrficos. SHP ESRI Shapefile Formato de transferncia desenvolvido pela ESRI. Armazena informao geomtrica no topolgica e informao de atributos para as caractersticas espaciais de um conjunto de dados. SVG Scalable Vector Graphics Normalizao XML para apresentao de dados Vectoriais na internet. aprovado pelo W3C (World Wide Web Consortium). TIGER Topologically Integrated Geographic Encoding and Referencing Files Formato de transferncia em ASCII utilizado pelo Gabinete de Censos Norte- Americano (US Census Bureau) para armazenar os mapas de estradas construdos para o censo de 1990. baseado em linhas, no em polgonos. Tabela 4 - Exemplos de Formatos Vectoriais
26 3.2.2. Formatos Raster Os ficheiros Raster so geralmente utilizados para gravar imagens, como mapas em papel digitalizados, fotografias digitais ou imagens de satlite. So ainda utilizados para gravar variveis que variam continuamente no espao, como topografia e temperatura. Imagens de satlites ou outras aeronaves so conhecidas como informao detectada remotamente. A resoluo deste tipo de informao e de mapas digitalizados refere-se rea do terreno coberta por um pixel, ao contrrio de outras imagens, em que a resoluo dada em dots per inch (dpi). A Tabela 5 apresenta alguns formatos de ficheiros Raster de SIGs mais comuns [GISCentrum, 2009]. Formato Nome Descrio ADRG Arc Digitized Raster Graphics Formato criado pelos militares americanos para gravar mapas em papel no formato Raster. BIL Band Interleaved by Line um formato Computer Compatible Tape (CCT) que armazena todas as bandas de informao detectada remotamente num ficheiro de imagem. BIP Band Interleaved by Pixel Cada linha de uma imagem armazenada sequencialmente (na linha 1 todas as bandas, na linha 2 todas as bandas, etc.). BSQ Band Sequential um formato Computer Compatible Tape (CCT) que armazena cada banda de dados de satlite num ficheiro de imagem para todas as linhas digitalizadas num array de imagens. Os cabealhos CCT so gravados em cada banda. DEM Digital Elevation Model Formato criado pelo USGS (US Geological Survey) para gravar informao de elevao. Os valores das clulas no DEM representam a elevao para essa posio na superfcie da terra. *.dem, *.hdr DEM ArcInfo Formato de dados de elevao do ArcINFO. GTOPO30 Global 30 Arc Second Elevation Data Set Modelo global digital de elevao com clulas horizontais de aproximadamente 1 km (30 segundos). Foi criado a partir de diferentes fontes Raster e Vectorial. GeoTIFF GeoTIFF Formato do tipo TIFF (Tag Image File Format) para dados Raster georreferenciados. GRIB GRid In Binary Normalizao para dados meteorolgicos baseados em grelhas, utilizado pelo WMO (World Meteorological Organization). PCX PC Paintbrush Exchange Formato Raster comum encontrado em muitos programas grficos e de digitalizao. SDTS Spatial Data Transfer Standard Formato para transferir informao geogrfica. Uma variante do SDTS foi feita especificamente para transferir dados Raster. TIFF Tagged Image File Format Formato produzido por programas de desenho e digitalizadores. Comprime os dados sem perda de informao. Tabela 5 - Exemplos de Formatos Raster
27 3.3. Integrao de Formatos de Ficheiros Geogrficos Ao longo dos anos foram desenvolvidas vrias propostas de integrao de ficheiros de diferentes formatos, umas para dar resposta a problemas de realidades especficas, outros para tentar responder de um modo geral a diferentes realidades, mas apresentando solues adaptveis a vrios cenrios. Estudam-se em seguida algumas solues desenhadas. 3.3.1. DPLAN Sistema de Planeamento de Distribuio Em 2007, a EDP apresentou uma proposta de arquitectura que visava integrar um SIG com um sistema de planeamento de distribuio, designado por DPLAN [Mira et all, 2007]. A EDP adoptou um Sistema de Informao Tcnica, o SIT, e decidiu que este seria o repositrio central de informao de rede, com recurso tecnologia GE Smallworld GIS. O SIT visava integrar a informao proveniente de vrios sistemas utilizados internamente. Aps integrar com sucesso os vrios sistemas com o SIT, a EDP decidiu avanar com a integrao do DPLAN, o que deu origem proposta de arquitectura em anlise. 3.3.1.1 DPLAN: O Problema Aps analisar a utilizao do DPLAN, a EDP concluiu que a informao a integrar era de dois tipos: Estudos complexos: estudos mais demorados, que utilizam funes avanadas do DPLAN; Estudos simples: estudos de configuraes de rede que culminam em desenho e propostas a clientes. Nos estudos complexos, o resultado do estudo aprovado era carregado no SIT como um novo projecto manualmente, o que exigia que o estudo fosse carregado em dois sistemas diferentes. Para os estudos mais simples, era necessrio trabalhar com informao actualizada, o que exigia que fossem feitas frequentes actualizaes de dados a partir do SIT.
28 3.3.1.2 DPLAN: Desenho da soluo Decidiu-se ento fazer um desenvolvimento faseado: Fase 1: desenvolvimento de ferramentas de importao e exportao entre o SIT e o DPLAN; Fase 2: o DPLAN integrado seria executado em background no ambiente SIT. 3.3.1.3 DPLAN: A Implementao Na primeira fase do desenvolvimento, foi desenvolvida uma soluo que substituiu a utilizao de uma ferramenta de exportao, o DINIS, que servia de intermedirio entre o GIS utilizado e o ficheiro DPX, o formato interno do DPLAN, utilizado depois pelo DPLAN, como mostra a Figura 6.
Figura 6 - DPLAN Processo de integrao anterior Dado que o DPLAN apresentava alguns problemas no tratamento de alguns tipos de dados do SIT e na exportao unvoca de dados, eliminou-se a utilizao do DINIS, passando a interface do DPLAN implementada no SIT a suportar o mapeamento exaustivo dos objectos e atributos SIT para os objectos e atributos do DPLAN, como representado na Figura 7.
Figura 7 - DPLAN Novo processo de integrao A interface do DPLAN implementada no SIT inclui tambm o mapeamento inverso, de objectos e atributos do DPLAN para os objectos e atributos SIT. Foi includo um atribudo na interface, o atributo status, includo em todos os objectos, com opes para instalar ou remover o objecto. Na segunda fase de desenvolvimento, foi integrado uma verso do DPLAN no SIT, que visava essencialmente disponibilizar funcionalidades especificas na verso integrada que permitissem a comunicao entre o DPLAN e o Smallworld atravs da troca de comandos, em alguns casos recorrendo a uma janela nativa para os executar.
29 3.3.2. SIG Empresarial Orientao a Servios Um SIG Empresarial uma abordagem de implementao, operao e gesto de um SIG ao nvel de uma organizao. Disponibiliza acesso a informao geoespacial partilhada e recursos analticos para um grande nmero de utilizadores concorrentes localizados em diversas partes de uma instituio [Ghosh et al, 2006]. Um SIG Empresarial pode ser descrito como um esforo para desenhar tcnicas de gesto integrada de informao geoespacial para dar resposta a uma instituio complexa. A arquitectura em anlise prope uma soluo orientada a servios utilizando servios web na integrao de diversos repositrios de dados espaciais. A arquitectura utiliza as normas OGS, nomeadamente, o Web Map Service (WMS) e o Web Feature Service (WFS) para permitir o acesso centralizado a informao espacial em diferentes formatos. 3.3.2.1 SIG Empresarial: O Problema Num cenrio empresarial, em que diferentes tipos de informao so geridos com recurso a diversos sistemas, a tarefa de partilha de aplicaes e de informao difcil, seno impossvel. A gesto de informao geoespacial no excepo, e a integrao de dados existentes em diversos repositrios de informao espacial apresenta-se dificultada por este cenrio. 3.3.2.2 SIG Empresarial: Desenho da soluo proposta uma arquitectura orientada a servios, utilizando servios web para a integrao dos dados espaciais provenientes de diferentes repositrios. Foram contemplados dois servios web propostos pelo OGC, o WMS e o WFS, como j referido. Estes servios so utilizados para permitir o acesso centralizado a informao espacial em diferentes formatos. O WFS permite que um cliente tenha acesso a dados geoespaciais a partir de mltiplos WFS. O WMS tem a capacidade de criar e mostrar mapas simultaneamente provenientes de vrias fontes, em formatos normalizados, como .svg, .png, .gif ou .jpg. 3.3.2.3 SIG Empresarial: A Implementao Para permitir o acesso centralizado informao proveniente de vrias fontes, cada instituio tem de registar os seus dados num registo central, o que permite manter um catlogo de dados. O catlogo deve conter informao sobre o tipo de dados, informao sobre caractersticas, etc. Ao ser feito um pedido, os dados so procurados
30 no catlogo, e o pedido enviado para o mdulo de gesto dos pedidos dessa entrada no catlogo. Independentemente do formato dos dados enviados para o sistema (dados de entrada), os dados que o sistema gera (dados de sada) so enviados no formato GML para assegurar a interoperabilidade. A concretizao desta arquitectura foi feita em Java, com integrao dos servios WFS e WMS do OGC. O objectivo disponibilizar maior interoperabilidade geogrfica recorrendo para isso s normas OGC e baixando as barreiras na integrao de dados geogrficos disponibilizados pelos fornecedores. Os dados no pedido feito ao servio WFS esto no formato GML. O pedido ao WMS mostra os dados gerados graficamente, ou seja, mostra o resultado num mapa. O trabalho proposto nesta arquitectura integra dados num formato flat file, como o formato GML, e no formato relacional, como o formato do Oracle Spatial. Com esta abordagem, os dados podem ser publicados como mapas ou imagens, usando o WMS, e como dados reais, usando o WFS. Foca-se na facilidade de utilizao do sistema e na utilizao de formatos abertos, de modo a permitir a qualquer sistema partilhar rapidamente a sua informao espacial de forma interopervel. 3.3.2.4 SIG Empresarial: A Arquitectura A arquitectura do sistema mostrada na Figura 8. A integrao dos repositrios de dados feita com recurso s normas web WFS e WMS. O ncleo do sistema um registo central que contem a informao de todos os repositrios de dados a partir dos quais possvel obter dados.
Figura 8 - SIG Empresarial Arquitectura do sistema
31 Todos os fornecedores de dados precisam registar os seus dados no registo central. Os dados so registados num catlogo, que um ficheiro XML com a informao da estrutura dos dados, como o tipo de dados (shapefile, gml, etc.), o nome da caracterstica, o namespace dos dados, etc. A Figura 9 representa um excerto do ficheiro de registo.
Figura 9 - SIG Empresarial Parte do ficheiro XML de registo Os dados tambm podem estar em sistemas de gesto de bases de dados relacionais. O Oracle considerado como preferencial neste ponto dadas as suas capacidades de armazenamento de dados espaciais. Por cada caracterstica (feature), armazenado tambm um ficheiro de estilo que usado para formatar a visualizao dos dados espaciais. O cliente pode aceder aos dados fazendo o pedido atravs da funcionalidade getFeature. O pedido ento enviado para o servidor como um GET ou um POST. O pedido inclui: O endereo do servidor; O tipo de pedido; neste caso, seria getfeature; O tipo de servio; neste caso, seria wfs; A verso; O nome do tipo de dados a obter; por exemplo, estradas. O pedido de mapas permite solicitar dados como parmetros de formatao adicionais, como altura, largura, tipo de imagem, etc. O pedido inclui: O endereo do servidor; Dados do objecto a formatar; por exemplo, as dimenses de um rectngulo; O estilo a aplicar; O formato da imagem; por exemplo, image/gif; O tipo de pedido, neste caso, seria GetMap; As camadas; A altura e largura; O SRS.
32 A Figura 10 mostra o resultado de um pedido de dados provenientes de uma nica fonte. Os dados tambm podem ser obtidos a partir de vrias fontes. Dado que os dados provenientes de vrias fontes esto disponveis como caractersticas geogrficas, podem ser especificadas vrias.
Figura 10 - SIG Empresarial Pedido GetMap a partir de uma nica fonte A Figura 11 mostra os dados provenientes de diferentes fontes e o resultado correspondente.
Figura 11 - SIG Empresarial Pedido GetMap a partir de vrias fontes 3.3.3. ATIS Sistema de Controlo de Trfego O ATIS, Advanced Travelers Information System, um sistema de controlo de trfego em tempo real, que usa a internet para disseminar esta informao. As diferentes partes do sistema so integradas atravs de um SIG disponvel atravs da internet. A disseminao da informao de trfego em tempo real conseguida ligando o ATIS a sistemas de monitorizao de trfego, armazenando a informao em bases de dados e visualizando-a em cima da rede de estradas actual [Kotzinos, Pratacos, 2004]. 3.3.3.1 ATIS: O Problema Numa definio lata, o ATIS inclui qualquer tipo de sistema que fornea informao sobre trfego e sobre viagens de uma forma organizada e consistente. De forma a fornecer informao fivel e precisa, o ATIS tem primeiro de obter os dados a partir de diferentes fontes, organiz-los e apresent-los aos utilizadores de forma
33 tambm consistente e intuitiva. Esta questo levanta o tpico problema da interoperabilidade, j que os formatos dos dados em cada fonte de informao so geralmente diferentes. O ATIS tem de adaptar os dados de forma transparente para o utilizador. Os dados podem ser de natureza esttica ou dinmica e podem ser de vrios tipos. Os dados estticos referem-se a dados que no mudam ao longo do tempo. Estes dados esto geralmente relacionados com a topologia ou a geografia da cidade ou da rea em anlise. So listados os dados que se enquadram nesta categoria: A rede de trfego da cidade; A posio e tipo de sinais de trnsito; As luzes de trnsito; Informao das Pginas Amarelas; Os lugares de estacionamento. Os SIGs permitem armazenar e manipular este tipo de dados, dado que conseguem lidar com bases de dados espaciais e todos estes tipos de dados so georreferenciados. Um SIG armazena os dados em diferentes camadas, permitindo assim a separao lgica dos diferentes tipos de informao. Uma topologia de rede que distingue entre cruzamentos, outros ns, direces, etc., pode facilmente ser integrada num SIG. Os dados dinmicos so dados em tempo real relacionados com o trfego. Ou so actualizados em intervalos regulares pr-definidos (time-driven), ou so actualizados aps a ocorrncia de um evento previamente especificado (event-driven). A lista deste tipo de ocorrncias inclui: Dados de trfego em tempo real, como o tempo, a velocidade, o n de veculos para cada trecho de estrada da rede; Estado em tempo real das luzes de trnsito; Incidentes; Lugares de estacionamento disponveis em parques de estacionamento; Relatrios de meteorologia; Informao de trnsito em tempo real como a localizao de autocarros, hora de chegada aproximada s paragens de autocarros. So necessrios sistemas de informao em tempo real para gerir os dados dinmicos.
34 3.3.3.2 ATIS: Desenho da soluo Pretendeu-se nesta arquitectura aumentar as capacidades de um SIG disponvel na internet de forma a permitir a gesto em tempo real de dados tanto despoletados pelas actualizaes regulares, como por ocorrncias de eventos. Definiu-se que o ATIS teria de ir ao encontro de trs desafios de modo a ser considerado completo e de confiana. So eles: Gerir as diferentes fontes de dados de forma transparente para o utilizador final; Operar em tempo real; Operar num ambiente heterogneo e cooperar com sistemas de gesto de trfego diferentes e por vezes proprietrios. O acesso a sistemas de informao web based tem de ser conseguido independentemente da localizao e dos meios, dentro de determinados limites. 3.3.3.3 ATIS: A Implementao Para responder s especificaes foi desenhada uma arquitectura modular e aberta. A arquitectura possui as seguintes caractersticas: aberta e pode ser facilmente expandida para permitir alteraes de infraestrutura; modular, o que significa que partes da arquitectura podem ser substitudas com relativa facilidade, se necessrio; Disponibiliza um meio uniformizado para os utilizadores acederem informao; Permite a personalizao do nvel de detalhe em que visualizada; Disponibiliza informao em tempo real; Funciona com um mnimo de informao disponvel e gere inclusivamente circunstncias de ausncia de informao; compatvel com qualquer infraestrutura de recolha de dados de trfego.
35 O sistema web based dividido em trs mdulos bsicos, cada um composto por vrios componentes. Os mdulos esto representados na Figura 12, e representam as operaes lgicas que tem de ser executadas para garantir a funcionalidade do sistema. So eles: Mdulo de personalizao e manipulao pelo utilizador; Mdulo de visualizao de informao; Modulo de interface com a infraestrutura existente.
Figura 12 - ATIS Arquitectura proposta O mdulo de personalizao e manipulao pelo utilizador gere as operaes relacionadas com o registo e personalizao do site pela primeira vez. O utilizador pode escolher a quantidade e a qualidade da informao que pretende receber quando est ligado ao site. O sistema devolve para cada utilizador o perfil nico correcto anteriormente armazenado. O perfil nico contem informao sobre as suas preferncias, as suas viagens, o tipo de informao em que esta interessado, etc., e criado quando o utilizador acede ao site pela primeira vez. O mdulo de visualizao de informao baseia-se na utilizao de um SIG disponvel na internet. usado para obter a informao pedida a partir de varias bases de dados e apresent-la como um mapa dentro de um web browser. O SIG age como a ligao entre as vrias fontes de informao e os utilizadores, dado que tanto obtm como apresenta a informao disponvel.
36 Este mdulo tem cinco componentes: Visualizador: a parte do SIG que apresenta o mapa da cidade mostra informao geogrfica, como a localizao de pontos de interesse, e gere as operaes sobre o mapa (zoom, panning, centrar e mover o mapa). Esta componente tambm funciona como interface com o utilizador que permite fazer pesquisas base de dados e obter informao do sistema; Bases de dados com informao esttica: bases de dados com informao no mutvel em tempo real; Bases de dados com informao em tempo real: bases de dados com contagens de trfego disponibilizados pelo sistema de gesto de trfego ou outras infraestruturas, conjuntamente com outra informao disponvel em tempo real sobre incidentes como acidentes de trabalhos de estrada, bloqueios de estrada, etc; Componente de acesso a dados: este componente gere a interaco entre o SIG e as bases de dados com informao esttica e em tempo real; Componente de caminho mais curto: inclui o algoritmo que utiliza tanto dados das bases de dados esttica e em tempo real, como os dados inseridos pelo utilizador relativos a pontos de origem e destino, para calcular a distncia mais curta. O mdulo interface com a infraestrutura existente gere a interface entre o sistema de informao do viajante e a infraestrutura existente que disponibiliza os dados em tempo real. separada do resto pelo sistema porque especfica ao site. A sua implementao afectada pelo tipo de infraestrutura que um municpio tem para obter dados de trfego. Este mdulo recebe os volumes de trfego e a ocupao das estradas a partir da infraestrutura existente para cada segmento de estrada ou para a parte da rede que est coberta. Passa ento as medidas do trfego para o sistema de informao do viajante. O objectivo deste mdulo concludo aps passar as medidas da infraestrutura para as tabelas apropriadas nas bases de dados em tempo real. 3.3.4. DISPRO A web based GIS O DISMAR um sistema de integrao de dados criado no CMRC (Coastal & Marine Resources Centre, na Irlanda) para gerir problemas relacionados com a poluio das guas nas zonas costeiras europeias. um acrnimo para Data Integration System for MARine Pollution and Water Quality [Tuama, 2004]. O desenho do sistema inclui um SIG como um componente base de um sistema distribudo, adoptando vrias normas, como as do OpenGIS, do W3C ou da ISO, e trabalhando com software de cdigo aberto sempre que possvel. Os requisitos do
37 sistema reflectem as orientaes da directiva EU INSPIRE, uma iniciativa que visa incentivar o desenvolvimento de uma infraestrutura de dados espaciais a nvel europeu. 2
O DISPRO, o primeiro prottipo do DISMAR, um sistema distribudo web based que utiliza as normas WMS da OGC e adopta as directivas da norma ISO 19115, sobre catlogos de metadados. 3.3.4.1 DISPRO: O Problema O termo SDI (Spatial Data Infrastructure), refere-se coleco relevante de tecnologias, politicas e directrizes institucionais que facilitam o acesso a, e a disponibilidade de, dados espaciais. A directiva INSPIRE usa o termo anlogo Infraestrutura de Informao Espacial, que se refere tanto a questes tcnicas como no tcnicas, e que englobam normas e protocolos tcnicos, questes organizacionais, politicas de dados, como regras de acesso a dados, e a criao e manuteno de informao geogrfica para um vasto conjunto de temas. A directiva INSPIRE definiu alguns princpios em relao ao acesso e utilizao de informao espacial no contexto de uma Infraestrutura de Dados Espaciais Europeia. A equipa do DISMAR procurou aderir o mais possvel a estes princpios. A Tabela 6 lista os princpios definidos pela directiva INSPIRE. ID Descrio 1 Os dados devem ser obtidos uma vez e mantidos no nvel mais eficaz possvel 2 Deve ser possvel combinar dados espaciais de diferentes fontes da Unio Europeia e partilh-los entre vrios utilizadores e aplicaes 3 Deve ser possvel obter dados espaciais num determinado nvel de governo e partilh-los pelos outros nveis 4 Os dados espaciais necessrios devem estar disponveis em condies no restritivas 5 Deve ser fcil descobrir quais os dados espaciais disponveis, para avaliar a sua adequabilidade a um determinado propsito e quais as condies para os utilizar Tabela 6 - Princpios INSPIRE O DISPRO procurou implementar estes princpios, sendo que os pontos 1, 2 e 5 foram conseguidos com recurso a normas abertas.
2 A directiva INSPIRE baseia-se na infraestrutura de informao espacial estabelecida e operada pelos pases membros da Unio Europeia. Exige que sejam adoptadas regras de implementao comuns em vrias reas especificadas (Metadados, Especificaes de dados, Servios de Redes, Partilha, Monitorizao e Reporting de Dados e Servios), que so adoptadas como Decises ou Regulaes de Comisso, e so vinculativas. Entrou em funcionamento em 15 de Maio de 2007. [http://inspire.jrc.ec.europa.eu/]
38 3.3.4.2 DISPRO: Desenho da soluo O objectivo do DISMAR seria disponibilizar um sistema que respeitasse os princpios delineados na directiva INSPIRE, como os listados na tabela, e outros relacionados com o tratamento de dados considerados essenciais, e que a directiva INSPIRE categoriza em dois grupos: dados bsicos e dados temticos frequentemente utilizados. Os dados bsicos so aqueles que requerem harmonizao e partilha por vrias reas. A harmonizao exigida em vrios nveis, incluindo no nvel lgico (modelos e representaes de dados), semntico (caractersticas e catalogao), topolgico e de perfis de metadados. Os dados temticos frequentemente utilizados so conjuntos de dados usados em comum por vrias reas. So dados que apenas necessitam de mostrar consistncia ao nvel geomtrico, ou seja, requerem normalizao ao nvel das caractersticas espaciais (linhas, pontos, polgonos). O sistema deveria tambm recorrer utilizao de normas abertas na implementao da soluo. 3.3.4.3 DISPRO: A Implementao O sistema de gesto de dados DISMAR possui um SIG disponvel numa estrutura web como um dos seus sistemas base. O desenho do sistema segue os princpios INSPIRE citados, e tirou partido dos esforos dos trabalhos do OGC e de projectos em cdigo aberto. Inclui a utilizao das normas da OGC, o WMS e o WFS. Utiliza XML para codificar e transportar os dados. O DISPRO foi construdo usando uma combinao de tecnologias de servidor web de cdigo aberto (um servidor Apache HTTP, contentor de servlets Java Apache Tomcat, e uma aplicao de visualizao de mapas certificada pelo OpenGIS, o UMN Server), e ferramentas de processamento Java/XML. Implementa ainda um servio web de mapas, recorrendo ao WMS da OGC.
39 A Figura 13 mostra a arquitectura do DISPRO.
Figura 13 - DISPRO Arquitectura O DISPRO implementa o WMS da OGC com oito ns (NERSC, NIVA, Met.no, PML, GKSS, Ifremer, Ecoles des Mines, CMRC), que disponibilizam um vasto conjunto de dados a partir de vrios sensores (por satlite, aparelhos areos, obtidos no local, etc.). Os ns so integrados atravs de um portal geogrfico no CMRC, que constri dinamicamente interfaces para os clientes do SIG, que lhes permitir trabalhar com os dados disponveis em cada n. A arquitectura do DISPRO contempla um sistema multi-camada, em que as vrias aplicaes-cliente comunicam com os servidores aplicacionais, que esto por sua vez ligados aos repositrios de dados. A Figura 14 mostra o sistema WMS implementado no DISPRO.
Figura 14 - DISPRO Implementao do WMS da OGC Quando um utilizador selecciona uma regio (1), feito um pedido GetCapabilities aos outros ns atravs da camada de software que contm o portal de integrao (2). Os ficheiros Capabilities devolvidos (3) so processados com ferramentas Java/XML no portal de integrao, e a interface do cliente SIG gerada e mostrada (4). As camadas dos mapas esto agora visveis atravs do cliente, com a camada de integrao a enviar os pedidos GetMap necessrios (5).
40 O sistema WMS implementado consiste em vrios componentes: A interface web para o SIG; A aplicao web do cliente do SIG; O cliente WMS; Os servidores WMS; E o software que agrega todos estes componentes. A Figura 15 mostra como o WMS est integrado na arquitectura do DISPRO.
Figura 15 - DISPRO Integrao do WMS 3.3.5. Open Format Converter O OFC (Open Format Converter) permite a converso de dados Vectoriais geoespaciais para vrios formatos. Define a estrutura para um conversor multifuncional que visa permitir a fcil implementao de formatos para alm dos propostos [Mrozek, Fraczek, 2004]. 3.3.5.1 OFC: O Problema Muitas organizaes e agncias governamentais utilizam formatos especiais para obter dados relacionados com as suas reas de interesse, como se d com o formato Digital Line Graph (DLG), utilizado pelo USGS (US Geological Survey), ou o Topologically Integrated Geographic Encoding and Referencing Files (TIGER), utilizado pelo SDTS (US Census Bureau and Spatial Data Transfer System (SDTS). Muitos formatos foram desenhados para facilitar a troca de informao entre sistemas, e muitos tem sido os esforos de normalizao feitos por organizaes internacionais no sentido de melhorar a interoperabilidade entre diferentes SIGs.
41 3.3.5.2 OFC: Desenho da soluo O OFC uma proposta de arquitectura que define uma estrutura extensvel para converter dados Vectoriais espaciais e no espaciais para formatos pretendidos. A arquitectura do OFC utiliza tecnologia orientada a objectos para armazenar dados em contentores internos universais e um conjunto de interfaces de entrada e sada de dados, utilizadas para aceder informao e escrev-la em vrios formatos. Fornece tambm funcionalidades de configurao que permitem controlar o comportamento do processo e definir transformaes adicionais para atributos no espaciais. 3.3.5.3 OFC: A Implementao A arquitectura do OFC inclui um mdulo principal, designado de Translation Core, que contm dois mdulos: o Geo-Core (Geospatial Core - GC) e a Attribute Matrix (AM). O GC o contentor universal para objectos espaciais Vectoriais de duas e trs dimenses. A estrutura foi desenhada assumindo que haver compatibilidade com as especificaes do GML 2.0. A Figura 16 apresenta a arquitectura genrica do conversor.
Figura 16 - Open Format Converter Arquitectura Apresenta o Translation Core, com os dois mdulos que o compem, o GC e o AM. As interfaces de entrada e sada de dados so representadas como dados de entrada do Translation Core e como dados de sada, representando os dados a converter como dados de input, e os dados j convertidos como dados de output. A estrutura de objectos que representam os contentores internos universais so, como j referido, orientadas a objectos, e permitem o armazenamento dos dados espaciais, como os pontos, as linhas, os polgonos, e ainda conjuntos de dados espaciais, como multi- pontos, multi-linhas, multi-polgonos, que na prtica definem hierarquias de objectos espaciais (por exemplo, multi-poligonos so vrios polgonos, que so um conjunto de anis lineares, que por sua vez so um conjunto de pontos ordenados).
42 A Figura 17 mostra o diagrama de objectos, representando as dependncias de agregao entre as estruturas dos vrios objectos armazenados no Translation Core.
Figura 17 - OFC Estrutura da herana dos objectos do Geo-Core O AM um contentor adicional para dados no espaciais. Este tipo de dados armazenado na forma de pares atributo-valor. Os atributos representam informao adicional relacionada com um objecto espacial, como o nome de uma rua, a profundidade mdia de um reservatrio de gua, etc. O AM permite tambm armazenar outros tipos de dados, como as propriedades e caractersticas de um objecto, ou ainda informao de visualizao do objecto, como cores, grossura e estilo das linhas, etc., que especificam como o objecto deve ser visualizado num mapa. Os dados armazenados no mdulo AM podem vir directamente dos dados de entrada ou podem ser calculados no momento pelo processo de configurao. Durante o processo de converso, o GC armazena um nico objecto processado. O AM carregado com a lista de atributos do objecto em processamento. As interfaces de entrada lem os dados a partir dos ficheiros ou de bases de dados, e armazenam-nos dentro dos mdulos do Translation Core. As interfaces de sada podem tambm escrever dados para ficheiros ou para bases de dados. Em muitos casos, o processo de converso requer configuraes adicionais. Isto pode ser feito por adicionar aplicao a possibilidade de utilizar ficheiros de configurao externos. Para isso, o OFC utiliza ficheiros XML de configurao. necessrio haver um ficheiro de configurao para cada tipo de converso.
43 A Figura 18 mostra um exemplo de um ficheiro de configurao.
Figura 18 - OFC Exemplo de ficheiro XML de configurao O XML composto por trs seces principais, dentro do n raiz, Configuration: General: contm informao comum sobre o processo, como o formato de origem, o formato de destino e tipos geomtricos opcionais. uma seco obrigatria no ficheiro de configurao; Input: esta seco opcional e controla a interface de entrada. Pode ser definido um dicionrio suplementar para obter valores de atributos adicionais que no esto disponveis no conjunto de atributos principal; Output: esta seco tambm opcional e controla a interface de sada. Pode conter instrues sobre como as coordenadas geomtricas podem ser apresentadas no destino. A principal vantagem da configurao avanada a possibilidade de influenciar e alterar o comportamento do processo de converso bsico implementado. Configuraes apropriadas podem alterar as actividades levadas a cabo pelas interfaces de entrada e sada.
44 3.4. Concluses sobre as arquitecturas analisadas A integrao de informao geogrfica significa tornar os dados espaciais acessveis a partir de varias tecnologias e fornecedores, e tornar as funcionalidades espaciais e de dados disponveis para outros sistemas, como CRM, logsticas, servios baseados em localizao para aparelhos sem fios, etc. A principal vantagem disponibilizar aos utilizadores os meios para aceder, combinar e disseminar informao geoespacial a partir de vrias fontes de informao distribudas. No limite, a integrao reduz custos de produo de informao, gesto e distribuio [McKee, OGC, 2005]. A integrao mais eficiente quando acompanhada com interfaces de normas abertas em vez de interfaces proprietrias. Sistemas que utilizam interfaces abertas podem tirar partido dos efeitos de rede que resultam de as mesmas interfaces serem utilizadas fora da empresa [McKee, OGC, 2005]. O objectivo do OGC criar uma nica infraestrutura neutra em termos de tecnologia proprietria para integrao da informao, e que funcione em qualquer lado, em vrias plataformas, tecnologias e tipos de aparelhos. As arquitecturas analisadas neste documento permitem chegar a vrias concluses neste campo. Em alguns casos, apresentam-se solues para problemas especficos. o caso da integrao do SIG e do DPLAN, implementado pela EDP. Trata-se de um desenvolvimento feito medida para responder a um problema especfico, mas que em termos de desenho de soluo contm algumas caractersticas de interesse para o estudo da integrao da informao. A parte da arquitectura que interessa realar o desenvolvimento de uma interface responsvel por fazer o mapeamento dos objectos entre os dois sistemas. Como referido, feito um mapeamento exaustivo dos objectos de e para cada um dos sistemas e so ainda includas no esquema de mapeamento formas de facilmente instalar ou remover o objecto. Tratando-se de uma soluo medida, dificilmente poderia ser adaptada a um cenrio como o que se discute nesta dissertao, de integrao de diversos formatos. No entanto, a soluo de desenvolvimento de uma interface com o mapeamento dos objectos entre os sistemas apresentada uma estratgia interessante a ter em conta. A proposta de [Ghosh et al, 2006], que prope uma arquitectura de integrao de dados de diferentes fontes numa abordagem orientada aos servios para SIGs Empresariais, reala a importncia de recorrer a normas. A arquitectura apresentada utiliza normas OGC amplamente aceites, as normas WMS e WFS, para integrar os dados. No entanto, o objectivo no especificamente a integrao de ficheiros de diferentes formatos, e sim a gerao de mapas com informao de vrias fontes a partir dos outputs do WMS e do
45 WFS. O output gerado sempre no formato GML, o que constitui uma limitao numa arquitectura de integrao de diferentes formatos. O ATIS apresenta uma soluo de implementao de uma arquitectura aberta e que permite escalabilidade pelo facto de ser modular. O DISPRO, embora no foque especificamente a integrao de dados Vectoriais, integra dados de diferentes fontes com o objectivo de gerar mapas, recorrendo para isso ao WMS. No podendo ser utilizado como uma arquitectura genrica de integrao, dado no se focar especificamente na integrao de ficheiros de diferentes formatos, permite assimilar algumas ideias interessantes a utilizar, como o facto de utilizar normas de integrao para processar os dados de input e gerar os mapas como output. Outra das solues estudadas o Open Format Converter. Apresenta uma arquitectura aberta de integrao de ficheiros, que permite a converso de diferentes formatos, e inclui alguns aspectos interessantes na forma como so tratados os dados dentro da arquitectura. o caso do Translation Core, que permite o tratamento de dados diferentes por mdulos diferentes. Os dois mdulos que apresenta, o GC, o contentor universal para objectos espaciais, e o AM, o contentor de dados no espaciais, tm responsabilidades distintas, apresentando tambm alguma modularidade, e sobretudo a distino no tratamento dos dados de acordo com a natureza dos mesmos. No entanto, com o aparecimento de normas mais recentes, como o WFS e o WMS, alguns componentes desta soluo passam a estar obsoletos. 3.5. Identificao de trabalho em aberto A existncia de informao geogrfica que referencia os mesmos locais, mas que est dispersa por diferentes ficheiros em diferentes formatos uma realidade. A informao geogrfica utilizado em SIGs heterognea, e continua a estar disponveis em vrios formatos e a estar armazenada em diferentes suportes multimdia, conduzindo ao problema da interoperabilidade entre sistemas. Tm sido desenvolvidos muitos trabalhos nos ltimos anos no sentido de desenvolver SIGs mais robustos, e de obter normas que ajudem a ultrapassar o problema da interoperabilidade. O aparecimento das normas da OGC, o WFS e o WMS, vieram facilitar esta tarefa. No entanto, de forma a ser possvel utilizar a informao dispersa, necessrio efectuar um conjunto de tarefas, desde converso para formatos reconhecidos pelo SIG que se pretende utilizar, at integrao da informao de forma manual, ou atravs de funcionalidades de integrao eventualmente disponibilizadas pelo SIG em utilizao, e que pode ou no suportar os formatos com que tem de lidar. Foram analisadas vrias solues de integrao de informao, que disponibilizam j algumas abordagens facilitadoras da converso e at mesmo da integrao.
46 No entanto, falta uma soluo de integrao que facilite o acompanhamento de todo o processo, desde a anlise da informao geogrfica dispersa por vrios ficheiros, at disponibilizao da informao integrada. So necessrias arquitecturas vocacionadas para sistemas de integrao de informao geogrfica, que integrem a informao proveniente de diferentes fontes, com diferentes formatos, e que permitam obter novas fontes em outros formatos, como resultado da integrao da informao. O captulo seguinte apresenta uma proposta de soluo para o problema da integrao da informao geogrfica dispersa por diferentes ficheiros, com diferentes formatos.
47 4. OPENGISINTEGRATOR PROPOSTA DE INTEGRAO DE INFORMAO GEOGRFICA A agregao de informao geogrfica a partir de fontes de informao heterogneas envolve a realizao de um conjunto de operaes de integrao. Neste captulo apresentada uma proposta de integrao da informao geogrfica, com recurso a diferentes mdulos, responsveis por efectuar diferentes operaes sobre os dados, com o objectivo final de os agregar e apresentar em um ou mais formatos geogrficos. A arquitectura proposta recebeu a designao de OpenGisIntegrator, e a Figura 19 apresenta o diagrama de contexto onde se insere.
Figura 19 - OpenGisIntegrator - Diagrama de Contexto O OpenGisIntegrator recebe n ficheiros de entrada, em diferentes formatos, e produz como sada os ficheiros de entrada agregados num nico ficheiro, que disponibilizado nos m formatos de sada definidos. 4.1. Descrio do OpenGisIntegrator O OpenGisIntegrator uma arquitectura que recebe como entrada dados Vectoriais disponibilizados em diferentes formatos. Estes dados so convertidos para um formato interno, sendo posteriormente integrados numa nica representao interna de dados, que pode ser apresentada como sada em um ou vrios formatos Vectoriais, escolhidos pelo utilizador.
48 A arquitectura genrica do OpenGisIntegrator apresentada na Figura 20.
Figura 20 - OpenGisIntegrator - Arquitectura O OpenGisIntegrator uma arquitectura composta por mdulos, ou componentes lgicos, com diferentes responsabilidades. Cada mdulo autnomo, desconhecendo a existncia de outros mdulos. As prximas seces explicam em detalhe as responsabilidades de cada componente lgico.
49 4.2. Componentes Lgicos do OpenGisIntegrator A arquitectura do OpenGisIntegrator composta por um controlador e trs componentes lgicos. A Tabela 7 apresenta resumidamente os componentes lgicos e as responsabilidades de cada um. Componente Responsabilidades Controller Garantir a comunicao entre os diferentes componentes lgicos. o nico meio que os componentes lgicos possuem para comunicar entre si DataRW Engine Gerir os contedos de entrada e sada do OpenGisIntegrator Converter Engine constitudo internamente por outros dois componentes: O Interface Recognizer: responsvel por identificar o formato a que cada ficheiro de entrada pertence, e associar a interface responsvel por esse formato a cada ficheiro; O Converter Processor: responsvel por converter os dados existentes nos ficheiros de entrada para o formato de representao interno, feita por cada interface de cada ficheiro. Aps o processo de converso e integrao, o Converter Engine tem a responsabilidade de converter os dados integrados no formato de representao interno para os formatos de sada Integrator Engine Integrar a informao dos diferentes ficheiros num nico ficheiro de dados, representado no formato de representao interno. Tabela 7 - OpenGisIntegrator - Componentes Lgicos Os componentes do OpenGisIntegrator so explicados detalhadamente em seguida.
50 4.2.1. Controller O Controller responsvel pelo controle da arquitectura. Todos os mdulos comunicam com o Controller. do Controller que recebem instrues e a ele que enviam o resultado do processamento pelo qual so responsveis As suas responsabilidades so enumeradas na Tabela 8. Responsabilidades do Controller Identificar o conjunto de ficheiros de entrada. Invocar o DataRW Engine, que obtm o contedo e a informao dos ficheiros de entrada. Obter o resultado do processamento do DataRW Engine. Invocar o Converter Engine, que recebe como dados de entrada a informao retornada pelo DataRW Engine. Obter o resultado do processamento do Converter Engine. Invocar o Integrator Engine, que recebe como dados de entrada a informao retornada pelo Converter Engine. Obter o resultado do processamento do Integrator Engine. Invocar o Converter Engine, que recebe como dados de entrada a informao retornada pelo Integrator Engine. Obter o resultado do processamento do Converter Engine. Retornar a informao retornada pelo Converter Engine, como resultado do processamento do OpenGisIntegrator. Tabela 8 - OpenGisIntegrator - Responsabilidades do Controller Desta forma, garantida a modularidade dos vrios componentes da arquitectura, sendo o controlo feito pelo Controller externamente a cada mdulo. 4.2.2. DataRW Engine O DataRW Engine tem como responsabilidade obter o contedo dos ficheiros de entrada e identificar o formato a que cada ficheiro pertence. tambm responsvel por gerar os ficheiros de sada, nos formatos previamente identificados.
51 4.2.2.1 Leitura dos Ficheiros de Entrada A Figura 21 mostra a arquitectura do DataRW Engine.
Figura 21 - OpenGisIntegrator - O DataRW Engine O DataRW Engine l os dados dos ficheiros de entrada e disponibiliza-os para o OpenGisIntegrator. Recebe tambm os dados integrados e escreve-os nos ficheiros de sada, nos formatos pretendidos. 4.2.2.2 Escrita dos Ficheiros de Sada Aps percorrer os ficheiros a integrar, e concluir a integrao de todas as caractersticas geogrficas, o ficheiro eleito como principal (mainFileX) possui integrada a informao de todos os ficheiros de entrada. Resta ento convert-lo para os formatos de sada. Para isso o Integrator Engine disponibiliza o ficheiro integrado para o Controller. A Figura 22 detalha a arquitectura do processo de integrao dos dados.
Figura 22 - OpenGisIntegrator - Gerao dos Ficheiros de Sada O Controller envia o ficheiro integrado para o Converter Engine, que identificou j os
52 formatos de sada. O Converter Engine efectua a converso, e envia os ficheiros de sada nos formatos finais para o Controller. Este envia os ficheiros para o DataRW Engine, que se encarrega de disponibilizar os binrios dos ficheiros gerados para o utilizador, nos vrios formatos definidos por este. O processo de converso est assim concludo. 4.2.3. Converter Engine A converso dos ficheiros de entrada da responsabilidade do Converter Engine. Este componente composto por dois mdulos: o Interface Recognizer e o Converter Processor. O Interface Recognizer o mdulo responsvel por receber os dados de entrada e coloc-los disponveis para serem convertidos. O Converter Processor o mdulo responsvel pela converso. So explicados em seguida em detalhe os dois mdulos que compem este componente. 4.2.3.1 Interface Recognizer O Interface Recognizer tem como funo identificar o formato de cada ficheiro de entrada e associar a interface correspondente, responsvel por conhecer esse formato. tambm responsvel por identificar os formatos pretendidos para os ficheiros de sada, e associar a interface correspondente.
53 4.2.3.1.1 Reconhecimento dos Formatos dos Ficheiros de Entrada A Figura 23 descreve o funcionamento interno do Interface Recognizer no tratamento dos ficheiros de entrada.
Figura 23 - OpenGisIntegrator - Arquitectura detalhada do Interface Recognizer O Interface Recognizer recebe do Controller a lista de ficheiros de entrada, que percorre com vista a identificar o formato a que pertencem. Aps identificar o formato, instancia a interface responsvel por esse formato. 4.2.3.1.2 Reconhecimento dos Formatos dos Ficheiros de Sada O Interface Recognizer tambm responsvel por identificar que formatos se pretendem nos ficheiros de sada, e instanciar as interfaces responsveis por esses formatos. A Figura 24 descreve o funcionamento interno do Interface Recognizer, agora na fase em que dever tratar os ficheiros de sada.
Figura 24 - OpenGisIntegrator - Identificao de Interfaces dos Ficheiros de Sada
54 As instncias de todas as interfaces identificadas so devolvidas para o Controller do OpenGisIntegrator, que se encarregar de garantir a continuao do processo de integrao. 4.2.3.2 Converter Processor O Converter Processor o conjunto de interfaces responsveis por conhecer os detalhes dos vrios formatos. A cada formato corresponde uma interface, responsvel por conhecer e converter de e para esse formato. A Figura 25 descreve o funcionamento do Converter Processor.
Figura 25 - OpenGisIntegrator - Arquitectura detalhada do Converter Processor O Converter Processor o conjunto de interfaces responsveis por converter cada ficheiro de entrada, bem como os ficheiros de sada, de e para o formato de representao interna do OpenGisIntegrator. A converso dos ficheiros de sada est representada na Figura 26.
Figura 26 - OpenGisIntegrator - Converso dos Ficheiros de Sada
55 Aps identificao das interfaces que conhecem os formatos de sada, o Converter Processor encarrega-se de efectuar a converso dos ficheiros de entrada, e notificar o Controller. 4.2.3.2.1 Modelo de Dados das Interfaces As interfaces esto modeladas num modelo de dados implementado num conjunto de classes do OpenGisIntegrator. A Figura 27 mostra o diagrama de classes das interfaces que integram o Converter Processor.
Figura 27 - OpenGisIntegrator - Diagrama de Classes do Converter Processor Cada interface de cada formato herda da classe Interface. Cada interface tem como atributo o ficheiro de entrada, cujo contedo guardado no atributo input_file.
56 A Tabela 9 descreve os mtodos definidos para cada interface. Mtodo Descrio get_source_file Mtodo responsvel por obter o contedo do ficheiro de entrada convert_input_data Mtodo responsvel por converter os dados de entrada para o formato de representao interno convert_output_data Mtodo responsvel por converter os dados de entrada no formato de representao interno para o formato da interface convert_to_point Mtodo responsvel por converter os dados de entrada sobre a caracterstica geogrfica pontos para o formato de representao interno convert_to_line Mtodo responsvel por converter os dados de entrada sobre a caracterstica geogrfica linha para o formato de representao interno convert_to_polygon Mtodo responsvel por converter os dados de entrada sobre a caracterstica geogrfica polgono para o formato de representao interno convert_from_point Mtodo responsvel por converter os dados de entrada sobre a caracterstica geogrfica ponto do formato de representao interno para o formato da interface convert_from_line Mtodo responsvel por converter os dados de entrada sobre a caracterstica geogrfica linha do formato de representao interno para o formato da interface convert_from_polygon Mtodo responsvel por converter os dados de entrada sobre a caracterstica geogrfica polgono do formato de representao interno para o formato da interface prepare_conversion_to_x Mtodo responsvel por validar se o contedo do ficheiro foi obtido com sucesso make_conversion_to_x Mtodo responsvel por fazer a converso para o formato de representao interno; invoca os mtodos convert_to_point, convert_to_line and convert_to_polygon prepare_conversion_from_x Mtodo responsvel por validar se o contedo do ficheiro foi gerado no formato da interface com sucesso make_conversion_from_x Mtodo responsvel por fazer a converso do formato de representao interno para o formato da interface; invoca os mtodos convert_from_point, convert_from_line and convert_from_polygon Tabela 9 - OpenGisIntegrator - Mtodos das Interfaces
57 Ao modelar as classes que representam as interfaces recorrendo herana, as classes que modelam as vrias interfaces partilham a mesma estrutura, generalizando assim a forma de acesso a cada interface. O Converter Processor assim constitudo por uma estrutura modular e escalvel. Caso se pretenda acrescentar uma nova interface a este componente (e por consequncia, ao OpenGisIntegrator), bastar que a nova interface seja implementada herdando as caractersticas da classe interface. 4.2.4. Integrator Engine Este o componente principal do OpenGisIntegrator, j que responsvel por efectuar a integrao dos ficheiros de diferentes formatos. neste componente que so resolvidos conflitos de integrao, so agrupadas as caractersticas geogrficas dos vrios ficheiros de entrada, e que produzido o ficheiro de sada no formato interno, que ser depois convertido para os diferentes formatos de sada pretendidos pelo utilizador. Explica-se em seguida o funcionamento deste componente. Aps receber os ficheiros de entrada j convertidos para o formato de representao interno, utilizado internamente pelo OpenGisIntegrator, esto reunidas as condies para integrar os dados provenientes de diferentes formatos num nico ficheiro. A Figura 28 detalha a arquitectura do processo de integrao dos dados.
Figura 28 - OpenGisIntegrator - Detalhe da Arquitectura do Integrator Engine A integrao feita elegendo um dos ficheiros como o ficheiro principal, e adicionando em seguida a este os dados existentes nos restantes ficheiros a integrar.
58 A Figura 29 e a Figura 30 detalham o processo de integrao. Os dados dos ficheiros de entrada, j disponveis em instncias da classe input_data, incluem os dados das caractersticas geogrficas ponto, linha e polgono.
Figura 29 - OpenGisIntegrator - Instncias da classe input_data O Ficheiro 1 eleito como o ficheiro principal.
Figura 30 - OpenGisIntegrator - Detalhe do Integrator Engine ao Ficheiro 1 que sero adicionadas as caractersticas geogrficas dos restantes ficheiros, recorrendo para isso aos mtodos da classe feature, update_points, update_lines e update_polygons. O resultado ser o Ficheiro 1, que conter os dados dos ficheiros Ficheiro 2 e Ficheiro 3.
59 4.3. Formato de Representao Interno O formato de representao interno um modelo de dados implementado atravs de um conjunto de classes que representam as caractersticas geogrficas que os ficheiros representam. Cada interface conhece o formato de representao interno do OpenGisIntegrator, de modo a poder fazer converses de e para este formato. A Figura 31 representa o diagrama de classes que constituem o formato de representao interno.
Figura 31 - OpenGisIntegrator - Diagrama de Classes da Representao Interna A classe Input_data representa a instncia de cada ficheiro de entrada, o que equivale a dizer que por cada ficheiro de entrada haver uma instncia da classe Input_data com os dados do ficheiro de entrada disponveis no formato de representao interno do OpenGisIntegrator. Esta classe agrega vrias caractersticas geogrficas, disponibilizadas pela classe feature. As classes Point, Line e Polygon herdam da classe feature, e representam as caractersticas geogrficas respectivas, existentes em cada ficheiro.
60 A Tabela 10 descreve as classes modeladas. Classe Descrio input_data Classe responsvel por modelar o ficheiro de entrada; a cada ficheiro de entrada ir corresponder uma instncia da classe input_data; esta classe possui como atributos os pontos, linhas e polgonos obtidos a partir dos ficheiros de entradas correspondentes feature Classe responsvel por gerir as caractersticas geogrficas existentes nos ficheiros; disponibiliza os seguintes mtodos: . point_exists: verifica se determinado ponto j existe na classe . line_exists: verifica se determinada linha j existe na classe . polygon_exists: verifica se determinado polgono j existe na classe . add_point: adiciona um ponto classe . add_line: adiciona uma linha classe . add_polygon: adiciona um polgono classe . update_points: actualiza um ponto da classe . update_lines: actualiza uma linha da classe . update_polygons: actualiza um polgono da classe point Classe responsvel por gerir a caracterstica geogrfica ponto; disponibiliza os seguintes atributos: . posX: coordenada X do ponto . posY: coordenada Y do ponto . posZ: coordenada Z do ponto disponibiliza ainda os seguintes mtodos: . set_point_X: actualiza o ponto X . set_point_Y: actualiza o ponto Y . set_point_Z: actualiza o ponto Z line Classe responsvel por gerir a caracterstica geogrfica linha; disponibiliza os seguintes atributos: . posXYini: coordenadas XY do inicio da linha . posXYfim: coordenadas XY do fim da linha disponibiliza ainda os seguintes mtodos: . set_line_XYini: actualiza as coordenadas do incio da linha . set_line_XYfim: actualiza as coordenadas do fim da linha polygon Classe responsvel por gerir a caracterstica geogrfica poligono; disponibiliza os seguintes atributos: . super_type: supertipo de polgono . type: tipo de polgono . coord: coordenadas do poligono disponibiliza ainda os seguintes mtodos: . set_super_type: actualiza o supertipo de polgono . set_type: actualiza o tipo de polgono . set_coord: actualiza as coordenadas do polgono Tabela 10 - OpenGisIntegrator - Classes do formato de Representao Interno O Converter Engine, especificamente o Converter Processor, produz os ficheiros de sada a partir do formato de representao interno.
61 4.4. Resoluo de Conflitos O processo de integrao de ficheiros com informao geogrfica passa por agregar informao geogrfica de diferentes ficheiros, muitas vezes referente mesma rea geogrfica. Dado que um ficheiro pode referenciar as mesmas caractersticas geogrficas que outro ficheiro a ser agregado, torna-se necessrio validar se se trata da mesma caracterstica ou de caractersticas semelhantes, mas que representem pontos diferentes no terreno. Pela natureza do processo de integrao, podem surgir conflitos na agregao, que a arquitectura do OpenGisIntegrator tem de identificar e permitir resolver, de forma a garantir que o ficheiro de sada integra realmente todas as caractersticas geogrficas de todos os ficheiros de entrada. 4.4.1. Tipos de Conflitos Como integrar dois pontos, linhas ou polgonos com coordenadas aproximadas so questes que se levantam na integrao de caractersticas geogrficas. A Tabela 11 tipifica os conflitos possveis na integrao das caractersticas geogrficas em anlise nesta dissertao. Tipo de Caracterstica Cenrio Ficheiro de Sada Gerado um nico ponto point n Pontos existentes em coordenadas que distam X graus entre si Gerados n pontos Gerada uma nica linha line n Linhas existentes em coordenadas que distam X graus entre si Geradas n linhas Gerado um nico polgono polygon n Polgonos existentes em coordenadas que distam X graus entre si Gerados n polgonos Tabela 11 - Tipos de Conflitos na Integrao Geogrfica 4.4.2. Mtodos de Resoluo de Conflitos O OpenGisIntegrator suporta a implementao de mtodos responsveis por verificar se determinada caracterstica geogrfica j existe. O componente lgico responsvel por garantir a resoluo dos conflitos que eventualmente surjam na integrao de caractersticas geogrficas semelhantes o Integrator Engine. Como j referido, o Integrator Engine percorre os ficheiros de entrada inseridos, com o objectivo de integrar a informao geogrfica de todos os ficheiros em apenas um nico ficheiro principal, eleito dentre os ficheiros de entrada, que incluir toda a informao geogrfica.
62 A proposta do OpenGisIntegrator para o processo de integrao passa por implementar mecanismos no Integrator Engine que percorram todas as caractersticas geogrficas de cada ficheiro com o objectivo de analisar cada uma e verificar se deve ser actualizada uma caracterstica geogrfica j existente, ou acrescentada a nova caracterstica geogrfica ao ficheiro principal. A resoluo de conflitos feita recorrendo aos mtodos da classe feature. Cada instncia de cada ficheiro de entrada herda uma instncia desta classe. Os mtodos disponibilizados pela classe feature foram desenhados especificamente com o objectivo de gerir os conflitos na integrao das caractersticas geogrficas. Os mtodos da classe feature dividem-se em trs tipos, de acordo com a Tabela 12. Tipos de Mtodos Descrio Mtodos abrangidos point_exists line_exists Verificao Mtodos de verificao da existncia da caracterstica geogrfica em anlise polygon_exists add_point add_line Adio Mtodos de adio da caracterstica geogrfica em anlise add_polygon update_point update_line Actualizao Mtodos de actualizao de uma caracterstica geogrfica existente com informao da caracterstica geogrfica em anlise update_polygon Tabela 12 - Classe feature - Tipos de Mtodos As prximas seces explicam o funcionamento dos tipos de mtodos. 4.4.2.1 Mtodos de Verificao O resultado das verificaes dita o que dever acontecer com a caracterstica geogrfica em anlise. Para efectuar essa verificao, devero ser utilizados os mtodos de verificao. A implementao dos mtodos de verificao deve incluir mtricas de comparao de caractersticas geogrficas adequadas s necessidades de cada realidade. Por exemplo, num determinado cenrio dois pontos que distem 2 metros entre si podem ser considerados o mesmo ponto, descrito pela mesma caracterstica geogrfica. No entanto, noutro cenrio esta distncia j poder ser pertinente, podendo a implementao optar por manter os dois pontos como caractersticas geogrficas distintas.
63 4.4.2.2 Mtodos de Adio Caso o resultado da verificao da existncia de uma caracterstica geogrfica indique que a caracterstica no existe, ento a implementao da arquitectura deve fornecer mtodos para implementar os mecanismos de adio. Os mtodos de adio tm esse objectivo. Sempre que se verifique que se trata de caractersticas geogrficas diferentes, ento a caracterstica geogrfica em anlise dever ser adicionada ao ficheiro principal. A implementao dos mtodos de adio deve garantir que as caractersticas geogrficas novas so adicionadas. 4.4.2.3 Mtodos de Actualizao Caso o resultado da verificao da existncia de uma caracterstica geogrfica indique que se trata de uma caracterstica geogrfica j existente, dever acontecer uma de duas situaes: Verifica-se que se trata de uma caracterstica geogrfica j existente, cujos atributos descrevem tambm a nova caracterstica geogrfica em anlise, e nesse caso no executada qualquer operao; Verifica-se que se trata de uma caracterstica geogrfica j existente, mas cujo atributos necessitam de ser actualizados de modo a descreverem tambm a nova caracterstica geogrfica em anlise. Nesse caso, os mtodos de actualizao devero garantir a actualizao dos atributos da caracterstica geogrfica em anlise. 4.4.2.4 A Integrao O OpenGisIntegrator garante a integrao recorrendo aos trs tipos de mtodos acima descritos. Desta forma garantida a integrao das caractersticas geogrficas dos ficheiros de entrada, sendo integradas num nico ficheiro, que descrever as caractersticas geogrficas de todos os ficheiros inseridos. Como j referido, os critrios para verificar se determinada caracterstica geogrfica existe podem variar de implementao para implementao da arquitectura, de acordo com as necessidades da soluo implementada. O OpenGisIntegrator prope o Integrator Engine como o mdulo responsvel pela implementao de mtodos que garantam a combinao de caractersticas geogrficas semelhantes, disponibilizando um processo de integrao que abrange todos as caractersticas geogrficas armazenadas em todos os ficheiros de entrada.
64 4.5. Fluxo de Integrao de Ficheiros Putting It All Together O OpenGisIntegrator permite a integrao de ficheiros com informao geogrfica em diferentes fontes, recorrendo aos componentes lgicos que o compem. O fluxo de integrao de ficheiros exemplificado na Figura 32, que apresenta um diagrama de sequncia de integrao de trs ficheiros contendo informao geogrfica.
Figura 32 - OpenGisIntegrator - Diagrama de Sequncia Ficheiros de Entrada A Figura 33 apresenta o diagrama que representa o ficheiro produzido com a informao geogrfica destes trs ficheiros integrada num s ficheiro, apresentado em dois ficheiros de diferentes formatos.
Figura 33 - OpenGisIntegrator - Diagrama de Sequncia Ficheiros de Sada
65 O diagrama de sequncia apresentado descrito em seguida. 4.5.1. Dados de Entrada O utilizador insere os ficheiros Ficheiro 1, Ficheiro 2 e Ficheiro 3 no OpenGisIntegrator, e despoleta o processo de integrao. Os ficheiros so recebidos pelo DataRW Engine, responsvel por gerir os ficheiros de entrada e sada do OpenGisIntegrator. O DataRW Engine notifica o Controller 4.5.2. Converso dos Dados de Entrada O Controller notifica o Converter Engine que tm ficheiros. O Converter Engine associa a interface correcta a cada ficheiro, atravs do Interface Recognizer, e efectua a converso para o formato interno atravs do Converter Processor. Notifica ento o Controller, que reconhece ento cada ficheiro convertido no formato representao interno. 4.5.3. Integrao dos Dados de Entrada O Controller notifica agora o Integrator Engine, que obtm o contedo dos ficheiros, j no formato de representao interno, e integra todos os ficheiros, resolvendo todos os conflitos que surgem, e gerando um ficheiro final, no formato de representao interno, com a representao de toda a informao geogrfica existente nos vrios ficheiros de entrada. Notifica ento o Controller da integrao dos ficheiros. 4.5.4. Gerao do Ficheiro de Sada O Controller notifica agora o Converter Engine que possui o ficheiro no formato de representao interno. O Converter Engine efectua ento a converso do ficheiro integrado para os formatos dos ficheiros de sada definidos pelo utilizador. Utiliza novamente o Interface Recognizer para associar as interfaces aos formatos definidos pelo utilizador, e o Converter Processor para efectuar a converso, agora do ficheiro no formato interno para os ficheiros de sada nos formatos pretendidos. Notifica ento o Controller que possui os ficheiros prontos a entregar ao utilizador. O Controller notifica ento novamente o DataRW Engine, que se encarrega de gravar os ficheiros de sada numa localizao fsica no disco, disponibilizando-os ao utilizador.
66 4.5.5. Resumo do Processo O OpenGisIntegrator produz assim o ficheiro de sada, obtido a partir de ficheiros de entrada em diferentes formatos, convertendo cada um deles para o formato de representao interno, e integrando-os em seguida num nico ficheiro. Aps a integrao, o ficheiro convertido para os formatos de sada especificados, e estes so ento devolvidos pela arquitectura. 4.6. OpenGisIntegrator - A Proposta de Arquitectura Este captulo descreveu a proposta de arquitectura de integrao geogrfica, designada por OpenGisIntegrator. A integrao de informao geogrfica existente em diferentes formatos passa por diferentes processos. Perante a existncia de diferentes ficheiros com diferentes formatos, e identificada a necessidade de utilizar a informao geogrfica armazenada nesses ficheiros num SIG, necessrio efectuar um conjunto de passos at poder utilizar a informao no formato que se pretende. Exige-se que sejam executadas operaes de converso dos ficheiros para formatos aceites pelo SIG. tambm necessrio efectuar um trabalho de integrao da informao num nico ficheiro, ou em alternativa, inserir todos os ficheiros no SIG, caso este suporte a integrao da informao. Na presena de um nmero considervel de ficheiros, o processo de converso, integrao e utilizao da informao geogrfica pode tornar-se complexo. A proposta do OpenGisIntegrator uma arquitectura que modela as diferentes fases do processo, desenhando uma soluo de implementao que permita agilizar o processo de integrao da informao geogrfica. O captulo seguinte descreve a avaliao experimental feita, com recurso a um prottipo que demonstra uma implementao da arquitectura proposta.
67 5. AVALIAO EXPERIMENTAL Para testar a implementao da arquitectura proposta, foi construdo um prottipo da soluo proposta, o OpenGisIntegrator, que implementa a arquitectura descrita no captulo anterior. O prottipo tem como objectivo validar uma possvel implementao da arquitectura descrita nesta dissertao. 5.1. Interface Grfica do Prottipo O prottipo composto por uma interface grfica, conforme mostra a Figura 34.
Figura 34 - Prottipo do OpenGisIntegrator O prottipo disponibiliza os seguintes campos: Localizao dos ficheiros de entrada: caixas de insero onde so inseridas as localizaes dos ficheiros de entrada; Definio dos formatos dos ficheiros de entrada; caixas de seleco onde possvel seleccionar o formato do ficheiro de entrada, dentre os formatos disponveis; Adio ( ): funcionalidade que permite adicionar mais caixas de insero para ficheiros de entrada; Definio dos formatos do ficheiro de sada: caixas de seleco onde possvel seleccionar o formato dos ficheiros de sada, dentre os formatos disponveis;
68 Adio ( ): funcionalidade que permite adicionar mais formatos para ficheiros de sada, dentre os formatos disponveis; Boto : funcionalidade que despoleta o processo de integrao. 5.2. Parametrizaes de Configuraes O prottipo implementado possui um conjunto de definies, utilizadas no processo de integrao da informao geogrfica inserida. Estas definies dividem-se em premissas, sobre as quais o prottipo assenta, e em detalhes de implementao, includos na arquitectura e que definem o comportamento do prottipo em situaes de integrao especificas. Estas parametrizaes so detalhadas em seguida. 5.2.1. Premissas O prottipo implementado assume um conjunto de premissas, listadas em seguida: Os ficheiros inseridos contemplam dados sobre as caractersticas geogrficas ponto, linha e poligono, sendo omissos quaisquer dados adicionais, como atributos, metadados, ou outros; Assume-se que sempre que duas coordenadas distem entre si at 1 (um) metro, considera-se que se tratam das mesmas coordenadas, salvo se for necessrio defini-las em separado; Assume-se que todos os ficheiros inseridos utilizam o mesmo sistema de coordenadas, no sendo contempladas converses entre sistemas de coordenadas. 5.2.2. Implementao do Processo de Integrao O processo de integrao implementado no prottipo compara todos os ficheiros de entrada. O processo de integrao implementado assume, tal como definido na arquitectura proposta, o primeiro ficheiro de entrada lido como sendo o ficheiro principal. Os restantes ficheiros de entrada so integrados comparando as caractersticas que possuem com as caractersticas existentes neste ficheiro principal. As linhas e os polgonos so definidos por conjuntos de pontos. O OpenGisIntegrator implementa os mecanismos de integrao por comparao dos pontos que definem as caractersticas geogrficas. Apenas so comparadas caractersticas geogrficas do mesmo tipo. Pontos so comparados com pontos, linhas so comparadas com linhas e polgonos so comparados com polgonos. So comparados os pares de coordenadas
69 que compem essa caracterstica. Cada par de coordenadas, representado por um ponto definido por coordenadas (x,y), comparado com um par de coordenadas j existente no ficheiro principal. Desta forma, em cada momento apenas so comparados dois pontos (x,y) de cada vez. A implementao do processo de integrao contempla a resoluo de conflitos que surgem na integrao de caractersticas geogrficas do mesmo tipo. A Tabela 13 descreve a implementao dos mtodos de resoluo de conflitos que surgem na comparao de coordenadas (x,y), de acordo com a caracterstica geogrfica em anlise em cada momento. Definem-se como pontos comuns os pontos que distam entre si at 1 (um) metro. Caracterstica Resoluo de Conflitos Pontos O ponto a ser integrado comum a um ponto j existente no ficheiro principal: o ponto em anlise ignorado; O ponto a ser integrado no comum a nenhum ponto j existente no ficheiro principal: o ponto em anlise acrescentado ao ficheiro principal. Linhas So comparados todos os pontos que constituem a linha a ser integrada. O ponto a ser integrado comum a um ponto j existente numa linha definida no ficheiro principal: . Se o ponto anterior analisado for um ponto comum, o ponto em anlise ignorado; . Se o ponto anterior analisado no for um ponto comum, a linha em anlise acrescentada ao ficheiro principal, adicionando o ponto em anlise e o ponto anterior analisado; O ponto a ser integrado no comum a nenhum ponto j existente numa linha definida no ficheiro principal: a linha em anlise acrescentada ao ficheiro principal, adicionando o ponto em anlise e o ponto anterior analisado. Polgonos So comparados todos os pontos que constituem o polgono a ser integrada. O ponto a ser integrado comum a um ponto j existente num polgono definido no ficheiro principal: . Se o ponto anterior analisado for um ponto comum, o ponto em anlise ignorado; . Se o ponto anterior analisado no for um ponto comum, a linha do polgono em anlise acrescentada ao ficheiro principal, adicionando o ponto em anlise e o ponto anterior analisado; O ponto a ser integrado no comum a nenhum ponto j existente num polgono definido no ficheiro principal: a linha do polgono em anlise acrescentada ao ficheiro principal, adicionando o ponto em anlise e o ponto anterior analisado. Tabela 13 - Parametrizaes do Prottipo
70 Foram implementados os seguintes formatos para a validao da arquitectura: KML, GML e geoRSS. 5.3. Cenrios de Avaliao O prottipo do OpenGisIntegrator foi avaliado em diferentes cenrios de teste, de forma a validar a implementao da arquitectura proposta. Foram efectuados dois tipos de avaliao: Avaliao da arquitectura: foram validados cenrios que permitiram avaliar a escalabilidade da arquitectura, a produo de ficheiros de sada em mais que um formato, e a integrao de ficheiros do mesmo formato e de diferentes formatos; Avaliao da integrao das caractersticas geogrficas: foram validados cenrios de integrao de pontos comuns ou distintos, linhas comuns ou distintas e polgonos comuns ou distintos. Foram avaliadas as formas de resoluo de conflitos que surgiram decorrentes da existncia de caractersticas geogrficas cuja localizao era aproximada, e foram testados os mecanismos que permitiram decidir se se tratava da mesma caracterstica ou de uma caracterstica diferente. Neste tipo de avaliao foram tambm testados cenrios de integrao de caractersticas geogrficas diferentes. A avaliao experimental, bem como os resultados obtidos, so descritos nas seces seguintes. 5.3.1. Avaliao da Arquitectura A avaliao da arquitectura permitiu testar o comportamento do OpenGisIntegrator ao integrar informao geogrfica existente em diferentes ficheiros, em diferentes formatos, e sempre que haja necessidade de acrescentar novas interfaces para suportar novos formatos at ento no suportados. Os cenrios de avaliao so descritos em seguida. 5.3.1.1 Avaliao da Escalabilidade da Arquitectura O OpenGisIntegrator permite acrescentar suporte a novos formatos, sem que este tipo de alteraes arquitectura tenha um impacto significativo na implementao. Para validar este cenrio, o OpenGisIntegrator foi inicialmente desenvolvido suportando dois formatos, o KML e o GML, tendo sido posteriormente acrescentado o formato geoRSS arquitectura.
71 A implementao seguiu os seguintes passos: Foi acrescentada ao Converter Engine uma nova interface para o novo formato, que herda da classe Interface, actualizada com dados especficos do formato geoRSS:
Foi alterado o Interface Recognizer, de modo a incluir o mapeamento para o novo formato: get_interface : function (input_file) { var interface_recognizer; var file_format = input_file.file_format;
switch (file_format) { case "gml" : interface_recognizer = new gml_interface(input_file); break; case "kml" : interface_recognizer = new kml_interface(input_file); break; case "geoRSS" : interface_recognizer = new georss_interface(input_file); break; default : interface_recognizer = null; break; }
return interface_recognizer; } Foi acrescentada ao DataRW Engine a indicao do suporte ao novo formato: this.supported_formats = ["kml", "gml", "geoRSS"]; Esta alterao reflectiu-se na lista de formatos suportados visualizados no prottipo: : Para validar o cenrio, foi feita uma converso simples do formato geoRSS para o formato GML. Foi inserido o ficheiro geoRSS com a seguinte estrutura: <feed xmlns=" http://www.w3.org/2005/Atom" xmlns:georss="http://www.georss.org/georss"> <entry> <georss:point>45.256 -71.92</georss:point> </entry> </feed>
72 Foi dada instruo de integrao, e foi gerado o ficheiro convertido para GML. O ficheiro gerado possui a seguinte estrutura: <gml:sample xmlns:gml="http://www.w3.org/TR/html4/"> <gml:position xmlns:gml="http://www.w3.org/TR/html4/"> <gml:Point xmlns:gml="http://www.w3.org/TR/html4/"> <gml:coordinates>45.256,-71.92</gml:coordinates> </gml:Point> </gml:position> </gml:sample> A converso simples foi efectuada com sucesso. As caractersticas geogrficas existentes no ficheiro com o formato geoRSS foram convertidas para o formato GML, tal como se pretendia validar. 5.3.1.2 Avaliao da Integrao de Ficheiros de Formatos Diferentes O OpenGisIntegrator dever permitir integrar informao geogrfica existente em diferentes ficheiros de diferentes formatos, resultando num ficheiro de sada que dever incluir a informao de entrada integrada. Para verificar este cenrio, foram inseridos trs ficheiros de diferentes formatos, KML, GML e geoRSS, e foi seleccionado o formato KML como formato de sada. Aps insero da localizao dos ficheiros foi dada a instruo de integrao. Foram inseridos trs ficheiros com a seguinte estrutura: Ficheiro #1 Formato geoRSS - inclui a caracterstica geogrfica Ponto: <feed xmlns=" http://www.w3.org/2005/Atom" xmlns:georss="http://www.georss.org/georss"> <entry> <georss:point>45.256 -71.92</georss:point> </entry> </feed> Ficheiro #2 Formato GML - inclui a caracterstica geogrfica Linha: <gml:LineString xmlns="http://www.opengis.net/examples" xmlns:gml="http://www.opengis.net/gml"> <gml:coordinates>45.67,88.56 55.56,89.44</gml:coordinates> </gml:LineString > Ficheiro #3 Formato KML - inclui a caracterstica geogrfica Polgono: <kml xmlns="http://www.opengis.net/kml/2.2"> <Placemark> <Polygon> <outerBoundaryIs> <LinearRing> <coordinates> -77.05788457660967,38.87253259892824,100 -77.05465973756702,38.87291016281703,100 -77.05315536854791,38.87053267794386,100 -77.05552622493516,38.868757801256,100 </coordinates> </LinearRing> </outerBoundaryIs> </Polygon> </Placemark> </kml>
73 Foi dada instruo de integrao e foi gerado o ficheiro convertido para KML. O ficheiro gerado possui a seguinte estrutura: <kml xmlns="http://www.opengis.net/kml/2.2"> <Placemark xmlns=""> <Point> <coordinates>45.256,-71.92</coordinates> </Point> </Placemark> <Placemark xmlns=""> <LineString> <coordinates>45.67,88.56 55.56,89.44</coordinates> </LineString> </Placemark> <Placemark xmlns=""> <Polygon> <outerBoundaryIs> <LinearRing> <coordinates> -77.05788457660967,38.87253259892824,100 -77.05465973756702,38.87291016281703,100 -77.05315536854791,38.87053267794386,100 -77.05552622493516,38.868757801256,100 </coordinates> </LinearRing> </outerBoundaryIs> </Polygon> </Placemark> </kml> A integrao de ficheiros de diferentes formatos foi efectuada com sucesso. O ficheiro resultante da integrao inclui as caractersticas geogrficas existentes nos trs ficheiros de entrada, nomeadamente, as Linhas, os Pontos e os Polgonos, integrados num nico ficheiro, no formato de sada definido, KML, tal como se pretendia. 5.3.1.3 Avaliao dos Ficheiros de Sada em Diferentes Formatos O OpenGisIntegrator permite integrar os ficheiros de entrada num nico ficheiro, que pode ser apresentado ao utilizador em diferentes formatos. Para verificar este cenrio, foi inserida a localizao dos trs ficheiros de diferentes formatos, KML, GML e geoRSS, utilizados no exemplo de avaliao anterior, e foram seleccionados como formatos de sada o formato KML e o formato GML. O contedo dos ficheiros de entrada o seguinte: Ficheiro #1 Formato geoRSS - inclui a caracterstica geogrfica Ponto: <feed xmlns=" http://www.w3.org/2005/Atom" xmlns:georss="http://www.georss.org/georss"> <entry> <georss:point>45.256 -71.92</georss:point> </entry> </feed>
74 Ficheiro #2 Formato GML - inclui a caracterstica geogrfica Linha: <gml:LineString xmlns="http://www.opengis.net/examples" xmlns:gml="http://www.opengis.net/gml"> <gml:coordinates>45.67,88.56 55.56,89.44</gml:coordinates> </gml:LineString > Ficheiro #3 Formato KML - inclui a caracterstica geogrfica Polgono: <kml xmlns="http://www.opengis.net/kml/2.2"> <Placemark> <Polygon> <outerBoundaryIs> <LinearRing> <coordinates> -77.05788457660967,38.87253259892824,100 -77.05465973756702,38.87291016281703,100 -77.05315536854791,38.87053267794386,100 -77.05552622493516,38.868757801256,100 </coordinates> </LinearRing> </outerBoundaryIs> </Polygon> </Placemark> </kml> Foi dada instruo de integrao e foram gerados os ficheiros de sada nos formatos KML e GML. O ficheiro gerado no formato KML possui a seguinte estrutura: <kml xmlns="http://www.opengis.net/kml/2.2"> <Placemark xmlns=""> <Point> <coordinates>45.256,-71.92</coordinates> </Point> </Placemark> <Placemark xmlns=""> <LineString> <coordinates>45.67,88.56 55.56,89.44</coordinates> </LineString> </Placemark> <Placemark xmlns=""> <Polygon> <outerBoundaryIs> <LinearRing> <coordinates> -77.05788457660967,38.87253259892824,100 -77.05465973756702,38.87291016281703,100 -77.05315536854791,38.87053267794386,100 -77.05552622493516,38.868757801256,100 </coordinates> </LinearRing> </outerBoundaryIs> </Polygon> </Placemark> </kml>
75 O ficheiro gerado no formato GML possui a seguinte estrutura: <Model> <gml:Point> <gml:pos>45.256,-71.92</gml:pos> </gml:Point> <gml:LineString> <gml:coordinates>45.67,88.56 55.56,89.44</gml:coordinates> </gml:LineString > <gml:Polygon> <gml:outerBoundaryIs> <gml:LinearRing> <gml:coordinates> -77.05788457660967,38.87253259892824,100 -77.05465973756702,38.87291016281703,100 -77.05315536854791,38.87053267794386,100 -77.05552622493516,38.868757801256,100 </gml:coordinates> </gml:LinearRing> </gml:outerBoundaryIs> </gml:Polygon> </kml> A gerao dos ficheiros de sada nos formatos seleccionados foi efectuada com sucesso. Os ficheiros resultantes da integrao incluem as caractersticas geogrficas existentes nos trs ficheiros de entrada, nomeadamente, as Linhas, os Pontos e os Polgonos, integrados num nico ficheiro, disponibilizado em dois formatos de sada, o formato KML e o formato GML, tal como se pretendia. 5.3.2. Avaliao da Integrao das Caractersticas Geogrficas A avaliao da integrao das caractersticas geogrficas permitiu testar o comportamento do OpenGisIntegrator ao lidar com coordenadas geograficamente prximas. Para efeitos de simplificao e melhor compreenso dos cenrios de teste, foram utilizados ficheiros de entrada no formato KML. Os ficheiros de entrada incluem coordenadas no datum WSG84, e os grficos utilizados para representao das caractersticas geogrficas so disponibilizados em metros. Os cenrios de avaliao so descritos em seguida. 5.3.2.1 Avaliao da Integrao de Pontos Neste cenrio de utilizao, foram avaliadas as funcionalidades de integrao de caractersticas geogrficas do tipo Ponto existentes em dois ficheiros distintos. Os ficheiros de entrada utilizados incluem um conjunto de pontos, alguns com coordenadas aproximadas geograficamente, devendo portanto ser detectada correspondncia entre os pontos, e outros que no tm correspondncia entre si.
76 Para efectuar a validao, foram inseridos dois ficheiros. O Ficheiro #1 possui a seguinte estrutura: <kml> <Placemark> <Point> <coordinates>58.51127403328638,0.000027058128099035313</coordinates> </Point> <Point> <coordinates>58.51128299228297,0.000036077504577906815</coordinates> </Point> <Point> <coordinates>58.51130091027761,0.000027058129102217802</coordinates> </Point> <Point> <coordinates>58.51129195128087,0.00000901937625594144</coordinates> </Point> <Point> <coordinates>58.51126507428996,0.000009019375921546616</coordinates> </Point> </Placemark> </kml> A Figura 35 representa os pontos do Ficheiro #1 em metros. 0,00 0,50 1,00 1,50 2,00 2,50 3,00 3,50 4,00 4,50 5,00 5,50 0, 00 0, 50 1, 00 1, 50 2, 00 2, 50 3, 00 3, 50 4, 00 4, 50 5, 00 5, 50
Figura 35 - Integrao de Pontos - Ficheiro #1 O Ficheiro #2 possui a seguinte estrutura: <kml> <Placemark> <Point> <coordinates>58.511274033286,0.000027058128</coordinates> </Point> <Point> <coordinates>58.511282992283,0.000036077505</coordinates> </Point> <Point> <coordinates>58.511291951281,0.000009019376</coordinates> </Point> </Placemark> </kml>
77 A Figura 36 representa os pontos do Ficheiro #2 em metros. 0,00 0,50 1,00 1,50 2,00 2,50 3,00 3,50 4,00 4,50 5,00 5,50 0, 00 0, 50 1, 00 1, 50 2, 00 2, 50 3, 00 3, 50 4, 00 4, 50 5, 00 5, 50
Figura 36 - Integrao de Pontos - Ficheiro #2 O resultado da integrao foi o ficheiro KML resultante, cuja estrutura a seguinte: <kml xmlns="http://www.opengis.net/kml/2.2"> <Placemark> <Point> <coordinates>58.51127403328638,0.000027058128099035313</coordinates> </Point> <Point> <coordinates>58.51128299228297,0.000036077504577906815</coordinates> </Point> <Point> <coordinates>58.51130091027761,0.000027058129102217802</coordinates> </Point> <Point> <coordinates>58.51129195128087,0.00000901937625594144</coordinates> </Point> <Point> <coordinates>58.51126507428996,0.000009019375921546616</coordinates> </Point> </Placemark> </kml> A Figura 37 representa os pontos do Ficheiro de sada em metros. 0,00 0,50 1,00 1,50 2,00 2,50 3,00 3,50 4,00 4,50 5,00 5,50 0, 00 0, 50 1, 00 1, 50 2, 00 2, 50 3, 00 3, 50 4, 00 4, 50 5, 00 5, 50
Figura 37 - Integrao de Pontos - Ficheiro de Sada
78 O cenrio descrito mostra trs situaes distintas de validao. Pontos em comum: os pontos assinalados com as coordenadas em metros (2.50, 3.00) e (3.00, 4,50) mantiveram-se pois eram comuns aos dois ficheiros; Pontos diferentes: o ponto assinalado com as coordenadas em metros (1.00, 1.00) foi includo pois apenas existia em um dos ficheiros; Pontos aproximados: o ponto assinalado com as coordenadas em metros (4.50, 1.50) foi includo pois existia no Ficheiro #1, e no Ficheiro #2, com uma distncia inferior definida, 1 (um) metro. Logo, o OpenGisIntegrator considerou-o o mesmo ponto, mantendo o ponto com as coordenadas j existentes no ficheiro principal. Este cenrio validou a integrao da caracterstica geogrfica Ponto, testando a funcionalidade de resoluo de conflitos, tendo sido obtidos os resultados de integrao esperados. 5.3.2.2 Avaliao da Integrao de Linhas Neste cenrio de utilizao, foram avaliadas as funcionalidades de integrao de caractersticas geogrficas do tipo Linha existentes em dois ficheiros distintos. Os ficheiros de entrada utilizados incluem um conjunto de pontos que descrevem linhas, sendo algumas dessas linhas definidas por coordenadas aproximadas geograficamente, devendo portanto ser detectada correspondncia entre elas, e sendo outras linhas definidas por coordenadas distantes geograficamente, que no tendo portanto correspondncia entre si. Para efectuar a validao, foram inseridos dois ficheiros. O Ficheiro #1 possui a seguinte estrutura: <kml> <Placemark> <LineString> <coordinates> 58.511265074289,0.000036077504 58.511274033287,0.000018038752 58.511282992284,0.000018038752 58.511291951281,0.000009019376 </coordinates> </LineString> </Placemark> </kml>
79 A Figura 38 representa os pontos do Ficheiro #1 em metros. 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5
Figura 38 - Integrao de Linhas - Ficheiro #1 O Ficheiro #2 possui a seguinte estrutura: <kml> <Placemark> <LineString> <coordinates> 58.511265074290,0.000009019376 58.511274033287,0.000018038752 58.511282992284,0.000018038752 58.511291951281,0.000009019376 </coordinates> </LineString> </Placemark> </kml> A Figura 39 representa os pontos do Ficheiro #2 em metros. 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5
Figura 39 - Integrao de Linhas - Ficheiro #2
80 O resultado da integrao foi o ficheiro KML resultante, cuja estrutura a seguinte: <kml> <Placemark> <LineString> <coordinates> 58.511265074289,0.000036077504 58.511274033287,0.000018038752 58.511282992284,0.000018038752 58.511291951281,0.000009019376 </coordinates> </LineString> <LineString> <coordinates> 58.511265074290,0.000009019376 58.511274033287,0.000018038752 </coordinates> </LineString> </Placemark> </kml> A Figura 40 representa os pontos do Ficheiro de sada em metros. 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5
Figura 40 - Integrao de Linhas - Ficheiro de Sada O cenrio descrito mostra trs situaes distintas de validao. Linhas em comum: as linhas assinaladas com as coordenadas em metros (3.00, 2.50) e (4.50, 1.50) mantiveram-se, pois eram comuns aos dois ficheiros; Linhas diferentes: a linha assinalada com as coordenadas em metros (1.00, 4.00) foi includo pois apenas existia em um dos ficheiros; Linhas aproximadas: a linha assinalada com as coordenadas em metros (2.00, 2.50) foram includas em ambas as representaes de linhas, pois apesar de o ponto ser comum a ambos os ficheiros, o ponto anterior no o era. Logo, o OpenGisIntegrator incluiu duas linhas distintas, que ao ser desenhadas sobrepem o mesmo ponto, com as coordenadas em metros (2.00, 2.50), mas so representadas como duas linhas distintas. Este cenrio validou a integrao da caracterstica geogrfica Linha, testando a funcionalidade de resoluo de conflitos, tendo sido obtidos os resultados de integrao esperados.
81 5.3.2.3 Avaliao da Integrao de Polgonos Neste cenrio de utilizao, foram avaliadas as funcionalidades de integrao de caractersticas geogrficas do tipo Polgono existentes em dois ficheiros distintos. Os ficheiros de entrada utilizados incluem um conjunto de pontos que descrevem linhas, que por sua vez desenham polgonos, sendo algumas dessas linhas definidas por coordenadas aproximadas geograficamente, devendo portanto ser detectada correspondncia entre elas, e sendo outras linhas definidas por coordenadas distantes geograficamente, que no tendo portanto correspondncia entre si. Para efectuar a validao, foram inseridos dois ficheiros. O Ficheiro #1 possui a seguinte estrutura: <kml> <Placemark> <Polygon> <outerBoundaryIs> <LinearRing> <coordinates> 58.511265074289,0.000036077504 58.511291951280,0.000036077505 58.511291951281,0.000018038753 58.511265074290,0.000018038752 58.511265074289,0.000036077504 </coordinates> </LinearRing> </outerBoundaryIs> </Polygon> </Placemark> </kml> A Figura 41 representa os pontos do Ficheiro #1 em metros. 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5
Figura 41 - Integrao de Polgonos - Ficheiro #1
82 O Ficheiro #2 possui a seguinte estrutura: <kml> <Placemark> <Polygon> <outerBoundaryIs> <LinearRing> <coordinates> 58.511265074289,0.000036077504 58.511282992283,0.000036077505 58.511282992284,0.000018038752 58.511265074290,0.000018038752 58.511265074289,0.000036077504 </coordinates> </LinearRing> </outerBoundaryIs> </Polygon> </Placemark> </kml> A Figura 42 representa os pontos do Ficheiro #2 em metros. 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5
Figura 42 - Integrao de Polgonos - Ficheiro #2 O resultado da integrao foi o ficheiro KML resultante, cuja estrutura a seguinte: <kml> <Placemark> <Polygon> <outerBoundaryIs> <LinearRing> <coordinates> 58.511265074289,0.000036077504 58.511291951280,0.000036077505 58.511291951281,0.000018038753 58.511265074290,0.000018038752 58.511265074289,0.000036077504 </coordinates> </LinearRing> </outerBoundaryIs> </Polygon> </Placemark> </kml>
83 A Figura 43 representa os pontos do Ficheiro de sada em metros. 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5
Figura 43 - Integrao de Polgonos - Ficheiro de Sada O cenrio descrito mostra duas situaes distintas de validao. Linhas em comum: as linhas assinaladas com as coordenadas em metros (1.50, 2.00) e (1.50, 4.50) mantiveram-se, pois eram comuns aos dois ficheiros; Linhas aproximadas: as linhas assinaladas com as coordenadas em metros (4.00, 2.00) e (4.00, 4.50) foram includas em ambas as representaes de linhas, pois embora as coordenadas variassem entre os dois ficheiros, no variavam mais do que a distncia mxima definida para a arquitectura, de 1 (um) metro. Assim, o OpenGisIntegrator descartou as linhas assinaladas no Ficheiro #2, mantendo as coordenadas definidas no Ficheiro #1. Este cenrio validou a integrao da caracterstica geogrfica Polgono, testando a funcionalidade de resoluo de conflitos, tendo sido obtidos os resultados de integrao esperados. 5.4. O Prottipo A implementao do prottipo da arquitectura do OpenGisIntegrator, descrita neste captulo, tinha por objectivo validar a implementao da arquitectura proposta nesta dissertao. Foram includos cenrios de avaliao, onde se visava avaliar a arquitectura, quer do ponto de vista do desenho proposto, quer do ponto de vista da resoluo de conflitos. Os cenrios demonstrados so exemplificativos do processo de integrao proposto na arquitectura descrita, e validam o funcionamento da arquitectura na integrao de informao geogrfica existente em diferentes formatos, bem como a integrao especifica das caractersticas geogrficas, permitindo, atravs de parametrizaes definidas, tomar decises na resoluo de conflitos originados pela integrao de caractersticas geogrficas semelhantes.
84
85 6. CONCLUSES E TRABALHO FUTURO A rea que explora os Sistemas de Informao Geogrfica vasta. So muitas so as questes em aberto no campo da informao geogrfica, sendo uma rea com vrios caminhos a percorrer, explorar e contribuir. Esta dissertao procurou dar um contributo na rea da integrao da informao geogrfica, proveniente de diferentes fontes, em diferentes formatos. 6.1. Concluses A interoperabilidade entre sistemas que lidam com informao geogrfica levanta problemas de reutilizao da informao geogrfica que, em casos de total incompatibilidade entre os formatos dos ficheiros e o SIG onde se pretende utiliz-los, podem levar impossibilidade de utilizao dessa informao. Com vista a analisar a oferta de solues que resolvam este problema, foram analisadas arquitecturas de integrao de informao geogrfica, que contriburam para conhecer metodologias e estratgias de converso e integrao da informao geogrfica, e ajudaram a perceber os problemas com que a integrao de informao geogrfica tem de lidar e quais as necessidades que ainda se fazem sentir neste campo. Identificou-se a necessidade de implementao de arquitecturas vocacionadas especificamente para sistemas de integrao de informao geogrfica, e que permitam a integrao da informao, com o objectivo de facilitar o acesso informao geogrfica dispersa por diferentes fontes e consequentemente em diferentes formatos. Como resultado do trabalho de estudo realizado, esta dissertao props-se a apresentar o desenho de uma soluo que permita agilizar o processo de integrao de informao geogrfica, atravs de uma arquitectura modular, que se prope percorrer as vrias fases do processo de anlise e integrao da informao geogrfica dispersa, e facilitar o acesso mesma. O OpenGisIntegrator a proposta de arquitectura apresentada nesta dissertao, e consiste numa proposta de uma arquitectura que recebe informao geogrfica de diferentes fontes, em diferentes formatos, que a converte para um formato de representao interno. Aps a converso, a arquitectura integra a informao geogrfica recebida nos vrios ficheiros num nico modelo de dados, que ento disponibilizado ao
86 utilizador nos formatos de sada por ele indicados, e que podem ser posteriormente utilizados em SIGs que os suportem. Os cenrios de utilizao apresentados no captulo da avaliao experimental permitiram avaliar a adequao da soluo proposta ao problema da integrao de informao geogrfica dispersa por diferentes ficheiros com diferentes formatos, e demonstrar, atravs de um prottipo demonstrativo de uma implementao da arquitectura proposta, como a integrao desta informao geogrfica pode ser facilitada com uma soluo desta natureza. Foram demonstrados casos de utilizao da integrao de informao geogrfica com diferentes cenrios. Os casos de utilizao incluram cenrios em que se introduziram poucos ficheiros com a informao dispersa, e cenrios em que se introduziu uma quantidade maior de ficheiros com informao geogrfica a integrar. Os resultados obtidos permitiram avaliar o comportamento da arquitectura implementada, no que diz respeito forma como a informao geogrfica existente em cada ficheiro foi integrada num nico modelo de dados, e apresentada em um ou vrios formatos de dados. Os casos de utilizao permitiram tambm avaliar como a implementao da arquitectura no OpenGisIntegrator lidou com os conflitos que surgiram na integrao. Foram parametrizadas configuraes na implementao do prottipo, com o objectivo de simular casos reais de utilizao que permitissem comparar dados geogrficos semelhantes, e decidir, com base nos parmetros definidos, como os integrar, optando por acrescentar os novos dados geogrficos aos dados j integrados, ou por assumir que se tratam dos mesmo dados, e nesse caso no incluir informao repetida. Os resultados obtidos permitiram avaliar o comportamento do processo de integrao na resoluo de conflitos na integrao, e garantir que esta efectuada sem que da integrao da informao geogrfica dispersa resultem dados geogrficos repetidos ou omissos. 6.2. Trabalho Futuro O trabalho desenvolvido no decurso desta dissertao teve como objectivo dar uma contribuio na rea de anlise e integrao de informao geogrfica dispersa pr diferentes ficheiros com diferentes formatos. No entanto, este trabalho no se encerra aqui, podendo ser explorando, numa perspectiva de continuidade, alguns temas relacionados tanto com esta rea, como especificamente com o trabalho desenvolvido.
87 Algumas propostas de trabalhos em aberto identificadas e passveis de ser continuadas so apresentadas em seguida: A extenso do modelo de dados apresentado no formato de representao interno da arquitectura proposta, que permita suportar a parametrizao de informao relevante para a anlise dos dados, como a configurao de datums diferentes, a converso entre diferentes sistemas de projeces, entre outros tipos de configuraes; A extenso do modelo de dados apresentado no formato de representao interno da arquitectura proposta, que permita suportar o tratamento de caractersticas geogrficas complexas, baseadas nas caractersticas geogrficas mais simples, o ponto, a linha ou o poligono; A incluso de ficheiros de configurao de informao adicional, como metadados, como forma de personalizar processos especficos de integrao de dados; A possibilidade de processar em paralelo os vrios ficheiros de entrada, recorrendo implementao de metodologias de Multithreading. O trabalho desenvolvido nesta dissertao pretende dar uma contribuio na explorao de metodologias de integrao de informao geogrfica heterognea, numa perspectiva de continuidade do processo de investigao e aprendizagem na rea dos Sistemas de Informao Geogrfica.
88
89 REFERNCIAS [Casanova et al., 2005] Casanova, M., Cmara, G., Davis C., Vinhas, L., Queiroz, G. R., Bancos de Dados Geogrficos, MundoGEO, 2005 [Kavouras et al., 2002] Kavouras, M., Kokla, M., Developing Multi-scale, Multi-context databases through the Semantic Integration of Heterogeneous Datasets, National Technical University of Athens, 2002 [ESRI, 2008] Essays on Geography and GIS, ESRI, Sep 2008 [Stoimenov, 2006] Stoimenov, L., Geographic Information Systems Interoperability in Local Comunity Environment, University of Nis, Srvia, 2006 [GeoComm.com, 2009], http://data.geocomm.com/helpdesk/formats.html, acedido em Junho/2009 [GIS.com, 2009], http://www.gis.com/whatisgis/index.html, acedido em Junho/2009 [StateMaster, 2007], http://www.statemaster.com/encyclopedia/Geographic-information-system, acedido em Junho/2009 [Smith, Goodchild, Longley, 2007] Smith M. J., Goodchild M. F., Longley P. A., Geospatial analysis: A comprehensive guide to principles, techniques and software tools", 2nd edition, 2007, Troubador, UK, disponvel online em http://www.spatialanalysisonline.com/output/ [OGC, 2009], http://www.opengeospatial.org/ogc, acedido em Junho/2009 [Sajeevan, G., 2008] Latitude and Longitude A misunderstanding, Maro de 2008 [Sajeevan, G., 2005] Correct Usage of Projection Parameters for Spatial Accuracy, 2005 [ESRI, Metadata and GIS, 2002] An ESRI White Paper, Outubro 2002 [GISCentrum, 2009], http://www.giscentrum.lu.se/english/whatisgisFileFormat.htm, acedido em Junho/2009 [Moyer, Niemann, 1993] Moyer D. D., Niemann, J. Jr.,The why, what and how of GIS Standards: Issues for discussion and resolution, 1993
90 [Arlington, 2004] Arlington, V., Here There Be Data: Mapping the Landscape of Science, National Science Foundation, ScienceDaily: News & Articles in Science, Health, Environment & Technology, 2004 [Hall et al, 2003] Hall, O., Alm, G., Ene, S. & Jansson, U. Introduktion till kartografi och geografisk information. Denmark: Naryana Press, 2003 [Ekhlund et al, 2003] Eklundh, L., Harrie, L., Hauska, H., Olsson, L. & Pilesj, P. "Geografisk informationsbehandling: metoder och tillmpningar", 3 edio, 2003 [Bryntse, 2007] Bryntse, S., A GIS tool for biological research - visualising flycatcher breeding data collected on land, 2007 [FME KF85, 2008] FME Readers and Writers, Swedish KF85 Reader/Writer, 1998, modificado em 2008 [ESRI SHP, 2000] ESRI, ESRI Shapefile Technical Description, 1998, modificado em 2000 [Reichardt, 2004] Reichardt, M., The Havoc of Non-Interoperability, 2004, OGC White Paper [OGC, 2005] Interoperability & Open Architectures: An Analysis of Existing Standardization Processes & Procedures, OGC, 2005 [McKee, OGC, 2005] McKee, L., The Importance of Going Open, OGC White Paper, 2005 [Mira et all, 2007] Mira, F., Santos C., Jorge, L., Quaresma, E., El-Zein, A., Santos, N., Afonso, P., Ferreira, L., Carvalho, P., Silva, F., An Architecture for Flexible GIS Integration of Distribution Planning and Analysis systems, EDP, 2007 [Ghosh et al, 2006] Paul, M., Ghosh, S. K.., De Sarkar, S. C., Acharya, P. S., A Service Oriented Architecture for Enterprise-GIS, NRDMS, Department of Science & Technology, New Delhi, 2006, disponvel online em http://www.gisdevelopment.net/proceedings/mapindia/2006/poster/mi06pos_89.htm [Hofman, 2004] Hofman, D., MOIRA DSS Architecture, Model Integration and User Interface Design, 2004 [Kotzinos, Pratacos, 2004] Kotzinos, D., Prastacos, P., Use of a Web-Based GIS for Real-Time Traffic Information Fusion and Presentation over the Internet, AGILE Conference on Geographic Information Science, 2004 [Tuama, 2004] Tuama, E. O., Implementing DISPRO A Web Based GIS, Coastal & Marine Resources Centre, ERI, University College Cork, Ireland, 2004 [INSPIRE, 2009] http://inspire.jrc.ec.europa.eu/, acedido em Setembro de 2009
91 [Hamre et al, 2005] Hamre, T., Sandven, S., Tuama, E. O. Data Integration System for Marine Pollution and Water Quality (DISMAR), MERIS-(A)ATSR User Workshop, Frascati, Italy, 26-30 September 2005 [Mrozek, Fraczek, 2004], Mrozek, D., Fraczek, J., Architecture of the Open Format Converter, Proceedings of the FOSS/GRASS Users Conference - Bangkok, Thailand, 12-14 September 2004 [Rosenberg] Rosenberg, M., Map Stops Cholera, About.com, artigo disponvel em http://geography.about.com/cs/medicalgeography/a/cholera.htm, acedido em Maro de 2010 [National Geographic] http://www.nationalgeographic.com/resources/ngo/education/ideas912/912choleraho3.ht ml, acedido em Maro de 2010