Вы находитесь на странице: 1из 53

SISTEMAS DE INFORMAÇÃO GEOLÓGICA

Sistemas de Informação
Geológica

Amândio Cordeiro

FCUL - ENGENHARIA GEOGRÁFICA 1


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

CAPÍTULO I

INTRODUÇÃO

1. CONSIDERAÇÕES GERAIS
Desde o alvôr das primeiras civilizações, a exploração da terra e mais tarde a gestão
planeada dos recursos naturais, assim coma as necessidades político-económicas dos
estados , conduziu a um cada vez maior ordenamento da informação, para um melhor
conhecimento dos condicionalismos a que aquela exploração sempre se encontrou
sujeita.

Nesse sentido, as cartas geográficas e topográficas têm sido utilizadas, desde a sua
concepção, para visualizar informação sobre a superfície terrestre. Navegadores,
agrimensores e militares têm utilizado cartas e mapas representando a distribuição
espacial de elementos geográficos importantes. A topografia e a cartografia
constituiam uma parte integrante da governação romana. Com o declínio do império
romano a topografia e a realização de cartas declinaram igualmente, durante aulgumas
centenas de anos, durante a longa “noite medieval”.

Foi só a partir do século XVIII que a cartografia foi retomada a mais alto nível na
Europa à medida que os governos constatavam a sua importância como um meio de
registo e de planeamento da utilização dos seus territórios. Instituições nacionais foram
encarregadas de produzirem coberturas inteiras desses territórios. Deste modo foram
elaborados mapas e cartas de carácter geral, mostrando o relevo e os limites nacionais
e das unidades administrativas. Com o desenvolvimento do estudo dos recursos
naturais também cresceu a utilização de cartas temáticas representando a distribuição
espacial de ocorrências de carácter geológico, morfológico, de tipos de solos,
vegetação, etc.

FCUL - ENGENHARIA GEOGRÁFICA 2


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

No final do sec.XIX e princípios do séc. XX o ritmo da ciência e da tecnologia


acelerou-se. Este incremento criou uma procura cada vez maior de informação de
dados geográficos de modo a serem representados em forma cartográfica, de aquisição
cada vez mais rápida e precisa. Com o desenvolvimento das tecnologias da
teledetecção, como a fotografia aérea e imagens via satélite (IVS), tem-se verificado
uma explosão na produção de informação geográfica, uma utilização mais alargada e
análises cada vez mais sofisticadas. Actualmente a massa de informação geográfica é
gerada mais rapidamente do que as capacidades da sua análise.

Tradicionalmente a informação geográfica tem sido apresentada sobre a forma


cartográfica. Até à existência de computadores esta informação tem sido representada
sob a forma de pontos, linhas e áreas marcadas num suporte opaco ou transparente. A
sua codificação é formada por símbolos, texturas e cores explicados numa legenda ou
texto adjunto. A carta e a sua documentação constituiam uma base de dados
geográficos.

A utilização de cartas temáticas dos recursos naturais começou como um meio de


inventário utilizado no registo e classificação das observações. Os métodos de análise
foram inicialmente qualitativos. Quer dizer, a procura e a análise da informação
cartográfica dependia basicamente na observação da carta e numa análise intuitiva dos
dados. A análise quantitativa duma carta podia ser levado a cabo partindo da medição
de distâncias e de áreas por meio de uma quadrícula ou, posteriormente, de um
planímetro. Enquanto era relativamento fácil procurar pequenas quantidades de
informação ou considerar as relações espaciais de um pequeno número de elementos,
aqueles métodos eram correntes, mas tornaram-se cada vez menos eficazes quando
grandes volumes de dados estavam em causa. Somente nos anos 70, quando se
tornaram acessíveis meios computacionais adequados, é que a tecnologia de tratamento
de informação deu um grande passo em frente. Os sistemas de informação geográfica,
baseados em computadores, foram desenvolvidos para fornecer um poder de análise de
grandes volumes dados geográficos.

A carta em suporte material pode ser facilmente produzida em grandes quantidades e


armazena uma certa quantidade de informação espacial de uma forma compacta e
acessível. Contudo tem um certo número de limitações importantes. Grande parte da
informação utilizada na elaboração de cartas tem de ser usualmente generalizada, i.e.,
a informação deve ser apresentada com menos detalhes e/ou por meio de símbolos ou
FCUL - ENGENHARIA GEOGRÁFICA 3
SISTEMAS DE INFORMAÇÃO GEOLÓGICA

de formatos sem escala, a fim de que as mesmas possam ser facilmente lidas. Áreas
cuja extensão excedam à escala o âmbito de uma carta maneável devem ser
apresentadas em várias partes (divisão em folhas). Os problemas surgem quando as
ligações entre as cartas não se conjugam nas suas margens e quando áreas de interesse
se dividem por mais de uma carta. Frequentemente estes problemas resolvem-se
deslocando a área das cartas de modo a obter um melhor ajuste. Para aplicações mais
críticas pode ser necessário uma nova divisão cartográfica.

Actualizar uma carta, nestas condições, é em geral um procedimento moroso e


oneroso. Relativamente às modificações as matrizes das cartas terão que ser
redesenhadas e as cartas reeditadas. Como consequência, fisicamente, uma carta é um
documento relativamente estático. A recolha de uma simples informação de uma carta
em suporte material é relativamente fácil; contudo o processo de recolha de grandes
quantidades de informação e de combinação de informação espacial a partir de toda
uma cartografia é moroso e dispendioso. Durante as décadas de 60 e 70 foi
reconhecida a necessidade de manuseamento de grande número de dados geográficos.
Por exemplo foi necessária a rápida e precisa integração de dados tão diversos como os
relativos a tipos de solos, utilização da terra, vegetação vigente, assim como a de
limites administrativos para estudos como os de impacto ambiental. Mesmo decisões
relativas à zonagem de áreas começaram a exigir a consideração de múltiplos factores
geográficos. A precisa e rápida análise de diferentes conjuntos de dados geográficos
foi assim percebida como um requesito para um planeamento mais eficaz.

A integração de dados poude ser inicialmente realizada utilizando cartografia em


suporte material. A informação cartográfica era conjugada e integrada sobrepondo
suportes transparentes sobre uma mesa luminosa, analisando visualmente a co-
ocorrência de factores. Desse modo, áreas com a desejada combinação de factores,
podiam ser delineadas marcando os seus limites num outro suporte igualmente
transparente. As cartas transparentes eram em geral desenhadas para análise, não só
para transformar as cartas de partida numa base comum mas igualmente para codificar
cada carta com diferentes graus de cinzento representando diferentes níveis de
constrangimento para uma aplicação de planeamento particular. No entanto o
procedimento era moroso e, à medida que o número de factores e de níveis de cada
factor aumentavam, um limite crítico de ordem prática era rapidamente atingido.

FCUL - ENGENHARIA GEOGRÁFICA 4


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

Na América do Norte os trabalhos no primeiro sistema computacional de informação


geográfica começou em meados dos anos 60. Por exemplo, o sistema de informação
geográfica do Canadá (CGIS), patrocinado pelo governo canadiano e a Land Use and
Natural Resources Inventory of New York States (LUNR), patrocinado pelo estado de
Nova York, foi desenvolvido aproximadante na mesma altura. Ambos os sistemas
faziam uso intenso de fotografia aérea e de cartografia existente de recursos naturais.
Níveis de informação como agricultura, florestas, vida animal, solos e geologia eram
considerados. A informação geográfica da cartografia foi então numerizada para
posterior análise computacional. Apesar deste desenvolvimento ter início nos anos 60,
a parte computacional destes sistemas tornou-se operacional somente no início dos
anos 70 quando a tecnologia do acesso directo aos discos foi criada. Estas primeiras
implementações de SIG operacionais sobre meios e recursos computacionais
estimularam o aparecimento de inovações tecnológicas. Do mesmo modo aqueles
sistemas forneceram valiosa experiência de como criar e operar grandes sistemas de
informação geográfica. Entretanto, numerosos trabalhos, desde 1976, forneceram
conselhos valiosos na implementação, gestão e modo operatório de um SIG que ainda
hoje continuam válidos.

Ainda no início dos anos 60, o Laboratório Gráfico de Harvard foi um dos grupos de
pesquiza mais activos no desenvolvimento de programas de análise cartográfica. Os
primeiros programas (SYMAP, GRID e IMGRID) foram elaborados de forma a
fornecer os mesmos procedimentos dos métodos manuais, mas com maior rapidez e
flexibilidade. O acelerado desenvolvimento da informática nas últimas duas décadas
permitiu aos sistemas de informação geográfica libertarem-se mais rapidamente dos
antigos sistemas, criando-se os SIG actuais com capacidade de tratamento cada vez
mais complexo.

A melhoria na velocidade de tratamento tem alterado a abordagem da análise dos


sistemas de informação geográfica. Talvez duas das mais importantes melhorias se
verifiquem na possibilidade em manter um sistema comum de dados georreferenciados
e de eficientemente se poder integrar conjuntos múltiplos de dados.

A capacidade de rapidamente se poder actualizar uma base de dados geográfica, a par


da rapidez e baixo custo da produção de cartas isoladas, tem tido como significado o
facto de uma carta material poder ser usada como um instantâneo de uma base de
dados geográficos em contínua evolução. Uma vez que a reanálise dos dados é
FCUL - ENGENHARIA GEOGRÁFICA 5
SISTEMAS DE INFORMAÇÃO GEOLÓGICA

relativamente pouco dispendiosa e pode ser feita rapidamente, têm sido


progressivamente melhorados cenários de planeamento complexo através da reanálise
de uma dada planificação, de modo a definir as modificações propostas. Os
responsáveis podem propor um grande número de planos alternativos e avaliar cada
um pela passagem de cada cenário, comparando os resultados. Esta abordagem
iterativa e interactiva seria francamente proibitiva, em termos de custos e temporais, se
se usasse os métodos manuais, pondo desse modo em realce a importância actual e as
capacidades por ora ainda não inteiramente exploradas dos actuais e futuros Sistemas
de Informação Geográfica.

Os Sistemas de Informação Geográfica (SIG) surgem assim como o culminar, na


nossa época, de toda uma evolução, desde os agrimensores egípcios até ao
desenvolvimento das projecções cartográficas verificado desde o séc XVIII, no sentido
persistente de georreferenciar de modo sinóptico e mesmo sugestivo o maior número
de informações sobre a realidade de toda uma região, para gerir a e para intervir na
utilização de todos os seus recursos.

Desde os suportes opacos e translúcidos e posteriormente os transparentes, onde a


sobreposição das informações permitia o seu cruzamento sugestivo, até à informação
digitalizada tratada por modernos e potentes computadores, o desenvolvimento de
novos sistemas, cada vez mais complexos e funcionais, têm conduzido um número
inesgotável de portas, prontas para se abrirem à informação. Este é um fenómeno
novo, o de se constatar uma inflação das potencialidades dos meios de tratamento da
informação, face à dificuldade em obter determinado tipo de dados de terreno
(amostragem), passíveis desse tratamento, problema este que constitui uma das
maiores limitações aos SIG, particularmente no domínio do tratamento em formato
vectorial.

Com efeito, o mesmo não se passa com os dados rasterizados, fornecidos pelos
sensores da área da Teledetecção, onde uma enorme massa da dados captados pelos
Satélites de Observação da Terra (Landsat, Spot, etc) conserva-se adormecida em
milhares de bandas magnéticas e mesmo suportes fotográficos, digitalizáveis. Daí a
necessidade de desenvolvimento de novos SIG onde seja cada vez mais fluido o
intercâmbio entre o domínio vectorial e raster, de par com o tratamento da informação
dentro do domínio raster.

FCUL - ENGENHARIA GEOGRÁFICA 6


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

2. O QUE É UM SIG ?
O termo SIG (SISTEMAS DE INFORMAÇÃO GEOGRÁFICA), na sua moderna vertente
computacional, é compreendido, à partida, como um produto informático (software) à
venda no mercado e que proporciona aos utilizadores a exploração de dados
multisectoriais, de múltiplas origens e de diversa natureza.

Podemos também dizer que um SISTEMA DE INFORMAÇÃO GEOGRÁFICA, se traduz


num conjunto de meios e ferramentas, que permitem a integração de informação
diversa relativa a realidades geográficas, bem como a sua manipulação e análise, com
especial relevo nas questões de natureza espacial. No que diz respeito às entidades que
se constituem como informação geográfica, poderemos dizer que elas procuram
descrever os objectos do mundo real tal como nós os vemos. Essas entidades
caracterizam-se por uma posição relativa num determinado referencial, por atributos
gráficos e alfanuméricos e por relações espaciais que traduzem a relatividade
posicional dos objectos à superfície da terra. Para o efeito estes sistemas dispõem de
grandes capacidades de armazenamento de informação gráfica e alfanumérica em
ficheiros e / ou Bases de Dados. Porém, e contrariamente ao que se possa pensar, só as
bases de dados e respectivos sistemas de gestão não bastam para que se possa admitir a
existência de um SIG. Este só existe efectivamente quando, para além das bases de
dados e das capacidades de CAD ( desenho por computador ) , o sistema tenha
possibilidade, conforme já se referiu, de desenvolver complexas operações de análise
espacial. Por um número imenso de razões o SIG é mais difícil de se definir do que a
princípio se imagina. A origem recente e o rápido desenvolvimento não têm ajudado a
criar uma definição exacta para os SIG.

Durante os últimos 30 anos tem havido um rápido desenvolvimento teórico,


tecnológico e organizacional no campo do SIG, culminando num período de intensa
actividade nos últimos 10 anos.

O campo dos SIG é caracterizado por uma grande diversidade de aplicações e consiste
em juntar ideias desenvolvidas em muitas áreas, incluindo áreas de agricultura,
botânica, computadores, economia, matemática, fotogrametria, estatística, zoologia,
geologia e claro, geografia, só para enumerar alguns. Inevitavelmente é difícil de

FCUL - ENGENHARIA GEOGRÁFICA 7


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

distinguir entre reinvidicações de várias organizações e indivíduos, uma vez que todos
querem estar representados num campo tão vibrante e lucrativo.

Também é difícil definir os SIG porque há sempre maneiras diferentes de definir e


classificar objectos e assuntos. A razão final para as dificuldades da definição surge do
debate académico sobre o foco central da actual actividade do SIG. Algumas pessoas
acreditam que o hardware e software são o foco central, outras defendem que o
elemento chave é o processamento da informação ou mesmo as aplicações.

Todos juntos, estes factores têm conspirado para ofuscar um assunto que raramente
tem sido discutido satisfatoriamente ou analisado com detalhe. No entanto, os
indivíduos e organizações que trabalham com os SIG têm-se dedicado a desenvolver
novos métodos a aplicar o sistema a problemas concretos.

Podemos no entanto sublinhar que é frequente na literatura especializada encontrar-se


uma definição abreviada dos SIG como sendo um “sistema de informação destinado a
tratar dados georreferenciados”. Esta afirmação, caracterizando apenas a componente
geográfica, tem o objectivo de pôr em evidência a base espacial ou “cartográfica”
indispensável a qualquer SIG, isto é, a inabilidade destes sistemas em tratar quaisquer
tabelas que não possuam pelo menos duas colunas, atribuindo aos dados de cada linha
uma projecção espacial unívoca. Em consequência, são as coordenadas dos dados,
fenómenos, ocorrências ou valores a tratar, que dão consistência e razão de ser a
qualquer Sistema de Informação Geográfica.

Este facto elege inequivocamente a Cartografia Topográfica (portanto, não a do


Geógrafo, utilizador por excelência dos SIG, mas seguramente a do Engenheiro
Geógrafo) como o principal sustentáculo, produtor da informação de base de qualquer
Sistema de Informação Geográfica. E, pelo facto do advento de tais sistemas terem
contribuído e certamente virem a contribuir cada vez mais para um grande salto
qualitativo na produção de informação e na investigação em todas as ciências da terra,
cada sector tem, com bastante razão, tendência a considerar os SIG como parte
integrante da sua área, por mais especializada que seja.

Embora correcta, a definição atrás referida, ela não permite distinguir os modernos e
potentes SIG, funcionando em plataformas computacionais de grande capacidade e
velocidade operacional, dos antigos métodos baseados no desenho temático e

FCUL - ENGENHARIA GEOGRÁFICA 8


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

sobreposição de diferentes temas em suportes transparentes (SIG manual, analógico?


). Se avançarmos para outra definição do tipo:

Os Sistemas de Informação Geográfica, são meios informáticos


(computacionais) que permitem a integração espacial de dados adquiridos a
diferentes escalas e épocas e em diferentes formatos,

estaremos sem dúvida mais próximos do que pretendemos abordar, deixando contudo
de definir a sua principal razão de ser. Assim, propomo-nos acrescentar o seguinte:

com capacidade de projecção, quantificação, acompanhamento e modelação dos


fenómenos e recursos naturais, assim como da actividade antropogénica.

alheando-nos ainda assim do papel determinante de todo o processo preparatório de


recolha, específica ou sistemática, dos dados de partida necessário ao funcionamento
ocasional, particularizado a um projecto, ou permanente (modelado), muitas vezes
destinado ao acompanhamento de fenómenos naturais ou ambientais.

Em conclusão, não seria demasiado vaticinar uma cada vez menor utilização da
cartografia clássica como base de tratamento da informação geográfica, dada o seu
carácter demasiado geral, limitado e estático , imposto pela facilidade de utilização e
leitura por uma grande generalidade de potenciais utilizadores, em favor dos modernos
e cada vez mais sofisticados Sistemas de Informação Geográfica.

Em todo o caso, o Engenheiro Geógrafo, o actual ou o “ainda por fazer”, estará


necessariamente no centro desta nova “aventura” do desenvolvimento tecnológico e do
conhecimento humano.

3. OS SIG, A INFORMAÇÃO E A DECISÃO


Os SIG entram necessariamente na realização de um objectivo, resultado de uma
iniciativa. A acção ou conjunto de acções que conduzem à realização desse objectivo
necessita, em geral, de ser planeado. Este planeamento e o próprio objectivo
FCUL - ENGENHARIA GEOGRÁFICA 9
SISTEMAS DE INFORMAÇÃO GEOLÓGICA

dependem de um certo número de factores. Se o conjunto de acções é para ser levado


a cabo num determinado espaço físico, a grande maioria dos factores possuem uma
projecção espacial. É na conjugação do maior número possível de factores com
projecção espacial que os SIG computacionais se têm desenvolvido como um poderoso
meio de elaboração de dados para obter a informação necessária à tomada de decisões
(Quadro 3.1) relativa a empreendimentos que impliquem a ocupação de espaços
físicos.

INICIATIVA SIG
OBJECTIVOS INFORMAÇÃO
DECISÃO
QUADRO INSTITUCIONAL

NÚCLEO COMPUTACIONAL

RECOLHA PRE- MANIPULAÇÃO


PLANEAMENTO DE DADOS
-PROCESSAMENTO
& ANÁLISE

Re-alimentação

Quad. 3.1 - Papel de um SIG na produção de informação, como apoio à decisão.

4. COMPONENTES DE UM SIG

4.1. COMPONENTES ESTRUTURAIS

Estas componentes, que designamos estruturais, correspondem às que basicamente se


podem considerar em qualquer Sistema de Informação e que, em geral, são apoiadas ou
geridas por estruturas técnicas ou administrativas ou ainda por grupos de trabalho
especializados. A sua concepção é indispensável à conceptualização de um Sistema de
Informação Geográfica (Quadro 4.1).

AQUISIÇÃO PROCESSAMENTO SAÍDA de


DE DADOS GESTÃO DE DADOS INFORMAÇÃO
E ANÁLISE (OUTPUT)
(INPUT)
(RETROACÇÃO)

Quad. 4.1. Componentes estruturais de um SIG.

FCUL - ENGENHARIA GEOGRÁFICA 10


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

Passamos a abordar sucintamente cada uma destas componentes.

4.1.1. AQUISIÇÃO DE DADOS E ARMAZENAMENTO (INPUT)

Esta fase inicial do processo tem como objectivo essencial o carregamento do sistema,
convertendo todo o tipo de dados no seu formato original para um formato utilizável
pelo SIG que se pretende implementar.

A informação, considerada como dados para o sistema que se pretende alimentar,


pode-se apresentar em diferentes formas ou formatos:

Cartografia analógica em geral: cartas, plantas e mapas em suporte material


flexível, susceptível de digitalização.

Cartografia digital: em formatos muitas vezes diferentes do utilizado.

Informação Tabelada: relativa a objectos georreferenciados, definindo em


geral os seus atributos sob a forma alfanumérica.

Fotografia Aérea: digitalizada e analiticamente ortoprojectada ou digitalizada


após ortoprojecção analógica.

Imagens via Satélite (IVS): de preferência após ortoprojecção analítica.

Outra informação aero-espacial ( Teledetecção em geral ): idem.

Os dados que se apresentam já no formato “legal” do sistema, são objecto de um


simples carregamento.

É grande o peso desta fase em todo o processo de sistematização da informação


cartográfica. Nela podemos considerar duas sub-componentes: a da Colheita de dados
(Aquisição propriamente dita) e a do Carregamento, com eventual formatação ou
reformatação. Sob o ponto de vista institucional, a primeira implica frequentemente
uma organização complexa levando, na implementação de um SIG, à restruturação de
fundo dos organismos envolvidos.

4.1.2. GESTÃO DE DADOS

Esta componente engloba todos os procedimentos de manutenção e de pre-


processamento dos dados, incluindo a sua organização geral, indispensáveis à fase
seguinte. Ela ocupa-se de duas entidades consideradas formalmente distintas:

Base de Dados (BD): Onde a informação é “arrumada”, com uma determinada


estrutura. Num SIG a BD possue necessariamente uma
FCUL - ENGENHARIA GEOGRÁFICA 11
SISTEMAS DE INFORMAÇÃO GEOLÓGICA

subdivisão: a Base de Dados Geográficos (BDG). A BDG


constitui uma das maiores responsabilidades de um Engenheiro
Geógrafo na constituição e manutenção de um SIG.

Sistema de Gestão de Base de Dados (SGDB): Subsistema responsável pela


organização, relacionamento, pesquisa e extracção da
informação contida na Base de Dados.

4.1.3. PROCESSAMENTO E ANÁLISE

Componente que inclui dois grupos de funções ou instrumentos, necessários à


produção da informação esperada do sistema:

Funções de Processamento: Destinadas a manusear e a transformar os dados


de modo a serem submetidos a determinadas funções de análise.

Funções de Análise: Funções que permitem a integração de dados gráficos e


alfanuméricos como: acesso, classificação, sobreposição,
medição, identificação de relações de vizinhança e
conectividade.

4.1.4. SAÍDA DE INFORMAÇÃO (OUTPUT)

Os aspectos mais importantes que são de considerar relativamente à informação


gerada por um SIG são a qualidade e a fiabilidade. Entre os factores que condicionam
estes atributos contamos os seguintes:

exactidão – grau de correcção dos dados;

precisão - escala em que os dados são representados (resolução);

tempo - período em que os dados de partida foram recolhidos (estação do ano,


período do dia, enquadramento temporal com outro tipo de
eventos, etc.);

crédito – período decorrido entre a recolha e a actualidade (validade);

Outro atributo importante a considerar é o que poderíamos designar por


inteligibilidade, regido pelo modo mais ou menos sugestivo em que se dá maior ou
menor relêvo aos factores determinantes de uma decisão.

FCUL - ENGENHARIA GEOGRÁFICA 12


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

O lado positivo destes atributos possui obviamente um preço. É também evidente que
o objectivo a atingir, em qualquer circunstância e do lado do investidor, é a melhor
relação utilidade/preço, integrando aqui o termo utilidade a qualidade, a fiabilidade e
a inteligibilidade.

4.2. COMPONENTES FÍSICAS

De um modo geral a informação, seja na forma de dados brutos ou dados tratados,


necessita de um suporte físico para o seu tratamento ou para o seu manuseamento pelo
utilisador final. Do mesmo modo os Sistemas de Informação Geográfica, desde a
descoberta da escrita, possuem igualmente um suporte físico. Relativamente aos
modernos SIG computacionais, temos a considerar os aspectos a seguir referidos.

4.2.1. SUPORTES DA INFORMAÇÃO

A informação pode apresentar-se sobre um suporte material (celulósico ou poliester),


um suporte magnético (Disquetes, cassetes ou fitas magnéticas), óptico (CD-ROM,
Disco-óptico) e podendo ainda ser transmitida por meios electrónicos, utilizando redes
de comunicação (Quad. 4.2).

SUPORTES

MATERIAL MAGNÉTICO ÓPTICO ELECTRÓNICO

Permanente Modifica-se Permanente ou


Permite a
interactivamente semi-permanente
Fácil de apresentar transferência do
output para
Requer equipamento informático
Fácil de manusear utilizadores distantes
Fácil de transportar fisicamente
Não requer equipamento
adicional após impressão Visualização condicionada

Visualização: Redes Telefónicas:


Plotter
Monitor Analógicas (Modem)
Impressora
“Datashow” Digitais (RDIS)

Quad. 4.2 - Suportes de informação.

4.2.2. PLATAFORMAS INFORMÁTICAS

As plataformas informáticas ou computacionais (hardware) variam essencialmente


segundo o tipo de Unidade de Processamento Central (CPU - Processador) utilizada e
ainda segundo o ambiente ou configuração geral do sistema. Assim temos:

FCUL - ENGENHARIA GEOGRÁFICA 13


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

4.2.2.1. Ambiente de Utilização

⇒ Sistema Multi-utilizador do tipo Servidor-Cliente1, em rede.

⇒ Estações individuais em rede, permitindo a troca de informações.

⇒ Estações individuais.

4.2.2.1. Tipo de CPU

⇒ Plataformas do tipo Mini ou Main Frame, funcionando em


ambiente multi-utilizador.

⇒ Estações de Trabalho (Workstations), individuais ou em rede,


utilizando o “processamento paralelo” (CPU com processadores
montados em paralelo).

⇒ Computadores pessoais (PC´s)

De um modo geral o conjunto de componentes físicas e suas caraterísticas designa-se


por Configuração do Sistema.

4.2.3. RECURSOS HUMANOS

Os recursos humanos constituem uma das componentes mais críticas no


funcionamento de um SIG, em virtude das tecnologias e concepções envolvidas
exigirem formação ou reciclagem e uma nova atitude mental relativamente ao modo de
tratamento da informação, frequentemente operada em tempo real. Assim, como
intervenientes em todo o processo, desde a sua constituição ao seu funcionamento
regular, temos a considerar:

⇒ Fornecedores de Sistemas SIG

⇒ Operadores

⇒ Programadores de Sistemas e especialistas em SIG.

⇒ Especialistas das diferentes áreas envolvidas no SIG a instituir.

⇒ Gestores de Sistemas.

1
Sistema formado por uma plataforma informática (Servidor) com capacidade de “coordenar” vários
terminais (Monitor+Teclado) designados por “clientes”, utilizando em comum os mesmos programas.
FCUL - ENGENHARIA GEOGRÁFICA 14
SISTEMAS DE INFORMAÇÃO GEOLÓGICA

É frequente ser necessário proceder à formação dos recursos humanos envolvidos e


podemos indicar, a título de exemplo, as seguintes:

⇒ Informática

⇒ Cartografia

⇒ Implementação do SIG

⇒ Análise Espacial

4.3. COMPONENTES LÓGICAS

Actualmente, as plataformas computacionais dedicadas aos SIG, tal como a maior


parte das aplicações informáticas, funcionam apenas com instruções programadas
grupadas em Programas que, por sua vez, se agrupam em Módulos (Lógicos) que
compôem os Sistemas:
INSTRUÇÕES ⇒ PROGRAMAS ⇒ MÓDULOS ⇒ SISTEMAS

O Sistema Lógico (singular) de um computador ou simplemente Sistema, designa


igualmente, nestes apontamentos, o conjunto de programas (Software, Logiciel)
residentes numa plataforma.

Os diferentes programas que compôem um Sistema Lógico agrupam-se em estruturas


ou componentes lógicas, sendo comum a todos a existência de um Sistema Operativo
que é activado pela memória da configuração de base: o BIOS. Sobre o Sistema
Operativo vêm logicamente imbricados os módulos que compôem o Sistema (Fig. 4.3).

SISTEMA

MÓDULOS
SISTEMA
OPERATIVO
BIOS

Fig. 4.3 - Componentes Lógicas dos Sistemas Informáticos.

Considera-se assim a seguinte hierarquia ascendente:


FCUL - ENGENHARIA GEOGRÁFICA 15
SISTEMAS DE INFORMAÇÃO GEOLÓGICA

BIOS - Memória elementar da configuração do sistema (BIOS - Basic Input-


Output System ).
Sistema Operativo - Sistema de relacionamento da CPU com as diferentes
memórias e interfaces, incluindo funções de manutenção e controlo. Os
Sistemas Operativos determinam igualmente dois tipos de ambiente de
utilização: Multi-utilizador e Mono-utilizador, atrás referidos.

Aplicações - Conjunto de módulos que garantem as funcionalidades do


Sistema.

Sistema - Unidade ou super-estrutura lógica que permite a realização de um


objectivo.

Relativamente à sua concepção as Aplicações de um modo geral e os SIG, em


particular, podem apresentar duas estruturas diferentes:

Unitária - todas as funções integradas num só módulo.


Modular - Grupos de funções integram diferentes módulos.

Para activar as funções são utilizados diversos procedimentos, diferindo a sua


predominância de sistema para sistema. Distinguem-se deste modo três tipos de
activação:

Linhas de comando - é necessário “digitar” ou soletrar através do teclado as


respectivas designações.

Menus - Comandos grupados em menus, podendo ser activados pelo rato ou


pelo teclado.
Ícones - “Botões” virtuais, activados pelo rato e o seu ponteiro.

São cada vez mais frequentes os sistemas que combinam sobretudo as duas últimas
opções, se bem que as linhas de comando continuem a ser utilizadas para activar
funções menos correntes.

5. SIG e CAD
É frequente tomarem-se os correntes Sistemas CAD(1), utilizados no apoio ao desenho
de projectos e à cartografia digitalizada, por Sistemas de Informação Geográfica. Um
CAD, tal como um SIG, é também um sistema que trabalha com dados
georreferenciados. Pode executar muitas das operações de um SIG. Mas o que
distingue um SIG dos outros sistemas é a possibilidade de integrar dados

1
CAD - Computer-Aided Design
FCUL - ENGENHARIA GEOGRÁFICA 16
SISTEMAS DE INFORMAÇÃO GEOLÓGICA

georreferenciados, “cruzando” informação. Aquela integração inclui operações como


a pesquisa espacial (spatial search) e a sobreposição de níveis de informação
(overlay). As funções de um SIG permitem definir áreas delimitadas segundo um certo
número de condições (por ex: visualizar toda a área de uma freguesia X que fica a
menos de 1 Km da estrada Y) e sobrepõem informação de diferentes tipos (por ex:
floresta, habitação, solos de drenagem, etc...).

Enquanto que as principais características de outros sistemas cartográficos é gerar


mapas em formato digital (armazenados em computador), as funções dos SIG têm
como objectivo criar informação por integração de vários níveis de dados, para fazer
uma análise dos dados, de diferentes formas e perspectivas.

Um SIG é um pouco a intersecção de todas as áreas e, em alguns sistemas, as


funcionalidades do SIG foram sobrepostas a um módulo CAD, de base. O SIG
acrescenta outras características que não são avaliadas nestas áreas e uma delas é o
ênfase que dá às operações analíticas. A capacidade que o SIG tem de analisar dados
espaciais é frequentemente vista como um elemento chave na sua definição e é muitas
vezes usado como a característica que distingue o SIG de outros sistemas cujo
principal objectivo é a produção cartográfica.

Outro aspecto que distingue um SIG de outros sistemas é gerar relações entre as
diferentes entidades espaciais possibilitando uma melhor análise espacial, assim como
fornecer a capacidade de modelar diversos tipos de operações.

6. APLICAÇÕES DOS SIG


Não podiamos deixar de concluir este capítulo introdutório sem uma breve referência
aos domínios de aplicação dos SIG. De um modo geral todo o domínio de actividade
do homem que exija a produção de informação com dados georreferenciados, é um
domínio privilegiado de aplicação dos SIG. Nesta base se compreende que esses
domínios sejam inúmeros, sendo praticamente inviável a elaboração de uma lista
exaustiva. O Quadro 6.1 sintetiza algumas das mais importantes aplicações.

Constata-se portanto no Quadro 6.1 que nenhuma das actividades indicadas se encontra
directamente relacionada ou é da responsabilidade do Engenheiro Geógrafo. A grande
responsabilidade deste técnico é basicamente a alimentação e manutenção da Base de

FCUL - ENGENHARIA GEOGRÁFICA 17


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

Dados Geográfica, além da sua participação do desenho e concepção do Sistema de


Informação Geográfica e, eventualmente, o acompanhamento dos resultados.

FCUL - ENGENHARIA GEOGRÁFICA 18


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

INFORMAÇÃO
ESPECÍFICA

GESTÃO
URBANIZAÇÃO
AMBIENTAL

USO
E OCUPAÇÃO
SIG APROVEITAMENTO
ENERGÉTICO
DO SOLO
BASE DE DADOS
GEOGRÁFICOS
VIAS DISTRIBUIÇÃO
DE DE
COMUNICAÇÃO PRODUTOS

INFRASTRUTURAS
DIVERSAS

CARTOGRAFIA
TELEDETECÇÃO
DIGITAL

Quadro 6.1 - Aplicações dos SIG.

FCUL - ENGENHARIA GEOGRÁFICA 19


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

CAPÍTULO II

AQUISIÇÃO DE DADOS

7. FONTES DE INFORMAÇÃO

A informação que sustenta um SIG, é muito diversificada e é função da área de


trabalho para a qual for planeado e implementado o sistema, o que obriga a estudo
prévio das necessidades de dados geográficos para o carregamento e podem ser, entre
outros:

Ö Cartografia de base e temática, nomeadamente topográfica, litológica,


geológica, florestal, hirográfica, etc;

Ö Dados estatísticos relativos à demografia, habitação, educação, saúde,


emprego, etc;

Ö Redes de equipamentos sociais, tais como escolas, hospitais, centros de


saúde, etc;

Ö Redes de infrastruturas de transporte, distribuição de água, energia,


saneamento, etc;

Ö Imagens Via Satélite (IVS) e Fotografia Aérea;

Ö Património histórico, planos de ordenamento, etc

A introdução da informação num SIG é quase sempre tarefa morosa, especialmente


quando se encontra em formatos pouco compatíveis com o sistema, requerendo
frequentemente a sua digitalização manual. É o caso das inúmeras listagens de
estatística que ainda não se encontrem em formato digital, ou mesmo de cartografia
convencional.

FCUL - ENGENHARIA GEOGRÁFICA 20


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

8. CARACTERIZAÇÃO DOS DADOS


A natureza e modo de aquisição dos dados é múltipla e variada e, obviamente, é
determinada pelos objectivos do sistema. Podemos considerar os dados segundo vários
aspectos, a saber:

1. Modo de aquisição: directo (amostragem: métodos sistemáticos, métodos


estratificados, métodos aleatórios) e indirecto (com base em documentos
existentes).

2. Formato: vectorial, raster, alfanumérico.

3. Atributos: precisão, exactidão, crédito, tempo.

Esta última caracterização dos dados, ao nível da aquisição, é a que possui uma
influência determinante da qualidade/fiabilidade dos dados de saída. Passamos a
abordar as duas primeira caracterizações, dado que os atributos já foram referidos na
introdução.

8.1. MODO DE AQUISIÇÃO

8.1.1. MODO DIRECTO

A aquisição directa de dados no terreno e/ou no tempo, para efeitos de digitalização e


carregamento em SIG, possui necessariamente uma distribuição espacial ou temporal
descontínua. Por este motivo se designa por amostragem a aquisição directa de dados
nesse contexto. Assim, em amostragem, temos a considerar os seguintes métodos, que
devem ser adoptados caso a caso:

a) Amostragem aleatória: A probabilidade de determinado local (ou instante)


ser seleccionado é igual à probabilidade de um outro local/instante ser
seleccionado

b) Amostragem estratificada: Um determinado número de amostras é


efectuado em cada sub-população. Este método pode ser aplicado quando a
característica a avaliar tem sub-populações significativas. Ex.: em
levantamentos topográficos a recolha de pontos deve ser mais densa em
áreas de topografia mais complexa do que em áreas planas.

c) Amostragem sistemática: As amostras são recolhidas de acordo com uma


determinada regra. A densidade de recolha de dados define a resolução dos
FCUL - ENGENHARIA GEOGRÁFICA 21
SISTEMAS DE INFORMAÇÃO GEOLÓGICA

dados e assume-se que a sistematização não influencia a amostragem. Por


exemplo a recolha de dados feita hora a hora não consegue captar as
variações que podem existir dentro de 1 hora, não deixando a amostragem,
apesar disso, de ser representativa do fenómeno. Ex.: recolha espacial de
dados todos os 500 m.

Os dados adquiridos de modo directo podem ser igualmente designados como de


“fonte primária”.

8.1.2. MODO INDIRECTO

A aquisição de dados pelo modo indirecto incide sobre informação existente. Ex.:
mapas, cartas, tabelas, relatórios de amostragens eventualmente realizadas para outros
fins.

Neste caso é necessário saber mais alguma coisa sobre as fontes de dados, por
exemplo, entre outros:

• o processo de aquisição
• a precisão dos dados

No entanto, em grande número de casos, esta informação não é imediata e facilmente


acessível, o que conduz a falsas espectativas sobre a precisão dos dados e mesmo
interpretações erradas de dados, que só são postas em evidência em fases posteriores
de integração e processamento. Nestas circunstâncias é necessário proceder a uma
análise dos respectivos efeitos sobre os resultados finais, eventualmente no quadro da
Teoria de Propagação dos Erros.

Os dados adquiridos de modo indirecto podem ser igualmente designados como de


“fonte secundária”.

8.2. FORMATO

Considerando que os dados que se pretende adquirir se apresentam num dado suporte
material, esses dados podem apresentar-se sob três formas: em modo linear (vectorial),
em modo matricial (raster) ou ainda sob a forma de tabelas (informação alfanumérica).

FCUL - ENGENHARIA GEOGRÁFICA 22


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

8.2.1. FORMATO VECTORIAL

Toda a carta geográfica ou topográfica, obtida por métodos de reconhecimento,


clássicos ou fotogramétricas, onde o traço e as cores procuram representar a realidade à
superfície da Terra, no seu subsolo ou nos fundos marinhos, à escala ou por
simbologia, é considerada no formato vectorial. Integrado numa plataforma
computacional pelos sitemas CAD, o formato vectorial é considerado digitalizado e
procura representar os objectos por meio de pontos, segmentos de recta e polígonos
(áreas). Os elementos gráficos são representados da forma mais real possível. Este
formato assume a área de uma carta, mapa ou região como um espaço coordenado
continuamente.

8.2.2. FORMATO MATRICIAL

Os produtos da Teledetecção, como “processo de aquisição de informação à distância”,


e em particular a fotografia aérea, há muito que são usados como meio de obtenção de
informação cartografável. Este tipo de informação caracteriza-se por fornecer uma
imagem com aspecto fotográfico, em que a mais pequena unidade de informação ou
pixel1, disposta em forma de mosaico ou matriz, define a resolução que varia consoante
os procedimentos e os sistemas. É um facto que, a maior parte da informação espacial
presentemente usada num SIG, é obtida através de técnicas de Teledetecção [Aronoff,
1989], seja de uma forma indirecta, por processamento fotogramétrico da fotografia
aérea para o formato vectorial, seja por digitalização por varrimento matricial
(scanning) directo da fotografia aérea, seja, por último, por uma utilização das Imagens
Via Satélite (IVS), obtidas por sensores montados em plataformas orbitais. Estes
últimos processos, IVS e digitalização das fotografias aéreas, fornecem informação
directamente no formato matricial (raster).

A fotografia aérea tem sido o método mais comum e convencional; porém, desde 1972,
com o lançamento do primeiro Satélite de Observação da Terra, o LANDSAT, que as
Imagens Via Satélite (IVS) se tornaram largamente disponíveis com o aumento
progressivo da sua resolução espacial. Esta evoluiu desde os 79 m iniciais (MSS-
Landsat) ao recente 1 metro do Satélite IKONOS, passando pelo sistema SPOT (10 m
em Pancromático), pelos 5.8 m nominais das imagens no espectro visível
(pancromático) do Satélite IRS-1, da União Indiana, e, mais recentemente (1998) as do

1
Pixel: Abreviatura anglo-saxónica de “Picture Element”.
FCUL - ENGENHARIA GEOGRÁFICA 23
SISTEMAS DE INFORMAÇÃO GEOLÓGICA

Early Bird 1, da Earth Watch, referindo-nos apenas às imagens comercializadas. Pelo


facto de fornecerem igualmente imagens noutras zonas do espectro radiométrico, além
do visível, como as bandas do infra-vermelho e das micro-ondas, é possível obter
outro género de informação, por exemplo acerca da ocupação e uso do solo, a
densidade populacional duma zona urbana, os espaços verdes ou até mesmo zonas de
poluição.

As imagens matriciais são uma opção atractiva e de fácil utilização, particularmente no


caso em que a informação espacial apenas necessita de ser visualizada.

8.2.3. VECTORIAL VERSUS MATRICIAL

As imagens em formato matricial podem ser utilizadas num SIG, sem que estas
necessitem de ser previamente tratadas, levando quando muito em consideração o
sistema de projecção a que foram referidas.

Porém, neste caso uma dificuldade aparece: torna-se impossível utilizá-las com o
objectivo de fazer uma referenciação espacial dos objectos, uma vez que numa imagem
deste tipo não existem elementos espaciais como pontos, linhas e polígonos, de um
modo explícito.

Devido a este problema, o formato matricial utiliza-se frequentemente como imagem


de fundo, sobre o qual podem ser sobrepostos níveis de informação em formato
vectorial.

Outro factor desfavorável nas imagens digitais relaciona-se com o seu armazenamento:
podem frequentemente ocupar dezenas e mesmo centenas de megabytes, pelo que
requerem uma grande capacidade de armazenamento apesar do aumento cada vez
maior desta capacidade em todo o tipo de plataformas computacionais existentes no
mercado.

Com efeito, tal como para o uso crescente do varrimento digital, o problema tem vindo
a ser atenuado pela cada vez melhor qualidade e menor preço das plataformas e dos
sistemas, em que o aumento da capacidade de armazenagem, em disco, também tem
acompanhado a crescente resolução das imagens de satélite. De qualquer modo é uma
realidade o uso cada vez mais frequente de imagens digitalizadas (matriciais) em
Sistemas de Informação Geográfica.

FCUL - ENGENHARIA GEOGRÁFICA 24


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

8.2.4. FORMATO ALFANUMÉRICO

É considerada no formato alfanumérico toda a informação textual ou numérica relativa


aos objectos cartografados, em que cada dado se refere a um único objecto. Os dados
numéricos podem constituir códigos representando atributos dos objectos ou definindo
uma simples relação de ordem. Apresentam-se em geral sob a forma de tabelas e a
referência aos objectos pode ser explícita, na forma de coordenadas dos objectos
afectados.

9. CARREGAMENTO DA INFORMAÇÃO
9.1. PROCEDIMENTOS

Todos os procedimentos de carregamento da informação para o suporte físico da


plataforma computacional podem adoptar designação genérica de digitalização, na
medida em que a informação necessita de tomar sempre a forma numérica, em
linguagem binária. Existem 4 formas possíveis para introduzir informação num SIG
(Aronoff [1989]), sendo as mesmas através de:
• Teclado;
• Digitalização manual;
• Varrimento digital (Scanning)
• Ficheiros digitais já existentes.

Os ficheiros digitais já existentes no formato digital são directamente carregados no


sistema pelos suportes físicos e meios electrónicos correntes e compatíveis com as
respectivas plataformas informáticas. São exemplos deste tipo, já no formato
matricial, as IVS (Imagens Via Satélite) e as coordenadas, atributos e referências
fornecidas, já sob a forma digital, pelas modernas estações totais, assim como pelos
receptores GPS dedicados a sistemas SIG e CAD.

9.2. TECLADO

A utilização do teclado é a maneira mais convencional de introdução de dados num


computador. É o método mais usado para a informação alfanumérica.

FCUL - ENGENHARIA GEOGRÁFICA 25


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

O recurso ao teclado aplica-se particularmente à introdução de coordenadas espaciais


dos objectos, seja directamente, seja por cálculo a partir de observações, e são desse
modo armazenadas num ficheiro interno criado pelo SIG.

9.3. DIGITALIZAÇÃO MANUAL

É um método que tem tido uma utilização cada vez menor no carregamento de
informação de carácter espacial, em particular, de cartas. Para tal é fixada a carta sobre
uma mesa (digitalizadora) onde um operador move manualmente um sistema
integrador, o rato informático, com um cursor que percorre os traços e os pontos da
carta a digitalizar.

A posição do cursor é medida com o grau de precisão requerida por um sistema


integrador que gera as coordenadas em formato digital.

No fundo trata-se duma conversão analógico-digital de cartas existentes, sendo os seus


custos mais dependentes da escala da carta, uma vez que as escalas maiores têm mais
pormenor, para uma mesma área no terreno, e por conseguinte exigem mais trabalho de
digitalização.

A eficiência da digitalização manual é dependente da acuidade do sistema de


digitalização e da perícia do operador. Convém dizer porém que, para o operador, este
é um trabalho em geral muito moroso. É extremamente repetitivo e monótono pelo que
o operador pode cansar-se facilmente, o que certamente contribui para a degradação da
qualidade da digitalização.

Por natureza, a digitalização manual gera directamente formatos vectoriais.

No entanto, o carregamento de um documento gráfico de traço, tipo carta ou planta, em


formato vectorial, pode passar por um varrimento digital (§ seguinte) seguido de
vectorização. Este é um procedimento cada vez mais seguido com o aperfeiçoamento
de módulos lógicos, em sistemas de tratamento de imagens matriciais, dedicados à
vectorização.

9.4. DIGITALIZAÇÃO POR VARRIMENTO

É realizado através de aparelhos de varrimento digital especiais designados em Inglês


por Scanner, Fig. 9.2, o qual gera uma imagem digital do documento em formato
matricial.

FCUL - ENGENHARIA GEOGRÁFICA 26


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

Fig. 9.1 - Rato Fig. 9.2 - Scanner Fig. 9.3 - Mesa digitalizadora

Posteriormente, a imagem matricial pode necessitar de sofrer um processamento digital


adicional, de modo a melhorar a sua qualidade seja para converter a informação
matricial em informação de formato vectorial, seja para outro tipo de tratamento de
imagem. Finalmente, através dum operador, esta última é verificada e possivelmente
corrigida, de modo a produzir informação compatível com o SIG. Durante esta fase a
cada elemento espacial (pixel) pode ser dada a correspondência a um atributo, em
geral, codificado.

9.5. DIGITALIZAÇÃO MANUAL E POR VARRIMENTO

A que se verifica hoje em dia é a tendência cada vez maior para a utilização das
técnicas de varrimento digital, uma vez que, sendo automático, ele é muito mais rápido
e requer muito menos meios humanos especializados de produção, contrariamente ao
que acontece na digitalização manual.

Esta actual preferência, de certa forma, é consequência da contínua evolução


tecnológica dos equipamentos e da capacidade dos sistemas de digitalização. O seu
custo também tem vindo a ser cada vez menor, sendo em média menos oneroso que as
mesas digitalizadoras.

Em relação às vantagens de um e de outro método, aqueles que preferem a


digitalização manual em relação ao varrimento argumentam que as cartas têm,
normalmente, que ser redesenhadas antes de poderem ser digitalizadas por varrimento.
Mesmo quando este procedimento é recomendado, os defensores da digitalização
prévia por varrimento consideram que este acréscimo não impede a redução dos custos
quer da digitalização manual (se esta for realizada à custa das cartas renovadas), quer
do varrimento.

FCUL - ENGENHARIA GEOGRÁFICA 27


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

CAPÍTULO III

SISTEMAS DE BASE DE DADOS

10. INTRODUÇÃO
Sempre que a resolução de um problema ou a informação sobre um determinado
domínio do conhecimento exija o manuseamento de um grande volume de dados,
impõe-se um certo grau de organização de toda a informação envolvida. Ao conjunto
assim minimamente organizado dá-se a designação de Base de Dados ou seja: um
sistema de armazenamento de dados, organizados segundo critérios bem
definidos, e com o objectivo de descrever o mundo real. A uma Base de Dados
corresponde assim um modelo do mundo real, parcial e virtualmente descrito, ou seja:
a uma descrição lógica dos objectos e das relações entre esses objectos. A
representação a ser obtida dependerá necessáriamente de instrumentos, eventualmente
plataformas computacionais, e da concepção do sistema.

Os sistemas de informação podem-se apoiar sobre dois tipos de sub-sistemas: o de


Base de Dados e o Documental. Apenas o Sub-sistema de Base de Dados constitui
objecto da nossa preocupação, dado constituir o núcleo de qualquer SIG
computacional.

Como foi referido anteriormente (Sec. 4.1.2), o Sistema de Base de Dados engloba:

Base de Dados (BD): Contendo informação de base, organizada segundo


determinados critérios, com uma subdivisão: a Base de Dados
Geográficos (BDG).

Sistema de Gestão de Base de Dados (SGDB): Subsistema responsável pela


organização, relacionamento, pesquisa e extracção da
informação contida na Base de Dados.

FCUL - ENGENHARIA GEOGRÁFICA 28


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

Na realidade esta divisão é, em muitos casos, teórica, dado que a Base e o sistema de
Gestão são praticamente indissociáveis: a organização da Base de Dados é garantida
pelo Sistema de Gestão.

11. DA AGENDA À BASE DE DADOS


A organização da informação e os métodos elementares de consulta tiveram os seus
primórdios no simples registo do tipo Lista (Inventário, Relação, Agenda), submetida
quando muito a uma rudimentar organização alfanumérica. O Ficheiro (Sistema de
Fichas), formado por uma colecção de fichas contendo informação sob um
determinado tema e ordenadas segundo critério fixo, constituiu um grande avanço
sobre a agenda e marcou várias gerações. No Sistema de Fichas a consulta é já
determinada por dois critérios que introduzem maior eficácia: o critério de
classificação é de acesso directo, i.e., não é necessário percorrer toda a informação
incluída nas fichas precedentes, e o critério interno da Ficha é, teoricamente, de acesso
sequencial. A actualização não envolve toda a informação, como acontecia com a
Lista.
O advento das primeiras plataformas computacionais, permitiu o bandono da ficha
material para o registo magético. Deste modo a consulta do Sistema de Ficheiros
automatizou-se, desenvolvendo-se inicialmente sistemas simples que exigiam, do
utilizador, pouca formação informática. No entanto, os programas e os dados
possuiam ainda entre si uma ligação muito estreita e toda a modificação de estrutura ou
suporte exigia uma correspondente alteração dos programas.

SISTEMAS DE
SISTEMAS BASES DE DADOS
DE FICHEIROS
FICHEIROS
MANUAIS

AGENDA

Fig. 11.1 - Evolução da organização dos dados.

A introdução do conceito de acesso directo1 em informática conduziu a uma separação


conceptual clara entre estrutura lógica e armazenamento físico. Assim os registos ou

1
Impropriamente designado tambem por Acesso Aleatório
FCUL - ENGENHARIA GEOGRÁFICA 29
SISTEMAS DE INFORMAÇÃO GEOLÓGICA

grupos de registos podiam-se encontrar localizados de forma aleatória, devendo ser


apenas conhecidas as suas localizações. Deste modo se impôs a necessidade da
formulação de uma verdadeira filosofia sobre métodos de acesso. E logo que os
métodos de acesso contribuem para e gerem a formação de registos, as aplicações,
assim libertas, debruçam-se cada vez mais sobre o modo de tratamento dos dados.
Surge assim a separação lógica que se estabelece entre Base de Dados e Sistema de
Gestão de Base de Dados. O edíficio dos modernos Sistemas de Base de Dados poude
desse modo crescer e produzir o grau de eficácia que é hoje conhecido.

12. BASES DE DADOS: INDEPENDÊNCIA E ESTRUTURAS


A grande tarefa dos Sistemas de Base de Dados consistiu em reduzir ao mínimo, senão
eliminar, a duplicação dos ficheiros e a redundância dos dados, tarefa essa altamente
apoiada pela evolução do desempenho das plataformas informáticas que iriam permitir,
ao nível dos Sistemas de Gestão de Base de Dados, duas formas de independência
entre as estruturas básicas do sistema: a independência lógica e a independência física.

A independência lógica possibilita em geral a permanência dos programas mesmo


quando a estrutura lógica da informação é modificada

A independência física conduz à não perturbação do funcionamento dos programas


quando a estrutura física dos dados e princípios de acesso são modificados.

Assim a independência lógica e física entre os Sistema de Gestão de Base de Dados


(SGDB) e a Base de Dados, permite a modelação dos dados, facilitada pela separação
da estrutura física relativamente à estrutura lógica.

A estrutura física é constituída essencialmente pelas seguintes entidades físicas:

O campo: conjunto de dados (ocorrências) correspondente a uma categoria ou


atributo. Em tabelas corresponde a uma coluna. Estas unidades
dividem-se em campos-chave e campos-descritores.

O registo: conjunto de campos. Em tabelas corresponde a uma linha. A


intersecção com um campo é uma ocorrência. As ocorrências dos
campos-chave identificam os registos.

O Ficheiro: conjunto de registos.

A Base da Dados: conjunto de ficheiros.

FCUL - ENGENHARIA GEOGRÁFICA 30


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

Podemo-nos referir igualmente a ocorrência de campo, de registo e de ficheiro como o


conjunto das ocorrências dessas entidades. Uma ocorrência de Base de Dados vem
assim como o conjunto das ocorrências de ficheiro. Todas estas ocorrências de nível
superior têm em comum a designação de “metadados”.

A estrutura lógica é basicamente constituída pelas seguintes entidades:

A característica: é a informação elementar descrita e fornecida pelo SGBD. É


qualquer dado sem nenhum conceito relacional.

O objecto: a mais pequena informação que agrupa e exige um conjunto de


características.

A relação: é a materialização ou formulação de ligações ou atributos comuns


entre objectos.

O esquema conceptual: descrição da estrutura lógica do universo temático,


com referência a relações, constrangimentos de integridade e de
constrangimentos de autorização de acesso.

O paralelismo entre as duas estruturas são configuradas na Fig. 12.1.

ENTIDADES FÍSICAS ENTIDADES LÓGICAS

BASE DE DADOS ESQUEMA CONCEPTUAL

FICHEIRO RELAÇÃO

REGISTO OBJECTO

CAMPO CARACTERÍSTICA

Fig. 12.1 - Paralelismo entre estrutras físicas e lógicas.

Se a redundância foi a grande preocupação no desenvolvimento das BD, a separação


alcançada entre a estrutura lógica e física põe claramente em evidência esse facto:

⇒ A nível lógico é alcançada uma visão globalizante dos dados, pondo em


evidência as suas relações, com maior facilidade e clareza.

⇒ A nível físico a redução da redundância traduz-se em maior desempenho do


sistema.
FCUL - ENGENHARIA GEOGRÁFICA 31
SISTEMAS DE INFORMAÇÃO GEOLÓGICA

13. QUALIDADE DOS DADOS


A qualidade e fiabilidade da informação produzida (Sec. 4.1.4), depende naturalmente
da qualidade dos dados de entrada. Assim, para estes, existem alguns factores
determinantes dessa qualidade, que passamos a enunciar:

⇒ Actualidade: Dadas as modificações constantes verificadas nas


comunidades e na natureza, por via de regra, quanto mais recuada no
tempo os dados tiverem sido colhidos, menor será a qualidade dos dados
(informação) de saída.

⇒ Exactidão: Quanto mais os dados estiverem de acordo com a realidade,


maior será a fiabilidade (confiança) da informação final.

⇒ Relevância: Quanto maior for o número de dados tratados, maior


dificuldade se tem em chegar às decisões finais. Informação não relevante
ou menos relevante dificulta sempre o processo de análise.

⇒ Disponibilidade: Mesmo verificando-se actualidade, relevância e


exactidão nos dados de entrada, se estes não estiverem disponíveis a tempo
de permitirem o tratamento necessário às conclusões, aqueles atributos de
nada servirão.

⇒ Legibilidade: O correcto tratamento e aproveitamento dos dados depende


do bom entendimento que os mesmos possam ou não sugerir, dado que os
dados só geram informação se forem bem interpretados.

Os dois primeiros atributos tem mais a ver com factores externos ao Sistema, enquanto
que os últimos três se encontram mais relacionados com factores internos, em geral
dependentes dos meios utilizados.

FCUL - ENGENHARIA GEOGRÁFICA 32


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

14 MODELOS DE BASE DE DADOS

14.1. EVOLUÇÃO

Segundo PEREIRA (96)1 a recente evolução das Base de Dados pode ser concebida
por ter passado por 3 gerações; a saber:

1ª Geração: Fase Pré-Relacional: Período inicial em que a estrutura e


manuseamento dos dados, arrumados segundo ficheiros, eram sugeridos
pelos procedimentos aplicados aos ficheiros manuais clássicos. A
filosofia de organização hierárquica e em rede desenvolveu-se nesta
fase.

2ª Geração: Fase Relacional: Período de desenvolvimento e vulgarização do


modelo relacional. Esta filosofia é actualmente dominante, tendo feito
as suas provas, dados os seu frutos e tido o seu sucesso. Começam no
entanto a ser reduzidos os melhoramentos obtidos dentro desta
orientação, indo-se criando as condições para o desenvolvimento de
novos conceitos.

3ª Geração: Fase Pós-Relacional: Centrada no desenvolvimento de extensões


do modêlo relacional e sua aplicação nos sistemas em que a integração
espacial e a concepção são dominantes, assim como no
desenvolvimento de Modelos Lógico-dedutivos, mantendo estas duas
orientações as suas ligações com o modelo relacional. Independente
destes modelos surgem, em franca ruptura, os Modelos Orientados
para Objectos (Object-Oriented), que designaremos com a sigla OO.

14.2. MODELOS PRÉ-RELACIONAIS

Destes modelos, os mais correntes foram o modelo hierárquico e o modelo em rede.

No modelo hierárquico os dados são organizados numa estrutura de registos


relacionados como os ramos de uma árvore invertida, agrupados e ligados a uma
mesma raíz, designação atribuída ao topo da ramificação. A partir da raíz, todas os

1
PEREIRA, J.L., 1996, Tecnologia de Base de Dados, FCA Ed.
FCUL - ENGENHARIA GEOGRÁFICA 33
SISTEMAS DE INFORMAÇÃO GEOLÓGICA

registos estão relacionados com um outro, e um só, de nível superior, ou registo-pai,


podendo relacionar-se igualmente com outros de nível inferior ou registos-filhos.

Sendo as pesquisas feitas sempre através da ramificação, segundo uma sequência


hierárquica, o relacionamento entre os registos pode-se tornar moroso ou mesmo
ineficiente. A activação dos procedimentos pressupõe o conhecimento de toda a
estrutura, o que implica o procedimento prévio de identificação de todos as unidades.
Este facto constitui um factor negativo em análise de informação geográfica, onde as
pesquisas são frequentemente exploratórias e não podem ser previamente definidas.
Outra limitação importante do modelo hierárquico é a não permissão de pesquisas por
campos-descritores1.

Seguindo a analogia anterior, no modelo em rede desaparece o conceito de “filiação”,


tornando-o mais flexível em relação ao modelo hierárquico, um vez que a pesquisa
pode já ser feita por “atalhos”. Esta pesquisa segue as regras das chamadas
Linguagens Procedimentais, o que introduz uma dificuldade no acompanhamento da
evolução das relações entre as diversas entidades.

A redundância é menor mas o estabelecimento das relações entre as entidades é mais


complexo.

14.3. MODELOS RELACIONAIS

Contrariamente aos modelos anteriores, os modelos relacionais foram concebidos de


raiz segundo uma filosofia distinta da do manuseamento de ficheiros, tendo partido da
teoria dos conjuntos. O primeiro produto comercial desta linha foi o SGBD Oracle,
surgido em 1980, e concebido uma dezena de anos antes por E.F.Codd, investigador na
altura da IBM Corp.

Após o lançamento dos princípios que regiam as Base de Dados Relacionais, assistiu-
se ao surgimento de sistemas de base de dados com algumas alterações relativamente
às anteriores concepções, mas reclamando-se desse estatuto. Este facto levou ao
estabelecimento das chamadas Doze Regras de Codd, o seu autor.

O princípio base do modelo relacional é o conceito de relação, apresentando-se o


conjunto das relações sob a forma de tabelas. Nestas tabelas, os campos

1
CNIG - Manual para a Exploração de Sistemas de Informação Geográfica - Vol.V.
FCUL - ENGENHARIA GEOGRÁFICA 34
SISTEMAS DE INFORMAÇÃO GEOLÓGICA

correspondem aos atributos e às linhas, contendo o registo dos atributos, dá-se a


designação específica de tuplos.

O modelo relacional introduz o conceito de grau da relação, dado pelo número de


atributos considerados numa relação. Paralelamente se define cardinalidade da
relação como o número de tuplos.

ATRIBUTOS

Cod_produto Designação Tipo Preço


TUPLO
321 Opel Corsa Swing 2175
Cardinalidade
437 Hyundai Accent 2387
da
517 Ford Fiesta 1950
267 Fiat Punto 2425 relação

Grau da relação

Fig. 14.2. - Exemplo de relação.

A construção de cada relação opera-se segundo determinados critérios, a saber:

a) O valor da ocorrência de um atributo num tuplo é atómico, ou seja,


indivisível.

b) Cada atributo numa relação possui um domínio de existência comum a


todas as ocorrências, ou seja, é bem definido o número e/ou natureza
dos respectivos valores que podem tomar. Qualquer ocorrência fora do
domínio, ou desconhecida, toma em geral o valor null.

c) Os atributos possuem identificadores que devem ser distintos em cada


relação.

d) Os tuplos devem ser todos distintos entre si, ou seja, não podem existir, na
mesma relação, dois tuplos com as mesmas ocorrências de atributos.

Em contrapartida não é imposta a uma relação qualquer ordem na sequência dos seus
tuplos.

Às relações registadas na memória permanente das plataformas informáticas atribui-se


a designação de relações base. É dada a designação de relações virtuais (views) às
que são produzidas pelo sistema apenas para efeitos de visualização temporária.

Nos modelos relacionais o conceito de chave é alargado a diferentes tipos e conjuntos,


como sejam:

FCUL - ENGENHARIA GEOGRÁFICA 35


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

Superchave: Conjunto de atributos cujos valores, em grupo, identificam


univocamente cada tuplo.

Chave candidata: Sub-conjunto dos atributos de uma superchave que continua


a identificar univocamente um tuplo.

Chave principal: Uma chave-candidata seleccionada (tb. chave primária).

Chave importada: Chave principal (primária) de outra relação (tb. chave


estrangeira).

A chave importada numa relação constitui o meio pelo qual se estabelece a


interligação com outras relações onde esse conjunto de atributos é chave principal. O
relacionamento objectivo entre relações é assim obtido pela identidade entre os
valores dos mesmos atributos.
cod_dep Depart. ...
dfis Física ...
dmat Matemática ... DEPARTAMENTOS
dinf Informática ...
deio Estatítica ...

cod_func Docentes Categ. cod_dep


DOCENTES 42758 J.N.Guedes ... dfis
87248 A.S.Ferreira ... dmat
91872 J.L.Matos ... dinf
23401 T.S.Conceição ... dmat
25342 M.E.Cantanhede ... dinf

Fig. 14.3 - Relacionamento entre tabelas, por chave importada.

A função que, nos sistemas, estabelece o relacionamento entre tabelas ou relações é em


geral designada por join. É este procedimento que permite, neste modelo, a pesquisa
por uma ou mais tabelas, desde que possuam atributos comuns. No processo de
pesquisa é sempre possível e desejável definir os atributos a levar em consideração.

Pelo exposto podemos referir as vantagens dos modelos relacionais relativas aos
modelos da fase pré-relacional:

⇒ Maior flexibilidade - Os procedimentos para consulta e pesquisa de


relacionamentos são independentes da estrutura das tabelas.

⇒ Aplicação da Álgebra dos Conjuntos - Operações sobre tabelas são


possíveis como se de conjuntos se tratassem. Com base nessa álgebra,
foram desenvolvidas Linguagens Relacionais específicas, em que as SQL
são as mais divulgadas.

FCUL - ENGENHARIA GEOGRÁFICA 36


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

⇒ Maior conviviabilidade - Por adoptar estruturas de compreensão comum,


como as tabelas.

⇒ Menor redundância (P.e.: eliminação sistemática de registos idênticos)

Havendo contudo algumas desvantagens:

⇒ Maior dificuldade na implementação.

⇒ Menor velocidade no processamento. Procedimentos de aceleramento tem


sido propostos.

As Bases de Dados Relacionais possuem grande aplicabilidade e têm tido bastante


sucesso nos Sistemas de Gestão Empresarial e afins, verificando-se contudo algumas
dificuldades na aplicação aos SIG e mesmo aos CAD e sistemas multimédia1, dado que
estas aplicações necessitam de funcionalidades de difícil implementação nas Bases de
Dados da 1ª e 2ª gerações.

Alem da Base de Dados Relacional Oracle, percursora, outras bases seguem os


mesmos princípios, como: a DB/2 (IBM), a Informix (Informix), a SQL (Microsoft)¸
Sybase SQL (Sybase), etc.

1
PEREIRA, J.L., (96), obra citada.
FCUL - ENGENHARIA GEOGRÁFICA 37
SISTEMAS DE INFORMAÇÃO GEOLÓGICA

CAPÍTULO IV

SISTEMAS DE GESTÃO DE BASE DE DADOS

15. LINGUAGENS RELACIONAIS

Paralelamente à concepção de bases de dados relacionais, desenvolveram-se, no


quadro da 2ª geração de base de dados, basicamente dois tipos de linguagens
relativamente diferentes cujo objectivo é desempenhar uma função de interface, seja
com as variadas aplicações, seja directamente com o utilizador. Estas linguagens ditas
relacionais, integradas nos Sistemas de Gestão de Base de Dados e constituindo o
interface visível para o utilizador, têm em geral como fundamento teórico a álgebra e o
cálculo relacional, que são abstracções de interfaces reais, próximas do modelo
relacional teórico.

Comercialmente, existem dois exemplos que mais representam essas duas orientações
de linguagens que dialogam com as bases da dados relacionais, a saber:

• SQL (Structured Query Language). Esta linguagem, que poderíamos


traduzir por Linguagem de Inquirição Estruturada, engloba
funcionalidades tanto de controlo, como de definição e manipulação de
dados, funcionalidades até então separadas. Os princípios que
presidiram à constituição de linguagens tipo SQL foram inicialmente
desenvolvidos pela IBM Corp. (inicialmente SEQUEL) e, mais
recentemente, consagrados na SQL92. No entanto a primeira aplicação
funcional que tenha aplicado os princípios SQL foi a SGBD Oracle.

• QBE (Query By Example). Os princípios desta linguagem basearam-se no


cálculo relacional de domínios e, sendo de fácil utilização por qualquer
utilizador sem conhecimentos de programação, foi talhada para os
pequenos e médios sistemas. São exemplos funcionais o DB2 (IBM
Corp.), as primeiras versões da ACCESS (Microsoft) e a PARADOX
(Borland).

FCUL - ENGENHARIA GEOGRÁFICA 38


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

No entanto, para além da SQL e QBE, muitos outros interfaces ou linguagens


relacionais foram propostas e algumas delas implementadas. É o caso da linguagem
QUEL ( Query Language ) que deu apenas o sistema relacional designado Ingres,
comercializado com dupla opção: QUEL e SQL. Aparentadas a esta e às outras
linguagens existe toda uma lista de aplicações para computadores pessoais (desktop
databases) como a família dBase ou XBase (Ashton-Tate), caracterizando-se esta pela
sua perenidade e mesmo capacidade de evolução.

16. A LINGUAGEM SQL1

Originalmente desenvolvida pela IBM Corp.,. aplicando mais tarde o resultado das
pesquisas no DB2, esta linguagem foi rapidamente adoptada por outros construtores
que desenvolveram as suas próprias versões e extensões. À partida, o facto de a IBM
ter sido a percursora, propondo-a como referência estandardizada, foi a principal razão
do seu sucesso, tendo o primeiro produto relacional a utilizar o SQL sido avançado
pela SGDB Oracle, e não pela IBM. Recentemente, sujeita a revisão como referência,
as novas especificações foram designadas por SQL92, preparando-se já uma nova
versão com funcionalidades características das linguagens Orientadas para Objectos
(OO)1.

A linguagem SQL engloba as seguintes funções:


♦ Manipulação de dados.
♦ Definição de dados.
♦ Controlo de dados.

16.1. MANIPULAÇÃO DE DADOS EM SQL

Como Linguagem de Manipulação de Dados (LMD), a SQL possui um conjunto de


instruções que se podem classificar em dois grupos:

→ Interrogação da BD (instrução SELECT)


→ Actualização da BD (instruções INSERT, DELETE, UPDATE)
Começando pela interrogação da BD, o esqueleto de uma inquirição SQL, na sua
forma mais simples, consiste no seguinte:

1
Excertos de J.L.Pereira, 1996, Tecnologia de Base de Dados, FCA Ed., Lisboa.

FCUL - ENGENHARIA GEOGRÁFICA 39


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

SELECT < colunas >


FROM < tabelas >
[WHERE < condição >]
em que:
< colunas > especifica a lista de atributos cujos valores interessa conhecer.
< tabelas > especifica quais as tabelas envolvidas no processamento da
questão.
< condição > traduz a expressão lógica que define os parâmetros de
selecção/interrogação a verificar.
As expressões entre parêntesis rectos são optativas.

Vamos apresentar alguns exemplos2, baseados no universo constituído pelos clientes


de um banco, as contas e empréstimos desses clientes nas suas agências. Consideram-
se as seguintes relações:

Clientes (cod_cliente, cliente, profissão, localidade)


Agencias (cod_agencia, agência, localidade)
Contas (num_conta, tipo_conta, cod_cliente, cod_agencia, saldo)
Emprestimos (num_emprestimo, cod_cliente, cod_agencia, valor)

Sobre este universo, podem ser feitas as seguintes interrogações, em SQL:

1. Quais os clientes deste banco?


SELECT cod_cliente, cliente
FROM Clientes
Corresponde a fazer uma projecção em “cod_cliente” e “cliente” sobre a tabela
Clientes.

2. Quais os clientes que residem em Braga?


SELECT *
FROM Clientes
WHERE localidade = ´Braga´
Em SQL os asterisco na cláusula SELECT indica que se pretende todos os
atributos no resultado.

3. Quais os clientes com contas na agência nº 123 ?

1
Melton,J., and Simon, A.R., Understanding the new SQL: A complete guide, Morgan Kaufmann, 1993.
2
Segundo Korth, H.F., and Silberschatz,A., 1991, Database System Concepts, McGraw-Hill Book Co.
FCUL - ENGENHARIA GEOGRÁFICA 40
SISTEMAS DE INFORMAÇÃO GEOLÓGICA

SELECT DISTINCT cod_cliente


FROM Contas
WHERE cod_agencia = ´123´
Dado que nesta agência podem existir clientes com várias contas, a forma de
evitar a repetição do mesmo “cod_cliente” no resultado final é a utilização da
cláusula DISTINCT. Genericamente, sempre que o resultado de uma
interrogação sobre uma tabela não traz a chave primária (ou qualquer outra
chave candidata) dessa tabela, poderão surgir resultados duplicados na saída. A
cláusula DISTINCT evita essa duplicação.

4. Quais os clientes que residem na mesma localidade das agências onde possuem
contas?
SELECT Clientes.*
FROM Clientes, Agencias
WHERE Clientes.localidade = Agencias.localidade
Trata-se de uma questão que envolve a junção de tabelas Clientes e Agencias
sobre um atributo localidade.
Nota: Eventuais ambiguidades são evitadas, quando colunas de diferentes
tabelas possuem identificadores iguais, associando a esses atributos a
identificação da respectiva tabela.

No domínio da actualização da BD (inserção, alteração e eliminação de dados),


apresentamos também alguns exemplos.
A inserção de dados nas tabelas faz-se através do comando INSERT, na forma geral:
INSERT INTO < tabela > [ (<colunas> ]
Exemplos:
INSERT INTO Clientes
VALUES (´1234´, ´J.Silva´, ´Estudante´, ´Braga´)
Este formato implica que todas as colunas são afectadas. Outra forma:

INSERT INTO Clientes


(cod_cliente, cliente, localidade)
VALUES (´1235´, ´A.Costa´, ´Guimarães´)
Este último formato é utilizado quando um ou mais valores da linha a introduzir na
tabela não existem ou não são conhecidos. Neste caso, o respectivo valor da tabela
(profissão)será nulo (null).

FCUL - ENGENHARIA GEOGRÁFICA 41


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

A alteração de dados na BD faz-se através do comando UPDATE com o seguinte


formato:
UPDATE < tabela >
SET < coluna > = < expressão >
... = ...
[ WHERE < condição > ]

Exemplo 1:
UPDATE Contas
SET saldo = saldo + 1000
FROM Contas
WHERE cod_cliente = ´1234´)
WHERE num_conta = ´12345678´
Operação que introduz uma simples actualização do valor de uma coluna numa
linha da tabela Contas.
Exemplo 2:
SET saldo = ( SELECT MAX (saldo)
FROM Contas
WHERE cod_cliente = ´1234´)
WHERE cod_cliente = ´1234´
Nesta operação o cliente nº 1234 foi “premiado” com a elevação do saldo de
todas as suas contas ao valor do seu maior saldo.

A remoção de linhas das tabelas da BD faz-se por meio do comando DELETE, de


formato geral:

DELETE FROM < tabela >


[ WHERE < condição >]
Exemplo:
DELETE FROM Clientes
WHERE cod_cliente IN (SELECT cod_cliente
FROM Contas
WHERE cod_agencia = ´123´ )

Neste exemplo várias linhas são removidas da tabela Clientes, os clientes que
possuiriam contas na agência nº123.

FCUL - ENGENHARIA GEOGRÁFICA 42


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

O predicado (opção) IN, de natureza bastante flexível, conduz à verificação se um


elemento está contido num conjunto dado.

Outros tipos de operações são possíveis em SQL, como as de Junção (JOIN) de


tabelas.

16.2. A DEFINIÇÃO DE DADOS EM SQL

É no núcleo de qualquer BD que se encontram as especificações relativas aos dados,


cujo conjunto é designado por dicionário ou catálogo, assim como toda a informação
relativa à gestão da BD (utilizadores, permissões, etc).

Nos sistemas relacionais o dicionário encontra-se organizado por tabelas, podendo ser
consultado da mesma forma que os dados. Do mesmo modo que a manipulação de
dados é feita com instruções específicas designadas por LMD, assim a definição de
dados é efectuada pela respectiva linguagem, a LDD.

Uma das principais funções da LDD é criação de tabelas com os seus atributos e
domínios respectivos assim como a especificação das restrições de integridade que
condicionam a manipulação. A especificação de domínio de cada atributo consiste
em definir o tipo de dados que irá caracterizar as suas ocorrências. As especificações
admitidas pela SQL92 são, principalmente: INTEGER, DECIMAL, DOUBLE
PRECISION, FLOAT, CHAR, VARCHAR, BIT, DATE, TIME, TIMESTAMP,
SMALLINT, etc.

As restrições de integridade são em geral definidas a quando da definição/criação de


relações/tabelas. Em SQL essas especificações adoptam o seguinte formato:

CREATE TABLE < nome_tabela > (


< definições de coluna e restrições de integridade >
)
A restrição mais simples é a restrição NOT NULL, impondo a uma coluna de tabela a
não admissão de valores nulos:
< atributo > DECIMAL (5,2) NOT NULL
A declaração PRIMARY KEY (Chave Primária) inclui a restrição da não repetição do
mesmo conjunto ordenado de ocorrências. No caso da chave primária ser constituida
por uma só coluna, essa restrição pode ocorrer na definição da própria coluna. Caso
contrário essa declaração deverá ser feita em separado:

FCUL - ENGENHARIA GEOGRÁFICA 43


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

cod_aluno CHAR(5)
nome_aluno CHAR(40)
PRIMARY KEY (cod_aluno, nome_aluno)
Uma terceira declaração importante é a restrição UNIQUE que também determina a
não repetição de ocorrências. Por este motivo as colunas sujeitas a esta restrição
constituem chaves candidatas:

cod_fornecedor CHAR(4) PRIMARY KEY


nome_fornecedor CHAR(20) NOT NULL
UNIQUE (nome_fornecedor)
A restrição CHECK, , é no entanto a especificação que se aplica a um maior número
de casos, permitindo verificar se o conteúdo de uma coluna satisfaz determinada
condição ou restrição de domínio:

peso INTEGER,
classificação SMALLINT,
sexo CHAR(1),
CHECK (peso > 50),
CHECK (classificação BETWEEN 0 AND 20),
CHECK (sexo IN (´F´, ´M´))

a especificação CHECK permite também, apenas em alguns produtos relacionais,


restrições mais complexas como seja a de restringir o valor de uma coluna em função
dos valores existentes noutras colunas, mesmo de tabelas diferentes.

Quanto às restrições de integridade relacional, estas impedem a realização de


actualizações sobre a base de dados que ponham em causa a sua integridade. É no
entanto possível especificar acções a realizar pelo sistema em casos de remoção de
linhas ou de modificações nas chaves primárias das tabelas referenciadas.

No exemplo da Fig. 14.3, na definição da tabela Docentes, a restrição de integridade


referencial relativa à chave estrangeira cod_dep, importada da tabela Departamentos,
poderia ser especificada do seguinte modo:

CREATE TABLE Docentes (


...
cod_dep CHAR(4)
FOREIGN KEY (cod_dep)
REFERENCES Departamentos (cod_dep)

FCUL - ENGENHARIA GEOGRÁFICA 44


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

ON UPDATE CASCADE
ON DELETE SET NULL )

Desta forma, a modificação dos valores de cod_dep na tabela Departamentos


propaga-se para a tabela Docentes, modificando as respectivas ocorrências de
cod_dep, seja alterando identicamente (ON UPDATE), seja tornando nulas as
ocorrências respectivas (ON DELETE). Opcionalmente, neste último caso, pode-se
ainda definir um valor “por defeito” (SET DEFAULT) na tabela referenciadora
(Docentes), quando o respectivo valor é removido ou modificado na tabela
referenciada (Departamentos).

As tabelas também podem ser alteradas com o comando ALTER TABLE:

ALTER TABLE Docentes


ADD COLUMN nacionalidade VARCHAR(15)
DEFAULT ´portuguesa´
ou ainda:

ALTER TABLE Docentes


DROP COLUMN nacionalidade

A informação pode ser modelada e visualizada consoante as necessidades do utilizador


criando, com o comando VIEW, tabelas “virtuais” derivadas das tabelas realmente
existentes, no seguinte formato:

CREATE VIEW < view > [ ( < colunas > ) ]


AS < especificação >

Onde “< especificação >” pode ser do tipo: (SELECT * FROM Docentes WHERE
cod_dep = dmat). Enquanto estiver activa, uma view é tomada como um tabela real e,
portanto, passível de ser requestionada como tal. A instrução DROP aplica-se
igualmente à eliminação de uma view existente. Finalmente, sob certas condições
expressas, a modificação de uma view pode ser repercutida sobre as tabelas afectadas,
podendo assim ser utilizada para actualização das tabelas.

16.3. SQL EM LINGUAGENS DE PROGRAMAÇÃO

FCUL - ENGENHARIA GEOGRÁFICA 45


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

As funções codificadas nas linguagens SQL nem sempre respondem às necessidades de


aplicações desenvolvidas. Nestes casos é necessário recorrer a linguagens de
programação onde se “encaixam” os comando SQL, sempre que haja acesso à BD. As
dificuldades de integração das duas linguagens residem essencialmente nas suas
diferenças estruturais. Enquanto a SQL é considerada uma linguagem orientada para
conjuntos (set-oriented), as linguagens de programação são linguagens orientadas para
registos (record-oriented), além da primeira ser essencialmente declarativa enquanto
que as segundas são utilizadas em aplicações não-declarativas. Basicamente estas
diferenças são resolvidas com a utilização de interfaces adequadas.

Em geral, qualquer instrução SQL embutida numa linguagem de programação, deve


alterar a sua sintaxe enquadrando-a entre palavras reservadas: “EXEC SQL” e “;”,
salvo em Cobol em que esta última deve ser “END-EXEC”.

As variáveis utilizadas no programa podem também ser utilizadas em comandos SQL,


desde que declaradas em secção própria:

EXEC SQL BEGIN DECLARE SECTION;


...
< declaração de variáveis utilizadas em SQL >
...
EXEC SQL END DECLARE SECTION;

17. A LINGUAGEM QBE1

17.1. MANIPULAÇÃO DE DADOS

Dado não existir um padrão para as QBE, os interface adoptados variam bastante de
sistema para sistema. Em todo o caso, na base de qualquer interface QBE estão as
grelhas correspondentes a esquemas de relações, sendo a interacção com o sistema
feita através do preenchimento dessas grelhas com valores, variáveis, expressões e
marcas especiais. No exemplo apresentado mais adiante utiliza-se a notação QBE do
sistema DB2 da IBM Corp.

Em QBE, uma questão é colocada ao sistema basicamente através da colocação na


grelha de um exemplo daquilo que se pretende. Esse exemplo será depois generalizado
pelo sistema permitindo obter o resultado pretendido. A selecção dos atributos a

1
idem.
FCUL - ENGENHARIA GEOGRÁFICA 46
SISTEMAS DE INFORMAÇÃO GEOLÓGICA

figurar no resultado final faz-se colocando marcas “P.” nos espaços da grelha,
correspondentes a esses atributos. Assim, consideramos a seguinte relação:

Alunos (numero, nome, curso, media. ano_finalização)

A questão “quais os alunos (número e nome) com média final igual a 14?” seria
colocada em QBE (em DB2) da seguinte forma:

Alunos a b c d e
numero nome curso média ano_finalização
P. P. > 14

A versão correspondente em cálculo relacional de domínios seria:

{ ab | (∃d) (Alunos (abcde) ∧ d > 14 }

Este interface é muito fácil de utilizar, contudo as questões terão que ser relativamente
simples. Existem no entanto questões, como por exemplo as que em álgebra relacional
implicam a utilização da operação divisão, que não podem ser colocadas utilizando
este interface.

17.2. OUTROS TIPOS DE LINGUAGEM


São bastante vulgarizadas algumas BD para computadores pessoais, utilizando
linguagens aparentadas à SQL e QBE. Entre estas a mais difundida tem sido a família
Xbase da Ashton-Tate. Este produto tem evoluído ao longo de várias versões, da
dBase II em 1984 à dBase IV em 1990, transformando-se no gestor de bases de dados
relacionais dominante para computadores pessoais, com grande divulgação no mercado
das pequenas e médias empresas.

A linguagem utilizada pelos sistemas dBase presta-se tanto a uma utilização


interactiva, em que o utilizador manipula os dados e coloca questões directamente ao
terminal utilizando a linha de comandos, como para o desenvolvimento de aplicações,
para o qual possui instruções de controlo de fluxo, formatação de saída de dados, etc.
Um exemplo de utilização interactiva através da linha de comando seria o seguinte,
dentro do exemplo de relação atrás definido:

USE alunos
DISPLAY ALL FIELDS numero, nome FOR media > 14.

FCUL - ENGENHARIA GEOGRÁFICA 47


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

Dado o sucesso obtido com os dBase, têm surgido no mercado outros produtos como o
Clipper, que concebeu o primeiro compilador para o dBase, ou o FoxPro da Fox
Software. Estes produtos têm em geral de comum o mesmo tipo de formato de
ficheiros (“ *.DBF ”).

18. MODELOS PÓS-RELACIONAIS

18.1. CONTEXTO

Os modelos de base de dados pós-relacionais nascem, sobretudo, já na última década


do sec. XX, perante a necessidade de melhor adequar os Sistemas de Bases de Dados
Relacionais a outras áreas bem diferentes das de gestão. Com efeito, aquelas bases de
dados tiveram o seu grande sucesso e constituiram um salto qualitativo considerável no
tratamento rápido de um grande número de dados em transacções simultâneas, em
geral de natureza semelhante, em tempo real e com acesso por parte de múltiplos
utizadores. Estas são, certamente, ainda as mais importantes necessidades de grandes
empresas de distribuição, de transporte aéreo ou ligadas à área financeira. Mas não
todas: mesmo áreas muito próximas da gestão, como a do Secretariado Electrónico
(Burotique, office automation), nunca foi muito bem servida pela tecnologia
convencional (BD’s pré-racionais e relacionais)1. As áreas de suporte à decisão,
onde se pode considerar incluídos os SIG, tem características completamente diversas2:
um muito menor número de utilizadores simultâneos (gestores, elementos dos
departamentos de planeamento e/ou de comercialização, etc.) da ordem das dezenas,
transações enormes que podem pesquisar milhões de registos, admitindo-se contudo
tempos de resposta mais dilatados. O tratamento de grande número de variáveis, a
conjugação de uma maior diversidade na natureza dos dados e por vezes relativos a
épocas diferentes, podendo neste caso diferir o seu carregamento, contribuiram
também para busca de soluções diferentes.

É neste contexto que surge o conceito e arquitectura de Data Warehouse, proposto por
W.H.Inmon3 e que tomamos a liberdade de traduzir como Entreposto de Dados, que
pode ser definido como uma base de dados para apoio à decisão, lógica e fisicamente

1
J.L.Pereira, 1996, Tecnologia de Base de Dados, FCA Ed., Lisboa.
2
Segundo Ana Lucas (FCUL), 1996, in Prólogo, Tecnologia de Base de Dados, FCA Ed., Lisboa.
3
Idem.
FCUL - ENGENHARIA GEOGRÁFICA 48
SISTEMAS DE INFORMAÇÃO GEOLÓGICA

separada do sistema operacional. Este tipo de BD destina-se a ser actualizada


periodicamente, em diferido (batch) e conterá dados datados, isto é, com informação
sobre o periodo a que se referem e/ou com data de aquisição. Estes podem ser dados
históricos, correntes ou com vários níveis de sintetização, consoante as necessidades.

18.2. LINGUAGENS PÓS-RELACIONAIS

A mais recente geração de BD surgiu face às diferentes necessidades de grande


número de aplicações, com fraco recurso a bases de dados convencionais,
privilegiando a construção de ficheiros dedicados, eventualmente de grande dimensão.
Foram deste modo determinadas por aplicações que necessitavam de grande
maniabilidade para as suas funcionalidades específicas. Com a utilização de ficheiros
dedicados têm surgido contudo alguns aspectos negativos como a tendência para a
criação de formatos próprios, constituindo “verdadeiras ilhas isoladas no meio dos
sistemas informáticos das organizações1”2. Este facto não deve no entanto impedir o
desenvolvimento das novas aplicações que exijam por sua vez o desenvolvimento de
BD´s capazes suportar:

⇒ Dados complexos.
⇒ Dados semanticamente ricos.
⇒ Representações de formas elaboradas de conhecimento.
⇒ Transacções com duração relativamente grande.
⇒ Registo da evolução dos “objectos” modelados.

Neste sentido, existem actualmente 3 linhas de investigação e desenvolvimento da


tecnologia de BD, envolvendo as seguintes áreas:

• Extensões ao modelo relacional. Partem do princípio de que o modelo


relacional fez as suas provas de eficiência, estabilidade e segurança,
assim como de outras virtudes ainda aproveitáveis (simplicidade de
conceitos, linguagens de manipulação de alto nível, bom suporte
teórico, etc) e lançam-se na adição de novas características e
funcionalidades no sentido de minimizar as suas fraquezas. Constitui

1
Se bem que, progressivamente, tenha sido compensado pela integração, nos sistemas, de módulos de
leitura e reformatação de dados oriundos de sistemas concorrentes.
2
J.L.Pereira, 1996, idem.
FCUL - ENGENHARIA GEOGRÁFICA 49
SISTEMAS DE INFORMAÇÃO GEOLÓGICA

um esforço “reformista”, com algum sucesso, no sentido de sobreviver à


nova vaga de solicitações da tecnologia de base de dados.

• Modelo Lógico/Dedutivo. Ainda ligado ao modelo relacional, mas mais


vincadamente evolucionista, procura levar a cabo uma maior simbiose
entre linguagens de programação em lógica e a base de dados. É capaz,
deste modo, de armazenar não apenas dados mas também regras que
controlam o acesso a esses dados, reagem a alterações sobre esses dados
e permitem inferir novos dados a partir dos existentes.

• Modelo Orientado para Objectos (OO). Modelo de Base de Dados


concebido de raiz e apoiado no desenvolvimento recente das linguagens
de programação Orientadas para Objectos. Dispõe de grandes
capacidades de modelação e adequa-se às áreas de aplicação mais
complexas, se bem que seja uma via ainda em pleno desenvolvimento,
impulsionada pela necessidade inadienável de tratamento e integração
de informação via Internet e Sistemas Multimédia.

FCUL - ENGENHARIA GEOGRÁFICA 50


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

18.3. O MODELO ORIENTADO PARA OBJECTOS

De entre os Sistemas de Gestão de Base de Dados pós-relacionais, o Modelo Orientado


para Objectos (OO) é sem dúvida o que apresenta maior potencial de desenvolvimento
neste início do século XXI e precisamente o que mais vai ao encontro das necessidades
do tratamento cada vez mais complexo da informação geográfica.

Além das razões anteriormente apresentadas, e se compararmos este modelo com os


relacionais, em que estes possuem enormes capacidades no tratamento de grandes
tabelas, mas em reduzido número, podemos assinalar, neste mesmo domínio, a
facilidade dos modelos orientados para objectos em relacionarem a informação de
grande número de tabelas, de preferência de menor dimensão. Deste modo, a corrente
complexidade dos objectos, mais próxima do mundo real, assim como a manutenção de
várias versões do mesmo objecto, ou mesmo as suas versões alternativas, encontra-se
muito mais ao alcance destes modelos que os da geração relacional que os precedeu.

Assim a complexidade dos objectos apontam para duas implicações:

Desagregação: para a sua representação em tabelas é necessário


desagregar os objectos.

Agregação: o procedimento relacional de reconstituição dos objectos é


por excelência a Junção (Join) de registos de diferentes tabelas, tornando-
se um procedimento bastante pesado para objectos complexos, pelo
número de tabelas envolvidas.

Apesar de, na prática, se confundir uma Base de Dados e o seu Sistema de Gestão,
suportado por uma Linguagem com regras bem definidas, existe, no modelo orientado
para objectos uma diferença bem marcada entre Linguagens de Programação e Bases
de Dados, apesar destas terem sido determinadas pelas primeiras. Não havendo
diferença fundamental entre os objectos lidados por umas e outras, o que destaca as
Bases de Dados é o facto desses mesmos objectos poderem persistir após a sua criação,
levada a cabo pelas linguagens e “existentes” apenas durante a execução do programa,
para alem das suas características correntes, como Base de Dados, ou seja: integridade,
controlo da concorrência, segurança de acessos, recuperação e tolerância a falhas.

Esta realidade introduz um novo conceito nos sistemas de informação, distinguindo um


objecto persistente de um objecto transiente, existindo este apenas durante o período, o

FCUL - ENGENHARIA GEOGRÁFICA 51


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

mais das vezes relativamente efémero, da execução de um programa. E é com esta


diferença estabelecida que as novas aplicações se libertam de funcionalidades mais
correntes como a decomposição dos objectos em estruturas passíveis de serem
armazenadas em ficheiros, a sua recuperação posterior e a reconstituição dos objectos
originais.

Outros conceitos foram necessariamente introduzidas nesta abordagem inteiramente


nova no tratamento da informação em que o de “objecto” surge naturalmente em
primeira linha do tratamento computacional da realidade.

O conceito de Objecto, equiparado ao de entidade (feature) no modelo reacional,


como um registo composto de diversos atributos, vem aqui como estando associado,
alem desses atributos, a um conjunto de métodos, que definiem o seu comportamento
ou relação com outros objectos, assim como a um conjunto de mensagens,
respondendo desse modo ao exterior em função da sua “utilidade”.

Em seguida, o conceito de Classe, para alem de corresponder a um conjunto com as


mesmas características (atributos) é igualmente caracterizado por possuir os mesmos
métodos. É ainda a existência de métodos definidores de classes que introduz uma das
diferenças mais importantes entre estes modelos e os das Bases de Dados Relacionais.
Alem deste aspecto, há que salientar o papel do método como definidores de uma
classe, pela eliminação de redundância na definição das propriedades de cada objecto.

O conceito de Encapsulamento é igualmente novo, na medida em que existiu, em


programação procedimental (imperativa), uma separação funcional entre dados e
código. Os modelos OO integram ambos num único objecto, permitindo uma
distinção entre propriedades estáticas e propriedades dinâmicas dos objectos.
Igualmente, e isto introduz mais uma diferença substancial com os modelos da geração
precedente, o objecto adquire um comportamento bem definido, contrariamente às
diferentes manipulações, arranjos e interpretações a que as tabelas do modelo
relacional podem ser sujeitas. Consubstancia igualmente a almejada independência
entre programação e dados, permitindo a alteração ou redefinição do objecto
(instância) sem alterar o sistema lógico ambiente.

O conceito de Herança é igualmente uma das conquistas deste novo modelo. A


organização hierárquica dos objectos em Classes, sub-classes e super-classes, intruduz
uma complexidade crescente, do topo para a base, em que a classe inferior “herda” as

FCUL - ENGENHARIA GEOGRÁFICA 52


SISTEMAS DE INFORMAÇÃO GEOLÓGICA

propriedades (dados e métodos) da superior, acrescidos dos restantes dados e métodos


característicos e definidores da sua classe. Esta noção de herança é ainda enriquecida
com o facto de uma classe poder pertencer a mais de uma super-classe, verificando-se
neste caso uma herança múltipla, diferenciando-se da herança simples atrás descrita.
A herança múltipla introduz naturalmente uma diminuição da redundância na definição
das propriedades dos objectos, em prejuízo de uma maior simplicidade do sistema. A
hieraquia assim definida está intimamente relacionada com os conceito de
generalização verificável no topo da mesma, enquanto que a descida para a base exige
uma maior especialização. Este é tambem um processo de criação de objectos a partir
doutros, sendo um processo corrente utilizar os mecanismos de generalização/
especialização numa dada hierarquia de classes.

Novo é tambem o definido por Polimorfismo, propriedade que caracteriza o facto de


uma mesma mensagem dirigida a objectos de classes diferentes provocar reacções
distintas.

Por último, um outro conceito leva à caracterização inequívoca de cada objecto, com a
definição de um identificador único, inalterável e não reutilizável, independentemente
do momento em que foi criado (sem data), o OID (Object IDentifier). Dois objectos
em tudo iguais (mesmo estado) podem (e devem) ter identificadores diferentes,
correspondendo cada um a objextos distintos da realidade. O identificador único não
impede que um objecto possa ser modificado, mesmo nos seus atributos chave.

Todas estas propriedades das Bases de Dados Orientadas para Objectos não impede
que se possa sempre aceder a um objecto que corresponda a uma dada condição, assim
como a todo um conjunto de outros objectos referenciados pelo primeiro. Este é o
princípio fundamental que permite todo e qualquer tipo de Inquirição.

FCUL - ENGENHARIA GEOGRÁFICA 53

Вам также может понравиться