Вы находитесь на странице: 1из 89

AUTARQUIA ASSOCIADA UNIVERSIDADE DE SO PAULO

Mapas Auto - organizveis de Kohonen (SOM) aplicados na


avaliao dos parmetros da qualidade da gua

Gustavo Sousa Affonso

Dissertao apresentada como


parte
dos requisitos para obteno do
Grau
de Mestre em Cincias na rea
de Tecnologia Nuclear - Reatores
Orientador:
Prof. Dr. Roberto Navarro de Mesquita

So Paulo
2011

Autarquia associada universidade de So Paulo

MAPAS AUTO - ORGANIZVEIS DE KOHONEN (SOM)


APLICADOS NA AVALIAO DOS PARMETROS DA
QUALIDADE DA GUA.

GUSTAVO SOUSA AFFONSO

Dissertao apresentada como parte


dos requisitos para obteno do Grau
de Mestre em Cincias na rea de
Tecnologia Nuclear Reatores

Orientador:
Dr. Roberto Navarro de Mesquita

So Paulo
2011

INSTITUTO DE PESQUISAS ENERGTICAS E NUCLEARES


Autarquia associada universidade de So Paulo

MAPAS AUTO ORGANIZVEIS DE KOHONEN (SOM)


APLICADOS NA AVALIAO DOS PARMETROS DA
QUALIDADE DA GUA.

GUSTAVO SOUSA AFFONSO

Dissertao apresentada como parte


dos requisitos para obteno do Grau
de Mestre em Cincias na rea de
Tecnologia Nuclear Reatores

Orientador:
Dr. Roberto Navarro de Mesquita

So Paulo
2011

Aos meus pais e


minha famlia.

AGRADECIMENTOS

Meus sinceros agradecimentos a todos que contriburam direta e indiretamente para a


realizao deste trabalho.
Ao Professor Doutor Roberto Navarro de Mesquita por sua orientao e especialmente
pela compreenso e pacincia.
Ao Professor Doutor Hlio Akira Furusawa por sua cooperao nos diversos aspectos
que contemplam este trabalho, por sua disponibilidade e auxilio nos momentos difceis
e por sua amizade.
E ao Centro de Qumica e Meio Ambiente, pela colaborao na realizao deste projeto.

MAPAS AUTO - ORGANIZVEIS DE KOHONEN (SOM)


APLICADOS NA AVALIAO DOS PARMETROS DA
QUALIDADE DA GUA.

Gustavo Sousa Affonso


RESUMO
A atual crescente necessidade de anlise de colees de dados cada vez mais complexas
e extensas, nas diversas reas da investigao cientfica, tem permitido o
desenvolvimento de novas ferramentas para a melhoria da percepo de informaes
que nem sempre so explcitas e visveis. Estudos de ferramentas matemticas que
propiciem o destaque de algumas destas informaes, ou que inteligentemente
reconheam padres associados aos diferentes conjuntos de dados, tm demonstrado
resultados promissores. No entanto, o sucesso da escolha da metodologia apropriada
para a anlise dos dados, est vinculado a vrios fatores como: a tecnologia disponvel
para a prospeco destes dados, a adequada coleta e seleo das amostras, e
principalmente, a capacidade do pesquisador em interagir com a nova tecnologia de
explorao. No presente projeto, proposta uma metodologia de anlise
multidimensional dos dados de unidades de gerenciamento de recursos hdricos
UGRHIs, localizadas no estado de So Paulo, por meio das redes neurais SOM (Mapas
Auto-Organizveis). Estes mapas so utilizados para estudar e visualizar possveis
correlaes entre as diversas variveis deste banco de dados relativas anlise de
compostos inorgnicos e parmetros fsico qumicos referentes qualidade da gua
nestas unidades.

SELF - ORGANIZING MAPS OF KOHONEN (SOM) APPLIED IN


THE EVALUATION OF PARAMETERS OF WATER QUALITY

Gustavo Sousa Affonso

ABSTRACT
The current increasingly need for data analysis on larger and more complex data
collections, in many different areas of scientific research, has induced the development
of new tools for the perception improvement of information that not always is explicit
and visible at first. Studies of mathematical tools which could enable the highlight of
some of this information, or should intelligently recognize patterns associated with
these different data collection, have been showing promising results. However, the
success of the choice of the appropriate analysis method is associated with several
factors: the available technology for this data exploration, the correct gathering and
selection of samples, and mainly, the researcher ability to interact with the new
exploration technology. In this project we propose a methodology for analyzing
multidimensional data from Water Resources Management Units (WRMUs), which are
located in So Paulo state, through Self - Organizing Maps (SOM) neural networks.
These maps are used to study and visualize possible correlations between the different
variables existent in this database, which are derived from analysis of inorganic and
physical - chemical parameters related to WRMUs water quality.

SUMRIO
Pgina
1 INTRODUO........................................................................................................... 1
1.2 Objetivos................................................................................................................3
2 REVISO DE LITERATURA...................................................................................4
2.1 Conceitos sobre anlise estatstica multivariada...................................................4
2.2 mtodos multivariados e SOM..............................................................................5
3 FUNDAMENTAO TERICA..............................................................................8
3.1 Redes Neurais........................................................................................................8
3.1.1 Modelo biolgico................................................................................................8
3.1.2 Breve Histrico das RNA................................................................................10
3.1.3 O Multi-Layer Perceptron................................................................................13
3.1.4 Algoritmos de Aprendizagem e Treinamento..................................................14
3.1.4.1 Regra de correo de erro..............................................................................15
3.1.4.2 Regra de gradiente descendente....................................................................15
3.1.5 Mapas Auto Organizveis............................................................................... 16
4 METODOLOGIA.......................................................................................................20
4.1 Caractersticas dos parmetros fsico qumicos................................................20
4.1.2 Organizao do Banco de Dados......................................................................21
4.1.3Caractersticas

das

Unidades

de

Gerenciamento

de

Recursos

hdricos......................................................................................................................24
4.1.4Implementao da Metodologia........................................................................29
4.1.5 Descrio do procedimento utilizado para o treinamento do SOM.................31
5 RESULTADO E DISCUSSO..................................................................................36
5.1 Apresentao dos resultados SOM......................................................................36
5.1 Estudo de similaridades entre pontos de coleta...................................................36
5.2 Estudo de similaridade ente parmetros fsico-qumicos....................................36
5.4 Grficos dos prottipos de vetores......................................................................49
6 CONCLUSES...........................................................................................................55
6.1 Matrizes para estudo de similaridade entre pontos de coleta..............................55
6.2 Matrizes para estudo de similaridade entre parmetros fsico-qumicos.............58

6.3 Grficos dos prottipos de vetores......................................................................59


6.3 Consideraes finais............................................................................................59
ANEXO A.......................................................................................................................61
ANEXO B.......................................................................................................................66
REFERNCIAS BILIOGRFICAS...........................................................................73

LISTA DE FIGURAS
Pgina
FIGURA 1 Modelo esquemtico do neurnio biolgico...............................................9
FIGURA 2 - Modelo esquemtico do neurnio artificial...............................................10
FIGURA 3 - Exemplo ilustrativo do Perceptron de Rosenblat.......................................11
FIGURA 4 - Exemplos de classes linearmente separveis e inseparveis do algoritmo
discriminante ..................................................................................................................12
FIGURA 5 - Rede neural MPL........................................................................................14
FIGURA 6 - Representaes das etapas competitiva e cooperativa de treinamento da
SOM.................................................................................................................................18
FIGURA 7 - Estrutura de SOM com topologia triangular..............................................19
FIGURA 8 - Estrutura de SOM com topologia quadrtica ............................................19
FIGURA 9 - Estrutura de SOM com topologia randmica.............................................19
FIGURA 10 - Mapa da Localizao geogrfica da UGRH 01, regio de Mantiqueira e
UGRH 02, regio de Paraba do Sul...............................................................................24
FIGURA 11 - Mapa da localizao geogrfica da UGRH 4 Rio Pardo.........................25
FIGURA 12 - Mapa da localizao geogrfica da UGRH 05, regio de Piracicaba,
Capivari e Jundia...........................................................................................................26
FIGURA 13 - Mapa da localizao geogrfica da UGRH 06, regio do Alto
Tiet................................................................................................................................ 27
FIGURA 14 - Diagrama da formatao da base de dados............................................29
FIGURA 15 - Procedimento realizado do transporte das variveis para a gerao de
resultados no SOM Toolbox............................................................................................31
FIGURA 16 - Exemplo do ordenamento dos prottipos de vetores................................35
FIGURA 17 - Mapa da matriz de distncia entre vetores com os rtulos......................37
FIGURA 18 - Componentes planos gerados a partir da grande matriz.........................40
FIGURA 19 - Mapa indicativo dos rtulos caractersticos (BMUs) dos pontos de coleta
na matriz principal..........................................................................................................42
FIGURA 20 - Mapa com rotulagem sobreposta para destaque dos grupos...................43
FIGURA 21-a - Apresentao do mapa das distncias vetoriais, por distribuio de
frequencia de rtulos, da matriz modificada (257 linhas por 10 parmetros)...............44
FIGURA 21-b- Apresentao por votao do mapa das distncias vetoriais com os
rtulos da matriz modificada (257 linhas por 10 parmetros).......................................45
FIGURA 21-c- Apresentao do mapa das distncias vetoriais com o mapa geral
rotulado obtido da matriz modificada (257 linhas por 10 parmetros).........................46
FIGURA 22 - Mapa geral rotulado obtido da matriz inversa........................................47
FIGURA 23 - Mapa de distncia entre vetores da matriz transposta com os rtulos dos
parmetros fsico qumicos..........................................................................................48
FIGURA 24 - Mapa de distncia entre vetores da matriz transposta da matriz
modificada de 257 linhas por 10 parmetros.................................................................49
FIGURA 25 - Grfico do prottipo de vetor mais caracterstico do cluster nomeado
PMnNKT.....................................................................................................................50
FIGURA 26 - Grfico do prottipo de vetor mais caracterstico do cluster nomeado
pHCLOD.....................................................................................................................51
FIGURA 27 - Grfico do prottipo de vetor mais caracterstico do cluster nomeado
Temperaturas..............................................................................................................51

FIGURA 28 - Grfico do prottipo de vetor mais caracterstico do cluster nomeado


Condutividade.............................................................................................................52
FIGURA 29 - Grfico do prottipo de vetor mais caracterstico do cluster nomeado
Turbidez.........................................................................................................................52
FIGURA 30 - Prottipo de vetor obtido a partir da matriz modificada referente aos
dados da regio do Rio Capivari....................................................................................53
FIGURA 31 - Prottipo de vetor obtido a partir da matriz modificada referente aos
dados da regio do Rio Paraba da coleta do dia 19/08/2008.......................................53
FIGURA 32 - Prottipo de vetor obtido a partir da matriz modificada referente aos
dados da regio do Rio Pardo da coleta do dia 03/10/2000..........................................54
FIGURA 33 - Mapa do estado de So Paulo com as 22 UGRHIs organizadas em 11
grupos. (CETESB, 2001).................................................................................................57

LISTA DE ABREVIATURAS

ART

Adaptive Ressonance Theory

BMU

Best Matching Unit

CESTESB

Companhia Ambiental do Estado de So Paulo

CONAMA

Conselho Nacional do Meio Ambiente

CQMA

Centro de Qumica e Meio Ambiente

DBO

Demanda Bioqumica de oxignio

DQO

Demanda Qumica de oxignio

ETA

Estao de Tratamento de gua

IA

Inteligncia Artificial

IAP

ndice de Qualidade das guas Brutas para Fins de Abastecimento

Pblico
IPEN

Instituto de Pesquisas Energticas e Nucleares

KSOM

Kohonen Self Organizing Maps

LMS

Least Mean Square Algorithm

MPL

Multilayer Perceptron

MS

Ministrio da Sade

NKT

Nitrognio Kjeldahl total

NSF

National Sanitation Foundation

OD

Oxignio Dissolvido

PCA

Principal Components Analysis

PFTHM

Potencial de formao de trihalometanos

pH

Potencial hidrogeninico

RNA

Rede Neural Artificial

SABESP

Companhia de Saneamento Bsico do Estado de So Paulo

SOM

Self Organizing Maps

UGRH

Unidade de Gerenciamento de Recursos Hdricos

1. INTRODUO
A importncia do tratamento da informao atualmente reconhecida nos mais diversos
campos das pesquisas cientificas e sociais, e tem proporcionado o desenvolvimento de
novas ferramentas interdisciplinares No entanto, em uma coleo de dados quer seja
exgua ou numerosa, a percepo do que representam estas informaes nem sempre
direta.

Assim, de grande valia o conhecimento sobre as tcnicas disponveis para

manipulao desses dados que permitam o destaque de algumas das informaes ou que
inteligentemente reconheam padres existentes e potencialmente relevantes. O sucesso da
escolha da estratgia de prospeco dos dados est vinculado a vrios fatores, como
tecnologia disponvel para esta prospeco, coleta e seleo apropriada das amostras, mas
principalmente ao conhecimento sobre a informao de interesse e capacidade que o
pesquisador tem de interagir com a tecnologia de explorao. Esta interao, comum a
qualquer pesquisa cientifica sistemtica, inclui a modificao da metodologia tanto em
seus parmetros fundamentais quanto na utilizao apropriada das tcnicas de seleo do
espao amostral. O desenvolvimento de tcnicas de inteligncia artificial nas ltimas
dcadas tem disponibilizado novos recursos ao pesquisador no sentido de automatizar
etapas dessas interaes. Assim, a interatividade no uso das tcnicas que extraiam relaes
e parmetros de interesse da base de dados pode ser melhorada e aperfeioada na medida
em que a prpria estratgia e conhecimento do pesquisador sobre o problema so
explicitados e sistematizados. Muitos dos trabalhos envolvendo tcnicas de inteligncia
artificial resultaram na possibilidade de comparao objetiva entre diferentes metodologias
e estratgias de tratamento dos dados, levando at mesmo ao estabelecimento de padres
de referncia (benchmarks).
Entre algumas das vantagens na metodologia h a capacidade que as tcnicas de
inteligncia artificial apresentam em repetir exaustivamente tarefas associadas pequenas
modificaes dos parmetros de explorao. Com a possibilidade de se utilizar diferentes
ajustes operacionais experimentais da ferramenta exploratria, sem que necessariamente
estas modificaes sejam parte implcita da ferramenta sendo utilizada. Em geral, a
inteligncia artificial possibilita a automatizao de etapas e procedimentos envolvidos no
processo de explorao ou minerao de dados.

Entre as diversas tcnicas de inteligncia artificial, est a tcnica dos mapas autoorganizveis de Kohonen (Self Organizing Maps, KSOM) para explorao de bases de
dados multidimensionais. Tcnica que inicialmente foi estabelecida por Teuvo Kohonen,
em 1981, e consiste em uma rede neural artificial interconectada e no supervisionada que
permite um mapeamento auto ajustvel do espao de estados multidimensionais
estudado. O SOM pode ser utilizado para um estudo mais amplo da correlao entre as
mltiplas variveis existentes em um fenmeno sem previamente restringir o nmero de
variveis a serem analisadas (COSTA e NETO, 2007, HONKELA, 2007). Esses mapas
permitem uma visualizao rpida e ampla de determinadas correlaes existentes neste
banco de dados, e tm sido empregados nas mais diversas reas de pesquisa.
No campo da Inteligncia Artificial (IA), esta tcnica pode ser utilizada em conjunto com
outras que possibilitem a automatizao de procedimentos de busca e minerao dos
dados. Esta integrao de diferentes tcnicas de IA e a implementao de uma estratgia de
prospeco que represente o conhecimento do especialista constitui a chamada
implementao de heurstica.
O desenvolvimento de metodologias de IA que incluam ou se comparem s anlises
tradicionais so justificadas pela necessidade da manuteno de caractersticas do banco de
dados original (caso contrrio, pode ocorrer alterao do comportamento do processo,
induo gerao de modelos corrompidos, por exemplo). Com o objetivo de obter
padres at ento desconhecidos, relativos ao comportamento da qualidade da gua, assim
como da varincia relativa ao tempo (COSTA e NETTO, 2007). Em alguns trabalhos
recentes tem sido realizada uma comparao sistemtica entre diferentes tcnicas de
anlise multidimensional, incluindo o SOM, envolvendo grandes conjuntos de dados de
indicadores qumicos da qualidade da gua (ASTEL et,al., 2007). Esses trabalhos tem
apresentado aplicaes na avaliao da qualidade da gua, quer seja em sistemas naturais
como rios ou associados a algum processo de alterao das caractersticas da gua. Em,
2008 Kalteh et al., apresentaram um trabalho em que fazem uma reviso da aplicao do
SOM em guas. Os autores reforam a idia de que o SOM, visto como uma rede neural,
pode ser aplicado para a obteno de agrupamentos (clustering), classificao, estimao,
predio e minerao de dados (data mining) visando o reconhecimento de sinais
organizao de grande quantidade de dados, monitoramento e anlise de processos,
modelamento assim como o tratamento das variveis ambientais. Eles ressaltam a

indicao que os vrios estudos sugerem que o SOM pode superar muitos outros mtodos
aplicados em hidrologia.
Este trabalho se insere neste contexto de desenvolvimento de tecnologias de prospeco de
dados e busca contribuir no desenvolvimento de metodologias de anlise de qualidade da
gua atravs da aplicao do SOM a um conjunto de matrizes ambientais com o auxlio de
algumas ferramentas estatsticas.
1.2 OBJETIVOS
Propor uma metodologia utilizando mapas auto organizveis de Kohonen (SOM), para a
anlise multidimensional de uma base de dados composta por valores de parmetros fsicoqumicos da qualidade da gua destinada ao consumo humano (domstico, industrial e
rural) oriunda de pontos de coleta das unidades de gerenciamento de recursos hdricos de
diversas regies do estado de So Paulo.
Objetivos Especficos
Demonstrar o potencial da aplicao dos mapas auto-organizveis de Kohonen em base de
dados de qualidade da gua;
Analisar as correlaes entre os parmetros oriundos de anlises ambientais visando
identificar potenciais correlaes.
Identificar e avaliar as limitaes desta tecnologia;
Estabelecer um procedimento bsico para futuras aplicaes.

2. REVISO DE LITERUTURA
2.1 Conceitos sobre anlise estatstica multivariada.
A estatstica multivariada consiste em um conjunto de mtodos estatsticos utilizados em
situaes nas quais vrias variveis so medidas simultaneamente, em cada elemento
amostral. Em geral as variveis so correlacionadas entre si e quanto maior o nmero de
variveis, mais complexa torna-se a anlise por mtodos comuns de estatstica univariada.
Embora historicamente o uso dos mtodos multivariados esteja em trabalhos na psicologia,
cincias sociais e biolgicas, mais recentemente eles tm sido aplicados em um grande
universo de reas diferentes como: educao, geologia, qumica, fsica, engenharia, etc.
Esta expanso na aplicao dessas tcnicas somente foi possvel graas ao grande avano
da tecnologia e ao grande numero de softwares estatsticos com mdulos de anlise
multivariada. Trabalhos realizados no Centro de Qumica e Meio Ambiente
(CQMA/IPEN), (COTRIM, 2006; REIS, 2006; MARQUES, 2005; LEMES, 2001)
utilizando a estatstica multivariada demonstraram a aplicabilidade da ferramenta na
anlise de dados ambientais gerados de naturezas diversas (gua bruta e final, sedimento,
iodo, entre outros).
H duas principais tcnicas citados na literatura: - um grupo de tcnicas exploratrias de
sintetizao (ou simplificao) da estrutura de variabilidade dos dados e um grupo de
tcnicas de inferncia estatstica. Dentro do grupo de tcnicas exploratrias podem-se
destacar a anlise de componentes principais, a anlise de correlaes cannicas, a anlise
de agrupamentos, a anlise discriminante de correspondncia (MINGOTI, 2005).
Do grupo de tcnicas de inferncia estatstica se destacam os mtodos de estimao de
parmetros, testes de hipteses, anlise de varincia, covarincia e de regresso
multivariada.
De acordo com Echalar, 1991, uma base de dados multivariada pode ser interpretada como
uma descrio das variabilidades em um sistema por meio das sries temporais das
variveis medidas.

A anlise de componentes principais tem como principal aplicao a mensurao do grau


de interrelaes existentes entre as variveis envolvidas no processo, e isto pode ser
observado na repetitividade de certa caracterstica em uma srie temporal denotando que
talvez essa informao derive de fatores subjacentes que causem a variabilidade.
Na anlise de fatores principais, busca-se substituir a descrio dessa variabilidade de
variveis medidas por outra com um menor nmero de variveis, independentes,
combinaes lineares que representem esses fatores causais, no explcitos da variabilidade
medida.
2.2 mtodos multivariados e SOM.
Um conjunto importante de aplicaes do SOM em anlise de qualidade da gua tem sido
publicadas em anos recentes, demonstrando o interesse internacional na qualificao de
novos mtodos de anlise que utilizam, em primeira instncia, os novos recursos de clculo
e de interatividade disponibilizados pelo crescente avano dos computadores nas ltimas
dcadas.
Algumas revises importantes foram publicadas bem recentemente analisando os
diferentes mtodos de anlise multidimensional da qualidade da gua tanto em seus
aspectos espaciais como temporais (Bierman et. al., 2011, Crghino e Park, 2009, Kalteh
et. al, 2008). Os trabalhos analisados e citados por estas revises recentes ressaltam o
potencial apresentado pelo SOM no estudo da qualidade da gua na visualizao e
explorao de relaes lineares e no-lineares de dados multidimensionais, consideradas
como ferramentas comprovadamente teis na avaliao da qualidade da gua (Crghino e
Park, 2009).
Entre os diversos mtodos multivariados disponveis para anlise de tendncias e padres
espaciais e temporais em dados de qualidade da gua foram comparadas tcnicas como
Anlise de Cluster, Anlise Discriminante, Anlise Fatorial e Anlise de Componentes
Principais (Bierman et. al., 2011). Muitos destes mtodos estatsticos so utilizados em
dados de amostras pontuais e so estendidos para dados adquiridos remotamente por
sensoriamento e imageamento. Bierman et. al (2011) afirmam que o SOM, o
Semivariograma e a Regresso Pesada Geograficamente (Geographically Weghted

Regression (GWR)) so mais apropriados para a anlise e representao espacial dos dados
relativos qualidade da gua.
Originalmente criada por Kohonen (1981a,b), o SOM foi inicialmente aplicado para
reconhecimento de fala. Em 1996, foi aplicado pela primeira vez no estudo da gua (Chon
et al., 1996) por meio do estudo de comunidades-padro de bentos em correntes de gua e
desde ento tem sido aplicado com freqncia em diversos estudos relacionados dados
ambientais multidimensionais.
Tison et al., 2004 classificou dados biolgicos e ambientais baseado na aplicao do SOM
em diatomceas (algas biolgicas).
Num trabalho mais direcionado, Mustonen et al., 2008, apresentaram uma avaliao da
qualidade da gua em uma estao piloto de tratamento de gua utilizando uma abordagem
com mtodos multivariados de explorao de dados com o SOM. Os 7 parmetros que os
autores monitoram foram pH, alcalinidade, dureza, DQO, cloreto, sulfato e ferro.
A utilizao concomitante da anlise multivariada com a anlise de componentes
principais (Principal Components Analysis, PCA) e da anlise com as redes neurais de
Kohonen pode possibilitar a comprovao e o desenvolvimento de modelos e metodologias
que possibilitem uma melhora significativa deste tipo de estudo. Tobiszewski et. al., 2010
se mostram otimistas quanto aos resultados obtidos pela utilizao da associao do SOM
com um algoritmo especialista. Astel et. al., 2007 j havia feito uma comparao entre a
aplicao de SOM para classificao de conjuntos de dados muito grandes com as anlise
tradicionais como Anlise de Agrupamentos (cluster analysis) e PCA.
Alguns estudos relacionados ao enfoque deste projeto foram publicados recentemente. A
anlise de uma planta de tratamento de guas residuais municipais usando o SOM, em um
estudo das complexas relaes existentes entre as variveis do processo da planta de
tratamento de guas residuais, foi publicado por Hong et. al., em 2002.
Os SOM tambm foram utilizados recentemente por Garcia e Gozalez, 2004, para estudo
do tratamento e monitoramento de guas residuais, em que se propem o desenvolvimento
de tcnicas de superviso para uma planta de tratamento de guas residuais.

O modelamento de uma planta de tratamento de gua residual municipal foi feito com
algoritmos evolucionrios autoorganizveis por Hong e Bhamidimarri em 2003.
A avaliao do desempenho da remoo dos metais pesados em um experimento
construdo em zonas midas foi feita com a aplicao de mapas auto-organizveis para
elucidar os mecanismos da remoo do metal pesado e para predizer as concentraes,
desenvolvido por Lee e Scholz em 2006.
A avaliao da sada de uma Estao de Tratamento de gua (ETA), em um rio no
Mediterrneo usando uma rede neural KSOM e a modelagem de balano de massa foi
publicado por Llorens et.al., em 2008, na qual propem a avaliao da ferramenta KSOM
para auxiliar no controle de quantidade da gua e como ferramenta de superviso.
Algumas outras aplicaes recentes do SOM na anlise da qualidade da gua, utilizando
comunidades macro invertebradas tem sido objeto de publicaes recentes em biologia
(SONG et. al., 2007; LEK e GIRAUDEL, 2001).
Notase em um conjunto crescente de pesquisadores de dados ambientais e da qualidade
da gua o uso de ferramentas mais sofisticadas e iterativas para a obteno de quadros de
correlao entre as variveis, determinao das variveis mais importantes e determinantes
e a conseqente possibilidade de obteno de novos e melhores ndices de avaliao da
qualidade ambiental. A viso da necessidade do desenvolvimento deste campo de pesquisa
enfatizada por Crghino e Park, 2009, reconhecendo um certo atraso da aplicao de
redes neurais artificiais no campo da pesquisa em pesquisa da gua e seus aspectos
biolgicos e qumicos, estimulando que mais estudos de caso e trabalhos sejam coletados.

3. FUNDAMENTAO TERICA
3.1 Redes Neurais.
Estudos na rea de neurofisiologia no ltimo sculo estimularam cientistas de diversas
reas na compreenso dos processos da mente humana e at mesmo, mimetiz-los no
formato de algoritmos. Este campo de estudo e desenvolvimento, muitas vezes descrito
como inteligncia artificial, gerou verses do neurnio biolgico que serviram como base
de desenvolvimento de diversas tcnicas conhecidas como redes artificiais (BUENO,
2006).
A rede neural artificial (RNA) um sistema computacional constitudo, por um conjunto
de

unidades

de

processamento

individuais

(chamadas

de

neurnio

artificial)

interconectados entre si com pesos que podem ser modificados de acordo com os
parmetros de qualidade que avaliam a proximidade entre a resposta desejada e a obtida.
Resumidamente o neurnio artificial, possui entradas semelhantes aos dendritos do
neurnio biolgico, captando as informaes provenientes do meio externo (figura 1), e
sadas resultantes semelhantes ao axnio.
A funo interna tambm semelhante ao soma do neurnio biolgico, desempenha a
funo de transformar a informao de entrada em uma nova informao.
A RNA tem a capacidade de aprender medida que os pesos das interconexes entre os
neurnios so ajustados conforme a sada desejada. Assim, uma RNA pode ser utilizada na
simulao e obteno de desempenhos e funes semelhantes as do crebro humano em
relao cognio e aprendizado.
3.1.1 Modelo biolgico
Na constituio do sistema nervoso biolgico, o neurnio pode ser definido como clula
nervosa altamente especializada ou como as unidades de vias de conduo de estmulo
nervoso, estimando-se que os seres humanos possuam a quantidade de bilhes de clulas
nervosas interconectadas entre si.

Dos neurnios existentes, propemse uma diviso em seus chamados constituintes


bsicos: o corpo celular, os dendritos e o axnio.
Na captao dos sinais externos transmitidos na forma de impulsos por meio dos dentritos
(canais de interconexo) h o processamento interno no corpo celular ou tambm chamado
soma para a gerao de novas informaes. A interface interneural ocorre por meio de
reaes qumicas e em regies especficas que realizam a comunicao, denominadas de
sinapses.
Em uma cadeia neural, a propagao dos estmulos nervosos percebidos pelos dentritos
realizada por meio do filamento central como observado na figura 1 denominado de
axnio, o qual os conduz at os dentritos na terminao.
A comunicao entre neurnios realizada por meio dos canais localizados no terminal
axnico ou terminal de transmisso por filamentos sensveis que desempenham a funo de
canais transmissores dos estmulos nervosos a outros neurnios, como mostrado na figura
1.

FIGURA 1 Modelo esquemtico do neurnio biolgico. (BADIN, 2011).


Entre as terminaes axnicas dos neurnios e os dendritos h as regies de contato
denominadas sinapses. A transmisso sinptica pode ser explicada por meio do principio
da propagao do influxo nervoso como um processo excitatrio por meio da liberao de

10

substncias que estimulariam outros neurnios quando o impulso percebido pelo


neurnio (RANSON, 1945).
3.1.2 Breve Histrico das RNA
Entre os mtodos de redes neurais artificiais desenvolvidos inicialmente, um dos mais
citados e que pode ser considerado originrio de vrios outros modelos posteriores, o
modelo tpico proposto por McMulloch e Pitts em 1943. Este modelo constitudo por um
dispositivo com uma sada binria e entradas com ganhos arbitrrios, podendo ser
excitatrios ou inibitrios. Na Figura 2, mostrado um esquema de um neurnio artificial
tpico.

b
X

W
Limiar

(uK)

Sada

y
Funo
Ativao
p

FIGURA 2 - Modelo esquemtico do neurnio artificial (BUENO, 2006)


Onde: X1, X2,...Xn so os sinais de entrada.
Wk so os pesos sinpticos do neurnio k.
uK o integrador linear de sada devido aos sinais de entrada.
b o bias e y o sinal de sada do neurnio.
O neurnio k pode ser descrito por meio das equaes 1 e 2.

U k = wkj x j + bk
j =1

(1)

11

yk = (u k )

(2)

Onde x1,x2,...xp so os sinais de entrada; wk1,wk2,...wkp so pesos sinpticos do neurnio k;


uk o integrador linear de sada devido aos sinais de entrada, bk o bias; (.) a funo de
ativao; e yk o sinal de sada do neurnio. O bias tm a funo acrescer uma tendncia
sada uk do combinador linear do neurnio.
No final da dcada de 1950, o projeto do Perceptron foi desenvolvido por Frank Rosenblatt
na Universidade de Cornell, a partir dos estudos de McCulloch. Utilizando a proposta do
algoritmo de treinamento da rede baseado no estudo do bilogo Donald Hebb de 1949, que
usava o ajuste gradual dos pesos de um discriminador linear. Este projeto utilizava
neurnios com pesos ajustveis para a classificao de padres linearmente separveis,
inicialmente com 400 clulas fotoeltricas, e uma arquitetura que consistia de uma camada
de neurnios de entrada. A rede era treinada para fornecer sadas de acordo com os dados
do

conjunto

de

treinamento,

para

padres

vetoriais

linearmente

separveis.

Esquematicamente o perceptron de uma nica camada pode ser representado conforme a


figura 3.

Sadas

Camada
simples com
um neurnio
Camada de inputs ou de
entradas vetorias.
FIGURA 3 - Exemplo ilustrativo do Perceptron de Rosenblatt.

12

Em 1960 Bernard Widrow e Ted Hoff, desenvolveram um modelo neural linear


denominado Adaline (Adaptive Linear Element) ou elemento linear adaptativo, e em 1962
a composio de uma rede com mltiplos elementos adaptativos, denominada Madaline
(Multiple Adaline) constituda. Eles tambm desenvolveram um algoritmo de
aprendizado baseado no conceito de minimizao do desvio quadrtico mdio (Least Mean
Square Algorithm LMS), tambm conhecido como regra delta ou mtodo do gradiente
decrescente para a minimizao do erro. (ROSSI, 2001)
Em 1969, Minsky e Papert publicam o livro intitulado Perceptrons no qual h a restrio a
problemas elementares como o ou Exclusivo e o seu complemento, limitando o teorema
desenvolvido por Rosenblatt a classe de problemas linearmente separveis, no modelo da
figura 4 h exemplos ilustram as classes de limitao citadas.

X1

X1

X1

X2
Soluo

Soluo

X2

X2
Sem soluo

FIGURA 4 Exemplos de classes linearmente separveis e inseparveis do algoritmo


discriminante. (FILHO, 1998)

Na dcada de 70 e inicio dos anos 80 houve uma diminuio na pesquisa e produo


cientfica sobre redes neurais, entretanto apesar de pouca atividade de pesquisas, neste
perodo alguns trabalhos tiveram um considervel destaque. Como os estudos apresentados
por Stephen Grossberg, que baseado em trabalhos sobre o aprendizado competitivo em
1987 junto com Carpenter, estabeleceram os princpios para uma nova classe de redes
neurais denominadas de ART ou Adaptive Ressonance Theory.

13

Antes do modelo proposto por Stephen Grossberg haviam publicaes de modelos como o
propostos por James Anderson baseados em modelos biolgicos da memria e de
reconhecimento em 1968.
Em 1982 Hopfield utilizou a idia de uma funo de energia para um novo modo de
funcionamento das redes recorrentes com conexes sinpticas simtricas, onde os
elementos so ligados buscando o aprendizado com um mnimo de energia, tendo como
dados de origem as Redes de Hopfield. No mesmo ano, Teuvo Kohonen desenvolve o
conceito das redes auto-organizveis na qual utiliza algoritmos competitivos.
Com o desenvolvimento de modelos de memrias associativas, utilizando o conceito de
aprendizado competitivo, nos quais as unidades competem para responder a determinada
entrada e o elemento vencedor tem os pesos de sua entrada modificados, convergindo para
responder com mais fora a valores prximos do desejado.
Somente em 1986 houve reinicio, das atividades de desenvolvimento das redes neurais
artificiais, com o desenvolvimento do algoritmo de retropropagao (backpropagation) por
Rumelhart, Hinton e Williams, embora este algoritmo j tivesse sido proposto
anteriormente em 1974 por Werbos em sua tese de doutorado, por Parker e LeCun em
1985. Com a publicao do livro intitulado Parallel Distributed Processing Explorations
in the Microstructures of Cognition, editado por Rumelhart e McClelland, o qual
apresentava o progresso das redes neurais ressurgiu o grande interesse pela tcnica.
3.1.3 O Multi-Layer Perceptron
O Multilayer Perceptron (MLP), ou rede de multicamadas MLP, uma sofisticao do
modelo original do Perceptron com a ampliao do nmero de camadas interconectadas, e
ampliou o espectro de problemas de classificao que podem ser resolvidas pela rede.
Uma MPL pode ser definida como uma rede interconectada (conexes sinpticas) de
neurnios disposta em neurnios de entrada (receptores do meio externo), neurnios da
camada interna ou unidades de processamento ocultas (hidden) e neurnios de sada.
(JUNIOR, 2005)

14

Na camada de neurnios de entrada, os vetores (dados) so recebidos e armazenados,


dependendo da arquitetura da rede. Na camada mais interna entre a camada de neurnios
de entrada e de sada pode haver uma camada intermediria, tambm chamada de oculta. A
camada de sada tem a funo de armazenar as respostas obtidas pela rede. O nmero de
neurnios nessa camada corresponde ao tamanho do vetor de sada. (BUENO, 2006,
FILHO, 1998). Na figura 5 apresentada uma ilustrao de um exemplo de arquitetura de
rede MPL.

Camada de
sada

Camada de
entrada
Camada
externa
FIGURA 5 - Rede neural MPL.
Este tipo de rede neural exemplifica como as RNAs procuram explorar os princpios
adotados pelo crebro humano, apresentando um processamento altamente paralelo em sua
estrutura, alm de uma capacidade de generalizar o aprendizado, obtendo respostas mais
abrangentes do que os dados apresentados durante o treinamento. Estes dois aspectos
fazem com que as redes neurais sejam capazes de solucionar problemas altamente
complexos e no-lineares.
3.1.4 Algoritmos de Aprendizagem e Treinamento
Conceitualmente, a aprendizagem da rede neural pode ser definida como um processo
adaptativo mediante a resposta aos estmulos externos rede apresentados durante a fase
de treinamento. Quando as respostas desejadas aos dados de entrada so conhecidas, o
processo de aprendizagem chamado de supervisionado, pois so apresentadas rede
simultaneamente as entradas e as sadas desejadas para que ela se auto-configure atravs da
atualizao de seus pesos. Esta atualizao feita principalmente por um algoritmo

15

chamado de retro-propagao (back-propagation), que propaga para toda a rede o erro


medido entre a resposta obtida e a resposta desejada (meta) da rede em questo. Devido
variedade de algoritmos existentes para o treinamento de redes, so citados alguns dos
algoritmos mais comuns encontrados na literatura em uma breve apresentao dos
algoritmos de aprendizagem h a definio de classes conforme o emprego de cada regra.
3.1.4.1 Regra de correo de erro
Consistem no processo de modificao dos pesos em funo direta das sadas. estimado
por meio do clculo da diferena entre a sada real gerada e a sada desejada, fornecida em
um ensino supervisionado, matematicamente o princpio (LNCC, 2011) pode ser expresso
como na equao 3:
(3)

ek = d k yk
Onde para um estmulo k,
e = sinal de erro;
d = sada desejada apresentada durante o treinamento;
y = sada real da rede aps a apresentao do estmulo de entrada.

3.1.4.2 Regra de gradiente descendente


Esta regra constitui-se de um processo de alterao dos pesos (wi), onde ocorre a
minimizao do erro pelo mtodo do mnimo erro mdio quadrtico, e pode ser expressa
pela equao 4:
E ( wi ) = 1

( xo x p ) 2

Onde xo o valor observado e xp o valor previsto.

(4)

16

3.1.5 Mapas Auto Organizveis


Os mapas autoorganizveis inicialmente inspirados no crtex cerebral humano, consistem
em uma rede neural que gera como sada representaes bidimensionais (mapas) de banco
de dados de alta dimensionalidade.
Desenvolvidos por Teuvo Kohonen (KOHONEN, 1981a,b), estes algoritmos podem
analisar dados por agrupamentos com o objetivo de descobrir estruturas e padres
multidimensionais. Tambm pode ser considerada uma rede neural com aprendizado no
supervisionado e competitiva, pois no necessita de um vetor de sada conhecido como
vetor alvo (MESQUITA, 2002).
Estes mapas foram consolidados como redes neurais por Kohonen em conferncia e artigos
no comeo da dcada de 1980. Os mapas autoorganizveis podem ser definidos como
sendo redes neurais competitivas com um alto grau de interconexo entre seus neurnios e
que so aptas a formar mapeamentos preservando a topologia entre os espaos de entrada e
de sada. Podem ser aplicados para problemas no lineares de alta dimensionalidade, tais
como: extrao de caractersticas e classificao de imagens e padres acsticos, controle
adaptativo de robs, equalizao, demodulao e transmisso de sinais assim como em
aplicaes nas reas de estatstica, processamento de sinais, qumica e medicina.
Com base no aprendizado competitivo, os neurnios de sada desta rede competem entre si
para serem ativados com o resultado de que apenas um neurnio de sada (ou um neurnio
por grupo) ser ativado em cada iterao. Um neurnio de sada que vence tal competio
chamado neurnio vencedor (winner-takes-all neuron). Uma maneira de induzir tal tipo
de competio entre os neurnios de sada usar conexes inibitrias laterais entre eles (ou
seja, caminhos de realimentao negativa), idia originalmente proposta por Rosenblat em
1958.
Os neurnios em uma rede SOM so posteriormente ordenados e apresentados em grficos
gradeados (trelia ou lattice), normalmente mono ou bi-dimensionais. Mapas de dimenses
maiores so tambm possveis, porm mais raros. Os neurnios se tornam seletivamente
ajustados a vrios estmulos (padres de entrada) ou classes de padres de entrada ao
longo de um processo competitivo de aprendizado. A localizao destes neurnios (que so

17

os neurnios vencedores) se torna ordenada entre si de tal forma que um sistema de


coordenadas significativo criado na trelia, para diferentes caractersticas de entrada.
O SOM , portanto, caracterizado pela formao de um mapa topogrfico dos padres de
entrada, no qual as localizaes espaciais (ou coordenadas) dos neurnios na trelia so
indicativas de caractersticas estatsticas (implcitas) contidas nos padres de entrada.
Como modelo neural, as redes SOM, conceitualmente, podem ser definidas como uma
conexo entre a adaptao dos neurnios e padres de seletividade de caractersticas.
Sendo consideradas tambm como uma generalizao no linear da heurstica para anlise
de componentes principais (MESQUITA, 2002).
O funcionamento de um SOM pode ser compreendido em etapas distintas, a etapa
competitiva na qual se define o neurnio mais adequado (Best Matching Unit). A escolha
da melhor correspondncia entre o vetor de entrada e o vetor peso feita por meio do
critrio da menor distncia (euclidiana) entre o vetor de pesos por ela armazenado e o vetor
de entrada, matematicamente expresso pela equao 5.

i ( x) = arg min x w j

j = 1,2,...n

(5)

Onde i(x) a representao do neurnio da entrada x, e wj o vetor peso;


Entre as funes de distncias utilizadas para quantificar a semelhana entre os vetores da
rede e, portanto, o quanto eles se aproximam do vetor de dados apresentado, uma das mais
empregadas a distncia Euclideana (DE ), definida pela equao 6.

DE = ( x1 y1 ) 2 + ( x2 y2 ) 2 + ... + ( xn y1n ) 2

(6)

Onde xn so as coordenadas dos vetores de entrada e yn so as coordenas dos vetoresprottipo (pesos das redes auto-organizveis).
Outros tipos de distncias que podem ser citadas a similaridade mtrica de Minkowski, e
distncia de Manhattan respectivamente, representadas pelas equaes 7 e 8.

18

DMinkowski =

yk

(7)

k =0

Distncia mtrica de Minkowski, citada como uma generalizao da mtrica euclidiana em


aplicaes na rea de psicologia.

DManhat tan = X Y

(8)

Distncia de Manhattan.
Na etapa cooperativa, so definidos os vizinhos dentro de uma distncia obtida a partir da
BMU (Best Matching Unit) obtida na primeira etapa, competitiva. Sumariamente o
processo de treinamento da rede, consiste na otimizao da distncia entre os neurnios.
Na minimizao das distncias definida a vizinhana topolgica por meio da
interatividade entre os neurnios (um neurnio ativado tende a excitar os neurnios em sua
vizinhana imediata). Cada atribuio de novos valores e distncias abrangendo toda a
rede chamada de poca. Pela repetio da adaptao de pesos (vetores-prottipo)
possvel determinar o melhor nmero de pocas de treinamento para cada matriz, o que
constitui a etapa adaptativa. Os neurnios nessa vizinhana so atualizados a cada iterao.

FIGURA 6 - Representaes das Etapas Competitiva e Cooperativa de treinamento da


SOM (VESANTO, 2009).
Na figura 6 so ilustradas a formao de vizinhana a partir do neurnio vencedor em
topologia hexagonal e retangular. Algumas opes de topologia podem ser vistas nas
figura 7 (triangular), figura 8 (quadrtica) e figura 9 (randmica).

19

FIGURA 7 Estrutura de SOM com topologia triangular (LCIS, 2011).

FIGURA 8 Estrutura de SOM com topologia quadrtica (LCIS, 2011).

FIGURA 9 Estrutura de SOM com topologia randmica (LCIS, 2011).

20

4. METODOLOGIA
No presente trabalho so aplicados os mapas auto-organizveis na anlise de dados fsicoqumicos de guas que abastecem estaes de tratamento de gua da Sabesp relativas a
algumas unidades de gerenciamento hdrico do Estado de So Paulo.
Uma avaliao inicial das caractersticas desse conjunto de dados mostrou interessante
potencialidade na aplicao da ferramenta para a busca de padres de comportamento e
correlaes. Como estratgia, o banco de dados foi analisado visualmente em busca de
eventuais falhas ou defeitos na seqncia dos dados que pudessem dificultar a aplicao
da ferramenta. Essa avaliao discutida mais adiante.
4.1 Caractersticas dos parmetros fsico-qumicos
A despeito de existirem parmetros definidos em legislao (CONAMA,MS, 2005) para a
qualidade de gua distribuda para consumo humano, essa qualidade por si s e
independente de qualquer referncia legal, deve garantir a propriedade para o consumo.
Parmetros como concentrao de metais, de substncias orgnicas, caractersticas
organolpticas (sabor, odor e cor), acidez/basicidade, presena de coliformes
termotolerantes, constituem a maior parte do conjunto das referncias legais a serem
atendidas. Com a finalidade de tornar mais prtico e gil a avaliao da qualidade da gua,
alguns organismos de regulao e/ou controle adotam ndices de qualidade, considerandose somente uma frao desses parmetros. A Companhia Ambiental do Estado de So
Paulo, CETESB, (CETESB, 2008), por exemplo, adota os seguintes parmetros para
compor o ndice de qualidade de gua bruta para fins de abastecimento pblico, IAP:
temperatura da gua, pH, oxignio dissolvido, demanda bioqumica de oxignio,
coliformes termotolerantes, nitrognio total, fsforo total, resduo total, turbidez, teste de
Ames genotoxicidade, potencial de formao de trihalometanos PFTHM, nmero de
clulas de cianobactrias, cdmio, chumbo, cromo total, mercrio, nquel, ferro, mangans,
alumnio, cobre e zinco. Esses parmetros apresentam itens comuns com os adotados pela
National Sanitation Foundation (NSF, 2008) e pela Comunidade Europia (Comunidade
Europia, 1998).

21

Embora a relao disponibilidade/demanda seja positiva em muitas regies do Estado de


So Paulo, no h como distribuir gua para consumo sem algum tipo de tratamento. As
estaes de tratamento de gua, ETA, realizam esse tratamento configurando as condies
das diversas etapas do processo em funo entre outras, das caractersticas da gua captada
(gua bruta) e da projeo da qualidade da gua final que dever atender legislao. Em
funo da forte correlao entre as caractersticas (rio, poo subterrneo, geomorfologia,
clima, entre outras) dos locais de captao e as caractersticas fsicoqumicas da gua
(COTRIM, 2006), cada ETA, em maior ou menor grau, apresenta uma identidade prpria
que define, ento, o melhor processo para tratamento da gua. A aquisio dos dados
inicialmente realizada por meio de relatrios pblicos disponibilizados pela CETESB,
(CETESB, 2001) os resultados so dispostos em formato de planilhas e expressos em
valores ou em estimativas, conforme tabela no anexo 1.
4.1.2 Organizao do Banco de Dados
Conceitualmente matrizes ambientais so colees de resultados multidimensionais
dinmicos de perfis comportamentais de constituintes de interesse legal. (CARVALHO,
2003).
Em anlises temporais, so comumente denotadas as dificuldades quanto variabilidade
dos processos, e mencionadas como um limitante e at gerador de incertezas para as
interpretaes.
No intuito de se suprir estas dificuldades atualmente empregada uma gama variada de
ferramentas matemticas e estatsticas propostas para manipulaes de dados com a
preservao das informaes relevantes. No entanto h restries quanto interpretao
dos resultados devido natureza dos dados originais e incompatibilidades das ferramentas.
Os mapas auto organizveis consistem em tcnica RNA de reconhecimento de
correlaes e inter-relaes em bancos multidimensionais e mesmo sendo uma tcnica de
RNA tambm possui a restrio aos dados originais. No presente trabalho, h a imposio
de uma limitao lgica restringindo sobremaneira a manipulao e transformao dos
dados de interesse. Originalmente a obteno dos dados foi realizada para o atendimento a
um requisito legal (CONAMA 357 e atualizaes e Decreto Estadual 8468/76). So

22

resultados de anlises qumicas que, por conseguinte, so limitados tecnolgica, financeira


e operacionalmente. No processo de excluso dos valores do banco de dados original
proposto para o presente trabalho so apresentados os critrios adotados, admitindo-se que
por razes do comprometimento final da anlise, haja condies que garantam a qualidade
da integridade:
Descontinuidade da anlise ou alterao temporal do parmetro, gerando truncamento na
seqncia;
Grande quantidade de valores faltantes, originando em vazios de dados;
Grande quantidade de valores inferiores aos limites impostos pelas tcnicas analticas.
Resumidamente o modelo de controle da qualidade da gua adotado para o abastecimento
pblico, pode ser compreendido como a adaptao de processos para o atendimento de
critrios de interesse legal visando o estabelecimento de novos critrios, a anlise crtica e
desenvolvimento de novas metodologias. (COTRIM, 2006)
A CETESB realiza a monitorao do ndice de qualidade de gua atualmente em 22
Unidades de Gerenciamento de Recursos Hdricos (UGRH), em aproximadamente 136
pontos de coleta subdivididos conforme tabela 1.

23

TABELA 1 - Pontos de coleta com sua respectiva numerao.


UGRHI 01

MANTIQUEIRA

UGRHI 02

PARABA DO SUL

UGRHI 03

LITORAL NORTE

UGRHI 04

PARDO

UGRHI 05

PIRACICABA, CAPIVARI E JUNDIA


-Bacia do Rio Capivari.
-Bacia do Rio Jundia.
-Bacia do Rio Piracicaba.

UGRHI 06

ALTO TIET

UGRHI 07

-Bacia do Rio Tiet Alto Cabeceiras.


-Bacia do Reservatrio Billings.
-Bacia do Reservatrio Guarapiranga.
-Bacia do Rio Cotia.
-Bacia do Rio Tiet Alto - Zona
Metropolitana.
BAIXADA SANTISTA

UGRHI 08

SAPUCA/GRANDE

UGRHI 09

MOGI-GUAU

UGRHI 010

SOROCABA/MDIO TIET
Bacia do Rio Tiet Mdio-Superior
Bacia do Rio Sorocaba

UGRHI 011

RIBEIRA DE IGUAPE/LITORAL SUL

UGRHI 012

BAIXO PARDO/GRANDE

UGRHI 013

TIET/JACAR

UGRHI 014

ALTO PARANAPANEMA

UGRHI 015

TURVO/GRANDE

UGRHI 016

TIET/BATALHA

UGRHI 017

MDIO PARANAPANEMA

UGRHI 018

SO JOS DOS DOURADOS

UGRHI 019

BAIXO TIET

UGRHI 020

AGUAPE

UGRHI 021

PEIXE

UGRHI 022

PONTAL DO PARANAPANEMA

Fonte: Relatrio CETESB 2001.

24

4.1.3 Caractersticas das Unidades de gerenciamento de Recursos hdricos


Para o presente trabalho foram utilizados dados pblicos de cinco unidades de
gerenciamento de recursos hdricos das regies de Mantiqueira, Paraba do Sul, Pardo,
Capivari e de Biritiba Mirim, no estado de So Paulo. Estes pontos foram selecionados
inicialmente sem a utilizao de critrios pr - estabelecidos.
A unidade de gerenciamento de recursos hdricos 01 (UGRH), da regio de Mantiqueira
est localizada a leste do estado de So Paulo, composta por 3 municpios e tem como
principais atividades: agricultura e industrial com proximidade a UGRH 02 da regio de
Paraba do Sul.
Na figura 10 so mostradas as localizaes da UGRH 01, e UGRH 02 de acordo com as
delimitaes da CETESB.

FIGURA 10 Mapa da Localizao geogrfica da UGRH 01, regio de Mantiqueira e


UGRH 02, regio de Paraba do Sul (CETESB, 2001).

25

A UGRH 04 est situada ao Norte do estado de So Paulo, composta por 23 municpios,


e tem como principais atividades o desenvolvimento agrcola e de segmentos industriais,
apresentada na figura 11.

FIGURA 11 Mapa da localizao geogrfica da UGRH 4 Rio Pardo (CETESB, 2001).

A UGRH 05 est localizada na regio metropolitana do estado So Paulo composta por


57 municpios e h nessa regio intensa atividade industrial, conforme os relatrios da
CETESB.

26

FIGURA 12 Mapa da localizao geogrfica da UGRH 05, regio de Piracicaba,


Capivari e Jundia (CETESB,2001).
E a UGRH 06 de acordo com a subdiviso adotada pela CETESB das bacias hdricas, para
avaliao da qualidade da gua, a distribuio da UGRH est localizada na regio
metropolitana, composta por 34 municpios e intensa atividade industrial, como atividade
primria desenvolvida, como observado na figura 13.

27

FIGURA 13 Mapa da localizao geogrfica da UGRH 06, regio do Alto Tiet


(CETESB, 2001).

Com a adoo de uma coleta de amostra bimensal em um perodo de 9 anos ao todo (2000
a 2008), portanto com um tamanho amostral 54 dias. Na anlise dos resultados das coletas
h informaes de 43 indicadores (parmetros fsicos, qumicos, hidrobiolgicos,
microbiolgicos e ecotoxicolgicos) utilizados segundo relatrios (CETESB, 2000).
A restrio do nmero de parmetros avaliados no presente trabalho est na capacidade de
correlao e de interpretao final dos resultados pelo analista e imposta como medida de
controle no desempenho da ferramenta.
Na tabela 2 est uma descrio sumaria dos aspetos de relevncia para o presente trabalho
dos parmetros, dispostos em grupos conforme a terminologia adotada pela CETESB.

28

TABELA 2 Descrio de parmetros.


I. Parmetros fsicos

Descrio

(campo)
Potencial hidrogeninico
(pH)

Grupo de parmetros de importncia para sustentabilidade

Temperatura do ar

do meio aqutico e tambm utilizados em correlaes para

Temperatura da gua

identificao de possveis fontes de contaminaes

Turbidez

antropogenicas (fontes de poluentes de origem humana).

Condutividade

* A condutividade em especfico uma expresso


numrica da capacidade de conduo de corrente eltrica
na gua, e pode sofrer influncias das concentraes
inicas e da temperatura.

II. Parmetros qumicos

Descrio

OD

Para controle de processos em sistemas aquticos naturais e

DBO

de uso em estaes de tratamento para o estabelecimento

DQO

de condies mnimas para a manuteno do meio


aqutico.

III. Compostos inorgnicos

Descrio

Cloreto

Indicadores de toxidez possuem relao com outros

Fenis

parmetros tais como: pH, temperatura da gua e turbidez

Fsforo

so de interesse legal (tanto para avaliao como o

Mangans

cumprimento da legislao vigente), e em alguns casos


possuem associao com produtos oriundos de atividades

NKT

humanas (contaminante antropogenico). * Obs: o

Nitrognio Kjeldahl total

nitrognio Kjeldahl total um parmetro obtido por meio


de cculo, pela soma das formas de nitrognio orgnico e
amoniacal, oriundos de atividades biolgicas naturais, e
utilizado na avaliao do nitrognio disponvel para as
atividades biolgicas

Fonte - COTRIM, 2006

29

A coleta em diferentes perodos realizada para a incluso de dados com diferenas


sazonais, (perodos de chuva e seca) com o objetivo da incorporao de um modelo real o
qual demonstra as alteraes dos dados por influencias externa.
A denominao perodos de seca e de chuva so classificaes adotadas conforme o ndice
de precipitao pluviomtrica (parmetro no utilizado) e das variaes de temperaturas e
so correlacionadas com as estaes do ano.
A variao dos resultados amostrais dos parmetros fsico-qumicos referentes s UGRHs
correspondentes apresentada no anexo B conforme os resultados das anlises fsicoqumicas mostradas em tabela no anexo A.
4.1.4 Implementao da Metodologia SOM.
O processo de implementao do sistema de anlise dos dados ambientais utilizando o
SOM realizado seguindo etapas de formatao e insero dos dados nas bases de
treinamento, conforme o diagrama apresentado na figura 14.

FIGURA 14 - Diagrama da formatao da base de dados.


Inicialmente a escolha das variveis que seriam utilizadas no estudo seguiu o critrio do
uso do maior nmero de variveis aptas a serem inseridas numericamente na rede SOM, de
forma a possibilitar a investigao do mais amplo espectro de possveis correlaes. A

30

formatao dos dados uma etapa fundamental e necessria para a correta utilizao da
ferramenta de anlise a ser utilizada: MATLAB (MATHWORKS, 2004),
Na organizao dos dados em formato de planilhas eletrnicas consideram-se o ponto de
coleta, data da anlise, e os parmetros fsico-qumicos que sero descritos adiante. Depois
de formatada a planilha transportada para o espao de trabalho do MATLAB por meio de
um plug-in (programa adicional ao Matlab) chamado de Excel Link que possibilita a
transformao da planilha em uma matriz multidimensional que pode ento ser manipulada
e trabalhada pelas funes do Matlab e pelo toolbox SomToolbox (SOM TOOLBOX,
2005). A partir deste conjunto de funes possvel escolher uma seqncia de comandos
que efetuaro as etapas necessrias ao treinamento da rede neural Som que gerar como
sada o chamado Mapa de Prottipos ou Mapa de Kohonen. Este aplicativo adicional
(Excel Link) possibilita uma conexo gil e interativa entre os dois programas (Excel e
Matlab) de forma que se possa atualizar e fazer a anlise pretendida com matrizes
multidimensionais.
O SOM Toolbox possui uma interface visual que possibilita a escolha dos parmetros de
treinamento, incluindo o erro almejado. A rede neural ento treinada e aps a verificao
dos parmetros de qualidade do treinamento, possvel a visualizao dos resultados
iniciais que podem ser avaliados de acordo com grficos gerados pelo prprio aplicativo,
onde se pode avaliar com grande agilidade o grau de interrelao entre as variveis
utilizadas.
A figura 15 apresenta um diagrama de blocos das etapas do procedimento executadas no
programa MATLAB com o recurso do SOM Toolbox.

31

FIGURA 15 - Procedimento realizado do transporte das variveis para a gerao de


resultados no SOM Toolbox.
4.1.5 Descrio do procedimento utilizado para o treinamento do SOM.
O procedimento do treinamento do SOM inicialmente realizado com o transporte e
transformao da planilha eletrnica previamente organizada em uma matriz bidimensional
no espao de trabalho do programa Matlab pelo Excel Link, como comentado na insero
dos dados.

A partir de uma varivel gerada pertencente a uma classe do Matlab

denominada data struct que tem como funo o armazenamento da estrutura de


informaes presentes na planilha original. A varivel pode armazenar outras variveis
como, por exemplo: double", inteiro, string e outras, concatenadas por campos que
definem diferentes tipos de informao de interesse. O toolbox Somtoolbox tem funes
de treinamento que atuam diretamente sobre este tipo de varivel. Por meio do comando:

>>Smatrix = som_data_struct(matrix);
A matriz matrix importada pelo Excel Link para o espao de trabalho do Matlab
transformada em (Smatrix), varivel da classe estrutura e abriga em si campos de
informao apropriados (mesmo que inicialmente vazios), para a manipulao pela funo
de treinamento da rede presente no Somtoolbox. Na etapa de normalizao da matriz de
dados, etapa necessria otimizao do treinamento da rede, possibilitando com que o
algoritmo de treinamento convirja mais rapidamente e ao mesmo tempo, que a sada possa

32

ser apresentada visualmente se comparando a variabilidade proporcional da varivel, e no


seus valores absolutos. Assim, o comportamento da varincia dos parmetros que compe
a base de dados pretende ser graficamente estabelecido, possibilitando uma rpida
observao de correlaes importantes. O algoritmo de treinamento da rede neural
minimiza a distncia entre os vetores-prottipo existentes em cada clula de rede SOM.
Experimentalmente definido, o processo de normalizao de dados para a presente matriz
denominado logistic e adotado pelos critrios de menor erro de quantificao e de
menor erro topogrfico. Esta normalizao obtida com o seguinte comando:

>>Smatrix = som_normalize(Smatrix,logistic);
Onde a varivel Smatrix normalizada escalando todos os vetores para valores no
intervalo entre zero e um de acordo com a funo logistic definida por duas operaes
algortmicas (iterativas) definidas nas equaes 9 e 10.

xescalado =

( xantigo mdia( xantigo ))

xnovo = 1

( xantigo )

(1 + exp( xescalado )

(9)

(10)

Aps a etapa de normalizao, inicia-se a identificao dos dados da matriz conforme os


parmetros fisico qumico e de abreviaturas que indiquem as regies e as informaes de
interesse como: regio e data de coleta, realizada pela modificao do campo label e
comp_names presentes na varivel estrutural Smatrix, por meio de comandos do tipo:

>>Smatrix.comp_names{1,1}=pH;

>>Smatrix.labels{1,1}=MANT1A;
Na compreenso das abreviaturas utilizadas na rotulagem dos vetores prottipos tomando
como exemplo, o elemento da matriz localizado na primeira linha e primeira coluna com o
rtulo MANT, referente ao ponto de coleta de Mantiqueira, 1, referente ao ano de
2001 e a letra A referente ao primeiro ms de coleta. Sistema de nomenclatura o qual

33

adotado para a rpida visualizao dos agrupamentos por pontos de coleta, anos e meses,
que so os vetores de entrada com 13 ordenadas identificados pelos parmetros fsico
qumicos.
Nas opes disponveis de mtodos de inicializao dos prottipos no Somtoolbox, h a
inicializao randmica (aleatria) ou a inicializao linear. A opo entre os
mtodos pode ser usada para definio de parmetros tais como de qualidade do
treinamento como a velocidade. No treinamento da rede h duas opes de algoritmos
diferentes disponveis: o treinamento seqencial ou o treinamento em batelada. Sendo que
a opo de treinamento de rede seqencial recomendada para grandes matrizes ou que
ofeream alguma dificuldade de processamento pelo custo computacional necessrio. No
presente projeto a escolha da inicializao foi randmica e com o treinamento dos dados
em batelada, devido s caractersticas da matriz de dados, que apesar de ampla no exigia
do algoritmo um tempo de treinamento muito prolongado que justificasse um treinamento
seqencial.
O treinamento tradicional de um SOM passa por duas etapas, uma primeira mais grosseira
denominada originalmente de rough onde um nmero inicial grande de raio de
vizinhana (neurnios vizinhos ao neurnio vencedor best match unit (BMU))
utilizado, modificando de uma s vez uma quantidade proporcionalmente alta dos
neurnios que compe a rede. Aps esta primeira etapa, segue-se a fase mais refinada
(finetuning) que utiliza um raio menor de vizinhana, modificando menos neurnios por
iterao. O treinamento da rede um processo contnuo de comparao entre os vetoresprottipos de cada neurnio e os vetores-amostra que compe a base de dados. Esta
comparao utiliza diferentes definies de distncia entre os vetores, e a mais utilizada
(default) a que utiliza a distncia euclidiana. Assim em iteraes sucessivas se encontra
o BMU e se modifica esta unidade e seus vizinhos de forma proporcional distncia
medida entre a a amostra e o prottipo. O comando bsico utilizado para iniciar o
treinamento :
>>Smatrixmap = som_make(Smatrix);
Utilizado com mais opes para alterar os modos e parmetros de treinamento na
verificao da qualidade do erro final de quantificao e do erro topogrfico, parmetros de

34

controle de qualidade da rede entre os parmetros existentes como definio do tamanho


da rede, especificao do nmero de pocas de treinamento e do treinamento das variveis
em batelada ou randmica, etc.
No relatrio do treinamento, so reportados os seguintes parmetros: tamanho do mapa
utilizado (dimenses da matriz de prottipos otimizada pelo algoritmo de acordo com o
tamanho da matriz de amostras e da variabilidade apresentada por ela), o nmero de pocas
de treinamento e o tempo de treinamento para cada fase de treinamento, rough e
finetune, o erro final de quantificao e o erro final topogrfico.
Ao final da etapa de treinamento da rede, na visualizao do mapa so apresentados os
mapas resultantes por meio do comando:
>> som_show (Smatrixmap);
Com o qual so gerados 13 mapas dos chamados componentes planos e um mapa, auxiliar
da matriz de distncia dos prottipos presentes em cada neurnio. Este comando tem
muitas possibilidades de utilizao, ativando diferentes formas de apresentao dos mapas
j treinados e presentes na varivel Smatrixmap. Pode-se visualizar desde as matrizes de
distncia vetorial representadas por umat, como tambm a seleo de variveis que se
deseje observar.
Entre as opes de visualizao e apresentao de resultados alm do comando descrito
acima pode se tambm, utilizar o comando para visualizao dos rtulos por distribuio
de freqncia:

>>som_show_add(label,Smatrixmap_freq):
Obtm-se a distribuio por freqncia, uma importante ferramenta para a rpida
visualizao do nmero de vetores presentes no mesmo grupo com seus referentes rtulos
e qual a freqncia por repetio no mapa, conforme exemplo na figura 34-a nos resultados
de mapa por distribuio por freqncia.

35

A matriz de distncias proporciona uma visualizao bidimensional das distncias mdias


entre cada varivel e um prottipo de vetor correspondente a cada neurnio.
A figura 16 mostra a ordem na qual os prottipos so arranjados no mapa SOM. O
tamanho do mapa otimizado pelo algoritmo e, no exemplo, as dimenses do mapa gerado
so 12 linhas por 7 colunas. A matriz de dados utilizada como entrada da rede tem 257
linhas por 13 colunas (parmetros).

13
14

2
3

25

15

27

17
6

33

23

34
35

24

68

59

80
81

70
71

61

78
79

69

60
49

66

57

47

76
77

67

58

48
36

55

45
46

64
65

56

74
75

63

54

44

62

53

43

32

22

10

12

30

20

51

41

73

61

52

42

31

21

11

28

18

39
40

29

19

26

16

50

38

82
83

72

84

FIGURA 16 Exemplo do ordenamento dos prottipos de vetores.

36

5.0 Resultados e Discusso


5.1 Apresentao dos resultados SOM
Na anlise dos mapas proposto um estudo comparativo do conjunto de mapas obtidos
aplicando ao mapa um algoritmo de agrupamento, para o reconhecimento do nmero de
clusters mais representativos presentes no mapa.
Na anlise dos dados, so empregadas diferentes estruturas de dados, em duas abordagens
distintas, inicialmente com uma matriz de 257 linhas agrupados em 13 parmetros
(ordenadas), com um total de 3341 elementos. E em uma abordagem posterior com uma
matriz de 257 linhas em 10 parmetros
Devido ao nmero de resultados para apresentao, no presente trabalho proposta uma
diviso em: Matrizes para estudo de similaridades entre pontos de coleta, Matrizes para
estudo de similaridades entre parmetros fisico-qumicos, e Grficos dos prottipos de
vetores no intuito de se proporcionar nas concluses um ordenamento.

5.2 Estudo de similaridades entre pontos de coleta.


Os prottipos de vetores de 13 ordenadas, (parmetros), inicializado randomicamente,
apesar de no se empregar pr-tratamento, os dados so normalizados, e treinados em 200
pocas. A escala de cores para visualizao dos clusters no mapa pode ser definida entre
opes disponibilizadas no toolbox (LCIS, 2011).
O tamanho do mapa auto-organizvel definido por critrios pr-estabelecidos no
algoritmo, com relao com o tamanho do banco de dados de treinamento. Alguns
parmetros para treinamento como o estudo de variao dos mesmos para otimizao do
erro final de quantificao e erro final de topogrfico, (parmetros utilizados para controle
de qualidade da rede e dos resultados), so experimentais.

37

A rotulagem dos prottipos realizada conforme a base de treinamento, no presente


trabalho adotam se as iniciais de acordo com as regies de coleta, ano da coleta e meses.
Alm da matriz de dados uma matriz de rtulos e treinada.
Aps o treinamento, na figura 17, apresentado o mapa da matriz de distncia entre
vetores como um dos resultados principais com tabelas auxiliares de legendas 3 a 5, para as
concluses finais.

U-matrix
MA8F RP5C RP0D RP0C RP0E RP0F RP2E
0.35
RP5D RP4C RP3C RP2D RP0A BM4F RP3B
MA8B MA7C RP7D

RP0B RP2F RP3F


0.3

MA7B BM1C PB0C PB6D BM0B BM2A BM0A


MA4A PB6C PB0D PB2C PB6E PB8E PB8D
MA1F PB3E PB3C PB4B PB2A PB8B PB6A
MA1C MA6D

PB4A PB3F PB3A PB1B

MA3B MA2F MA6E

PB4D PB5A PB0A

MA4F MA1B MA2D MA1A BM5F


MA3C
MA3F

0.25

0.2

PB7F

RC1C RC5C RC4E RC3A RC0B

0.15

RC0C RC1F RC5B RC6D

RC4C RC1D RC0D RC3D RC3E RC1E RC0A

0.1

FIGURA 17 - Mapa da matriz de distncia entre vetores com os rtulos.

38

TABELA 3 - Legenda para as regies de coleta:


Regio de coleta

Nome abreviado

Mantiqueira

MA

Biritiba Mirim

BM

Rio Capivari

RC

Rio Paraba

PB

Rio Pardo

RP

TABELA 4 - Legenda para os meses de coleta


Meses
*(perodo compreendido entre meses)

Letra

Janeiro - Fevereiro

Maro - Abril

Maio - Junho

Julho - Agosto

Setembro - Outubro

Novembro - Dezembro

* Obs: Aos meses so atribudos perodos conforme a data de amostragem diferenciada.

39

TABELA 5 - Legenda para os anos


Anos

Inicial abreviada

2000

2001

2002

2003

2004

2005

2006

2007

2008

Do mapa da matriz da figura 17 so gerados como sadas 84 prottipos de vetores em uma


topologia hexagonal de 7 colunas por 12 linhas, com o perfil mdio dos pontos de coleta
(prottipo de vetor gerado a partir dos dados de entrada).
Os erros de quantificao e topolgico obtidos experimentalmente so de 0.330 e 0.012
respectivamente (menores ndices apontados com o uso da funo de normalizao
logistic.)
Entre as opes de visualizao de resultado h a opo da apresentao dos componentes
planos juntamente com a matriz de distncia vetorial, nessa opo, os prottipos de vetores
podem ser visualizados individualmente conforme os parmetros, como apresentado na
figura 18.

40

U-matrix

0.376

PH

7.18

0.232

19.7

d
COND

FEN

0.00363

OD

7.74

3.86

7.27

0.054

Turbidez

DQO

0.24

18.3

49.5
32.8

2.03

0.457

4.52

52

14.3

NKT

2.87

0.125

0.0332

1.61

0.368

117

5.89

SOM 31-Mar-2011

DBO

0.241

0.00104

29.8
24.2

16

MN

0.00234
d

124

3.23

TAR

20.9

6.36

222

10.3
d

25.8

6.77

0.0891
CL

TAGUA

59.5

7.9

FIGURA 18 - Componentes planos gerados a partir da grande matriz.


Como pode ser observado na figura 18, no campo dos ttulos os nomes dos parmetros
fsico-qumicos so substitudos por iniciais abreviadas de acordo com a (tabela 6 Legenda
dos parmetros fsico-qumicos).

41

TABELA 6 Legenda de parmetros fsico qumicos


Lista de Parmetros fsico qumicos.
PH = Potencial hidrogenionico,
TAGUA = Temperatura da gua,
TAR = Temperatura do ar,
CL = Cloreto,
COND = Condutividade,
DBO = Demanda bioqumica de oxignio
DQO = Demanda qumica de oxignio,
FEN = Fenis,
P = Fsforo,
MN = Mangans,
NKT = Nitrognio Kjeldahl Total,
OD = Oxignio dissolvido
A escala de gradao (barra lateral) na figura 18, de cada mapa mostra a variao de cada
parmetro (no normalizado) de acordo com a base de treinamento.
Alm da matriz de distncia vetorial em estudo, gerada a matriz universal (U-matriz)
para complementao da anlise dos agrupamentos. Neste mapa so escolhidos os rtulos
relativos s melhores correspondncias (BMUs) entre o vetor e o prottipo da clula
(neurnio) da matriz. Assim, o mapa das BMUs apresentado na figura 19.

42

FIGURA 19 - Mapa indicativo dos rtulos caractersticos (BMUs) dos pontos de coleta na
matriz principal.

No presente trabalho a definio do melhor nmero de clusters distintos para o


agrupamento obtido pela funo mtrica Davies-Bouldin, com a aplicao de um
algoritmo de clusterizao (k-means) ao mapa e utilizando o nmero otimizado. Pode-se
visualizar clusters delimitados conforme a figura 20 do mapa, com rotulagem sobreposta
para destaque dos agrupamentos. (DAVIES, 1979)

43

FIGURA 20 - Mapa com rotulagem sobreposta para destaque dos grupos

Na figura 20 pode-se observar os cinco grupos em destaque em diferentes cores, apenas


para diferenciao dos clusters e para determinao de suas respectivas delimitaes.
Na matriz alterada so excluidos trs parmetros da matriz original de dados (Fenis, DQO
e DBO) resultando em uma nova matriz com as seguintes dimenses: 257 linhas em 10
colunas (total de 2570 elementos), a nova base de dados treinada conservando-se os
mesmos parmetros do primeiro experimento.
Nas sadas so gerados 80 prottipos de vetores (ver figura 21-c) e aps treinada a rede o
erro final de quantificao de 0.254, e o erro final topogrfico de 0.012.
Os novos resultados da matriz de distncia vetorial so apresentados com uso de diferentes
recursos como na figura 21-a por distribuio por frequencia e por distribuio por votao
na figura 21-b.

44

RP0C U-matrix
RP0A
RP5D
RP0F
RP2E
RP0E
RP0C(1)
RP0A(1)
RP5D(1)
RP0F(1)
RP2E(1)
RP0E(1)
RP3D
RP0D(1)
BIR2C
RP0B(1)
BIR0C(1)
RP2A(1)
RP6A(1)
RP2C(1)
RP6C(1)
BIR2C(1)
RP3D(1)
RP2B(1)
BIR0D(1)
RP3A(1)
RP6B(1)
RP4F(1)
RP7C(1)
BIR2D(1)
RP4D(1)
RP4E(1)
BIR1D(1)
RP5E(1)
RP6E(1) RP3B
RP6D(1)
BIR2E(1)
BIR6C(1)
BIR3C(1)
RP8A(1)
BIR3D(1)
RP3B(1)
RP7B(1)
RP7A(1)
MAN2D(1)
BIR5C(1)
BIR8D(1)
BIR7E(1)
RP8B(1) RP4B
BIR3E(1)
RP4A(1)
RP3EBIR6D(1)
RP8C(1)
RP8D(1)
BIR8E(1)RP2D
BIR8B(1)
BIR8C(1)BIR1E
RP5B(1)
RP4B(1)
RP3E(1)
RP4C
BIR6E(1)PAR0D
RP2D(1)
RP6F(1)
RP5A(1)
PAR0D(1)
RP4C(1)
RP7D(1)
BIR1E(1)
RP5F(1)
RP7E(1)
BIR6A(1)
MAN7C(1)
RP5C(1)
RP8E(1)
BIR4D(1)
BIR8F(1)
RP7F(1)
BIR7B(1)
BIR1C(1)
RP2F
PAR0C
RP3FPAR0E(1)
PAR1C
PAR6C
MAN7D
RP2F(1)
MAN4B
BIR6B(1)
RP3F(1)
PAR0C(1)
PAR1C(1)
PAR6C(1)
RP3C
MAN7D(1)
BIR1B(1)
MAN4B(1)
PAR1D(1)
BIR0E(1)
BIR4E(1)
BIR3F(1)
RP3C(1)
MAN8C(1)
BIR4F(1)
MAN6D(1)
BIR1A(1)
BIR7A(1)
BIR7F(1)
BIR4C(1)
BIR7D(1)
MAN1C
BIR8A(1)
BIR0A
MAN1C(1)
BIR0A(1)
PAR2C
PAR5D
BIR1F
MAN2A
MAN1E(1)
BIR2F(1)
PAR2C(1)
BIR6F
MAN6B
PAR5D(1)
BIR1F(1)
MAN2A(1)
MAN4D(1)
BIR4A(1)
PAR2D(1)
BIR6F(1)
MAN6B(1)
BIR0B(1)
BIR2B(1)
MAN2C(1)
MAN5C(1)
MAN1F
BIR4B(1)
BIR3B(1)
MAN6C(1)
PAR3C
MAN4A
MAN1F(1)
BIR5B(1)
MAN7A(1)
PAR8E
PAR3C(1)
MAN4A(1)
PAR3D
MAN3A(1)
PAR6B
PAR8E(1)
PAR5B(1)
MAN7B(1)
PAR3D(1)
MAN4C
MAN3B(1)
PAR6B(1)
PAR0A
BIR2A(1)
PAR6D(1)
MAN4C(1)
BIR5D(1)
PAR3E(1)
MAN4F(1)
BIR5A(1)
PAR0A(1)
PAR4ABIR3A(1)
PAR6E(1)
BIR5E(1)
PAR7D(1)
MAN5A(1)
PAR1A(1)
PAR4A(1)
PAR7C(1)
BIR7C(1)
MAN5B(1)
PAR1B(1)
PAR2A
PAR4B(1)
MAN1B
MAN2B
MAN6A(1)
PAR1E(1)
PAR2A(1)
PAR4C(1)
MAN1B(1)
MAN6E
PAR5C
MAN2B(1)
PAR1F(1)
PAR2F(1)
PAR5E(1)
MAN5E(1)
MAN6E(1)
PAR5C(1)
MAN8B(1)
PAR3B
PAR2B(1)
BIR0F(1)
PAR5F(1)
MAN8A(1)
MAN8F(1)
PAR3B(1)
MAN2E
PAR2E(1)
PAR7E(1)
PAR0F
MAN4E
PAR4E(1)
MAN2F
MAN2E(1)
PAR6A(1)
PAR8C(1)
PAR0F(1)
MAN4E(1)
PAR4F(1)
PAR3F
PAR4D
BIR5F
MAN2F(1)
MAN3C(1)
PAR8A(1)
PAR3A(1)
MAN7E(1)
PAR7A(1)
PAR3F(1)
PAR4D(1)
BIR5F(1)
MAN5F(1)
MAN3D(1)
PAR5A(1)
MAN7F(1)
PAR7B(1)
MAN6F(1)
MAN3E(1)
PAR6F(1)
MAN8E(1)
PAR8B(1)
MAN8D(1)
MAN1D
PAR8F(1)
PAR0B
CAP1C
PAR8D
MAN1A
CAP8B
MAN1D(1)
PAR0B(1)
CAP1C(1)
PAR8D(1)
MAN1A(1)
CAP8B(1)
MAN3F(1)
PAR7F(1)
CAP2A(1)
MAN5D(1)
CAP1F
CAP0C
CAP6D
CAP1F(1)
CAP2F
CAP0C(1)
CAP6D(1)
CAP2C(1)
CAP2F(1)
CAP1D(1)
CAP6F(1)
CAP5B(1)
CAP0B
CAP3E
CAP7D(1)
CAP0A
CAP6B(1)
CAP0B(1)
CAP1E
CAP3E(1)
CAP0D
CAP4C
CAP0A(1)
CAP2D
CAP2B(1)
CAP1E(1)
CAP5A(1)
CAP0D(1)
CAP4C(1)
CAP0E
CAP1A(1)
CAP2D(1)
CAP3A(1)
CAP2E(1)
CAP5E(1)
CAP3C(1)
CAP5C(1)
CAP0E(1)
CAP1B(1)
CAP4D(1)
CAP4A(1)
CAP3B(1)
CAP5F(1)
CAP3D(1)
CAP7C(1)
CAP0F(1)
CAP3F(1)
CAP6C(1)
CAP4E(1)
CAP7A(1)
CAP6E(1)
CAP4B(1)
CAP8C(1)
CAP6A(1)
CAP8D(1)
CAP4F(1)
CAP7F(1)
CAP7E(1)
CAP5D(1)
CAP8E(1)
CAP8A(1)
CAP7B(1)
CAP8F(1)

0.4

0.35

0.3

0.25

0.2

0.15

0.1

SOM 19-Apr-2011

FIGURA 21-a - Apresentao do mapa das distncias vetoriais, por distribuio de


frequencia de rtulos, da matriz modificada (257 linhas por 10 parmetros)

45

U-matrix
0.4
RP5D

BIR2C

RP3D

BIR1E

MAN7D

RP0C

RP4C

MAN4B

RP3E

RP0E

PAR0D

PAR6C

RP3C

RP0F

RP0A

RP2D

PAR1C

RP2E

RP3B

RP4B

RP2F

PAR0C

0.35

RP3F
0.3

MAN1C

MAN1F

MAN6B

MAN4C

MAN2B

MAN2A

MAN4A

MAN1B

BIR6F

PAR3D

MAN6E

PAR2C

PAR3C

PAR5C

PAR5D

PAR8E

PAR4A

BIR1F

BIR0A

PAR6B

0.25

PAR2A

PAR0A
0.2

MAN2E

MAN4E

MAN2F

MAN1D

BIR5F

CAP1C

CAP0C

PAR4D

CAP8B

CAP1F

PAR3F

PAR3B

MAN1A

CAP6D

PAR0F

PAR8D

PAR0B

CAP0E

CAP0B

0.15

CAP2F

0.1
CAP4C

CAP2D

CAP0D

CAP3E

CAP1E

CAP0A

SOM 19-Apr-2011

FIGURA 21-b - Apresentao por votao do mapa das distncias vetoriais com os rtulos
da matriz modificada (257 linhas por 10 parmetros).

46

labels
RP5D BIR2C RP3D RP0C RP0E
U-matrix

0.407

RP0A

RP0F

RP3E PAR0D RP2D RP4B

BIR1E RP4C

RP2E
RP3B

MAN7D MAN4B PAR6C RP3C PAR1C PAR0C RP2F

RP3F

MAN1C MAN6B MAN2A BIR6F PAR2C PAR5D BIR1F BIR0A


MAN1F MAN4C MAN4A PAR3D PAR3C PAR8E PAR6B
0.237
MAN2B MAN1B MAN6E PAR5C PAR4A PAR2A

PAR0A

MAN2E MAN4E MAN2F BIR5F PAR4D PAR3F PAR3B PAR0F


CAP1C CAP8B MAN1A

MAN1D
0.0664

PAR8D PAR0B

CAP0C CAP1F CAP6D CAP2F


CAP4C CAP2D CAP0D CAP3E CAP1E CAP0A CAP0E CAP0B

SOM 19-Apr-2011

FIGURA 21-c - Apresentao do mapa das distncias vetoriais com o mapa geral rotulado
obtido da matriz modificada (257 linhas por 10 parmetros)

5.3 Estudo de similaridades entre parmetros fisico-qumicos.


Na reorganizao da disposio inicial da matriz em uma disposio transposta, a ordem de
insero alterada, resultando em uma matriz de 13 linhas por 257 parmetros, para
anlise de correlaes entre os parmetros fsicos qumicos,
Priorizando a anlise dos parmetros, no so gerados os mapas dos componentes planos.
O reordenamento proposto realizado no prprio Matlab por meio do comando:
>> Smatrixg = Smatrixg;
Onde a varivel Smatrixg a transposta de Smatrixg.

47

Na anlise da matriz inversa so estudadas as correlaes dos parmetros fsico qumicos


por meio do comportamento amostral, conforme figuras 22 e 23, e obtidos conservando os
parmetros iniciais de treinamento .

FIGURA 22 - Mapa geral rotulado obtido da matriz inversa.

48

FIGURA 23 - Mapa de distncia entre vetores da matriz transposta com os rtulos dos
parmetros fsico qumicos.

Na descrio figuras 22 e 23 os mapas gerados tm as seguintes caractersticas: dimenses


de 3 x 7 clulas, (figura 35) e 5 x 13(figura 36) com as condies iniciais mantidas o erro
final de quantificao de 0.530, e o erro topogrfico de 0.000
Na transposio da matriz alterada, gerada uma matriz de 10 linhas por 257 colunas, aps
o treinamento da base de dados, obteve-se como sada 14 prottipos de vetores em uma
topologia hexagonal com um erro final de quantificao de 0.530, e um erro final
topogrfico de 0.000.

49

U-matrix

P(1)
Mn(1)
NKT(1)

pH(1)
Cloreto(1)
OD(1)
1.5

Turbidez(1)
1

Temp.Agua(1)
Temp.Ar(1)

0.5

Condut.(1)

SOM 20-Apr-2011

FIGURA 24 - Mapa de distncia entre vetores da matriz transposta da matriz modificada


de 257 linhas por 10 parmetros.
Nos resultados do mapa da matriz modificada da figura 24, pode-se observar a
identificao dos clusters por meio dos rtulos. Para anlise e demonstrao das
similaridades por reconhecimento visual so extraidos do mapa os chamados codebooks.

5.4 Grficos dos prottipos de vetores


Os codebooks consistem no conjunto de prototpos de vetores gerados e treinados no
algoritmo. No presente trabalho, eles so obtidos nas clulas rotuladas, utilizando-se como
critrio de escolha as informaes do prprio mapa.
O estudo dos codebooks por meio de grficos pode proporcionar, em uma rpida
visualizao, a relao de similaridade entre os dados de entrada e as sadas geradas no
algortmo para a definio do perfil mdio dos parmetro por regio.
No programa Matlab a extrao do codebook e a plotagem do grfico realizada por meio
dos comandos:

50

>> figure;plot(PMnNKT);
>> pHCLOD = Sgminvmap_freq.codebook(11,:);
Os grficos so gerados conforme o tamanho da matriz (nmero de amostras) e a
normalizao, como mostrados nas figuras 25 a 29.

PMnNKT

0.44

0.42

0.4

0.38

0.36

0.34

0.32

0.3

50

100

150

200

250

300

FIGURA 25 - Grfico do prottipo de vetor mais caracterstico do cluster nomeado


PMnNKT.

51

pHCLOD

0.43

0.42

0.41

0.4

0.39

0.38

0.37

0.36

50

100

150

200

250

300

FIGURA 26 - Grfico do prottipo de vetor mais caracterstico do cluster nomeado


pHCLOD.

Temperaturas
0.75

0.7

0.65

0.6

0.55

0.5

0.45

50

100

150

200

250

300

FIGURA 27 - Grfico do prottipo de vetor mais caracterstico do cluster nomeado


Temperaturas.

52

Condutividade

0.9

0.85

0.8

0.75

0.7

0.65

0.6

0.55

0.5

0.45

50

100

150

200

250

300

FIGURA 28 Grfico do prottipo de vetor mais caracterstico do cluster nomeado


Condutividade.

Turbidez

0.75

0.7

0.65

0.6

0.55

0.5

0.45

0.4

50

100

150

200

250

300

FIGURA 29 - Grfico do prottipo de vetor mais caracterstico do cluster nomeado


Turbidez.

53

Cada grfico de prottipo de vetor nomeado de acordo com rtulo correspondente


separadamente, como pode ser observado h uma aglutinao de at trs parmetros.
Capivari

0.9
0.85
0.8
0.75
0.7
0.65
0.6
0.55
0.5
0.45
0.4

10

FIGURA 30 - Prottipo de vetor obtido a partir da matriz modificada referente aos dados
da regio do Rio Capivari.
PAR8D
0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

10

FIGURA 31 - Prottipo de vetor obtido a partir da matriz modificada referente


aos dados da regio do Rio Paraba da coleta do dia 19/08/2008.

54

RP0E
0.9

0.85

0.8

0.75

0.7

0.65

0.6

0.55

0.5

0.45

0.4

10

FIGURA 32 - Prottipo de vetor obtido a partir da matriz modificada referente aos dados
da regio do Rio Pardo da coleta do dia 03/10/2000.

55

6.0 CONCLUSES.
6.1 Matrizes para estudo de similaridades entre pontos de coleta.
Nos mapas de distncia vetorial nas figuras 21-a 21-b e 21-c, pode-se observar clusters
com prottipos mais prximos como observados na escala lateral (0,1 a 0,20) associados
aos pontos de coleta das regies do Rio Pardo, Rio Paraba do sul como BMUs sugerindo a
proximidade de comportamento destes prottipos.
Nos prottipos do cluster denominado Rio Paraba (PB), h a proximidade dos prottipos
associados aos perodos referentes aos ltimos meses de coleta, e com distribuio
proporcional correspondente aos 8 anos de coleta.
No cluster h 22 clulas (ver figura 20) com uma rea de aproximadamente 26% da rea do
mapa. Na interpretao da proximidade, observa-se um padro dos prottipos referentes
aos ltimos meses, que podem indicar a relao de sazonalidade nos perodos de coleta e a
distribuio proporcional no perodo compreendido.
Tambm observado no mesmo grupo a presena de dois prottipos rotulados BM2A e
BM0A referentes regio de Biritiba Mirim respectivamente dos anos de 2002 e 2000 do
ms de Janeiro que podem indicar correlao entre pontos distintos de coleta.
O comportamento dos prottipos do cluster denominado Rio Pardo (RP), sugere
associaes com referncia aos perodos dos ltimos meses de coleta e aos anos iniciais.
Com 14 clulas, esse grupo possui aproximadamente 16,67% da rea do mapa, e tambm
apresenta uma correlao com a regio de Biritiba Mirim no ms de Maro, como
observado na clula BM0B.
Na interpretao da proximidade de prottipos do cluster Rio Pardo, h caractersticas de
sazonalidade e de similaridade no perodo inicial de coleta.
No cluster de Mantiqueira (MA), h uma distribuio proporcional dos prottipos de
vetores referentes ao perodo integral respectivo de coleta, sem constatao de

56

predominncias, e com a repetio dos ltimos meses de coleta (sazonalidade). Ocupa


aproximadamente 20,4% da rea do mapa.
No cluster de Rio Capivari (RC), tambm h uma distribuio proporcional dos prottipos
de vetores referentes ao perodo integral de coleta sem predominncias, apresentando
repetitividade referente aos ltimos meses de coleta (sazonalidade). Apresenta uma rea de
aproximadamente 23% do mapa, com correlao com a regio de Biritiba Mirim do ms de
dezembro do ano 2005.
H em um cluster em especfico com correlaes entre os pontos de coleta referentes s
regies de: Biritiba Mirim (BM), Rio Pardo (RP), e Mantiqueira (MA). Na distribuio dos
prottipos deste cluster, pode-se observar a proporcionalidade referente aos meses de
coleta, e a predominncia referente aos ltimos anos de coleta. Observa-se a
dessemelhana observada em comparao aos quatro outros clusters.
Para a compreenso da similaridade e das possveis contribuies entre os pontos de coleta
nos corpos hdricos, realizado um estudo comparativo com o mapa do estado de So
Paulo e das delimitaes das UGRHs obtido nos relatrios da CETESB.

57

FIGURA 33 - Mapa do estado de So Paulo com as 22 UGRHIs organizadas em 11


grupos. (CETESB, 2001)

Conforme o mapa da figura 33, da regio de So Paulo, as 22 UGRHIs encontram-se


organizadas em 11 grupos delimitados, nos quais pode se observar os pontos de coleta
nos seguintes grupos:
UGRHI 01 Mantiqueira, 9grupo.
UGRHI 02 Paraba do sul, 9grupo.
UGRHI 04 Rio Pardo, 8grupo.
UGRHI 05 Capivari, 4 grupo.
UGRHI 19 Baixo Tiet (Biritiba Mirim), 6grupo.
Com base no mapa do estado de So Paulo, na figura 33, h proximidades entre as regies
de Mantiqueira, Paraba do Sul e Capivari. Devido s caractersticas semelhantes, h a

58

proximidade entre os clusters de forma semelhante apresentada figura 20. Assim como o
distanciamento entre a regio do Rio Pardo e a regio de Biritiba mirim (Baixo Tiet).
Na comparao entre os mapas da figura 33 e 20 possvel identificar o reconhecimento
das caractersticas geogrficas nos agrupamentos dos mapas SOM.
Esta propriedade denota uma vantagem do emprego da ferramenta tanto em classificao
de dados por grau de semelhana entre variveis como na classificao por semelhana
comparativa entre grupos demonstrados no mesmo resultado.

6.2 Matrizes para estudo de similaridades entre parmetros fisico-qumicos.


Na visualizao do mapa da matriz transposta nas figuras 22 e 23 pode-se notar um cluster
com prottipos mais prximos associados aos parmetros pH, Cloreto e OD como BMUs,
sugerindo a proximidade de comportamento destes prottipos, com um nmero total de 11
prottipos gerados.
H proximidades entre os prottipos associados aos parmetos Fsforo, Mangans e
Nitrognio Kjeldahl Total (NKT), localizados no canto superior do mapa. As temperatura
da gua e temperatura do ar esto localizados na parte inferior, e a Turbidez e
Condutividade, em reas isoladas.
Devido s caractersticas especificas dos parmetros Fenis DQO e DBO, decidiu-se fazer
um estudo com uma matriz de dados sem a utilizao destes parmetros. Eles
apresentavam valores constantes e erro indefinido e poderiam estar alterando treinamento
da rede. Este novo critrio aplicado para excluso dos trs parmetros foi descrito no
tpico 4.1.2 (Organizao do banco de dados).
No mapa da matriz alterada na figura 24 pode-se notar um cluster de prottipos prximos
como observados na escala lateral (0-0,8) associados aos parmetros pH, Cloreto e OD.
H tambm um comportamento semelhante observado no cluster de prottipos associados
aos parmetros Fsforo (P), Mangans (Mn) e NKT. A proximidade dos prottipos
associados aos parmetros Temperatura de gua e do ar est na escala lateral de variao

59

de 1-1,5. A Turbidez e a Condutividade encontram-se em reas isoladas distintas, um


comportamento comum dos dois parmetros tambm notado em outros mapas.

6.3 Grficos dos prottipos de vetores


Os grficos (Anexo B) so os comportamento amostrais dos parmetros no normalizados
e representam os dados de entrada do banco de dados. As figuras 25 a 29 dos grficos dos
prottipos de vetores, consistem no conjunto das sadas. Por meio da comparao entre
ambos, pode-se reconhecer reas similares.
A extrao dos prottipos de vetores e o reconhecimento por meio dos grficos dos
mesmos alm de ser um recurso adicional, demonstra os comportamento amostrais nas
caractersticas dos perfis mdios gerados.

6.4 Consideraes finais.


Em estudos aplicados a matrizes ambientais, os mapas auto organizveis de Kohonen se
mostraram como uma ferramenta til, na identificao de correlaes conhecidas e no
conhecidas, apresentando uma rpida visualizao dos resultados.
No estudo de classes de dados, o SOM demonstrou a adaptao do resultado aos
parmetros de treinamento definidos, com uma satisfatria representatividade de modelo.
Esta metodologia demonstrou sua eficincia e rapidez na anlise da base de dados da
qualidade da gua possibilitando visualizar correlaes de forma rpida e dinmica
Cabe ressaltar que h limitaes inerentes ao analista na interpretao de banco de dados
multivariados, na compreenso da correlao das variveis.
Nos aspetos operacionais, pode-se ressaltar a interatividade da interface do toolbox no
estabelecimento da comunicao com outros programas, a linguagem de fcil acesso, e a
possibilidade de manipulao da base de dados com agilidade.

60

Trabalhos Futuros
Devido ao potencial da ferramenta, a continuidade de trabalhos na avaliao de matrizes
ambientais com SOM est na certificao da ferramenta como instrumento indicativo para
determinao e estabelecimento de critrios e parmetros.
Tanto para satisfazer a necessidade de gerao de informao como base de dados como
para melhoria na qualidade do tratamento da gua por meio de obteno de novos ndices.

61

ANEXO - A Tabela dos valores dos parmetros fsico qumicos (perodo de 2000 a 2008)
Referente aos resultados dos 13 parmetros coletados nas UGRHs das cinco regies, organizados no formato de planilha
Valores dos parmetros fsico qumicos no perodo de 2000 2008.
pH

Temp.
gua

Temp.
Ar

Cloreto
Total

Condutividade

(5,20)

DQO

Fenis

Fsforo
Total

Mangans

NKT

OD

Turbidez

DBO

Ponto de coleta
Rio Pardo
Rio Pardo
Rio Pardo
Rio Pardo
Rio Pardo
Rio Pardo
Rio Pardo
Rio Pardo
Rio Pardo
Rio Pardo
Rio Pardo
Rio Pardo
Rio Pardo
Rio Pardo
Rio Pardo
Rio Pardo
Rio Pardo
Rio Pardo
Rio Pardo
Rio Pardo
Rio Pardo
Rio Pardo
Rio Pardo
Rio Pardo
Rio
RioCapivari
Pardo
Rio Pardo
Rio
RioCapivari
Pardo
Rio Pardo
Rio
RioCapivari
Pardo
Rio Pardo
Rio
RioCapivari
Pardo

Data
06/08/2003
04/12/2006
01/02/2000
01/10/2003
28/02/2007
04/04/2000
08/12/2003
11/04/2007
28/06/2000
11/02/2004
14/06/2007
29/08/2000
07/04/2004
08/08/2007
03/10/2000
16/06/2004
22/10/2007
20/12/2000
11/08/2004
03/12/2007
19/02/2002
25/10/2004
18/02/2008
22/04/2002
06/12/2004
09/04/2008
26/06/2002
12/06/2008
16/02/2005
07/08/2002
11/08/2008
06/04/2005
02/10/2002
15/06/2005
21/10/2008
10/12/2002
10/08/2005
11/01/2000
05/02/2003
24/10/2005
21/03/2000
09/04/2003
07/12/2005
09/05/2000
09/06/2003
15/02/2006
11/07/2000

U.pH

mg/L

S/cm

mg/L

mg/L

mg/L

mgP/L

mg/L

mgN/L

mgO2/L

UNT

6,2
6,7
7,2
5,7
6,6
7,1
5,5
6,8
7,2
6,7
6
7
6,9
5,9
7,1
6,38
6,3
6,8
6,66
6,1
7
7,4
7,7
7,3
7,12
7,2
6,8
6,9
7
7
6,7
6,4
6,6
6,7
6,3
6,7
6,9
7,5
6,8
6,8
7
6,4
6,9
7,3
6,3
6,3
7,2

18,3
27
24
19,7
25,5
23
25
26
19
24,8
21,4
21
23,9
19,4
23
19,3
25,5
25
19,3
28
26
23,7
25,9
25
24,4
20
21
25
24,9
20
24
25,4
24
22,8
20
22
19
25
24,7
26
25
25
23,2
21
21,3
27
17

32
25
27
28,5
29
25
28
30
28
31
28
24
27,5
26
30
22,5
28
28
23
34
32
28,5
29
30
30
29
30
27,5
24,4
29
33
31
33
22
25
29
20
29
29
31
31,5
24,5
21
25,5
36
21

2,3
2,5
2,5
2,5
2
2,5
3,5
2
3,5
2,5
3
1,5
3
4
2,5
3
4,5
2,5
3
4
2,5
1,5
3,5
1,4
2
2
1,5
2,5
3,3
2,5
2,4
3
2,3
2,5
3,5
1,4
9
2,5
7,8
2
2,5
2,24
16,3
3,5
21,8
3

66,4
50,5
54
52,9
57,1
53
63,6
55,1
51
52,5
57,8
55
49,2
53,8
70
53
57
62
54,2
63,4
55
55,7
48,1
52
54,8
48
56
50,2
54,7
53,9
53,1
58,2
65,3
56,1
52,2
98,28
57,5
157
63,7
57,4
150
55,4
59,6
232
57,8
55,1
278

2
3
2
3
2
3
2
3
2
3
2
4
3
2
2
2
2
2
3
2
3
2
2
3
2
2
2
4
2
2
3
2
3
6
2
11
2

50
21
50
17
50
50
50
50
50
50
50
50
50
50
50
50
50
50
50
50
50
50
50
50
50
42
50
50
18
50
50
18
50
50
15

0,003
0,003
0,003
0,001
0,003
0,003
0,001
0,003
0,003
0,001
0,003
0,003
0,001
0,003
0,003
0,002
0,012
0,003
0,002
0,003
0,003
0,002
0,003
0,003
0,002
0,003
0,002
0,003
0,003
0,003
0,003
0,003
0,003
0,003
0,004
0,003
0,003
0,005
0,003
0,003
0,003
0,003

0,029
0,035
0,005
0,024
0,046
0,058
0,077
0,01
0,039
0,049
0,034
0,046
0,045
0,037
0,003
0,053
0,01
0,069
0,037
0,14
0,063
0,058
0,039
0,003
0,082
0,043
0,08
0,016
0,093
0,016
0,007
0,062
0,113
0,021
0,009
0,023
0,018
0,332
0,077
0,02
0,18
0,063
0,261
0,06
0,026
0,244
0,41

0,04
0,14
0,03
0,06
0,06
0,06
0,02
0,06
0,03
0,02
0,06
0,04
0,02
0,04
0,03
0,06
0,02
0,04
0,05
0,0568
0,05
0,04
0,0488
0,05
0,04
0,0233
0,05
0,02
0,0111
0,05
0,04
0,0502
0,03
0,05
0,02
0,28
0,05
0,04
0,21
0,06
0,04
0,16
0,03
0,05
0,27

0,25
0,21
0,39
0,11
0,33
0,56
0,26
0,41
0,19
0,33
0,6
0,31
0,15
0,31
0,22
0,2
0,49
0,38
0,81
0,34
0,26
0,1
0,03
0,27
0,36
0,03
0,27
0,16
0,18
0,15
0,24
0,49
0,15
0,18
1,41
0,28
1,3
0,2
1,25
0,98
0,13
0,33
2
0,17
0,49
2,5

5,5
7,8
6,8
7,5
7,1
7,2
6,5
6
9,5
6,4
7,8
8,5
7,6
6
9
8,2
7
7,4
7,7
6,3
6
6,5
7,8
7
8,7
7
7,7
7,3
6,06
6,2
7,8
6,7
7,6
7,6
8,7
5,8
7,8
5,4
6,6
7,7
7,6
6,2
6,4
6,1
7
8,4
4,5

4,5
15
55
30
3
35
35
20
5
3,82
80
4
5,75
20
5
6,12
10
20
10,2
3
35
21,6
10
10
52,3
20
1
4,83
15
1
2,2
15
3
1,48
10
15
200
15
40
13
5
15
6,3
18
5
45
15

Rio
RioCapivari
Pardo

05/04/2006
19/09/2000

6,6
7,3

24,3
22

28,7
27

1,4
11

53,7
176

11
2

50
34

0,003
0,007

0,066
0,201

0,02
0,19

0,32
1,6

6,9
7

25
80

Rio
RioCapivari
Pardo

20/06/2006
20/11/2000

6,8
7,4

20
22

26
27

2,5
9

53,5
145

2
8

50
37

0,003
0,005

0,085
0,195

0,03
0,15

0,42
0,93

9,4
7

140
3,5

Rio
RioCapivari
Pardo

09/08/2006
09/01/2001

7,2
7

22
26

29
26

3,1
7,9

54,2
147

2
9

50
38

0,003

0,357
0,2

0,06
0,38

0,05
0,49

7,8
6,6

160
2,5

Rio
RioCapivari
Pardo

23/10/2006
13/03/2001

6,7
7,4

25
24

31
28

2,9
7,9

155
61

2
9

50
31

0,003

0,272
0,06

0,04
0,42

0,05
1,3

6,8
4,9

255
10

62

Rio Capivari

29/05/2001
01/02/2006

7,2
7

19
23

23
28

9,5
9

170
124

5
6

15
50

0,003

0,135
0,7

0,16
0,29

1,2
0,5

6,8
6

506
25

Rio Capivari

10/07/2001
24/04/2006

7,2
7,3

18
20

23
26

13
17

217
190

7
6

16
50

0,007
0,003

0,297
0,4

0,15
0,18

1,44
1,1

6,9
6,1

20
26

Rio Capivari

03/09/2001
05/06/2006

6,8
7,4

16,5
22

19,5
30

16,3
22

270
200

8
6

30
50

0,003

0,529
0,5

0,29
0,23

2,36
0,6

4,6
6,2

23
15

Rio Capivari

05/11/2001
08/08/2006

7,8
7

21
27

23
24

23
21

259
215

8
4

39
50

0,003

0,33
0,5

0,15
0,19

1,1
2

5,5
6

15
12

Rio Capivari

18/02/2002
02/10/2006

8,2
7,3

23
21

21
28

7,2
33

153
302

2
7

15
50

0,003

0,199
0,6

0,21
0,22

0,71
5

5,2
6

40
19

Rio Capivari
Rio Capivari

02/04/2002
11/12/2006
04/06/2002
05/02/2007

7,5
7,2
7,3
7,1

26
23
19
25

33
26
25
28

10,4
17
15,5
19

191
196
206
221

3
5
4
6

20
50
15
50

0,003
0,002

0,261
0,3
0,387
0,3

0,19
0,21
0,17
0,24

0,21
1
0,98
1

5,8
5,6
5,6
4,6

18
53
18
34

Rio Capivari
Rio Capivari

06/08/2002
23/04/2007
15/10/2002
04/06/2007

7
6,7
7
6,7

18
23,5
26
16,5

19
28
35
12,5

15,9
24
22,3
16

206
232
209
157

6
8
4
6

15
50
29
50

0,003
0,005

0,278
0,05
0,551
0,6

0,25
0,21
0,21
0,13

1,9
4
2,3
1

5,5
5,7
3,1
6

20
41
27
60

Rio Capivari
Rio Capivari

03/12/2002
07/08/2007
17/02/2003
01/10/2007

7,3
7,1
7,3
4,5

25
17
24
20

30
26
24,5
27

19,4
23
12,9
50

166
220
176
369

4
8
8
10

30
50
36
50

0,003
0,005
0,003
0,005

0,315
0,2
0,02
0,7

0,18
0,19
0,23
0,3

0,81
4
0,83
5

4,9
6,5
4,9
5,2

69
22
54
16

Rio Capivari
Rio Capivari

01/04/2003
10/12/2007
03/06/2003
11/02/2008

7,7
7,1
7,5
7

25
18
23,5

29
27
22
26

18,3
18
30,2
8

189
218
259
115

4
10
7
6

15
50
37
50

0,003
0,005
0,003
0,005

1,05
0,4
0,771
0,9

0,22
0,21
0,17
0,35

1,2
0,05
2,5
2

6
5
5,1
6,4

15
80
14
664

Rio Capivari
Rio Capivari

05/08/2003
01/04/2008
08/10/2003
02/06/2008

7,5
7,2
7,1
6,6

17,5
22
22
16

24,5
26
22,5
18

24,9
20
33,8
13

276
196
262
134

13
7
8

87
50
55
50

0,003
0,002
0,003
0,002

0,558
0,3
0,79
0,5

0,21
0,09
0,38
0,2

5,1
2
5,2
1

4,7
6,3
5
7,3

16
55
103
306

Rio Capivari
Rio Capivari

02/12/2003
05/08/2008
02/02/2004
06/10/2008

7,1
6,6
7,4
6,4

22,5
18
24
17

25
23
26,5
17

16,1
18
18,5
23

132,5
215
167
177

9
7
4
8

50
26
50

0,003
0,002
0,003
0,002

0,779
0,4
0,02
0,3

0,23
0,3
0,19
0,2

0,751
3
0,73
2

6,7
5,6
5,3
5,7

303
61
27
102

Rio Capivari
Rio
Capivari
R. Paraiba

26/04/2004
16/12/2008
01/06/2004
16/02/2000

7,2
6,6
7,4
6,5

20,5
22
17
28

21,5
26
19
31

15,9
22
13
6,8

184
215
68
195

8
6
3
8

21
50
14
27

0,003
0,002
0,002
0,003

0,531
0,4
0,09
0,02

0,26
0,3
0,19
0,14

0,9
4
2,1
0,57

6,4
4,8
4,2
6,9

54
39
125
89

Rio
Capivari
R. Paraiba
Rio
Capivari
R. Paraiba

10/08/2004
05/04/2000
19/10/2004
28/06/2000

7,3
6,7
7
6,7

14,5
24
22

19,5
28
24,5
28

21
6,6
12
2,7

71
256
49
170

2
6
1
6

18
23
8
50

0,001
0,003
0,001
0,003

0,08
0,358
0,07
0,02

0,19
0,14
0,18
0,04

2,3
0,84
0,94
0,21

5,4
6,6
6,3
6,7

10
86
103
22

Rio
Capivari
R. Paraiba
Rio
Capivari
R. Paraiba

13/12/2004
15/08/2000
14/02/2005
18/10/2000

6,6
7,3
6,7
7,4

23,5
20
23
28

31,5
26
25
34

15
5
21
6,9

45
190
57
215

1
8
1
8

4
50
26
50

0,001
0,003
0,001
0,003

0,03
0,02
0,07
0,6

0,15
0,05
0,19
0,07

1
0,36
1
0,19

6,8
6,7
6,0
6,1

54
23
26
20

Rio
Capivari
R. Paraiba
Rio
Capivari
R. Paraiba

25/04/2005
14/12/2000
20/02/2001
01/06/2005
04/04/2001
09/08/2005

6,6
7
6,5
6,8

21,5
28
29
19

19
8,4
15
6,1

89
216

3
7
3
5

8
50
16
50

0,001
0,003

0,08
0,4

4,5
7

2
8
2
6

22
50
6
50

0,003
0,001
0,003
0,001

0,2
0,05
0,9
0,06

20
30
68
63
106
13

26/06/2001
03/10/2005

27
18
22
20

0,19
0,11
0,1
0,16
0,08
0,22

0,5
0,38
0,6
1,3

6,4
7,1
6,9
6,8

23
28
34
21
30
22

21/08/2001
12/12/2005

6,4
7,2

22,5
22

2
6

10
50

0,003
0,001
0,003
0,001

1
0,06
0,9
0,08

Rio
Capivari
R. Paraiba
Rio
Capivari
R. Paraiba
Rio
Capivari
R. Paraiba

26,5
22
23,5
34

23
4,9
14
4,8
18
4,5

164
88
223
88
212
66
56
242

0,006
0,001
0,003
0,005

0,03
0,34

3
0,3
5
0,33

0,03
0,28

2
0,26

6,9
3,5
6,2
3,3
6,1
5,9
6,7
6

16
53
21
24

63

6,6
6,5
6,5
6,3

28
19

30
21

7,3
5,2

R. Paraiba

17/10/2001
21/06/2006
12/12/2001
15/08/2006

3
2
3
2

18
4
28
50

0,001

0,15
0,08

6,2
5,1

84
78
73
84

26
19

28
24

0,001

R. Paraiba

20/02/2002
24/10/2006

6,4
6,1

23
20

23
20

9,4
7,5

68
86

3
2

27
50

R. Paraiba

03/04/2002
06/12/2006

6,6

25
24

32
27

7,4
7,2

112
98

2,6
6

R. Paraiba

12/06/2002
22/02/2007

6,4
6,5

21
25

26

6,7
7

109
76

R. Paraiba

20/08/2002
19/04/2007

6,4
7

21
23

25
27

7,4
6,4

R. Paraiba
R. Paraiba

16/10/2002
20/06/2007
11/12/2002
28/08/2007

6
6,6
6,4
6,5

26
20
24
17

31
20
23
17

R. Paraiba
R.
R. Paraiba
Paraiba

19/02/2003
19/10/2007
02/04/2003
05/12/2007

6,7
6,6
6,2
6,7

25,5
21
25
27

R.
R. Paraiba
Paraiba
R.
R. Paraiba
Paraiba

25/06/2003
21/02/2008
19/08/2003
03/04/2008

6,1
6,5
6,6
6,6

R.
R. Paraiba
Paraiba
R.
R. Paraiba
Paraiba

15/10/2003
18/06/2008
10/12/2003
19/08/2008

6,4
6,7
6,8
6,7

R. Paraiba

R. Paraiba
R. Paraiba
R. Paraiba
R. Paraiba
R. Paraiba
Mantiqueira
R. Paraiba
Mantiqueira
R. Paraiba
Mantiqueira
R. Paraiba
Mantiqueira
R. Paraiba
Mantiqueira
R. Paraiba
Mantiqueira
R. Paraiba
Mantiqueira
R. Paraiba
Mantiqueira
R. Paraiba
Mantiqueira
R. Paraiba
Mantiqueira
R. Paraiba
Mantiqueira
R. Paraiba

26/02/2004
02/10/2008
29/04/2004
03/12/2008
23/06/2004
16/01/2001
24/08/2004
01/03/2001
13/10/2004
23/05/2001
08/12/2004
17/07/2001
24/02/2005
18/09/2001
29/04/2005
13/11/2001
22/06/2005
22/01/2002
29/08/2005
03/05/2002
20/10/2005
05/02/2002
07/12/2005
07/10/2002
16/02/2006
18/09/2002
27/04/2006

6,5
6,5
5,8
6,6
5,9
7
6,8
6,9
6,7
6,7
6,7
7,2
6,5
6,6
6,5
7
6,5
5,9
6,5
7,4
6,8
5,5
6,7
7,2
6,6
7,5
6,5

0,44
0,62
0,52
0,44

4,8
7,6

0,14
0,08

0,07
0,05
0,06
0,05

5,3
4

41
16
79
24

0,001

0,08
0,09

0,05
0,1

0,51
1

5,2
4

99
20

13
50

0,001

0,07
0,13

0,09
0,1

0,58
1,2

4,2
3,6

67
44

1,4
1

50
4

0,001

0,06
0,15

0,04
0,09

0,36
0,49

5,8
3,9

17
28

74
94

0,4
3

17
50

0,001

0,08
0,06

0,04
0,07

0,53
0,37

5,1
4,2

18
28

7,2
5,7
4,7
5,8

81
75
80
94

3
2
1
2

7
36,22

0,001
0,001

0,09
0,08
0,06
0,14

0,1
0,03
0,07
0,04

0,6
0,33
0,38
0,37

4
5
3,2
4,7

69
12
84
19

27
20
25
29

8,1
6,6
9,7
11

115
87
123
153

2
3
2

0,001
0,002
0,001
0,002

0,09
0,06
0,09
0,14

0,03
0,58
0,78
0,77

3,2
4,1
3
3

39
21
19
16

19
25
17
24

21
28
20
24

5,5
4,8
6,7
8,1

82
97
101
123

2
2
2
2

0,1
0,09
0,13
0,01
0,05

0,06
0,04
0,02
0,09

0,56
0,67
0,39
0,75

4,4
2,9
5,5
3,5

62
59
13
25

18
21
23
23

17
23
22
26

6,7
6,5
7,7
9,4

107
105
117
125

1
2
2,2
2

0,07
0,07
0,08
0,12

0,55
0,7
0,4
0,63

6,4
4,7
3,2
3,8

61
18
32
19

20
22
22
25
20
25
22
19
24
15
24
13
24
13
19
18
19
21
19
19
20
22
21
21
23
17
23

19
23
22
25
23
22
25
18
27
20
26
18
28
16
24
20
20
20
29
21
22
20
21
26
26
20
25

5,2
4,7
11
5,8
12
5,9
11
2
8,4
2,1
9,6
4,7
8,8
5,6
6,11
2,8
7,37
2,9
4,1
2,1
6,9
2
4,6
4,7
4,7
4,5
7,4

72
84
124
109
134
110
120
91
128
74
122
104
133
91
97
56
114
61
75
52
88
56
83
78
66
71
104

4,2
2
1,6
2
2,2
8
3
9
1,8
5
2
9
3,8
6
1,7
1
1,5
3
0,9
2
1,6
2
2
7
1,6
5
4

14
36,22
14
36,22
17
36,22
11
36,22
4
36,22
14
36,22
18
36,22
25
36,22
10
36,22
14
30
14
22
11
16
11
24
27
18
13
4
10
4
7
4
4
4
17
17
36
10
8

0,001
0,002
0,001
0,002
0,001
0,002
0,001
0,003
0,001
0,003
0,001
0,003
0,001
0,001
0,001
0,001
0,001
0,001
0,001
0,009
0,001
0,001
0,001
0,001
0,001
0,001
0,001
0,001
0,001
0,001
0,001
0,001
0,001
0,001
0,001

0,08
0,1
0,12
0,11
0,12
0,13
0,06
0,11
0,11
0,05
0,12
0,38
0,16
0,26
0,16
0,14
0,14
0,34
0,06
0,25
0,04
0,15
0,13
0,13
0,11
0,01
0,09
0,13
0,09
0,34
0,06
0,22
0,11

0,1
0,05
0,09
0,08
0,08
0,15
0,06
0,14
0,06
0,13
0,06
0,24
0,13
0,14
0,07
0,08
0,04
0,12
0,05
0,23
0,06
0,09
0,09
0,06
0,1
0,13
0,07

0,9
0,43
0,55
0,77
0,9
1,41
4
1,41
0,8
1,41
0,54
1,41
0,61
1,41
0,97
1,41
0,53
1
1,41
0,78
0,66
1,6
0,96
3,7
1,42
2,9
0,26

3
3,6
4,4
2,7
5
4,8
4,5
5,4
3,9
7
3,3
5,7
2,1
7,5
4,9
6,4
4,5
7
4,5
7,6
3,7
7
3,3
7,5
2,9
6,1
5,2

131
31
27
33
18
29
24
13
23
21
26
14
36
15
20
87
12
32
19
40
31
15
65
15
202
16
23

64

Mantiqueira

11/11/2002
10/07/2007

7,4
6,4

23
12

22
20

3,8
4,5

65
86

6
9

21
50

0,001

0,1
0,2

0,13
0,08

2,26
3,2

6,1
7,7

151
41

Mantiqueira
Mantiqueira

21/01/2003
12/09/2007
12/03/2003
28/11/2007

7,29
6,9
7,2
7,5

17
17
21

19
21
19
23

1,9
4,3
3,6
1,8

60
85
71
83

5
6
3

8
36,22

0,001
0,001
0,002

0,04
0,29
0,09
0,32

0,07
0,09
0,2
0,12

1,9
3,52
1,2
5

6,6
5,5
6,6
6,3

69
9
152
9,9

Mantiqueira
Mantiqueira
Mantiqueira

22/05/2003
07/01/2008
15/07/2003
12/03/2008

7,18
7,1
7,3
7,5

15
19
16
18

20
22
17
20

6,7
3,3
4,5
1,2

91
6,8
80
65

8
4
3
2

0,001
0,002
0,001
0,002

0,19
0,15
0,16
0,17

0,1
0,15
0,12
0,09

5
1,28
3
1,25

5,9
6,4
6,4

15,7
47
16
0,7

Mantiqueira
Mantiqueira
Mantiqueira
Mantiqueira

17/09/2003
13/05/2008
11/11/2003
15/07/2008

7
6,7
7,1
7

16
12
15
9,9

18
13
20
19

3,4
2,7
5,4
3,3

76
51
95
74

6
3
6
5

0,001
0,002
0,001
0,002

0,09
0,13
1,9
0,23

0,1
0,06
0,17
0,11

25
1
40
2,72

6,4
7,3
6,1
7

34
17
13
13

Mantiqueira
Mantiqueira
Mantiqueira
Mantiqueira

20/01/2004
11/09/2008
17/03/2004
26/11/2008

6,8
7,1
6,3
7,3

17
16
18
17,4

20
23
19
21

5,4
5,1
1,8
2,3

83
94
57
68

3
5
2
5

0,001
0,003
0,001
0,003

0,08
0,34
0,06
0,19

0,102
0,07
0,09
0,07

1,9
2,9
0,69
1,22

6,2
6,2
7,4
6,8

17
13
28
42

0,001
0,003
0,001
0,003

0,42
0,04
0,01
0,11

0,11
0,002
0,12
0,002

3,4
0,76
2,5
0,27

5,4
7,8
6,8
7,4

19
4
195
3

0,22
0,07
0,42
0,11

0,11
0,03
0,1
0,03

6,7
5,7
5,8
5,7

15
9,24
14
35,7

7,3
8,4
6,5
5

416
5,08
12
38

Mantiqueira
Biritiba.Mirim
Mantiqueira
Biritiba.Mirim
Mantiqueira
Biritiba.Mirim
Mantiqueira
Biritiba.Mirim
Mantiqueira
Biritiba.Mirim
Mantiqueira
Biritiba.Mirim
Mantiqueira
Biritiba.Mirim
Mantiqueira
Biritiba.Mirim
Mantiqueira
Biritiba.Mirim
Mantiqueira
Biritiba.Mirim
Mantiqueira
Biritiba.Mirim
Mantiqueira
Biritiba.Mirim
Mantiqueira
Biritiba.Mirim
Mantiqueira
Biritiba.Mirim
Mantiqueira
Biritiba.Mirim
Mantiqueira
Biritiba.Mirim
Mantiqueira
Biritiba.Mirim
Mantiqueira
Biritiba.Mirim
Mantiqueira

20/05/2004
13/01/2000
13/07/2004
27/03/2000
15/09/2004
24/05/2000
16/11/2004
26/07/2000
04/01/2005
21/09/2000
16/03/2005
30/11/2000
17/05/2005
11/01/2001
12/07/2005
27/03/2001
14/09/2005
30/05/2001
30/11/2005
25/07/2001

6,94
6,1
6,42
6,1
7,1
7,5
7,11
6,7
7,23
6,6
6,77
6,2
6,7
6,6
6,9
6,7
6,9
5,9
6,9
6,9

04/01/2006
18/09/2001
15/03/2006
29/11/2001

7
6,4
6,26
6,3

13/09/2006
28/05/2002
29/11/2006
25/07/2002

6,4
6,5
7,6
6,8

17/05/2006
15/01/2002
11/07/2006
26/03/2002

08/01/2007
17/09/2002
14/03/2007
25/11/2002
15/05/2007

7
6,4
6,4
6,3

6,5
6,6
6,8
6
6,9

15
25
14
22
19
15
15
14
17
21
17
22
10
25
12
24
20
18
22
16
12
15
16
21
13
21
18
22
18
15
20
15
19
20
17
23
18

17
33
11
25
20
20
14
17
17
28
19
23

5,2
3,6
4,1
4,6
4,8
3,7
2,8
7,1
1,7
6,2
3
8,1

9
30
17
27

3,25
3,41
4,94
5,83

14
17
18
29

1,8
4,67
1,8
5,39

15
25
19
18

20
24
22
28
21
24
30
25
20
29
21
31
25

81
47
63
37
80
28
76
59
74
49
77
66

4
50
11
39
10
25
25
25
32
25
18
25
13
52
38
26

57
51
58
87

5
3
3
9

31
25
106
50
15
50

3
3
6,1
3

50
50
50
50

2,4
3,9
2,7
6,5

57
65
65
49

3,2

6
3
7
4

11
36,22
32
50

8
3
10
3

80
43
101
43

1,9
4
4,3
3,8

8
4
7
3

11
36,22
18
36,22

70
41
88
69

4,7
4,06
5,1
4,18

6,3
3,9
4,1
4,8

3
3,99
5
3

7
36,22
11
36,22

90
32
90
44
65
41
68
36
64

3
1
8
3

6
3
6
3

27
3
0,4
3
2

31
29
4
12

8
50
20
50

50
50
50
50
50

0,001
0,003
0,001
0,003

0,001
0,003
0,001
0,003
0,001
0,004
0,001
0,003
0,001
0,003
0,001
0,003
0,001
0,003
0,001
0,003
0,001
0,003
0,001
0,003
0,001
0,003
0,001
0,003
0,001
0,003
0,001
0,003
0,001

0,17
0,03
0,17
0,11

0,14
0,13
0,14
0,3

0,12
0,07
0,13
0,04

0,11
0,02
0,12
0,05

0,2
0,07
0,29
0,03

0,13
0,002
0,19
0,02

0,01
0,22
0,2
0,15

0,08
0,03
0,08
0,06

0,05
0,03
0,12
0,39

0,29
0,03
0,32
0,05
0,05
0,04
0,12
0,08
0,01

0,18
0,02
0,11
0,06

0,09
0,03
0,12
0,01
0,18
0,04
0,11
0,11
0,08

2,1
0,6
2,7
0,31

1,6
0,87
2,5
1,12
1,41
0,67
4,9
0,86
3,1
0,1
3,5
1,88
1,5
1,03
1,5
1,92
3,56
0,66
2,26
0,61
3,52
0,03
5
0,34
1,5
0,03
1,5
1,31
3,56

6,9
3,8
7
4,8

7,1
6,1
6,4
3,5

6,6
8
5,9
6,7

6,9
4,1
7,7
4,6

20
13
22
13

112
7
220
106

21
6,48
46
9,2

12
50
41
12

5,5
10
6,3
8,9

25
1
105
7

6,9

11

7,3
7,8
6,5
4,8

89
4
13
10

65

Biritiba.Mirim

14/01/2003
11/09/2007

6,1
7,1

21,1
18,4

24,4
24,5

3,84
3,97

45,8
38

50

0,0003
0,003

0,13
0,03

0,05
0,02

0,81
0,6

3,9
7,5

40,79
21

Biritiba.Mirim

26/03/2003
27/11/2007

6,4
6,8

20,2
21,3

22,5
24

Biritiba.Mirim

15/05/2003
08/01/2008

6,8
6,7

16,8
23,5

29,5
26

3,55
5,93

68,6
45

50

0,0003
0,003

0,11
0,07

0,03
0,05

0,72
0,64

5,3
6,5

14,48
13

4,04
7,71

100,5
34,3

50

0,0003
0,003

0,05
0,09

0,01
0,08

0,61
0,5

8,2
6,2

15,43
3,5

Biritiba.Mirim

10/07/2003
27/03/2008

7,5
6,9

19,5
22,3

16,5
29,4

6,79
3,5

31,5
91,4

50

0,0003
0,003

0,04
0,05

0,01
0,07

0,42
0,65

8,4
7

12,77
3,9

Biritiba.Mirim

16/09/2003
08/05/2008

6,7
6,9

16,1
16,5

17,5
19,3

5,93
6,62

54,7
86,8

50

0,0003
0,009

0,06
0,08

0,02
0,04

0,56
0,5

8,3
7,8

3,5
22

Biritiba.Mirim

04/11/2003
24/07/2008

6,3
7

17,7
17,9

19
23

4,87
2,89

43,7
50,7

50

0,0003
0,003

0,06
0,15

0,04
0,02

1,73
0,72

7,1
7,9

5,28
5

Biritiba.Mirim

13/01/2004
04/09/2008

5,9
7,2

22,2
20

26,5
31

4,11
4,49

50,9
44

36,22

0,003

0,09
0,05

0,09
0,03

0,45
0,62

3,5
7,6

3,95
10

Biritiba.Mirim
Biritiba.Mirim

10/03/2004
25/11/2008
13/05/2004

5,9
7
6,5

24
21,4
18,5

27,5
26
21

3,58
5,58
4,16

38,3
69,3
39

3
4
3

50
36,22
50

0,003
0,003

0,09
0,04
0,05

0,02
0,06
0,02

0,49
0,92
0,34

3,8
7
6,9

12
9,62
11

Biritiba.Mirim

29/07/2004

6,4

14,5

19

4,35

40,7

50

0,003

0,06

0,01

0,18

2,5

Biritiba.Mirim

16/09/2004

6,7

19,2

27

4,33

40,8

50

0,003

0,03

0,03

0,62

5,7

0,9

Biritiba.Mirim

03/11/2004

6,8

24

30,5

6,48

58,8

50

0,003

0,06

0,07

0,76

5,7

7,45

Biritiba.Mirim

11/01/2005

6,72

24,5

24

4,31

61,7

50

0,005

0,19

0,08

0,39

4,27

39

Biritiba.Mirim

01/03/2005

6,3

24,1

28

4,78

55,1

50

0,003

0,12

0,07

0,91

4,2

13

Biritiba.Mirim

12/05/2005

6,52

19,6

28,5

0,5

37,7

50

0,003

0,04

0,02

0,28

7,04

11,51

Biritiba.Mirim

28/07/2005

6,8

17,2

20

5,99

76,9

78

0,003

0,1

0,1

0,84

6,7

7,6

Biritiba.Mirim

13/09/2005

6,5

17,7

18

7,12

84,1

50

0,003

0,13

0,12

0,8

6,4

8,4

Biritiba.Mirim

03/11/2005

20

25,5

8,68

138,2

50

0,003

0,24

0,007

1,79

5,9

12,5

Biritiba.Mirim

10/01/2006

7,1

24

28

5,74

84,5

50

0,003

0,14

0,06

5,7

7,2

Biritiba.Mirim

08/03/2006

6,1

23,6

29

6,78

106,5

50

0,003

0,1

0,07

0,87

6,7

2,8

Biritiba.Mirim

11/05/2006

6,8

18,6

21

3,75

59,9

50

0,003

0,02

0,03

0,52

7,2

3,9

Biritiba.Mirim

27/07/2006

6,8

17,2

28,5

3,32

44,9

50

0,003

0,11

0,02

0,92

7,8

0,8

Biritiba.Mirim

12/09/2006

6,7

19,2

32

4,23

41,6

50

0,003

0,11

0,04

0,74

7,5

4,3

Biritiba.Mirim

07/11/2006

6,2

21,2

19,5

4,25

56,9

50

0,003

0,09

0,04

0,38

6,2

5,7

Biritiba.Mirim

09/01/2007

6,7

23,3

24,5

6,09

78,8

50

0,003

0,07

0,09

0,77

5,8

22,4

Biritiba.Mirim

09/03/2007

25,9

28,5

4,09

50,3

50

0,003

0,07

0,08

0,57

4,72

Biritiba.Mirim

09/05/2005

6,8

19,4

14

4,54

52,9

50

0,003

0,18

0,04

2,13

6,6

10,5

Biritiba.Mirim

26/07/2007

6,5

15,3

16,5

8,59

114,4

50

0,003

0,16

0,04

0,59

7,8

30,27

66

ANEXO - B Perfis amostrais dos treze parmetros .


Nesta seo so mostrados os comportamentos amostrais dos resultados referentes a
Tabela dos valores dos parmetros fsico - qumicos no perodo de 2000 2008 (Anexo A).
Os grficos correspondem a variao das concentraes dos parmetros em 257 dias de
coleta.

0,014

Fenis (no normalizado)

0,012

mg/ L

0,01
0,008
0,006
0,004
0,002

1
12
23
34
45
56
67
78
89
100
111
122
133
144
155
166
177
188
199
210
221
232
243
254

0
Total de amostras

FIGURA B.1 - Grfico do comportamento no normalizado dos valores das coletas


referentes ao periodo de 2000 a 2008 da varivel Fenis.

67

Fsforo (no normalizado)

2
1,8
1,6

mgP/ L

1,4
1,2
1
0,8
0,6
0,4
0,2

253

241

217
229

193
205

Total de amostras

181

157
169

133
145

121

97
109

85

61
73

37
49

25

1
13

FIGURA B.2 Grfico do comportamento no normalizado dos valores das coletas


referentes ao perodo de 2000 a 20008 da varivel Fsforo.

0,45

Mangans (no normalizado)

0,4
0,35

mg/ L

0,3
0,25
0,2
0,15
0,1
0,05

235
248

196
209
222

157
170
183

118
131
144

92
105

66
79

40
53

14
27

0
Total de amostras

FIGURA B.3 Grfico do comportamento no normalizado dos valores das coletas


referentes ao perodo de 2000 a 2008 da varivel Mangans.

68

120

Demanda qumica de oxignio, DQO


(no normalizado)

100

mg/ L

80
60
40
20

1
12
23
34
45
56
67
78
89
100
111
122
133
144
155
166
177
188
199
210
221
232
243
254

0
Total de amostras

FIGURA B.4 Grfico do comportamento no normalizado dos valores das coletas


referentes ao perodo de 2000 a 2008 da varivel Demanda Qumica de Oxignio.

Demanda bioqumica de oxignio, DBO


(no normalizado)
30
25

mg/ L

20
15
10
5

1
11
21
31
41
51
61
71
81
91
101
111
121
131
141
151
161
171
181
191
201
211
221
231
241
251

0
Total de amostras

FIGURA B.5 Grfico do comportamento no normalizado dos valores das coletas


referentes ao perodo de 2000 a 2008 da varivel Demanda Bioqumica de oxignio.

69

12

Oxignio dissolvido (no normalizado)

10

mgO 2/ L

8
6
4
2

1
11
21
31
41
51
61
71
81
91
101
111
121
131
141
151
161
171
181
191
201
211
221
231
241
251

0
Total de amostras

FIGURA B.6 Grfico do comportamento no normalizado dos valores referentes ao


perodo de 2000 a 2008 da varivel Oxignio Dissolvido.

45

NKT (no normalizado)

40
35
mgN/ L

30
25
20
15
10
5

241
253

217
229

193
205

Total de coletas

169
181

145
157

97
109
121
133

61
73
85

37
49

1
13
25

FIGURA B.7 Grfico do comportamento no normalizado dos valores referentes ao


perodo de 2000 a 2008 da varivel Nitrognio Kjeldahl Total.

70

60

Cloreto total (no normalizado)

50

mg/ L

40
30
20
10

1
11
21
31
41
51
61
71
81
91
101
111
121
131
141
151
161
171
181
191
201
211
221
231
241
251

0
Total de amostras

FIGURA B.8 Grfico do comportamento no normalizado dos valores de coleta


referentes ao perodo de 2000 a 2008 da varivel Cloreto Total.

40

Temperatura do ar (no normalizado)

35
30

25
20
15
10
5

1
11
21
31
41
51
61
71
81
91
101
111
121
131
141
151
161
171
181
191
201
211
221
231
241
251

0
Total de amostras

FIGURA B.9 Grfico do comportamento no normalizado dos valores de coletas


referentes ao perodo de 2000 a 2008 da varivel Temperatura do ar.

71

35

Temperatura da gua (no


normalizado)

30

25
20
15
10
5

1
11
21
31
41
51
61
71
81
91
101
111
121
131
141
151
161
171
181
191
201
211
221
231
241
251

0
Total de amostras

FIGURA B.10 Grfico do comportamento no normalizado dos valores das coletas


referentes ao periodo de 2000 a 2008 da varivelTemperatura da gua.

400

Condutividade (no normalizado)

350

S/ cm

300
250
200
150
100
50

1
12
23
34
45
56
67
78
89
100
111
122
133
144
155
166
177
188
199
210
221
232
243
254

0
Total de amostras

FIGURA B.11 Grfico do comportamento no normalizado dos valores de coleta


referentes ao perodo de 2000 a 2008 da variavel Condutividade.

72

700

Turbidez (no normalizado)

600

UNT

500
400
300
200
100

1
12
23
34
45
56
67
78
89
100
111
122
133
144
155
166
177
188
199
210
221
232
243
254

0
Total de amostras

FIGURA B.12 - Grfico do comportamento no normalizado dos valores de coleta


referentes ao perodo de 2000 a 2008 da varivel Turbidez.

pH (no normalizado)

8
7

U.pH

6
5
4
3
2
1
1
11
21
31
41
51
61
71
81
91
101
111
121
131
141
151
161
171
181
191
201
211
221
231
241
251

0
Total de amostras

FIGURA B.13 - Grfico do comportamento no normalizado dos valores de coletas


referentes ao perodo de 2000 a 2008 da varivel Potencial hidrogeninico.

73

REFERNCIAS BIBLIOGRFICAS
ASTEL A, S. TSAKOVSKI, P. BARBIERI, V. SIMEONOV, Comparison of self
organizing maps classification approach with cluster and principal components abalysis for
large environmental data sets. Water Research, 41(19), p. 4566 4578, 2007.
BADIN JR., H., Redes Neurais Artificiais - Parte 2, - Neurnio Biolgico, Mecatrnica
Atual, disponvel em: http://www.mecatronicaatual.com.br/secoes/leitura/553, acessado em
20/01/2011.
BIERMAN P.H., LEWIS M. OSTENDORF B., TANNER J., A review of methods for
analysing spatial and temporal patterns in coastal water quality. Ecological Indicators, 11,
p.103-114, 2011.
BRASIL. MINISTRIO DA SADE, Portaria n. 518, 2004. Ministrio da sade do
Brasil, D.O.U., de 25 de maro de 2004, Braslia.
BRASIL. MINISTRIO DO DESENVOLVIMENTO URBANO E MEIO AMBIENTE
CONSELHO NACIONAL DO MEIO AMBIENTE (CONAMA). Resoluo n. 357,
D.O.U., de 17 de Maro de 2005, Braslia.
BUENO E.I., Utilizao de redes neurais artificiais na monitorao e deteco de
falhas em sensores do reator IEA R1, Dissertao (Mestrado), Instituto de Pesquisas
Energticas e Nucleares IPEN, So Paulo, 2006.
CARVALHO M.A.G, Mtodos estatsticos para anlise de dados de monitorao
ambiental. Tese (Doutorado), Instituto de Pesquisas Energticas e Nucleares IPEN, So
Paulo, 2003.
CRGHINO R., PARK Y.-S., Review of Self-Organizing Map (SOM) approach in water
resources: Commentary. Environmental Modelling & Software, 24, 945-947, 2009.
CETESB Companhia de Tecnologia de Saneamento de So Paulo. Relatrio de
qualidade das guas interiores do estado de So Paulo 2000. CD, 2v, il, srie de
relatrios CETESB, So Paulo, 2001.
CETESB Companhia de Tecnologia de Saneamento de So Paulo. Variveis de
qualidade das guas. Disponvel em: http://www.cetesb.sp.gov.br/Agua/rios/variaveis.asp
, Acesso em: 19/07/2008.
CONAMA - MINISTRIO DO MEIO AMBIENTE. CONSELHO NACIONAL DO
MEIO AMBIENTE, Resoluo n.o 357 de 17/03/2005, D.OU. n.o 53, Braslia, Brasil.
COSTA F.A.J, NETTO A..L.M, Segmentao de mapas auto organizveis com espao
de sada 3 D, Revista Controle &Automao, v.18 n.2., p. 150 162, Abr./Mai/Jun.
2007.
COTRIM M.E.B, Avaliao da qualidade da gua na bacia hidrogrfica do Ribeira de
Iguape com vistas ao abastecimento pblico, Tese (Doutorado), Instituto de Pesquisas
Energticas e Nucleares IPEN, So Paulo, 2006.

74

DAVIES D.L, BOULDIN D.W. A Cluster Separation Measure. IEEE - Transactions on


Pattern Analysis and Machine Intelligence, New York, abr. 1979, vol PAM1-1. n.o 2.
DECRETO
ESTADUAL
n.o
8468
de
08/09/76
http://www.cetesb.sp.gov.br/Institucional/documentos/Dec8468.pdf,
21/01/11.

obtido
acessado

em:
em

ECHALAR M.A.F., Estudo da estrutura de fontes de aerossis em Cubato com uso


de PIXE e modelos receptores, Dissertao (Mestrado), Instituto de Fsica da
Universidade de So Paulo, So Paulo, 1991.
FILHO B.D. B, Redes neurais para controle de sistemas de reatores nucleares, Tese
(Doutorado), Instituto de Pesquisas Energticas e Nucleares IPEN, So Paulo, 1998.
GARCIA L.H, GONZLES M.I, Self organizing map and clustering for wastewater
treatment monitoring. Engineering Applications of Artificial Intelligence,17, p.215
225, 2004.
HONG T.S.Y, BHAMIDIMARRI R, Evolutionary self organizing modeling of a
municipal wastewater treatment plant, Water Research, 37 (6), p. 1199 1212, 2003.
HONG T.S.Y, ROSEN R.M, BHAMIDIMARRI R, Analysis of a municipal wastewater
treatment plant using a neural network based pattern analysis. Water Research, 37, p.
1608 1618, 2003.

References
on
self

organizing
map,
disponvel
HONKELA
T,
em:http://mlab.uiah.fi/~timo/som/references.html , Acesso em novembro de 2007.
IGAMI, M.P.Z.; ZARPELON, L.M.C. (Org). Guia para a elaborao de dissertaes e
teses: preparado para orientao dos alunos de Ps-graduao do IPEN. So Paulo: IPEN,
Diviso de Informao e Documentao Cientficas, 2002. Disponvel em:
https://www.ipen.br/conteudo/upload/200609111605540.guia_teses.pdf.
Acesso em:
25/11/2010.
JUNIOR D.W, Identificao de padres em sistemas supervisrios de instalaes de
reatores nucleares e em sistemas de gasodutos utilizando mapas auto organizveis.
Dissertao (Mestrado), Instituto de Pesquisas Energticas e Nucleares IPEN, So Paulo,
2005.
KALTEH A.M, HORTH P, BERNDTSSON R, Review of the self organizing map
(SOM) approach in water resources: Analysis, modeling and application. Environ. Modell
& Softw. 23, p, 835 845, 2008.
KOHONEN T, Automatic formation of topological maps of patterns in a self organizing
system. In: Oja, E. e Simula, O., Eds. Proc. 2SCIA, Scand. Conf. on Image Analysis, p
214 220, Helsinki, Finland, 1981a.
KOHONEN T, Construction of similarity diagrams for phonemes by a self organizing
algorithm. Report TKK F, A463, Helsinki Uni. Technol., Finland, 1981b.

75

LCIS, Laboratoty of Computer and Information Science, Som Toolbox 2.0, obtido em:
http://www.cis.hut.fi/somtoolbox/, acesado em: 22/01/2011.
LEE H.B, SCHOLZ M, Application of the self organizing map (SOM) to assess the
heavy metal removal performance in experimental wetlands. Water Research, 40 (18), p.
3367 3374, 2006.
LEK S, GIRAUDEL J.L, Acomparison of self organizing map algorithm and some
conventional statistical for ecological community ordination.Ecological modeling, 146 (13), p. 329 339, 2001.
LEMES M.J.L, Avaliao de metais e elementos trao em gua e sedimentos das
bacias hidrogrficas dos rios Mogi guau e Pardo, Dissertao (Mestrado), Instituto
de Pesquisas Energticas e Nucleares IPEN, So Paulo, 2001.
LLORENS E, THIERY F, GRIEU S, POLIT M, Evaluation of WWTP discharges into a
Mediterranena river using KSOM neural networks and mass balance modeling. Chemical
Engineering Journal, 142 (2), p 135 146, 2008.
LNCC, Laboratrio Nacional de Computao Cientfica, Tutorial em Redes Neurais,
obtido em: http://www.lncc.br/~labinfo/tutorialRN/frm1_aprendizado.htm, acessado em
21/01/2011.
McCULLOCH W.S, PITTS W.H, Alogical calculus of the ideas immanent in nervous
activity. Bulletin of Mathematical Biophysics, 5, p. 115 133, 1943.
MARQUES N.M, Avaliao do impacto de agrotxicos em reas de proteo
ambiental, pertencentes bacia hidrogrfica do Rio Ribeira de Iguape, So Paulo.
Uma contribuio anlise crtica da legislao sobre o padro de potabilidade. Tese
(Doutorado), Instituto de Pesquisas Energticas e Nucleares IPEN, So Paulo, 2005.
MATHWORKS: Matlab verso 6.5, [S.I], Mathworks Inc., 2004, Conjunto de programas,
2 CD-ROM.
MESQUITA N.R, Classificao de defeitos em tubos de gerador de vapor de plantas
nucleares utilizando mapas auto organizveis, Tese (Doutorado), Escola Politcnica
de engenharia, USP, So Paulo, 2002.
MICROSOFT Project for Windows, version XP: project planning software. [S.I]:
Microsoft Corporation, 2001, Conjunto de programas 1 CD - ROM.
MINGOTI A.S, Anlise de dados atravs de mtodos de estatstica multivariada: Uma
abordagem aplicada, Ed UFMG, Belo Horizonte, 2005.
MUSTONEN S.M, TISSARI S, HUIKKO L, KOLEHMAINEN M, LEHTOLA M.J,
HIRVONEN A, Evaluating online data of water quality charges in a pilot drinking water
distribution system with multivariate data exploration methods.Water Research, 42(10
11), p. 2421 2430, 2008.

76

NETO A.E.P, Modelos receptores aplicados determinao da estrutura de fontes de


aerossis remotos. Tese (Doutorado), Instituto de Fsica, USP, So Paulo, 1985.
RANSON. S.W, Anatomia do Sistema Nervoso sob o ponto de vista de
desenvolvimento e funo, ed. 7, cap 4, p. 31 44, Renascena s.a, So Paulo, 1945.
REIS T.L.E, Abordagem sistmica do sistema de tratamento de gua de registro, So
Paulo, com nfase na avaliao de impacto do descarte dos resduos na bacia
hidrogrfica do rio Ribeira de Iguape. Tese (Doutorado), Instituto de Pesquisas
Energticas e Nucleares IPEN, So Paulo, 2006.
ROSEMBLATT F, The Perceptron: a probabilistic model for information storage &
organization in the brain. Psychological Review, 65, p. 386 408, 1958.
ROSSI. S.P.H.R, Utilizao de redes neurais na monitorao da potncia do reator
IEA R1, (Tese) Doutorado, Instituto de Pesquisas Energticas e Nucleares IPEN, So
Paulo, 2001.
SOM TOOLBOX verso 2.0, obtida no Laboratory of Computer and Information Science,
Finland, Mar. 17 2005, [S.I]. Disponvel em: http://www.cis.hut.fi/projects/somtoolbox/ .
TISON J., PARK Y.S., COSTE, M. DELMAS F., GIRAUDEL, J.L.,Use of unsupervised
neural networks for eco-regional zonation of hydrosystems through diatom communities:
case study of Adour-Garonne watershed. Archiv fr Hydrobiologie, 159, 409-422, 2004.
TOBISZEWSKI M., TSAKOVSKI S., SIMEONOV V., NAMISNIK J., Surface water
quality assessment by the use of combination of multivariate statistical classification and
expert information. Chemosphere, 80, p.740-746, 2010.
VESANTO, J., SOM implementation in SOM Toolbox, obtido em: VESANTO, J., SOM
implementation
in
SOM
Toolbox,
obtido
em:
http://www.cis.hut.fi/somtoolbox/documentation/somalg.shtml, acessado em: 21/01/2009.

Вам также может понравиться