Академический Документы
Профессиональный Документы
Культура Документы
VERSO CORRIGIDA
SO CARLOS, SP
2013
Este trabalho foi licenciado com uma Licena CreativeCommons - Atribuio No
Comercial 3.0 Brasil.
permitido compartilhar e adaptar o trabalho para todo uso no comercial, desde que
respeitada a atribuio. A licena jurdica (resumida ou completa) pode ser acessada em:
http://creativecommons.org/licenses/by-nc/3.0/br/deed.pt
professora Fernanda, que desde o incio acreditou neste projeto e na minha capacidade, e
me fez acreditar tambm. Agradeo pela permanente orientao e o conhecimento
transmitido, e tambm pela confiana depositada, a disposio e pacincia dispensadas, e os
ensinamentos proporcionados com suas palavras e com seu exemplo.
Ao professor Rodrigo Guido, cujas indicaes foram uma bssola nas diversas etapas do
projeto, agradeo a grande contribuio e a excelente disposio em colaborar conosco.
Aos professores Rodrigo Porto, Andr de Carvalho e Maria Carolina Monard, agradeo pela
receptividade e sua contribuio resolvendo dvidas e oferecendo indicaes que foram
fundamentais no trabalho.
Ao engenheiro Javier Mahecha, pelas ideias fornecidas, a valiosa colaborao nas atividades
de laboratrio, as longas conversas sobre os temas do projeto, a reviso do texto e, em fim,
tudo o suporte que fez possvel a concluso deste trabalho.
Aos colegas do ICMC, Didier Vega e Lilian Berton, pelo auxilio no uso do software.
Control of losses in water supply systems is a constant concern, and a key to the solution of
this problem is the rapid and reliable detection of leaks that often begin anywhere on the
network. A promising approach to solve the problem is the leak detection based on the
analysis of signals acquired by monitoring the network in operation, and this research fits
with that approach. Its developed a pattern recognition system for the analysis of pressure
and flow signals, which identifies whether a leak happened during signal acquisition. Several
techniques are exploited for forming this system, including the feature extraction in the time
domain (energy, entropy, zero crossings count) and in the wavelet decomposition (energy
distribution in the components). Also, the use of different types of algorithms for
classification (nearest neighbors, decision tree, decision rule, Naive Bayes, support vector
machine and artificial neural network with radial basis functions) is explored. Signals are
acquired from the experimental hydraulic circuit, allowing the simulation of the onset of a
leak in the network, to form a big database of example signals. Besides the literature review
and the concepts relating to the considered methods, in this document are shown the analyses
leading to the creation of the pattern recognition system most appropriate for the problem.
The analysis of the methods considered allows defining the pattern recognition system, which
is composed by segmentation and standardization, feature extraction and classification. The
evaluation of the proposed system shows a completely satisfactory performance, recognizing
rightly the signals as linked or not to a leak in more than 95% of the tests.
COM Nome da classe que agrupa os sinais adquiridos durante o incio de um vazamento.
FBR Rede neural artificial com funes de base radial, mtodo de classificao.
SEM Nome da classe que agrupa os sinais adquiridos durante escoamento permanente.
1. INTRODUO .................................................................................................................17
2. OBJETIVOS ......................................................................................................................21
7. RESULTADOS ................................................................................................................. 76
8. CONCLUSES ...............................................................................................................108
9. REFERNCIAS ..............................................................................................................112
1. INTRODUO
visuais tm sido substitudos em muitos casos por outros mais avanados como a inspeo
acstica, injeo de gs na rede, inspees eletromagnticas ou baseadas em medies
eltricas. A incorporao das novas tecnologias tem ampliado as possibilidades de detectar
vazamentos menores que os identificveis atravs da simples inspeo visual, mas continuam
tendo um limite abaixo do qual os vazamentos no podem ser detectados.
Considerando que os vazamentos que podem ser detectados pelos usurios ou pelas
consequncias facilmente perceptveis no sistema, podem corresponder a menos de 10% das
perdas reais em sistemas bem manejados (PILCHER, 2007), as tarefas de deteco e
localizao so complexas e de grande importncia. Os vazamentos no visveis, tanto os
detectveis via metodologias de inspeo quanto os de magnitudes menores detectvel
atravs delas, esto caracterizados por vazes pequenas, ausncia de indicadores visveis de
superfcie e influncia menos evidente nas caractersticas hidrulicas do sistema. Assim, os
tempos de reparo desses vazamentos so bem maiores do que os dos visveis, e, portanto,
ainda que caracterizados por vazes pequenas, podem promover maior volume de gua
perdida.
Assim, cada vez mais importante desenvolver o controle ativo de vazamentos, entendido
como o processo de deteco e localizao de vazamentos permanente sobre a rede (WLTS,
2007). Para que novas metodologias de controle ativo possam ser implementadas elas devem
ser condizentes com a realidade dos rgos responsveis pelo abastecimento, o que inclui
informao incompleta sobre as caractersticas e estado da rede, pouca disponibilidade de
pessoal altamente qualificado, recursos limitados para a compra de equipamentos sofisticados
e fragilidade das redes existentes, dentre outros fatores.
e em razo disso podem ser analisadas, por exemplo, em termos de caractersticas como vazo
e presso. Esta abordagem tem sido explorada por muitos pesquisadores nas ltimas dcadas,
com propostas diversas, mas a sua aplicao prtica a sistemas reais tem sido alcanada em
poucos casos.
Por outro lado, os esforos pela modernizao dos sistemas de distribuio de gua para
abastecimento visando a melhorar seu controle e operao tm levado instalao de sensores
de baixo custo que permitem conhecer o estado de sistema, por exemplo, vazes e presses
em locais especficos. Essas informaes so obtidas continuamente, mas, em geral, so
pobremente analisadas.
O presente trabalho um aporte dentro dos esforos para a deteco de vazamentos pela
anlise de sinais. Usando os dados de presso e vazo adquiridos experimentalmente num
circuito de laboratrio, desenvolvido um sistema de reconhecimento de padres para a
classificao dos sinais adquiridos durante uma situao de vazamento ou no. O
embasamento terico, a explicao da metodologia utilizada e os resultados obtidos so
apresentados neste documento, que organizado nos seguintes captulos:
Nos apndices, dados e figuras adicionais aos colocados nos diferentes captulos so
mostrados.
21
2. OBJETIVOS
Implementao da rotina computacional para cada uma das trs etapas do sistema,
incluindo os mtodos alternativos para cada qual.
Para compreender o panorama atual das tcnicas de deteco de vazamentos proposta neste
trabalho uma nova classificao, distinguindo as tcnicas baseadas na modelagem hidrulica
(MH) das tcnicas focadas na anlise dos sinais (AS). Dentro do primeiro grupo esto as
tcnicas que modelam o sistema em regime permanente (MH_P) ou transitrio (MH_T).
Dentro do segundo grupo podem se diferenciar as tcnicas AS_T que estudam o sistema
somente durante um transitrio hidrulico (situaes cabveis a modelos dinmicos inerciais)
e as tcnicas AS_O que analisam os sinais durante a operao normal de uma rede, numa
escala temporal muito superior da passagem das ondas e em condies de anlise quase-
estticas. dentro deste ltimo subgrupo que poderia ser classificado o sistema de
reconhecimento de padres desenvolvido no presente trabalho.
23
Avaliao
Autor, Ano Mtodo Principal Sistema considerado
Num Lab Cam
MH Mtodos Baseados em Modelos Hidrulicos
Modelos em regime Permanente
Pudar; Liggett, 1992 Problema Inverso Circuitos hipotticos X - -
Estimacion de estado. Minimos
Andersen; Powell, 2000 Circuitos hipotticos X
quadrados
Soares, 2003 Problema Inverso. AGs Circuitos hipotticos X - -
MH_P Poulakis; Valougeorgis; Probabilidad Bayesiana e
Circuitos hipotticos X - -
Papadimitriou, 2003 modelos parametricos
Colombo, 2007 Problema Inverso. AGs Setor de rede real - - X
Wu, 2009 Problema Inverso. AGs Setor de rede real - - X
Circuitos hipotticos e
Wu; Sage; Turtle, 2010 Problema Inverso. AGs X - X
Setor de rede real
Modelos Em Regime Transitrio
Anlise transitrio inverso
Liggett; Chen, 1994 Circuitos hipotticos X
(ITA)
Vitkovsky; Simpson; Anlise transitrio inverso
Circuitos hipotticos X
Lambert, 2000 (ITA) e AGs
Kapelan; Savic; Walters, Anlise transitrio inverso
Circuitos hipotticos X - -
2003 (ITA), AGs e LVM
MH_T Saldarriaga; Fuentes; Anlise transitrio inverso
Setor de rede real - - X
Galvis, 2006 (ITA) e AGs
Anlise transitrio inverso Circuitos hipotticos e de
Soares, 2007 X X -
(ITA) e AGs laboratrio
Anlise transitrio inverso Sistema aberto de
Covas; Ramos, 2010 - X -
(ITA) laboratrio
Anlise transitrio inverso
Soares; Covas; Reis, 2011 Circuito laboratrio - X -
(ITA), AGs e LVM
AS Mtodos Baseados Na Analise De Sinais
Anlise De Sinais De Presso Durante Um Transitrio Hidrulico
Mpesha; Gassman; Fluxo oscilatorio. Resposta em
Sistema aberto hipottico X - -
Chaudhry, 2001 frequencia
Amortecimento da onda. Sistema tubulao nica
Wang et al., 2002 X X -
Harmonicos hipottico e de laboratrio
Teste transitoro. Anlise Sistema tubulao nica
Ferrante; Brunone, 2003 X X -
harmnico hipottico e de laboratrio
Teste transitoro. Anlise Sistema tubulao nica de
Ferrante; Brunone, 2003 - X -
wavelet laboratrio
Misiunas, 2003; Misiunas et Sistema tubulao nica de
Sumas cumulativas (CUSUM) - X X
AS_T al., 2005 laboratrio e real
Covas; Ramos; Almeida, Fluxo oscilatorio. Resposta em
Sistema aberto hipottico X - -
2005 frequencia
Ferrante; Brunone; Teste transitoro. Anlise Sistema tubulao nica
X X -
Meniconi, 2007 wavelet hipottico e de laboratrio
Ferrante; Brunone; Teste transitoro. Anlise Sistema aberto (juno) de
- X X
Meniconi, 2009 wavelet laboratrio e real
Sistema tubulao nica de
Aguiar, 2010 Classificao com RNA - X -
laboratrio
Teste transitoro. Anlise Sistema aberto (juno)
Meniconi et al., 2011 - - X
wavelet e Lagrange real
Anlise De Sinais Durante Operao Da Rede
Buchberger; Nadimpalli, Setor de rede hipottico e
Analise estatistico de vazes X - X
2004 real
Aksela; Aksela; Vahala,
Mapas auto organizados Setor de rede real - - X
2009
Romano; Kapelan; Savic, Controle estatistico e
Setor de rede real - - X
2009 inferencia Bayesiana
AS_O
Mounce; Boxall; Machell,
RNA e Logica Difusa Setor de rede real - - X
2010
Ye; Ph; Fenner, 2011 Filtros Kalman Setor de rede real - - X
Palau; Arregui; Carlos, Analise de componentes
Setor de rede real - - X
2012 principais
Romano; Kapelan; Savic, RNA, Controle estatistico e
Setor de rede real - - X
2012 inferencia Bayesiana
24
Os mtodos para a resoluo do modelo tambm podem ser classificados em dois tipos,
explcitos ou implcitos. Nos mtodos explcitos, o funcionamento hidrulico do sistema
descrito por N equaes no lineares, onde esto envolvidas as caractersticas da rede e as
demandas, e por N incgnitas representando o estado do sistema. Os valores das incgnitas
so encontrados atravs da resoluo do sistema de equaes. Poucos problemas podem ser
25
representados fielmente com esta abordagem simplificada, mas tem sido utilizada para a
calibrao do fator de atrito e as demandas nos ns usando desde mtodos de tentativa e erro
at resolues complexas do sistema de equaes da hidrulica da rede (SOARES, 2003).
A modelagem hidrulica pode ser feita para o regime permanente (MH_P) ou no permanente
(MH_T), sendo este o critrio de classificao das tcnicas de deteco de vazamentos
referidas a seguir.
Nos modelos hidrulicos de redes em regime permanente, suposto que as mudanas na rede
so instantneas, passando de um estado permanente para outro, desconsiderando a transio.
As equaes que descrevem o funcionamento hidrulico da rede sob regime permanente so
conhecidas e aceitas para propsitos diversos tais como projetos, reabilitao, e otimizao da
operao de sistemas de distribuio de guas para abastecimento. Existe atualmente uma
grande quantidade de simuladores hidrulicos no regime permanente, com diferentes graus de
complexidade e limitaes, alguns deles desenvolvidos por grupos de pesquisa das
universidades (Crede), outros por agncias pblicas (Epanet), ou companhias comerciais
(WaterCad, InfoWater,H2OMap). No regime permanente factvel estudar simultaneamente
presso e vazo, considerando a capacidade de sensores e sistemas de aquisio,
diferentemente das anlises em regime transitrio, como discutido na seo 3.1.2.
A deteco de vazamentos por MH_P pode ser abordada com a incorporao de demandas ou
sadas adicionais e desconhecidas nos ns da rede. Os valores de tais demandas ou sadas, que
podem ser maiores ou iguais a zero, podem ser tambm variveis de deciso do problema de
otimizao utilizado para calibrao de redes (quando usada a abordagem implcita para
resoluo do problema inverso (PUDAR; LIGGETT, 1992)). Assim, em algumas pesquisas
sobre calibrao de modelos que podem ser encontrados os primeiros esforos para a deteco
de vazamentos.
26
Por exemplo, na proposta apresentada por Wu (2009) e Wu, Sage e Turtle (2010), os
vazamentos dependentes da presso so includos no modelo hidrulico e a definio dos
parmetros, em cada n, essencialmente um problema de calibrao, resolvido com AGs.
Nesse ltimo trabalho apresentada a aplicao do mtodo a uma rede terica e a um setor de
rede real com dados adquiridos no perodo de mnima demanda obtendo, segundo os autores,
resultados positivos, mesmo limitados pelas dificuldades da modelagem hidrulica e da
acurcia na medio. O modelo de vazamentos incorporado ao modelo hidrulico define uma
relao potencial da vazo de sada do vazamento com a presso. Usualmente essa relao
pode ser dada pela equao de um orifcio ou por formulaes especficas que mudam
segundo a magnitude e tipo do vazamento.
Com uma abordagem menos comum, Anderson e Powell (2000) apresentaram uma
metodologia para deteco de vazamentos baseada na estimao de estado, isto , o clculo de
presses e vazes, dados os parmetros fixos do sistema, usando mtodo implcito de
27
O principio bsico utilizado que, quando um transitrio acontece, uma onda se movimenta
pelo sistema com umas caractersticas de propagao dadas, at encontrar uma
descontinuidade (como um vazamento, mudana de dimetro, mudana de material, etc.); por
efeito de dita descontinuidade as caractersticas da onda so modificadas, e essa modificao
perceptvel tambm em outros pontos do sistema, pela propagao. Assim, estudando o sinal
original e a modificao que sofreu, possvel identificar a singularidade que a produz e sua
localizao.
A ideia central antes exposta aplicada no mtodo de anlise do transitrio inverso (ITA, do
ingls Inverse Transient Analysis) (LIGGETT; CHEN, 1994), procurando a grandeza e
localizao de vazamentos no modelo hidrulico de transitrio, que minimizem a diferena
entre o diagrama de presso em funo do tempo modelado e o medido no sistema. Autores
posteriores tm feito aportes a esta abordagem, usando como metodologias de otimizao os
algoritmos genticos (VITKOVSKY; SIMPSON; LAMBERT, 2000), o mtodo de
Levenberg-Marquardt (LVM), ou mtodos hbridos (KAPELAN; SAVIC; WALTERS, 2003)
(SOARES; COVAS; REIS, 2011).
Mesmo sendo uma tcnica bem estudada, so poucos os relatos na literatura sobre sua
aplicao prtica, como mostrado na Tabela 1. Uma mesma rede terica simples foi
considerada na apresentao de vrias das metodologias propostas (KAPELAN; SAVIC;
WALTERS, 2003; LIGGETT; CHEN, 1994; VITKOVSKY; SIMPSON; LAMBERT, 2000),
28
Por outro lado, os mtodos baseados no regime no permanente apresentam uma limitao
adicional devido a que para implement-los necessrio gerar fenmenos transitrios no
sistema a avaliar, o que no caso de redes de abastecimento implicaria em grande risco de
falha. Alm disso, existe a dificuldade de estudar as vazes durante o transiente, dado que a
maioria de medidores no responde instantaneamente s mudanas, limitando assim as
anlises aos registros de presses (PUUST et al., 2010).
Da mesma forma que as tcnicas MH-T (seo 3.1.2), nas tcnicas AS_T aproveitada a
mudana que um vazamento causa na propagao da onda durante um fenmeno transitrio.
Quando acontece um transitrio hidrulico gerado por uma manobra no sistema, e, durante a
30
sua propagao a onda encontra um vazamento este ter um efeito que pode ser de
amortecimento e reflexo (COLOMBO; LEE; KARNEY, 2009). Tambm o prprio
surgimento de um vazamento gera um transitrio hidrulico e ondas que se deslocam pelo
sistema. Identificar e quantificar todas essas alteraes e correlacion-las com um vazamento
o foco dos mtodos de deteco AS_T que, diferentemente dos mtodos MH_T, utilizam as
informaes monitoradas em um nico ponto do sistema ou cada um dos pontos monitorados
analisado isoladamente.
Entre as tcnicas AS_T propostas nos ltimos anos est a deteco de rupturas fazendo uso do
algoritmo CUSUM (do ingls Cumulative Sum) na anlise de sinais de presso (MISIUNAS,
2003; MISIUNAS et al., 2005). Essa tcnica visa identificar a onda de presso produzida por
uma ruptura que d origem a um vazamento para extrair dela informaes sobre a localizao
e magnitude do vazamento, relacionados com os tempos de chegada e as amplitudes das
ondas. Para tanto, so usadas informaes de monitoramento permanente da presso em um
nico ponto de uma tubulao em circuito aberto.
Outro tipo de anlise de sinais de presso durante o transitrio gerado pelo prprio vazamento
foi aplicado por Aguiar (2010), utilizando redes neurais artificiais (RNA) para a identificao
de padres de mudana no sinal relacionados com o incio de um vazamento. A tcnica visa
distinguir sinais de presso como pertencendo a uma de duas classes: referente ao incio de
um vazamento ou sem vazamento. Usando sinais de presso adquiridos durante a simulao
da ocorrncia de vazamentos com abertura de vlvulas num sistema experimental, foi treinada
uma rede neural do tipo Perceptron feedforward. A RNA tem como entrada um segmento do
sinal, i.e. um conjunto de valores de presso adquiridos (e normalizados), e como sada dois
valores cada um deles relativo semelhana com uma das classes possveis. Esse processo
pode ser visto como um aprendizado de mquina supervisionado.
A anlise de sinais pode ser realizada sobre diferentes representaes ou domnios, como
explicado na seo 4.2. Os dois trabalhos antes referidos analisam os sinais na sua
representao original, no domnio temporal, enquanto outros muitos autores tm proposto
mtodos aplicando transformaes de domnio para, por exemplo, fazer as anlises de
resposta em frequncia ou de harmnicos. A ideia anterior aplicada nos trabalhos referidos
a seguir, nos quais, adicionalmente, as informaes relativas presena de vazamentos so
investigadas durante a ocorrncia de fenmenos transitrios controlados e gerados
artificialmente, diferentes dos produzidos pelo prprio incio do vazamento.
31
Wang et al. (2002) propem o estudo do amortecimento da onda de presso gerada por um
transitrio hidrulico como ferramenta para detectar, localizar e quantificar um vazamento. O
amortecimento da onda devido frico estudado em uma tubulao sem nenhum
vazamento, seja mediante anlise numrica ou medio direta das presses num ponto, e
posteriormente estudado o mesmo sistema com presena de vazamento. Os sinais de presso
assim obtidos so separados em segmentos relacionados com o perodo da onda, a forma de
separar as partes correspondentes a cada reflexo da onda, e a cada um desses segmentos
aplicada a transformada de Fourier. No trabalho citado desenvolvida analiticamente uma
expresso para o amortecimento do transiente, sendo exatamente exponencial se o
amortecimento devido unicamente ao atrito e aproximadamente exponencial se o vazamento
tambm contribui para o amortecimento. A amplitude de cada um dos componentes
harmnicos resultantes da transformada analisada juntamente com os parmetros de
amortecimento, de forma de obter as concluses buscadas. feita a apresentao numrica do
mtodo e tambm uma validao em teste de laboratrio com tubulao nica.
32
Em um estudo de validao da tcnica proposta por Wang et al. (2002) concluiu-se que sua
aplicao est limitada a sistemas que no envolvem nenhuma descontinuidade interna e a
fenmenos transitrios instantneos e de pequena amplitude cuja durao seja menor do que o
tempo de viagem da onda at o ponto de monitoramento (NIXON et al., 2006).
Uma tcnica AS_T destacada que usa transitrios hidrulicos gerados por manobras de
fechamento rpido e anlise de harmnicos apresentada por Ferrante e Brunone (2003a).
Estudando no domnio da frequncia as equaes que descrevem o escoamento transitrio,
obtm-se a expresso analtica para as presses na sada da tubulao. Esse sinal de sada no
domnio da frequncia depende das caractersticas da manobra que produz o transitrio e das
caractersticas do sistema, e modificado tambm pela presena de um vazamento. Sinais de
presso so adquiridos sob o transitrio gerado controladamente e so transformados ao
domnio da frequncia usando transformada de Fourier, para posteriormente compar-los com
a resposta analtica ou com a de experimentos anteriores. A anlise comparativa permite a
identificao de distores que indicam a presena de vazamento na tubulao. A
metodologia foi aplicada a um sistema aberto de tubulao nica, com vlvula de fechamento
na sada, e medio das presses em alta frequncia de aquisio.
A anlise anterior pode ser estendida de sistemas de uma nica tubulao a sistemas com
bifurcao (FERRANTE; BRUNONE; MENICONI, 2009), e ainda melhorias so propostas
pela integrao de modelos de Lagrange. O uso desses modelos Lagrangianos para avaliar as
causas das singulares detectadas com a anlise wavelet (MENICONI et al., 2011) foi testado
em campo em uma tubulao adutora.
Podem ser citados vrios trabalhos que analisam os sinais de vazes de entrada em um setor
de rede de abastecimento, como os resumidos a seguir. Anlises estatsticas da vazo no
perodo de baixa demanda (considerada como varivel aleatria) so a base da proposta de
Buchberger e Nadimpalli (2004), que validada somente para setores residenciais pequenos,
onde possam ser descartados consumos noturnos importantes e variveis. Segundo o mtodo,
a partir dos dados de vazo de entrada a uma rea residencial adquiridos durante o perodo de
mnima demanda , so calculados os parmetros da distribuio de probabilidade normal das
medies. A srie observada truncada e reavaliada sua mdia e desvio padro, processo que
se repete at atingir uma quantidade mnima de leituras na amostra suficiente para a
determinao de tais parmetros. O comportamento esperado dos parmetros em relao ao
nvel de truncamento definido teoricamente, e uma divergncia abrupta nele interpretada
como um vazamento. Tambm analisando essa divergncia estimada a ordem de grandeza
das perdas. Segundo os autores, para aplicao da tcnica preciso contar com medies de
alta frequncia, da ordem de um valor cada 5s a 1s, e uma rea monitorada com menos de mil
residncias.
Usando ferramentas mais complexas para anlise dos sinais de vazo num setor de rede,
Mounce, Boxal e Machell (2010) propem um mtodo para deteco de vazamentos e outras
anormalidades em tempo real, usando inteligncia artificial, cujas bases foram apresentadas
em publicaes anteriores (MOUNCE et al., 2006, 2007, 2008 apud (ROMANO;
KAPELAN; SAVIC, 2009). Dados de vazo coletados na rede com intervalos de 15 minutos,
durante os trs meses imediatamente anteriores anlise so submetidos a um pr-
processamento, para serem utilizados no treinamento de uma rede neural artificial (RNA).
Posteriormente construdo o modelo de densidade de probabilidade para as vazes futuras
produzidas pela RNA. Sries atualizadas de valores observados so comparadas em tempo
real com as previses para perodos de duraes variveis; com um sistema de inferncia
difusa gerado um alerta quando detectadas observaes anormais. Baseado na densidade de
probabilidades, para cada evento associado um intervalo de confiana que permite
classificar e priorizar os alarmes. O mtodo foi testado para uma rede de distribuio de gua
potvel do Reino Unido com sucesso.
35
Por outro lado, o mtodo apresentado por K. Aksela, M. Askela e Vahala (2009) est baseado
nos mapas auto-organizados (SOM, do ingls Self Organizing Maps), que correspondem a um
tipo de RNA treinada usando aprendizado no supervisionado para o agrupamento de um
conjunto de entradas e que produz sua representao com menor dimensionalidade, que so os
chamados mapas. As informaes utilizadas para a construo do modelo de vazamentos so
sinais de vazo e registros de vazamentos conhecidos, num setor de rede real. Uma frmula
emprica de vazamento em funo da distncia ao sensor e do tempo definida para o caso
estudado. As entradas do SOM so os sinais de vazo, depois do pr-processamento, com
base semanal, correspondentes a todo o perodo de dados. A funo de vazamento emprica
incorporada, resultando na construo de mapas dos padres de vazo usados para indicar o
valor da funo de vazamento. Depois do processo de treinamento antes descrito, os mapas
criados permitem identificar um vazamento.
Ainda dentro das tcnicas baseadas nos registros de vazo em setores monitorados da rede,
tambm est a anlise de componentes principais (PCA, do ingls Principal Component
Analysis) para deteco de vazamentos (PALAU; ARREGUI; CARLOS, 2012). A tcnica de
PCA permite, com uma transformao ortogonal, reduzir uma matriz de alta dimensionalidade
como a de vazes num setor durante um determinado perodo, para uma matriz de
dimensionalidade menor na qual toda a variabilidade dos dados expressa num conjunto de
poucas variveis linearmente descorrelacionadas. Assim, construdo um modelo estatstico
que representa o comportamento da rede baseado exclusivamente nos sinais adquiridos.
Quando um vazamento se incorpora vazo, os valores das componentes mudam, e fazendo
uso de tcnicas estatsticas de controle possvel a identificao de anomalias, incluindo
inicio de vazamentos.
As tcnicas baseadas na anlise de sinais durante a operao da rede (AS_O), apesar do curto
tempo desde seu surgimento, tm se mostrado promissoras. Porm, no tm sido publicadas
suas aplicaes efetivas a sistemas reais, possivelmente pelo tempo que naturalmente leva a
transferncia de tecnologia para a indstria, mas tambm por caractersticas das prprias
tcnicas que precisariam ser melhoradas para sua implementao generalizada. A aplicao de
37
tcnicas de inteligncia artificial na anlise dos sinais nas tcnicas AS_O ainda inovadora,
sendo que, a cada nova pesquisa com resultados positivos, novas possibilidades de melhoria
so abertas. Reconhecendo que os objetivos prticos do seu desenvolvimento no tm sido
satisfatoriamente atingidos, h um grande interesse por continuar explorando esta abordagem.
38
Um sinal pode ser definido como qualquer ente fsico que varia ao longo do tempo, espao ou
outra varivel independente (ou vrias delas) (PROAKIS; MANOLAKIS, 2007). Todo sinal
pode ser representado matematicamente como funo de uma ou diversas variveis
independentes. Segundo a definio anterior tanto a presso quanto a vazo em pontos de uma
rede podem ser estudados como sinais que, para as anlises de interesse, so considerados
independentes entre si, de forma a consider-los como sinais unidimensionais, variveis no
tempo somente.
entendendo as variveis do sistema, presso e vazo, como sinais, que foram neste trabalho
exploradas metodologias de processamento de sinais. O termo processamento de sinais
muito abrangente, pois considera todos os sistemas (fsicos ou lgicos) que realizam
operaes sobre o sinal, seja com o fim de produzir um sinal alterado ou de extrair
informaes de interesse, neste ltimo caso com o nome mais apropriado de anlise de
sinais.
Os sinais podem ser classificados em dois tipos bsicos: analgicos e digitais. Se a varivel
independente contnua e os valores da varivel dependente esto tambm numa faixa
contnua, o sinal analgico. Se tanto a varivel independente quanto a varivel dependente
so discretas, ento o sinal dito digital. A grande maioria de sinais no mundo fsico,
incluindo a presso e a vazo, analgica: por exemplo, em todo instante de tempo sem
interrupo existe uma presso, e sua magnitude instantnea pode assumir infinitos valores.
possvel o processamento de sinais analgicos, mas os mtodos mais avanados de anlise e
39
Para o presente trabalho de pesquisa, e como apresentado na seo 5.2, as presses e vazes
na rede foram medidas pelos transdutores e hidrmetros, e transmitidas para uma placa de
aquisio de dados que controla o processo de converso e transmisso do sinal digital para o
microcomputador.
4.2.TRANSFORMAES DE DOMNIO
A presso e vazo na rede so neste trabalho, segundo explicado na seo anterior, sinais
digitais variveis no tempo, isto , sinais temporais discretos. O sinal composto por sries de
valores instantneos, e pelo processo de digitalizao usado, os intervalos de tempo entre
valores sucessivos so constantes. De acordo com essa representao temporal, as mudanas
nos valores correspondem a mudanas no estado do sistema observado, em funo do tempo.
Quando um sinal analisado nessa representao, como uma sequncia de valores no tempo,
fala-se de anlise no domnio do tempo. Com o sinal no domnio do tempo podem ser feitas
transformaes no sinal tais como a padronizao (seo 6.1), podem ser calculadas
caractersticas como energia, potncia, entropia e outras (seo 6.2), podem realizar-se
operaes como adio, multiplicao ou mudana de escala, dentre muitas outras opes de
anlise e processamento de sinais.
Seja considerado um sinal temporal discreto peridico (no qual as mesmas sequncias de
valores repetem-se a cada certo nmero de intervalos no tempo), por exemplo, um sinal
senoidal. Nesse sinal simples, o perodo definido como o tempo transcorrido para a
repetio da sequncia de valores (ciclos), e a frequncia o inverso do perodo, ou o nmero
de ciclos numa unidade de tempo. Portanto, esse sinal senoidal simples ter um nico valor de
frequncia representativo, comumente medido em unidade de s-1 = Hz. Se o sinal no fosse
simplesmente senoidal, mas composto pelo somatrio de vrias funes senoidais de
diferentes perodos, ao invs de um nico valor o sinal teria mltiplos valores de frequncia
presentes. Um sinal mais complexo composto por uma faixa muito ampla de frequncias
diferentes. A anlise dessas frequncias presentes no sinal, ao invs dos valores em funo do
tempo, corresponde anlise no domnio da frequncia.
(MALLAT, 1999). A principal limitao deve-se a que com esse tipo de transformao
possvel saber quais frequncias compem um sinal, mas sem nenhuma indicao do
momento (ou valor no eixo temporal original) no qual essas frequncias se apresentam.
-1
-2
0 0.5 1 1.5 2 2.5 3
As funes wavelet so combinadas, mudando sua escala e posio, para transformar o sinal
em anlise para uma representao mais til. A mudana de escala, que equivale expanso
ou contrao da funo, est tambm indiretamente relacionada com as frequncias presentes
no sinal, enquanto a posio refere-se ao eixo temporal original do sinal. Assim, a
transformada wavelet permite analisar as frequncias presentes no sinal sem perder as
informaes referentes ao sinal no tempo. A transformada wavelet discreta de um sinal
definida como segue:
( )( ) ( ) ( ) ( ) ( )
1
A convoluo um operador linear que transforma duas funes em uma terceira funo, no caso a
convoluo da funo wavelet e o sinal d origem ao sinal transformado.
43
Nvel
Tamanho N
m=0 Sinal Original
m=1
m=2
Componentes (aprox. e
detalhe) da dec. wavelet
m=3
discreta at nvel 3
A quantidade de elementos nos vetores de aproximao e detalhes muda de forma tal que em
todo nvel m o total de elementos de todas as componentes igual a N. Adicionalmente, cada
uma das componentes corresponde a uma representao da durao completa do sinal.
Lembrando tambm que cada decomposio produz uma diviso mais fina da faixa de
frequncias contidas em cada componente, entende-se que nveis de decomposio (m)
maiores implicam uma maior resoluo na frequncia, mas menor resoluo temporal,
44
enquanto nveis m menores fornecem melhor resoluo temporal, mas pobre resoluo de
frequncias. A seleo do melhor nvel de decomposio varia de um problema para outro,
sendo necessrio avaliar conjuntamente o ganho e o custo do clculo. Essa seleo para o
presente estudo apresentada na seo 7.1.
Nvel Tamanho N
m=1
m=2
Componentes (aprox. e
detalhe) da dec. wavelet
m=3
package at nvel 3
Assim, o aprendizado indutivo realizado pela anlise de exemplos obtidos com anterioridade
ao processo de aprendizado. Segundo as informaes anteriores fornecidas ao processo de
aprendizado, este pode ser supervisionado ou no supervisionado. No aprendizado
supervisionado para cada um dos exemplos fornecida tambm a resposta ou sada
correspondente, enquanto no aprendizado no supervisionado o prprio algoritmo dever
tentar agrupar e a interpretao desse agrupamento usualmente requer uma anlise posterior.
5.1.MONTAGEM EXPERIMENTAL
O circuito hidrulico experimental um sistema para estudo sobre uma rede de condutos
forados, com monitoramento automtico de presses e vazes, localizado no laboratrio de
Hidrulica Ambiental do Centro de Recursos Hdricos e Ecologia Aplicada (CRHEA). O
sistema completo composto pela rede de tubulaes em policloreto de vinila (PVC)
desenvolvida verticalmente, o sistema de alimentao e o de aquisio de dados, cujo
esquema apresentado na Figura 6.
Para a alimentao do sistema hidrulico utilizada uma estao de bombeamento, com duas
bombas centrifugas em paralelo, de potncia 1 cv e 5 cv respectivamente, e com uma vlvula
de reteno a jusante delas. O bombeamento se d a partir de um reservatrio com nvel de
5 m, ao qual tambm retorna a vazo depois de circular pela rede, constituindo um circuito
fechado.
0 1m 2m 3m 4m
Escala
47
48
5.2.AQUISIO DE DADOS
A aquisio de dados feita por 15 transdutores de presso com escalas de at 100, 200 e
300 psi, preciso de 0,25% do fundo de escala, e sada em corrente na faixa de 4 a 20 mA.
Para a medio de vazes de sada do circuito pelas vlvulas de simulao de vazamentos so
usados 9 medidores tipo hidrmetro com sensor eletrnico incorporado. Trs medidores
eletromagnticos de vazo de 100 mm de dimetro, com escala de 0 a 50 m3/h, esto
localizados nas tubulaes de entrada, de sada e uma intermediria. A localizao e
nomenclatura dos medidores so apresentadas na Figura 7.
Todos os sensores esto ligados a conversores analgicos para ajustar os diferentes tipos de
sinal que alimentam uma placa de aquisio de dados. A placa est comunicada com um
microcomputador no qual um software especificamente desenvolvido para o projeto permite
controlar a aquisio. No software tambm so incorporadas as equaes de calibrao de
cada um dos sensores e possvel fazer acompanhamento. possvel acompanhar os valores
das variveis adquiridos a partir de cada sensor, com atualizao a cada segundo,
graficamente. Para a gravao dos dados durante experimentos possvel escolher os sensores
a serem considerados, a taxa de aquisio (entre 1 amostra/minuto e 12000 amostras/minuto),
e o tempo total de aquisio (de 1 minuto at 48 horas). Tambm atravs do sistema as
bombas e a vlvula automtica podem ser acionadas usando o software. Na Figura 8
apresentada uma vista da interface visual do software.
P15
P6 P7
P8
Q3
Q1
P16 P1
P3 P4 P5
P2
V1
0 1m 2m 3m 4m
Escala
49
50
Para a construo e teste do sistema de reconhecimento de padres foi usada uma base de
dados de exemplos adquiridos junto ao circuito hidrulico experimental. Com os 15 sensores
de presso e 3 de vazo simultaneamente, foram adquiridos exemplos de duas classes: sem
vazamento (SEM) e durante o incio de um vazamento (COM). No total, para cada um dos 18
sensores conta-se com 620 exemplos, sendo 310 para cada uma das classes.
51
Figura 9. Trs exemplos de sinais da classe SEM adquiridos com o sensor P02 para trs diferentes vazes
no circuito (Q).
Por sua vez, os exemplos da classe COM foram adquiridos durante experimentos nos quais
um registro de simulao de vazamento (V1 na Figura 7) era aberto rapidamente. Na Figura
10 so apresentados trs exemplos da classe COM nos quais possvel identificar
visualmente a queda de presso devida ao vazamento. Salienta-se que essa identificao
difcil para a maior parte dos exemplos.
52
Figura 10. Trs exemplos de sinais da classe COM adquiridos com o sensor P02 para trs diferentes
vazes no circuito (Q) e diferentes magnitudes de vazamento (V).
Provavelmente o jeito mais rudimentar de abordar a tarefa seria examinar uma representao
grfica do sinal e determinar se h ou no uma anormalidade, com base no conhecimento
prvio, capacidade e at intuio. Claramente, essa metodologia tem grandes limitaes,
praticamente impossvel us-la para processar uma quantidade importante de informaes.
Ainda seus resultados sero diferentes, por exemplo, segundo a pessoa que faz a avaliao, a
escala e a forma de representao do sinal, dentre muitos outros fatores, fazendo com que
grande quantidade de singularidades seja despercebida e a taxa de falsos alarmes seja grande
demais.
Um sistema de reconhecimento de padres tem uma estrutura bsica que compreende vrias
etapas; um novo sinal de entrada pode passar (ou no) por processo de segmentao, depois
passa pela extrao de caractersticas e finalmente classificado. Segundo indicado na seo
4.4, a classificao um problema de aprendizado de mquina supervisionado no qual
utilizada a informao de exemplos acertadamente classificados para possibilitar que um novo
sinal seja atribudo a uma das classes. Portanto a resposta que entrega o sistema o nome da
classe qual pertence o sinal de entrada dado. Cada uma das etapas, mostradas na Figura 11,
ser brevemente descrita em este documento.
54
AQUISIO DECISO
Extrao de
Sinal caracterstica Sada
Entrada s
a Segmentao e
Classificao
padronizao
6.1.SEGMENTAO E PADRONIZAO
O uso da janela deslizante como tcnica para segmentao tem diferentes variaes, entre elas
a forma da janela, ou a funo pela qual so lidos os dados do sinal para construir cada
segmento. O tipo de janela mais simples a janela retangular, que pode ser representado
como:
[ ]
{
m = 1, 2... M
O tamanho de segmentos mais conveniente pode variar muito de um para outro problema e
no existem regras definidas para a sua escolha. Atendendo s necessidades especficas dos
dados adquiridos experimentalmente, foi definido usar segmentos com 240 pontos, o que
significa durao de 1 minuto com taxa de amostragem de 4 amostras/segundo. A tcnica foi
adaptada s condies de execuo dos ensaios, de forma a garantir a adequada distino
entre segmentos relativos s classes COM e SEM. Cada um dos segmentos ser considerado
nas anlises seguintes como um exemplo isolado, passando a usar o termo sinal para cada um
dos segmentos extrados do sinal adquirido.
As diferenas nas grandezas medidas no esto relacionadas com o fenmeno que queremos
reconhecer, o vazamento. Assim, visando capacidade de generalizao do sistema de
reconhecimento, essas diferenas podem ser desconsideradas. Para tanto, todos os sinais
utilizados (depois do processo de segmentao) so padronizados, segundo a expresso
seguinte:
| |
6.2.EXTRAO DE CARACTERSTICAS
Cada um dos sinais usados na pesquisa representado por um vetor de 240 valores
sequenciais de presso ou vazo, que podem estar afetados por rudo, variaes originadas na
medio, transmisso, ou ainda por fenmenos fsicos como micro turbulncias. Pela
conformao dos exemplos, o tamanho de todos eles igual, mas em condies menos
controladas so comuns sinais com diferentes duraes ou taxa de amostragem, dados
faltantes ou valores errados que precisam ser desconsiderados, de forma que o sinal ou vetor
de entrada comumente tem tamanho varivel e grande.
Assim, a anlise dos valores brutos do sinal adquirido pode ser prejudicada pela presena de
perturbaes, a variabilidade no tamanho dos sinais, e o alto custo computacional da anlise
com sries longas. Em resposta a esses problemas, diversas metodologias de processamento
de sinais fazem uso da extrao de caractersticas. A extrao de caractersticas permite
analisar, ao invs do grande vetor de valores do sinal, caractersticas que dele derivam e que
podem ser representadas em um vetor muito menor, que ainda mantenha a capacidade de
distinguir a classe a que um exemplo pertence.
2
Os valores das caractersticas extradas so vetores de um ou mais elementos, por isso que ao extrair as
quatro caractersticas (explicadas na seo 6.2) o resultado um vetor de sete elementos.
58
ENE ENT
220 9.5
170 8.5
classe
com
120 7.5 sem
70 6.5
20 5.5
ENE ENT
NCZ 100
EDW
200
75
160
120 50
80
25
40
0
NCZ A3 D3 D2 D1
Figura 12 Exemplo de dois sinais de presso Figura 13 Caractersticas extradas dos dois sinais de
adquiridos. presso.
Existe uma grande diversidade de caractersticas que podem representar o sinal, que podem
ser julgadas mais ou menos importantes, considerando o tipo de sinal e os objetivos da
anlise. Para identificar quais as caractersticas que melhor poderiam ser adaptadas ao sistema
de reconhecimento de padres para deteco de vazamentos, foi explorada a extrao de
quatro tipos de caractersticas diferentes e avaliados os resultados de sistemas construdos a
partir de cada uma, e de sua associao.
A energia de um sinal temporal discreto uma medida do grau de distanciamento dos valores
com relao sua mdia, e definida como:
Para cada um dos sinais obtido um valor de energia total. Teoricamente para o sinal
padronizado onde xi [-1,1] o valor de energia deve cumprir ENE < N.
59
Com a expresso anterior, e considerando cada um dos sinais exemplo como o vetor X,
calculado um valor de entropia para cada sinal.
Se a grandeza dos valores do sinal seguisse uma distribuio uniforme o valor da entropia
seria determinado somente pelo tamanho do vetor. O valor mnimo da entropia se apresentaria
no caso hipottico de somente um elemento do vetor ser diferente de 0. Assim, e lembrando
que os sinais adquiridos so padronizados de forma a ter valores xi [-1,1], o valor da
entropia calculado ser necessariamente ENT < 7.9.
O nmero de cruzamentos por zero, como o prprio nome indica, nada mais que a contagem
do nmero de ocorrncias de um elemento positivo aparecer imediatamente depois de um
elemento negativo, ou um negativo depois de um positivo.
60
( )
I(s) = 1 se s = Verdadeiro
I(s) = 0 se s = Falso
Para analisar os resultados da decomposio wavelet estuda-se em qual das componentes est
concentrada mais ou menos informao, o que pode ser medido com os valores da energia
definida anteriormente (6.2.1). calculado o valor da energia correspondente a cada um dos
componentes resultantes da decomposio, e expresso como percentagem da energia total dos
m+1 componentes. A caracterstica de distribuio da energia nas componentes da
decomposio wavelet (EDW) do sinal corresponde ao vetor de valores resultante, composto
de m+1 nmeros reais de 0 at 100.
61
6.3.CLASSIFICADOR
dos sinais de exemplo adquiridos, representado pelo seu vetor de caractersticas de tamanho
V, pode ento ser visto como um ponto no espao de entrada, ou um vetor desde a origem at
esse ponto, e que tem associada a sua classe j conhecida (BEALE; JACKSON, 2010). Na
Figura 14 apresentado um exemplo de espao de entradas usando vetores de caractersticas
de dimenso trs (CAR.1, CAR.2, CAR.3) para elementos pertencentes a duas classes (A e
B).
CLA SSE
A
B
120
80
CAR. 1 40
0
0
8
50
6
CAR. 3
4
100 2 CAR. 2
Figura 14. Espao de entrada para elementos de dimenso trs pertencentes a duas classes
Escolher os k elementos (vetores) mais prximos, quer dizer com menor distncia de
x0, independentemente da classe que pertencem. A definio do melhor valor de K
abordada na seo 7.2.
( ) ( )
Segundo o algoritmo KNN, como todos os classificadores baseados em distncia, a escala dos
valores um fator muito importante. Por exemplo, dentre as caractersticas apresentadas na
seo 6.2 algumas esto na faixa de 1 at 100 enquanto outras so sempre menores do que 10.
Considerando que uma distncia proporcionalmente pequena na coordenada WDE teria uma
importncia muito maior que uma distncia proporcionalmente alta na coordenada ENT, para
evitar essa assimetria, os valores das caractersticas so padronizados antes de executar o
algoritmo de classificao. A padronizao realizada para que todas as caractersticas
fiquem expressas no intervalo de 0 at 1, segundo:
chegar finalmente a uma classe na qual o elemento possa ser alocado. A definio das regras
sequenciais que constituem uma rvore de deciso corresponde com a diviso sucessiva do
espao de entrada (seo 6.3.1) em regies no intersectadas menores que correspondem s
diferentes classes. Essa diviso feita normalmente com hiperplanos de lados paralelos aos
eixos, isto quer dizer que cada uma das regras para a diviso corresponde a uma pergunta
binria relativa a uma caracterstica, do tipo a caracterstica C menor que o valor Y?.
Existem tambm outros tipos de funes mais complexas, mas sua aplicao prtica menos
comum.
Figura 15. Exemplo de rvore de deciso para duas classes, com quatro caractersticas.
espao a que ele corresponde. Para tanto, seus valores so submetidos sequncia de testes da
rvore de deciso at chegar a um n folha.
Uma variao interessante da classificao com regras de deciso o algoritmo de uma nica
regra (1R ou OneR, do ingls One Rule), apresentado por Holte (1993). Atravs da
experimentao com diversas bases de dados foi comprovado que o mesmo desempenho dos
classificadores comuns, como as rvores de deciso, pode ser atingido tambm com um
algoritmo muito mais simples baseado numa nica regra, que pode ser entendida como uma
rvore de deciso para um nico atributo. Para cada qual dos atributos, a faixa total de valores
dividida em uma quantidade finita de intervalos dentro dos quais estejam contidos pelo
66
( | ) ( | )
( ) ( | )
( | )
( )
( ) ( | ) ( )
A probabilidade a priori de cada classe deve ser definida para o problema ao qual se aplica,
por exemplo, segundo a frequncia relativa de cada classe no conjunto de exemplos,
assumindo distribuio uniforme das classes ou adotando valores diferentes segundo
conhecimento adquirido sobre a ocorrncia das classes no fenmeno real. Nas anlises
seguintes foi utilizada a probabilidade a priori de ( ) ( )
O termo Rede Neural Artificial (RNA, ou ANN do ingls Artificial Neural Network) refere-se
a grande quantidade de modelos matemticos estruturados na forma de unidades de
processamento simples (neurnios) densamente interligados, nos quais o armazenamento e
processamento da informao so feitos de maneira paralela e distribuda. Alm de muitas
outras aplicaes, as RNA podem ser utilizadas como classificadores. No modelo, as unidades
ou neurnios esto organizados em camadas de processamento sequenciais, sendo que o vetor
de caractersticas fornece a entrada para a primeira camada e um valor referente classe a
69
sada da ltima camada. Cada neurnio executa uma funo usando um ou mais valores de
entrada afetados por pesos que ponderam a entrada recebida, e produz um valor de sada que
poder ser usado como entrada na camada seguinte. O treinamento da RNA como
classificador, aplicando aprendizado supervisionado, consiste no seu ajuste para que
reproduza com um erro mnimo as sadas conhecidas (classes), dadas as entradas de exemplo
(vetores de caractersticas). Posteriormente, a RNA dever prever a sada (classe) de qualquer
entrada nova.
As RNA de funes de base radial (FBR) so redes supervisionadas caracterizadas pelo tipo
de funes usadas na camada intermediria, sua arquitetura bsica apresentada na Figura 16.
Cada neurnio determinado por uma funo no linear da distncia euclidiana entre o vetor
de entrada e um centro predefinido (vetor de referncia), sendo funes localizadas e que
apresentam base radial sobre seu domnio (CASTRO; CASTRO, [s.d.]). Por ser de domnio
localizado, para cada vetor de entrada s algumas unidades apresentas sadas significativas, o
que ajustado dentro do processo de treinamento. Essas funes podem ter vrias formas,
sendo a mais comum a gaussiana:
( )
A camada posterior realiza uma combinao linear das sadas das funes de base radial,
usando outro vetor de pesos, para gerar a sada. As sadas produzidas pela combinao linear
podem ter qualquer valor dentro da faixa estabelecida pela funo de ativao usada no
neurnio de sada, comumente uma funo logstica. Assim, para um classificador binrio
uma das classes pode corresponder a -1, a outra classe a 1, e as respostas do classificador para
uma nova entrada sero um nmero intermedirio. A classe escolhida em cada caso ser
aquela cujo valor de sada estabelecido esteja mais prximo do valor calculado pelo
classificador para o vetor de entrada.
70
Um bom sistema de reconhecimento de padres, neste trabalho, ser aquele que ao receber
um novo sinal produzir a sua classificao corretamente, mas para avaliar quo bom o
sistema no vlido usar um juzo apreciativo. Para qualquer anlise cientfica o desempenho
deve ser testado e quantificado com metodologias apropriadas. A seguir, as metodologias
usadas neste trabalho so brevemente apresentadas.
Assim, uma metodologia amplamente utilizada a validao cruzada (k-fold cross validation)
segundo a qual o conjunto total de exemplos dividido em k partes de aproximadamente igual
tamanho, sendo k-1 deles destinados ao processo de treinamento e 1 deles realizao de
testes. Portanto, o sistema treinado com k-1 partes e testado com a parte restante,
produzindo os indicadores de desempenho de interesse. Posteriormente, o processo repetido
escolhendo outra das partes para teste e as restantes k-1 para treinamento, e assim segue at
ter usado todas as k partes para teste uma vez. O desempenho ser ento calculado como a
mdia dos k valores dos indicadores obtidos nas iteraes. Na diviso do conjunto de
exemplos procura-se que cada parte seja formada por exemplos das diferentes classes na
mesma proporo que elas se apresentam no conjunto total.
Em todas as anlises da seo 7 foi utilizada a metodologia antes descrita para validao
cruzada, com 10 partes, cada uma composta por exemplos das classes COM e SEM na mesma
quantidade.
Assim, formam-se quatro categorias: Verdadeiros COM (VC, exemplos COM classificados
corretamente), Falsos COM (FC, exemplos SEM classificados como COM), Verdadeiros
SEM (VS, exemplos SEM classificados corretamente) e Falsos SEM (exemplos COM
classificados errado), sendo que VC+FC+VS+FS = N, nmero total de sinais de teste.
Classe Obtida
Verdadeira
COM SEM
COM VC FS
Classe
SEM FC VS
72
Para um sistema de reconhecimento ideal, tanto FS quanto FC devem ser iguais a zero,
enquanto VC e VS devem ter valor de N/2 (dado que, neste trabalho, na validao cruzada
garantido que cada conjunto de teste tenha a mesma quantidade de exemplos de cada classe).
Inicialmente, a matriz de confuso alerta sobre resultados tendenciosos quando h grande
assimetria, mas a sua maior utilidade est no clculo de indicadores de desempenho como os
apresentados a seguir (FACELI et al., 2011).
Taxa de erro: Complemento da taxa de acerto, a taxa de erro uma medida dos erros
cometidos nas duas classes.
sada nas RNA-FBR, por exemplo) para prever uma das duas classes possveis. Cada
classificador fica assim representado por uma curva, sendo que para o classificador ideal a
curva seria a linha (0,0)(0,1)(1,1) e para o classificador aleatrio a linha (0,0)(1,1).
A aquisio dos sinais foi feita a travs do software integrado ao sistema de aquisio (seo
5.2), obtendo as informaes em arquivos de extenso .xls. O armazenamento e primeira
organizao da informao foi feita usando planilhas de MSExcel. Posteriormente todos os
sinais adquiridos foram ingressados como variveis no programa Matlab3.
3
Do ingls Matrix Laboratory, Matlab um ambiente de anlise numrica de alto desempenho e linguagem de
programao de quarta gerao, desenvolvido pelo MathWorks, amplamente utilizado para ensino, pesquisa e
aplicaes industriais em todo o mundo.
4
Waikato Environment for Knowledge Analysis WEKA, um popular compendio de software para
aprendizado de mquina, desenvolvido em linguagem JAVA, pela Universidade de Waikato, Nova Zalndia.
75
7. RESULTADOS
Na seo 7.1 so analisadas variaes no clculo de uma das caractersticas a ser consideradas
na etapa de extrao de caractersticas, enquanto na seo 7.2 so analisados parmetros para
um dos classificadores propostos. A comparao geral e a avaliao da melhor alternativa
para a etapa de extrao de caractersticas realizada na seo 7.3, e o correspondente etapa
de classificao analisado na 7.4. Com os resultados anteriores, fica definida a melhor
arquitetura de sistema de reconhecimento de padres proposta, e seu desempenho avaliado
na seo 7.5. Na seo 7.6 analisada a influncia da magnitude do vazamento no
desempenho do sistema. Um esquema das anlises apresentadas neste captulo, em relao
sua aplicao no sistema de reconhecimento de padres, mostrado na Figura 18.
Alternativas de Parmetros do
Classificao classificadores (7.4) classificador KNN (7.2)
Desempenho do sistema de
reconhecimento de padres (7.5)
Avaliaes
Influncia da magnitude do vazamento (7.6)
Figura 18. Esquema das anlises apresentadas neste captulo, em relao s componentes do sistema de
reconhecimento de padres.
77
Todos os resultados do presente captulo foram obtidos analisando toda a base de dados de
sinais adquiridos junto ao circuito hidrulica experimental como apresentado na seo 5.3,
com 620 exemplos em total (310 de cada classe) e para os 18 sensores 5. Cada resultado
apresentado produto da aplicao do 10-fold cross validation apresentado na seo 6.4.1. O
indicador de desempenho do sistema mais utilizado para as comparaes neste capitulo a
rea abaixo da curva ROC (AAC), explicada na seo 6.4.3.
Como apresentado nas sees 4.3 e 6.2.4, a caracterstica EDW calculada a partir das
componentes que representam o sinal depois da aplicao da decomposio wavelet, sendo os
componentes obtidos at um dado nvel. A seleo do melhor nvel de decomposio varia de
um problema para outro, sendo necessrio avaliar conjuntamente o ganho e o custo do
clculo. No caso, o ganho medido em termos do desempenho do sistema de reconhecimento
de padres quando desenvolvido usando a caracterstica EDW (distribuio da energia na
decomposio wavelet) calculada at cada nvel de decomposio. O custo de clculo,
entretanto, sabe-se que maior para nveis superiores.
Resultados foram obtidos para cada alternativa de nvel de decomposio, usando cada um
dos seis classificadores propostos na seo 6.3, e para cada um dos 18 sensores. Para
consolidar essa grande quantidade de resultados, os valores relativos aos 18 sensores para
5
Como antes explicado, todas as analises so conduzidas para os sinais de cada um dos 18 sensores,
isoladamente, durante todas as etapas da anlise. Somente quando indicado, apresentada a mdia dos
resultados dos diferentes sensores.
78
cada alternativa foram resumidos calculando sua mdia e desvio padro, que so apresentados
na Tabela 4 e na Figura 19.
Tabela 4. AAC mdia (desvio padro) para diferentes nveis de decomposio, segundo o classificador.
Figura 19. AAC mdia usando diferentes nveis de decomposio, segundo o classificador.
Tabela 5. Aumento percentual na AAC com o aumento no nvel de decomposio, segundo o classificador.
Classificador de N2 a N3 de N3 a N4 de N4 a N5
3NN 1.98% 0.24% -0.88%
rvore 1.28% -0.32% -1.01%
Regras 1.44% -1.60% -1.49%
NaiveBayes 0.48% 0.31% -0.36%
SVM 2.66% 0.23% -1.15%
FBR 0.79% 0.40% -0.17%
Mdia 1.44% -0.12% -0.84%
Para todos os classificadores utilizados, a decomposio at nvel trs traz um ganho na mdia
da AAC em comparao com a decomposio at nvel 2 (de N2 para N3). Esse ganho
maior do que os obtidos ao passar de nvel trs para nvel quatro (de N3 para N4), e maior
ainda do que ganho ao mudar de nvel quatro para nvel cinco. Adicionalmente, s a passagem
de nvel dois para nvel trs traz ganhos positivos segundo todos os classificadores usados.
Considerando tais resultados, foi definido para o clculo da caracterstica EDW, usar a
decomposio wavelet at nvel 3.
Para avaliar o desempenho da EDW extrada da decomposio wavelet packet foi treinado e
testado o sistema de reconhecimento de padres completo, para cada um dos 18 sensores,
usando alternativamente cada um dos seis classificadores. Foi calculada a AAC para cada
caso, e a mdia e o desvio padro dos resultados para os 18 sensores so apresentadas na
Tabela 6. Na Figura 20 os resultados so comparados com aqueles obtidos extraindo a
caracterstica EDW da decomposio wavelet discreta (db2 at nvel 3, discreta).
80
Tabela 6. AAC mdia (desvio padro) usando decomposio wavelet packet, segundo o classificador.
EDW
Classificador
Wavelet Package
3NN 0.972 (0.029)
rvore 0.946 (0.029)
Regras 0.901 (0.036)
Bayes 0.959 (0.042)
SVM 0.938 (0.06)
FBR 0.972 (0.043)
Mdia 0.948 (0.04)
Figura 20. Comparao da AAC mdia usando decomposio wavelet discreta e wavelet packet.
pode ser mostrada atravs dos histogramas de cada um dos valores das caractersticas,
calculados para os exemplos adquiridos com cada sensor. A comparao dos histogramas
construdos para cada componente dos respectivos exemplos SEM e COM, possvel atravs
do exame da Figura 21.
A3 D1
150
100
50
(numero de exemplos)
0
0 15 30 45 60 75 90 0 8 16 24 32 40 48 56
Frequncia (quantidade de exemplos)
D2 D3
150
100
50
0
0 3 6 9 12 15 18 21 0 10 20 30 40 50 60
D4 D5
150
Frequncia
100
50
0
0 4 8 12 16 20 24 28 0 3 6 9 12 15 18 21
D6 D7
150
100
50
0
0 5 10 15 20 25 30 0 6 12 18 24 30 36
classe
com
sem
Figura 21. Histograma de frequncias da distribuio da energia na decomposio wavelet packet, para
exemplos SEM e COM.
Vrias concluses podem ser extradas da comparao dos histogramas. A maior parte dos
exemplos COM tem a maior percentagem de energia na componente de aproximao, A3, e
as percentagens para os componentes de detalhe, D1 a D7, so usualmente menores. Para os
exemplos SEM, a percentagem de energia na componente A3 usualmente menor do que as
percentagens nas componentes D1 a D7. Adicionalmente, as distribuies nos componentes
de detalhe so mais concentradas para os exemplos COM do que para os exemplos SEM, e
82
mantm tambm uma distribuio semelhante nas componentes D1 a D7, com a maior
quantidade de casos correspondendo a percentagens de energias baixas. J para os sinais
SEM, parece que a energia est mais concentrada nos diferentes componentes de detalhe, com
pouca participao da componente A3. Assim, nos exemplos COM a maior parte da energia
do sinal devida mudana produzida pelo incio do vazamento, melhor representada na
componente de aproximao (ou de baixa frequncia). Entretanto, nos exemplos SEM a
energia do sinal est mais relacionada com o rudo e as oscilaes prprias do sistema fsico e
de aquisio de dados, razo pela qual apresentam maior disperso e a componente de
aproximao torna-se menos importante.
Em adio anlise dos histogramas, o estudo dos primeiros nveis na rvore de deciso
reforam as concluses. A componente com maior potencial para diferenciar os exemplos das
duas classes a A3. Adicionalmente, as componentes D2 e D3 tambm permitem uma
diferenciao interessante entre ambas as classes.
Considerando o discutido nesta seo, nas anlises seguintes a caracterstica EDW ser a
avaliada usando decomposio wavelet discreta, da famlia db2, at nvel 3.
Com o objetivo de estabelecer o valor mais apropriado para K e avaliar a sensibilidade dessa
escolha, foram feitos testes do sistema de reconhecimento de padres envolvendo seis
possveis valores para K (1, 3, 5, 7, 9, 11) e, portanto, seis classificadores. A anlise feita
considerando os dados de cada sensor independentemente, usando o conjunto de quatro
caractersticas (TOD) e tambm usando somente a caracterstica de distribuio da energia da
decomposio wavelet6 (EDW).
6
Em ambos os casos, usando decomposio wavelet discreta at nvel 3 com a funo db2, como definido na
seo anterior.
84
Tabela 7. AAC usando variaes do algoritmo K-NN, depois da extrao do vetor de caractersticas TOD.
Figura 22. AAC usando variaes do algoritmo K-NN, depois da extrao das caractersticas TOD.
85
Tabela 8. AAC usando variaes do algoritmo K-NN, depois da extrao da caracterstica EDW.
Figura 23. AAC usando variaes do algoritmo K-NN, depois da extrao da caracterstica EDW.
86
Os resultados apresentados permitem concluir que, tanto usando como vetor de caractersticas
TOD quanto EDW, o desempenho dos classificadores superior para valores maiores de K,
na maioria dos sinais. Como detalhado na Tabela 97, a melhora no desempenho muito mais
significativa para os valores inferiores de K, com um ganho mdio de 4,0% ao passar de 1NN
para 3NN. Ao estudar valores maiores de K, o aumento de desempenho torna-se menos
significativo.
Sensor 1NN a 3NN 3NN a 5NN 5NN a 7NN 7NN a 9NN 9NN a 11NN
P01 4.77% 0.44% 0.82% 0.49% 0.05%
P02 2.95% 0.25% 0.01% 0.38% 0.03%
P03 4.09% 0.48% 0.03% 0.20% 0.15%
P04 3.50% 0.61% -0.03% -0.05% 0.24%
P05 3.13% 0.51% 0.45% 0.47% 0.17%
P06 3.42% 0.63% 0.08% 0.05% 0.17%
P07 2.60% 0.71% 0.27% 0.31% 0.10%
P08 2.50% 0.60% 0.74% 0.27% 0.34%
P09 3.43% 0.73% 0.18% 0.32% 0.25%
P11 4.00% 0.74% 0.19% -0.04% 0.01%
P12 2.62% 0.31% 0.10% 0.06% 0.27%
P13 1.90% 0.31% 0.45% 0.12% 0.18%
P14 4.60% 0.82% 0.22% 0.02% 0.07%
P15 2.97% 0.94% 0.44% 0.24% 0.15%
P16 3.96% 1.12% 0.62% -0.05% -0.01%
Q01 8.38% 1.62% 1.34% 0.05% 0.11%
Q02 6.93% 0.98% 0.40% 0.22% -0.06%
Q03 6.96% 1.71% 0.24% 0.62% 0.50%
Mdia 4.04% 0.75% 0.36% 0.20% 0.15%
Desvio 1.74% 0.41% 0.35% 0.20% 0.14%
7
A Tabela 9 refere-se aos resultados obtidos usando somente a caracterstica EDW, mostrados na Tabela 8 e
Figura 23, mas as concluses so as mesmas se considerados os resultados usando TOD.
87
7.3.CARACTERSTICAS EXTRADAS
Como apresentado na seo 6.2, foram avaliadas quatro caractersticas para representar os
sinais adquiridos, sendo elas:
Para analisar a tendncia das caractersticas dos sinais SEM e COM, foram extradas as
caractersticas de cada qual dos 620 exemplos das duas classes, para cada um dos 18 sensores.
Usando os valores extrados, foram construdos os histogramas de frequncias relativos aos
exemplos SEM e COM para cada caracterstica, ou mais exatamente para cada um dos valores
do vetor de caractersticas (sendo que a caracterstica EDW representada por quatro
valores). Os histogramas foram construdos com os dados de cada sensor isoladamente, e na
Figura 24 so apresentados os do sensor mais prximo do local de vazamento (P02) e o do
local mais afastado a jusante dele (P16), cuja localizao pode ser conferida na Figura 7.
Para obter uma indicao quantitativa do grau de semelhana entre os valores relativos s
duas classes, foi calculado o intervalo central de valores de caractersticas que contm o 85%
dos exemplos, sendo que 7,5% dos exemplos tm valores da caracterstica inferiores aos do
intervalo, e o restante 7,5% valores superiores a ele. Os limites desses intervalos so
resumidos na Tabela 10 e indicados tambm na Figura 24.
P02 P16
SEM COM SEM COM
7.5% - 92.5% 7.5% - 92.5% 7.5% - 92.5% 7.5% - 92.5%
ENE 10.4 - 34.9 2.8 - 76.5 17.3 - 37.8 2.8 - 42.4
ENT 6.2 - 6.8 6 - 7.6 6.7 - 7 6-7
NCZ 58.5 - 121.9 1 - 57.5 76.1 - 123.9 44.9 - 92.5
EDW-A3 5.7 - 30.2 23.6 - 92.2 8 - 23.6 25.7 - 65.4
EDW-D3 9.3 - 50 1.3 - 12.6 15.6 - 50.4 9 - 33.8
EDW-D2 18.6 - 37.4 0.8 - 29.4 18.7 - 35.4 7.7 - 25.9
EDW-D1 4.7 - 33.6 0.3 - 34 7.7 - 34.3 1.7 - 30.5
88
ENE ENE
160 160
80 80
0 0
0 20 40 60 80 100 120 0 20 40 60 80 100 120
ENT ENT
160 160
80 80
0 0
2 3 4 5 6 7 8 2 3 4 5 6 7 8
NCZ NCZ
160 160
80 80
0 0
0 20 40 60 80 100 120 140 0 20 40 60 80 100 120 140
EDW - A3 EDW - A3
160 160
80 80
0 0
0 15 30 45 60 75 90 0 15 30 45 60 75 90
EDW - D3 EDW - D3
160 160
80 80
0 0
0 10 20 30 40 50 60 0 10 20 30 40 50 60
EDW - D2 EDW - D2
160 160
80 80
0 0
0 10 20 30 40 50 60 70 0 10 20 30 40 50 60 70
EDW - D1 EDW - D1
160 160
80 80
0 0
0 10 20 30 40 50 60 0 10 20 30 40 50 60
CLASSE CLASSE
COM COM
SEM SEM
Figura 24. Histogramas dos valores do vetor de caractersticas para exemplos SEM e COM.
89
possvel verificar que para algumas das caractersticas, as faixas de valores mais comuns
so similares, enquanto para outras caractersticas os intervalos esto mais claramente
diferenciados. A seguir as observaes principais sobre cada caracterstica:
Para a caracterstica ENE, tanto no sensor mais prximo (P02) quanto no mais
afastado (P16) o intervalo de valores mais frequentes para a classe SEM est contido
no intervalo da classe COM. Assim, difcil diferenciar se um sinal pertence a uma ou
outra classe com base no seu valor ENE dado que os mesmos valores aparecem
frequentemente para as duas classes.
8
Vale a pena salientar que quando se mencionam, por exemplo, os valores mais frequentes ou os
histogramas de frequncias, a palavra frequncia refere-se quantidade de vezes que um valor ou faixa de
valores ocorrem, e pode ser quantificada com unidades de nmero de ocorrncias. Por outro lado, quando
referidas as altas / baixas frequncias em referencia s componentes da decomposio wavelet, trata-se de
frequncias presentes no sinal, que seria o numero de ciclos por unidade de tempo se se tratasse de sinais
peridicos, e cuja unidade a inversa do tempo, 1/sec = Hz.
90
para um sinal em que a maior parte das oscilaes devida ao rudo, de alta
frequncia. Entretanto, nos exemplos COM grande parte da energia est concentrada
no componente de aproximao A3, devido mudana provocada pelo vazamento. Os
valores de energia nas componentes de detalhe so complementares aos da
componente de aproximao (A3+D3+D2+D1=100 para cada exemplo individual),
portanto para os exemplos SEM os valores de D3, D2 e D1 so maiores do que para os
exemplos COM. A diferenciao entre os intervalos de valores mais comuns das duas
classes mais clara para os componentes de menor frequncia (D3) do que para os de
maior frequncia (D1). A importncia de cada valor da caracterstica de distribuio
da energia na decomposio wavelet foi discutida tambm na seo 7.1.
Os resultados para apenas dois dos sensores foram apresentados acima para melhor
compreenso, embora as mesmas anlises tenham sido realizadas para todos os outros
sensores foram feitas e os seus resultados em nada contradizem as anteriores observaes,
como pode ser verificado nos histogramas apndice A.
SIN. Sinal original (sem extrair nenhuma caracterstica), vetor de dimenso 240. O uso
do vetor original como vetor de entrada a o classificador possvel somente porque a
aquisio em laboratrio e o pr-processamento dos exemplos garante que todos eles
contenham a mesma quantidade de elementos, sem dados errneos ou faltantes.
91
Foi calculada a rea abaixo da curva ROC (AAC) para o sistema de reconhecimento de cada
combinao considerada, aplicando o procedimento de validao cruzada. Os resultados para
todos os sensores e para os diferentes vetores de caractersticas considerados so apresentados
na Tabela 11, em termos do seu valor mdio e desvio padro para os diferentes
classificadores. Nas ltimas linhas da mesma tabela apresentam-se valores mdios para todos
os sensores relativos a cada vetor de caractersticas. Os resultados anteriores tambm so
apresentados na Figura 25, na qual cada ponto corresponde avaliao de uma arquitetura do
sistema de reconhecimento de padres com os dados de um sensor. Cada 18 pontos alinhados
verticalmente correspondem aos resultados de todos os 18 sensores segundo um dos seis
classificadores (de esquerda para direita: 3NN, rvore, Regra, Bayes, SVM e FBR). Cada
grupo de pontos da mesma cor corresponde mesma alternativa em termos do vetor de
caractersticas considerado, isto , as alternativas a serem comparadas nesta seo para a
escolha do melhor vetor de caractersticas (TOD, ENE, ENT, NCZ, EDW, SIN).
Figura 25. AAC para diferentes vetores de caractersticas segundo o sensor e o classificador considerados.
92
Tabela 11. AAC mdia (desvio padro) para diferentes vetores de caractersticas, segundo o sensor
considerado.
O valor de desempenho afetado pela escolha do classificador, e para avaliar sua influncia
na Tabela 12 so mostrados os valores de desempenho mdios para cada alternativa de vetor
de caractersticos, discriminados segundo o tipo de classificador utilizado. Apesar das
variaes nos valores, o ordenamento das melhores caractersticas semelhante ao antes
identificado, com TOD e EDW na primeira e segunda melhor posio dentre as alternativas
de extrao de caractersticas, superados por pequena diferena pelo uso do vetor SIN quando
considerados dois dos classificadores.
Tabela 12. AAC mdia para diferentes vetores de caractersticas, segundo o classificador.
Por outro lado, a caracterstica que isoladamente fornece os melhores resultados mdios
EDW, mas a incorporao da segunda melhor caracterstica, NCZ, incrementa um pouco os
94
resultados mdios (de 0.951 a 0.961 em mdia) e diminui levemente os desvios (de 0.030 a
0.023, em mdia). Como seu clculo pouco complexo se comparado com o da EDW,
considera-se interessante o uso das duas caractersticas combinadas, NCZ+EDW.
Tabela 13. AAC mdia (desvio padro) segundo o sensor considerado, para os vetores de caractersticas
de melhor desempenho.
Quanto ao uso do sinal original (sem extrair caractersticas), SIN, como vetor de entrada para
o processo de classificao, cada exemplo considerado um ponto dentro de um espao de
dimenso 240, e para a definio de distncias, regras ou distribuies nos procedimentos de
treinamento dos classificadores o i-simo valor da srie comparado somente com o i-simo
das outras sries, sendo i = 1, 2... 240. Esse tipo de comparao ponto a ponto tem
desvantagens considerando que nos exemplos COM o vazamento acontece em diferentes
momentos dentro do intervalo de exemplo. O desempenho do sistema de reconhecimento de
padres usando o vetor SIN foi muito varivel dependendo do classificador utilizado, com
95
valores individuais de AAC desde 0.567 (sensor P16, classificador Bayesiano) at 0.997
(sensor P11, classificador 3NN). Assim, os valores de desvio relativos a SIN com cada sensor
mostrados na Tabela 11, de mdia 0.15 e mnimo 0.11, so maiores do que os desvios de
todas as outras alternativas de vetores de caractersticas, restando portanto confiabilidade aos
seus valores mdios. O tempo de processamento usando SIN foi muito maior do que com os
outros vetores de caractersticas, devido ao grande tamanho dos vetores envolvidos, embora
com essa alternativa seja economizado o tempo que leva a extrao de caractersticas. Como
apontado anteriormente, o uso do sinal sem extrair caractersticas somente possvel pelo fato
de todos os exemplos terem exatamente o mesmo tamanho. Se alguns dos exemplos tivessem
tamanho diferente, essa opo de uso do vetor SIN no seria aplicvel, enquanto o processo
de extrao de caractersticas no encontraria nenhum problema.
Assim, considerando que o uso do sinal diretamente como se fosse o vetor de caractersticas
no diminui o custo computacional, tm aplicao limitada, e gera desempenhos de menor
preciso e, em mdia, de menor acurcia, conclui-se que o uso da extrao de caractersticas
muito mais interessante do que o uso do sinal de entrada, SIN, diretamente.
7.4.TIPOS DE CLASSIFICADOR
Os seis diferentes tipos de classificador apresentados na seo 6.3 foram avaliados como
alternativas dentro do sistema de reconhecimento de padres criado, sendo eles:
Regra. Algoritmo de uma regra (One Rule), com mnimo seis elementos nos
segmentos;
SVM. Mquina de vetor suporte, com funes kernel lineares e sem incorporar pesos
diferenciados s duas classes;
FBR. Rede neural artificial com funes de base radial, com funes normalizadas
Gaussianas.
96
Tabela 14. AAC mdia (desvio padro) para diferentes classificadores, segundo o sensor considerado.
O desempenho de todos os classificadores muito bom, de forma que as diferenas entre eles
so pequenas em relao ao resultado mdio. O classificador Bayes apresenta o melhor
resultado para nove dos sensores, enquanto o FBR o melhor para oito dos sensores e o 3NN
para os trs restantes. Mesmo com diferenas pequenas, os melhores resultados (maior valor
de AAC) correspondem aos classificadores FBR, Bayes e 3NN. O desempenho pior foi o da
regra de deciso, levemente superado pelo SVM e pela rvore.
Quanto ao tipo de distribuio, para os clculos anteriores foi assumida a distribuio normal,
como feito corriqueiramente. Mas ao analisar a verdadeira distribuio dos valores dos
vetores de caractersticas, como as apresentadas na Figura 24, isso no se verifica. A maioria
dos valores das caractersticas extradas no tem comportamento normal, descumprindo a
hiptese inicial da aplicao do classificador Naive Bayes. Ainda ao tentar substituir a
distribuio normal, nenhum tipo distribuio ajusta bem os dados das diferentes
caractersticas e sensores simultaneamente. Os resultados em termos do desempenho do
sistema de reconhecimento de padres usando o classificador Naive Bayes podem ser bons
devido a que as duas classes tm intervalos de valores mais comuns bem diferenciados,
especialmente das caractersticas NCZ e EDW (como destacado na seo 7.3), mas o
descumprimento da hiptese da distribuio de probabilidades gera desconfiana nestes
resultados. Adicionalmente, pode-se prever que com exemplos mais exigentes, para os quais
os valores mais comuns das caractersticas sejam menos diferentes entre as duas classes, o
problema por assumir a priori a distribuio de probabilidade pode ser mais significativo.
Com base nas anlises relativas aos diferentes componentes do sistema de reconhecimento de
padres e suas alternativas, possvel escolher a arquitetura geral do sistema que fornece os
resultados mais interessantes no processo de reconhecimento de sinais adquiridos na ausncia
99
Em cada um dos testes, do conjunto de 620 exemplos 10% usado para testes, sendo 31
exemplos SEM e 31 exemplos COM. A repetio do processo dez vezes, pela validao
cruzada, oferece um total de 620 respostas do sistema, com cada sensor. A matriz de confuso
dessas 620 respostas apresentada na Tabela 15 para cada sensor, e tambm se mostra a
matriz mdia resultante.
100
MDIA
294 16
15 295
Tanto as matrizes de confuso dos sensores individuais quanto a mdia mostram uma simetria
razovel com os erros balanceados entre falsos SEM (FS) e falsos COM (FC), descartando
vis na classificao. Com base nas matrizes e segundo as definies da seo 6.4.2, os
indicadores de desempenho foram calculados para cada um dos sensores e para o conjunto
todo, e so apresentados na Tabela 16 e na Tabela 17.
101
Tabela 16. Taxa de acerto, taxa de erro e sensibilidade do sistema, para cada sensor.
O nvel geral de acurcia do sistema, medido pela taxa de acerto, maior que 0.91 para todos
os sensores com exceo do sensor Q03. O valor mdio, de 0.95, satisfatoriamente alto. A
taxa de erro o complemento da taxa de acerto, sendo assim sua mdia de 0.05. Quanto
sensibilidade ou taxa de verdadeiros positivos, mostra-se que a proporo de exemplos da
classe COM classificados acertadamente superior a 90% para dados de todos os sensores
com exceo do sensor Q03. Em mdia essa porcentagem de 94,9%, portanto somente 5,1%
dos exemplos COM foram classificados errados.
Tabela 17. Taxa de falsos positivos, especificidade e preciso do sistema, para cada sensor e mdia.
Taxa falsos
Sensor Especificid. Preciso
positivos
P01 0.048 0.952 0.950
P02 0.035 0.965 0.965
P03 0.032 0.968 0.968
P04 0.023 0.977 0.977
P05 0.061 0.939 0.940
P06 0.035 0.965 0.964
P07 0.026 0.974 0.974
P08 0.045 0.955 0.955
P09 0.042 0.958 0.958
P11 0.026 0.974 0.974
P12 0.026 0.974 0.974
P13 0.019 0.981 0.980
P14 0.048 0.952 0.952
P15 0.035 0.965 0.964
P16 0.048 0.952 0.952
Q01 0.087 0.913 0.913
Q02 0.077 0.923 0.921
Q03 0.152 0.848 0.849
Mdia 0.048 0.952 0.952
Desvio 0.032 0.032 0.032
Para cada um dos sensores pode ser desenhada a respectiva curva ROC, com o eixo horizontal
referente a VC (verdadeiros COM) e o eixo vertical a FC (falsos COM). Na Figura 27 so
apresentadas, como exemplo, as curvas relativas aos sensores P02, P16 e Q03, enquanto as
dos outros sensores so mostradas no apndice C. O indicador de maior interesse nas anlises
comparativas neste trabalho a AAC, cujos valores para cada sensor (na arquitetura definitiva
do sistema) so apresentados na Tabela 18.
103
P02
P16
Q03
9
Grficos gerados no software WEKA, como referido na seo 6.5.
104
rea abaixo
Sensor
da curva ROC
P01 0.967
P02 0.990
P03 0.985
P04 0.987
P05 0.974
P06 0.981
P07 0.983
P08 0.974
P09 0.981
P11 0.984
P12 0.987
P13 0.982
P14 0.979
P15 0.981
P16 0.971
Q01 0.963
Q02 0.961
Q03 0.906
Mdia 0.974
Desvio 0.019
reconhecimento de padres criado, foi identificada a faixa de valores V/Q a que pertence cada
um dos exemplos usados na etapa de teste dentro do processo de validao cruzada.
Analisando os resultados da classificao de cada exemplo para todos os testes, foi calculado
o nmero de exemplos COM classificados acertadamente (VC) ou no (FS) para cada faixa de
valores V/Q, como apresentado na Tabela 19. A sensibilidade ou taxa de verdadeiros
positivos (definida na seo 6.4.2), apresentada na Tabela 20. A configurao do sistema de
reconhecimento de padres a resumida na seo anterior, e inclui segmentao e
padronizao, extrao do vetor de caractersticas NCZ+EDW e classificao com 3NN.
A tendncia geral que pode ser predita quanto sensibilidade do sistema de reconhecimento
de padres que seus valores sejam menores para exemplos com relao V/Q baixa e maiores
para os exemplos com relao V/Q maior. Porm, valores individuais em alguns sensores no
seguem essa tendncia. Por exemplo, a sensibilidade na faixa de 4% a 5% aparece inferior do
que a de 3% a 4% para os sinais de vrios sensores, sendo o mais crtico o Q01 que aparenta
diminuio da sensibilidade em 0.11. Para a faixa de V/Q de 9% a 10% aparece na maioria
dos sensores sensibilidade inferior da faixa anterior (8% a 9%), sendo que essa tendncia
negativa continua presente ainda nos resultados totais. Uma possvel explicao de esse
inesperado resultado poderia ser a ocorrncia dentro de essa faixa de exemplos extrados de
um experimento com algum erro que tenha gerado corrupo dos dados e dificulte sua
classificao, mas essa hiptese no foi comprovada nem levada em conta nas anlises
executadas com a mesma base de dados de exemplos.
Tabela 20. Sensibilidade (taxa de verdadeiros positivos) para os diferentes valores de V/Q usados nos
testes.
Figura 28. Sensibilidade (taxa de verdadeiros positivos) para diferentes valores de V/Q, total.
108
8. CONCLUSES
determinar, com certo grau de acurcia, se um novo sinal corresponde com uma situao de
incio de vazamento ou no. No presente trabalho essa avaliao foi feita sempre sobre uma
base de dados conformada previamente, mas o sistema desenvolvido poderia ser aplicado
anlise de sinais contnuos, em tempo real, precisando para tanto ajustes na rotina
computacional.
reconhecimento. Foi notado que depois da decomposio wavelet (tanto discreta quanto
packet) a maior energia est concentrada na componente de menor frequncia para os
exemplos COM, ao contrrio dos exemplos SEM, sendo assim essa componente mostrou-se a
mais til na distino entre exemplos das duas classes. Considerando o anterior, foi concludo
que para o clculo da caracterstica EDW, na etapa de extrao de caractersticas do sistema
de reconhecimento de padres, fosse usada a decomposio wavelet discreta, com a funo
db2, at nvel 3.
Os valores de cada qual das quatro caractersticas nas duas classes foram analisadas e foi
tambm avaliado o desempenho do sistema de reconhecimento de padres com o uso das
caractersticas isoladas e combinadas. Concluiu-se que as caractersticas ENE e ENT foram as
menos interessantes para o sistema, enquanto a mais interessante foi EDW, seguida de NCZ.
Ao avaliar o uso do vetor de caractersticas TOD, conformado pela combinao das quatro
caractersticas, o desempenho do sistema foi equivalente ao obtido usando o vetor de
caractersticas da combinao NCZ+EDW; portanto, o aporte das caractersticas ENE e ENT
ao processo de reconhecimento no significativo. Foi concludo que na etapa de extrao de
caractersticas fosse calculado o vetor NCZ+EDW como representao de cada sinal.
Para a etapa de classificao foram avaliados seis algoritmos diferentes e foi comparado o
desempenho do sistema de reconhecimento de padres usando cada qual. Antes da
comparao, foi analisado o parmetro K do algoritmo KNN, ou nmero de vizinhos mais
prximos, concluindo pela utilizao do valor de K = 3. O desempenho do sistema com base
nos seis classificadores utilizados (3NN, rvore, Naive Bayes, SVM e FBR) alto, sendo que
as diferenas entre eles so de ordem de grandeza menor de cada resultado. Os
classificadores correspondentes aos melhores desempenhos mdios so o FBR (rede neural
com funes de base radial), Naive Bayes e 3NN (3 vizinhos mais prximos). Desempenho
mdio inferior foi obtido usando rvore de deciso, regra de deciso e SVM (Mquina de
vetor suporte). Analisando os classificadores de melhor desempenho, foi concludo que os
resultados com o Naive Bayes perdem confiabilidade por no serem cumpridas as hipteses
originais quanto distribuio de probabilidade dos valores das caractersticas utilizadas. Por
outro lado, tanto FBR quanto 3NN apresentam desempenhos semelhantes, mas nenhum dos
dois fornece um modelo interpretvel do sistema, razo pela qual a escolha foi feita pela
menor complexidade, concluindo o uso do algoritmo 3NN para a etapa de classificao.
Assim, foi concludo que a melhor arquitetura para o sistema de reconhecimento de padres
era: segmentao e padronizao, extrao do vetor de caractersticas NCZ+EDW, e
111
classificao com 3NN. O sistema foi avaliado com os sinais obtidos de cada sensor
individualmente, segundo diferentes indicadores de desempenho produzindo os seguintes
resultados mdios: taxa de acerto de 95.0%, sensibilidade de 94.9%, taxa de falsos positivos
de 4.8%, especificidade de 95.2%, preciso de 95.2% e rea abaixo da curva ROC (AAC) de
0.974. Tais resultados indicam um desempenho consistente e de alta acurcia do sistema de
reconhecimento de padres proposto.
9. REFERNCIAS
AKSELA, K.; AKSELA, M.; VAHALA, R. Leakage detection in a real distribution network
using a SOM. Urban Water Journal, v. 6, n. 4, p. 279289, out. 2009.
CASTRO, F. DE; CASTRO, M. C. DE. Captulo 5 Radial Basis Function. In: Redes Neurais
Artificiais. Porto Alegre: Pontfica Universidade Catlica de Rio Grande do Sul, [s.d.].
COVAS, D.; RAMOS, H. Case Studies of Leak Detection and Location in Water Pipe
Systems by Inverse Transient Analysis. Journal of Water Resources Planning and
Management, v. 136, n. 2, p. 248257, 2010.
COVAS, D.; RAMOS, H.; ALMEIDA, A. B. DE. Standing Wave Difference Method for
Leak Detection in Pipeline Systems. Journal of Hydraulic Engineering, v. 131, n. 12, p.
11061116, 2005.
DUDA, R.; HART, P.; STORK, D. Pattern Classification. 2. ed. New York: Willey-
Interscience, 2001.
FERRANTE, M.; BRUNONE, B. Pipe system diagnosis and leak detection by unsteady-state
tests. 1. Harmonic analysis. Advances in Water Resources, v. 26, n. 1, p. 95105, jan. 2003.
113
FERRANTE, M.; BRUNONE, B. Pipe system diagnosis and leak detection by unsteady-state
tests. 2. Wavelet analysis. Advances in Water Resources, v. 26, n. 1, p. 107116, jan. 2003.
FERRANTE, M.; BRUNONE, B.; MENICONI, S. Wavelets for the Analysis of Transient
Pressure Signals for Leak Detection. Journal of hydraulic engineering, v. 133, n. 11, p.
12741282, 2007.
FERRANTE, M.; BRUNONE, B.; MENICONI, S. Leak detection in branched pipe systems
coupling wavelet analysis and a Lagrangian model. Journal of Water Supply: Research
and TechnologyAQUA, v. 58, n. 2, p. 95, mar. 2009.
HOLTE, R. C. Very Simple Classification Rules Perform Well on Most Commonly Used
Datasets. Machine Learning, v. 11, p. 6390, 1 abr. 1993.
KAPELAN, Z.; SAVIC, D.; WALTERS, G. A hybrid inverse transient model for leakage
detection and roughness calibration in pipe networks. JOURNAL OF HYDRAULIC
RESEARCH, v. 41, n. 5, p. 481492, 2003.
LIGGETT, J. A.; CHEN, L.-C. Inverse transient analysis in pipe networks. Journal of
hydraulic engineering, v. 120, n. 8, p. 934955, 1994.
MALLAT, S. A Wavelet Tour of Signal Processing. 2. ed. London: Academic Press, 1999.
MENICONI, S. et al. Potential of transient tests to diagnose real supply pipe systems: What
can be done with a single extemporary test. Journal of Water Resources Planning and
Management, v. 137, n. 2, p. 238241, 2011.
MISIUNAS, D. Burst Detection and Location in Pipelines and Pipe Networks with
application in water distribution systems. Lund: Lund University, 2003.
MISIUNAS, D. et al. Pipeline Break Detection Using Pressure Transient Monitoring. Journal
of Water Resources Planning and Management, v. 131, n. 4, p. 316325, 1 jul. 2005.
PALAU, C. V.; ARREGUI, F. J.; CARLOS, M. Burst Detection in Water Networks Using
Principal Component Analysis. Journal of Water Resoucer planning and management, v.
138, n. 1, p. 4754, 2012.
PILCHER, R. Leak location and repair guidance notes and the never ending war against
leakageWater Loss. Anais...Bucareste, Romnia: 2007
PUUST, R. et al. A review of methods for leakage management in pipe networks. Urban
Water Journal, v. 7, n. 1, p. 2545, fev. 2010.
QUINLAN, J. R. C4.5: programs for machine learning. San Francisco, CA, USA: Morgan
Kaufmann Publishers Inc., 1993.
REIS, L. F.; PORTO, R.; CHAUDHRY, F. Optimal location of control valves in pipe
networks by genetic algorithm. Journal of Water Resources Planning and Management, v.
123, n. 6, p. 317326, 1997.
ROMANO, M.; KAPELAN, Z.; SAVIC, D. Automated Detection of pipe burst and other
events in water distribution systems. Journal of Water Resources Planning and
Management, 2012.
ROMANO, M.; KAPELAN, Z.; SAVIC, D. Testing of the system for detection of pipe
bursts and other events in a uk water distribution system14th Water Distribution System
Analysis Conference. Anais...Adelaide: 2012
WANG, X. et al. Leak Detection in Pipelines using Damping of Fluid Transients. Journal of
hydraulic engineering, v. 128, n. 7, p. 697711, 2002.
WU, Z. Y. Unified parameter optimisation approach for leakage detection and extended-
period simulation model calibration. Urban Water Journal, v. 6, n. 1, p. 5367, mar. 2009.
WU, Z. Y.; SAGE, P.; TURTLE, D. Pressure-Dependent Leak Detection Model and Its
Application to a District Water System. Journal of Water Resources Planning and
Management, v. 136, n. 1, p. 116128, 2010.
YE, G.; PH, D.; FENNER, R. A. Kalman Filtering of Hydraulic Measurements for Burst
Detection in Water Distribution Systems. Journal of pipeline systems engineering and
practice, v. 2, n. 1, p. 1422, 2011.
116
ENE ENE
160 160
80 80
0 0
0 20 40 60 80 100 120 0 20 40 60 80 100 120
ENT ENT
160 160
80 80
0 0
Frequncia (quantidade de exemplos). Sensor P02
Frequncia (quantidade de exemplos). Sensor P01
2 3 4 5 6 7 8 2 3 4 5 6 7 8
NCZ NCZ
160 160
80 80
0 0
0 20 40 60 80 100 120 140 0 20 40 60 80 100 120 140
EDW - A3 EDW - A3
160 160
80 80
0 0
0 15 30 45 60 75 90 0 15 30 45 60 75 90
EDW - D3 EDW - D3
160 160
80 80
0 0
0 10 20 30 40 50 60 0 10 20 30 40 50 60
EDW - D2 EDW - D2
160 160
80 80
0 0
0 10 20 30 40 50 60 70 0 10 20 30 40 50 60 70
EDW - D1 EDW - D1
160 160
80 80
0 0
0 10 20 30 40 50 60 0 10 20 30 40 50 60
CLASSE CLASSE
COM COM
SEM SEM
117
ENE ENE
160 160
80 80
0 0
0 20 40 60 80 100 120 0 20 40 60 80 100 120
ENT ENT
160 160
80 80
0 0
2 3 4 5 6 7 8
NCZ NCZ
160 160
80 80
0 0
0 20 40 60 80 100 120 140 0 20 40 60 80 100 120 140
EDW - A3 EDW - A3
160 160
80 80
0 0
0 15 30 45 60 75 90 0 15 30 45 60 75 90
EDW - D3 EDW - D3
160 160
80 80
0 0
0 10 20 30 40 50 60 0 10 20 30 40 50 60
EDW - D2 EDW - D2
160 160
80 80
0 0
0 10 20 30 40 50 60 70 0 10 20 30 40 50 60 70
EDW - D1 EDW - D1
160 160
80 80
0 0
0 10 20 30 40 50 60 0 10 20 30 40 50 60
CLASSE CLASSE
COM COM
SEM SEM
118
ENE ENE
160 160
80 80
0 0
0 20 40 60 80 100 120 0 20 40 60 80 100 120
ENT ENT
160 160
80 80
0 0
2 3 4 5 6 7 8 2 3 4 5 6 7 8
NCZ NCZ
160 160
80 80
0 0
0 20 40 60 80 100 120 140 0 20 40 60 80 100 120 140
EDW - A3 EDW - A3
160 160
80 80
0 0
0 15 30 45 60 75 90 0 15 30 45 60 75 90
EDW - D3 EDW - D3
160 160
80 80
0 0
0 10 20 30 40 50 60 0 10 20 30 40 50 60
EDW - D2 EDW - D2
160 160
80 80
0 0
0 10 20 30 40 50 60 70 0 10 20 30 40 50 60 70
EDW - D1 EDW - D1
160 160
80 80
0 0
0 10 20 30 40 50 60 0 10 20 30 40 50 60
CLASSE CLASSE
COM COM
SEM SEM
119
ENE ENE
160 160
80 80
0 0
0 20 40 60 80 100 120 0 20 40 60 80 100 120
ENT ENT
160 160
80 80
0 0
2 3 4 5 6 7 8 2 3 4 5 6 7 8
NCZ NCZ
160 160
80 80
0 0
0 20 40 60 80 100 120 140 0 20 40 60 80 100 120 140
EDW - A3 EDW - A3
160 160
80 80
0 0
0 15 30 45 60 75 90 0 15 30 45 60 75 90
EDW - D3 EDW - D3
160 160
80 80
0 0
0 10 20 30 40 50 60 0 10 20 30 40 50 60
EDW - D2 EDW - D2
160 160
80 80
0 0
0 10 20 30 40 50 60 70 0 10 20 30 40 50 60 70
EDW - D1 EDW - D1
160 160
80 80
0 0
0 10 20 30 40 50 60 0 10 20 30 40 50 60
CLASSE CLASSE
COM COM
SEM SEM
120
ENE ENE
160 160
80 80
0 0
0 20 40 60 80 100 120 0 20 40 60 80 100 120
ENT ENT
160 160
80 80
0 0
Frequncia (quantidade de exemplos). Sensor P09
80 80
0 0
0 20 40 60 80 100 120 140 0 20 40 60 80 100 120 140
EDW - A3 EDW - A3
160 160
80 80
0 0
0 15 30 45 60 75 90 0 15 30 45 60 75 90
EDW - D3 EDW - D3
160 160
80 80
0 0
0 10 20 30 40 50 60 0 10 20 30 40 50 60
EDW - D2 EDW - D2
160 160
80 80
0 0
0 10 20 30 40 50 60 70 0 10 20 30 40 50 60 70
EDW - D1 EDW - D1
160 160
80 80
0 0
0 10 20 30 40 50 60 0 10 20 30 40 50 60
CLASSE CLASSE
COM COM
SEM SEM
121
ENE ENE
160 160
80 80
0 0
0 20 40 60 80 100 120 0 20 40 60 80 100 120
ENT ENT
160 160
80 80
0 0
2 3 4 5 6 7 8
NCZ NCZ
160 160
80 80
0 0
0 20 40 60 80 100 120 140 0 20 40 60 80 100 120 140
EDW - A3 EDW - A3
160 160
80 80
0 0
0 15 30 45 60 75 90 0 15 30 45 60 75 90
EDW - D3 EDW - D3
160 160
80 80
0 0
0 10 20 30 40 50 60 0 10 20 30 40 50 60
EDW - D2 EDW - D2
160 160
80 80
0 0
0 10 20 30 40 50 60 70 0 10 20 30 40 50 60 70
EDW - D1 EDW - D1
160 160
80 80
0 0
0 10 20 30 40 50 60 0 10 20 30 40 50 60
CLASSE CLASSE
COM COM
SEM SEM
122
ENE
ENE 160
160
80 80
0 0
0 20 40 60 80 100 120 0 20 40 60 80 100 120
ENT ENT
160 160
80 80
0 0
2 3 4 5 6 7 8
NCZ NCZ
160 160
80 80
0 0
0 20 40 60 80 100 120 140 0 20 40 60 80 100 120 140
EDW - A3 EDW - A3
160 160
80 80
0 0
0 15 30 45 60 75 90 0 15 30 45 60 75 90
EDW - D3 EDW - D3
160 160
80 80
0 0
0 10 20 30 40 50 60 0 10 20 30 40 50 60
EDW - D2 EDW - D2
160 160
80 80
0 0
0 10 20 30 40 50 60 70 0 10 20 30 40 50 60 70
EDW - D1 EDW - D1
160 160
80 80
0 0
0 10 20 30 40 50 60 0 10 20 30 40 50 60
CLASSE CLASSE
COM COM
SEM SEM
123
ENE ENE
160 160
80 80
0 0
0 20 40 60 80 100 120 0 20 40 60 80 100 120
ENT ENT
160 160
80 80
0 0
2 3 4 5 6 7 8 2 3 4 5 6 7 8
NCZ NCZ
160 160
80 80
0 0
0 20 40 60 80 100 120 140 0 20 40 60 80 100 120 140
EDW - A3 EDW - A3
160 160
80 80
0 0
0 15 30 45 60 75 90 0 15 30 45 60 75 90
EDW - D3 EDW - D3
160 160
80 80
0 0
0 10 20 30 40 50 60 0 10 20 30 40 50 60
EDW - D2 EDW - D2
160 160
80 80
0 0
0 10 20 30 40 50 60 70 0 10 20 30 40 50 60 70
EDW - D1 EDW - D1
160 160
80 80
0 0
0 10 20 30 40 50 60 0 10 20 30 40 50 60
CLASSE CLASSE
COM COM
SEM SEM
124
ENE ENE
160 160
80 80
0 0
0 20 40 60 80 100 120 0 20 40 60 80 100 120
ENT ENT
160 160
80 80
0 0
Frequncia (quantidade de exemplos). Sensor Q02
80 80
0 0
0 20 40 60 80 100 120 140 0 20 40 60 80 100 120 140
EDW - A3 EDW - A3
160 160
80 80
0 0
0 15 30 45 60 75 90 0 15 30 45 60 75 90
EDW - D3 EDW - D3
160 160
80 80
0 0
0 10 20 30 40 50 60 0 10 20 30 40 50 60
EDW - D2 EDW - D2
160 160
80 80
0 0
0 10 20 30 40 50 60 70 0 10 20 30 40 50 60 70
EDW - D1 EDW - D1
160 160
80 80
0 0
0 10 20 30 40 50 60 0 10 20 30 40 50 60
CLASSE CLASSE
COM COM
SEM SEM
125
P01 P02
P03 P04
P05 P06
130
P07 P08
P09 P11
P12 P13
131
P14 P15
P16 Q01
Q02 Q03