Академический Документы
Профессиональный Документы
Культура Документы
Renato Tins
Orientador:
Prof. Dr. Marco Henrique Terra
So Carlos
1999
Dedico este trabalho aos meus pais, Denir e
Elisabet, por terem me permitido chegar at aqui e
pelos exemplos de perseverana e simplicidade.
Agradecimentos
Ao Prof. Dr. Marco Henrique Terra pela orientao, amizade e pela confiana
depositada para a realizao deste trabalho.
Ao CNPq pelo suporte financeiro fornecido durante a realizao deste trabalho, sem
o qual o mesmo no seria possvel.
Sumrio
INTRODUO ...01
Rob Manipulador
- vetor de posies das juntas
- vetor de torques
M - matriz de inrcia
v - vetor dos termos centrfugos e de Coriolis
g - vetor dos termos gravitacionais
z - vetor dos termos de frico
ng - nmero de graus de liberdade do manipulador
RESUMO
TINS, R. (1999). Fault detection and diagnosis in robotic manipulators via artificial
neural networks. So Carlos, 1999. 117p. Dissertao (Mestrado) - Escola de
Engenharia de So Carlos, Universidade de So Paulo.
In this work, a new approach for fault detection and diagnosis in robotic manipulators
is presented. A faulty robot could cause serious damages and put in risk the people involved.
Usually, researchers have proposed fault detection and diagnosis schemes based on the
mathematical model of the system. However, modeling errors could obscure the fault effects
and could be a false alarm source. In this work, two artificial neural networks are employed
in a fault detection and diagnosis system to robotic manipulators. A Multilayer Perceptron
trained with Backpropagation algorithm is employed to reproduce the robotic manipulator
dynamical behavior. The Perceptron outputs are compared with the real measurements,
generating the residual vector. A Radial Basis Function Network is utilized to classify the
residual vector, generating the fault isolation. Four different algorithms have been employed
to train this Network. The first utilizes regularization to reduce the flexibility of the model.
The second employs regularization too, but instead of only one penalty term, each radial unit
has a individual penalty term. The third employs subset selection to choose the radial units
from the training patterns. The forth algorithm employs the Kohonens Self-organizing Map
to fix the radial unit center near to the cluster centers. Simulations employing a two link
manipulator and a Puma 560 manipulator are presented, demonstrating that the system can
detect and isolate correctly faults that occur in nontrained pattern sets.
Keywords: Fault detection and diagnosis, Robotic manipulators, Artificial neural networks,
Multilayer perceptrons, Radial basis function networks, Kohonens self-organizing map.
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 1
Introduo
Por outro lado, pode-se utilizar sistemas de deteco e diagnstico de falhas que no
utilizam componentes fsicos adicionais. As diversas tcnicas de deteco e diagnstico de
falhas utilizam processamento de informaes das variveis medidas do sistema sob
condies operacionais bem caracterizadas. As tcnicas mais utilizadas so aquelas que
utilizam o modelo matemtico do sistema para reproduzir o seu comportamento dinmico
livre de falhas. Para um determinado vetor das variveis medidas de entrada do sistema, o
modelo matemtico dever gerar um vetor de sadas para ser comparado com o vetor das
variveis medidas da sada do sistema. A diferena entre estes dois vetores chamada de
resduo. Este resduo deve ser diferente de zero na ocorrncia de uma falha e trar as
informaes necessrias para a sua identificao.
Contudo, erros de modelagem obscurecem os efeitos das falhas e so uma fonte de
alarmes falsos. Tcnicas que buscam robustez em relao aos erros de modelagem na
gerao de resduos so cada vez mais estudadas. Outro problema, provavelmente mais
srio, que muitos dos sistemas reais no podem ser modelados com preciso suficiente.
Um outro enfoque aquele em que se empregam tcnicas de Inteligncia Artificial.
Dentro deste enfoque, podem-se destacar os mtodos que utilizam sistemas baseados em
conhecimento, a lgica nebulosa (fuzzy logic) e as redes neurais artificiais. Estas, em
particular, tm sido exaustivamente empregadas em uma infinidade de reas distintas.
O objetivo deste trabalho propor um sistema de deteco e diagnstico de falhas
baseado em redes neurais artificiais para robs manipuladores. Na arquitetura do sistema
proposto, so utilizadas duas redes neurais artificiais: a primeira tem por objetivo reproduzir
o comportamento dinmico do manipulador e, a segunda tem por funo classificar os sinais
de resduo produzidos pela diferena entre as sadas da primeira rede e as variveis medidas.
Dois tipos diferentes de redes neurais artificias so utilizados. Um perceptron multicamadas
utilizado para efetuar o mapeamento dinmico do sistema e uma rede RBF (radial basis
function) empregada para a classificao dos padres faltosos. Com o objetivo de se fazer
comparaes, esta rede treinada por quatro mtodos diferentes. Um manipulador planar
com dois elos rgidos e um manipulador Puma 560 so simulados para testes do sistema de
deteco e diagnstico de falhas via redes neurais artificiais.
Neste trabalho, apresenta-se no Captulo 1 uma viso geral sobre o problema da
deteco e diagnstico de falhas em sistemas dinmicos. Primeiramente o conceito de
gerao de resduos apresentado. Tal conceito utilizado neste trabalho e pode ser
empregado em mtodos baseados nos modelos matemticos.
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 3
No Captulo 2, uma introduo ao tema das redes neurais artificiais, enfatizando suas
aplicaes em mapeamento de funes e classificao de padres, feita. Duas redes so
apresentadas: o perceptron multicamadas com aprendizado por retropropagao do erro e a
rede radial basis function (RBF). Discute-se, tambm, a motivao de se empregar tais redes
para o sistema de deteco e diagnstico de falhas. Ainda neste Captulo, apresenta-se os 4
algoritmos utilizados neste trabalho para o treinamento das redes RBF.
A seguir, no Captulo 3, uma breve introduo aos robs manipuladores feita. So
apresentadas tambm uma anlise sobre as possveis falhas que ocorrem nestes sistemas, os
mtodos utilizados para a deteco e diagnstico de falhas e os sistemas com tolerncia a
falhas.
A arquitetura do sistema baseado em redes neurais artificiais utilizado para a deteco
e diagnstico de falhas apresentada no Captulo 4. O Captulo 5 traz os resultados do
sistema de deteco e isolao de falhas proposto utilizando redes neurais aplicado ao
manipulador com 2 elos rgidos e ao manipulador Puma 560. Finalmente, o Captulo 6 traz
as discusses sobre o trabalho realizado.
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 4
Captulo 1
Deteco e diagnstico de falhas em sistemas dinmicos
Qualquer tipo de alterao no sistema dinmico que leve a uma perda de desempenho
no aceitvel na realizao de determinadas tarefas pode ser entendida como falha. A
categoria de falhas mais importante engloba as alteraes na planta e o mau funcionamento
de sensores, atuadores e controladores.
Falhas podem ocorrer de modo abrupto ou de modo gradual. Estas ltimas so
geralmente difceis de serem detectadas pois seus efeitos no so observados em curto
prazo. Alm disso, muitas vezes tais efeitos so encobertos pela ao dos controladores. Um
exemplo tpico a variao paramtrica em um sistema dinmico. No entanto, tal qual as
falhas que ocorrem de modo abrupto, essas falhas ocasionam perdas de desempenho no
aceitveis e muitas vezes colocam em risco os equipamentos, o ambiente de trabalho e o
pessoal envolvido. Tais fatores podem explicar a crescente procura por sistemas que
propiciam deteco e diagnstico de falhas (DDF) de forma rpida e confivel.
Segundo a terminologia geralmente aceita, DDF consiste em [GERTLER, 1988]:
a) Deteco da falha, ou seja, a indicao de que algo errado est acontecendo
no sistema;
b) Isolao da falha, ou seja, a determinao do tipo e local da falha, e
c) Identificao da falha, ou seja, determinao do tamanho da falha.1
Mtodos de DDF podem ser empregados em sistemas de controle que propiciem
tolerncia a falhas. Tais sistemas de controle podem ser caracterizados por serem robustos
e/ou reconfigurveis [PATTON, 1997]. Um sistema de controle dito robusto, se retm
satisfatoriamente o desempenho na presena de erros de modelagem, rudos e/ou falhas. O
sistema de controle dito reconfigurvel, se a sua estrutura ou seus parmetros puderem ser
1
Neste trabalho, o termo DDF empregado para designar a deteco e a isolao das falhas.
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 5
alterados em resposta a falhas. Neste caso, o sistema de controle deve detectar e diagnosticar
a falha, modificando posteriormente suas leis para manter um desempenho aceitvel
[STENGEL, 1991].
Muitos sistemas empregam a chamada redundncia fsica (ou de hardware) para obter
tolerncia a falhas. Na redundncia fsica, alguns componentes do sistema de controle
(sensores, atuadores e controladores) so duplicados, ou seja, existem dois componentes
para desempenhar a mesma funo. Os componentes redundantes so aqueles mais sujeitos a
falhas e/ou mais cruciais em relao ao desempenho do sistema.
Uma derivao de tal mtodo a redundncia fsica em paralelo, na qual dois ou mais
conjuntos de sensores, atuadores e controladores, cada qual com capacidade individual de
um controle satisfatrio, so instalados para a execuo da mesma tarefa. Um sistema
gerenciador deve comparar os sinais de controle para detectar o conjunto faltoso. Com dois
sinais redundantes, um sistema votante pode detectar a existncia de um conjunto faltoso
mas no pode identific-lo. Com trs sinais redundantes, um sistema votante pode detectar e
isolar o conjunto faltoso, selecionando assim, qual no deve ser utilizado para o controle da
planta.
Redundncia fsica pode proteger o sistema contra falhas nos componentes do sistema
de controle, mas no nos componentes da planta. Pode, tambm, ser uma alternativa bastante
cara e muitas vezes invivel, como no caso de falta de espao fsico para a instalao dos
componentes redundantes.
De outro lado surgem sistemas de DDF que no necessitam de instrumentao
adicional na planta, utilizando-se do processamento de informao das variveis medidas.
Dentro deste enfoque, os mtodos que empregam a chamada redundncia analtica [CHOW
& WILLSKY, 1984] so os mais conhecidos. Estes mtodos utilizam o conceito de gerao
de resduos, que ser visto na Seo seguinte. Os sistemas de DDF via redundncia analtica
sero apresentados resumidamente na Seo 1.2. Ser visto que erros de modelagem podem
comprometer a eficincia de tais sistemas de DDF, levando os pesquisadores a buscarem
tcnicas robustas. Como ser visto na Seo 1.3, tcnicas de inteligncia artificial podem
tornar-se ferramentas interessantes para auxlio da resoluo de tal problema.
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 6
rudos de
falhas falhas falhas medida
rudos do
sistema
( )
x& (t ) = f t x(t ), u(t ), d(t ) (1)
na qual x(t) o vetor de estados no tempo t, y(t) o vetor de sadas no tempo t, u(t) o vetor
de controle atual, d(t) o vetor de distrbios externos no-correlacionados e, ft (.) e gt (.)
representam as funes no-lineares do sistema livre de falhas. Discretizando as equaes
acima, o sistema dinmico livre de falhas pode ser representado por
(
x(t + t ) = f x(t ), u(t ), d(t ) ) (3)
x(t)
Dinmica do
u(t) x(t+t)
sistema
d(t)
Considerando agora os efeitos das falhas, as equaes do sistema podem ser dadas por
(
x (t + t ) = f x(t ), u(t ), d(t ) ) (5)
( )
y (t ) = g x(t ), u(t ), d(t ) (6)
nas quais f (.) e g (.) representam as funes no-lineares do sistema na presena de falhas.
Note que as falhas podem ser, ou no, entradas aditivas do sistema (ou seja, dependentes
apenas do tempo t). O vetor de falhas aqui definido como a diferena do comportamento
dinmico do sistema na presena de falhas (Eq. 5) e do comportamento dinmico do sistema
livre de falhas (Eq. 3). Assim, o vetor de falhas dado por
( ) ( )
(t + t ) = x (t + t ) x(t + t ) = f x(t ), u(t ), d(t ) f x(t ), u(t ), d(t ) . (7)
x1
x(3)
x(1)= x(1)
x(2)= x(2) (3)
x(4)
x(0)= x(0) x(3)
(4)
x(4)
x2
Figura 3. Vetor de falhas e estados de um sistema em que ocorre uma falha em t=2.
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 8
x1
x(1) x(2)
(1) x(3)
(2) x(2) (3)
x(1) x(4)
x(0) x(3)
(4)
x(4)
x2
Figura 4. Vetor de resduos e estados de um sistema em que ocorre uma falha em t=2.
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 9
Portanto, o procedimento para DDF pode ser descrito da seguinte forma: gera-se o
vetor de resduos comparando-se o vetor de estados medidos em (t+t) com a sua estimativa
dada por uma ferramenta qualquer e, posteriormente, analisa-se o vetor de resduos,
indicando a falha ocorrida. Normalmente nesta etapa, uma falha detectada quando uma
banda pr-definida (que ser chamada banda de deteco) sobre o vetor de resduos
ultrapassada. Contudo, como as falhas e os erros de mapeamento geralmente so
correlacionados com a dinmica do sistema, o sistema de DDF pode no conseguir detectar
uma falha ou gerar alarmes falsos.
Note que para a gerao de resduos, os estados esto sendo considerados
mensurveis. No entanto, se a sada do sistema possuir informao suficiente a respeito dos
estados, uma equao de sada do tipo recursiva pode ser utilizada para a gerao de
resduos. Assim, a equao do sistema que dever ser reproduzida dada por
falhas
d (t) y (t)
u (t) sistema
$ (t )
estimao de H
estados
O enfoque por identificao paramtrica faz uso do fato de que as falhas nos sistemas
dinmicos so refletidas nos parmetros fsicos, como por exemplo frico, massa,
viscosidade, capacitncia, etc. A idia bsica detectar as falhas fazendo a estimativa
paramtrica do modelo matemtico atual e calculando os desvios em relao ao modelo do
sistema sem falhas [ISERMANN, 1984]. O procedimento utilizado ilustrado na Figura 6.
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 12
falhas
d (t)
sistema y (t)
u (t)
atual
identificao
paramtrica
parmetros do sistema
determinao das
variaes paramtricas
deciso das
alarmes
falhas
Captulo 2
As redes neurais artificiais
O perceptron multicamadas pode ser visto como um veculo prtico para realizar
mapeamentos de funes no-lineares de maneira geral [HAYKIN, 1994]. A relao
entrada/sada do MLP define um mapeamento de um espao de entrada Euclidiano p-
dimensional para um espao de sada Euclidiano q-dimensional continuamente
diferencivel. Um MLP com apenas uma camada escondida pode ser visto na Figura 7.
h1
1 $ 1
2 $ 2
h2
hm
p $ q
Camada Camada Camada
de entrada escondida de sada
Figura 7. Perceptron multicamadas com uma nica camada escondida.
Para um MLP com uma nica camada escondida, apresentando-se o n-simo padro
de entrada (n) = [ 1(n) 2(n) ... p(n)] T, a ativao do neurnio de sada k e a ativao
dos neurnios j da camada escondida, respectivamente, so dadas por
m
$ k (n) = k k j (n) h j (n) , (11)
j =0
p
j (n) = j j i (n) i (n)
h (12)
i =0
a (v a ) = 1
1 + exp ( v a ) (13)
na qual k (n) a varivel que deve ser estimada pela sada da RNA $ k (n) . A soma dos
erros quadrticos instantneos nas sadas do MLP para o padro n dada por
1 q 2
E (n) = ek (n) (15)
2 k =1
np
1
E medio =
np
E (n) . (16)
n =1
Utilizando-se a lei delta [HERTZ et al., 1991], as conexes entre a camada escondida
e a camada de sada so ajustadas por
E (n)
kj (n) = (n) (17)
kj (n)
na qual
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 19
(
k (n) = e k (n) k ' v k (n) .) (19)
na qual
( ) k (n) kj (n) .
q
j (n) = j ' v j (n) (21)
k =1
Teorema A1: [CYBENKO, 1989] Seja qualquer funo de ativao contnua. Ento, dada
np
qualquer funo contnua com valores reais f (.), em um subespao compacto s e>
0, existem vetores 1 , 2 ,..., m , , e uma funo parametrizada G( . , , , ): tal
que
G( , , , ) f ( ) < (22)
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 20
j ( Tj + j )
m
G ( , , , ) = (23)
j =1
Este teorema pode ser interpretado da seguinte maneira: uma falha na funo de
mapeamento do MLP resultado de uma escolha de parmetros inadequada ou de um
insuficiente nmero de unidades escondidas [EFRATI, 1997].
Neste trabalho, o MLP com treinamento por retropropagao do erro ser utilizado
para aproximar a funo dinmica do sistema. Inicialmente, esta RNA tambm deveria ser
utilizada para o problema de classificao do vetor de resduos.
Para o problema de classificao, o MLP produz bordas de deciso que separam os
padres das diferentes classes. Bordas de deciso so superfcies (ou linhas para o caso de
dois neurnios na entrada) no espao de entradas onde a sada dos dois (ou mais) neurnios
com maior ativao na ltima camada so iguais para um mesmo padro. As bordas de
deciso produzidas pelo MLP com treinamento por retropopagao so posicionadas muito
perto da superfcie que separa os padres de treinamento pertencentes s diferentes classes.
Esta caracterstica do MLP pode gerar m-classificao dos padres no-treinados em
problemas (como por exemplo em DDF) em que as superfcies que separam as diferentes
classes so difceis de serem estipuladas atravs de um conjunto limitado de padres. Este
problema poderia ser evitado se as bordas de deciso estivessem em posies mais
conservadoras. Alm disso, nas reas do espao de entradas no ocupadas pelos padres do
conjunto de treinamento a classificao arbitrria j que os pontos de sada desejados
somente refletem as ativaes da rede para os padres empregados no treinamento
[LEONARD & KRAMER, 1991]. Portanto, sob certas condies, o MLP com treinamento
por retropropagao pode produzir bordas de deciso que so no-intuitivas e no-robustas.
Para ilustrar tais caractersticas ser apresentado um exemplo adaptado de
LEONARD & KRAMER (1991). O seguinte problema de DDF uma verso simplificada
de muitos dos problemas encontrados em processos reais, em que a RNA utilizada para a
classificao das falhas (observe que o conceito de gerao de resduos no empregado).
nb
xi = x 0i + aij b j + ci , i = 1,..., n x (24)
j =1
0.8
0.6
0.4
0.2
0
x2
-0.2
-0.4
-0.6
-0.8
-1
-1 -0.5 0 0.5 1
x1
Figura 8. Padres utilizados no exemplo 1: o operao normal, x falha 1, + falha 2.
Observe que a regio classificada como falha 1 menor que a regio classificada
como falha 2 sem que os padres do conjunto de treinamento indicassem tal
comportamento. Isto ocorre porque a classificao das regies reflete as ativaes do MLP
para os padres utilizados no treinamento. Veja que para o conjunto de treinamento a
classificao satisfatria. No entanto, tal caracterstica pode gerar m-classificao para
problemas de DDF em que o tamanho do conjunto de treinamento geralmente limitado.
Note tambm que existe uma regio no quadrante inferior esquerdo que foi definida como
falha 1, apesar de no haver padres de treinamento localizados nesta rea que indiquem tal
comportamento.
Estes problemas podem ser superados quando se utilizam redes RBF, nas quais a
classificao feita de acordo com a distncia entre o padro a ser classificado e os centros
das unidades radiais que representam as diferentes classes.
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 23
Funes de base radial so, simplesmente, uma classe de funes. MOODY &
DARKEN (1989) propuseram seu uso em um novo tipo de RNA chamada rede com funo
de base radial (RBF). Esta RNA inspirada em neurnios que tm ativaes localmente
sintonizadas ou neurnios seletivos, que respondem para determinadas faixas de sinais de
entrada e so encontrados em diversas partes do corpo humano e de outros animais. Em
princpio, as redes RBF podem ser multicamadas e terem funes de ativao na sada no-
lineares. Contudo, redes RBF tm tradicionalmente sido associadas com funes radiais em
uma nica camada escondida e funes de sada lineares [ORR, 1996 a].
A rede RBF utilizada neste trabalho tem trs camadas distintas. Na primeira, os
padres de entrada so apresentados. No existem pesos entre a primeira e a segunda
camadas, sendo os padres de entrada repassados para os neurnios da segunda camada
(camada escondida). As unidades desta camada tm funo de ativao radial. Cada
neurnio j da camada escondida (chamado unidade radial j) responsvel pela criao de
um campo receptivo no espao de entradas centrado em um vetor j , chamado de centro da
unidade radial. A unidade radial j tem ativao de acordo com a distncia entre o vetor de
entrada e o centro da unidade radial. Quanto mais prximos forem os dois vetores, maior
ser a ativao do neurnio (Figura 10). Entre a segunda e a terceira camadas existem pesos
e a terceira camada apresenta ativao linear. A k-sima (k = 1,...,q) sada da rede RBF para
o n-simo (n = 1,...,np) vetor de entrada n , dada por
m
$ k (n) = k j h j (n) (25)
j =0
(n) 2
h j (n) = exp
j (26)
2 2
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 24
h 0.5
0
-1 -0.5 0 0.5 1
x
Figura 10. Resposta da funo Gaussiana com o centro em 0 ( = 0) e = 0,3. Note que a
ativao mxima ocorre em x = .
h j (n) =
1
(27)
((n) j )
2
1
1+ R
na qual R uma matriz diagonal formada pelos parmetros individuais que definem o
tamanho do campo receptivo em cada dimenso do espao de entradas, ou seja
1 0 0 0
0 2 0 0
R= .
(28)
0 0 O 0
0 0 0 p
Figura 11. Separao do espao de entradas do exemplo 1 de acordo com a classificao feita
pela rede RBF: o operao normal, x falha 1, + falha 2.
As redes RBF ainda apresentam outras vantagens sobre o MLP, tais como
inexistncia de mnimos locais no clculo dos pesos e um menor tempo de treinamento
[LOONEY, 1997]. Entre as desvantagens, pode-se citar: as redes RBF ocupam mais
memria devido ao nmero alto de unidades escondidas (unidades radiais), a velocidade de
operao pode ser menor devido ao maior nmero de unidades escondidas e a escolha das
unidades radiais e de seus parmetros subtima. Neste ponto, uma questo que pode surgir
: por que no utilizar tambm a rede RBF para a aproximao da funo dinmica do
sistema no problema de DDF? Realmente, a rede RBF apresenta bons resultados no
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 26
a um particular conjunto de padres ter uma grande varincia. Considerando que $ a()
sada do modelo de predio (neste caso a sada da rede RBF) da varivel medida
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 27
E medio = ( ( ) $ ( ))
2
(29)
na qual a expectncia, que indicada por < . >, considerada sobre os padres do espao de
entradas. Separando a equao acima em duas componentes [GERMAN et al., 1992]
(
E medio = ( ) $ ( ) ) (
+ $ ( ) $ ( ) )
2 2
(30)
na qual a primeira parte desta equao o bias ao quadrado e a segunda parte a varincia.
O bias indica a diferena entre a sada desejada e a mdia das sadas do modelo. A varincia
indica a sensibilidade s peculiaridades (tal qual rudos e escolha dos padres) de cada
conjunto particular de treinamento. A melhor generalizao ocorre quando existe o melhor
compromisso entre as conflitantes necessidades de bias pequeno e varincia pequena. Isto
pode ser obtido controlando a flexibilidade do modelo. Um modo de controlar a
flexibilidade da rede RBF utilizar a tcnica da regularizao (como nos dois primeiros
mtodos de treinamento), conhecida de Regresso Linear, para diminuir a sensibilidade do
modelo em relao ao conjunto de treinamento e, assim, diminuir a varincia. Em um outro
enfoque, a flexibilidade pode ser controlada variando-se o nmero de parmetros
adaptativos da rede RBF (como em seleo de subconjuntos). Finalmente, a flexibilidade
pode ser controlada escolhendo os centros das unidades radiais como uma mdia dos
padres pertencentes a aglomerados de uma mesma classe (como empregando o mapa auto-
organizvel de Kohonen). Assim, diminui-se a varincia e o nmero de parmetros
adaptativos da rede RBF.
Por volta dos anos 50, o russo Andre Tikhonov desenvolveu a tcnica matemtica
conhecida como regularizao para a soluo de problemas mal definidos [ORR, 1996 a].
Estes so problemas nos quais no h uma nica soluo porque no existem informaes
suficientes no problema. No entanto, o trabalho de Tikhonov s ficou amplamente
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 28
varincia for grande, o erro mdio quadrtico ainda poder ser grande. Este ser o caso se a
sada do modelo de predio altamente sensvel s peculiaridades (tais como rudo e
escolha dos padres) de um conjunto de treinamento particular e esta sensibilidade causa
problemas de regresso mal definidos no sentido de Tikhonov. Contudo, a varincia pode
ser significativamente reduzida introduzindo-se uma pequena quantidade de bias na funo
de custo a ser minimizada.
Introduzir um termo de bias equivalente a restringir o domnio das funes as quais
o modelo pode reproduzir. Tipicamente isto alcanado removendo graus de liberdade.
Como exemplo, pode-se diminuir a ordem de um polinmio ou reduzir o nmero de pesos na
RNA. Ridge regression no remove explicitamente os graus de liberdade mas, ao invs
disso, diminui o nmero efetivo de parmetros. Como resultado tem-se uma perda de
flexibilidade que faz o modelo menos sensvel.
Um mtodo conveniente de se restringir a flexibilidade de modelos lineares
aumentar a soma dos erros quadrticos com um termo que penaliza os pesos grandes.
Quando as RNA se tornaram populares na dcada de 1980, uma das tcnicas que surgiram
para podar conexes sem importncia na rede foi a de decaimento de pesos. Logo foi
reconhecido que ridge regression e decaimento de pesos so equivalentes pois acrescentam
o mesmo termo de penalidade soma dos erros quadrticos.
Neste trabalho, utilizou-se ridge regression de duas formas: a primeira, a qual ser
chamada global ridge regression, utiliza um nico termo de penalidade (ou regularizao)
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 29
para todos os pesos, e a segunda, local ridge regression, utiliza temos de regularizao
individuais para os vrios pesos.
np m
( k (n) $ k (n)) +
2 (31)
Ck = 2
kj
n =1 j =1
( )
1
$ = HTH + I
HT
m (32)
na qual a matriz identidade I tem dimenso m (nmero de unidades radiais que, aqui, igual
[
= 1 2 K q ] [
na qual k = k (1) k (2) K k (n )]
p
T
e, H a matriz de
projeto formada pelas ativaes hj das unidades radiais para os diferentes padres de
P = I n p HA 1H T (33)
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 31
(
A 1 = H T H + )1 (34)
n p TP2 (35)
$ GCV
2
=
(tr (P))2
somente $ aparece no lado direito da equao (Apndice A5). Considerando-se que a rede
RBF tem apenas uma sada, ento
$ =
(
T P 2 tr A -1 $ A -2 ). (36)
$ A tr (P )
T -1 $
Esta no uma soluo, e sim uma frmula de reestimao j que o lado direito da
equao depende de $ . Portanto, um valor inicial de $ tem que ser escolhido e usado no
lado direito da equao acima. Isto leva a uma nova estimativa e o processo pode ser
repetido at que algum critrio de convergncia seja alcanado.
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 32
np
( ) +
m
Ck = k (n) $ k (n)
2
j kj2 . (37)
n =1 j =1
( )
1
$ = HT H +
HT (38)
Quando o valor calculado j = , a j-sima unidade radial pode ser removida, pois,
se for calculada a matriz de projeo com j = , esta ser igual a matriz de projeo sem a
unidade radial j. Na prtica, especialmente se a rede inicialmente muito flexvel (alta
varincia e/ou pequeno bias), vrios valores timos dos parmetros de regularizao sero
iguais a e LRR pode ser usado para podar unidades radiais desnecessrias. O Apndice
A6 traz o mtodo para o clculo dos valores timos dos parmetros de regularizao.
Como qualquer tipo de otimizao no-linear, o algoritmo pode cair em um mnimo
local dependendo das condies iniciais. aconselhvel, portanto, que valores iniciais dos
parmetros de regularizao sejam escolhidos (por exemplo, iniciar com o parmetro global
calculado pelo mtodo GRR), ao invs de inici-los com valores aleatrios.
Uma alternativa aos mtodos que controlam o balano entre bias e a varincia (como
os mtodos que utilizam regularizao) comparar os modelos formados por diferentes
subconjuntos de unidades radiais subtrados de um mesmo conjunto de treinamento fixo.
Deste modo, a flexibilidade variada mudando-se o nmero de parmetros adaptativos da
rede RBF (como os pesos e tamanho do campo receptivo das unidades radiais). Isto
chamado de seleo de subconjuntos em estatstica [RAWLINGS, 1988]. Seleo de
subconjuntos normalmente utilizada para a identificao de subconjuntos de funes
fixadas de variveis independentes que podem modelar a maior variao das variveis
dependentes. Neste sentido, achar o melhor subconjunto intratvel, sendo necessrio a
utilizao de procedimentos heursticos. Um destes procedimentos heursticos chama-se
forward selection (FS).
CHEN et al. (1991) utilizaram FS para escolher os centros das unidades radiais em
redes RBF a partir dos padres do conjunto de treinamento. FS comea com um conjunto
vazio e adiciona uma unidade radial por vez - aquela que mais reduz a soma dos erros
quadrticos [MILLER, 1990]. Ou seja, considerando-se apenas uma sada (q=1), a unidade
radial selecionada aquela cuja diferena abaixo (veja Apndice A7) maior
C$ M C$ M +1 =
( TPM h n )
2
(39)
h Tn P M h n
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 34
a n-sima (n = 1, ..., np) unidade radial ser acrescentada, C$ M +1 a soma dos erros
a]. Apesar da soma dos erros quadrticos C$ nunca aumentar quando uma nova unidade
radial for acrescentada, o erro GCV eventualmente ir parar de decrescer e comear a
crescer, indicando um sobreajuste. Este o ponto em que o algoritmo deve parar a seleo.
A matriz de pesos tima dada por (veja Apndice A2)
( )
1
$ = HT H
HT (40)
{
h c ( t ) = max h j (t )
j
} (41)
na qual c a unidade radial selecionada, j=1,...,mk (mk o nmero de padres da classe k),
k=1,...,q (q o nmero de classes) e t=1,...,tmax o ndice do tempo discreto (tmax deve ser
mltiplo de mk). Em cada amostra t, um padro diferente do subconjunto de treinamento
deve ser apresentado (para que o algoritmo apresente uma convergncia conveniente, o
subconjunto de treinamento deve ser apresentado diversas vezes). O passo seguinte
atualizar as posies dos centros das unidades radiais de acordo com
[
j (t + 1) = j (t ) + (t ) (t ) (t ) j (t )] (42)
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 36
na qual (t) uma funo de decaimento no tempo que define a taxa de aprendizagem e
j) e o centro da
(t) uma funo da distncia vetorial entre o centro da unidade radial j (
c). Aqui, esta funo dada por
unidade radial selecionada (
1
(
, se R 1 c j < (t ), )
( )
2
1
(t ) = 1 + R c j (43)
0, (
se R 1 c j (t ) )
na qual a funo de espalhamento (t) decai com o tempo e define o tamanho da vizinhana
c). Se o nmero de iteraes (tmax)
ao redor do centro da unidade radial selecionada c (
suficientemente grande e os parmetros de treinamento so apropriadamente escolhidos, os
centros das unidades radiais em um mesmo aglomerado (cluster) devero se mover at as
proximidades do centro do aglomerado (ou seja, no local em que a mdia das ativaes das
unidades radiais para todos os padres de um mesmo aglomerado seja a maior). Aps o
treinamento, vrios centros de um mesmo aglomerado estaro na mesma posio ou em
posies muito prximas. Pode-se, portanto, juntar estas unidades radiais em uma nica, j
que as ativaes de duas unidades radiais com o mesmo centro so iguais. Agindo desta
forma, a complexidade da rede RBF diminui pois o nmero de parmetros adaptativos
(pesos) decresce. Este procedimento tambm importante para evitar problemas de
singularidade na matriz usada para determinar os pesos timos (Eq. 40). Se existem dois
centros muito prximos, a inversa da matriz da Eq. 40 sofre problemas de mal
condicionamento. A unio das unidades radiais com centros muito prximos feita
verificando se a norma da distncia entre duas unidades radiais muito pequena. Se a
resposta for afirmativa, uma unidade radial retirada.
Repetindo o procedimento descrito acima para todas as classes, as unidades radiais de
cada subconjunto so agrupadas em uma nica rede RBF e a matriz de pesos tima
calculada atravs da Eq. (40). A seguir, um exemplo simples ser apresentado para
demostrar a eficincia deste mtodo.
1.5
1
v
a
r
i 0.5
v
e
l 0
2
-0.5
o Classe 1
+ Classe 2
* Centros
-1
-0.2 0 0.2 0.4 0.6 0.8
varivel 1
Figura 12. Padres de treinamento e campos receptivos criados pelas unidades radiais de uma
rede RBF treinada pelo algoritmo FS.
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 38
1.5
v
a 0.5
r
i
v 0
e
l
2 -0.5
o Classe 1
+ Classe 2
* Centros
-1
-0.2 0 0.2 0.4 0.6 0.8
varivel 1
Figura 13. Padres de treinamento e campos receptivos criados pelas unidades radiais de uma
rede RBF treinada pelo algoritmo MAOK.
A seguir, foram gerados 200 padres com as mesmas caractersticas anteriores para
teste das redes RBF treinadas pelos dois mtodos. As Figuras 14 e 15 mostram os padres de
treinamento e os campos receptivos formados pelas redes RBF treinadas pelos dois
algoritmos.
1.2
0.8
0.6
v
a 0.4
r
i 0.2
v 0
e
l -0.2
2
-0.4
o Classe 1
-0.6 + Classe 2
* Centros
-0.8
-0.4 -0.2 0 0.2 0.4 0.6 0.8 1
v a r i v e l 1
Figura 14. Padres de teste e campos receptivos criados pelas unidades radiais de uma rede
RBF treinada pelo algoritmo FS.
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 39
1.2
0.8
0.6
v
a 0.4
r
i 0.2
v 0
e
l -0.2
2
-0.4
o Classe 1
-0.6 + Classe 2
* Centros
-0.8
-0.4 -0.2 0 0.2 0.4 0.6 0.8 1
v a r i v e l 1
Figura 15. Padres de teste e campos receptivos criados pelas unidades radiais de uma rede
RBF treinada pelo algoritmo MAOK.
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 40
Captulo 3
O rob manipulador
Robs manipuladores (ou robs industriais) esto sendo cada vez mais utilizados em
sistemas de engenharia. Entre as diversas aplicaes, pode-se citar o seu uso cada vez mais
frequente em processos de produo, explorao espacial, medicina e ambientes hostis (tais
como usinas nucleares e fundo do mar).
Um rob manipulador definido como uma mquina com caractersticas significantes
de versatilidade e flexibilidade [SCIAVICCO & SICILIANO, 1996]. De acordo com uma
definio amplamente aceita feita pelo Robot Institute of America, datada de 1980, um rob
um manipulador multifuncional projetado para mover materiais, partes, ferramentas ou
artifcios especializados atravs de movimentos programados variveis para o desempenho
de uma variedade de tarefas. Um rob manipulador constitudo por
manipulador (ou estrutura mecnica): constitudo por um conjunto de elos conectados
atravs de articulaes (ou juntas), um pulso e um efetuador projetado para realizar a tarefa
requerida pelo rob,
atuadores: responsveis pela movimentao do manipulador atravs de foras aplicadas
direta ou indiretamente nas juntas (atravs, por exemplo, de engrenagens ou correias); as
foras so aplicadas por motores eltricos, pneumticos ou hidrulicos,
sensores: indicam o status do manipulador e,
sistema de controle (computador): permite o controle e a superviso do manipulador.
As juntas de um manipulador podem ser rotativas, que permitem movimentos de
rotao das diferentes partes do rob (elos, punho ou efetuador), ou prismticas, que
permitem movimentos de translao. Geralmente, sensores de velocidade e/ou posio so
colocados nas juntas do rob.
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 41
2
l2
l1
Figura 16. Rob manipulador com dois elos rgidos e juntas rotativas.
Considere um rob manipulador rgido livre de falhas com atuadores em cada grau de
liberdade. A sua dinmica dada por [CRAIG, 1988]
na qual o vetor dos ngulos das juntas (ng -dimensional), ng o nmero de graus de
liberdade, t o ndice do tempo, o vetor dos torques (ng -dimensional), M a matriz de
inrcia (ng x ng), v o vetor dos termos centrfugos e de Coriolis, g o vetor dos termos
gravitacionais, z o vetor dos termos de frico dinmica e esttica e d o vetor dos
distrbios externos no-correlacionados.
A matriz de inrcia simtrica e positiva definida para qualquer rob manipulador.
Utilizando-se o equacionamento anterior, tem-se a seguinte equao de estados para o
manipulador livre de falhas
& &
x& = =
M( )
&&
1
[ & &
) ]
v , g( ) z , , t d(t )
( ) ( (45)
[ ]T ou seja x = [1 ]
T
na qual o vetor de estados x = & L ng &1 L &ng .
Exemplificando o sistema acima para um rob planar com dois elos rgidos se
movendo no plano vertical, como na Figura 16, tem-se
m l g s + (m1 + m2 ) l1 g s1
g( ) = 2 2 12 ,
m2 l2 g s12
distncia destes ambientes torna o envio de seres humanos invivel para reparar um rob
com falhas. No caso de ambientes espaciais, falhas em robs sem tolerncia podem fazer
com que a misso aborte. Em medicina, um rob com falhas pode matar um paciente ou
gerar sequelas permanentes. Em plantas nucleares, o mau funcionamento de robs pode
causar acidentes irreversveis com alta periculosidade. Tais fatos justificam a formulao de
mtodos de DDF em robs manipuladores.
Considerando agora o efeito da falha na dinmica do rob manipulador, a equao de
estados aps a falha pode ser dada por
& &
x& = =
M( )
&&
1
[ ) ] (
v , & g( ) z , & , t d(t ) + , & , , t
( ) ( ) (46)
observadores robustos) e/ou para a anlise dos resduos (atravs de bandas de deteco
adaptativas). Todos os mtodos descritos acima tm as seguintes caractersticas: 1) o modelo
nominal do sistema considerado linear e, 2) as falhas so modeladas como entradas
aditivas externas (ou seja, dependentes apenas do tempo e no dos estados e das entradas do
sistema). Apesar de ser conveniente do ponto de vista analtico o estudo de problemas de
DDF em estruturas lineares, a dinmica do manipulador inerentemente no-linear e a
maioria das falhas reais so funes no-lineares dos estados e das entradas [VEMURI &
POLYCARPOU, 1997].
Um enfoque para DDF em robs manipuladores diferente dos utilizados
anteriormente o desenvolvido por VEMURI & POLYCARPOU (1997), no qual uma RNA
empregada para mapear a funo de falha (ver Eq. 46). Seu mtodo interessante pois a
falha no considerada como uma entrada aditiva externa e sim como uma funo das
variveis do sistema. A tarefa da RNA mapear a funo da falha, tendo como entradas as
velocidades e as posies das juntas. Assim, o sistema pode no s detectar, mas tambm
reproduzir a funo da falha. O mtodo utiliza um observador para, baseado no modelo
matemtico e na funo de falha estimada pela RNA, gerar uma estimativa das variveis
medidas. O erro entre o valor estimado e o valor medido utilizado para o ajuste dos pesos
da rede. O trabalho no prope nenhum esquema para isolao da falha, propondo que
algum mtodo de classificao de padres deva ser utilizado. O maior problema deste
mtodo que erros de modelagem podem comprometer, durante o treinamento da RNA, o
mapeamento do vetor de falhas.
permite que, dependendo da junta onde ocorre a falha, o rob consiga executar a tarefa
requerida mesmo com uma falha nos componentes de uma junta (neste caso, a falha deve ser
detectada e isolada para que a junta seja travada). Em outra alternativa, como a usada no
Sistema Manipulador Remoto do nibus Espacial, o sistema de DDF deve desligar o
sistema de controle e o operador deve manualmente executar a tarefa [VISINSKY et al.,
1994].
Por outro lado surgem sistemas de tolerncia a falhas que no necessitam de
mecanismos adicionais. Dois exemplos sero aqui citados. No primeiro, considerando que
uma falha que afete o atuador de uma junta seja detectada e isolada, reconfigura-se o
sistema de controle para trabalhar com o manipulador subatuado. Em BERGERMAN
(1996), os problemas de modelagem, controlabilidade, controle e planejamento de trajetrias
em manipuladores subatuados foram estudados. Se uma falha que impossibilite o uso do
atuador de uma junta qualquer do manipulador foi detectada e isolada, o sistema de controle
pode ser reconfigurado para, atravs das juntas que ainda tm atuao, controlar a junta no
atuada. Salienta-se que as juntas devem ser dotadas de freios. O segundo exemplo trabalha
com falhas que no prejudiquem seriamente o manipulador, tal qual mudanas paramtricas
(como aumento de massa nos elos). Utilizando o conceito de gerao de resduos, pode-se
reconfigurar o sistema de controle para que tenha a habilidade de tolerncia a falhas
[VEMURI & POLYCARPOU, 1997]. Para isso, o vetor de resduos utilizado para estimar
a funo de falha, que indica a diferena do modelo esperado (sem falhas) e do sistema
faltoso. Esta diferena deve ser usada para reconfigurar o sistema de controle que usa o
modelo matemtico do sistema. Tal qual para os sistemas de DDF, a preciso do
mapeamento dinmico do sistema (via RNA) essencial para o bom funcionamento do
mecanismo.
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 48
Captulo 4
Sistema de deteco e diagnstico de falhas via redes
neurais artificiais para robs manipuladores
$ gerado atravs da subtrao x- x$ . O MLP deve ser treinado para que o resduo seja zero
quando o rob manipulador no apresenta nenhuma falha. Quando ocorrer uma falha, este
resduo ter um valor diferente de zero, possibilitando a sua deteco. Espera-se que cada
falha tenha uma assinatura particular, o que permite que a rede RBF possa realizar a
classificao.
[ ]
u (t ) = (t )
T
[
x ( t + t ) = ( t + t ) & ( t + t ) ]T
manipulador
x(t )
z-1
a)
x$ ( t + t ) $ ( t + t )
MLP
-
falhas
[ ]
u (t ) = (t ) [
x ( t + t ) = ( t + t ) & ( t + t ) ]T
T
manipulador
x(t )
z-1
b)
x$ ( t + t ) $ ( t + t )
MLP
-
&& (t ) = (t + t ) (t ) .
& &
(47)
t
& (t + t ) = M( )
1
[ v(,& ) g() z(,& ,t ) d(t )] t + & (t ) . (48)
& (t + t ) = M( )
1
[ v(,& ) g() z(,& , t ) d(t )] t + (,& , , t ) t + & (t ) . (49)
O MLP deve reproduzir a equao dinmica do manipulador sem falhas (Eq. 48).
Assim, os dados de entrada do MLP sero os estados (posies e velocidades das juntas) e
as entradas (torques nas juntas) medidas no instante t. As sadas do MLP sero as
estimaes das velocidades medidas no instante (t+t). Deste modo
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 51
( t )
(n) = & ( t ) e,
( t )
$
[
$ (n) = & (t + t ) . ]
importante observar que o perodo amostral est implcito no mapeamento realizado
pelo MLP. O erro de mapeamento do MLP (manipulador sem falhas) no padro n dado por
$
( n) $ (n) = & (t + t ) & ( t + t ) = e( t + t ) . (50)
Note que os rudos de medida podem estar implcitos nesta equao. Assim, o vetor
de resduo do manipulador livre de falhas deve ser dado por
$ (t + t ) = e(t + t ) . (51)
A anlise feita atravs da rede RBF que tem por objetivo classificar os padres de
resduo. Os padres de entrada desta rede sero o vetor de resduos e as velocidades das
juntas. As velocidades so utilizadas pois nos manipuladores, os erros de mapeamento do
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 52
a) Informaes
das falhas
$ (t + t ) sada 1
sada 2
& (t + t ) Rede RBF sada 3
sada q
b)
$ (t + t ) sada 1 falha 1
sada 2 falha 2
Critrio de
& (t + t ) Rede RBF sada 3
deteco
falha 3
sada q falha q
A rede RBF treinada para que suas sadas apresentem sinal 1 no caso de uma falha
do seu tipo relacionado e 0 em caso contrrio (por exemplo, se ocorre uma falha do tipo 2, o
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 53
neurnio de sada 2 deve ter ativao igual a 1 e os outros neurnios devem ter ativao
igual a 0). O critrio de deteco considera que para uma falha ser detectada, o neurnio de
sada correspondente deve ter uma sequncia (com um nmero pr-definido de amostras) de
ativaes maiores que 0,5. Este critrio adotado para evitar que padres isolados mal-
classificados causem alarmes falsos. Assim, se considerado que o nmero de amostras para
a deteco deve ser 3, ento a falha detectada quando um neurnio de sada apresentar 3
ativaes consecutivas maiores que 0,5. Este critrio no diminui significativamente a
sensibilidade do sistema de DDF pois, em geral, o perodo amostral baixo.
Captulo 5
Resultados
considerado que cada junta do rob possui dois sensores: um para velocidade
angular e outro para posio. Durante a simulao, rudos de medida so considerados nos
sinais de posio das juntas (mdia=0 e varincia=0.005 ) e de velocidade angular das juntas
(mdia=0 e varincia=0.05 ). O rob executa suas tarefas atravs de trajetrias pr-
definidas. Em cada trajetria, os elos saem de uma posio inicial e realizam o movimento
at a posio final. Por exemplo, a trajetria vista na Figura 16 vai de =[/4 0]T at =[/2
/4]T.
0
0 50 100 150 200
Torque das juntas (N m)
100
-100
0 50 100 150 200
Velocidade das juntas (rad / s)
20
-20
0 50 100 150 200
amostras
Figura 19. Entradas do MLP (antes da normalizao) para a trajetria no-treinada livre de
falhas de =[
/6 /4] at =[2
/3 /3] . Os dados da junta 1 so representados pelas linhas
T T
12
rad / s
junta 1
junta 2
-6
0 50 100 150 200
amostras
Figura 20. Velocidades reais (linhas contnuas) e sadas do MLP sem normalizao (linhas
tracejadas) para a trajetria no-treinada livre de falhas de =[
/6 /4] at =[2
/3 /3] .
T T
0.8
rad / s
-1
0 50 100 150 200
amostras
Figura 21. Resduos das velocidades (no-normalizados) para a trajetria no-treinada livre de
falhas de =[
/6 /4] at =[2
/3 /3] . Os dados da junta 1 so representados pelas linhas
T T
trajetria empregada nas figuras anteriores, mas com a ocorrncia da falha do tipo 1 entre as
amostras 10 e 160.
0
0 200
-100
0 200
-10
0 Amostras 200
10
rad / s
junta 1
junta 2
-8
0 160 200
amostras
Figura 23. Velocidades reais (linhas contnuas) e sadas do MLP no-normalizadas (linhas
tracejadas) para a trajetria no-treinada de =[
/6 /4] at =[2
/3 /3] em que ocorre a falha
T T
0.5
rad / s
0 junta 2
junta 1
-4
0 160 200
amostras
A rede RBF para o manipulador com dois graus de liberdade tem 4 entradas (resduos
e velocidades) e duas sadas (2 falhas). Para o treinamento da rede RBF, 9 trajetrias com 40
amostras cada so utilizadas. Estas trajetrias so apresentadas rede RBF trs vezes: uma
em operao normal, uma em que ocorre a falha 1 e uma em que ocorre a falha 2,
perfazendo um total de 1080 padres. A definio dos padres mais significativos de
treinamento e dos parmetros que definem o tamanho do campo receptivo (diagonal da
matriz R) so essenciais para a rede RBF. Os padres de treinamento devem ocupar regies
do espao de entradas significativas para que os novos padres possam ser associados
atravs dos campos receptivos das unidades radiais. As trajetrias utilizadas para o
treinamento da rede RBF podem ser vistas no Apndice A9. Neste trabalho, o tamanho do
campo receptivo, definido pela diagonal de R, dado por [0.05 0.035 0.1 0.1]T, no qual os
dois primeiros valores atuam sobre os resduos e os dois ltimos atuam sobre as velocidades.
Para comparao de resultados, os quatro mtodos descritos na seo 2.2 foram
utilizados. O mtodo FS utilizou o OLS para otimizar o algoritmo e o GCV como critrio de
parada. Durante o treinamento, foram selecionadas 415 unidades radiais. A Figura 25 mostra
o treinamento da rede RBF pelo mtodo FS. Note que o erro GCV diminui conforme
aumenta o nmero de centros escolhidos. O algoritmo termina a seleo quando o erro GCV
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 62
cresce durante duas iteraes seguidas. Nota-se que o algoritmo pra a seleo quando o
primeiro mnimo (local ou global) alcanado.
0.5
0.45
0.4
0.35
e
0.3
r
r 0.25
o
0.2
G
C 0.15
V
0.1
0.05
0
0 100 200 300 400 500
nmero de unidades radiais escolhidas
Para o mtodo GRR, utiliza-se como critrio de convergncia uma mudana relativa
selecionado foi $ = 7,642 x 10-6. A Figura 26 mostra a convergncia para este valor. O
0.031
e
0.0305
r
r
o
G 0.03
C
V
convergncia
0.0295 -4
x 10
0 0.2 0.4 0.6 0.8 1
$
Figura 26. Convergncia do mtodo GRR durante o treinamento da rede RBF.
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 63
podadas 761 unidades radiais da rede (estas unidades tiveram $ j = ). Assim, a rede
utiliza somente 319 unidades radiais. Cada uma destas unidades radiais tem um parmetro
de regularizao individual.
No mtodo MAOK, os parmetros utilizados foram: =t-1, =0,015 t-1 e tmax=1000
(nmero de vezes que cada padro apresentado). Usando tais parmetros, 215 unidades
radiais foram selecionadas. A Tabela 3 mostra o erro mdio quadrtico das duas sadas da
rede RBF (falha 1 e falha 2) para o conjunto de treinamento.
As Figuras 27, 28, 29 e 30 mostram as sadas das rede RBF treinadas pelos quatro
mtodos para uma trajetria no-treinada em que ocorre a falha 1 entre as amostras 10 e
160. A sada 1 responsvel pela deteco da falha 1 e a sada 2 responsvel pela deteco
da falha 2.
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 64
1.5
sada 1
a
t 1
i
v
a 0.5
o
0
sada 2
-0.5
-1
0 20 160 200
amostras
1.5
sada 1
a 1
t
i
v
a 0.5
o
0
sada 2
-0.5
-1
0 amostras
200
Figura 28. Sadas da rede RBF treinada por GRR para a trajetria de =[
/6 /4] at =[2
/3 /3]
T T
1.5
sada 1
a 1
t
i
v
a 0.5
o
0
sada 2
-0.5
-1
0 200
amostras
Figura 29. Sadas da rede RBF treinada por LRR para a trajetria de =[
/6 /4] at =[2
/3 /3]
T T
1.5
sada 1
a 1
t
i
v
a 0.5
o
0
sada 2
-0.5
-1
0 200
amostras
Figura 30. Sadas da rede RBF treinada por MAOK para a trajetria de =[
/6 /4] at =[2
/3
T
O critrio de falhas adotado o seguinte: para ser caracterizada uma falha, a sada da
rede RBF tem que apresentar cinco sinais seguidos maiores que 0,5. Isto no causa uma
perda de sensibilidade significativa na deteco das falhas porque o perodo amostral
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 66
baixo. A Figura 31 mostra a deteco e a isolao da falha 1 para as sadas da rede RBF
vistas na Figura 28.
falha 1
operao
s/ falha 1
Figura 31. Deteco da falha 1 para as sadas da rede RBF treinada por GRR vistas na Figura
0.2
0.15
0.1 junta 2
0.05
0
junta 1
-0.05
-0.1
0 20 40 60 80 100
amo stras
1.2
sada 2
1
0.8
a
t 0.6
i
v
a 0.4
0.2
o
sada 1
0
-0.2
0 20 40 60 80 100
amostras
Figura 33. Sada da rede RBF treinada pelo mtodo FS para a trajetria =[2
/3 /2] at
T
=[5
/12 0] , com a falha 2 ocorrendo entre os amostras 5 e 85.
T
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 68
falha 2
operao
s/ falha 2
0 20 40 60 80 100
amostras
Figura 34. Deteco da falha 2 utilizando a rede RBF treinada pelo mtodo FS (linha contnua)
para a trajetria =[2
/3 /2] at =[5
/12 0] . A falha 2 real est representada pela linha
T T
tracejada.
1.2
1
sada 2
0.8
a
t 0.6
i
v
a 0.4
0.2
o
sada 1
0
-0.2
0 20 40 60 80 100
amostras
Figura 35. Sada da rede RBF treinada pelo mtodo GRR para a trajetria =[2
/3 /2] at
T
=[5
/12 0] , com a falha 2 ocorrendo entre os amostras 5 e 85.
T
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 69
falha 2
operao
s/ falha 2
0 20 40 60 80 100
amostras
Figura 36. Deteco da falha 2 utilizando a rede RBF treinada pelo mtodo GRR (linha contnua)
para a trajetria =[2
/3 /2] at =[5
/12 0] . A Falha 2 real est representada pela linha
T T
tracejada.
1.2
1
sada 2
0.8
a
t 0.6
i
v
a 0.4
0.2
o
sada 1
0
-0.2
0 20 40 60 80 100
amostras
Figura 37. Sada da rede RBF treinada pelo mtodo LRR para a trajetria =[2
/3 /2] at
T
=[5
/12 0] , com a falha 2 ocorrendo entre os amostras 5 e 85.
T
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 70
falha 2
operao
s/ falha 2
0 20 40 60 80 100
amostras
Figura 38. Deteco da falha 2 utilizando a rede RBF treinada pelo mtodo LRR (linha contnua)
/3 /2] at =[5
para a trajetria =[2 /12 0] . A Falha 2 real est representada pela linha
T T
tracejada.
sada 2
1
0.8
a
t 0.6
i
v
a 0.4
0.2
o
0
sada 1
-0.2
0 20 40 60 80 100
amostras
Figura 39. Sada da rede RBF treinada pelo mtodo MAOK para a trajetria =[2
/3 /2] at
T
=[5
/12 0] , com a falha 2 ocorrendo entre os amostras 5 e 85.
T
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 71
falha 2
operao
s/ falha 2
0 20 40 60 80 100
amostras
Figura 40. Deteco da falha 2 utilizando a rede RBF treinada pelo mtodo MAOK (linha
contnua) para a trajetria =[2
/3 /2] at =[5
/12 0] . A Falha 2 real est representada pela
T T
linha tracejada.
0.02
junta 1
0.01
-0.01
-0.02
-0.03
junta 2
-0.04
-0.05
0 20 40 60 80 100
amostras
2.5
1.5
a
t 1
i sada 2
v
a 0.5
0
o
-0.5 sada 1
-1
0 20 40 60 80 100
amostras
Figura 42. Sada da rede RBF treinada pelo mtodo FS para a trajetria livre de falhas de
=[5
/12 /2] at =[
/6 /8] .
T T
falha 2
operao
s/ falha 2
0 20 40 60 80 100
amostras
Figura 43. Deteco da falha 2 utilizando a rede RBF treinada pelo mtodo FS (linha contnua)
/12 /2] at =[
para a trajetria livre de falhas de =[5 /6 /8] . A Falha 2 real est
T T
0.8
0.6
0.4
a sada 2
t 0.2
i
v 0
a
-0.2
o -0.4
sada 1
-0.6
-0.8
0 20 40 60 80 100
amostras
Figura 44. Sada da rede RBF treinada pelo mtodo GRR para a trajetria =[5
/12 /2] at
T
=[
/6 /8] .
T
0.8
sada 2
0.6
0.4
a
t 0.2
i
v 0
a
-0.2
o -0.4
-0.6 sada 1
-0.8
0 20 40 60 80 100
amostras
Figura 45. Sada da rede RBF treinada pelo mtodo LRR para a trajetria =[5
/12 /2] at
T
=[
/6 /8] .
T
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 74
0.8
sada 1
0.6
0.4
a
t 0.2
i
v 0
a
-0.2
o -0.4 sada 2
-0.6
-0.8
0 20 40 60 80 100
amost ras
Figura 46. Sada da rede RBF treinada pelo mtodo MAOK para a trajetria =[5
/12 /2] at
T
=[
/6 /8] .
T
O segundo manipulador a ser estudado neste trabalho o Puma 560, um rob comum
tanto em ambientes industriais, como em ambientes acadmicos [CORKE, 1994]. Este
manipulador foi implementado em MATLAB atravs do toolbox Robotics, desenvolvido por
CORKE (1996). Informaes sobre os parmetros de tal sistema podem ser encontrados em
[CORKE & ARMSTRONG-HLOUVRY, 1994]. O perodo amostral utilizado de 0,056 s.
O rob, neste trabalho, utiliza o mtodo do torque calculado para o controle de
posicionamento das juntas e tem seis graus de liberdade: trs para posicionamento e trs
para orientao.
Para o treinamento do MLP, utiliza-se 150 trajetrias com 54 amostras cada, em que
se considera o rob livre de falhas. Portanto, um total de 8100 padres so usados no
treinamento do MLP. As 20 primeiras trajetrias utilizadas no treinamento so escolhidas
para que grande parte do espao de posies das juntas seja coberto, e as trajetrias restantes
so escolhidas aleatoriamente. A normalizao feita do mesmo modo que para o
manipulador com 2 graus de liberdade. Aqui, os efeitos dos termos de frico no foram
considerados. Os parmetros do treinamento por retropropagao do erro para o MLP
podem ser vistos na Tabela 5. O vetor de entradas formado pelas posies, velocidades
angulares e torques das 3 primeiras juntas (posicionamento) em cada instante amostral t e o
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 75
vetor de sadas formado pelas velocidades angulares das 3 primeiras juntas no instante
amostral t+t.
Para o treinamento do MLP, um total de 8.000 pocas foram utilizadas. O erro mdio
quadrtico do MLP depois deste perodo foi de 1,5795 x 10-5 (para o conjunto de
treinamento). Neste trabalho, o MLP reproduz a dinmica do sistema em operao normal
com um resduo baixo mesmo para trajetrias no-treinadas, comprovando a generalizao
do procedimento. A Figura 47 mostra os sinais resduos (das velocidades das juntas) para
uma trajetria no-treinada livre de falhas.
0.8
0.7
junta 1
0.6
0.5 junta 2
0.4
0.3
junta 3
0.2
0.1
0
0 10 20 30 40 50 60
amostras
Figura 47. Velocidades reais normalizadas (linha tracejada) e sadas do MLP (linha contnua)
0.2
0.1
-0.1
-0.2
-0.3
-0.4 junta 1
junta 2
-0.5 junta 3
0 10 20 30 40
amo st ras
Figura 48. Sinais de resduo para quatro simulaes de uma mesma trajetria com 12 amostras
de =[0 0 0 0 0 0] at =[
/3 -5
/6 /6 /2 5
/12] . Em cada uma das 3 primeiras simulaes,
T T
A rede RBF para o manipulador Puma 560 tem 6 entradas (resduos e velocidades) e
duas sadas (3 falhas). Para o treinamento da rede RBF, 15 trajetrias com 12 amostras cada
so utilizadas. Estas trajetrias so apresentadas rede RBF quatro vezes: uma em operao
normal, uma em que ocorre a falha 1, uma em que ocorre a falha 2 e uma em que ocorre a
falha 3, perfazendo um total de 720 padres. Neste trabalho, o tamanho do campo receptivo,
definido pela diagonal de R, dado por [0,022 0,027 0,027 0,8 0,8 0,8]T, no qual os trs
primeiros valores atuam sobre os resduos e os trs ltimos atuam sobre as velocidades.
Para comparao de resultados, os quatro mtodos descritos na seo 2.2 foram
utilizados. O mtodo FS utilizou o OLS para otimizar o algoritmo e o GCV como critrio de
parada. Durante o treinamento, foram selecionadas 251 unidades radiais.
Para o mtodo GRR, utiliza-se como critrio de convergncia uma mudana relativa
Foram podadas 425 unidades radiais da rede (estas unidades tiveram $ j = ). Assim, a
rede utiliza somente 295 unidades radiais. Notou-se que para este treinamento, o LRR
apresentou problemas de mau condicionamento.
No mtodo MAOK, os parmetros utilizados foram: =t-1, =0,020 t-1 e tmax=1000
(nmero de vezes que cada padro apresentado). Usando tais parmetros, 255 unidades
radiais foram selecionadas. A Tabela 6 mostra o erro mdio quadrtico das trs sadas da
rede RBF (falha 1, falha 2 e falha 3) para o conjunto de treinamento.
e uma para cada uma das trs falhas), perfazendo um total de 120 trajetrias. A Tabela 7
mostra o erro mdio quadrtico das trs sadas da rede RBF para o conjunto de teste. Os
valores altos do erro para o LRR so devidos a problemas de mau condicionamento.
As Figuras 49, 50, 51 e 52 mostram as sadas das rede RBF treinadas pelos quatro
mtodos para as quatro simulaes da trajetria no-treinada cujos sinais de resduos so
mostradas na Figura 48. A sada 1 da rede RBF responsvel pela deteco da falha 1, a
sada 2 responsvel pela deteco da falha 2 e a sada 3 responsvel pela deteco da
falha 3.
1.2
1
sada 1 sada 2 sada 3
0.8
a
0.6
t
i 0.4
v
0.2
a
0
-0.2
o
-0.4
-0.6
-0.8
0 5 10 15 20 25 30 35 40 45 50
am ostras
Figura 49. Sadas da rede RBF treinada por FS para os sinais de resduo mostrados na Figura
48.
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 79
1.2
a 0.8
t
i
0.6
v
a
0.4
o 0.2
-0.2
0 5 10 15 20 25 30 35 40 45 50
amostras
Figura 50. Sadas da rede RBF treinada por GRR para os sinais de resduo mostrados na Figura
48.
15
sada 3
10
a
t
i 5
v sada 1 sada 2
a
0
o
-5
-10
0 5 10 15 20 25 30 35 40 45 50
amostras
Figura 51. Sadas da rede RBF treinada por LRR para os sinais de resduo mostrados na Figura
48.
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 80
1.2
a 0.8
t
i
0.6
v
a
0.4
o 0.2
-0.2
0 5 10 15 20 25 30 35 40 45 50
amostras
Figura 52. Sadas da rede RBF treinada por MAOK para os sinais de resduo mostrados na
Figura 48.
O critrio de falhas adotado o seguinte: para ser caracterizada uma falha, a sada da
rede RBF tem que apresentar trs sinais seguidos maiores que 0,5. Isto no causa uma perda
de sensibilidade significativa na deteco das falhas porque o perodo amostral baixo. A
Tabela 8 mostra os resultados da DDF aps a aplicao do critrio de deteco de falhas nos
padres do conjunto de teste. Salienta-se que estes resultados poderiam ser melhores se o
nmero de padres utilizados no conjunto de treinamento fosse maior.
Tabela 8. Resultados dos testes para o sistema de DDF aplicado ao Puma 560.
Captulo 6
Concluses
O sistema de DDF via RNA apresenta bons resultados quando aplicado a um rob
manipulador planar com dois elos rgidos e a um manipulador Puma560. Salienta-se que o
grande atrativo que, de acordo com os testes, o sistema de DDF consegue detectar e isolar
as falhas que ocorrem em trajetrias no-vistas e em instantes diferentes daqueles dos
padres treinados. Deve-se observar tambm que os resultados apresentados para ambos os
casos (principalmente para o Puma 560) podiam ser melhores se o nmero de padres
utilizados nos treinamentos das redes RBF fosse maior.
O MLP reproduz o comportamento dinmico do sistema sem falhas produzindo
geralmente um resduo baixo. A qualidade do treinamento do MLP muito importante para
os futuros resultados do sistema de DDF, quando padres no-treinados devero ser
generalizados. Um erro do mapeamento grande resulta em resduos altos e,
consequentemente, alarmes falsos e erros de classificao das falhas.
As redes RBF treinadas pelos quatro mtodos apresentaram comportamentos
diferentes quando aplicadas ao problema de DDF. Neste trabalho, as redes RBF treinadas
pelo mtodo FS apresentaram os menores erros mdios quadrticos para os conjuntos de
treinamento. Isso ocorre porque as redes RBF treinadas por FS apresentam os menores bias
nos erros quadrticos mdios. Contudo, as redes RBF treinadas pelos outros mtodos
apresentaram erros menores nos conjuntos de testes, indicando que as varincias dos erros
foram menores. Tal fato indica que as redes RBF treinadas por FS foram mais sensveis s
peculiaridades (tal qual rudos e escolha dos padres) dos conjuntos de treinamento. Isso
ocorre porque os centros das unidades radiais das redes treinadas via FS so escolhidas a
partir das posies dos padres de treinamento.
Para as redes treinadas por GRR e LRR, apesar de os centros das unidades radiais
serem escolhidos a partir dos padres de treinamento, os pesos grandes foram penalizados,
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 82
produzindo um efeito de suavidade na funo de sada das redes (pesos grandes geralmente
so requeridos para produzir funes de sada que variam bruscamente). Isto ocorre porque
o bias introduzido nos mtodos GRR e LRR favorece a soluo envolvendo pesos pequenos.
O LRR deveria adaptar a suavidade s condies locais (atravs de parmetros de
regularizao individuais) do espao de entradas da rede RBF. O mtodo poda algumas
conexes da rede atravs de um grande aumento nos valores dos parmetros de
regularizao das unidades radiais associadas a estas conexes, o que explica os melhores
resultados de generalizao do GRR. Isto deixa o mtodo de certa forma parecido com o FS.
Todavia, o uso de parmetros de regularizao suaviza a funo de sada da rede. Note que o
mtodo FS selecionou mais unidades radiais que o mtodo LRR, o que deveria tornar a
funo de sada da rede mais suave. Isto no acontece, no entanto, porque o mtodo GRR
faz uso dos parmetros de regularizao, fazendo com que os pesos utilizados sejam
menores.
Apesar de a rede RBF treinada pelo mtodo GRR apresentar melhores resultados para
o Puma 560, as redes RBF treinadas por MAOK apresentaram os melhores resultados para
os conjuntos de teste, indicando uma melhor generalizao. Isto ocorre porque,
diferentemente dos outros mtodos, MAOK fixa os centros em posies diferentes daquelas
dos padres de treinamento. Tais posies, prximas dos centros dos aglomerados de
padres (clusters), so mais interessantes pois indicam um comportamento coletivo (dos
padres do aglomerado) ao invs de comportamentos individuais (dos padres de
treinamento isolados). No caso do Puma 560, a rede treinada por GRR apresentou os
melhores resultados de generalizao porque houve uma grande penalizao nos pesos
grandes, gerando um efeito de suavidade na funo de sada da rede RBF. No entanto, o
resultado da rede RBF treinada por MAOK foi bastante prxima, apesar desta utilizar um
nmero menor de unidades radiais (255 do MAOK contra 720 do GRR). O nmero de
unidades radiais selecionadas indica a complexidade da operao da rede RBF, sendo um
nmero menor de unidades radiais mais interessante (se o nmero de unidades radiais
grande, o esforo computacional para os diversos clculos envolvendo a rede RBF e a
memria requerida so maiores). Assim, o nmero de unidades radiais um bom indicador
da velocidade de operao da rede RBF. Um aspecto negativo do mtodo MAOK a
escolha dos parmetros de treinamento, que influenciam drasticamente o desempenho da
rede RBF resultante.
Salienta-se, tambm, que durante o treinamento, o esforo computacional do MAOK
baixo pois este mtodo no emprega clculos complexos envolvendo matrizes grandes. O
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 83
algoritmo que apresenta o esforo computacional maior o LRR (porque precisa calcular
todos os parmetros de regularizao individuais), seguido do GRR. O algoritmo FS
apresenta um esforo computacional relativamente baixo porque faz uso de modelos
reduzidos (com um nmero menor de unidades radiais).
A definio do tamanho do campo receptivo das redes RBF tem um papel importante
na generalizao dos resultados. Como exemplo, na rede RBF treinada pelo mtodo FS, se
um campo receptivo muito grande definido, o mtodo escolhe poucas unidades radiais
conseguindo classificar apenas os padres nos grandes aglomerados e, portanto,
identificando erroneamente os padres isolados. Se o campo receptivo muito pequeno, um
grande nmero de unidades radiais escolhido, resultando em uma sobre-sensibilidade aos
detalhes do conjunto particular de treinamento e, portanto, em uma baixa generalizao.
Neste trabalho, a escolha dos parmetros que definem o tamanho do campo receptivo foram
feitos heuristicamente.
Os resultados podem ser generalizados para um maior nmero de falhas. Entretanto,
falhas cujo sistema apresenta comportamentos semelhantes, independentemente dos graus
de liberdade do rob, so difceis de serem isoladas (apesar de serem detectadas) porque os
padres de resduo devem ocupar as mesmas regies do espao de entradas.
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 84
Referncias bibliogrficas
Allen, D. M. (1974). The relationship between variable selection and data augmentation
and a method for prediction , Technometrics, vol. 16, 1, p.125-127.
Bishop, C. M. (1995). Neural networks for pattern recognition, Oxford University Press.
Brown, M. and Harris, C. (1994). Neurofuzzy adaptive modelling and control , Prentice
Hall International.
Calado, J. M. F. and Roberts, P. D. (1997). Fault detection and diagnosis based on fuzzy
qualitative, Proceedings of the IFAC Symposium on Fault Detection, Supervision
and Safety for Technical Processes, Kingston Upon Hull, U. K., vol.1, p.534-539.
Chen, S., Cowan, C. F. N. and Grant, P. M. (1991). Orthogonal least squares learning
algorithm for radial basis function networks, IEEE Transactions on Neural
Networks, vol. 2, 2, p.302-309.
Chow, E. Y. and Willsky, A. S. (1984). Analytical redundancy and design of robust failure
detection systems, IEEE Transactions on Automatic Control, 29, p.603-614.
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 85
Corke, P. I. (1994). The Unimation Puma servo system, Technical Report MTN-226,
CSIRO Division of Manufacturing Technology, Australia.
Corke, P. I. (1996). A robotics toolbox for MATLAB, IEEE Transactions on Robotics &
Automation Magazine, vol. 3, n. 1, p.24-32.
Corke, P. I., and Armstrong-Hlouvry, B. S. (1994). A search for consensus among model
parameters reported for Puma 560 robot, In the Proceedings of the IEEE Conference
on Robotics and Automation, San Diego, USA.
Evsukoff, A., Montmain, J. and Gentil, S. (1997). Dynamic model and causal knowledge-
based fault detection and isolation, Proceedings of the IFAC Symposium on Fault
Detection, Supervision and Safety for Technical Processes, Kingston Upon Hull, U.
K., vol. 2, p.699-704.
Frank, P. M. (1987). Fault diagnosis in dynamic systems via state estimation - A survey,
In Tsafestas, S. M. Singh and G. Schmidt (Eds.), System Fault Diagnostics,
Reliability and Related Knowledge-Based Approaches, vol. 1, p.35-98.
Fssel, D., Ball, P. and Isermann, R. (1997). Closed-loop fault diagnosis based on a
nolinear process model and automatic fuzzy rule generation, Proceedings of the
IFAC Symposium on Fault Detection, Supervision and Safety for Technical
Processes, Kingston Upon Hull, U. K., vol.1, p.359-364.
Geman, S., Bienenstock, E. and Doursat, R. (1992). Neural networks and the bias/variance
dilemma, Neural Computation, vol. 4, 1, p.1-58.
Gertler, J. (1991). Analytical redundancy methods in fault detection and isolation - Survey
and synthesis, Proceedings of the IFAC Symposium on Fault Detection, Supervision
and Safety for Technical Processes, Baden Baden, Germany, vol. 1, p.9-23.
Hertz, J., Krogh, A. and Palmer, R. G. (1991). Introduction to the theory of neural
computation, Addison-Wesley Publishing Company.
Horak, D. T. (1988). Failure detection in dynamic systems with modeling errors, AIAA
Journal of Guidance, Control and Dynamics, vo. 11, 6, p.508-516.
Isermann, R. (1984). Process fault detection based on modeling and estimation methods - A
survey, Automatica, vol. 20, 4, p.387-404.
Korbicz, J. (1997). Neural networks and their application in fault detection and diagnosis,
Proceedings of the IFAC Symposium on Fault Detection, Supervision and Safety for
Technical Processes, Kingston Upon Hull, U. K., vol.1, p.377-382.
Leonard , J. A. and Kramer, M. A. (1991). Radial basis function networks for classifying
process faults, IEEE Control Systems, vol. 11, 3, p.31-38.
Mangoubi, R., Appleby, B. D. and Farrell, J. (1992). Robust estimation in fault detection,
Proceedings of the 31st IEEE Conference on Decision and Control, p.3943-3948.
Naughton, J. M., Chen, Y. C. and Jiang, J. (1996). A neural network aplication to fault
diagnosis for robotic manipulator, Proceedings of IEEE International Conference on
Control Applications, vol.1, p.988-1003.
Nelles, O. and Isermann, R. (1995). A comparison between RBF networks and classical
methods for identification of nonlinear dynamic systems, Proceedings of the IFAC
Congress on Adaptive System in Control and Sygnal Processing, Budapest, Hungary,
p.233-238.
Ojala, T. and Vuorimaa, P. (1995). Modified Kohonens learning laws for RBF networks,
Proceedings of the International Conference on Artificial Neural Nets and Genetic
Algorithms, Ales, France, p.356-359.
Orr, M. J. L. (1995 a). Regularization in the selection of radial basis function centers,
Neural Computation, 7, p.606-623.
Orr, M. J. L. (1995 b). Local smoothing of radial basis function networks, Proceedings of
the 1995 International Symposium on Neural Networks, Hsinchu, Taiwan.
Orr, M. J. L. (1996 a). Introduction to radial basis function networks, Technical Report,
Center for Cognitive Science, Edinburgh University, Scotland, U. K.
Orr, M. J. L. (1996 b). MATLAB routines for subset selection and ridge regression in
linear neural networks, Technical Report, Center for Cognitive Science, Edinburgh
University, Scotland, U. K.
Patton, R. J. (1994). Robust model-based fault diagnosis: the state of the art, Proceedings
of the IFAC Symposium on Fault Detection, Supervision and Safety for Technical
Processes, Helsinki, Finland, vol. 1, p.1-24.
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 88
Patton, R. J.(1997). Fault-tolerant control: The 1997 situation, Proceedings of the IFAC
Symposium on Fault Detection, Supervision and Safety for Technical Processes,
Kingston Upon Hull, U. K., vol.2, p.1033-1055.
Sadrnia, M.A, Chen, J. and Patton, R. J. (1997 a). Robust fault detection observer design
using H/ techniques for uncertain flight control systems, Proceedings of the 2nd
IFAC Symposium on Robust Control Design, Budapest, Hungary, p.531-536.
Sadrnia, M.A, Chen, J. and Patton, R. J. (1997 b). Robust H/ observer-based residual
generation for fault diagnosis, Proceedings of the IFAC Symposium on Fault
Detection, Supervision and Safety for Technical Processes, Kingston Upon Hull, U.
K., vol.1, p.147-153.
Visinsky, M. L., Cavallaro, J. R. and Walker, I. D. (1994). Robotic fault detection and fault
tolerance: A survey, Reliability Engineering and System Safety, 46, p.139-158.
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 89
Warwick, K. and Craddock, R. (1996). An introduction to radial basis function for system
identification: A comparison with other neural networks, Conference on Decision
and Control, Kobe, Japan, p.464-469.
Apndice A1
Dados utilizados no exemplo 1
Apndice A2
A matriz de pesos tima para a rede RBF
Para o clculo da matriz de pesos tima, a funo de custo ser minimizada. Como as
anlises para os diferentes mtodos so similares, ser considerada a funo de custo mais
complexa: a do mtodo LRR. No entanto, o resultado pode ser generalizado para o GRR
fazendo j = para j = 1,...,m. Para o FS e o MAOK basta fazer j = 0 para j = 1,...,m. Sabe-
se que a funo de custo para o mtodo LRR dada por (equao 37)
np
( ) +
m
Ck = (n) $ (n)
2
j kj2
n =1 j =1
na qual k = 1,...,q. O que se deseja achar o extremo da funo. Assim, primeiro a funo de
custo ser diferenciada e em seguida ser igualada a zero. Por simplicidade, ser
considerada uma nica sada para a rede RBF (q=1). Diferenciando a funo de custo, tem-
se para a unidade radial j
C p n
$ (n)
= 2 ($ (n) (n)) + 2 j j .
j n =1 j
$ (n)
= h j (n) .
j
n
C p
= 2 ($ (n) (n)) h j (n) + 2 j $ j = 0
j n =1
np np
2 $ (n) h j (n) 2 (n) h j (n) + 2 j $ j = 0
n =1 n =1
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 92
np np
Existem m destas equaes (j = 1,...,m), tal que cada uma representa uma limitao na
soluo. Como existem o nmero exato de restries e de equaes desconhecidas, deve
existir uma nica soluo. A soluo nica pode ser encontrada atravs de lgebra linear.
Usando a notao vetorial na equao anterior, tem-se para a unidade radial j
h Tj $ + j $ j = h Tj
[ ( )] [ ( )]
T
h j = h j (1) h j (2) K h j n p
T
na qual , $ = $ (1) $ (2) K $ n p e,
[ ( )]
T
= (1) ( 2) K n p . Considerando a equao acima para todas as unidades
h 1T $ 1$ 1 h 1T
T T
h 2 $ + 2$ 2 = h 2 .
M M M (A2.1)
T T
h m $ m$ m h m
Fazendo
H = h1 [ h2 K hm , ]
[
$ = $ 1 $ 2 K $ m ]T e,
1 0 K 0
0 2 K 0
=
M M O M
0 0 K m
H T $ + = H T . (A2.2)
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 93
m
$ (n) = j h j (n) .
j =1
$ (n) = h nT $
[ ] [ ]
T
H = h1 h 2 K h m = h1 h2 K hnp .
$ (1) h1T $
$
(2) h 2T $
$ = = = H $ .
M M
T
( )
$ n p h n p $
H T H $ + $ = H T
(H T
)
H + $ = H T
( )
1
$ = H T H + HT
que o vetor de pesos timo para o mtodo LRR. Considerando-se agora q>1 (vrias
neurnios de sada na rede RBF) tem-se a matriz de pesos tima
( )
1
$ = HT H +
HT
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 94
na qual: [
$ = $
1 $ 2 K $ q , ]
$ k = $ [ k1 $ k2 K $ km ]T ,
= 1[ 2 K q e, ]
[ (n )]
T
k= k (1) k (2) K k p .
( )
1
$ = HT H +
HT .
m
( )
1
$ = HT H
HT .
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 95
Apndice A3
A matriz de projeo
b1
(I np )
P
b2
Figura A3.1. O modelo gera um plano (com as bases b1 e b2) em um espao tridimensional
(que utiliza a base b3) e no pode igualar . O modelo dos mnimos quadrticos a projeo
de no plano gerado e o vetor de erro dado pelo vetor P .
$ (n) = h nT $
[ ] [ ]
T
H = h1 h 2 K h m = h1 h2 K hnp .
$ (1) h1T $
$
(2) h 2T $
$ = = = H $ .
M M
T
( )
$ n p h n p $
( )
1
$ = H T H + HT .
Portanto
(
$ = H H T H + ) 1
HT .
( )
1
A 1 = H T H + .
Assim:
$ = HA 1H T .
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 97
O erro entre a predio realizada pela rede RBF a partir do conjunto de treinamento e
a sada observada dado por
$ = HA 1H T
(
$ = I n p HA 1H T )
$ = P (A3.1)
(
P = I n p HA 1H T . )
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 98
Apndice A4
O critrio generalized cross-validation (GCV)
np
( (n) $ (n))
1
$ LOO
2
=
2
. (A4.1)
np n =1
(
$ n = H nT H n + )1 H nT n = A 1H nT n
n
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 99
[ ]
T
H = h1 h2 K hnp .
H Tn n = H T (n) h n (A4.3)
A seguir, a matriz A -1
n ser deduzida. Como no importa a ordem em que os padres
esto na matriz de projeto H, a linha removida ser representada como estando na posio
np. Assim
H n
H = T.
hn
A = HTH
H n
[
A = H Tn ]
hn T
hn
A = A n + h n h nT
A n = A h n h nT (A4.4)
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 100
B = A + XRY
B 1 = A 1 A 1 X (R 1 + YA 1 X) YA 1 .
1
Se r muito menor que n, ento a matriz R e o termo entre parntesis podem ser
muito mais fceis de se inverter do que a matriz B.
1 1 A 1 h n h nT A 1
An =A + . (A4.5)
1 h nT A 1 h n
1 A 1 h n
A n hn = .
1 h nT A 1 h n
(n) T HA 1h n
(n) $ (n) = .
1 h nT A 1 h n
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 101
(1) $ (1)
(2) (2)
$
= diag (P ) 1 P .
M ( )
( ) ( )
n p $ n p
A matriz diag (P) tem o mesmo tamanho e a mesma diagonal principal de P, mas os
componentes fora da diagonal principal so iguais a zero. Finalmente, da equao acima e
da Eq. (A4.1), tem-se a predio da varincia do erro (ou erro LOO)
P (diag (P )) P .
1 T 2
$ LOO
2
=
np
( )
se a matriz diag (P) por tr ( P ) / n p I n p , na qual tr (P) denota o trao da matriz de projeo
(o trao de uma matriz quadrada a soma dos elementos da diagonal principal) e a matriz de
identidade tem posto np. Assim, a predio da varincia do erro GCV(ou erro GCV) fica:
n p TP2
$ GCV
2
= .
(tr (P))2
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 102
Apndice A5
O valor timo para o parmetro de regularizao global
n p TP2
$ GCV
2
= .
(tr (P))2
Para se achar o mnimo deste erro como uma funo do parmetro de regularizao
ser preciso diferenciar a equao em relao a e, ento, igualar o resultado a zero. Para
isto, a matriz de projeo (Apndice A3) precisa ser diferenciada. Para tal, a matriz de
varincia (Eq. 34) ser diferenciada. Assim, assuma que a matriz H tenha a seguinte
decomposio singular [HORN & JONHSON, 1985]
H = U V T
na qual U e V so ortogonais e
1 0 L 0
0 2 L 0
M M O M
= 0 0 L m
0 0 L 0
M M O M
L 0
0 0
{ } { }
m m
na qual j so os valores singulares de H e j so os autovalores de HT H.
j =1 j =1
Assumindo que H tenha mais linhas do que colunas (np > m), apesar que o mesmo resultado
pode ser obtido para o caso oposto, segue que
H TH = V T V T .
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 103
(
A 1 = H T H + ) 1
(
A -1 = V T V T + I m)1
A -1 = (V T V T + VV T )
1
A -1 = (V ( T + I m )V T ) .
1
(
A -1 = V T + I m )1 V T . (A5.1)
1
+ 0 L 0
1
0 1
0
( T
+ Im ) 1
= + 2
L
.
M M O M
1
0 0 L
+ m
Esta inversa a nica parte da equao (A5.1) que depende de . Derivando a inversa
acima, tem-se
1
0 L 0
( + 1 )
2
1
(
T + Im ) 1
=
0
( + 2 ) 2
L 0
M M O M
1
0 0 L
( + m )2
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 104
( )1 = ( T + Im )1
2
T + Im
(
T + Im )1 = ( T + Im )2 .
A 1
(
= V T + Im )2 V T
A 1
(
= V T + Im )1 ( T + I m )1 V T
A 1
(
= V T + Im )1 V T V ( T + Im )1 V T
A 1
= A 1A 1
A 1
= A 2 .
P
= (
I HA 1H T
n p )
P A 1 T
= H H
P
= HA 2 H T .
A 1 T
tr( P) = tr H H
(
tr (P ) = tr HA 2 H T )
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 105
tr( P) = tr A 2 H T H ( )
(
tr(P) = tr A 2 (A I m ) )
(
tr (P ) = tr A 1 A 2 )
e,
P
(
T P 2 = 2 TP
)
( )
T P 2 = 2 T P HA 2 H T
( ) (
T P 2 = 2 T I n p HA 1H T HA 2 H T )
( ) (
T P 2 = 2 T HA 2 H T HA 1H T HA 2 H T )
( ) (
T P 2 = 2 T HA 2 H T HA 1 (A I m )A 2 H T )
( ) (
T P 2 = 2 T HA 2 H T HA 1 AA 2 H T + HA 1 A 2 H T )
( )
T P 2 = 2 T HA 3 H T .
$ = A 1H T
ento
( )
T P 2 = 2 $ T A 1 $ .
$ GCV
2
2 n p TP2
( )
np
= P
T 2
tr (P )
(tr (P))2 (tr (P))3
$ GCV
2
{ $ ( )} .
2n p
= T
A 1$ tr (P) T P 2 tr A 1 A 2
(tr (P)) 3
(
$ $ T A 1$ tr ( P) = T P 2 tr A 1 $ A 2 . )
Isolando o parmetro de regularizao timo, obtm-se a frmula de reestimao para
o erro GCV
$ =
(
T P 2 tr A -1 $ A -2 ).
$ A tr (P )
T -1 $
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 107
Apndice A6
Os valores timos para os parmetros de regularizao
locais
[
H = H m1 hj ]
na qual
h j (1)
h j (2)
hj = .
M
( )
h j n p
A = H TH +
H Tm1
[ m1
]
0
A = T H m1 h j + T
h j 0 j
A m1 Hm T
1h j
A = T . (A6.1)
h j H m1 j + h Tj h j
A seguir ser utilizado o seguinte lema para inverso de matrizes [HORN &
JONHSON, 1985]:
A inversa de uma matriz particionada
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 108
A1 A2
A=
A 3 A 4
pode ser expressa por
A 1
=
A (
1 A 2 A 1
3 A 4
1
) (
A 11 A 2 A 3 A 11 A 2 A 4 )1
(
A A 1A A 1 A A 1
3 1 2 4 )
3 1 (A 4 A 3 A11A 2 )1
A 1 + A 11A 2 1 A 3 A 11 A 11 A 2 1
A 1 = 1 .
1A 3 A 11 1
T
1 A m1 0 1 A m1H m
T
1h j
A m1H m
T
1h j
A = T + . (A6.2)
0 0 + h T P h
j j m1 j
1
1
P = I n p H A 1H T .
Pode se ver que na equao acima existe uma relao entre a matriz de projeo e os
n p TP2
$ GCV
2
= .
(tr (P)) 2
(
n p a 2j 2b j + c )
$ 2
( ) = (A6.5)
( )
GCV j 2
j
na qual
a = y T Pm2 1 ,
b = T Pm2 1h j T Pm1h j ,
( )
2
c = h Tj Pm2 1h j T Pm1h j ,
= tr (Pm1 ) e,
= h Tj Pm2 1h j .
Esta equao mostra como o erro GCV depende de j quando todos os outros
parmetros de regularizao so mantidos constantes. Esta dependncia aparece atravs de
um polinmio racional em j (ou j). Como pode se ver, o polinmio tem um plo em j =
/ , o qual nunca ocorre para valores positivos de j visto que sempre verdade que
h Tj Pm2 1h j
h Tj Pm1h j
( )
.
tr Pm1
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 110
O valor mnimo do erro GCV pode ser alcanado diferenciando a Eq. (A6.5) com
respeito a j e igualando a zero a equao diferenciada. Fazendo a diferenciao, tem-se
$ GCV
2
$ GCV
2
j $ GCV
2
= =
j j j j
$ GCV
2
=
( ) 2n (a 2b + c)
2 n p a j b p
2
j j
j
( ) j ( )
2
j
3
$ GCV
2
2n ((b a ) (c b ))
p j
= .
j
( ) j
3
c b
$ j =
b a
ou, ainda
c b
$ j = h Tj Pm1h j .
b a
Este valor timo deve ser sempre maior que zero. Se o valor calculado for negativo,
existem duas alternativas. Primeiro, se
b
>
a
ento o plo (em j = / ) ocorre direita do mnimo global. Quando j vai de - at , a
derivada do erro GCV primeiro decresce at que seja alcanado o mnimo global (em j<0).
Da a derivada cresce at que j atinja o plo e a partir deste ponto decresce at que j
Entretanto, se
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 111
b
<
a
ento o plo (em j = / ) ocorre esquerda do mnimo. Quando j vai de - at , a
derivada do erro GCV primeiro cresce at que seja alcanado o plo. Da a derivada
decresce at que j atinja o mnimo global (em j<0) e a partir deste ponto cresce at que j
se a = b
c b
se h Tj Pm1h j > e a > b
b a
$ j = c b
0 se h Tj Pm1h j > e a < b
b a
c b c b
h Tj Pm1h j se h Tj Pm1h j
b a b a
Apndice A7
O mtodo forward selection
Sabe-se que a soma dos erros quadrticos para o neurnio de sada k dada por
np
( k (n) $ k (n)) .
2
Ck =
n =1
C = ( $ ) ( $ ) .
T
C$ = (P ) P
T
C$ = T P T P
C$ = T P 2 .
radial ser acrescentada e C$ M +1 a soma dos erros quadrticos depois de a n-sima unidade
radial ser acrescentada, tem-se
C$ M = T P M
2
C$ M +1 = T P M
2
+1 .
C$ M = T P M
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 113
C$ M +1 = T P M +1 .
(
C$ M C$ M +1 = T P M P M +1 . ) (A7.1)
A Eq. (A6.3) relaciona as matrizes de projeo antes e depois de uma unidade radial
ser retirada. Pode-se utilizar a mesma equao para relacionar as matrizes de projeo antes
e depois que a n-sima unidade radial acrescentada. Assim (lembre-se que para FS j = 0)
P M h n h Tn P M
P M +1 = P M .
h Tn P M h n
P M h n h Tn P M
C$ M C$ M +1 = T
h Tn P M h n
C$ M C$ M +1 =
( TPM h n )
2
.
h Tn P M h n
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 114
Apndice A8
Programas Utilizados
Programa em C:
rbf_koho: determina os centros da rede RBF para cada classe utilizando os dados gerados
pelo programa aux_koho.m.
Programa em C:
r_falb: treinamento do MLP utilizando os dados gerados no programa r6g_falb.m.
rbf_koho: determina os centros da rede RBF para cada classe utilizando os dados gerados
pelo programa aux_koho.m.
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 116
Apndice A9
Trajetrias utilizadas na simulao do manipulador com 2
graus de liberdade
Tabela A9.2. Trajetrias utilizadas no treinamento da rede RBF ( manipulador com 2 elos).