TDE

DETECO E DIAGNSTICO DE FALHAS
EM ROBS MANIPULADORES VIA REDES

NEURAIS ARTIFICIAIS
Renato Tins
Dissertao apresentada Escola de

Engenharia de So Carlos da
Universidade de So Paulo, como parte
dos requisitos para obteno do ttulo de
Mestre em Engenharia Eltrica
Orientador:
Prof. Dr. Marco Henrique Terra
So Carlos
1999
Dedico este trabalho aos meus pais, Denir e
Elisabet, por terem me permitido chegar at aqui e
pelos exemplos de perseverana e simplicidade.
Agradecimentos
Ao Prof. Dr. Marco Henrique Terra pela orientao, amizade e pela confiana
depositada para a realizao deste trabalho.
Lcia Maria Santos pela dedicao, pacincia e, sobretudo, companheirismo

durante a realizao deste trabalho. O caminho seria muito mais tortuoso sem voc.
A todos os amigos que me acompanharam nesta jornada e ainda esto presentes.

Alm disto, agradeo em especial aos colegas Ricardo Sovat, Maria Cristina,
Guilherme Barreto, Arthur Plnio, Marcelo Rosa e Hlio Darbo pelas valiosas
discusses e sugestes.
Aos Professores Aluzio F. R. Arajo da EESC - USP, Marcel Bergerman do CTI -

Campinas, Oswaldo L. V. Costa da Escola Politcnica - USP e Walmir M. Caminhas
da UFMG pelas crticas e sugestes.
minha famlia, em especial, ao Fbio, Adriana, ao Lus Filipe e Marisa.
Aos professores e funcionrios do Depto. de Engenharia Eltrica que sempre

estiveram dispostos a colaborar.
Ao CNPq pelo suporte financeiro fornecido durante a realizao deste trabalho, sem
o qual o mesmo no seria possvel.
Sumrio
LISTA DE ABREVIATURAS .....i

NOTAO GERAL ....ii
SMBOLOS PRINCIPAIS ...iii
RESUMO ...iv
ABSTRACT ....v
INTRODUO ...01
CAPTULO 1. DETECO E DIAGNSTICO DE FALHAS EM SISTEMAS

...04
DINMICOS
1.1. Conceito de Gerao de Resduos ...05
1.2. Deteco e Diagnstico de Falhas via Redundncia Analtica ...09
1.2.1. Robustez em Sistemas de Deteco e Diagnstico de Falhas via
...11
Redundncia Analtica
1.3. Tcnicas de Inteligncia Artificial Aplicadas em Sistemas de Deteco e
...12
Diagnstico de Falhas
1.3.1. Sistemas Baseados em Conhecimento ...13
1.3.2. Lgica Nebulosa ...13
1.3.3. Redes Neurais Artificiais ...14
CAPTULO 2. AS REDES NEURAIS ARTIFICIAIS ...16

2.1. Perceptron Multicamadas com Treinamento por Retropropagao do Erro ...17
2.2. Rede com Funo de Base Radial (Rede RBF) ...23
2.2.1. Treinamento da Rede RBF via Regularizao ...28
2.2.1.1. Global Ridge Regression ...29
2.2.1.2. Local Ridge Regression ...32
2.2.2. Treinamento da Rede RBF via Forward Selection ...33
2.2.3. Treinamento da Rede RBF via Mapa Auto-Organizvel de Kohonen ...35
CAPTULO 3. O ROB MANIPULADOR ...40
3.1. Modelo Matemtico do Rob Manipulador Sem Falhas ...41
3.2. Falhas em Robs Manipuladores ...43
3.3. Mtodos para Deteco e Diagnstico de Falhas em Robs Manipuladores ...44
3.4. Tolerncia a Falhas em Robs Manipuladores ...46
CAPTULO 4. SISTEMA DE DETECO E DIAGNSTICO DE FALHAS VIA REDES

NEURAIS ARTIFICIAIS PARA ROBS MANIPULADORES ...48
4.1. Gerao dos Resduos ...49
4.2. Anlise dos Resduos ...51
4.3. Procedimentos do Sistema de Deteco e Diagnstico de Falhas ...53
4.3.1. Procedimento para Treinamento ...53
4.3.2. Procedimento para Operao ...54
CAPTULO 5. RESULTADOS ...55

5.1. Manipulador Planar com 2 Graus de Liberdade ...55
5.1.1. Gerao dos Resduos ...56
5.1.2. Anlise dos Resduos ...61
5.2. Manipulador Puma 560 ...74
5.2.1. Gerao dos Resduos ...74
5.2.2. Anlise dos Resduos ...77
CAPTULO 6. CONCLUSES ...81
REFERNCIAS BIBLIOGRFICAS ...84
APNDICE A1. DADOS UTILIZADOS NO EXEMPLO 1 ...90
APNDICE A2. O VETOR DE PESOS TIMO PARA A REDE RBF ...91
APNDICE A3. A MATRIZ DE PROJEO ...95
APNDICE A4. O CRITRIO GENERALIZED CROSS VALIDATION ...98

APNDICE A5. O VALOR TIMO PARA O PARMETRO DE REGULARIZAO
..102
GLOBAL
APNDICE A6. OS VALORES TIMOS PARA OS PARMETROS DE

..107
REGULARIZAO LOCAIS
APNDICE A7. O MTODO FORWARD SELECTION ..112
APNDICE A8. PROGRAMAS UTILIZADOS ..114
APNDICE A9. TRAJETRIAS UTILIZADAS NA SIMULAO DO ROB COM 2

..116
GRAUS DE LIBERDADE
Lista de Abreviaturas
DDF - Deteco e Diagnstico de Falhas

IA - Inteligncia Artificial
RNA - Redes Neurais Artificiais
MLP - MultiLayer Perceptron
RBF - Radial Basis Function
GCV - Generalized Cross Validation
GRR - Global Ridge Regression
LRR - Local Ridge Regression
FS - Forward Selection
MAOK - Mapa Auto-Organizvel de Kohonen
Notao Geral
a, B letras em itlico representam escalares.

a, b letras minsculas em negrito representam vetores:
a1
a
a = .
2
M

a n
A, B letras maisculas em negrito representam matrizes.
In matriz identidade (n x n).
AT transposta de A.
A-1 inversa de A.
exp funo exponencial: exp (a) = e a .
a$ valor estimado de a.
a norma de a.
a expectncia de a.
a& primeira derivada de a.
a&& segunda derivada de a.
diag (A) matriz diagonal de A.
tr (A) trao da matriz A.
Smbolos Principais
Deteco e Diagnstico de Falhas

d - vetor de distrbios externos no-correlacionados
f (.) , g (.) - funes no-lineares do sistema livre de falhas
t - ndice do tempo
x - vetor de estados do sistema
u - vetor de controle
y - sada da planta
t - perodo amostral
(.) - funo de falha
$ (.) - vetor de resduos
Redes Neurais Artificiais

- vetor de entradas da RNA
$ - vetor de sadas da RNA
- vetor de sadas desejadas da RNA
ha - ativao do neurnio a
H - matriz de projeto
a - funo de ativao do neurnio a
ba - peso entre a sada do neurnio a e a entrada do neurnio b
e - erro instantneo
E - erro quadrtico instantneo
Emdio - erro mdio quadrtico
C - funo de custo
- taxa de aprendizagem
a - fator de ajuste do neurnio a
a - centro da unidade radial a
R - matriz que determina o tamanho dos campos receptivos
- parmetro de regularizao
- matriz dos parmetros de regularizao individuais
- matriz de projeo
A-1 - matriz de varincia
$GCV - erro GCV
- funo de decaimento que define a taxa de aprendizagem

(MAOK)
- define o espalhamento do ajuste (MAOK)
- funo de decaimento que define o espalhamento (MAOK)
Rob Manipulador
- vetor de posies das juntas
- vetor de torques
M - matriz de inrcia
v - vetor dos termos centrfugos e de Coriolis
g - vetor dos termos gravitacionais
z - vetor dos termos de frico
ng - nmero de graus de liberdade do manipulador
RESUMO
TINS, R. (1999). Deteco e diagnstico de falhas em robs manipuladores via redes

neurais artificiais. So Carlos, 1999. 117p. Dissertao (Mestrado) - Escola de
Engenharia de So Carlos, Universidade de So Paulo.
Neste trabalho, um novo enfoque para deteco e diagnstico de falhas (DDF) em

robs manipuladores apresentado. Um rob com falhas pode causar srios danos e pode
colocar em risco o pessoal presente no ambiente de trabalho. Geralmente, os pesquisadores
tm proposto esquemas de DDF baseados no modelo matemtico do sistema. Contudo, erros
de modelagem podem ocultar os efeitos das falhas e podem ser uma fonte de alarmes falsos.
Aqui, duas redes neurais artificiais so utilizadas em um sistema de DDF para robs
manipuladores. Um Perceptron Multicamadas treinado por retropropagao do erro usado
para reproduzir o comportamento dinmico do manipulador. As sadas do Perceptron so
comparadas com as variveis medidas, gerando o vetor de resduos. Em seguida, uma rede
com funo de base radial usada para classificar os resduos, gerando a isolao das falhas.
Quatro algoritmos diferentes so empregados para treinar esta rede. O primeiro utiliza
regularizao para reduzir a flexibilidade do modelo. O segundo emprega regularizao
tambm, mas ao invs de um nico termo de penalidade, cada unidade radial tem um
regularizao individual. O terceiro algoritmo emprega seleo de subconjuntos para
selecionar as unidades radiais a partir dos padres de treinamento. O quarto emprega o
Mapa Auto-Organizvel de Kohonen para fixar os centros das unidades radiais prximos aos
centros dos aglomerados de padres. Simulaes usando um manipulador com dois graus de
liberdade e um Puma 560 so apresentadas, demostrando que o sistema consegue detectar e
diagnosticar corretamente falhas que ocorrem em conjuntos de padres no-treinados.
Palavras-chave: Deteco e diagnstico de falhas, Robs manipuladores, Redes neurais

artificiais, Perceptron multicamadas, Rede com funo de base radial, Mapa auto-
organizvel de Kohonen.
ABSTRACT
TINS, R. (1999). Fault detection and diagnosis in robotic manipulators via artificial
neural networks. So Carlos, 1999. 117p. Dissertao (Mestrado) - Escola de
Engenharia de So Carlos, Universidade de So Paulo.
In this work, a new approach for fault detection and diagnosis in robotic manipulators
is presented. A faulty robot could cause serious damages and put in risk the people involved.
Usually, researchers have proposed fault detection and diagnosis schemes based on the
mathematical model of the system. However, modeling errors could obscure the fault effects
and could be a false alarm source. In this work, two artificial neural networks are employed
in a fault detection and diagnosis system to robotic manipulators. A Multilayer Perceptron
trained with Backpropagation algorithm is employed to reproduce the robotic manipulator
dynamical behavior. The Perceptron outputs are compared with the real measurements,
generating the residual vector. A Radial Basis Function Network is utilized to classify the
residual vector, generating the fault isolation. Four different algorithms have been employed
to train this Network. The first utilizes regularization to reduce the flexibility of the model.
The second employs regularization too, but instead of only one penalty term, each radial unit
has a individual penalty term. The third employs subset selection to choose the radial units
from the training patterns. The forth algorithm employs the Kohonens Self-organizing Map
to fix the radial unit center near to the cluster centers. Simulations employing a two link
manipulator and a Puma 560 manipulator are presented, demonstrating that the system can
detect and isolate correctly faults that occur in nontrained pattern sets.
Keywords: Fault detection and diagnosis, Robotic manipulators, Artificial neural networks,
Multilayer perceptrons, Radial basis function networks, Kohonens self-organizing map.
Deteco e diagnstico de falhas em robs manipuladores via redes neurais artificiais 1
Introduo
Com a crescente automatizao dos processos industriais, mecanismos que garantam

maior segurana e confiabilidade aos equipamentos esto sendo cada vez mais exigidos.
crescente a busca pela minimizao das perdas econmicas causadas durante os processos
de produo. Entre outras exigncias, deseja-se que os componentes inclusos nos processos
de produo tenham um bom desempenho e sejam livres de falhas. Eventuais falhas em
componentes de um sistema dinmico inserido no processo industrial podem acarretar
perdas de desempenho no aceitveis, bem como por em risco os equipamentos e o pessoal
envolvido. Portanto, sistemas de deteco e diagnstico de falhas se tornam cada vez mais
importantes.
Particularmente na rea de robtica, com o crescente uso de robs em reas como
explorao espacial, medicina e ambientes hostis (por exemplo, instalaes nucleares), no
somente a deteco e o diagnstico de falhas se torna importante, como tambm os sistemas
tolerantes a falhas.
Uma falha em um sistema dinmico pode ser entendida como qualquer tipo de mau
funcionamento em seus componentes que leve a uma perda de desempenho no aceitvel na
realizao de determinadas tarefas. Falhas podem ocorrer de modo abrupto, as quais
geralmente causam a parada do equipamento afetado, e de modo lento. Estas ocorrem de
modo gradual, ocasionando perda de desempenho no sistema e fadiga nos componentes
sobrecarregados. Muitas vezes os efeitos destas falhas so encobertos pela ao dos
controladores envolvidos, sendo, portanto, difceis de serem detectadas.
Uma alternativa para a minimizao dos efeitos desagradveis causados pelas falhas
a utilizao da chamada redundncia fsica (incluso de equipamentos, tais como sensores e
atuadores redundantes). Entretanto, muitas vezes essa uma alternativa bastante custosa e
pode se tornar invivel, como por exemplo, no caso de falta de espao fsico para a
instalao do componente redundante.
Por outro lado, pode-se utilizar sistemas de deteco e diagnstico de falhas que no
utilizam componentes fsicos adicionais. As diversas tcnicas de deteco e diagnstico de
falhas utilizam processamento de informaes das variveis medidas do sistema sob
condies operacionais bem caracterizadas. As tcnicas mais utilizadas so aquelas que
utilizam o modelo matemtico do sistema para reproduzir o seu comportamento dinmico
livre de falhas. Para um determinado vetor das variveis medidas de entrada do sistema, o
modelo matemtico dever gerar um vetor de sadas para ser comparado com o vetor das
variveis medidas da sada do sistema. A diferena entre estes dois vetores chamada de
resduo. Este resduo deve ser diferente de zero na ocorrncia de uma falha e trar as
informaes necessrias para a sua identificao.
Contudo, erros de modelagem obscurecem os efeitos das falhas e so uma fonte de
alarmes falsos. Tcnicas que buscam robustez em relao aos erros de modelagem na
gerao de resduos so cada vez mais estudadas. Outro problema, provavelmente mais
srio, que muitos dos sistemas reais no podem ser modelados com preciso suficiente.
Um outro enfoque aquele em que se empregam tcnicas de Inteligncia Artificial.
Dentro deste enfoque, podem-se destacar os mtodos que utilizam sistemas baseados em
conhecimento, a lgica nebulosa (fuzzy logic) e as redes neurais artificiais. Estas, em
particular, tm sido exaustivamente empregadas em uma infinidade de reas distintas.
O objetivo deste trabalho propor um sistema de deteco e diagnstico de falhas
baseado em redes neurais artificiais para robs manipuladores. Na arquitetura do sistema
proposto, so utilizadas duas redes neurais artificiais: a primeira tem por objetivo reproduzir
o comportamento dinmico do manipulador e, a segunda tem por funo classificar os sinais
de resduo produzidos pela diferena entre as sadas da primeira rede e as variveis medidas.
Dois tipos diferentes de redes neurais artificias so utilizados. Um perceptron multicamadas
utilizado para efetuar o mapeamento dinmico do sistema e uma rede RBF (radial basis
function) empregada para a classificao dos padres faltosos. Com o objetivo de se fazer
comparaes, esta rede treinada por quatro mtodos diferentes. Um manipulador planar
com dois elos rgidos e um manipulador Puma 560 so simulados para testes do sistema de
deteco e diagnstico de falhas via redes neurais artificiais.
Neste trabalho, apresenta-se no Captulo 1 uma viso geral sobre o problema da
deteco e diagnstico de falhas em sistemas dinmicos. Primeiramente o conceito de
gerao de resduos apresentado. Tal conceito utilizado neste trabalho e pode ser
empregado em mtodos baseados nos modelos matemticos.
No Captulo 2, uma introduo ao tema das redes neurais artificiais, enfatizando suas
aplicaes em mapeamento de funes e classificao de padres, feita. Duas redes so
apresentadas: o perceptron multicamadas com aprendizado por retropropagao do erro e a
rede radial basis function (RBF). Discute-se, tambm, a motivao de se empregar tais redes
para o sistema de deteco e diagnstico de falhas. Ainda neste Captulo, apresenta-se os 4
algoritmos utilizados neste trabalho para o treinamento das redes RBF.
A seguir, no Captulo 3, uma breve introduo aos robs manipuladores feita. So
apresentadas tambm uma anlise sobre as possveis falhas que ocorrem nestes sistemas, os
mtodos utilizados para a deteco e diagnstico de falhas e os sistemas com tolerncia a
falhas.
A arquitetura do sistema baseado em redes neurais artificiais utilizado para a deteco
e diagnstico de falhas apresentada no Captulo 4. O Captulo 5 traz os resultados do
sistema de deteco e isolao de falhas proposto utilizando redes neurais aplicado ao
manipulador com 2 elos rgidos e ao manipulador Puma 560. Finalmente, o Captulo 6 traz
as discusses sobre o trabalho realizado.
Captulo 1
Deteco e diagnstico de falhas em sistemas dinmicos
Qualquer tipo de alterao no sistema dinmico que leve a uma perda de desempenho
no aceitvel na realizao de determinadas tarefas pode ser entendida como falha. A
categoria de falhas mais importante engloba as alteraes na planta e o mau funcionamento
de sensores, atuadores e controladores.
Falhas podem ocorrer de modo abrupto ou de modo gradual. Estas ltimas so
geralmente difceis de serem detectadas pois seus efeitos no so observados em curto
prazo. Alm disso, muitas vezes tais efeitos so encobertos pela ao dos controladores. Um
exemplo tpico a variao paramtrica em um sistema dinmico. No entanto, tal qual as
falhas que ocorrem de modo abrupto, essas falhas ocasionam perdas de desempenho no
aceitveis e muitas vezes colocam em risco os equipamentos, o ambiente de trabalho e o
pessoal envolvido. Tais fatores podem explicar a crescente procura por sistemas que
propiciam deteco e diagnstico de falhas (DDF) de forma rpida e confivel.
Segundo a terminologia geralmente aceita, DDF consiste em [GERTLER, 1988]:
a) Deteco da falha, ou seja, a indicao de que algo errado est acontecendo
no sistema;
b) Isolao da falha, ou seja, a determinao do tipo e local da falha, e
c) Identificao da falha, ou seja, determinao do tamanho da falha.1
Mtodos de DDF podem ser empregados em sistemas de controle que propiciem
tolerncia a falhas. Tais sistemas de controle podem ser caracterizados por serem robustos
e/ou reconfigurveis [PATTON, 1997]. Um sistema de controle dito robusto, se retm
satisfatoriamente o desempenho na presena de erros de modelagem, rudos e/ou falhas. O
sistema de controle dito reconfigurvel, se a sua estrutura ou seus parmetros puderem ser
1
Neste trabalho, o termo DDF empregado para designar a deteco e a isolao das falhas.
alterados em resposta a falhas. Neste caso, o sistema de controle deve detectar e diagnosticar
a falha, modificando posteriormente suas leis para manter um desempenho aceitvel
[STENGEL, 1991].
Muitos sistemas empregam a chamada redundncia fsica (ou de hardware) para obter
tolerncia a falhas. Na redundncia fsica, alguns componentes do sistema de controle
(sensores, atuadores e controladores) so duplicados, ou seja, existem dois componentes
para desempenhar a mesma funo. Os componentes redundantes so aqueles mais sujeitos a
falhas e/ou mais cruciais em relao ao desempenho do sistema.
Uma derivao de tal mtodo a redundncia fsica em paralelo, na qual dois ou mais
conjuntos de sensores, atuadores e controladores, cada qual com capacidade individual de
um controle satisfatrio, so instalados para a execuo da mesma tarefa. Um sistema
gerenciador deve comparar os sinais de controle para detectar o conjunto faltoso. Com dois
sinais redundantes, um sistema votante pode detectar a existncia de um conjunto faltoso
mas no pode identific-lo. Com trs sinais redundantes, um sistema votante pode detectar e
isolar o conjunto faltoso, selecionando assim, qual no deve ser utilizado para o controle da
planta.
Redundncia fsica pode proteger o sistema contra falhas nos componentes do sistema
de controle, mas no nos componentes da planta. Pode, tambm, ser uma alternativa bastante
cara e muitas vezes invivel, como no caso de falta de espao fsico para a instalao dos
componentes redundantes.
De outro lado surgem sistemas de DDF que no necessitam de instrumentao
adicional na planta, utilizando-se do processamento de informao das variveis medidas.
Dentro deste enfoque, os mtodos que empregam a chamada redundncia analtica [CHOW
& WILLSKY, 1984] so os mais conhecidos. Estes mtodos utilizam o conceito de gerao
de resduos, que ser visto na Seo seguinte. Os sistemas de DDF via redundncia analtica
sero apresentados resumidamente na Seo 1.2. Ser visto que erros de modelagem podem
comprometer a eficincia de tais sistemas de DDF, levando os pesquisadores a buscarem
tcnicas robustas. Como ser visto na Seo 1.3, tcnicas de inteligncia artificial podem
tornar-se ferramentas interessantes para auxlio da resoluo de tal problema.
1.1. CONCEITO DE GERAO DE RESDUOS
Um sistema dinmico geralmente constitudo por atuadores, planta e sensores, como

pode ser visto na Figura 1.
rudos de
falhas falhas falhas medida
entradas atuadores planta sensores sadas
rudos do
sistema
Figura 1. Representao do sistema dinmico.
A equao de estados e a equao de sadas do sistema dinmico livre de falhas so

dadas por
( )
x& (t ) = f t x(t ), u(t ), d(t ) (1)
y(t ) = g t (x(t ), u(t ), d(t )) (2)
na qual x(t) o vetor de estados no tempo t, y(t) o vetor de sadas no tempo t, u(t) o vetor
de controle atual, d(t) o vetor de distrbios externos no-correlacionados e, ft (.) e gt (.)
representam as funes no-lineares do sistema livre de falhas. Discretizando as equaes
acima, o sistema dinmico livre de falhas pode ser representado por
(
x(t + t ) = f x(t ), u(t ), d(t ) ) (3)
y(t ) = g (x(t ), u(t ), d(t )) (4)
nas quais t o perodo amostral e, por abuso de notao, x e y representam

respectivamente o vetor de estados e o vetor de sadas discretos. A Figura 2 apresenta a
representao da equao de estados do sistema livre de falhas. Note que os rudos do
sistema e demais distrbios externos no-correlacionados so representados pelo vetor d(t).
x(t)
Dinmica do
u(t) x(t+t)
sistema
d(t)
Figura 2. Representao da dinmica do sistema livre de falhas.
Considerando agora os efeitos das falhas, as equaes do sistema podem ser dadas por
(
x (t + t ) = f x(t ), u(t ), d(t ) ) (5)
( )
y (t ) = g x(t ), u(t ), d(t ) (6)
nas quais f (.) e g (.) representam as funes no-lineares do sistema na presena de falhas.
Note que as falhas podem ser, ou no, entradas aditivas do sistema (ou seja, dependentes
apenas do tempo t). O vetor de falhas aqui definido como a diferena do comportamento
dinmico do sistema na presena de falhas (Eq. 5) e do comportamento dinmico do sistema
livre de falhas (Eq. 3). Assim, o vetor de falhas dado por
( ) ( )
(t + t ) = x (t + t ) x(t + t ) = f x(t ), u(t ), d(t ) f x(t ), u(t ), d(t ) . (7)
Note que na ausncia de falhas no sistema, (t+t)=0 e, em caso contrrio, (t+t)0.

Geralmente, para cada tipo de falha, tem um comportamento peculiar, o qual chamado de
assinatura da falha. A Figura 3 ilustra o comportamento dinmico de um sistema com dois
estados, x1 e x2 , em que ocorre uma falha em t=2. Note que para t<2 o vetor de falhas
nulo.
x1
x(3)
x(1)= x(1)
x(2)= x(2) (3)
x(4)
x(0)= x(0) x(3)
(4)
x(4)
x2
Figura 3. Vetor de falhas e estados de um sistema em que ocorre uma falha em t=2.
O princpio bsico dos mtodos de DDF que utilizam o conceito de gerao de

resduos o emprego de para anlise das falhas do sistema. Para isso, o comportamento
dinmico do sistema livre de falhas (dado pela Eq. 3) deve ser reproduzido por uma
ferramenta qualquer. Como ser visto a seguir, em redundncia analtica, o comportamento
dinmico do sistema livre de falhas reproduzido pelo modelo matemtico. Considere que a
estimativa do vetor de estados de um sistema livre de falhas dado por uma ferramenta
qualquer seja
x$ (t + t ) = f$ (x(t ), u(t )) (8)
na qual f$ (.) a funo no-linear que representa o mapeamento entrada-sada da ferramenta

utilizada. Aqui, o vetor de resduos definido como
$ (t + t ) = x ( t + t ) x$ (t + t ) = f (x( t ), u(t ), d(t )) f$ (x( t ), u( t )) .(9)
Se a ferramenta utilizada representa exatamente o comportamento dinmico do

sistema livre de falhas e no existem distrbios externos, o vetor de resduos exatamente
igual ao vetor de falhas. No entanto, em sistemas reais, tal fato no ocorre. Em tais sistemas
sempre haver diferenas entre o vetor de resduos e o vetor de falhas, devido aos distrbios
no-correlacionados e/ou erros no mapeamento do comportamento dinmico. Estas
diferenas, como ser visto a seguir, podem prejudicar seriamente a deteco e o diagnstico
das falhas. A Figura 4 mostra o vetor de resduos para um sistema em que ocorre uma falha
em t=2. Note que existe um erro no mapeamento do sistema dinmico.
x1
x(1) x(2)
(1) x(3)
(2) x(2) (3)
x(1) x(4)
x(0) x(3)
(4)
x(4)
x2
Figura 4. Vetor de resduos e estados de um sistema em que ocorre uma falha em t=2.
Portanto, o procedimento para DDF pode ser descrito da seguinte forma: gera-se o
vetor de resduos comparando-se o vetor de estados medidos em (t+t) com a sua estimativa
dada por uma ferramenta qualquer e, posteriormente, analisa-se o vetor de resduos,
indicando a falha ocorrida. Normalmente nesta etapa, uma falha detectada quando uma
banda pr-definida (que ser chamada banda de deteco) sobre o vetor de resduos
ultrapassada. Contudo, como as falhas e os erros de mapeamento geralmente so
correlacionados com a dinmica do sistema, o sistema de DDF pode no conseguir detectar
uma falha ou gerar alarmes falsos.
Note que para a gerao de resduos, os estados esto sendo considerados
mensurveis. No entanto, se a sada do sistema possuir informao suficiente a respeito dos
estados, uma equao de sada do tipo recursiva pode ser utilizada para a gerao de
resduos. Assim, a equao do sistema que dever ser reproduzida dada por
y (t + t ) = l (u(t ), d(t ), y(t ), y(t t ),L) (10)
na qual l(.) representa a funo no-linear do sistema livre de falhas.
1.2. DETECO E DIAGNSTICO DE FALHAS VIA REDUNDNCIA

ANALTICA
Em contraste com a redundncia fsica na qual medidas de diferentes sensores so

confrontadas, na redundncia analtica as medidas dos sensores so comparadas com os
valores correspondentes analiticamente obtidos [GERTLER, 1988]. Usando-se o conceito de
gerao de resduos, o modelo matemtico utilizado para a reproduo do comportamento
dinmico do sistema livre de falhas.
O preo a ser pago pelos benefcios do modelo matemtico do sistema, alm claro
do considervel esforo computacional, a sensibilidade do sistema de DDF com respeito
aos erros de modelagem que so inevitveis na prtica. Os erros de modelagem podem
obscurecer os efeitos das falhas e tornarem-se uma fonte de alarmes falsos. Portanto, a
sensibilidade aos erros de modelagem o principal problema nas aplicaes dos mtodos de
DDF que utilizam redundncia analtica [FRANK, 1990].
Nos mtodos que utilizam redundncia analtica, para a detectabilidade e
diferenciao da falha, deve-se ter: conhecimento do modelo nominal do sistema,
conclusividade do comportamento faltoso, existncia de relaes redundantes, observao
do comportamento do sistema na presena da falha e invarincia ou um mnimo de robustez

com respeito a entradas desconhecidas.
A literatura traz uma grande variedade de mtodos que utilizam redundncia analtica.
No entanto, eles basicamente podem ser englobados por dois conceitos bsicos: os mtodos
que usam estimao de estado, nos quais se destacam o enfoque por paridade de estados e o
enfoque por observadores dedicados, e os mtodos que utilizam estimao paramtrica.
No enfoque por paridade de estados, a principal idia checar a paridade
(consistncia) do modelo matemtico do sistema atravs das variveis medidas. Quando uma
banda de erros pr-definida (banda de deteco) ultrapassada, indica-se que uma falha
ocorreu. O problema de DDF empregando paridade de estados pode ser formulado como se
segue: dadas q medidas redundantes das variveis do sistema e as bandas de deteco que
caracterizam um comportamento faltoso, ache uma estimativa x$ da varivel de processo a
partir do mais consistente subconjunto de medidas e, identifique a medida faltosa pela
verificao da paridade.
Basicamente, no enfoque por observadores dedicados, os resduos so gerados
reconstruindo-se os estados do sistema a partir das variveis medidas (ou um subconjunto
destas). Os estados so reconstrudos utilizando-se observadores via estimao de erros ou
filtros de Kalman. A falha poder ser detectada checando-se o incremento do resduo
causado pela falha. No caso simples, uma banda de deteco usada para evitar alarmes
falsos. Um caminho similar pode ser traado para gerar resduos usando observadores de
ordem reduzida ou estimadores no-lineares. O esquema de gerao de resduos para a DDF
utilizando-se um estimador de estados de ordem plena pode ser visto na Figura 5. Note que o
resduo definido como a diferena entre as variveis medidas e a sada estimada pelo
modelo.
falhas
d (t) y (t)
u (t) sistema
modelo y$ (t) gerao

sem falhas - de resduos
$ (t )
estimao de H
estados
Figura 5. Gerao de resduos via observadores dedicados.
O enfoque por identificao paramtrica faz uso do fato de que as falhas nos sistemas
dinmicos so refletidas nos parmetros fsicos, como por exemplo frico, massa,
viscosidade, capacitncia, etc. A idia bsica detectar as falhas fazendo a estimativa
paramtrica do modelo matemtico atual e calculando os desvios em relao ao modelo do
sistema sem falhas [ISERMANN, 1984]. O procedimento utilizado ilustrado na Figura 6.
falhas
d (t)
sistema y (t)
u (t)
atual
identificao
paramtrica
parmetros do sistema
determinao das
variaes paramtricas
deciso das
alarmes
falhas
Figura 6. Deteco e diagnstico de falhas via identificao paramtrica.
1.2.1. Robustez em sistemas de deteco e diagnstico de falhas via redundncia

analtica
Em sistemas reais, os mtodos de DDF baseados no modelo matemtico operam sobre

condies no-ideais, na presena de rudos, distrbios e erros de modelagem [GERTLER,
1997]. A consequncia desse fato que a diferena (resduo) entre a varivel medida e a
sada do modelo matemtico diferente de zero na ausncia de falhas. O que se deseja de
um sistema de DDF via redundncia analtica que ele seja sensvel s falhas e insensvel s
incertezas de modelagem e rudos no sistema. Um mtodo que atende a estes requisitos
dito robusto.
Para esconder os efeitos indesejveis dos erros de modelagem e rudos no sistema
utiliza-se bandas de deteco no sinal de resduo. O uso de bandas de deteco apresenta
dois problemas principais: a sensibilidade do sistema de DDF fica reduzida e a determinao
da largura das bandas difcil de ser estabelecida, j que o resduo varia com o sinal de
entrada, com a magnitude e a natureza dos distrbios no sistema. Escolhendo-se bandas de
deteco fixas muito pequenas, aumenta-se o nmero de alarmes falsos. Por outro lado,
escolhendo bandas de deteco fixas muito grandes, reduz-se consideravelmente a

sensibilidade do sistema de DDF.
Muitos trabalhos tm sido desenvolvidos em sistemas de DDF robustos [WILLSKY,
1976], [PATTON et al., 1989], [PATTON, 1994]. Vrias tcnicas robustas de projeto de
estimadores de estado para gerao de resduos foram desenvolvidas [FRANK, 1987],
[WATANABE & HIMMELBLAU, 1982], [CHOW & WILLSKY, 1984]. Mais
recentemente, nesta mesma linha, pode-se citar os mtodos que utilizam equaes de
paridade robustas [GERTLER, 1991], o enfoque por estimao robusta H [MANGOUBI et
al., 1992], [SADRNIA et al., 1997 a,b], o uso de observadores de estados robustos baseados
na teoria de modos deslizantes [CAMINHAS, 1997], entre outros.
Por outro lado, foram desenvolvidos vrios enfoques que aumentam a robustez da
DDF pela escolha apropriada de bandas de deteco ou fazendo-as adaptativas ao sinal de
entrada do sistema, como foi proposto por CLARK no livro de PATTON et al. (1989). A
anlise de alguns dos mais recentes mtodos de DDF podem ser encontrados no trabalho de
GERTLER (1997).
1.3. TCNICAS DE INTELIGNCIA ARTIFICIAL APLICADAS EM SISTEMAS

DE DETECO E DIAGNSTICO DE FALHAS
Basicamente, tcnicas de Inteligncia Artificial (IA) podem ser utilizadas em sistemas

de DDF para trs funes distintas. Na primeira, as tcnicas de IA so usadas para a
produo de classificadores baseados nas variveis medidas do processo. Na segunda, o
conceito de gerao de resduos utilizado, sendo que as tcnicas de IA so empregadas
para reproduzir o comportamento dinmico do sistema e/ou para a classificao do vetor de
resduos (neste caso, indiretamente, a tcnica empregada produz bandas de deteco
variveis baseadas nas medidas do sistema). As tcnicas de IA, ainda, podem ser usadas para
produzir a estimativa paramtrica do sistema e, em um procedimento semelhante ao descrito
anteriormente, detectar as falhas.
Dentre as ferramentas de IA utilizadas em sistemas de DDF, destacam-se trs: os
sistemas baseados em conhecimento (ou sistemas especialistas), a lgica nebulosa e as redes
neurais artificiais.
1.3.1. Sistemas baseados em conhecimento
Tambm conhecidos como sistemas especialistas, os sistemas baseados em

conhecimento so programas de computador que fazem uso de relaes heursticas e fatos
(experincia) tal qual os especialistas humanos fazem. Sistemas especialistas oferecem um
formalismo proveitoso para DDF porque eles podem considerar diversas fontes de dados e
subproblemas de abstraes [FRANK, 1990]. Entre as funes de um sistema especialista,
destacam-se para os sistemas de DDF:
a) Interpretao, ou seja, uma correta, consistente e completa anlise de dados;
b) Diagnstico e,
c) Monitorao, ou seja reconhecimento das condies de alarme.
O sistema especialista pode ser implementado atravs de um sistema baseado em
regras, consistindo de um banco de dados, um banco de regras e um interpretador de regras
[CHARNIAK & MCDERMOTT, 1985].
Atualmente, tais sistemas tm sido muito usados em conjunto com lgica nebulosa em
sistemas de DDF [EVSUKOFF et al., 1997], [CALADO & ROBERTS, 1997]. A lgica
nebulosa aplicada em sistemas onde as informaes so vagas e imprecisas, como grande
parte dos problemas de DDF.
1.3.2. Lgica nebulosa
Lgica nebulosa foi desenvolvida para prover algoritmos de processamento de

informaes que podem raciocinar sobre ou utilizar dados imprecisos [BROWN &
HARRIS, 1994]. Para isso, utiliza informaes lingusticas tal qual os seres humanos o
fazem.
Pode ser utilizada para a construo de bandas de deteco baseadas nas variveis do
processo [SCHNEIDER & FRANK, 1996] ou para a classificao destas. Algumas vezes
utilizada em conjunto com as redes neurais artificiais [FSSEL et al., 1997], [CAMINHAS
et al., 1996], [CAMINHAS, 1997] para as tarefas citadas anteriormente.
1.3.3. Redes neurais artificiais
So sistemas computacionais inspirados em certas caractersticas dos sistemas

biolgicos. Existe um grande nmero de tipos de redes neurais artificiais (RNA) que
basicamente diferem em suas arquiteturas e suas formas de aprendizado. Entre as diferentes

arquiteturas, as mais utilizadas so as recorrentes e as com propagao para a frente
(diretas). Entre as formas de aprendizado, sobressaem a supervisionada e a no-
supervisionada. As RNA so aplicadas para a realizao de inmeras tarefas, como por
exemplo, aproximao de funes (especialmente no-lineares), associao de padres,
reconhecimento de padres, classificao e predio.
Em sistemas de DDF, as RNA tm sido empregadas nos ltimos anos especialmente
em sistemas estticos e menos intensivamente em sistemas dinmicos [KORBICZ, 1997].
Na maioria das aplicaes, as RNA tm sido utilizadas como classificadores baseados nas
variveis medidas do processo (salienta-se que as entradas do sistema geralmente no so
utilizadas). Em tais solues, as RNA podem ser implementadas com aprendizado
supervisionado ou no-supervisionado. No aprendizado supervisionado, um perceptron
multicamadas (do ingls, multilayer perceptron - MLP) geralmente empregado tendo
como padres de entrada, vetores p-dimensionais contendo as variveis medidas do processo
e, na sada, o estado das diferentes classes (diferentes falhas e sistema em operao normal).
As diferentes classes devem ter regies separveis no espao de entradas p-dimensional.
Para cada padro de entrada, um vetor q-dimensional descrevendo os estados das diferentes
classes dever ser utilizado para o aprendizado da RNA. Entretanto, em algumas aplicaes
no se conhece profundamente o comportamento das variveis medidas quando submetidas
s falhas. Neste caso, devem ser empregadas RNA com aprendizado no-supervisionado.
Uma modelo tpico de tais redes a dos mapas auto-organizveis de Kohonen [KOHONEN,
1995]. Em tais redes, os diferentes padres so separados em aglomerados (clusters) que
posteriormente devem ser associados s diferentes falhas e operao normal.
No entanto, em sistemas dinmicos tais procedimentos geralmente no so vlidos
pois as variveis de sada medidas comumente sofrem os efeitos das entradas do sistema.
Isto ocorre especialmente em sistemas dinmicos no-lineares [KORBICZ, 1997]. Um
enfoque que surgiu para superar tais dificuldades o baseado no conceito de gerao de
resduos. Neste enfoque, o modelo matemtico ou uma RNA utilizada para a reproduo
do comportamento dinmico do sistema livre de falhas. As sadas do modelo matemtico ou
da RNA so comparadas com os valores das variveis medidas do sistema, gerando assim o
vetor de resduos, que aplicado em uma RNA que tem por objetivo a classificao das
falhas. Esta a arquitetura utilizada para a DDF neste trabalho e ser discutida com maiores
detalhes no Captulo 4. No Captulo seguinte, as RNA utilizadas neste trabalho sero
apresentadas.
Captulo 2
As redes neurais artificiais
As redes neurais artificiais (RNA) tm sido aplicadas na soluo de uma infinidade de

problemas. O adjetivo neural usado porque muito da inspirao de tais redes vem da
neurocincia [HERTZ et al., 1991]. As RNA empregam como unidade de processamento
fundamental o neurnio artificial, inspirado no funcionamento bsico dos neurnios
biolgicos.
Neste trabalho, as RNA so utilizadas para duas tarefas distintas: aproximao de
funes no-lineares e classificao de padres. O perceptron multicamadas (multilayer
perceptron - MLP) com aprendizado por retropropagao do erro (backpropagation) ,
atualmente, a RNA mais utilizada para a aproximao de funes no-lineares contnuas.
Para a classificao de padres em DDF, no entanto, esta RNA apresenta alguns problemas.
Tais problemas levam utilizao de outra RNA conhecida como rede de funo de base
radial (radial basis function network - rede RBF). Neste trabalho, com o objetivo de
comparao, as redes RBF empregadas utilizam quatro diferentes mtodos de treinamento.
Os dois primeiros utilizam regularizao para penalizar os pesos grandes e, assim, gerar um
efeito de suavidade na funo de sada da rede. O terceiro mtodo utiliza seleo de
subconjuntos para escolher os centros das unidades radiais a partir dos padres do conjunto
de treinamento. O quarto algoritmo emprega o mapa auto-organizvel de Kohonen para
selecionar os centros das unidades radiais em posies prximas aos centros dos
aglomerados de padres (clusters) pertencentes a uma mesma classe.
2.1. PERCEPTRON MULTICAMADAS COM TREINAMENTO POR

RETROPROPAGAO DO ERRO
O perceptron multicamadas pode ser visto como um veculo prtico para realizar
mapeamentos de funes no-lineares de maneira geral [HAYKIN, 1994]. A relao
entrada/sada do MLP define um mapeamento de um espao de entrada Euclidiano p-
dimensional para um espao de sada Euclidiano q-dimensional continuamente
diferencivel. Um MLP com apenas uma camada escondida pode ser visto na Figura 7.
h1
1 $ 1
2 $ 2
h2
hm
p $ q
Camada Camada Camada
de entrada escondida de sada
Figura 7. Perceptron multicamadas com uma nica camada escondida.
Para um MLP com uma nica camada escondida, apresentando-se o n-simo padro
de entrada (n) = [ 1(n) 2(n) ... p(n)] T, a ativao do neurnio de sada k e a ativao
dos neurnios j da camada escondida, respectivamente, so dadas por
m
$ k (n) = k k j (n) h j (n) , (11)
j =0
p
j (n) = j j i (n) i (n)
h (12)
i =0
nas quais a a funo de ativao no-linear do neurnio a, cb o peso entre a sada do

neurnio b (camada anterior) e a entrada do neurnio c (camada posterior), i = 1, ..., p o
ndice dos neurnios da camada de entrada, j = 1, ..., m o ndice dos neurnios da camada
escondida e k = 1, ..., q o ndice dos neurnios da camada de sada.
Uma funo de ativao no-linear comumente empregada no MLP a sigmoidal, que
dada por
a (v a ) = 1
1 + exp ( v a ) (13)
na qual va o nvel de ativao interna no neurnio a.

A seguir, mostra-se o algoritmo para treinamento do MLP por retropropagao do
erro. Apresentando-se o n-simo padro de treinamento (n = 1,...,np) na entrada do MLP, o
erro instantneo na sada k dado por
e k (n) = k (n) $ k (n) (14)
na qual k (n) a varivel que deve ser estimada pela sada da RNA $ k (n) . A soma dos
erros quadrticos instantneos nas sadas do MLP para o padro n dada por
1 q 2
E (n) = ek (n) (15)
2 k =1
e o erro mdio quadrtico sobre o conjunto de treinamento dado por
np
1
E medio =
np
E (n) . (16)
n =1
Utilizando-se a lei delta [HERTZ et al., 1991], as conexes entre a camada escondida
e a camada de sada so ajustadas por
E (n)
kj (n) = (n) (17)
kj (n)
na qual a taxa de aprendizagem e kj a correo aplicada ao peso kj . Da Equao
anterior e da Eq. (15), chega-se a lei de ajuste dos pesos
kj (n) = (n) k (n) h j (n) (18)
na qual
(
k (n) = e k (n) k ' v k (n) .) (19)
Do mesmo modo, para as conexes entre a camada de entrada e a camada escondida,

tem-se que o ajuste de pesos dado por
ji (n) = (n) j (n) i (n) (20)
na qual
( ) k (n) kj (n) .
q
j (n) = j ' v j (n) (21)
k =1
A definio da taxa de aprendizagem tem um papel importante no treinamento por

retropropagao do erro. Se a taxa muito baixa, o algoritmo demorar para convergir. Se,
por outro lado, a taxa muito alta, o algoritmo pode se tornar instvel. Um mtodo simples
de aumentar a velocidade de convergncia e evitar a instabilidade modificar a lei de ajuste
adicionando um termo de momentum que proporcional ao ajuste de pesos anterior
[HAYKIN, 1994].
Neste trabalho, o MLP tem apenas uma camada escondida. O seguinte teorema
estabelece que uma RNA direta (feedforward) com uma nica camada escondida e com um
nmero suficiente de unidades escondidas capaz de aproximar qualquer funo contnua f:
pq com qualquer acuracidade desejada.
Teorema A1: [CYBENKO, 1989] Seja qualquer funo de ativao contnua. Ento, dada
np
qualquer funo contnua com valores reais f (.), em um subespao compacto s e>
0, existem vetores 1 , 2 ,..., m , , e uma funo parametrizada G( . , , , ): tal
que
G( , , , ) f ( ) < (22)
j ( Tj + j )
m
G ( , , , ) = (23)
j =1
na qual jp, p, j, j, j=[ j1... jp]T, =[ 1... m]T e =[ 1... m]T.
Este teorema pode ser interpretado da seguinte maneira: uma falha na funo de
mapeamento do MLP resultado de uma escolha de parmetros inadequada ou de um
insuficiente nmero de unidades escondidas [EFRATI, 1997].
Neste trabalho, o MLP com treinamento por retropropagao do erro ser utilizado
para aproximar a funo dinmica do sistema. Inicialmente, esta RNA tambm deveria ser
utilizada para o problema de classificao do vetor de resduos.
Para o problema de classificao, o MLP produz bordas de deciso que separam os
padres das diferentes classes. Bordas de deciso so superfcies (ou linhas para o caso de
dois neurnios na entrada) no espao de entradas onde a sada dos dois (ou mais) neurnios
com maior ativao na ltima camada so iguais para um mesmo padro. As bordas de
deciso produzidas pelo MLP com treinamento por retropopagao so posicionadas muito
perto da superfcie que separa os padres de treinamento pertencentes s diferentes classes.
Esta caracterstica do MLP pode gerar m-classificao dos padres no-treinados em
problemas (como por exemplo em DDF) em que as superfcies que separam as diferentes
classes so difceis de serem estipuladas atravs de um conjunto limitado de padres. Este
problema poderia ser evitado se as bordas de deciso estivessem em posies mais
conservadoras. Alm disso, nas reas do espao de entradas no ocupadas pelos padres do
conjunto de treinamento a classificao arbitrria j que os pontos de sada desejados
somente refletem as ativaes da rede para os padres empregados no treinamento
[LEONARD & KRAMER, 1991]. Portanto, sob certas condies, o MLP com treinamento
por retropropagao pode produzir bordas de deciso que so no-intuitivas e no-robustas.
Para ilustrar tais caractersticas ser apresentado um exemplo adaptado de
LEONARD & KRAMER (1991). O seguinte problema de DDF uma verso simplificada
de muitos dos problemas encontrados em processos reais, em que a RNA utilizada para a
classificao das falhas (observe que o conceito de gerao de resduos no empregado).
Exemplo 1: Considere que o vetor de estados de um processo em condio de operao

normal seja x0 e as falhas sejam representadas por mudanas em um conjunto de parmetros
b. Quando no existem falhas, o conjunto de parmetros b deve ter seus valores numricos
prximos de zero. O efeito da variao destes parmetros sobre o vetor de estados x

assumido como linear
nb
xi = x 0i + aij b j + ci , i = 1,..., n x (24)
j =1
na qual a o vetor responsvel pela direo do efeito de b em x e, c um vetor de rudos de

medida Gaussiano.
Assumindo nx=2 e nb=2, as classes so definidas como segue
Classe 1 (operao normal): | b1 | < 0,1 e | b2 | < 0,1;
Classe 2 (falha 1): | b1 | > 0,1 e,
Classe 3 (falha 2): | b2 | > 0,1.
Para os padres com falha 1, considera-se a1 j = [1 -1]T e, para os padres com falha 2,
a2 j = [1 1]T. A varincia do rudo de medida definida como 0,15. Utilizando a Eq. (24) so
gerados 202 padres que podem ser vistos na Figura 8.
0.8
0.6
0.4
0.2
0
x2
-0.2
-0.4
-0.6
-0.8
-1
-1 -0.5 0 0.5 1
x1
Figura 8. Padres utilizados no exemplo 1: o operao normal, x falha 1, + falha 2.
Os padres vistos na Figura 8 foram empregados para o treinamento de um MLP com

aprendizado por retropropagao do erro (veja parmetros no Apndice A1). O MLP tem
dois neurnios na camada de entrada (estados x1 e x2), 6 neurnios na camada escondida e 3

neurnios na camada de sada (3 classes). A separao do espao de entradas de acordo com
a classificao feita pelo MLP aps o treinamento (400 pocas) pode ser vista na Figura 9.
Salienta-se que esta separao dependente da arquitetura e do treinamento do MLP. No
entanto, de modo geral, esta caso particular exemplifica bem o problema de classificao do
MLP.
Figura 9. Separao do espao de entradas do exemplo 1 de acordo com a classificao feita

pelo MLP treinado por retropropagao do erro: o operao normal, x falha 1, + falha 2.
Observe que a regio classificada como falha 1 menor que a regio classificada
como falha 2 sem que os padres do conjunto de treinamento indicassem tal
comportamento. Isto ocorre porque a classificao das regies reflete as ativaes do MLP
para os padres utilizados no treinamento. Veja que para o conjunto de treinamento a
classificao satisfatria. No entanto, tal caracterstica pode gerar m-classificao para
problemas de DDF em que o tamanho do conjunto de treinamento geralmente limitado.
Note tambm que existe uma regio no quadrante inferior esquerdo que foi definida como
falha 1, apesar de no haver padres de treinamento localizados nesta rea que indiquem tal
comportamento.
Estes problemas podem ser superados quando se utilizam redes RBF, nas quais a
classificao feita de acordo com a distncia entre o padro a ser classificado e os centros
das unidades radiais que representam as diferentes classes.
2.2. REDE COM FUNO DE BASE RADIAL (REDE RBF)
Funes de base radial so, simplesmente, uma classe de funes. MOODY &
DARKEN (1989) propuseram seu uso em um novo tipo de RNA chamada rede com funo
de base radial (RBF). Esta RNA inspirada em neurnios que tm ativaes localmente
sintonizadas ou neurnios seletivos, que respondem para determinadas faixas de sinais de
entrada e so encontrados em diversas partes do corpo humano e de outros animais. Em
princpio, as redes RBF podem ser multicamadas e terem funes de ativao na sada no-
lineares. Contudo, redes RBF tm tradicionalmente sido associadas com funes radiais em
uma nica camada escondida e funes de sada lineares [ORR, 1996 a].
A rede RBF utilizada neste trabalho tem trs camadas distintas. Na primeira, os
padres de entrada so apresentados. No existem pesos entre a primeira e a segunda
camadas, sendo os padres de entrada repassados para os neurnios da segunda camada
(camada escondida). As unidades desta camada tm funo de ativao radial. Cada
neurnio j da camada escondida (chamado unidade radial j) responsvel pela criao de
um campo receptivo no espao de entradas centrado em um vetor j , chamado de centro da
unidade radial. A unidade radial j tem ativao de acordo com a distncia entre o vetor de
entrada e o centro da unidade radial. Quanto mais prximos forem os dois vetores, maior
ser a ativao do neurnio (Figura 10). Entre a segunda e a terceira camadas existem pesos
e a terceira camada apresenta ativao linear. A k-sima (k = 1,...,q) sada da rede RBF para
o n-simo (n = 1,...,np) vetor de entrada n , dada por
m
$ k (n) = k j h j (n) (25)
j =0
na qual h j a ativao da unidade radial j da camada escondida e k j o peso entre a

unidade radial j e o neurnio de sada k. A ativao das unidades da camada escondida
definida por uma funo radial. Uma funo radial de ativao comum a Gaussiana.
Aplicando tal funo na unidade radial j, a ativao desta unidade para o n-simo vetor de
entrada dada por
(n) 2
h j (n) = exp
j (26)
2 2

na qual determina o tamanho do campo receptivo da unidade radial j e || . || define a norma

do vetor (geralmente a Euclidiana).
h 0.5
0
-1 -0.5 0 0.5 1
x
Figura 10. Resposta da funo Gaussiana com o centro em 0 ( = 0) e = 0,3. Note que a
ativao mxima ocorre em x = .
Neste trabalho, a funo de ativao utilizada nas unidades radiais a funo de

Cauchy. Esta funo foi escolhida por apresentar um decaimento mais suave conforme os
padres se distanciam do centro da unidade radial. Assim, mesmo os padres nas regies do
espao de entradas que no so ocupadas pelos padres de treinamento sero classificados
de acordo com a distncia at o centro mais prximo, sem a necessidade de se aumentar o
tamanho do campo receptivo. Aqui, a funo de Cauchy dada por
h j (n) =
1
(27)
((n) j )
2
1
1+ R
na qual R uma matriz diagonal formada pelos parmetros individuais que definem o
tamanho do campo receptivo em cada dimenso do espao de entradas, ou seja
1 0 0 0
0 2 0 0
R= .
(28)
0 0 O 0

0 0 0 p
Desta forma, o campo receptivo no precisa necessariamente ter o mesmo tamanho

em todas as dimenses do espao de entradas. Portanto, se uma determinada varivel do
vetor de entrada tem um poder discriminatrio menor, o tamanho do campo receptivo em

sua dimenso pode ser maior, priorizando-se, assim, as outras variveis.
Para os problemas de DDF, a rede RBF pode produzir bordas de deciso que so mais
robustas e intuitivas que as do MLP, j que a classificao feita considerando-se a
proximidade entre o padro a ser classificado e os centros das unidades radiais. claro que
este resultado dependente da escolha adequada das unidades radiais e de seus parmetros
Por exemplo, treinando uma rede RBF (veja parmetros no Apndice A1) com os padres
apresentados no exemplo 1, a classificao do espao de entradas muito mais interessante
do que a feita pelo MLP com treinamento por retropropagao do erro (Figura 11).
Figura 11. Separao do espao de entradas do exemplo 1 de acordo com a classificao feita
pela rede RBF: o operao normal, x falha 1, + falha 2.
As redes RBF ainda apresentam outras vantagens sobre o MLP, tais como
inexistncia de mnimos locais no clculo dos pesos e um menor tempo de treinamento
[LOONEY, 1997]. Entre as desvantagens, pode-se citar: as redes RBF ocupam mais
memria devido ao nmero alto de unidades escondidas (unidades radiais), a velocidade de
operao pode ser menor devido ao maior nmero de unidades escondidas e a escolha das
unidades radiais e de seus parmetros subtima. Neste ponto, uma questo que pode surgir
: por que no utilizar tambm a rede RBF para a aproximao da funo dinmica do
sistema no problema de DDF? Realmente, a rede RBF apresenta bons resultados no
mapeamento de sistemas no-lineares com poucas variveis medidas [NELLES &

ISERMANN, 1995]. Contudo, se a dimenso do espao de entradas grande, um nmero de
unidades radiais bastante alto requerido para tratar a complexidade do problema
[WARWICK & CRADDOCK, 1996]. Isto pode resultar em uma baixa generalizao e em
um esforo computacional extremamente alto durante a fase de treinamento da rede RBF.
Agora, ser considerado o problema do treinamento da rede RBF. Se a rede RBF tem
apenas uma camada escondida e as unidades radiais so fixadas (isto , o nmero de
unidades radiais e seus parmetros so constantes), ento esta RNA pode ser vista como um
modelo linear. Neste caso, o treinamento pode ser feito de maneira desacoplada: primeiro
determina-se as unidades radiais e seus parmetros e depois calcula-se os pesos da segunda
camada de acordo com as ativaes das unidades radiais e com as sadas desejadas. Assim,
evita-se o uso de algoritmos de otimizao no-lineares, como os do tipo gradiente
descendente, que apresentam um esforo computacional relativamente alto para clculo dos
pesos. Outra vantagem que evita-se os mnimos locais no clculo dos pesos.
A determinao do nmero de unidades radiais e seus parmetros a primeira etapa
do treinamento. O mtodo RBF original utiliza como centros todos os padres de
treinamento. No entanto, como o nmero de padres muito grande em DDF, este mtodo
raramente utilizado. Alm disso, utilizando-se um nmero grande de unidades radiais pode
haver problemas de sobreajuste (overfitting), ou seja, a classificao ser sensvel escolha
do conjunto de treinamento, apresentando uma baixa generalizao (maus resultados para
padres no-apresentados).
Neste trabalho, utilizou-se quatro diferentes mtodos para a escolha das unidades
radiais. Os trs primeiros escolhem as unidades radiais a partir dos padres de treinamento,
sendo que os dois primeiros utilizam regularizao e o terceiro utiliza seleo de
subconjuntos. O quarto emprega o mapa auto-organizvel de Kohonen para posicionar os
centros das unidades radiais perto dos centros dos aglomerados de padres (clusters) das
diferentes classes. Antes da descrio destes mtodos, o problema da generalizao para
RNA ser descrito.
Para atingir a melhor generalizao, a complexidade do modelo (RNA) precisa ser
otimizada [BISHOP, 1995]. Para uma melhor compreenso, o erro de generalizao ser
decomposto na soma da varincia com o bias ao quadrado. Um modelo que muito simples,
ou muito inflexvel, ter um bias grande, enquanto que um modelo muito flexvel em relao
a um particular conjunto de padres ter uma grande varincia. Considerando que $ a()
sada do modelo de predio (neste caso a sada da rede RBF) da varivel medida
( ) para um vetor de entrada , o erro mdio quadrtico sobre os padres do espao de

entradas dado por
E medio = ( ( ) $ ( ))
2
(29)
na qual a expectncia, que indicada por < . >, considerada sobre os padres do espao de
entradas. Separando a equao acima em duas componentes [GERMAN et al., 1992]
(
E medio = ( ) $ ( ) ) (
+ $ ( ) $ ( ) )
2 2
(30)
na qual a primeira parte desta equao o bias ao quadrado e a segunda parte a varincia.
O bias indica a diferena entre a sada desejada e a mdia das sadas do modelo. A varincia
indica a sensibilidade s peculiaridades (tal qual rudos e escolha dos padres) de cada
conjunto particular de treinamento. A melhor generalizao ocorre quando existe o melhor
compromisso entre as conflitantes necessidades de bias pequeno e varincia pequena. Isto
pode ser obtido controlando a flexibilidade do modelo. Um modo de controlar a
flexibilidade da rede RBF utilizar a tcnica da regularizao (como nos dois primeiros
mtodos de treinamento), conhecida de Regresso Linear, para diminuir a sensibilidade do
modelo em relao ao conjunto de treinamento e, assim, diminuir a varincia. Em um outro
enfoque, a flexibilidade pode ser controlada variando-se o nmero de parmetros
adaptativos da rede RBF (como em seleo de subconjuntos). Finalmente, a flexibilidade
pode ser controlada escolhendo os centros das unidades radiais como uma mdia dos
padres pertencentes a aglomerados de uma mesma classe (como empregando o mapa auto-
organizvel de Kohonen). Assim, diminui-se a varincia e o nmero de parmetros
adaptativos da rede RBF.
2.2.1. Treinamento da rede RBF via regularizao
Por volta dos anos 50, o russo Andre Tikhonov desenvolveu a tcnica matemtica
conhecida como regularizao para a soluo de problemas mal definidos [ORR, 1996 a].
Estes so problemas nos quais no h uma nica soluo porque no existem informaes
suficientes no problema. No entanto, o trabalho de Tikhonov s ficou amplamente
conhecido no Ocidente depois da publicao de seu livro em 1977 [TIKHONOV &

ARSENIN, 1977].
Enquanto isso, dois estatsticos americanos, Arthur Hoerl e Robert Kennard,
desenvolveram [HOERL & KENNARD, 1970] o conceito de ridge regression, um mtodo
para a soluo de problemas de regresso linear mal condicionados. Mal condicionamento
significa dificuldades em resolver a matriz inversa necessria para a obteno da matriz de
varincia. Ridge regression utiliza o fato de que uma matriz quadrada singular pode se
tornar no-singular adicionando uma constante na diagonal da matriz [RAWLINGS, 1988].
Se por exemplo, ATA singular, ento (ATA + k I) no-singular, na qual k uma constante
positiva pequena. O problema de mal condicionamento um tipo de problema de regresso
mal definido no sentido de Tikhonov e o mtodo de Hoerl e Kennard de fato uma forma de
regularizao conhecida como regularizao de ordem zero [PRESS et al., 1992].
Se na Eq. (30), $ ( ) = ( ) para todo , o bias igual a zero. No entanto, se a
varincia for grande, o erro mdio quadrtico ainda poder ser grande. Este ser o caso se a
sada do modelo de predio altamente sensvel s peculiaridades (tais como rudo e
escolha dos padres) de um conjunto de treinamento particular e esta sensibilidade causa
problemas de regresso mal definidos no sentido de Tikhonov. Contudo, a varincia pode
ser significativamente reduzida introduzindo-se uma pequena quantidade de bias na funo
de custo a ser minimizada.
Introduzir um termo de bias equivalente a restringir o domnio das funes as quais
o modelo pode reproduzir. Tipicamente isto alcanado removendo graus de liberdade.
Como exemplo, pode-se diminuir a ordem de um polinmio ou reduzir o nmero de pesos na
RNA. Ridge regression no remove explicitamente os graus de liberdade mas, ao invs
disso, diminui o nmero efetivo de parmetros. Como resultado tem-se uma perda de
flexibilidade que faz o modelo menos sensvel.
Um mtodo conveniente de se restringir a flexibilidade de modelos lineares
aumentar a soma dos erros quadrticos com um termo que penaliza os pesos grandes.
Quando as RNA se tornaram populares na dcada de 1980, uma das tcnicas que surgiram
para podar conexes sem importncia na rede foi a de decaimento de pesos. Logo foi
reconhecido que ridge regression e decaimento de pesos so equivalentes pois acrescentam
o mesmo termo de penalidade soma dos erros quadrticos.
Neste trabalho, utilizou-se ridge regression de duas formas: a primeira, a qual ser
chamada global ridge regression, utiliza um nico termo de penalidade (ou regularizao)
para todos os pesos, e a segunda, local ridge regression, utiliza temos de regularizao
individuais para os vrios pesos.
2.2.1.1 Global ridge regression (GRR):

No mtodo global ridge regression (GRR), um nico termo de regularizao
utilizado para todos os pesos. A funo de custo (para o neurnio de sada k) dada pela
soma dos erros quadrticos mais o termo de regularizao aplicado aos pesos
np m
( k (n) $ k (n)) +
2 (31)
Ck = 2
kj
n =1 j =1
na qual o parmetro de regularizao (ou penalidade) que controla o balano entre

ajustar a funo e evitar a penalizao, a sada desejada e m, neste caso, igual a np pois
todos os padres do conjunto de treinamento so escolhidos como centros das unidades
radiais. O bias introduzido favorece as solues envolvendo pesos pequenos e o efeito de
suavidade da funo de sada, j que pesos grandes so usualmente requeridos para produzir
funes de sada com variaes rpidas (bruscas).
Como, aps a determinao das ativaes das unidades radiais para o conjunto de
treinamento, o modelo pode ser visto como linear, pode-se calcular, minimizando a Eq. (31),
a matriz de pesos tima (veja Apndice A2)
( )
1
$ = HTH + I
HT
m (32)
na qual a matriz identidade I tem dimenso m (nmero de unidades radiais que, aqui, igual
ao nmero de padres), a matriz de pesos tima formada por $ = $ 1 $ 2 K $ q na [ ]

qual $ k = [$ k1 $ k2 K $ km ]T , a matriz de sada desejada formada por
[
= 1 2 K q ] [
na qual k = k (1) k (2) K k (n )]
p
T
e, H a matriz de
projeto formada pelas ativaes hj das unidades radiais para os diferentes padres de
treinamento n , [ ] na qual h = [h (1) ( )]

T
H = h1 h2 K hm j j h j (2) K h j n p . Ou seja
h1 (1) h2 (1) L hm (1)

h1 (2) h2 (2) L hm (2)
H = .
M M O M

( ) ( )
h1 n p h2 n p ( )

L hm n p
Um problema que surge a escolha do parmetro de regularizao . Se um valor de

escolhido muito pequeno, significa que existir uma pequena penalizao, o que pode
gerar uma baixa generalizao j que o modelo se ajustar firmemente aos dados de
treinamento (overfitting). Por outro lado, se um valor de muito grande escolhido, existir
uma grande penalizao, significando que o modelo pode se ajustar mal aos dados de
treinamento. Critrios para seleo de modelos podem ser utilizados para encontrar um valor
de o mais prximo possvel do valor timo. O valor escolhido aquele associado com o
menor erro de predio. O erro de predio a estimativa do desempenho do modelo
treinado para padres desconhecidos (no-treinados). Existem vrios critrios para estimar o
erro de predio (ou mtodos para seleo de modelos), entre eles: leave-one-out cross-
validation, generalized cross-validation, erro de predio final e critrio de informao
Bayesiano.
Neste trabalho, o critrio generalized cross-validation (GCV) utilizado na escolha
do parmetro de regularizao pois, para este fim, a sua forma de otimizao simples
[GOLUB et al., 1979]. Para a utilizao do critrio GCV, a matriz de projeo precisa ser
calculada. Esta uma matriz quadrada que projeta vetores de um espao np-dimensional (np
o nmero de padres de treinamento) perpendicular para um subespao m-dimensional (m
o nmero de unidades radiais) gerado pelo modelo e representa o erro entre a sada
desejada (que um vetor np-dimensional para cada neurnio de sada) e a predio (vetor m
dimensional) pelo princpio dos mnimos quadrticos sem a penalizao dos pesos (veja
Apndice A3). Uma observao importante que em ridge regression, a matriz de projeo,
embora continuar a ser chamada assim, no exatamente a projeo dos vetores do espao
np-dimensional perpendicular para um subespao m-dimensional, j que a penalizao
diminuiu o nmero efetivo de parmetros (m). A matriz de projeo dada pelo princpio do
mnimo quadrtico
P = I n p HA 1H T (33)
na qual A-1 a matriz de varincia e a matriz identidade I tem dimenso np (nmero de

padres). A matriz de varincia dada por:
(
A 1 = H T H + )1 (34)
na qual uma matriz quadrada com dimenso m com os parmetros de regularizao na

diagonal principal e zero nos elementos restantes. A predio da varincia do erro pelo
critrio GCV (ou erro GCV), considerando-se que a rede RBF tem apenas uma sada (q=1),
dada por (Apndice A4)
n p TP2 (35)
$ GCV
2
=
(tr (P))2
na qual tr (P) denota o trao da matriz de projeo.

Como em regularizao os critrios para seleo de modelos dependem no-
linearmente de , algum tipo de otimizao no-linear necessria. Qualquer das tcnicas de
otimizao no-linear, como por exemplo o mtodo de Newton, podem ser usadas.
Alternativamente [ORR, 1995 a], pode-se explorar o fato de que quando a derivada do erro
GCV fixada em zero, a equao resultante pode ser manipulada de tal modo que
somente $ aparece no lado direito da equao (Apndice A5). Considerando-se que a rede
RBF tem apenas uma sada, ento
$ =
(
T P 2 tr A -1 $ A -2 ). (36)
$ A tr (P )
T -1 $
Esta no uma soluo, e sim uma frmula de reestimao j que o lado direito da
equao depende de $ . Portanto, um valor inicial de $ tem que ser escolhido e usado no
lado direito da equao acima. Isto leva a uma nova estimativa e o processo pode ser
repetido at que algum critrio de convergncia seja alcanado.
2.2.1.2. Local ridge regression (LRR):

Ao invs de todos os pesos serem igualmente tratados atravs de um nico termo de
regularizao, eles podem ser tratados separadamente atravs de vrios termos, cada um
associado a uma unidade radial. Assim, a nova funo de custo para o neurnio de sada k
fica
np
( ) +
m
Ck = k (n) $ k (n)
2
j kj2 . (37)
n =1 j =1
A nova matriz de pesos tima dada por (veja Apndice A2)
( )
1
$ = HT H +
HT (38)
na qual uma matriz diagonal formada pelos parmetros de regularizao j.

Em geral, no existe nada de local nesta forma de decaimento de pesos. No entanto, se
forem usadas funes de base locais como as funes radiais, ento, a suavidade produzida
por esta forma de ridge regression controlada de maneira local pelos parmetros de
regularizao individuais [ORR, 1995 b]. Pode-se, portanto, adaptar a suavidade da funo
s condies locais. Este o porqu do nome local ridge regression (LRR). O mtodo GRR
tem dificuldades em reproduzir funes que tm suavidade significativamente diferente nas
diversas partes do espao de entradas.
Como no mtodo GRR, os parmetros de regularizao devem ser otimizados atravs
de um critrio para seleo de modelos. O critrio de seleo depende principalmente da
matriz de projeo (Apndice A3) e, portanto, ser preciso deduzir a sua dependncia aos
parmetros de regularizao individuais. O critrio de seleo de modelo que ser utilizado
o GCV.
Em contraste com o mtodo GRR, para o mtodo LRR existe uma soluo para os
valores timos dos parmetros de regularizao e, portanto, a reestimao no necessria.
O problema que existem m-1 outros parmetros para otimizar e cada vez que um parmetro
otimizado, os valores timos dos outros parmetros mudam. Como soluo para este
problema todos os parmetros so otimizados juntos como em um tipo de reestimao,
fazendo um por vez e repetindo at que o erro GCV convirja.
Quando o valor calculado j = , a j-sima unidade radial pode ser removida, pois,
se for calculada a matriz de projeo com j = , esta ser igual a matriz de projeo sem a
unidade radial j. Na prtica, especialmente se a rede inicialmente muito flexvel (alta
varincia e/ou pequeno bias), vrios valores timos dos parmetros de regularizao sero
iguais a e LRR pode ser usado para podar unidades radiais desnecessrias. O Apndice
A6 traz o mtodo para o clculo dos valores timos dos parmetros de regularizao.
Como qualquer tipo de otimizao no-linear, o algoritmo pode cair em um mnimo
local dependendo das condies iniciais. aconselhvel, portanto, que valores iniciais dos
parmetros de regularizao sejam escolhidos (por exemplo, iniciar com o parmetro global
calculado pelo mtodo GRR), ao invs de inici-los com valores aleatrios.
2.2.2. Treinamento da rede RBF via forward selection (FS)
Uma alternativa aos mtodos que controlam o balano entre bias e a varincia (como
os mtodos que utilizam regularizao) comparar os modelos formados por diferentes
subconjuntos de unidades radiais subtrados de um mesmo conjunto de treinamento fixo.
Deste modo, a flexibilidade variada mudando-se o nmero de parmetros adaptativos da
rede RBF (como os pesos e tamanho do campo receptivo das unidades radiais). Isto
chamado de seleo de subconjuntos em estatstica [RAWLINGS, 1988]. Seleo de
subconjuntos normalmente utilizada para a identificao de subconjuntos de funes
fixadas de variveis independentes que podem modelar a maior variao das variveis
dependentes. Neste sentido, achar o melhor subconjunto intratvel, sendo necessrio a
utilizao de procedimentos heursticos. Um destes procedimentos heursticos chama-se
forward selection (FS).
CHEN et al. (1991) utilizaram FS para escolher os centros das unidades radiais em
redes RBF a partir dos padres do conjunto de treinamento. FS comea com um conjunto
vazio e adiciona uma unidade radial por vez - aquela que mais reduz a soma dos erros
quadrticos [MILLER, 1990]. Ou seja, considerando-se apenas uma sada (q=1), a unidade
radial selecionada aquela cuja diferena abaixo (veja Apndice A7) maior
C$ M C$ M +1 =
( TPM h n )
2
(39)
h Tn P M h n
na qual M = 1, ..., m (m o nmero de unidades radiais escolhidas pelo mtodo) o nmero
de unidades radiais escolhidas at o momento, C$ M a soma dos erros quadrticos antes de
a n-sima (n = 1, ..., np) unidade radial ser acrescentada, C$ M +1 a soma dos erros
quadrticos depois de a n-sima unidade radial ser acrescentada, hn a n-sima coluna da

matriz de projeto H original, ou seja, o vetor com as np ativaes da unidade radial n e PM
a matriz de projeo antes de a n-sima unidade radial ser acrescentada.
Se a n-sima unidade radial acrescentada, ento o vetor hn inserido na ltima
coluna da nova matriz de projeto HM. Ao final, a nova matriz de projeto ter m colunas. O
algoritmo FS pode se tornar mais eficiente usando-se uma tcnica conhecida como
orthogonal least squares (OLS) [CHEN et al., 1991], que garante que cada novo vetor hn
correspondente ao centro adicionado matriz de projeto seja ortogonal s colunas
anteriores. Isto simplifica a funo de custo e torna o algoritmo mais rpido. Originalmente,
a seleo de centros deve parar quando um threshold na varincia da soma dos erros
quadrticos ultrapassado. Um mtodo mais eficiente empregar um critrio que estima o
erro de predio, tal qual o GCV, para finalizar a seleo das unidades radiais [ORR, 1995
a]. Apesar da soma dos erros quadrticos C$ nunca aumentar quando uma nova unidade
radial for acrescentada, o erro GCV eventualmente ir parar de decrescer e comear a
crescer, indicando um sobreajuste. Este o ponto em que o algoritmo deve parar a seleo.
A matriz de pesos tima dada por (veja Apndice A2)
( )
1
$ = HT H
HT (40)
na qual a matriz de projeo H formada pelas ativaes das m unidades radiais

selecionadas apresentando-se os padres do conjunto de treinamento.
2.2.3. Treinamento da rede RBF via mapa auto-organizvel de Kohonen

(MAOK)
O ltimo mtodo para treinamento da rede RBF utiliza o mapa auto-organizvel de

Kohonen (MAOK) para a seleo das unidades radiais da rede RBF. O uso do MAOK para
o treinamento de redes RBF no um enfoque novo. Em OJALA & VUORIMAA (1995)
por exemplo, o MAOK usado para a seleo inicial dos centros das unidades radiais e,
ento, um algoritmo Learning Vector Quantization (LVQ2.1) modificado [KOHONEN,
1995] utilizado para sintonizar todos os parmetros da rede (como os centros e os pesos).
Neste trabalho, algumas mudanas sero feitas para adequar o MAOK para o treinamento da
rede RBF aplicada no problema de DDF. Apesar deste algoritmo ser no-supervisionado (ou
seja, no necessita do conhecimento das sadas desejadas), ele ser aplicado em um
problema supervisionado. Assim, aproveitando as caractersticas do problema, o conjunto de
treinamento ser separado de acordo com as diferentes classes. Este procedimento adotado
para evitar que padres de treinamento pertencentes diferentes classes sejam sintonizados
em uma mesma unidade radial. Portanto, o algoritmo descrito abaixo deve ser repetido para
cada classe.
Inicialmente, todos os padres de treinamento so considerados como centros das
unidades radiais. Utilizando os padres pertencentes a uma determinada classe, calcula-se as
ativaes das unidades radias (Eq. 27) para cada padro de treinamento (da mesma classe) e
a unidade com a maior ativao selecionada de acordo com
{
h c ( t ) = max h j (t )
j
} (41)
na qual c a unidade radial selecionada, j=1,...,mk (mk o nmero de padres da classe k),
k=1,...,q (q o nmero de classes) e t=1,...,tmax o ndice do tempo discreto (tmax deve ser
mltiplo de mk). Em cada amostra t, um padro diferente do subconjunto de treinamento
deve ser apresentado (para que o algoritmo apresente uma convergncia conveniente, o
subconjunto de treinamento deve ser apresentado diversas vezes). O passo seguinte
atualizar as posies dos centros das unidades radiais de acordo com
[
j (t + 1) = j (t ) + (t ) (t ) (t ) j (t )] (42)
na qual (t) uma funo de decaimento no tempo que define a taxa de aprendizagem e
j) e o centro da
(t) uma funo da distncia vetorial entre o centro da unidade radial j (
c). Aqui, esta funo dada por
unidade radial selecionada (

1
(
, se R 1 c j < (t ), )
( )
2
1
(t ) = 1 + R c j (43)

0, (
se R 1 c j (t ) )
na qual a funo de espalhamento (t) decai com o tempo e define o tamanho da vizinhana
c). Se o nmero de iteraes (tmax)
ao redor do centro da unidade radial selecionada c (
suficientemente grande e os parmetros de treinamento so apropriadamente escolhidos, os
centros das unidades radiais em um mesmo aglomerado (cluster) devero se mover at as
proximidades do centro do aglomerado (ou seja, no local em que a mdia das ativaes das
unidades radiais para todos os padres de um mesmo aglomerado seja a maior). Aps o
treinamento, vrios centros de um mesmo aglomerado estaro na mesma posio ou em
posies muito prximas. Pode-se, portanto, juntar estas unidades radiais em uma nica, j
que as ativaes de duas unidades radiais com o mesmo centro so iguais. Agindo desta
forma, a complexidade da rede RBF diminui pois o nmero de parmetros adaptativos
(pesos) decresce. Este procedimento tambm importante para evitar problemas de
singularidade na matriz usada para determinar os pesos timos (Eq. 40). Se existem dois
centros muito prximos, a inversa da matriz da Eq. 40 sofre problemas de mal
condicionamento. A unio das unidades radiais com centros muito prximos feita
verificando se a norma da distncia entre duas unidades radiais muito pequena. Se a
resposta for afirmativa, uma unidade radial retirada.
Repetindo o procedimento descrito acima para todas as classes, as unidades radiais de
cada subconjunto so agrupadas em uma nica rede RBF e a matriz de pesos tima
calculada atravs da Eq. (40). A seguir, um exemplo simples ser apresentado para
demostrar a eficincia deste mtodo.
Exemplo 2: Considere que se deseja classificar padres inseridos em um espao

bidimensional em duas classes. Para a construo do classificador (treinamento) so
disponveis 20 padres de cada classe. Os padres da classe 1 so gerados aleatoriamente
(distribuio uniforme) com mdia=[0,5 0,5]T e varincia=[0,01 0,09]T. Os padres da classe
2 so gerados aleatoriamente (distribuio uniforme) com mdia=[0 0]T e varincia=[0,01

0,09]T. Dois mtodos para treinamento da rede RBF so utilizados: o algoritmo MAOK e o
algoritmo FS utilizando um simples threshold na varincia do erro como critrio de parada.
O tamanho do campo receptivo (diagonal da matriz R) da rede RBF escolhido como [0,2
0,6]T. O algoritmo FS seleciona 2 unidades radiais centradas em [0,578 0,589]T e [0,047
0,083]T, como pode ser visto na Figura 12. Note que tais centros so escolhidos a partir das
posies dos padres de treinamento. O algoritmo MAOK seleciona 2 unidades radiais
centradas em [0,513 0,560]T e [0,015 0,039]T, como pode ser visto na Figura 13. Tais
posies so obtidas atravs da convergncia dos padres em direo aos centros de cada
aglomerado.
1.5
1
v
a
r
i 0.5

v
e
l 0
2
-0.5
o Classe 1
+ Classe 2
* Centros
-1
-0.2 0 0.2 0.4 0.6 0.8
varivel 1
Figura 12. Padres de treinamento e campos receptivos criados pelas unidades radiais de uma
rede RBF treinada pelo algoritmo FS.
1.5
v
a 0.5
r
i

v 0
e
l
2 -0.5
o Classe 1
+ Classe 2
* Centros
-1
-0.2 0 0.2 0.4 0.6 0.8
varivel 1
Figura 13. Padres de treinamento e campos receptivos criados pelas unidades radiais de uma
rede RBF treinada pelo algoritmo MAOK.
A seguir, foram gerados 200 padres com as mesmas caractersticas anteriores para
teste das redes RBF treinadas pelos dois mtodos. As Figuras 14 e 15 mostram os padres de
treinamento e os campos receptivos formados pelas redes RBF treinadas pelos dois
algoritmos.
1.2
0.8
0.6
v
a 0.4
r
i 0.2

v 0
e
l -0.2
2
-0.4
o Classe 1
-0.6 + Classe 2
* Centros
-0.8
-0.4 -0.2 0 0.2 0.4 0.6 0.8 1
v a r i v e l 1
Figura 14. Padres de teste e campos receptivos criados pelas unidades radiais de uma rede
RBF treinada pelo algoritmo FS.
1.2
0.8
0.6
v
a 0.4
r
i 0.2

v 0
e
l -0.2
2
-0.4
o Classe 1
-0.6 + Classe 2
* Centros
-0.8
-0.4 -0.2 0 0.2 0.4 0.6 0.8 1
v a r i v e l 1
Figura 15. Padres de teste e campos receptivos criados pelas unidades radiais de uma rede
RBF treinada pelo algoritmo MAOK.
Captulo 3
O rob manipulador
Robs manipuladores (ou robs industriais) esto sendo cada vez mais utilizados em
sistemas de engenharia. Entre as diversas aplicaes, pode-se citar o seu uso cada vez mais
frequente em processos de produo, explorao espacial, medicina e ambientes hostis (tais
como usinas nucleares e fundo do mar).
Um rob manipulador definido como uma mquina com caractersticas significantes
de versatilidade e flexibilidade [SCIAVICCO & SICILIANO, 1996]. De acordo com uma
definio amplamente aceita feita pelo Robot Institute of America, datada de 1980, um rob
um manipulador multifuncional projetado para mover materiais, partes, ferramentas ou
artifcios especializados atravs de movimentos programados variveis para o desempenho
de uma variedade de tarefas. Um rob manipulador constitudo por
manipulador (ou estrutura mecnica): constitudo por um conjunto de elos conectados
atravs de articulaes (ou juntas), um pulso e um efetuador projetado para realizar a tarefa
requerida pelo rob,
atuadores: responsveis pela movimentao do manipulador atravs de foras aplicadas
direta ou indiretamente nas juntas (atravs, por exemplo, de engrenagens ou correias); as
foras so aplicadas por motores eltricos, pneumticos ou hidrulicos,
sensores: indicam o status do manipulador e,
sistema de controle (computador): permite o controle e a superviso do manipulador.
As juntas de um manipulador podem ser rotativas, que permitem movimentos de
rotao das diferentes partes do rob (elos, punho ou efetuador), ou prismticas, que
permitem movimentos de translao. Geralmente, sensores de velocidade e/ou posio so
colocados nas juntas do rob.
Diferente do brao e da mo humana, que juntos possuem cerca de 30 graus de

liberdade, muitos robs trabalham em trs dimenses com apenas 6 graus de liberdade, o
nmero mnimo de graus necessrios para posicionar e orientar o efetuador em qualquer
lugar de um espao tridimensional [VISINSKY et al., 1994]. Robs com um nmero maior
de juntas podem ser configurados de diferentes modos para realizar o mesmo
posicionamento de um objeto ligado ao efetuador.
A Figura 16 mostra um rob manipulador planar com dois elos rgidos. Este
manipulador ser posteriormente utilizado para a simulao do sistema de DDF. Os ngulos
1 e 2 indicam a posio, respectivamente, da junta 1 e da junta 2. Os tamanhos dos elos
so representados por l1 e l2. A seguir, o modelo matemtico do rob manipulador ser
descrito. Na seo 3.2, ser comentado o problema das falhas em tais sistemas e na seo 3.3
sero apresentados alguns mtodos para DDF em robs manipuladores. Considerando que a
falha j foi detectada e isolada por um sistema de DDF, em alguns casos, pode-se
reconfigurar a ao de controle para permitir tolerncia a falha. Alguns mecanismos para
reconfigurao de controle aps falha em robs manipuladores sero discutidas na seo
3.4.
2
l2
l1
Figura 16. Rob manipulador com dois elos rgidos e juntas rotativas.
3.1. MODELO MATEMTICO DO ROB MANIPULADOR SEM FALHAS
Considere um rob manipulador rgido livre de falhas com atuadores em cada grau de
liberdade. A sua dinmica dada por [CRAIG, 1988]
= M( ) && + v( , & ) + g( ) + z(, & ,t ) + d(t ) (44)

na qual o vetor dos ngulos das juntas (ng -dimensional), ng o nmero de graus de
liberdade, t o ndice do tempo, o vetor dos torques (ng -dimensional), M a matriz de
inrcia (ng x ng), v o vetor dos termos centrfugos e de Coriolis, g o vetor dos termos
gravitacionais, z o vetor dos termos de frico dinmica e esttica e d o vetor dos
distrbios externos no-correlacionados.
A matriz de inrcia simtrica e positiva definida para qualquer rob manipulador.
Utilizando-se o equacionamento anterior, tem-se a seguinte equao de estados para o
manipulador livre de falhas
& &
x& = =
M( )
&&
1
[ & &
) ]
v , g( ) z , , t d(t )
( ) ( (45)
[ ]T ou seja x = [1 ]
T
na qual o vetor de estados x = & L ng &1 L &ng .
Exemplificando o sistema acima para um rob planar com dois elos rgidos se
movendo no plano vertical, como na Figura 16, tem-se
m l 2 + 2m2 l1l2 c2 + l12 (m1 + m2 ) m2 l22 + m2 l1 l2 c2

M( ) = 2 2 ,
m2 l22 + m2 l1l2 c2 m2 l22
m2 l1 l2 s2&22 2m2 l1l2 s2&1&2

( )
v , & =
m2 l1l2 s2&22
,

m l g s + (m1 + m2 ) l1 g s1
g( ) = 2 2 12 ,
m2 l2 g s12
s1 sen (1 ), s2 sen (2 ), s12 sen (1 + 2 ), c2 cos (2 )
nas quais g a acelerao da gravidade e m1 , m2 so as massas dos elos (consideradas no

fim de cada elo).
O sistema de controle comanda o rob manipulador para se mover atravs do espao
de trabalho baseado em um plano ou uma trajetria desejada. O plano tipicamente
desenvolvido usando um algoritmo de cinemtica inversa que calcula o prximo ponto
desejado dada a configurao atual do rob manipulador. Existem vrios mtodos para se
controlar o rob definido pela Eq. (44). Um dos mais utilizados o mtodo do torque
calculado. Para o clculo do torque nesse mtodo, o modelo matemtico completo do rob
manipulador precisa ser conhecido. Erros de modelagem podem comprometer a eficcia

deste mtodo. No entanto, existem mtodos em que o conhecimento completo do modelo
matemtico no necessrio, como por exemplo, os mtodos de controle recursivo
[OSTOJIC, 1996].
3.2. FALHAS EM ROBS MANIPULADORES
Falhas em robs manipuladores podem causar movimentos descontrolados dos elos,

podendo causar srios danos ao rob e ao ambiente de trabalho. Por exemplo, uma falha no
sensor de velocidade da segunda junta de um rob industrial com 6 graus de liberdade pode
fazer com que o sistema de controle aplique nessa junta um alto valor de torque. Esta ao
pode levar o rob a, por exemplo, bater no cho ou em outros objetos do ambiente de
trabalho. Entre as falhas mais frequentes em robs manipuladores podem-se citar as falhas
nos sensores, nos atuadores, na fonte de alimentao e no sistema de controle [VISINSKY et
al., 1994].
Os sensores dos robs manipuladores esto sujeitos a diversas falhas. Um sensor pode
ter um fio rompido, permanecer enviando o mesmo sinal ou enviar o sinal errado. Se um
sensor est com falhas e o sistema no conseguir detect-las, o controlador ir receber
informaes incorretas sobre a junta e ir tomar as decises de controle erradas.
Atuadores em robs manipuladores so obviamente crticos. Podem, por exemplo,
travar a junta em uma nica posio ou no aplicar fora alguma. Em sistemas tolerantes a
falhas reconfigurveis, os atuadores devem ter a habilidade de travar a junta na posio em
que se encontra. Se o atuador falha e trava no lugar, ele no ir afetar as outras juntas
atravs do acoplamento. No entanto, o atuador ir parar de contribuir para a realizao da
tarefa requerida.
Pelo que foi visto, sistemas de DDF em robs manipuladores so muito importantes
para manter a sua confiabilidade e segurana. Quando a falha ocorre, ela deve ser detectada
de modo rpido e devem ser geradas atitudes para preservar a segurana do equipamento e
do ambiente de trabalho. Atravs da DDF, pode-se, tambm, obter sistemas tolerantes a
falhas reconfigurveis. A idia da tolerncia a falhas via DDF diz respeito habilidade do
sistema em detectar e isolar a falha e, ento, tomar atitudes para que continue funcionando.
O interesse em robs manipuladores com tolerncia a falhas tem se expandido nos
ltimos anos. Um dos motivos a crescente aplicao de robs em reas como explorao
espacial, medicina, plantas nucleares e outros ambientes hostis. A periculosidade e/ou a
distncia destes ambientes torna o envio de seres humanos invivel para reparar um rob
com falhas. No caso de ambientes espaciais, falhas em robs sem tolerncia podem fazer
com que a misso aborte. Em medicina, um rob com falhas pode matar um paciente ou
gerar sequelas permanentes. Em plantas nucleares, o mau funcionamento de robs pode
causar acidentes irreversveis com alta periculosidade. Tais fatos justificam a formulao de
mtodos de DDF em robs manipuladores.
Considerando agora o efeito da falha na dinmica do rob manipulador, a equao de
estados aps a falha pode ser dada por
& &
x& = =
M( )
&&
1
[ ) ] (
v , & g( ) z , & , t d(t ) + , & , , t
( ) ( ) (46)
na qual o vetor de falhas (ng - dimensional).
3.3. MTODOS PARA DETECO E DIAGNSTICO DE FALHAS EM ROBS

MANIPULADORES
Em geral, a maioria dos mtodos utilizados para DDF em robs manipuladores

emprega redundncia analtica (veja Captulo 1). Portanto, utilizam o modelo matemtico do
rob manipulador. A diferena bsica entre os mtodos se encontra na anlise dos resduos.
Analisar simplesmente se o resduo diferente de zero invivel para a deteco da falha.
Este procedimento leva a um grande nmero de alarmes falsos, j que os erros de
modelagem inerentes ao sistema sem falhas aumentam devido a linearizao das equaes
do sistema e s incertezas dos parmetros do modelo.
O que acontece tipicamente nos sistemas de DDF para robs manipuladores que
bandas de deteco (thresholds) fixas so estipuladas para mascarar tais incertezas.
Geralmente, a banda de deteco determinada empiricamente, tomando-se cuidado para
que seu valor no seja grande o suficiente para esconder as falhas. No entanto, os efeitos de
erros de modelagem flutuam dinamicamente conforme o manipulador se move e quando
ocorrem falhas. Desta forma, os alarmes falsos podem aparecer conforme o rob se move,
pois a banda de deteco fixa no projetada para todas as situaes dinmicas possveis.
Como exemplo prtico deste problema, pode-se citar o sistema de DDF utilizado no rob
manipulador do nibus Espacial Americano na misso STS-49 (maio de 1992). Neste vo,
uma sequncia de 13 alarmes falsos foram disparados porque condies operacionais
especiais, tais como entradas do controlador manual e carga no manipulador no usuais, no

foram levadas em considerao na modelagem do sistema [VISINSKY et al., 1994]. Assim,
as bandas de deteco devem ser variveis para que os efeitos dos erros de modelagem
possam ser superados.
Vrios mtodos foram criados para superar os problemas dos sistemas dinmicos
incertos. Dentre esses, pode-se citar o RMI (reachable measurement intervals) desenvolvido
por HORAK (1988) para sistemas de aeronaves. RMI prov condies para se achar os
extremos possveis das sadas medidas para cada entrada e estado do sistema sob condies
livres de falhas, dadas faixas de variaes paramtricas nos coeficientes das matrizes das
equaes dinmicas. RMI, contudo, concebido para sistemas com dinmica linear e requer
procedimentos especiais custosos para tratar sistemas dinmicos no-lineares.
Para robs manipuladores, um outro mtodo baseado nos conceitos de RMI foi
desenvolvido. o chamado ThMB (model-based threshold algorithm) que utiliza a idia de
se encontrar a mxima varincia possvel devido s faixas dos erros paramtricos em cada
iterao [VISINSKY et al., 1995]. Utilizando tais dados, bandas de deteco dependentes
dos estados e das entradas so construdas para se alcanar robustez na anlise dos resduos.
Este mtodo explora as similaridades entre RMI e redundncia analtica.
Um outro enfoque utilizar tcnicas de Inteligncia Artificial para criar bandas de
deteco adaptativas. SCHNEIDER & FRANK (1996) utilizaram lgica difusa (seo 1.3.2)
e NAUGHTON et al. (1996) utilizaram um MLP com treinamento por retropropagao para
produzir bandas de deteco variveis. O trabalho de SCHNEIDER & FRANK preocupa-se
basicamente com os erros de modelagem causados pela frico. Como a frico difcil de
ser modelada em robs manipuladores, construiu-se um conjunto de regras difusas para
variar as bandas de deteco em funo dos dados de velocidade e acelerao nas juntas.
Produzem, assim, bandas de deteco dinmicas. Neste caso, o conhecimento de um
especialista necessrio para a confeco das regras. J NAUGHTON et al. utilizaram um
MLP com treinamento por retropropagao para a classificao dos resduos. Treinando o
MLP com dados do vetor de resduos como entrada e das falhas como sada desejada, a
RNA pde construir bandas de deteco variveis. No entanto, o sistema de DDF neste caso
consegue apenas detectar as falhas em um conjunto de trajetrias limitado (aquele usado no
treinamento) apesar de os autores acreditarem que novas trajetrias podem ser utilizadas se
o conjunto de treinamento empregado for maior.
Todos os mtodos citados acima utilizam o modelo matemtico do manipulador.
Empregam tcnicas robustas para a gerao de resduos (atravs, por exemplo, de
observadores robustos) e/ou para a anlise dos resduos (atravs de bandas de deteco
adaptativas). Todos os mtodos descritos acima tm as seguintes caractersticas: 1) o modelo
nominal do sistema considerado linear e, 2) as falhas so modeladas como entradas
aditivas externas (ou seja, dependentes apenas do tempo e no dos estados e das entradas do
sistema). Apesar de ser conveniente do ponto de vista analtico o estudo de problemas de
DDF em estruturas lineares, a dinmica do manipulador inerentemente no-linear e a
maioria das falhas reais so funes no-lineares dos estados e das entradas [VEMURI &
POLYCARPOU, 1997].
Um enfoque para DDF em robs manipuladores diferente dos utilizados
anteriormente o desenvolvido por VEMURI & POLYCARPOU (1997), no qual uma RNA
empregada para mapear a funo de falha (ver Eq. 46). Seu mtodo interessante pois a
falha no considerada como uma entrada aditiva externa e sim como uma funo das
variveis do sistema. A tarefa da RNA mapear a funo da falha, tendo como entradas as
velocidades e as posies das juntas. Assim, o sistema pode no s detectar, mas tambm
reproduzir a funo da falha. O mtodo utiliza um observador para, baseado no modelo
matemtico e na funo de falha estimada pela RNA, gerar uma estimativa das variveis
medidas. O erro entre o valor estimado e o valor medido utilizado para o ajuste dos pesos
da rede. O trabalho no prope nenhum esquema para isolao da falha, propondo que
algum mtodo de classificao de padres deva ser utilizado. O maior problema deste
mtodo que erros de modelagem podem comprometer, durante o treinamento da RNA, o
mapeamento do vetor de falhas.
3.4. TOLERNCIA A FALHAS EM ROBS MANIPULADORES
Dependendo da falha que afeta o manipulador, a ao de controle pode ser

reconfigurada para permitir que o rob execute sua tarefa tal qual originalmente foi
proposta. A maioria dos trabalhos em tolerncia de falhas mecnicas em robs tem se
concentrado naqueles algoritmos que, aps a falha, ativam a parte duplicada [VISINSKY et
al., 1994]. Por exemplo, se um motor falha, o sistema detecta e isola tal falha, desliga o
componente faltoso e ativa o motor redundante. Os problemas citados para tais mtodos so
os mesmos do sistema de DDF via redundncia fsica, ou seja, incremento de custo, tamanho
e potncia de alimentao. Uma outra alternativa trabalhar com robs cinemticamente
redundantes. Assim, se por exemplo, um mnimo de 6 graus de liberdade so necessrios
para uma determinada tarefa, trabalha-se com um rob com 8 graus de liberdade, o que
permite que, dependendo da junta onde ocorre a falha, o rob consiga executar a tarefa
requerida mesmo com uma falha nos componentes de uma junta (neste caso, a falha deve ser
detectada e isolada para que a junta seja travada). Em outra alternativa, como a usada no
Sistema Manipulador Remoto do nibus Espacial, o sistema de DDF deve desligar o
sistema de controle e o operador deve manualmente executar a tarefa [VISINSKY et al.,
1994].
Por outro lado surgem sistemas de tolerncia a falhas que no necessitam de
mecanismos adicionais. Dois exemplos sero aqui citados. No primeiro, considerando que
uma falha que afete o atuador de uma junta seja detectada e isolada, reconfigura-se o
sistema de controle para trabalhar com o manipulador subatuado. Em BERGERMAN
(1996), os problemas de modelagem, controlabilidade, controle e planejamento de trajetrias
em manipuladores subatuados foram estudados. Se uma falha que impossibilite o uso do
atuador de uma junta qualquer do manipulador foi detectada e isolada, o sistema de controle
pode ser reconfigurado para, atravs das juntas que ainda tm atuao, controlar a junta no
atuada. Salienta-se que as juntas devem ser dotadas de freios. O segundo exemplo trabalha
com falhas que no prejudiquem seriamente o manipulador, tal qual mudanas paramtricas
(como aumento de massa nos elos). Utilizando o conceito de gerao de resduos, pode-se
reconfigurar o sistema de controle para que tenha a habilidade de tolerncia a falhas
[VEMURI & POLYCARPOU, 1997]. Para isso, o vetor de resduos utilizado para estimar
a funo de falha, que indica a diferena do modelo esperado (sem falhas) e do sistema
faltoso. Esta diferena deve ser usada para reconfigurar o sistema de controle que usa o
modelo matemtico do sistema. Tal qual para os sistemas de DDF, a preciso do
mapeamento dinmico do sistema (via RNA) essencial para o bom funcionamento do
mecanismo.
Captulo 4
Sistema de deteco e diagnstico de falhas via redes
neurais artificiais para robs manipuladores
A proposta do presente trabalho utilizar um sistema de DDF via RNA baseado no

conceito de gerao de resduos [KPPEN-SELIGER & FRANK, 1996] para robs
manipuladores. Um MLP utilizado para reproduzir o comportamento dinmico do rob
manipulador e uma rede RBF para a classificao do vetor de resduos. Mas, por que utilizar
o MLP para o mapeamento dinmico se o modelo matemtico do rob to conhecido? A
principal motivao que os robs manipuladores reais esto sujeitos a fenmenos cuja
modelagem uma tarefa intrincada. Um bom exemplo a frico nas juntas. J quando se
utiliza o MLP, o conhecimento detalhado destes fenmenos no necessrio pois seus
efeitos so abstrados pelo mapeamento feito pela RNA. O uso da rede RBF para a
classificao dos resduos advm do fato de que, ao invs de conceber bandas de deteco
fixas, fato que iria produzir inmeros alarmes falsos j que os resduos so dependentes da
dinmica do sistema, constri-se bandas de deteco variveis. Utilizando-se uma RNA para
a anlise dos resduos, a banda de deteco determinada de acordo com os padres do
conjunto de treinamento, no sendo necessrio a utilizao dos conhecimentos de um
especialista. A seguir, as duas partes principais do sistema de DDF (gerao dos resduos e
classificao dos resduos) sero descritas. Na seo 4.3, o procedimento para treinamento e
operao do sistema de DDF via RNA ser descrito.
4.1. GERAO DOS RESDUOS
A gerao dos resduos (Captulo 1) feita atravs da comparao dos estados

(posies e velocidades das juntas - Eq. 45) medidos no instante (t+t) com as respectivas
estimaes produzidas pelas sadas do MLP com treinamento por retropropagao (Figura
17). O MLP deve reproduzir o comportamento dinmico do sistema sem falhas. Os estados x
(posies e velocidades) e as entradas u (torques) do sistema medidos no instante t
alimentam o MLP que deve gerar a estimao dos estados, x$ , no instante (t+t). O resduo
$ gerado atravs da subtrao x- x$ . O MLP deve ser treinado para que o resduo seja zero
quando o rob manipulador no apresenta nenhuma falha. Quando ocorrer uma falha, este
resduo ter um valor diferente de zero, possibilitando a sua deteco. Espera-se que cada
falha tenha uma assinatura particular, o que permite que a rede RBF possa realizar a
classificao.
[ ]
u (t ) = (t )
T
[
x ( t + t ) = ( t + t ) & ( t + t ) ]T
manipulador
x(t )
z-1
a)
x$ ( t + t ) $ ( t + t )
MLP
-
falhas
[ ]
u (t ) = (t ) [
x ( t + t ) = ( t + t ) & ( t + t ) ]T
T
manipulador
x(t )
z-1
b)
x$ ( t + t ) $ ( t + t )
MLP
-
Figura 17. Gerao dos resduos: a) Treinamento do perceptron multicamadas; b) Operao.
Utilizando a arquitetura descrita acima, verificou-se que os resduos produzidos pelas

posies das juntas no tinham um alto poder discriminatrio para as falhas consideradas.
Isto ocorre porque, sendo baixo o perodo de amostragem, a diferena entre as posies no
instante t e no instante t+t pequena e, consequentemente, o resduo produzido baixo

mesmo para o manipulador com falhas. Se existem rudos de medida no sistema e erros no
mapeamento realizado pelo MLP, a classificao feita pela rede RBF pode ser prejudicada
pois estes resduos podero ser encobertos. Optou-se, portanto, por empregar somente os
resduos produzidos pelas velocidades das juntas na entrada da rede RBF. Esse
procedimento tambm facilita o treinamento da rede RBF pois, diminuindo a dimenso do
espao de entradas, o nmero de padres de treinamento necessrio para uma boa
generalizao decresce.
A seguir ser descrita a forma da funo no-linear que o MLP deve reproduzir.
Como os resduos de posio no sero empregados, ser considerada na sada do MLP
somente as velocidades das juntas no instante t+t.
Para a utilizao da equao dinmica do manipulador (Eq. 45) como funo a ser
reproduzida, preciso que os dados de acelerao nas juntas sejam mensurados. Entretanto,
os dados de acelerao geralmente no so disponveis nos robs manipuladores. Para
resolver tal problema, a acelerao ser relacionada com a velocidade. Substituindo
&& (t ) = (t + t ) (t ) .
& &
(47)
t
na equao (45), tem-se (considerando apenas a segunda equao) que a dinmica do

manipulador sem falhas dada por
& (t + t ) = M( )
1
[ v(,& ) g() z(,& ,t ) d(t )] t + & (t ) . (48)
E, procedendo da mesma forma na equao (46), tem-se que a dinmica do

manipulador com falhas dada por
& (t + t ) = M( )
1
[ v(,& ) g() z(,& , t ) d(t )] t + (,& , , t ) t + & (t ) . (49)
O MLP deve reproduzir a equao dinmica do manipulador sem falhas (Eq. 48).
Assim, os dados de entrada do MLP sero os estados (posies e velocidades das juntas) e
as entradas (torques nas juntas) medidas no instante t. As sadas do MLP sero as
estimaes das velocidades medidas no instante (t+t). Deste modo
( t )

(n) = & ( t ) e,
( t )
$
[
$ (n) = & (t + t ) . ]
importante observar que o perodo amostral est implcito no mapeamento realizado
pelo MLP. O erro de mapeamento do MLP (manipulador sem falhas) no padro n dado por
$
( n) $ (n) = & (t + t ) & ( t + t ) = e( t + t ) . (50)
Note que os rudos de medida podem estar implcitos nesta equao. Assim, o vetor
de resduo do manipulador livre de falhas deve ser dado por
$ (t + t ) = e(t + t ) . (51)
Portanto, para o manipulador sem falhas, o vetor de resduos varia exclusivamente

devido aos erros de mapeamento do MLP e aos rudos de medida. Considerando, agora, os
efeitos das falhas no manipulador, o vetor de resduos deve ser dado pela diferena das Eq.
(49) e (48) acrescida do erro de mapeamento
$ (t + t ) = ( , & , , t ) t + e(t + t ) . (52)
Desta forma, se o erro de mapeamento do MLP e os rudos de medida forem

significativos, o vetor de falhas poder ser encoberto, ocasionando erros na DDF. Como os
erros de mapeamento e os rudos de medida so inevitveis em sistemas reais, utiliza-se a
rede RBF para construir bandas de deteco variveis.
4.2. ANLISE DOS RESDUOS
A anlise feita atravs da rede RBF que tem por objetivo classificar os padres de
resduo. Os padres de entrada desta rede sero o vetor de resduos e as velocidades das
juntas. As velocidades so utilizadas pois nos manipuladores, os erros de mapeamento do
MLP e os rudos de medida variam dinamicamente. Este o caso, por exemplo, de um

mapeamento incorreto dos efeitos dos termos de frico. Utilizando, portanto, os dados de
velocidade das juntas, a rede RBF constri bandas de deteco que variam dinamicamente.
Por exemplo, se os erros de mapeamento so grandes em velocidades pequenas, a rede RBF
conseguir abstrair essa caracterstica e, assim, alarmes falsos no sero disparados. O efeito
negativo de se acrescentar os dados de velocidade das juntas que durante o treinamento, a
rede RBF necessitar de mais padres para que consiga uma boa generalizao, pois a
dimenso do espao de entradas aumenta.
A arquitetura do sistema de anlises dos resduos pode ser vista na Figura 18. A sada
da rede RBF apresenta um vetor q-dimensional, na qual q o nmero de falhas considerado.
Cada unidade deste vetor responsvel pela deteco de uma falha diferente. A rede RBF
deve separar o espao 2 x ng dimensional de entradas (ng resduos e ng velocidades) em
regies que devem ser associadas operao normal do rob manipulador e s diferentes
falhas.
a) Informaes
das falhas
$ (t + t ) sada 1
sada 2
& (t + t ) Rede RBF sada 3
sada q
b)
$ (t + t ) sada 1 falha 1
sada 2 falha 2
Critrio de
& (t + t ) Rede RBF sada 3
deteco
falha 3
sada q falha q
Figura 18. Anlise dos resduos: a) Treinamento da rede RBF; b) Operao.
A rede RBF treinada para que suas sadas apresentem sinal 1 no caso de uma falha
do seu tipo relacionado e 0 em caso contrrio (por exemplo, se ocorre uma falha do tipo 2, o
neurnio de sada 2 deve ter ativao igual a 1 e os outros neurnios devem ter ativao
igual a 0). O critrio de deteco considera que para uma falha ser detectada, o neurnio de
sada correspondente deve ter uma sequncia (com um nmero pr-definido de amostras) de
ativaes maiores que 0,5. Este critrio adotado para evitar que padres isolados mal-
classificados causem alarmes falsos. Assim, se considerado que o nmero de amostras para
a deteco deve ser 3, ento a falha detectada quando um neurnio de sada apresentar 3
ativaes consecutivas maiores que 0,5. Este critrio no diminui significativamente a
sensibilidade do sistema de DDF pois, em geral, o perodo amostral baixo.
4.3. PROCEDIMENTOS DO SISTEMA DE DETECO E DIAGNSTICO DE

FALHAS
A seguir, os procedimentos para treinamento e operao do sistema de DDF sero

descritos.
4.3.1. Procedimento para treinamento
1. Gera-se um conjunto significativo de trajetrias livres de falhas e, em cada amostra,

mede-se as posies, as velocidades angulares e os torques nas juntas;
2. as amostras deste conjunto de treinamento so normalizadas e, posteriormente,
empregadas para treinar o MLP. Na entrada do MLP, apresenta-se as posies, as
velocidades e os torques das juntas em cada instante amostral. O vetor de sadas do MLP
comparado com as velocidades das juntas do instante amostral seguinte. A diferena
entre estes dois vetores utilizada para ajustar os pesos do MLP. Este procedimento deve
ser repetido at que um critrio de paradas (como o nmero mximo de pocas de
treinamento) seja alcanado;
3. avalia-se o mapeamento do MLP apresentando-se os dados normalizados de trajetrias
no-treinadas. Se a anlise negativa, repete-se os passos anteriores mudando-se o
conjunto de treinamento (provavelmente o conjunto no significativo o bastante) e/ou
os parmetros de treinamento. Se a anlise positiva, passe para o passo seguinte;
4. gera-se um conjunto significativo de trajetrias. Os dados de cada trajetria so
normalizados e devem ser apresentados q+1 vezes (q o nmero de falhas): em cada
apresentao, um tipo de falha diferente deve ocorrer e, na ltima, nenhuma falha ocorre.
Em cada amostra, as posies, as velocidades e os torques das juntas so apresentadas ao

MLP que gera, assim, o vetor de resduos;
5. as amostras dos vetores de resduos gerados e das velocidades normalizadas so
apresentadas rede RBF. Um dos quatro algoritmos descritos na seo 2.2 utilizado
para o treinamento da rede RBF. O vetor de sadas da rede RBF, aps ser analisado pelo
critrio de falhas, comparado com as informaes reais das falhas e,
6. avalia-se a classificao realizada pela rede RBF apresentando-se dados de trajetrias
no-treinadas em que ocorrem cada tipo de falha e para operao normal. Analisa-se a
ocorrncia de alarmes falsos e se as falhas so detectadas e isoladas corretamente. Se a
anlise negativa, repete-se os passos 4, 5 e 6 mudando-se o conjunto de treinamento
(provavelmente o conjunto no significativo o bastante) e/ou os parmetros de
treinamento. Se a anlise positiva, finaliza-se o treinamento.
4.3.2. Procedimento para operao
1. Medem-se as variveis de posies e velocidades angulares das juntas no instante t+t

atravs de sensores;
2. os sinais medidos e os torques (fornecidos pelo sistema de controle) no instante t+t
sofrem pr-prossessamento (converses, normalizaes, etc.);
3. os valores das velocidades, posies e torques das juntas no instante t (j pr-
processados) so apresentados entrada do MLP, que tem como sada a estimativa das
velocidades das juntas no instante t+t;
4. a sada do MLP comparada com as velocidades das juntas pr-processadas medidas no
instante t+t, gerando o vetor de resduos;
5. o vetor de resduos e as velocidades das juntas pr-processadas medidas no instante t+t
so apresentadas entrada da rede RBF;
6. a rede RBF classifica os padres de entrada e gera um vetor de sadas que, aps ser
analisado pelo critrio de falhas, indica o estado de operao do sistema (sem falhas ou
ocorrncia de determinada falha) e,
7. incrementa-se o tempo t e retorna-se para o passo 1.
Captulo 5
Resultados
Dois manipuladores foram simulados em MATLAB para testes do sistema de DDF:

um manipulador planar com 2 graus de liberdade e um manipulador Puma 560. Os
algoritmos FS, GRR e LRR tambm foram executados em MATLAB, pois fez-se uso de
rotinas do toolbox RBF desenvolvido por ORR (1996 b). A descrio dos programas
construdos encontra-se no Apndice A8.
5.1. MANIPULADOR PLANAR COM 2 GRAUS DE LIBERDADE
Para o estudo do sistema de DDF foi simulado atravs do programa MATLAB, um

rob manipulador planar com dois elos rgidos e juntas rotativas adaptado de CRAIG
(1988). O rob, que pode ser visto na Figura 16, utiliza o mtodo do torque calculado para o
controle de posicionamento das juntas. No entanto, outros mtodos de controle podem ser
utilizados sem que se precise fazer mudanas no sistema de DDF pois o MLP mapeia as
equaes do manipulador e no as do controlador. Os parmetros do manipulador e do
controlador podem ser vistos na Tabela 1.
Tabela 1. Parmetros do manipulador com 2 graus de liberdade e do sistema de controle.
Parmetro Valor Descrio

l1 0,3 m tamanho do elo 1
l2 0,3 m tamanho do elo 2
m1 5 kg massa no elo 1
m2 5 kg massa no elo 2
g 9,81 m/s2 acelerao da gravidade
1max 100 N m torque mximo aplicado no elo 1
1min -100 N m torque mnimo aplicado no elo 1
2max 50 N m torque mximo aplicado no elo 2
2min -50 N m torque mnimo aplicado no elo 2
h 0,015 s perodo amostral

Kp 400 rad -1 ganho proporcional do controlador
Kv 40 s rad -1 ganho derivativo do controlador
considerado que cada junta do rob possui dois sensores: um para velocidade
angular e outro para posio. Durante a simulao, rudos de medida so considerados nos
sinais de posio das juntas (mdia=0 e varincia=0.005 ) e de velocidade angular das juntas
(mdia=0 e varincia=0.05 ). O rob executa suas tarefas atravs de trajetrias pr-
definidas. Em cada trajetria, os elos saem de uma posio inicial e realizam o movimento
at a posio final. Por exemplo, a trajetria vista na Figura 16 vai de =[/4 0]T at =[/2
/4]T.
5.1.1. Gerao dos Resduos
Para o treinamento do MLP, utilizam-se 10 trajetrias com 50 amostras cada em que

no se considera nenhuma falha no rob. Portanto, um total de 500 padres so usados no
treinamento do MLP. As trajetrias utilizadas no treinamento so escolhidas para que a
maior parte do espao de posies das juntas seja coberto. Isto deve acontecer para que os
padres utilizados nos treinamento sejam bastante significativos, permitindo a generalizao
do mapeamento para padres no-vistos. Durante o treinamento, o rob manipulador
simulado para todas as trajetrias e os dados de posio, velocidade angular e torque das
juntas so normalizados e em seguida apresentados ao MLP. A normalizao feita entre 0
e 1 devido a funo de ativao utilizada (sigmoidal). A normalizao feita do seguinte

modo: para cada varivel do vetor de entradas, relacionam-se o maior e o menor valores do
conjunto de treinamento respectivamente a 0 e a 1. Os parmetros do treinamento por
retropropagao do erro para o MLP podem ser vistos na Tabela 2. Os vetor de entradas
formado pelas posies, velocidades angulares e torques das 2 juntas em cada instante
amostral t e o vetor de sadas formado pelas velocidades angulares das 2 juntas no instante
amostral t+t. As trajetrias utilizadas no treinamento do MLP podem ser vistas na
Apndice A9.
Tabela 2. Parmetros do treinamento por retropropagao do erro no MLP para o manipulador

com 2 graus de liberdade.
Nmero de unidades na primeira camada 6

Nmero de unidades na camada escondida 13
Nmero de unidades na ltima camada 2
Funo de ativao utilizada sigmoidal
Taxa de aprendizagem 0,4
Momentum 0,1
Como se deseja um resduo baixo quando no existem falhas no manipulador, um

grande nmero de pocas de treinamento necessrio. Neste trabalho, um total de 18.000
pocas de treinamento foram utilizadas. O erro mdio quadrtico do MLP depois deste
perodo foi de 5,208 x 10-5 para o conjunto de treinamento. Como teste de validao,
apresentam-se trajetrias no-treinadas ao MLP. Neste trabalho, o MLP reproduz a dinmica
do sistema em operao normal com um resduo baixo mesmo para trajetrias no-treinadas,
comprovando a generalizao do procedimento. Em determinados instantes de certas
trajetrias, o resduo se torna maior (geralmente quando a velocidade angular muito
grande). Tal fato se explica por um erro no mapeamento realizado pelo MLP. Este erro pode
ser evitado aumentando-se o nmero de padres de treinamento e/ou o nmero de pocas.
No entanto, tal comportamento no prejudica a resposta do sistema de DDF pois a rede RBF
consegue abstra-lo (ou seja, graas aos dados de velocidade das juntas, a rede RBF
consegue construir bandas de deteco dinmicas). A Figura 19 mostra os sinais de posio,
velocidade e torque das juntas que devero ser normalizados para serem apresentados ao
MLP. Estes sinais foram obtidos atravs da simulao de uma trajetria no-treinada livre de
falhas. A Figura 20 traz as velocidades reais das juntas e as respectivas sadas no-
normalizadas do MLP para os mesmos padres da figura anterior. Os resduos (das

velocidades das juntas) resultantes podem ser vistos na Figura 21. Repare que quando a
velocidade das juntas alta (em mdulo), o resduo alto. Observa-se tambm uma
oscilao de baixa amplitude presente no sinal de resduo que provocada pelos rudos de
medida.
Posio das juntas (rad)

4
0
0 50 100 150 200
Torque das juntas (N m)
100
-100
0 50 100 150 200
Velocidade das juntas (rad / s)
20
-20
0 50 100 150 200
amostras
Figura 19. Entradas do MLP (antes da normalizao) para a trajetria no-treinada livre de
falhas de =[
/6 /4] at =[2
/3 /3] . Os dados da junta 1 so representados pelas linhas
T T
contnuas e os dados da junta 2, pelas linhas tracejadas.

12
rad / s
junta 1
junta 2
-6
0 50 100 150 200
amostras
Figura 20. Velocidades reais (linhas contnuas) e sadas do MLP sem normalizao (linhas
tracejadas) para a trajetria no-treinada livre de falhas de =[
/6 /4] at =[2
/3 /3] .
T T
0.8
rad / s
-1
0 50 100 150 200
amostras
Figura 21. Resduos das velocidades (no-normalizados) para a trajetria no-treinada livre de
falhas de =[
/6 /4] at =[2
/3 /3] . Os dados da junta 1 so representados pelas linhas
T T
contnuas e os dados da junta 2, pelas linhas tracejadas.
Dois tipos de falhas so considerados na simulao do sistema de DDF para o

manipulador com 2 graus de liberdade. Na primeira (falha 1) a junta do elo 1 bloqueada
em um determinado instante. Na segunda (falha 2) o mesmo ocorre para a junta do elo 2.
Estas falhas podem ter como causa, por exemplo, um travamento do motor de acionamento
ou um travamento das engrenagens que ligam a junta ao motor. As Figuras 22, 23 e 24
mostram as entradas e as sadas do MLP e os sinais de resduo resultantes para a mesma
trajetria empregada nas figuras anteriores, mas com a ocorrncia da falha do tipo 1 entre as
amostras 10 e 160.
Posio das juntas (rad)

3
0
0 200
Torque das juntas (N m)

100
-100
0 200
Velocidade das juntas (rad / s)

10
-10
0 Amostras 200
Figura 22. Entradas do MLP (antes da normalizao) para a trajetria no-treinada de =[

/6
/4] at =[2
/3 /3] em que ocorre a falha 1 entre as amostras 10 e 160. Os dados da junta 1
T T
so representados pelas linhas contnuas e os dados da junta 2, pelas linhas tracejadas.
10
rad / s
junta 1
junta 2
-8
0 160 200
amostras
Figura 23. Velocidades reais (linhas contnuas) e sadas do MLP no-normalizadas (linhas
tracejadas) para a trajetria no-treinada de =[
/6 /4] at =[2
/3 /3] em que ocorre a falha
T T
1 entre as amostras 10 e 160.

0.5
rad / s
0 junta 2
junta 1
-4
0 160 200
amostras
Figura 24. Resduos das velocidades (no-normalizados) para a trajetria no-treinada de

=[
/6 /4] at =[2
/3 /3] em que ocorre a falha 1 entre as amostras 10 e 160. Os dados da
T T
junta 1 so representados pelas linhas contnuas e os dados da junta 2, pelas linhas

tracejadas.
5.1.2. Anlise dos Resduos
A rede RBF para o manipulador com dois graus de liberdade tem 4 entradas (resduos
e velocidades) e duas sadas (2 falhas). Para o treinamento da rede RBF, 9 trajetrias com 40
amostras cada so utilizadas. Estas trajetrias so apresentadas rede RBF trs vezes: uma
em operao normal, uma em que ocorre a falha 1 e uma em que ocorre a falha 2,
perfazendo um total de 1080 padres. A definio dos padres mais significativos de
treinamento e dos parmetros que definem o tamanho do campo receptivo (diagonal da
matriz R) so essenciais para a rede RBF. Os padres de treinamento devem ocupar regies
do espao de entradas significativas para que os novos padres possam ser associados
atravs dos campos receptivos das unidades radiais. As trajetrias utilizadas para o
treinamento da rede RBF podem ser vistas no Apndice A9. Neste trabalho, o tamanho do
campo receptivo, definido pela diagonal de R, dado por [0.05 0.035 0.1 0.1]T, no qual os
dois primeiros valores atuam sobre os resduos e os dois ltimos atuam sobre as velocidades.
Para comparao de resultados, os quatro mtodos descritos na seo 2.2 foram
utilizados. O mtodo FS utilizou o OLS para otimizar o algoritmo e o GCV como critrio de
parada. Durante o treinamento, foram selecionadas 415 unidades radiais. A Figura 25 mostra
o treinamento da rede RBF pelo mtodo FS. Note que o erro GCV diminui conforme
aumenta o nmero de centros escolhidos. O algoritmo termina a seleo quando o erro GCV
cresce durante duas iteraes seguidas. Nota-se que o algoritmo pra a seleo quando o
primeiro mnimo (local ou global) alcanado.
0.5
0.45
0.4
0.35
e
0.3
r
r 0.25
o
0.2
G
C 0.15
V
0.1
0.05
0
0 100 200 300 400 500
nmero de unidades radiais escolhidas
Figura 25. Convergncia do mtodo FS durante o treinamento da rede RBF.
Para o mtodo GRR, utiliza-se como critrio de convergncia uma mudana relativa
de 1/1000, ou seja, o mtodo deve parar a seleo do parmetro de regularizao global ( $ )

quando a mudana no valor do erro GCV entre duas iteraes for menor que 1/1000. O valor
selecionado foi $ = 7,642 x 10-6. A Figura 26 mostra a convergncia para este valor. O
algoritmo comea com um valor pr-definido ( $ = 1 x 10-4) e reestima o parmetro de

regularizao global at que o critrio de convergncia seja alcanado.
0.031
e
0.0305
r
r
o
G 0.03
C
V
convergncia
0.0295 -4
x 10
0 0.2 0.4 0.6 0.8 1
$

Figura 26. Convergncia do mtodo GRR durante o treinamento da rede RBF.
Para o LRR, o critrio de convergncia utilizado foi o mesmo do GRR. Foram
podadas 761 unidades radiais da rede (estas unidades tiveram $ j = ). Assim, a rede
utiliza somente 319 unidades radiais. Cada uma destas unidades radiais tem um parmetro
de regularizao individual.
No mtodo MAOK, os parmetros utilizados foram: =t-1, =0,015 t-1 e tmax=1000
(nmero de vezes que cada padro apresentado). Usando tais parmetros, 215 unidades
radiais foram selecionadas. A Tabela 3 mostra o erro mdio quadrtico das duas sadas da
rede RBF (falha 1 e falha 2) para o conjunto de treinamento.
Tabela 3. Erro mdio quadrtico da rede RBF para o conjunto de treinamento.
sada 1 - rede RBF sada 2 - rede RBF

(Falha 1) (Falha 2)
Forward Selection 0.0008 0.0042
Global Ridge Regression 0.0015 0.0066
Local Ridge Regression 0.0013 0.0058
Mapa Auto-organizvel de Kohonen 0.0100 0.0212
Para teste de validao dos sistemas de DDF resultantes, 17 trajetrias no-treinadas

com 100 amostras cada so apresentadas trs vezes aos sistemas (uma para operao normal
e uma para cada uma das duas falhas). Assim, o total de trajetrias usadas durante o teste
de 51. As trajetrias podem ser vistas no Apndice A9. A Tabela 4 mostra o erro mdio
quadrtico das duas sadas da rede RBF para o conjunto de teste.
Tabela 4. Erro mdio quadrtico da rede RBF para o conjunto de teste.
sada 1 - rede RBF sada 2 - rede RBF

(Falha 1) (Falha 2)
Forward Selection 0.0699 0.2727
Global Ridge Regression 0.0354 0.0829
Local Ridge Regression 0.0414 0.1233
Mapa auto-organizvel de Kohonen 0.0273 0.0788
As Figuras 27, 28, 29 e 30 mostram as sadas das rede RBF treinadas pelos quatro
mtodos para uma trajetria no-treinada em que ocorre a falha 1 entre as amostras 10 e
160. A sada 1 responsvel pela deteco da falha 1 e a sada 2 responsvel pela deteco
da falha 2.
1.5
sada 1
a
t 1
i
v
a 0.5

o
0
sada 2
-0.5
-1
0 20 160 200
amostras
Figura 27. Sadas da rede RBF treinada por FS para a trajetria de =[

/6 /4] at =[2
/3 /3]
T T
em que ocorre a falha 1 entre as amostras 10 e 160.
1.5
sada 1
a 1
t
i
v
a 0.5

o
0
sada 2
-0.5
-1
0 amostras
200
Figura 28. Sadas da rede RBF treinada por GRR para a trajetria de =[
/6 /4] at =[2
/3 /3]
T T

1.5
sada 1
a 1
t
i
v
a 0.5

o
0
sada 2
-0.5
-1
0 200
amostras
Figura 29. Sadas da rede RBF treinada por LRR para a trajetria de =[
/6 /4] at =[2
/3 /3]
T T
1.5
sada 1
a 1
t
i
v
a 0.5

o
0
sada 2
-0.5
-1
0 200
amostras
Figura 30. Sadas da rede RBF treinada por MAOK para a trajetria de =[
/6 /4] at =[2
/3
T
/3] em que ocorre a falha 1 entre as amostras 10 e 160.

T
O critrio de falhas adotado o seguinte: para ser caracterizada uma falha, a sada da
rede RBF tem que apresentar cinco sinais seguidos maiores que 0,5. Isto no causa uma
perda de sensibilidade significativa na deteco das falhas porque o perodo amostral
baixo. A Figura 31 mostra a deteco e a isolao da falha 1 para as sadas da rede RBF
vistas na Figura 28.
falha 1
operao
s/ falha 1
0 50 100 150 200

amostras
Figura 31. Deteco da falha 1 para as sadas da rede RBF treinada por GRR vistas na Figura
28. A falha 1 real esta representada pela linha tracejada.
A Figura 32 mostra os resduos gerados em outra trajetria, a de =[2/3 /2]T at

=[5/12 0]T em que ocorre a falha 2 entre as amostras 5 e 85. Note que agora o resduo no
mostrado na figura no-normalizado. As sadas da rede RBF, treinada pelo mtodo FS, e a
deteco (aps o critrio de falhas ser aplicado) utilizando tais sadas podem ser vistas
respectivamente nas Figuras 33 e 34. As Figuras 35 e 36 mostram tais sinais para a rede
treinada pelo mtodo GRR, as Figuras 37 e 38 para a rede treinada pelo mtodo LRR e, as
Figuras 39 e 40 para a rede treinada pelo mtodo MAOK.
0.2
0.15
0.1 junta 2
0.05
0
junta 1
-0.05
-0.1
0 20 40 60 80 100
amo stras
Figura 32. Resduos para a trajetria =[2

/3 /2] at =[5
/12 0] , com a falha 2 ocorrendo
T T
entre os amostras 5 e 85. Note que os resduos no so apresentados no-normalizados.
1.2
sada 2
1
0.8
a
t 0.6
i
v
a 0.4

0.2
o
sada 1
0
-0.2
0 20 40 60 80 100
amostras
Figura 33. Sada da rede RBF treinada pelo mtodo FS para a trajetria =[2
/3 /2] at
T
=[5
/12 0] , com a falha 2 ocorrendo entre os amostras 5 e 85.
T
falha 2
operao
s/ falha 2
0 20 40 60 80 100
amostras
Figura 34. Deteco da falha 2 utilizando a rede RBF treinada pelo mtodo FS (linha contnua)
para a trajetria =[2
/3 /2] at =[5
/12 0] . A falha 2 real est representada pela linha
T T
tracejada.
1.2
1
sada 2
0.8
a
t 0.6
i
v
a 0.4

0.2
o
sada 1
0
-0.2
0 20 40 60 80 100
amostras
Figura 35. Sada da rede RBF treinada pelo mtodo GRR para a trajetria =[2
/3 /2] at
T
=[5
T
falha 2
operao
s/ falha 2
0 20 40 60 80 100
amostras
Figura 36. Deteco da falha 2 utilizando a rede RBF treinada pelo mtodo GRR (linha contnua)
para a trajetria =[2
/3 /2] at =[5
/12 0] . A Falha 2 real est representada pela linha
T T
tracejada.
1.2
1
sada 2
0.8
a
t 0.6
i
v
a 0.4

0.2
o
sada 1
0
-0.2
0 20 40 60 80 100
amostras
Figura 37. Sada da rede RBF treinada pelo mtodo LRR para a trajetria =[2
/3 /2] at
T
=[5
T
falha 2
operao
s/ falha 2
0 20 40 60 80 100
amostras
Figura 38. Deteco da falha 2 utilizando a rede RBF treinada pelo mtodo LRR (linha contnua)
/3 /2] at =[5
para a trajetria =[2 /12 0] . A Falha 2 real est representada pela linha
T T
tracejada.
sada 2
1
0.8
a
t 0.6
i
v
a 0.4

0.2
o
0
sada 1
-0.2
0 20 40 60 80 100
amostras
Figura 39. Sada da rede RBF treinada pelo mtodo MAOK para a trajetria =[2
/3 /2] at
T
=[5
T
falha 2
operao
s/ falha 2
0 20 40 60 80 100
amostras
Figura 40. Deteco da falha 2 utilizando a rede RBF treinada pelo mtodo MAOK (linha
contnua) para a trajetria =[2
/3 /2] at =[5
/12 0] . A Falha 2 real est representada pela
T T
linha tracejada.
Nos testes realizados com as 51 trajetrias formadas pelas 17 trajetrias do Apndice

A9, os sistemas de DDF com as redes RBF treinadas pelos mtodos GRR, LRR e MAOK
conseguiram detectar e isolar todas as falhas. Nenhum alarme falso foi detectado. Para o
sistema de DDF com a rede RBF treinada pelos mtodo FS todas as falhas foram detectadas
e isoladas. Um nico pico de alarme falso ocorreu quando a trajetria 3 (apndice A9) foi
apresentada em operao normal. Este resultado pode ser visto nas Figuras 41, 42, 43, 44, 45
e 46. Note que os sistemas que utilizam os mtodos GRR, LRR e MAOK no apresentam o
alarme falso.
0.02
junta 1
0.01
-0.01
-0.02
-0.03
junta 2
-0.04
-0.05
0 20 40 60 80 100
amostras
Figura 41. Resduos para a trajetria livre de falhas de =[5

/12 /2] at =[
/6 /8] .
T T
2.5
1.5
a
t 1
i sada 2
v
a 0.5

0
o
-0.5 sada 1
-1
0 20 40 60 80 100
amostras
Figura 42. Sada da rede RBF treinada pelo mtodo FS para a trajetria livre de falhas de
=[5
/12 /2] at =[
/6 /8] .
T T
falha 2
operao
s/ falha 2
0 20 40 60 80 100
amostras
Figura 43. Deteco da falha 2 utilizando a rede RBF treinada pelo mtodo FS (linha contnua)
/12 /2] at =[
para a trajetria livre de falhas de =[5 /6 /8] . A Falha 2 real est
T T
representada pela linha tracejada.

0.8
0.6
0.4
a sada 2
t 0.2
i
v 0
a
-0.2

o -0.4
sada 1
-0.6
-0.8
0 20 40 60 80 100
amostras
Figura 44. Sada da rede RBF treinada pelo mtodo GRR para a trajetria =[5
/12 /2] at
T
=[
/6 /8] .
T
0.8
sada 2
0.6
0.4
a
t 0.2
i
v 0
a
-0.2

o -0.4
-0.6 sada 1
-0.8
0 20 40 60 80 100
amostras
Figura 45. Sada da rede RBF treinada pelo mtodo LRR para a trajetria =[5
/12 /2] at
T
=[
/6 /8] .
T
0.8
sada 1
0.6
0.4
a
t 0.2
i
v 0
a
-0.2

o -0.4 sada 2
-0.6
-0.8
0 20 40 60 80 100
amost ras
Figura 46. Sada da rede RBF treinada pelo mtodo MAOK para a trajetria =[5
/12 /2] at
T
=[
/6 /8] .
T
5.2. MANIPULADOR PUMA 560
O segundo manipulador a ser estudado neste trabalho o Puma 560, um rob comum
tanto em ambientes industriais, como em ambientes acadmicos [CORKE, 1994]. Este
manipulador foi implementado em MATLAB atravs do toolbox Robotics, desenvolvido por
CORKE (1996). Informaes sobre os parmetros de tal sistema podem ser encontrados em
[CORKE & ARMSTRONG-HLOUVRY, 1994]. O perodo amostral utilizado de 0,056 s.
O rob, neste trabalho, utiliza o mtodo do torque calculado para o controle de
posicionamento das juntas e tem seis graus de liberdade: trs para posicionamento e trs
para orientao.
5.2.1. Gerao dos Resduos
Para o treinamento do MLP, utiliza-se 150 trajetrias com 54 amostras cada, em que
se considera o rob livre de falhas. Portanto, um total de 8100 padres so usados no
treinamento do MLP. As 20 primeiras trajetrias utilizadas no treinamento so escolhidas
para que grande parte do espao de posies das juntas seja coberto, e as trajetrias restantes
so escolhidas aleatoriamente. A normalizao feita do mesmo modo que para o
manipulador com 2 graus de liberdade. Aqui, os efeitos dos termos de frico no foram
considerados. Os parmetros do treinamento por retropropagao do erro para o MLP
podem ser vistos na Tabela 5. O vetor de entradas formado pelas posies, velocidades
angulares e torques das 3 primeiras juntas (posicionamento) em cada instante amostral t e o
vetor de sadas formado pelas velocidades angulares das 3 primeiras juntas no instante
amostral t+t.
Tabela 5. Parmetros do treinamento por retropropagao do erro no MLP para o manipulador

Puma 560.

Momentum 0,90
Para o treinamento do MLP, um total de 8.000 pocas foram utilizadas. O erro mdio
quadrtico do MLP depois deste perodo foi de 1,5795 x 10-5 (para o conjunto de
treinamento). Neste trabalho, o MLP reproduz a dinmica do sistema em operao normal
com um resduo baixo mesmo para trajetrias no-treinadas, comprovando a generalizao
do procedimento. A Figura 47 mostra os sinais resduos (das velocidades das juntas) para
uma trajetria no-treinada livre de falhas.
0.8
0.7
junta 1
0.6
0.5 junta 2
0.4
0.3
junta 3
0.2
0.1
0
0 10 20 30 40 50 60
amostras
Figura 47. Velocidades reais normalizadas (linha tracejada) e sadas do MLP (linha contnua)
para a trajetria livre de falhas de =[0 0 0 0 0 0] at =[

/3 -5
/6 /6 /2 5
/12] .
T T
Trs tipos de falhas so considerados na simulao do sistema de DDF para o

manipulador Puma 560. Na primeira (falha 1), o sinal de controle no transmitido junta
1. Na segunda (falha 2), o mesmo ocorre para a junta 2 e na terceira (falha 3), o mesmo
ocorre para a junta 3. Estas falhas podem ter como causa, por exemplo, rompimentos dos
fios que ligam o sistema de controle aos atuadores, falhas nas sadas do sistema de controle,
falhas nos atuadores das juntas (por exemplo, o atuador deixa de funcionar) e falhas no
sistema de engrenagens que liga o atuador junta. Note que como o torque no medido
(supe-se que o torque aplicado pelo sinal de controle seja transmitido s juntas), o sistema
de controle continua aplicando o sinal de controle. Como existem inrcia e foras
gravitacionais no sistema, se no forem tomadas atitudes rpidas (por exemplo, freiar os
elos), srios danos podem ser causados ao manipulador, carga do efetuador e ao ambiente
de trabalho. A Figura 48 mostra os sinais de resduo resultantes de 4 simulaes de uma
mesma trajetria com 12 amostras. Na primeira simulao (amostras 1 a 12), ocorre a partir
da amostra 3 a falha 1, na segunda simulao (amostras 13 a 24) ocorre a partir da amostra
16 a falha 2, na terceira simulao (amostras 25 a 36) ocorre a partir da amostra 28 a falha 3
e, na ltima simulao, nenhuma falha ocorre. Foi usado um nmero pequeno de amostras
(12) em cada simulao, pois quando ocorrem falhas deste tipo, se uma atitude no for
tomada rapidamente, o sistema pode atingir suas restries (por exemplo, bater no cho).
0.2
0.1
-0.1
-0.2
-0.3
-0.4 junta 1
junta 2
-0.5 junta 3
0 10 20 30 40
amo st ras
Figura 48. Sinais de resduo para quatro simulaes de uma mesma trajetria com 12 amostras
de =[0 0 0 0 0 0] at =[
/3 -5
/6 /6 /2 5
/12] . Em cada uma das 3 primeiras simulaes,
T T
uma falha diferente ocorre e, na ltima, nenhuma falha ocorre.

5.2.2. Anlise dos Resduos
A rede RBF para o manipulador Puma 560 tem 6 entradas (resduos e velocidades) e
duas sadas (3 falhas). Para o treinamento da rede RBF, 15 trajetrias com 12 amostras cada
so utilizadas. Estas trajetrias so apresentadas rede RBF quatro vezes: uma em operao
normal, uma em que ocorre a falha 1, uma em que ocorre a falha 2 e uma em que ocorre a
falha 3, perfazendo um total de 720 padres. Neste trabalho, o tamanho do campo receptivo,
definido pela diagonal de R, dado por [0,022 0,027 0,027 0,8 0,8 0,8]T, no qual os trs
primeiros valores atuam sobre os resduos e os trs ltimos atuam sobre as velocidades.
Para comparao de resultados, os quatro mtodos descritos na seo 2.2 foram
utilizados. O mtodo FS utilizou o OLS para otimizar o algoritmo e o GCV como critrio de
parada. Durante o treinamento, foram selecionadas 251 unidades radiais.
Para o mtodo GRR, utiliza-se como critrio de convergncia uma mudana relativa
de 1/1000, ou seja, o mtodo deve parar a seleo do parmetro de regularizao global ( $ )

quando a mudana no valor do erro GCV entre duas iteraes for menor que 1/1000. O valor
selecionado foi $ = 0,5123.

Para o LRR, o critrio de convergncia utilizado foi o mesmo do GRR descrito acima.
Foram podadas 425 unidades radiais da rede (estas unidades tiveram $ j = ). Assim, a
rede utiliza somente 295 unidades radiais. Notou-se que para este treinamento, o LRR
apresentou problemas de mau condicionamento.
No mtodo MAOK, os parmetros utilizados foram: =t-1, =0,020 t-1 e tmax=1000
(nmero de vezes que cada padro apresentado). Usando tais parmetros, 255 unidades
radiais foram selecionadas. A Tabela 6 mostra o erro mdio quadrtico das trs sadas da
rede RBF (falha 1, falha 2 e falha 3) para o conjunto de treinamento.
Tabela 6. Erro mdio quadrtico da rede RBF para o conjunto de treinamento.
sada 1 - rede RBF sada 2 - rede RBF sada 3 - rede RBF

(Falha 1) (Falha 2) (Falha 3)
FS 0.0040 0.0017 0.0017
GRR 0.0155 0.0075 0.0119
LRR 0.0061 0.0022 0.0030
MAOK 0.0096 0.0042 0.0092
Para teste de validao dos sistemas de DDF resultantes, 30 trajetrias no-treinadas,

com 15 amostras cada so apresentadas quatro vezes ao sistema (uma para operao normal
e uma para cada uma das trs falhas), perfazendo um total de 120 trajetrias. A Tabela 7
mostra o erro mdio quadrtico das trs sadas da rede RBF para o conjunto de teste. Os
valores altos do erro para o LRR so devidos a problemas de mau condicionamento.
Tabela 7. Erro mdio quadrtico da rede RBF para o conjunto de teste.
sada 1 - rede RBF sada 2 - rede RBF sada 3 - rede RBF

(Falha 1) (Falha 2) (Falha 3)
FS 0.0712 0.0431 0.0347
GRR 0.0419 0.0371 0.0271
LRR 0.7930 241.7819 2.6576
MAOK 0.0462 0.0400 0.0293
As Figuras 49, 50, 51 e 52 mostram as sadas das rede RBF treinadas pelos quatro
mtodos para as quatro simulaes da trajetria no-treinada cujos sinais de resduos so
mostradas na Figura 48. A sada 1 da rede RBF responsvel pela deteco da falha 1, a
sada 2 responsvel pela deteco da falha 2 e a sada 3 responsvel pela deteco da
falha 3.
1.2
1
sada 1 sada 2 sada 3
0.8
a
0.6
t
i 0.4
v
0.2
a
0

-0.2
o
-0.4
-0.6
-0.8
0 5 10 15 20 25 30 35 40 45 50
am ostras
Figura 49. Sadas da rede RBF treinada por FS para os sinais de resduo mostrados na Figura
48.
1.2

1
a 0.8
t
i
0.6
v
a
0.4

o 0.2
-0.2
0 5 10 15 20 25 30 35 40 45 50
amostras
Figura 50. Sadas da rede RBF treinada por GRR para os sinais de resduo mostrados na Figura
48.
15
sada 3
10
a
t
i 5
v sada 1 sada 2
a
0

o
-5
-10
0 5 10 15 20 25 30 35 40 45 50
amostras
Figura 51. Sadas da rede RBF treinada por LRR para os sinais de resduo mostrados na Figura
48.
1.2

1
a 0.8
t
i
0.6
v
a
0.4

o 0.2
-0.2
0 5 10 15 20 25 30 35 40 45 50
amostras
Figura 52. Sadas da rede RBF treinada por MAOK para os sinais de resduo mostrados na
Figura 48.
O critrio de falhas adotado o seguinte: para ser caracterizada uma falha, a sada da
rede RBF tem que apresentar trs sinais seguidos maiores que 0,5. Isto no causa uma perda
de sensibilidade significativa na deteco das falhas porque o perodo amostral baixo. A
Tabela 8 mostra os resultados da DDF aps a aplicao do critrio de deteco de falhas nos
padres do conjunto de teste. Salienta-se que estes resultados poderiam ser melhores se o
nmero de padres utilizados no conjunto de treinamento fosse maior.
Tabela 8. Resultados dos testes para o sistema de DDF aplicado ao Puma 560.
nmero de alarmes nmero de falhas

falsos no-detectadas
FS 8 2
GRR 1 0
LRR 7 1
MAOK 4 0
Captulo 6
Concluses
O sistema de DDF via RNA apresenta bons resultados quando aplicado a um rob
manipulador planar com dois elos rgidos e a um manipulador Puma560. Salienta-se que o
grande atrativo que, de acordo com os testes, o sistema de DDF consegue detectar e isolar
as falhas que ocorrem em trajetrias no-vistas e em instantes diferentes daqueles dos
padres treinados. Deve-se observar tambm que os resultados apresentados para ambos os
casos (principalmente para o Puma 560) podiam ser melhores se o nmero de padres
utilizados nos treinamentos das redes RBF fosse maior.
O MLP reproduz o comportamento dinmico do sistema sem falhas produzindo
geralmente um resduo baixo. A qualidade do treinamento do MLP muito importante para
os futuros resultados do sistema de DDF, quando padres no-treinados devero ser
generalizados. Um erro do mapeamento grande resulta em resduos altos e,
consequentemente, alarmes falsos e erros de classificao das falhas.
As redes RBF treinadas pelos quatro mtodos apresentaram comportamentos
diferentes quando aplicadas ao problema de DDF. Neste trabalho, as redes RBF treinadas
pelo mtodo FS apresentaram os menores erros mdios quadrticos para os conjuntos de
treinamento. Isso ocorre porque as redes RBF treinadas por FS apresentam os menores bias
nos erros quadrticos mdios. Contudo, as redes RBF treinadas pelos outros mtodos
apresentaram erros menores nos conjuntos de testes, indicando que as varincias dos erros
foram menores. Tal fato indica que as redes RBF treinadas por FS foram mais sensveis s
peculiaridades (tal qual rudos e escolha dos padres) dos conjuntos de treinamento. Isso
ocorre porque os centros das unidades radiais das redes treinadas via FS so escolhidas a
partir das posies dos padres de treinamento.
Para as redes treinadas por GRR e LRR, apesar de os centros das unidades radiais
serem escolhidos a partir dos padres de treinamento, os pesos grandes foram penalizados,
produzindo um efeito de suavidade na funo de sada das redes (pesos grandes geralmente
so requeridos para produzir funes de sada que variam bruscamente). Isto ocorre porque
o bias introduzido nos mtodos GRR e LRR favorece a soluo envolvendo pesos pequenos.
O LRR deveria adaptar a suavidade s condies locais (atravs de parmetros de
regularizao individuais) do espao de entradas da rede RBF. O mtodo poda algumas
conexes da rede atravs de um grande aumento nos valores dos parmetros de
regularizao das unidades radiais associadas a estas conexes, o que explica os melhores
resultados de generalizao do GRR. Isto deixa o mtodo de certa forma parecido com o FS.
Todavia, o uso de parmetros de regularizao suaviza a funo de sada da rede. Note que o
mtodo FS selecionou mais unidades radiais que o mtodo LRR, o que deveria tornar a
funo de sada da rede mais suave. Isto no acontece, no entanto, porque o mtodo GRR
faz uso dos parmetros de regularizao, fazendo com que os pesos utilizados sejam
menores.
Apesar de a rede RBF treinada pelo mtodo GRR apresentar melhores resultados para
o Puma 560, as redes RBF treinadas por MAOK apresentaram os melhores resultados para
os conjuntos de teste, indicando uma melhor generalizao. Isto ocorre porque,
diferentemente dos outros mtodos, MAOK fixa os centros em posies diferentes daquelas
dos padres de treinamento. Tais posies, prximas dos centros dos aglomerados de
padres (clusters), so mais interessantes pois indicam um comportamento coletivo (dos
padres do aglomerado) ao invs de comportamentos individuais (dos padres de
treinamento isolados). No caso do Puma 560, a rede treinada por GRR apresentou os
melhores resultados de generalizao porque houve uma grande penalizao nos pesos
grandes, gerando um efeito de suavidade na funo de sada da rede RBF. No entanto, o
resultado da rede RBF treinada por MAOK foi bastante prxima, apesar desta utilizar um
nmero menor de unidades radiais (255 do MAOK contra 720 do GRR). O nmero de
unidades radiais selecionadas indica a complexidade da operao da rede RBF, sendo um
nmero menor de unidades radiais mais interessante (se o nmero de unidades radiais
grande, o esforo computacional para os diversos clculos envolvendo a rede RBF e a
memria requerida so maiores). Assim, o nmero de unidades radiais um bom indicador
da velocidade de operao da rede RBF. Um aspecto negativo do mtodo MAOK a
escolha dos parmetros de treinamento, que influenciam drasticamente o desempenho da
rede RBF resultante.
Salienta-se, tambm, que durante o treinamento, o esforo computacional do MAOK
baixo pois este mtodo no emprega clculos complexos envolvendo matrizes grandes. O
algoritmo que apresenta o esforo computacional maior o LRR (porque precisa calcular
todos os parmetros de regularizao individuais), seguido do GRR. O algoritmo FS
apresenta um esforo computacional relativamente baixo porque faz uso de modelos
reduzidos (com um nmero menor de unidades radiais).
A definio do tamanho do campo receptivo das redes RBF tem um papel importante
na generalizao dos resultados. Como exemplo, na rede RBF treinada pelo mtodo FS, se
um campo receptivo muito grande definido, o mtodo escolhe poucas unidades radiais
conseguindo classificar apenas os padres nos grandes aglomerados e, portanto,
identificando erroneamente os padres isolados. Se o campo receptivo muito pequeno, um
grande nmero de unidades radiais escolhido, resultando em uma sobre-sensibilidade aos
detalhes do conjunto particular de treinamento e, portanto, em uma baixa generalizao.
Neste trabalho, a escolha dos parmetros que definem o tamanho do campo receptivo foram
feitos heuristicamente.
Os resultados podem ser generalizados para um maior nmero de falhas. Entretanto,
falhas cujo sistema apresenta comportamentos semelhantes, independentemente dos graus
de liberdade do rob, so difceis de serem isoladas (apesar de serem detectadas) porque os
padres de resduo devem ocupar as mesmas regies do espao de entradas.
Referncias bibliogrficas
Allen, D. M. (1974). The relationship between variable selection and data augmentation
and a method for prediction , Technometrics, vol. 16, 1, p.125-127.
Bergerman, M. (1996). Dynamics and control of underactuated manipulators, PhD

Dissertation, Carnegie Mellon University, 129p., Pittsburgh, USA.
Bishop, C. M. (1995). Neural networks for pattern recognition, Oxford University Press.
Brown, M. and Harris, C. (1994). Neurofuzzy adaptive modelling and control , Prentice
Hall International.
Calado, J. M. F. and Roberts, P. D. (1997). Fault detection and diagnosis based on fuzzy
qualitative, Proceedings of the IFAC Symposium on Fault Detection, Supervision
and Safety for Technical Processes, Kingston Upon Hull, U. K., vol.1, p.534-539.
Caminhas, W. M. (1997). Estratgias de deteco e diagnstico de falhas em sistemas

dinmicos, Tese (Doutorado), Universidade Estadual de Campinas, 161p., Campinas.
Caminhas, W. M., Tavares, H. M. F. e Gomide, F. (1996). "Rede lgica neurofuzzy:

aplicao em diagnstico de falhas em sistemas dinmicos", Anais do XI Congresso
Brasileiro de Automtica, So Paulo, Brasil, p.459-464.
Charniak, E. and McDermott, D. V. (1985). Introduction to artificial intelligence,

Addison-Wesley Publishing Company Inc.
Chen, S., Cowan, C. F. N. and Grant, P. M. (1991). Orthogonal least squares learning
algorithm for radial basis function networks, IEEE Transactions on Neural
Networks, vol. 2, 2, p.302-309.
Chow, E. Y. and Willsky, A. S. (1984). Analytical redundancy and design of robust failure
detection systems, IEEE Transactions on Automatic Control, 29, p.603-614.
Corke, P. I. (1994). The Unimation Puma servo system, Technical Report MTN-226,
CSIRO Division of Manufacturing Technology, Australia.
Corke, P. I. (1996). A robotics toolbox for MATLAB, IEEE Transactions on Robotics &
Automation Magazine, vol. 3, n. 1, p.24-32.
Corke, P. I., and Armstrong-Hlouvry, B. S. (1994). A search for consensus among model
parameters reported for Puma 560 robot, In the Proceedings of the IEEE Conference
on Robotics and Automation, San Diego, USA.
Craig, J. J. (1988). Introduction to robotics: Mechanics and control, Addison-Wesley.
Cybenko, G. (1989). Approximation by superpositions of a sigmoidal function,

Mathematics of Control, Signals, and Systems, 2, p.303-314.
Efrati, H. F. T. (1997). Tracking of mechanical systems using artificial neural networks,

Revista Brasileira de Cincias Mecnicas, vol. 19, n. 2, p.217-227.
Evsukoff, A., Montmain, J. and Gentil, S. (1997). Dynamic model and causal knowledge-
based fault detection and isolation, Proceedings of the IFAC Symposium on Fault
Detection, Supervision and Safety for Technical Processes, Kingston Upon Hull, U.
K., vol. 2, p.699-704.
Frank, P. M. (1987). Fault diagnosis in dynamic systems via state estimation - A survey,
In Tsafestas, S. M. Singh and G. Schmidt (Eds.), System Fault Diagnostics,
Reliability and Related Knowledge-Based Approaches, vol. 1, p.35-98.
Frank, P. M. (1990). "Fault Diagnosis in Dynamic Systems Using Analytical and

Knowledge-based Redundancy - A Survey and Some New Results". Automatica, vol.
26, 3, p.459-474.
Fssel, D., Ball, P. and Isermann, R. (1997). Closed-loop fault diagnosis based on a
nolinear process model and automatic fuzzy rule generation, Proceedings of the
IFAC Symposium on Fault Detection, Supervision and Safety for Technical
Processes, Kingston Upon Hull, U. K., vol.1, p.359-364.
Geman, S., Bienenstock, E. and Doursat, R. (1992). Neural networks and the bias/variance
dilemma, Neural Computation, vol. 4, 1, p.1-58.
Gertler, J. (1988). A survey of model-based failure detection and isolation in complex

plants, IEEE Control Systems Magazine, vol. 8, n. 6, p.3-11.
Gertler, J. (1991). Analytical redundancy methods in fault detection and isolation - Survey
and synthesis, Proceedings of the IFAC Symposium on Fault Detection, Supervision
and Safety for Technical Processes, Baden Baden, Germany, vol. 1, p.9-23.
Gertler, J. (1997). A cautious look at robustness in residual generation, Proceedings of the

IFAC Symposium on Fault Detection, Supervision and Safety for Technical
Processes, Kingston Upon Hull, U. K., vol.1, p.133-139.
Golub, G. H., Heath, M. and Wahba, G. (1979). Generalised cross-validation as a method

for choosing a good ridge parameter, Technometrics, vol. 21, 2, p.215-223.
Haykin, S. S. (1994). Neural networks: a comprehensive foundation, New York:

Macmillan.
Hertz, J., Krogh, A. and Palmer, R. G. (1991). Introduction to the theory of neural
computation, Addison-Wesley Publishing Company.
Hoerl, A. E. and R. W. Kennard (1970). Ridge regression: biased estimation for

nonorthogonal problems, Technometrics, vol. 12, 3, p.55-67.
Horn, R. A. and Johnson, C. R. (1985). Matrix analysis, Cambridge University Press.
Horak, D. T. (1988). Failure detection in dynamic systems with modeling errors, AIAA
Journal of Guidance, Control and Dynamics, vo. 11, 6, p.508-516.
Isermann, R. (1984). Process fault detection based on modeling and estimation methods - A
survey, Automatica, vol. 20, 4, p.387-404.
Kohonen, T. (1995). Self-organizing maps, Springer-Verlag, Berlin.
Kppen-Seliger, B. and Frank, P. M. (1996). "Neural Networks in Model-Based Fault

Diagnosis", Proceedings of the 13th IFAC World Congress, San Francisco, USA,
p.67-72.
Korbicz, J. (1997). Neural networks and their application in fault detection and diagnosis,
Proceedings of the IFAC Symposium on Fault Detection, Supervision and Safety for
Technical Processes, Kingston Upon Hull, U. K., vol.1, p.377-382.
Leonard , J. A. and Kramer, M. A. (1991). Radial basis function networks for classifying
process faults, IEEE Control Systems, vol. 11, 3, p.31-38.
Miller, A. J. (1990). Subset Selection in Regression, Chapman and Hall.

Looney, C. G. (1997). Pattern recognition using neural networks, Oxford University

Press.
Mangoubi, R., Appleby, B. D. and Farrell, J. (1992). Robust estimation in fault detection,
Proceedings of the 31st IEEE Conference on Decision and Control, p.3943-3948.
Moody, J. and Darken, C. (1989). Fast learning in networks of locally-tuned processing

units, Neural Computation, 1, p.289-303.
Naughton, J. M., Chen, Y. C. and Jiang, J. (1996). A neural network aplication to fault
diagnosis for robotic manipulator, Proceedings of IEEE International Conference on
Control Applications, vol.1, p.988-1003.
Nelles, O. and Isermann, R. (1995). A comparison between RBF networks and classical
methods for identification of nonlinear dynamic systems, Proceedings of the IFAC
Congress on Adaptive System in Control and Sygnal Processing, Budapest, Hungary,
p.233-238.
Ojala, T. and Vuorimaa, P. (1995). Modified Kohonens learning laws for RBF networks,
Proceedings of the International Conference on Artificial Neural Nets and Genetic
Algorithms, Ales, France, p.356-359.
Orr, M. J. L. (1995 a). Regularization in the selection of radial basis function centers,
Neural Computation, 7, p.606-623.
Orr, M. J. L. (1995 b). Local smoothing of radial basis function networks, Proceedings of
the 1995 International Symposium on Neural Networks, Hsinchu, Taiwan.
Orr, M. J. L. (1996 a). Introduction to radial basis function networks, Technical Report,
Center for Cognitive Science, Edinburgh University, Scotland, U. K.
Orr, M. J. L. (1996 b). MATLAB routines for subset selection and ridge regression in
linear neural networks, Technical Report, Center for Cognitive Science, Edinburgh
University, Scotland, U. K.
Ostojic, M. (1996). Recursive control of robotic motion, International Journal of Control,

vol. 64, n. 5, p.775-787.
Patton, R. J. (1994). Robust model-based fault diagnosis: the state of the art, Proceedings
of the IFAC Symposium on Fault Detection, Supervision and Safety for Technical
Processes, Helsinki, Finland, vol. 1, p.1-24.
Patton, R. J.(1997). Fault-tolerant control: The 1997 situation, Proceedings of the IFAC
Symposium on Fault Detection, Supervision and Safety for Technical Processes,
Kingston Upon Hull, U. K., vol.2, p.1033-1055.
Patton, R. J., Frank, P. M. e Clark, R. N. (1989). Fault diagnosis in dynamic systems -

theory and application, Prentice Hall International.
Press, W. H., Teukolsky, S. A., Vetterling, W. T. and Flannery, B. P. (1992). Numerical

recipes in C, Cambridge University Press, Cambridge, U. K., 2nd ed.
Rawlings, J. O. (1988). Applied regression analysis - a research tool, Wadsworth &

Brooks / Cole Advanced Books & Software.
Sadrnia, M.A, Chen, J. and Patton, R. J. (1997 a). Robust fault detection observer design
using H/ techniques for uncertain flight control systems, Proceedings of the 2nd
IFAC Symposium on Robust Control Design, Budapest, Hungary, p.531-536.
Sadrnia, M.A, Chen, J. and Patton, R. J. (1997 b). Robust H/ observer-based residual
generation for fault diagnosis, Proceedings of the IFAC Symposium on Fault
Detection, Supervision and Safety for Technical Processes, Kingston Upon Hull, U.
K., vol.1, p.147-153.
Schneider, H. and Frank, P. M. (1996). Observer-based supervision and fault-detection in

robots using nonlinear and fuzzy logic residual evaluation, IEEE Transactions on
Control Systems Technology, vol. 4, 3, p.274-282.
Sciavicco, L. and Siciliano, B. (1996). Modeling and control of robot manipulators,

McGraw-Hill.
Stengel, R. F. (1991). Intelligent failure-tolerant control, IEEE Control Systems, vol.11, 4,

p.14-23.
Tikhonov, A. N. and Arsenin, V. Y. (1977). Solutions of ill-posed problems, Winston,

Washington.
Vemuri, A. T. and Polycarpou, M. M. (1997). Neural-network-based robust fault diagnosis

in robotic systems, IEEE Transaction on Neural Networks, vol. 8, 6, p.1410-1420.
Visinsky, M. L., Cavallaro, J. R. and Walker, I. D. (1994). Robotic fault detection and fault
tolerance: A survey, Reliability Engineering and System Safety, 46, p.139-158.
Visinsky, M. L., Cavallaro, J. R. and Walker, I. D. (1995). A dynamic fault tolerance

framework for remote robots. IEEE Transactions on Robotics and Automation, vol.
11, 4, p.477-490.
Warwick, K. and Craddock, R. (1996). An introduction to radial basis function for system
identification: A comparison with other neural networks, Conference on Decision
and Control, Kobe, Japan, p.464-469.
Watanabe, K. and Himmelblau, D. M. (1982). Instrument fault detection in systems with

uncertainties, International Journal of Systems Science, 13, p.137-158.
Willsky, A. S. (1976). A survey of design methods for failure detection in dynamic

systems, Automatica, vol. 12, 6, p.601-611.
Apndice A1
Dados utilizados no exemplo 1
Tabela A1.1. Treinamento do MLP por retropropagao do erro para o exemplo 1.

Momentum 0,1
Tabela A1.2. Treinamento da rede RBF para o exemplo 1.

Funo de ativao utilizada nas unidades radiais Gaussiana
Mtodo utilizado para treinamento global ridge regression
R (define o tamanho do campo receptivo) 5 0
0 5

Parmetro de regularizao () selecionado 1,21 x 10-5
Apndice A2
A matriz de pesos tima para a rede RBF
Para o clculo da matriz de pesos tima, a funo de custo ser minimizada. Como as
anlises para os diferentes mtodos so similares, ser considerada a funo de custo mais
complexa: a do mtodo LRR. No entanto, o resultado pode ser generalizado para o GRR
fazendo j = para j = 1,...,m. Para o FS e o MAOK basta fazer j = 0 para j = 1,...,m. Sabe-
se que a funo de custo para o mtodo LRR dada por (equao 37)
np
( ) +
m
Ck = (n) $ (n)
2
j kj2
n =1 j =1
na qual k = 1,...,q. O que se deseja achar o extremo da funo. Assim, primeiro a funo de
custo ser diferenciada e em seguida ser igualada a zero. Por simplicidade, ser
considerada uma nica sada para a rede RBF (q=1). Diferenciando a funo de custo, tem-
se para a unidade radial j
C p n
$ (n)
= 2 ($ (n) (n)) + 2 j j .
j n =1 j
Como o modelo linear, da Eq. (25)
$ (n)
= h j (n) .
j
Substituindo na equao anterior e igualando a zero
n
C p
= 2 ($ (n) (n)) h j (n) + 2 j $ j = 0
j n =1
np np
2 $ (n) h j (n) 2 (n) h j (n) + 2 j $ j = 0
n =1 n =1
np np
$ (n) h j (n) + j $ j = (n) h j (n) .

n =1 n =1
Existem m destas equaes (j = 1,...,m), tal que cada uma representa uma limitao na
soluo. Como existem o nmero exato de restries e de equaes desconhecidas, deve
existir uma nica soluo. A soluo nica pode ser encontrada atravs de lgebra linear.
Usando a notao vetorial na equao anterior, tem-se para a unidade radial j
h Tj $ + j $ j = h Tj
[ ( )] [ ( )]
T
h j = h j (1) h j (2) K h j n p
T
na qual , $ = $ (1) $ (2) K $ n p e,
[ ( )]
T
= (1) ( 2) K n p . Considerando a equao acima para todas as unidades
radiais, ou seja, j = 1,...,m, tem-se
h 1T $ 1$ 1 h 1T
T T
h 2 $ + 2$ 2 = h 2 .
M M M (A2.1)
T T
h m $ m$ m h m
Fazendo
H = h1 [ h2 K hm , ]
[
$ = $ 1 $ 2 K $ m ]T e,
1 0 K 0
0 2 K 0
=
M M O M

0 0 K m
a Eq. A2.1 fica
H T $ + = H T . (A2.2)
Sabe-se que a sada da rede RBF (Eq. 25)
m
$ (n) = j h j (n) .
j =1
Passando para a notao vetorial
$ (n) = h nT $
h n = [h1 (n) h2 (n) K hm (n)] e

T
na qual:
[ ] [ ]
T
H = h1 h 2 K h m = h1 h2 K hnp .
Para todo o conjunto de treinamento, ou seja n = 1, ..., np , tem-se
$ (1) h1T $
$
(2) h 2T $
$ = = = H $ .
M M
T
( )
$ n p h n p $
Substituindo na equao A2.2, tem-se
H T H $ + $ = H T
(H T
)
H + $ = H T
( )
1
$ = H T H + HT
que o vetor de pesos timo para o mtodo LRR. Considerando-se agora q>1 (vrias
neurnios de sada na rede RBF) tem-se a matriz de pesos tima
( )
1
$ = HT H +
HT
na qual: [
$ = $
1 $ 2 K $ q , ]
$ k = $ [ k1 $ k2 K $ km ]T ,
= 1[ 2 K q e, ]
[ (n )]
T
k= k (1) k (2) K k p .
Para o mtodo GRR, basta fazer j = para j = 1,...,m. Portanto, = Im , na qual Im

uma matriz identidade de tamanho m. Assim, a matriz de pesos tima para o mtodo GRR
( )
1
$ = HT H +
HT .
m
Quando a penalizao dos pesos no considerada (como no mtodo FS e no mtodo

MAOK), basta fazer j = 0 para j = 1,...,m. Assim, a matriz de pesos tima dada por
( )
1
$ = HT H
HT .
Apndice A3
A matriz de projeo
Esta matriz (P) projeta vetores de um espao np-dimensional (vetor de sadas

desejadas de cada neurnio de sada) perpendicular para um subspao m-dimensional gerado
pelo modelo dos mnimos quadrticos sem a penalizao dos pesos. Considere que existe
apenas um neurnio de sada (q=1) e que no existe penalizao (como nos mtodos FS e
MAOK). O conjunto de vetores de sadas desejadas est em um espao np-dimensional (np
o nmero de padres de treinamento). Contudo, o modelo sendo linear e possuindo
somente m graus de liberdade (os m pesos), pode somente atingir pontos em um hiperplano
m-dimensional, que um subspao do espao np-dimensional (se m np). Por exemplo, se
np=3 e m=2 o modelo pode somente atingir pontos posicionados em algum plano fixado e
nunca pode igualar se este est fora de um plano (veja Figura A3.1). O principio dos
mnimos quadrticos implica que o modelo timo aquele com a mnima distncia do vetor
at o plano, ou seja, o vetor (P ).
b3
b1
(I np )
P
b2
Figura A3.1. O modelo gera um plano (com as bases b1 e b2) em um espao tridimensional
(que utiliza a base b3) e no pode igualar . O modelo dos mnimos quadrticos a projeo
de no plano gerado e o vetor de erro dado pelo vetor P .
Sabe-se que a sada da rede RBF (equao 25) dada por

m
$ (n) = j h j (n)
j =1
Passando para a notao vetorial
$ (n) = h nT $
h n = [h1 (n) h2 (n) K hm (n)] e

T
na qual:
[ ] [ ]
T
H = h1 h 2 K h m = h1 h2 K hnp .
Para n = 1, ..., np , tem-se
$ (1) h1T $
$
(2) h 2T $
$ = = = H $ .
M M
T
( )
$ n p h n p $
Sabe-se que o vetor de pesos timo dado por (Apndice A2)
( )
1
$ = H T H + HT .
Portanto
(
$ = H H T H + ) 1
HT .
A matriz de varincia definida como
( )
1
A 1 = H T H + .
Assim:
$ = HA 1H T .
O erro entre a predio realizada pela rede RBF a partir do conjunto de treinamento e
a sada observada dado por
$ = HA 1H T
(
$ = I n p HA 1H T )
$ = P (A3.1)
na qual P a matriz de projeo dada por
(
P = I n p HA 1H T . )
Apndice A4
O critrio generalized cross-validation (GCV)
O critrio de seleo de modelo GCV uma variao do critrio leave-one-out (LOO)

cross-validation. Portanto, primeiro o critrio LOO ser descrito aqui para posterior
descrio do mtodo GCV.
Se os dados disponveis no so escassos, ento o conjunto de medidas pode ser
dividido em duas partes: uma parte para treinamento e outra parte para teste. Deste modo
vrios modelos diferentes, todos treinados sobre o mesmo conjunto de treinamento, podem
ser comparados sobre um mesmo conjunto de teste. Esta a forma bsica do critrio cross-
validation.
O melhor mtodo particionar o conjunto de treinamento original de vrios modos
diferentes e calcular o escore sobre as diferentes parties. Uma variao extrema deste
mtodo dividir os np padres em um conjunto de treinamento de tamanho np-1 e um
conjunto de teste de tamanho 1 e medir o erro quadrtico do padro de teste sobre os np
possveis modos de obter tal partio [ALLEN, 1974]. Este mtodo chamado de leave-one-
out cross-validation. A vantagem que todos os dados podem ser usados para o treinamento
(nenhum dado precisa se separado para ser usado s no conjunto de teste). O atrativo de
LOO que para modelos lineares, tais como a rede RBF utilizada aqui, a predio da
varincia do erro pode ser calculada analiticamente.
Considere que existe apenas um neurnio de sada e que $ ( n) a predio do
modelo para o n-simo padro do conjunto de treinamento depois de ter sido treinado por
outros np-1 padres. A predio da varincia do erro para o critrio LOO dada por
np
( (n) $ (n))
1
$ LOO
2
=
2
. (A4.1)
np n =1
O vetor de pesos timo para o conjunto de treinamento reduzido (isto , sem o n-

simo padro) dado por
(
$ n = H nT H n + )1 H nT n = A 1H nT n
n
na qual as matrizes An e Hn e o vetor n referem-se ao conjunto de treinamento reduzido.

Aplicando-se o vetor de pesos timo calculado sobre o conjunto de treinamento reduzido no
clculo da predio da varincia do erro para o n-simo padro (conjunto de teste), tem-se
(n) $ (n) = (n) $ Tn h n
(n) $ (n) = (n) Tn H n A n1h n (A4.2)
h n = [h1 (n) h2 (n) K hm (n)] e,

T
na qual:
[ ]
T
H = h1 h2 K hnp .
A matriz Hn e o vetor n so obtidos removendo-se as n-simas linhas

respectivamente de H e y. Consequentemente:
H Tn n = H T (n) h n (A4.3)
na qual h nT a linha removida da matriz H e (n) a componente tirada do vetor .
A seguir, a matriz A -1
n ser deduzida. Como no importa a ordem em que os padres
esto na matriz de projeto H, a linha removida ser representada como estando na posio
np. Assim
H n
H = T.
hn
Da equao da matriz de varincia (Apndice A3), tem-se
A = HTH
H n
[
A = H Tn ]
hn T
hn
A = A n + h n h nT
A n = A h n h nT (A4.4)
que valida sem ou com penalizao.

A seguir, ser utilizado um lema para inverso de matrizes [HORN & JONHSON,
1985]:
Se a inversa de uma dada matriz conhecida, e deseja-se saber como a inversa varia
quando da adio de uma matriz de posto pequeno, existe uma frmula simples que, se a
forma de ajuste da matriz suficientemente simples, pode-se calcular a nova inversa de
modo simples. Suponha uma matriz no-singular A m x m, cuja inversa A-1 conhecida
B = A + XRY
na qual X uma matriz n x r, Y uma matriz r x n e R uma matriz no-singular r x r. Se B

no-singular, ento
B 1 = A 1 A 1 X (R 1 + YA 1 X) YA 1 .
1
Se r muito menor que n, ento a matriz R e o termo entre parntesis podem ser
muito mais fceis de se inverter do que a matriz B.
Aplicando o lema acima na Eq. (A4.4) com X = h n , Y= h nT e R=1, tem-se
1 1 A 1 h n h nT A 1
An =A + . (A4.5)
1 h nT A 1 h n
Desta equao deduz-se que
1 A 1 h n
A n hn = .
1 h nT A 1 h n
Substituindo esta expresso e a transposta da Eq. (A4.3) na Eq. (A4.2), tem-se
(n) T HA 1h n
(n) $ (n) = .
1 h nT A 1 h n
O numerador desta relao a n-sima componente do vetor P e o denominador a

n-sima componente da diagonal principal de P, na qual P a matriz de projeo (Apndice
A3). Portanto, o vetor das np predies das varincias dos erros dado por
(1) $ (1)

(2) (2)
$
= diag (P ) 1 P .
M ( )

( ) ( )
n p $ n p

A matriz diag (P) tem o mesmo tamanho e a mesma diagonal principal de P, mas os
componentes fora da diagonal principal so iguais a zero. Finalmente, da equao acima e
da Eq. (A4.1), tem-se a predio da varincia do erro (ou erro LOO)
P (diag (P )) P .
1 T 2
$ LOO
2
=
np
No entanto, a matriz diag (P) torna a equao um tanto complicada de se manusear

matematicamente. Da equao do LOO surge o critrio GCV [GOLUB et al., 1979], que
mais conveniente matematicamente. A equao do critrio GCV conseguida substituindo-
( )
se a matriz diag (P) por tr ( P ) / n p I n p , na qual tr (P) denota o trao da matriz de projeo
(o trao de uma matriz quadrada a soma dos elementos da diagonal principal) e a matriz de
identidade tem posto np. Assim, a predio da varincia do erro GCV(ou erro GCV) fica:
n p TP2
$ GCV
2
= .
(tr (P))2
Apndice A5
O valor timo para o parmetro de regularizao global
Como foi visto no Apndice A4, o erro GCV dado por
n p TP2
$ GCV
2
= .
(tr (P))2
Para se achar o mnimo deste erro como uma funo do parmetro de regularizao
ser preciso diferenciar a equao em relao a e, ento, igualar o resultado a zero. Para
isto, a matriz de projeo (Apndice A3) precisa ser diferenciada. Para tal, a matriz de
varincia (Eq. 34) ser diferenciada. Assim, assuma que a matriz H tenha a seguinte
decomposio singular [HORN & JONHSON, 1985]
H = U V T
na qual U e V so ortogonais e
1 0 L 0

0 2 L 0
M M O M

= 0 0 L m
0 0 L 0

M M O M
L 0
0 0
{ } { }
m m
na qual j so os valores singulares de H e j so os autovalores de HT H.
j =1 j =1
Assumindo que H tenha mais linhas do que colunas (np > m), apesar que o mesmo resultado
pode ser obtido para o caso oposto, segue que
H TH = V T V T .
Substituindo na equao da matriz de varincia, tem-se
(
A 1 = H T H + ) 1
(
A -1 = V T V T + I m)1
A -1 = (V T V T + VV T )
1
A -1 = (V ( T + I m )V T ) .
1
Como V ortogonal, ento V-1 = VT e (VT)-1. Assim
(
A -1 = V T + I m )1 V T . (A5.1)
Como a matriz entre parntesis diagonal, a inversa fcil de se achar
1
+ 0 L 0

1
0 1
0
( T
+ Im ) 1
= + 2
L
.
M M O M
1
0 0 L
+ m
Esta inversa a nica parte da equao (A5.1) que depende de . Derivando a inversa
acima, tem-se
1
0 L 0
( + 1 )
2

1

(
T + Im ) 1
=
0
( + 2 ) 2
L 0

M M O M
1
0 0 L
( + m )2

( )1 = ( T + Im )1
2
T + Im

(
T + Im )1 = ( T + Im )2 .
Assim, a derivada em relao a da matriz de varincia fica
A 1

(
= V T + Im )2 V T
A 1

(
= V T + Im )1 ( T + I m )1 V T
A 1

(
= V T + Im )1 V T V ( T + Im )1 V T
A 1
= A 1A 1

A 1
= A 2 .

A derivada da matriz de projeo em relao a dada por
P
= (
I HA 1H T
n p )
P A 1 T
= H H

P
= HA 2 H T .

Similarmente, pode-se diferenciar as outras componentes da equao do erro GCV
A 1 T
tr( P) = tr H H

(
tr (P ) = tr HA 2 H T )

tr( P) = tr A 2 H T H ( )

(
tr(P) = tr A 2 (A I m ) )

(
tr (P ) = tr A 1 A 2 )
e,
P

(
T P 2 = 2 TP

)

( )
T P 2 = 2 T P HA 2 H T

( ) (
T P 2 = 2 T I n p HA 1H T HA 2 H T )

( ) (
T P 2 = 2 T HA 2 H T HA 1H T HA 2 H T )

( ) (
T P 2 = 2 T HA 2 H T HA 1 (A I m )A 2 H T )

( ) (
T P 2 = 2 T HA 2 H T HA 1 AA 2 H T + HA 1 A 2 H T )

( )
T P 2 = 2 T HA 3 H T .
Como o vetor de pesos timo dado por
$ = A 1H T
ento

( )
T P 2 = 2 $ T A 1 $ .
Utilizando as diferenciaes acima para diferenciar a equao do erro GCV, tem-se

$ GCV
2
2 n p TP2
( )
np
= P
T 2
tr (P )
(tr (P))2 (tr (P))3
$ GCV
2
{ $ ( )} .
2n p
= T
A 1$ tr (P) T P 2 tr A 1 A 2
(tr (P)) 3
Igualando a equao acima a zero pode se encontrar o parmetro de regularizao

timo
(
$ $ T A 1$ tr ( P) = T P 2 tr A 1 $ A 2 . )
Isolando o parmetro de regularizao timo, obtm-se a frmula de reestimao para
o erro GCV
$ =
(
T P 2 tr A -1 $ A -2 ).
$ A tr (P )
T -1 $
Apndice A6
Os valores timos para os parmetros de regularizao
locais
Como est-se interessado na relao de dependncia entre a matriz de projeo e os

parmetros locais, uma frmula para remoo de uma unidade radial ser usada, j que esta
relao aparece de forma clara em sua equao. Assim, primeiro ser deduzida a frmula
que relaciona a matriz de projeo antes e depois de uma unidade radial ser removida.
Considere que da matriz de projeto H removida a coluna j (ou seja, a unidade radial
j removida), resultando em uma nova matriz Hm-1 . Assim
[
H = H m1 hj ]
na qual
h j (1)

h j (2)
hj = .
M

( )
h j n p
Calculando a inversa da matriz de varincia (A-1)
A = H TH +
H Tm1
[ m1
]
0
A = T H m1 h j + T
h j 0 j
A m1 Hm T
1h j

A = T . (A6.1)
h j H m1 j + h Tj h j
A seguir ser utilizado o seguinte lema para inverso de matrizes [HORN &
JONHSON, 1985]:
A inversa de uma matriz particionada
A1 A2
A=
A 3 A 4
pode ser expressa por
A 1

=
A (
1 A 2 A 1
3 A 4
1
) (
A 11 A 2 A 3 A 11 A 2 A 4 )1
(
A A 1A A 1 A A 1
3 1 2 4 )
3 1 (A 4 A 3 A11A 2 )1

assumindo que todas as inversas indicadas existam. Alternativamente, usando a frmula de
ajuste de posto pequeno (ver Apndice A4) e definindo = A 4 A 3 A 11 A 2 , tem-se
A 1 + A 11A 2 1 A 3 A 11 A 11 A 2 1
A 1 = 1 .
1A 3 A 11 1
Aplicando o lema acima na equao (A6.1), tem-se
T
1 A m1 0 1 A m1H m
T
1h j
A m1H m
T
1h j

A = T + . (A6.2)
0 0 + h T P h
j j m1 j
1

1
A matriz de projeo (Apndice A3) dada por
P = I n p H A 1H T .
Aplicando a equao (A6.2), tem-se
Pm1h j h Tj Pm1 (A6.3)

P = Pm1 .
j + h j Pm1h j
T
Pode se ver que na equao acima existe uma relao entre a matriz de projeo e os
parmetros de regularizao. Fazendo j = j + h Tj Pm1 h j , tem-se

Pm1h j h Tj Pm1 (A6.4)

P = Pm1 .
j
O erro GCV dado por (Apndice A4)
n p TP2
$ GCV
2
= .
(tr (P)) 2
A funo do erro GCV um polinmio racional de ordem 2 em j fcil de se analisar

(isto , de achar o mnimo para j 0). Substituindo a Eq. (A6.4) na equao acima
(
n p a 2j 2b j + c )
$ 2
( ) = (A6.5)
( )
GCV j 2
j
na qual
a = y T Pm2 1 ,
b = T Pm2 1h j T Pm1h j ,
( )
2
c = h Tj Pm2 1h j T Pm1h j ,
= tr (Pm1 ) e,
= h Tj Pm2 1h j .
Esta equao mostra como o erro GCV depende de j quando todos os outros
parmetros de regularizao so mantidos constantes. Esta dependncia aparece atravs de
um polinmio racional em j (ou j). Como pode se ver, o polinmio tem um plo em j =
/ , o qual nunca ocorre para valores positivos de j visto que sempre verdade que
h Tj Pm2 1h j
h Tj Pm1h j
( )
.
tr Pm1
O valor mnimo do erro GCV pode ser alcanado diferenciando a Eq. (A6.5) com
respeito a j e igualando a zero a equao diferenciada. Fazendo a diferenciao, tem-se
$ GCV
2
$ GCV
2
j $ GCV
2
= =
j j j j
$ GCV
2
=
( ) 2n (a 2b + c)
2 n p a j b p
2
j j
j
( ) j ( )
2
j
3
$ GCV
2
2n ((b a ) (c b ))
p j
= .
j
( ) j
3
Se b = a esta equao somente alcanar o valor zero se j = (j = ). Como

o interesse em valores de j iguais ou maiores do que zero, ento neste caso j = + . Se
b a , igualando a equao a zero, tem-se
c b
$ j =
b a
ou, ainda
c b
$ j = h Tj Pm1h j .
b a
Este valor timo deve ser sempre maior que zero. Se o valor calculado for negativo,
existem duas alternativas. Primeiro, se
b
>
a
ento o plo (em j = / ) ocorre direita do mnimo global. Quando j vai de - at , a
derivada do erro GCV primeiro decresce at que seja alcanado o mnimo global (em j<0).
Da a derivada cresce at que j atinja o plo e a partir deste ponto decresce at que j
chegue a . Portanto, o erro mnimo para j 0 deve ser em $ j = .
Entretanto, se
b
<
a
ento o plo (em j = / ) ocorre esquerda do mnimo. Quando j vai de - at , a
derivada do erro GCV primeiro cresce at que seja alcanado o plo. Da a derivada
decresce at que j atinja o mnimo global (em j<0) e a partir deste ponto cresce at que j
chegue a . Portanto, o erro mnimo para j 0 deve ser em $ j = 0.
Assim, pode-se resumir para os valores timos do parmetro de regularizao da

unidade radial j na equao (A6.4)
se a = b
c b
se h Tj Pm1h j > e a > b
b a
$ j = c b
0 se h Tj Pm1h j > e a < b
b a
c b c b
h Tj Pm1h j se h Tj Pm1h j
b a b a
Em cada otimizao individual garantida a reduo, ou no mnimo, no aumentar o

erro GCV. Todos os m parmetros so otimizados um aps o outro e, se necessrio,
repetidamente at que o GCV pare de decrescer ou decresa em uma quantidade muito
pequena. Naturalmente, a ordem com que os parmetros so otimizados bem como os
valores iniciais so importantes, podendo o erro atingir um mnimo local. O esforo
computacional deste mtodo alto perto do GRR pois a matriz de projeo muda em cada
otimizao individual e precisa ser recalculada. Algum aumento de eficincia pode se obtido
recalculando somente os valores usados nos cinco coeficientes do polinmio racional, tais
como P e P H.
Apndice A7
O mtodo forward selection
Sabe-se que a soma dos erros quadrticos para o neurnio de sada k dada por
np
( k (n) $ k (n)) .
2
Ck =
n =1
Considerando apenas um neurnio de sada (q=1), passando para a notao vetorial a

equao acima, tem-se
C = ( $ ) ( $ ) .
T
Substituindo a Eq. (A3.1), tem-se
C$ = (P ) P
T
C$ = T P T P
C$ = T P 2 .
Considerando C$ M como a soma dos erros quadrticos antes de a n-sima unidade
radial ser acrescentada e C$ M +1 a soma dos erros quadrticos depois de a n-sima unidade
radial ser acrescentada, tem-se
C$ M = T P M
2

C$ M +1 = T P M
2
+1 .
Quando no existe regularizao (como em FS) as matrizes P so matrizes de

projeo verdadeiras e tambm so idempotentes (isto , P 2 = P). Portanto
C$ M = T P M
C$ M +1 = T P M +1 .
Fazendo a diferena dos dois erros, tem-se
(
C$ M C$ M +1 = T P M P M +1 . ) (A7.1)
A Eq. (A6.3) relaciona as matrizes de projeo antes e depois de uma unidade radial
ser retirada. Pode-se utilizar a mesma equao para relacionar as matrizes de projeo antes
e depois que a n-sima unidade radial acrescentada. Assim (lembre-se que para FS j = 0)
P M h n h Tn P M
P M +1 = P M .
h Tn P M h n
Substituindo a equao acima na Eq. (A7.1), tem-se
P M h n h Tn P M
C$ M C$ M +1 = T
h Tn P M h n
C$ M C$ M +1 =
( TPM h n )
2
.
h Tn P M h n
Apndice A8
Programas Utilizados
A seguir, encontra-se uma descrio dos programas construdos em MATLAB e em

C.
Programas para o sistema de DDF do manipulador com 2 graus de liberdade

Programas em MATLAB:
r2g_falb: a) simula o manipulador, gerando os padres normalizados para treinamento
(ou teste) do MLP; b) treinamento do MLP via retropropagao do erro; c) teste do
mapeamento realizado pelo MLP.
residuo2: gera os resduos para uma ou vrias trajetrias com os pesos do MLP gerados
no programa anterior. Para cada condio de operao (falhas e operao normal), gera
uma simulao diferente.
aux_koho: utilizando os dados gerados no programa anterior, a) separa os padres de
entrada para uso do programa rbf_koho.c; b) unifica os centros gerados pelo programa
rbf_koho.c em um nico subconjunto.
rbf_2g: utilizando os dados gerados no programa residuo2.m, treina (ou testa) a rede
RBF por: FS, GRR, LRR e MAOK (nesta opo, os centros determinados pelo programa
anterior so utilizados para clculo da matriz de pesos).
Programa em C:
rbf_koho: determina os centros da rede RBF para cada classe utilizando os dados gerados
pelo programa aux_koho.m.
Programas para o sistema de DDF do Puma 560

Programas em MATLAB:
r6g_falb: a) simula o manipulador, gerando os padres normalizados para treinamento
(ou teste) do MLP; b) teste do mapeamento realizado pelo MLP.
res_6g: gera os resduos para uma ou vrias trajetrias com os pesos do MLP gerados no
programa r_falb.c. Para cada condio de operao (falhas e operao normal), gera uma
simulao diferente.
aux_koho: utilizando os dados gerados no programa anterior, a) separa os padres de

entrada para uso do programa rbf_koho.c; b) unifica os centros gerados pelo programa
rbf_koho.c em um nico subconjunto.
rbf_6g: utilizando os dados gerados no programa residuo2.m, treina (ou testa) a rede
RBF por: FS, GRR, LRR e MAOK (nesta opo, os centros determinados pelo programa
anterior so utilizados para clculo da matriz de pesos).
Programa em C:
r_falb: treinamento do MLP utilizando os dados gerados no programa r6g_falb.m.
rbf_koho: determina os centros da rede RBF para cada classe utilizando os dados gerados
pelo programa aux_koho.m.
Apndice A9
Trajetrias utilizadas na simulao do manipulador com 2
graus de liberdade
Tabela A9.1. Trajetrias utilizadas no treinamento do MLP( manipulador com 2 elos).
Posies iniciais Posies finais

Trajetria Junta 1 Junta 2 Junta 1 Junta 2
1 /6 0 2/3 /2
2 /6 /2 2/3 0
3 7 / 24 0 13 / 24 /2
4 /6 3/8 2/3 /8
5 2/3 3/8 5 / 12 0
6 13 / 24 0 /6 /4
7 2/3 /4 7 / 24 /2
8 5 / 12 /2 /6 /8
9 7 / 24 0 /6 /8
10 13 / 24 /2 2/3 3/8
Tabela A9.2. Trajetrias utilizadas no treinamento da rede RBF ( manipulador com 2 elos).

1 /6 0 2/3 /2
2 5 / 12 /6 7 / 24 /4
3 2/3 3/8 5 / 12 0
4 13 / 24 /4 5 / 12 /8
5 2/3 /8 13 / 24 0
6 13 / 24 0 /6 /4
7 1,83 1,09 2,08 1,23
8 7 / 24 /4 5 / 12 3/8
9 /6 /2 2/3 0
Tabela A9.3. Trajetrias utilizadas no teste do sistema de DDF (manipulador com 2 elos)

1 7 / 24 0 13 / 24 /2
2 7 / 24 0 2/3 /4
3 5 / 12 /2 /6 /8
4 /6 3/8 2/3 /8
5 2/3 /4 7 / 24 /2
6 7 / 24 0 /6 /8
7 13 / 24 /2 2/3 3/8
8 7 / 24 /2 /6 3/8
9 2/3 /8 5 / 12 /2
10 5 / 12 3/8 13 / 24 /4
11 5 / 12 /8 7 / 24 /4
12 13 / 24 0 2/3 /8
13 2/3 /2 5 / 12 0
14 5 / 12 0 13 / 24 /2
15 7 / 24 3/8 /6 0
16 13 / 24 3/8 7 / 24 /4
17 /6 /4 2/3 /2

TDE

Загружено:

Сведения о документе

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

TDE

Загружено:

Авторское право:

Доступные форматы

DETECO E DIAGNSTICO DE FALHAS

EM ROBS MANIPULADORES VIA REDES

Dissertao apresentada Escola de

Lcia Maria Santos pela dedicao, pacincia e, sobretudo, companheirismo

A todos os amigos que me acompanharam nesta jornada e ainda esto presentes.

Aos Professores Aluzio F. R. Arajo da EESC - USP, Marcel Bergerman do CTI -

minha famlia, em especial, ao Fbio, Adriana, ao Lus Filipe e Marisa.

Aos professores e funcionrios do Depto. de Engenharia Eltrica que sempre

LISTA DE ABREVIATURAS .....i

CAPTULO 1. DETECO E DIAGNSTICO DE FALHAS EM SISTEMAS

CAPTULO 2. AS REDES NEURAIS ARTIFICIAIS ...16

CAPTULO 4. SISTEMA DE DETECO E DIAGNSTICO DE FALHAS VIA REDES

CAPTULO 5. RESULTADOS ...55

CAPTULO 6. CONCLUSES ...81

REFERNCIAS BIBLIOGRFICAS ...84

APNDICE A1. DADOS UTILIZADOS NO EXEMPLO 1 ...90

APNDICE A2. O VETOR DE PESOS TIMO PARA A REDE RBF ...91

APNDICE A3. A MATRIZ DE PROJEO ...95

APNDICE A4. O CRITRIO GENERALIZED CROSS VALIDATION ...98

APNDICE A6. OS VALORES TIMOS PARA OS PARMETROS DE

APNDICE A7. O MTODO FORWARD SELECTION ..112

APNDICE A8. PROGRAMAS UTILIZADOS ..114

APNDICE A9. TRAJETRIAS UTILIZADAS NA SIMULAO DO ROB COM 2

DDF - Deteco e Diagnstico de Falhas

a, B letras em itlico representam escalares.

Deteco e Diagnstico de Falhas

$ (.) - vetor de resduos

Redes Neurais Artificiais

- funo de decaimento que define a taxa de aprendizagem

TINS, R. (1999). Deteco e diagnstico de falhas em robs manipuladores via redes

Neste trabalho, um novo enfoque para deteco e diagnstico de falhas (DDF) em

Palavras-chave: Deteco e diagnstico de falhas, Robs manipuladores, Redes neurais

Com a crescente automatizao dos processos industriais, mecanismos que garantam

1.1. CONCEITO DE GERAO DE RESDUOS

Um sistema dinmico geralmente constitudo por atuadores, planta e sensores, como

entradas atuadores planta sensores sadas

Figura 1. Representao do sistema dinmico.

A equao de estados e a equao de sadas do sistema dinmico livre de falhas so

y(t ) = g t (x(t ), u(t ), d(t )) (2)

y(t ) = g (x(t ), u(t ), d(t )) (4)

nas quais t o perodo amostral e, por abuso de notao, x e y representam

Figura 2. Representao da dinmica do sistema livre de falhas.

Note que na ausncia de falhas no sistema, (t+t)=0 e, em caso contrrio, (t+t)0.

O princpio bsico dos mtodos de DDF que utilizam o conceito de gerao de

x$ (t + t ) = f$ (x(t ), u(t )) (8)

na qual f$ (.) a funo no-linear que representa o mapeamento entrada-sada da ferramenta

$ (t + t ) = x ( t + t ) x$ (t + t ) = f (x( t ), u(t ), d(t )) f$ (x( t ), u( t )) .(9)

Se a ferramenta utilizada representa exatamente o comportamento dinmico do

y (t + t ) = l (u(t ), d(t ), y(t ), y(t t ),L) (10)

na qual l(.) representa a funo no-linear do sistema livre de falhas.

1.2. DETECO E DIAGNSTICO DE FALHAS VIA REDUNDNCIA

Em contraste com a redundncia fsica na qual medidas de diferentes sensores so

do comportamento do sistema na presena da falha e invarincia ou um mnimo de robustez

modelo y$ (t) gerao

Figura 5. Gerao de resduos via observadores dedicados.

Figura 6. Deteco e diagnstico de falhas via identificao paramtrica.

1.2.1. Robustez em sistemas de deteco e diagnstico de falhas via redundncia

Em sistemas reais, os mtodos de DDF baseados no modelo matemtico operam sobre

escolhendo bandas de deteco fixas muito grandes, reduz-se consideravelmente a

1.3. TCNICAS DE INTELIGNCIA ARTIFICIAL APLICADAS EM SISTEMAS

Basicamente, tcnicas de Inteligncia Artificial (IA) podem ser utilizadas em sistemas

1.3.1. Sistemas baseados em conhecimento

Tambm conhecidos como sistemas especialistas, os sistemas baseados em

1.3.2. Lgica nebulosa