Вы находитесь на странице: 1из 126

MINISTRIO DA EDUCAO

UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL


PROGRAMA DE PS-GRADUAO EM ENGENHARIA MECNICA

MODELAGEM E CONTROLE DE UM SERVOPOSICIONADOR PNEUMTICO VIA


REDES NEURAIS

por

Vitor Irigon Gervini

Tese para obteno do Ttulo de


Doutor em Engenharia

Porto Alegre, dezembro de 2014

MODELAGEM E CONTROLE DE UM SERVOPOSICIONADOR PNEUMTICO VIA


REDES NEURAIS
por
Vitor Irigon Gervini
Mestre em Engenharia
Tese submetida ao Programa de Ps-Graduao em Engenharia Mecnica, da Escola
de Engenharia da Universidade Federal do Rio Grande do Sul, como parte dos requisitos
necessrios para a obteno do Ttulo de
Doutor em Engenharia
rea de Concentrao: Processos de Fabricao
Orientador: Prof. Dr. Eduardo Andr Perondi

Aprovada por:
Prof. Dr. Rafael Antnio Comparsi Laranja - UFRGS
Prof. Dr. Victor Juliano De Negri - UFSC
Prof. Dr. Antnio Carlos Valdiero - UNIJUI
Prof. Dr. Rogrio Jos Marczak
Coordenador do PROMEC

Porto Alegre, 3 de dezembro de 2014


ii

Dedico este trabalho ao meu av Dr. Joo Martins Gervini, que sempre me apoiou e
incentivou na pesquisa acadmica.

iii

AGRADECIMENTOS
Agradeo aos meus pais Igor e Bebeth, pelo carinho, a minha esposa Vanessa por seu amor,
apoio e por ter dado a luz a nossa querida filha Sofia, aos meus irmos pelos incentivos,
carinhos e amizade. Agradeo ao Prof. Sebastio por todos os ensinamentos e apoio que me
foram dedicados ao longo de minha vida acadmica, ao Prof. Perondi pela excelente
orientao e pacincia ao longo de todo o curso de doutorado, aos membros da banca pelas
preciosas colaboraes durante a qualificao e fase final de defesa do doutorado. Agradeo a
todos os colegas do Laboratrio de Mecnica e Controle da UFRGS, pelo coleguismo, em
especial ao tcnico der e colega Alexandre, por suas incontveis ajudas em todas as fases de
meu trabalho. Agradeo a todos os professores do Centro de Cincias Computacionais da
FURG por me incentivarem e apoiarem nesta etapa de vida.

iv

RESUMO

Visando apoiar o desenvolvimento de controladores para servoposicionadores pneumticos,


apresentada no presente trabalho uma proposta de um procedimento baseado no uso de redes
neurais para a determinao de modelos matemticos precisos que possam ser aplicados tanto
para a simulao do seu comportamento dinmico quanto na estrutura de controladores que
utilizam estratgias baseadas em modelos. No mbito do trabalho, esse procedimento foi
testado por meio de sua aplicao na identificao das foras de atrito e da relao
presso/vazo mssica nos orifcios de controle da servovlvula (que consistem nas principais
no-linearidades envolvidas em tais sistemas). Alm disso, determinou-se atravs de redes
neurais a relao inversa entre as vazes desejadas e o sinal de controle da servovlvula
(difeomorfismo), a qual aplicada em tcnicas de controle baseadas em modelos. Visando
validar o procedimento de modelagem proposto, foram realizadas simulaes em malha
aberta e malha fechada, cujos resultados so comparados com os de experimentos realizados
em uma bancada de testes. Com o intuito de comprovar sua eficcia em aplicaes de
controle, o modelo baseado em redes neurais foi utilizado no desenvolvimento de um
controlador no-linear sintetizado de acordo com uma estratgia em cascata (a qual foi j
testada em outros trabalhos, mostrando resultados satisfatrios quando aplicada ao controle de
servoposicionadores pneumticos). No entanto, essa estratgia apresenta dificuldades de
implantao em decorrncia das dificuldades associadas ao processo de identificao dos
parmetros do sistema, que so especialmente trabalhosos neste caso. As caractersticas de
estabilidade em malha fechada foram analisadas por meio do segundo mtodo Lyapunov. Os
resultados experimentais em malha fechada obtidos atestam a eficcia da estratgia de
controle proposta.
Palavras-chave: Sistemas pneumticos, modelagem, controle cascata; redes neurais.

ABSTRACT
The development of a precise positioning system has motivated several researches in the
pneumatic systems control area to overcome the problems caused by these nonlinearities, by
appropriate feedback control algorithms. In this work it is proposed a methodology based on
neural networks to achieve accurate mathematical models that can be used in simulation as in
controllers techniques based on models. This methodology was tested through its application
in identifying the phenomenon of friction and the relationship pressure/mass flow through
servo valve orifices control holes. Furthermore, using neural networks, the inverse
relationship between the desired flow rates and control signal of servo valve
(diffeomorphism), which is applied in various control techniques based on models, was
determined. To evaluate the proposed modeling methodology, simulations were done in open
and closed loop, and the results were compared with experiments conducted on a real
pneumatic servo positioning system. A neural network based model was used to develop a
nonlinear controller according to a cascade strategy with friction compensation (which has
been tested on other studies showing satisfactory results when applied to pneumatic servo
positioning control). The cascade control strategy, despite showing a good performance in
trajectory tracking, presents significant difficulties in implementation due mainly to
difficulties associated with the system parameters identification process, which are especially
expensive. The characteristics of the closed loop stability were analyzed by Lyapunov
method. The experimental results obtained in closed loop attest the efficiency of the proposed
control strategy.
Keywords: Pneumatic, servo positioning systems, modeling, cascade control; neural
networks.

vi

NDICE

INTRODUO................................................................................................... 1
1.1

Estado da Arte ................................................................................................ 2

1.2

Objetivos do Trabalho .................................................................................. 12

1.3

Organizao do Trabalho ............................................................................. 13

MODELAGEM DO SISTEMA DINMICO .................................................. 14


2.1

Bancada Experimental para o Servoposicionador Pneumtico .................... 14

2.2

Modelagem do Servoposicionador Pneumtico ........................................... 16

2.3

Dinmica das Presses nas Cmaras do Cilindro Atuador .......................... 17

2.4

Equilbrio das Foras no Pisto .................................................................... 19

2.5

Modelo No-Linear de Quarta Ordem ......................................................... 20

2.6

Redes Neurais Artificiais ............................................................................. 21

2.7

Identificao da Fora de Atrito ................................................................... 28

2.8

Identificao das Vazes Mssicas .............................................................. 31

2.9

Validao do modelo obtido ........................................................................ 34

2.10 Procedimento para o levantamento do Modelo Pneumtico Neural ............ 38


3

SISTEMA DE CONTROLE .............................................................................. 40


3.1

Seguimento no Subsistema Mecnico .......................................................... 41

3.2

Seguimento no Subsistema Pneumtico ....................................................... 43

3.3

Anlise de Estabilidade ................................................................................ 44

3.4

Anlise de Estabilidade - Caso Ideal ............................................................ 46

3.5

Anlise de Estabilidade - Caso com Erros Paramtricos e na Estimativa das


Perturbaes ................................................................................................. 48

RESULTADOS DE SIMULAES E EXPERIMENTOS ............................ 52


4.1

Trajetrias de Referncia ............................................................................. 52

4.2

Comparao entre o modelo pneumtico neural e experimento em bancada


com ambos em Malha Fechada .................................................................... 53
vii

4.3

Comparao entre experimento em bancada em malha fechada e modelo


pneumtico neural em malha aberta para referncia senoidal...................... 57
......................................... 60

4.4

Resultados experimentais do controlador

4.5

Resultados do controlador Cascata Neural com compensao de atrito ...... 64

4.6

Resultados do controlador Cascata Neural sem compensao de Atrito ..... 71

4.7

Resultados do controlador Cascata Neural com compensao de Atrito e


adio de massa ............................................................................................ 75

4.8

Resultados do controlador Cascata Neural com compensao de atrito com


adio de massa com aumento nos ganhos .................................................. 78

CONCLUSES ................................................................................................... 82

REFERNCIAS BIBLIOGRFICAS ......................................................................... 84


APNDICE I Parmetros Fsicos do Sistema Servopneumtico, Sensores e
Atuadores ........................................................................................................................ 93
I.1

Parmetros Fsicos........................................................................................ 93

I.2

Sensores ........................................................................................................ 93

I.3

Atuadores ..................................................................................................... 94

I.4

Sistema de Aquisio de Dados e Controle DSPACE .............................. 95

APNDICE II Caracterizao Terica das Vazes Mssicas na Servovlvula..... 96


APNDICE III Identificao Neural da derivada da Fora de Atrito e da Dinmica
Inversa da Servovlvula (Difeomorfismo).................................................................... 103
III.1 Identificao da derivada da Fora de Atrito ............................................. 103
III.2 Identificao da dinmica inversa da servovlvula .................................... 104
III.2 Comandos em MatLab para o clculo da sada de algumas RN ................ 106
APNDICE IV Resultados com controlador Cascata Neural com compensao de
Atrito com utilizando setup do Rob Pneumtico ....................................................... 108

viii

LISTA DE FIGURAS
Figura 1.1 Rob Pneumtico disponvel no LAMECC/UFRGS ............................................. 3
Figura 1.2 Atuador pneumtico utilizado em [Van Varseveld e Bone, 1997] com baixo atrito
............................................................................................................................................ 5
Figura 2.1 Desenho esquemtico da bancada experimental e sistema eltrico ..................... 15
Figura 2.2 Fotografia da bancada de testes do atuador pneumtico montada no Laboratrio
de Mecatrnica e Controle da UFRGS (LAMECC)......................................................... 16
Figura 2.3 Volume de controle com domnio varivel .......................................................... 18
Figura 2.4 Equilbrio de foras no mbolo do cilindro atuador [Perondi, 2002] .................. 20
Figura 2.5 Estrutura bsica de um neurnio .......................................................................... 22
Figura 2.6 Exemplos de funes de ativao utilizadas nos neurnios ................................. 23
Figura 2.7 Agrupamento de arquiteturas de redes feed-forward e recorrentes [Jain et. al,
1996] ................................................................................................................................. 23
Figura 2.8 Topologia tpica de uma rede neural MLP feed-forward com trs camadas e
totalmente conectada ........................................................................................................ 25
Figura 2.9 Arquitetura da Rede Neural Artificial (RNA) usada para a realizao da
estimao da fora de atrito .............................................................................................. 29
Figura 2.10 Arquitetura dos neurnios da camada oculta e de sada utilizados para a
modelagem do atrito ......................................................................................................... 29
Figura 2.11 Padres de treinamento da RN para estimao do atrito.................................... 30
Figura 2.12 Fora de atrito experimental (preto) e estimada pela rede neural (azul) para
8 e referncia senoidal com frequncia de 2 rad/s e amplitude de 0,45 m............. 31

Figura 2.13 Arquitetura da RNA para estimao das vazes mssicas ................................. 32
Figura 2.14 Sinais utilizados para o treinamento da RN para estimao das vazes mssicas
.......................................................................................................................................... 33
Figura 2.15 Vazo mssica experimental da cmara 1 (preto) e estimada pela rede neural
(azul) ................................................................................................................................. 34
Figura 2.16 Vazo mssica experimental da cmara 2 (preto) e estimada pela rede neural
(azul) ................................................................................................................................. 34
Figura 2.17 Velocidade do mbolo experimental (preto) e modelo (azul)............................ 36
Figura 2.18 Trajetrias de atrito idealizadas para representar o fenmeno stick-slip. .......... 36
Figura 2.19 Presso na cmara 1 experimental (preto) e modelo (azul) ............................... 37
ix

Figura 2.20 Presso na cmara 2 experimental (preto) e modelo (azul) ............................... 37


Figura 3.1 Interpretao do servoposicionador como dois subsistemas interconectados...... 40
Figura 3.2 Diagrama em blocos da estratgia de controle em cascata neural proposta. ....... 40
Figura 4.1 Posio do mbolo do cilindro atuador e seu respectivo erro em simulao para
sinal de controle proporcional (MF) e referncia senoidal ............................................... 54
Figura 4.2 Posio do mbolo do cilindro atuador e seu respectivo erro experimental para
sinal de controle proporcional (MF) e referncia senoidal ............................................... 55
Figura 4.3 Velocidade do mbolo e sinal de controle em simulao (MF) para referncia
senoidal ............................................................................................................................. 55
Figura 4.4 Velocidade do mbolo e sinal de controle experimental (MF) para referncia
senoidal ............................................................................................................................. 56

Figura 4.5 Presses nas cmaras 1 e 2 em simulao (MF) para referncia senoidal ...... 56
Figura 4.6 Presses nas cmaras 1 e 2 experimental (MF) para referncia senoidal ....... 56

Figura 4.7 Sinal de controle calculado em experimento de bancada e aplicado em MF no


mesmo experimento, o qual foi salvo em arquivo digital e aplicado como controle em
MA na simulao .............................................................................................................. 57
Figura 4.8 Comparao de resultados experimental (MF) e em simulao (MA) para a
posio do mbolo ............................................................................................................ 58
Figura 4.9 Comparao de resultados experimental (MF) e em simulao (MA) para a
velocidade do mbolo ....................................................................................................... 58
Figura 4.10 Comparao de resultados experimental (MF) e em simulao do modelo
pneumtico neural (MA) para a presso na cmara 1 .................................................... 59

Figura 4.11 Comparao de resultados experimental (MF) e em simulao do modelo


pneumtico neural (MA) para a presso na cmara 2 .................................................... 59

Figura 4.12 Comparao entre posies do mbolo experimental (controle

com

trajetria senoidal) e em simulao em malha aberta do modelo, bem como seus


respectivos erros ............................................................................................................... 61
Figura 4.13 Velocidades e sinal de controle experimental

e em simulao em malha

aberta para trajetria de referncia senoidal ..................................................................... 62


Figura 4.14 Presses nas cmaras do atuador experimental

e em simulao em malha

aberta para trajetria de referncia senoidal ..................................................................... 62

Figura 4.15 Comparao entre posies do mbolo experimental (controle

com

trajetria polinomial) e em simulao em malha aberta do modelo, bem como seus


respectivos erros ............................................................................................................... 63
Figura 4.16 Velocidades e sinal de controle experimental

e em simulao em malha

aberta para trajetria de referncia polinomial ................................................................. 63


Figura 4.17 Presses nas cmaras do atuador experimental

e em simulao em malha

aberta para trajetria de referncia polinomial ................................................................. 64

Figura 4.18 Posio do mbolo e seu respectivo erro experimental para o controlador
cascata neural com trajetria de referncia senoidal ........................................................ 65
Figura 4.19 Velocidade do mbolo e sinal de controle experimental para o controlador
cascata neural com trajetria de referncia senoidal ........................................................ 66

Figura 4.20 Presses nas cmaras 1 e 2 experimental e sinal de erro s para o controlador
cascata neural com trajetria de referncia senoidal ........................................................ 66

Figura 4.21 Fora desejada calculada pela lei de Slotine e Li em relao fora aplicada e
respectivo erro em fora experimental para o controlador cascata neural com trajetria de
referncia senoidal ............................................................................................................ 67
Figura 4.22 Variveis

utilizadas no controlador cascata neural com trajetria de

referncia senoidal ............................................................................................................ 67


Figura 4.23 Posio do mbolo e seu respectivo erro experimental para o controlador
cascata neural com trajetria de referncia polinomial .................................................... 68
Figura 4.24 Velocidade do mbolo e sinal de controle experimental para o controlador
cascata neural com trajetria de referncia polinomial .................................................... 69

Figura 4.25 Presses nas cmaras 1 e 2 experimental e sinal de erro s para o controlador
cascata neural com trajetria de referncia polinomial .................................................... 69

Figura 4.26 Fora desejada calculada pela lei de Slotine e Li em relao fora aplicada e
respectivo erro em fora experimental para o controlador cascata neural com trajetria de
referncia polinomial ........................................................................................................ 70
Figura 4.27 Variveis

utilizadas no controlador cascata neural com trajetria de

referncia polinomial ........................................................................................................ 70


Figura 4.28 Posio do mbolo e seu respectivo erro experimental para o controlador
cascata neural com trajetria de referncia senoidal sem compensao de atrito ............ 71
xi

Figura 4.29 Velocidade do mbolo e sinal de controle experimental para o controlador


cascata neural com trajetria de referncia senoidal sem compensao de atrito ............ 72
Figura 4.30 Fora desejada calculada pela lei de Slotine e Li em relao fora aplicada e
respectivo erro em fora experimental para o controlador cascata neural com trajetria de
referncia senoidal sem compensao de atrito................................................................ 73
Figura 4.31 Posio do mbolo e seu respectivo erro experimental para o controlador
cascata neural com trajetria de referncia polinomial sem compensao explcita de
atrito .................................................................................................................................. 73
Figura 4.32 Velocidade do mbolo e sinal de controle experimental para o controlador
cascata neural com trajetria de referncia polinomial sem compensao de atrito ........ 74
Figura 4.33 Fora desejada calculada pela lei de Slotine e Li em relao fora aplicada e
respectivo erro em fora experimental para o controlador cascata neural com trajetria de
referncia senoidal sem compensao de atrito................................................................ 74
Figura 4.34 Posio do mbolo e seu respectivo erro experimental para o controlador
cascata neural com trajetria de referncia senoidal e adio de massa .......................... 76
Figura 4.35 Velocidade do mbolo e sinal de controle experimental para o controlador
cascata neural com trajetria de referncia senoidal e adio de massa .......................... 76
Figura 4.36 Foras e respectivo erro para o controlador cascata neural com trajetria de
referncia senoidal e adio de massa .............................................................................. 76
Figura 4.37 Posio do mbolo e seu respectivo erro experimental para o controlador
cascata neural com trajetria de referncia polinomial e adio de massa ...................... 77
Figura 4.38 Velocidade do mbolo e sinal de controle experimental para o controlador
cascata neural com trajetria de referncia polinomial e adio de massa ...................... 78
Figura 4.39 Foras e respectivo erro para o controlador cascata neural com trajetria de
referncia polinomial e adio de massa .......................................................................... 78
Figura 4.40 Posio do mbolo e seu respectivo erro experimental para o controlador
cascata neural com trajetria de referncia senoidal e adio de massa com ganhos
modificados ...................................................................................................................... 79
Figura 4.41 Velocidade do mbolo e sinal de controle experimental para o controlador
cascata neural com trajetria de referncia senoidal e adio de massa com ganhos
modificados ...................................................................................................................... 80

xii

Figura 4.42 Foras e respectivo erro para o controlador cascata neural com trajetria de
referncia senoidal e adio de massa com ganhos modificados ..................................... 81
Figura III.1 Arquitetura da Rede Neural Artificial (RNA) usada para a realizao da
estimao da derivada da fora de atrito ........................................................................ 103
Figura III.2 Derivada da fora de atrito experimental (preto) e estimada pela rede neural
(azul) para

8 e referncia senoidal com frequncia de 2 rad/s e amplitude de 0,45

m ..................................................................................................................................... 104

Figura III.3 Arquitetura da RNA para estimao da tenso de controle ............................. 105
Figura III.4 Tenso de controle experimental (preto) e estimada pela rede neural (azul) ... 106
Figura IV.1 Posio do mbolo e seu respectivo erro experimental para o controlador
cascata neural com trajetria de referncia senoidal. ..................................................... 109
Figura IV.2 Velocidade do mbolo e sinal de controle experimental para o controlador
cascata neural com trajetria de referncia senoidal. ..................................................... 109
Figura IV.3 Foras e respectivo erro para o controlador cascata neural com trajetria de
referncia senoidal. ......................................................................................................... 109

xiii

LISTA DE TABELAS
Tabela 2.1 Exemplo de padres de treinamento para a operao lgica XOR com duas
entradas ............................................................................................................................. 26
Tabela 2.2 Parmetros dos experimentos selecionados para o treinamento da rede neural .. 31
Tabela 2.3 Resultados das simulaes usando o modelo proposto segundo critrio IAE ..... 36
Tabela 4.1 Ganhos utilizados no controlador PVP ............................................................. 60
Tabela 4.2 Ganhos utilizados no controlador Cascata Neural ............................................... 64
Tabela 4.3 Ganhos modificados utilizados no controlador Cascata Neural .......................... 79
Tabela I.1 Valores numricos dos parmetros do sistema fsico........................................... 93
Tabela I.2 Caractersticas tcnicas dos sensores de presso.................................................. 93
Tabela I.3 Caractersticas tcnicas da rgua potenciomtrica. .............................................. 94
Tabela I.4 Caractersticas tcnicas da servovlvula direcional. ............................................ 94
Tabela I.5 Caractersticas tcnicas do atuador pneumtico linear. ........................................ 94
Tabela I.6 Caractersticas da placa de aquisio e processamento de dados. ........................ 95

xiv

LISTA DE SMBOLOS
A

rea do mbolo, m2

termo de bias da rede neural


calor especfico do ar a presso constante, J/kg K
calor especfico do ar a volume constante, J/kg K
velocidade do som a jusante, m/s
erro
isima entrada da rede neural
fora de atrito, N
estimativa da fora de atrito, N
erro da estimativa do atrito, N
fora externa aplicada, N
estimativa da fora externa aplicada, N
erro da estimativa da fora externa, N

Fa

vetor composio da fora de atrito

Fe

vetor composio da fora externa aplicada sobre a massa


fora desejada, N
parcela dinmica do sistema que independe da tenso de controle
estimativa da parcela dinmica do sistema
erro da estimativa da parcela dinmica do sistema

constante positiva do controlador para s


constante positiva do controlador para presso

comprimento til do cilindro atuador, m

massa de ar contida no volume de controle, kg

"

$%

$&
'

massa deslocada, kg
matriz da funo Lyapunov
matriz da derivada da funo Lyapunov
presso absoluta na cmara i, Pa
presso a jusante, Pa
presso a montante, Pa
xv

)'

*+

,+
,+
-

diferena das presses, Pa


diferena de presso desejada, Pa
erro no seguimento da diferena de presso, Pa
presso de suprimento, Pa
presso atmosfrica, Pa
vazo mssica que entra ou sai da cmara i, kg/s
estimativa neural da vazo mssica que entra ou sai da cmara i, kg/s

energia calorfica, J

constante do gs, kg J/K

tempo, s

potncia calorfica, J/s

relao entre os calores especficos

velocidade

temperatura do ar a montante, K

combinao linear dos erros de seguimento de posio e de

2'

temperatura do ar de suprimento, K

tenso aplicada servovlvula, V

un

sinal de controle auxiliar

Estimativa neural da tenso aplicada servovlvula, V

3'

temperatura do ar a jusante, K

velocidade do ar a jusante, m/s


velocidade do ar a montante, m/s
funo Lyapunov
volume na cmara i, m3

Vi0

volume morto na cmara i, m3

vazo volumtrica na cmara i, m3/s

deslocamento do carretel da servovlvula, m

deslocamento do mbolo, m

56

velocidade do mbolo, m/s

isimo peso da rede neural

acelerao do mbolo, m/s2


xvi

57

posio desejada, m

acelerao de referncia, m/s2

57

posio de referncia, m

massa especfica do ar, kg/m3

567

velocidade de referncia, m/s

8'

massa especfica do ar a jusante, kg/m3

constante positiva do controlador

<

relao entre autovalores mximos e mnimos

massa especfica do ar a montante, kg/m3

vetor de erros da funo Lyapunov

isimo autovalor mximo

isimo autovalor mnimo

fator de aprendizado da rede neural

xvii

1 INTRODUO
Os servoposicionadores pneumticos so relativamente baratos, leves e de fcil
instalao, apresentando tambm uma relao de fora de sada por unidade de peso que os
tornam muito atraentes em aplicaes na indstria. Por outro lado, os servoposicionadores
pneumticos possuem caractersticas altamente no-lineares e uma grande dificuldade em se
obter modelos matemticos precisos, o que dificulta que se consiga um desempenho adequado
no controle do seguimento de trajetrias.
Os atuadores pneumticos esto sendo cada vez mais utilizados e tm se tornando uma
alternativa na automao industrial devido s suas caractersticas especficas. Para algumas
aplicaes, existem vantagens na utilizao de atuadores pneumticos em relao aos
atuadores hidrulicos e eltricos. Atuadores pneumticos utilizam o ar na transmisso de
movimento, sendo este de fcil disponibilidade. Os atuadores pneumticos possuem uma boa
relao peso/potncia [Messina et al., 2005; Rajendran e Nanda, 2009; Schindele e
Aschemann, 2009; Chikh et al, 2010; Ren e Huang, 2013b], alm de apresentarem uma
capacidade de fornecer maior fora e por um perodo mais longo do tempo do que os aos
atuadores eltricos [Schindele e Aschemann, 2009]. Sistemas pneumticos so fceis de
serem projetados e so muito flexveis quanto s suas aplicaes [Shaojuan et al., 2008;
Ramirez, 2013], propiciando condies de operaes limpas [Messina et al., 2005; Niiyama,
2012; Chen e Shih, 2013]. Alm disso, ao contrrio dos sistemas eltricos, os sistemas
pneumticos no emitem fagulhas, fazendo com que sejam seguros e facilmente adaptveis
para utilizao em ambientes classificados.
Por outro lado, atuadores pneumticos tm aplicao restrita em problemas onde alta
preciso requisitada. As dificuldades esto associadas a caractersticas tais como: difcil
identificao dos parmetros do sistema dinmico, efeitos da compressibilidade do ar,
presena de atrito com comportamento altamente no-linear entre as superfcies de contato
nas vedaes do cilindro, tanto no mbolo quanto na haste; fortes no-linearidades associadas
relao entre a vazo de ar atravs do orifcio da servovlvula e as presses nas cmaras do
cilindro. Esses fatores dificultam a obteno de um modelo dinmico preditivo e desempenho
adequado do sistema de controle. Assim, para a implantao de controladores de sistemas
pneumticos baseados em modelos matemticos, necessrio que vrios parmetros sejam

levantados e identificados para que seja possvel a aplicao destes sistemas de controle nos
sistemas reais.
Na presente tese realizada uma pesquisa sobre servoatuadores pneumticos,
englobando aspectos tanto de modelagem dinmica quanto de controle. feito um
desenvolvimento terico dos dois principais mdulos que compem a tese: modelagem
dinmica e controle de servoatuadores pneumticos. Este desenvolvimento terico foi
validado a partir de resultados experimentais, obtidos em uma bancada experimental que se
encontra fisicamente no LAMECC (Laboratrio de Mecatrnica e Controle) da UFRGS.
1.1

Estado da Arte
A demanda pela automao industrial iniciou-se entre a dcada de 1950 e 1960

[Broadbent, 1950; Tappan et al., 1960], bem como a pesquisa sobre atuadores pneumticos.
Um dos primeiros estudos publicados sobre modelagem de atuadores pneumticos o de
Shearer, 1956, no qual apresentado um modelo dinmico no-linear, o modelo no-linear
obtido ento linearizado, visando aplicao em projeto de controladores baseados em
tcnicas lineares [Virvalo, 1995; Li et al., 2011]. De forma geral, os modelos matemticos
encontrados na bibliografia seguem as mesmas hipteses e procedimentos gerais do
equacionamento proposto por Shearer, 1956.
Na literatura so encontradas aplicaes para servoposicionadores pneumticos,
algumas das quais so aqui descritas. Em Wang et al., 1999a, por exemplo, apresentada uma
estratgia de controle pneumtico baseada em um controlador PID para um sistema de
embalagem de alimentos. Experimentos para um cilindro pneumtico de 30 cm de curso total
so apresentados para o controle ponto a ponto. Os resultados apresentam um erro mximo de
1 mm na preciso do posicionamento do cilindro com uma massa de 1,7 kg. O controlador se
mostrou robusto a variaes no suprimento de presso de at 2 bar. Em Choi et al., 2003, est
descrito o desenvolvido de um rob hbrido acionado por atuadores pneumticos e
servomotores utilizado para aplicaes de colocaes de vidro, rob este que possui 4 graus
de liberdade e uma resoluo na posio mxima de 3 mm. O controlador utilizado foi o
controle por modos deslizantes. O autor salienta que no se consegue uma alta preciso e que
o intuito utilizar o rob como suporte para trabalhadores humanos na montagem de painis
em construes. Alm das aplicaes industriais, atuadores pneumticos tm sido utilizados

tambm como interface fsica humana. Por exemplo, em Faudzi et al., 2008, uma cadeira
inteligente foi projetada, de modo a se ajustar de acordo com a curvatura lombar de um ser
humano, com o intuito de minimizar o desconforto e a fadiga. Resultados experimentais no
seguimento de fora e de trajetria so apresentados graficamente, sem detalhar o
desempenho do sistema de controle proposto. Em Sang-Eun et al., 2010, atuadores
pneumticos foram utilizados em aplicaes na rea mdica de Ressonncia Magntica por
Imagem (MRI) para a bipsia da prstata. Foram, no entanto, apresentados problemas devido
ao limitado espao de trabalho. Atualmente, encontra-se em desenvolvimento no Laboratrio
de Mecnica e Controle (LAMECC) da Universidade Federal do Rio Grande do Sul (UFRGS)
um rob pneumtico com cinco graus de liberdade, conforme apresentado na Figura 1.1 [Rijo,
2013].

Figura 1.1 Rob Pneumtico disponvel no LAMECC/UFRGS

O desenvolvimento de um posicionador rpido e preciso tem motivado diversos


trabalhos na rea de controle de atuadores pneumticos, buscando superar os problemas
ocasionados pelas no-linearidades atravs do uso de algoritmos de controle adequados. O
estudo do controle no seguimento de trajetria em sistemas pneumticos vem tendo um

significativo crescimento desde 1990. Muitas abordagens vm sendo investigadas na tentativa


de superar as dificuldades do controle de sistemas pneumticos. As investigaes das
estratgias de sistemas de controle vo desde tcnicas de controle PID [Varseveld e Bone,
1997; Fok e Ong, 1999; Wang, et al., 1999a; Lee et al., 2002; Rahmat et al., 2012; Aliff et al.,
2013] at tcnicas avanadas de controle, como o controle por modos deslizantes [Song e
Ishida, 1997b; Richer e Hurmuzlu, 2000; Tsai e Huang, 2008; Meng et al., 2014; Hodgson et
al., 2015], controle adaptativo [Smaoui et al., 2006; Schindele e Aschemann, 2009; Ren e
Huang, 2013a; Na et al., 2014] e as combinaes de diversas tcnicas de controle [Chiang et
al., 2005; Shu e Bone, 2005; Zhu et al., 2009; Han e Lee, 2013]. Esses algoritmos, muitas
vezes, necessitam de modelos para a sua sntese, enquanto outros utilizam estratgias que no
necessitam de sinais nominais calculados a partir do modelo dinmico do servoposicionador
[Surgenor et al., 1995; Perondi e Guenther, 2000]. Neste caso, o modelo til para a
realizao de simulao, atravs das quais os ganhos e parmetros do controlador so
ajustados a partir da avaliao dos resultados obtidos.
A combinao de um controlador convencional com a compensao de atrito foi
investigada por diversos pesquisadores. Em 1997, uma combinao de um controlador PID
com uma estratgia de compensao de atrito foi implementado utilizando vlvulas solenides
tipo on/off visando ao posicionamento preciso [Van Varseveld e Bone, 1997]. O mtodo de
compensao de atrito foi baseado no modelo de atrito simplificado de Coulomb e os
resultados mostram que o controlador apresenta comportamento robusto quanto variao da
massa da carga. Os resultados experimentais apresentam erro de no mximo 0,21 mm para
deslocamento ponto a ponto e de 2 mm no seguimento de trajetrias com baixas velocidades
(50 mm/s). A carga de trabalho utilizada foi de 0,94 kg e o curso total do cilindro de 15,2 cm.
O tipo de cilindro utilizado possui baixo atrito, segundo o autor, e apresentado na Figura
1.2.
Um controle robusto por modos deslizantes foi proposto em Song e Ishida, 1997b. O
projeto do controlador derivado da teoria de Lyapunov, utilizando uma regio de
convergncia para a dinmica do erro quando o tempo t . A estratgia de controle
investigada apresenta rejeio a incertezas paramtricas na modelagem. Nos experimentos so
utilizados valores de massa de carga de 30 a 100 kg. Erros de seguimento de trajetria
inferiores a 0,1 cm so apresentados para curvas de referncia de baixa amplitude (5 cm), para
um cilindro pneumtico com comprimento total de 30 cm.

Figura 1.2 Atuador pneumtico utilizado em [Van Varseveld e Bone, 1997] com baixo atrito

Em Wang e Moore, 1999b, investigado um controlador PID de posio com a adio


de uma realimentao de acelerao visando a melhorar as caractersticas de estabilidade do
sistema de controle. Nesta estratgia de controle, so tambm utilizados esquemas de
compensao de duas no-linearidades: atraso de tempo (time-delay), que ocorre devido
compressibilidade do ar e zona morta de controle, que ocasionada pelo sobrepassamento
(overlapping) do carretel de controle da servovlvula. So apresentados resultados grficos no
seguimento de trajetrias de baixas velocidades para o controlador proposto sem o
detalhamento de desempenho do sistema de controle proposto. Nesse artigo no so
apresentados resultados de controle ponto a ponto e de seguimento de trajetria para a
posio.
Em Saleem et al., 2009, proposto um controlador PID de velocidade com
compensao de atrito (no caso do controlador PID em velocidade, o retorno do ganho
proporcional opera a velocidade, ficando a ao integral com o retorno de posio e a ao
derivativa com o retorno de acelerao). Foi proposto um procedimento para a identificao
online do atrito utilizando a diferena entre o comportamento do sistema experimental e o
fornecido pelo modelo matemtico. O artigo no apresenta detalhes para o resultado do erro
de posicionamento da estratgia de controle proposta.
Os sistemas de servoposicionamento pneumtico geralmente dispem de sensores de
posio a partir dos quais, atravs da derivao no tempo do sinal por eles fornecido, obtmse as curvas de velocidade. Um dos problemas do controle de velocidade est em se obter
essas derivadas temporais. Para evitar essa dificuldade, que associada utilizao da

velocidade na estratgia de controle, alguns autores preferem uma abordagem com utilizao
do sinal de fora, como, por exemplo, [Ilchmann et al., 2006], que apresenta um controlador
proporcional estvel com realimentao do erro em fora. Resultados experimentais do
controlador em aplicaes de seguimento de fora apresentam erros de cerca de 4 N para
trajetrias de referncia constitudas por degraus de diferentes amplitudes, restritas entre 40
N. Outros autores, porm, se utilizam de observadores de estados para as estimativas dos
sinais desejados [Salgado e Chairez, 2013] ou de fenmenos no-lineares tais como o atrito
[Rahman e Sepehri, 2013].
A utilizao de redes neurais artificiais (RNA) em robtica tem sido realizada,
principalmente, como ferramenta de identificao de modelos estticos e dinmicos para a
posterior compensao de no-linearidades, objetivando tornar a planta o mais linear possvel,
facilitando assim o bom desempenho da lei de controle. A RNA atua como um modelo
matemtico com que pode reproduzir caractersticas de algum sistema fsico previamente
selecionado, como, por exemplo, o atrito ou a funo inversa da servovlvula. Algumas
vantagens no uso de RNA so a facilidade e a rapidez na identificao de sistemas fsicos em
comparao com os mtodos tradicionais de identificao (levantamentos de pontos e
aproximaes de curvas, mtodo usualmente utilizado na identificao do modelo da inversa
da servovlvula).
Em Lee et al., 2002, apresentado um controle PID de posio com compensao de
atrito via rede neural e um observador no-linear para a fora de atrito baseado no modelo
simplificado de Coulomb descrito atravs da equao,

=>, 5@

> 0B C=5@, onde 5 a

velocidade do mbolo e a um parmetro a ser estimado utilizando um observador no-linear


de ordem reduzida, tal que > (estimativa do valor ideal a) funo de um estado observvel z

associado a uma dinmica interna escolhida de modo que se possa provar a convergncia
assinttica do erro em posio para zero. O atuador utilizado do tipo linear com curso total
de 20 cm e uma massa na carga de 2,7 kg. A rede neural proposta possui duas entradas
(velocidade e acelerao), uma camada escondida com trs neurnios e uma sada para a
estimativa do atrito. O treinamento da rede neural foi feito de forma offline utilizando-se
padres de treinamentos levantados previamente. O algoritmo de adaptao escolhido foi o
mtodo clssico de retropropagao do erro (backpropagation), onde o treinamento
supervisionado das redes neurais baseado no uso de padres de treinamento de entrada e
sada para uma dada rede neural que propaga os erros de suas sadas para os pesos mais

internos na rede [Fausett, 1994]. Os resultados experimentais so apresentados utilizando,


respectivamente, amplitudes e frequncias de 7 cm e 0,5 Hz para a referncia de posio. Os
resultados experimentais utilizando o PID com compensao neural apresentaram um erro de
seguimento de trajetria mximo de 1,5 cm, enquanto com o observador de estados o erro
mximo foi de 2,0 cm. Entretanto, o controle utilizando o uso do observador de estados
mostrou-se mais fcil de ser ajustado.
Outra abordagem sobre a utilizao de redes neurais para o controle de sistemas
pneumticos relativa ao ajuste de ganhos de um controlador PI com realimentao de
posio via redes neurais [Kothapalli e Hassan, 2008]. Os ganhos proporcional e integral do
controlador so ajustados atravs do uso de uma rede neural que possui duas entradas: erro em
posio e fora externa aplicada carga movimentada. Para treinamento utilizada a tcnica
da retropropagao do erro com momento (momentum), via mtodo do gradiente descendente.
A funo utilizada na camada escondida foi a tangente sigmoidal. Os autores apresentaram
apenas resultados de simulao, os quais no so conclusivos quanto robustez do controle
proposto.
A maioria dos trabalhos sobre o equacionamento do atrito entre o mbolo e a camisa
do pisto utiliza o modelo conhecido como LuGre [Canudas de Wit et al., 1995], que, alm de
levar em conta as principais no-linearidades macroscpicas do atrito, tm-se mostrado
bastante adequado para o uso em esquemas de observao e compensao do atrito
[Lischinsky, 1999; Perondi, 2002; Guenther et al., 2006; Sobczyk et al., 2012; Feyel et al.,
2013; Meng et al., 2014]. Para aplicaes em controle, este modelo apresenta limitaes
associadas a dificuldades referentes obteno dos seus parmetros. No presente trabalho,
como ser visto no Captulo 2, redes neurais foram utilizadas para obteno de estimativas da
fora de atrito a partir da diferena de presso no mbolo do cilindro atuador e da sua
velocidade.
Em Carneiro e Almeida, 2011, investigada a modelagem de servoposicionadores
pneumticos utilizando redes neurais. O modelo dinmico global formado por dois tipos de
redes neurais: o primeiro utilizado na identificao do modelo direto das servovlvulas
proporcionais, enquanto o segundo tipo aplicado na identificao do atrito. As redes neurais
usadas para a identificao da dinmica direta das servovlvulas possuem quatro camadas:
uma de entrada com dois neurnios (tenso de comando e presso a jusante); duas camadas
escondidas (com dez neurnios na primeira e seis na segunda) e uma camada de sada com

um neurnio (estimativa neural da vazo mssica da servovlvula). A rede neural para a


identificao do atrito possui tambm quatro camadas: uma de entrada com dois neurnios
(velocidade e acelerao do mbolo); duas camadas escondidas (com dez e seis neurnios) e
outra de sada, com um neurnio (estimativa neural da fora de atrito). Como funo de
ativao foi utilizada a tangente hiperblica sigmoidal (tansig). O treinamento dos pesos para
ambos os tipos de rede neural foi feito de forma offline sobre um padro de treinamento
previamente obtido a partir de resultados experimentais, utilizando o mtodo de LevenbergMarquardt (LM) para a minimizao do erro. O mtodo de Levenberg-Marquardt uma
variao do mtodo de convergncia de Newton, tratando-se de um algoritmo de otimizao
efetivo com uma convergncia rpida e robusta [Marquardt, 1963; Hagan et al., 1996;
Nergaard et al., 2000; Ham e Kostanic, 2001]. Resultados de simulao utilizando o modelo
proposto so comparados com dados experimentais e atestam uma boa concordncia da
estratgia de modelagem proposta. Os resultados foram validados para excitao tipo pulso e
por sinal de referncia harmnico de amplitude 0,1 m com frequncia de 1 Hz.
Em Carneiro e Almeida, 2012, apresentado o projeto de um controlador neural para
o seguimento de trajetria de um servoposicionador pneumtico. Nesse trabalho, o controle de
fora com compensao de atrito via redes neurais estudado. Duas redes neurais so
utilizadas para realizar a identificao do modelo inverso das servovlvulas de controle. O
modelo inverso, conceito tambm utilizado na estratgia de controle em cascata [Perondi,
2002], permite obter o valor necessrio da tenso aplicada a servovlvula a partir do valor
desejado da sua varivel de sada. O cilindro pneumtico estudado possui comprimento total
de 40 cm, sendo as amplitudes utilizadas nos seguimentos das trajetrias senoidais abaixo de
16 cm (32 cm de curso total). A maior frequncia das trajetrias seguida de rad/s e a
massa da carga testada variou entre de 2,69 e 13,1 kg. Para a menor massa e frequncia
mxima da trajetria, o erro de pico ficou em torno de 7,5 mm. Em Carneiro e Almeida, 2013
apresentado como melhorar o desempenho no controle de fora em cilindros industriais
utilizando duas servovlvulas pneumticas.

Carneiro e Almeida, 2014, apresentam o

desempenho de seu controlador neural em um servoatuador pneumtico porttil, onde todos


os sensores, servovlvula, cilindro de atuao, tratamento de ar, esto dentro de uma maleta
porttil tambm chamado de sistema on-the-shelf.
Em Al-Shabi et al., 2011, apresentado um filtro preditor (Smooth Variable Structure
Filter - SVSF) para a modelagem de sistemas pneumticos baseado no conceito de modos

deslizantes. O filtro preditor utilizado para que a estimao dos parmetros e dos estados do
modelo desloquem-se em direo superfcie de um hiperplano previamente definido. O
desempenho do filtro preditor comparado a partir de resultados de simulaes com
estimaes realizadas por uma rede neural feed-forward de quatro camadas, com uma entrada,
duas camadas escondidas e uma sada, utilizando o algoritmo de treinamento por
retropropagao de Levenberg-Marquardt.
Hesselroth et al., 1994, utilizaram redes neurais para o controle de um manipulador de
cinco graus de liberdade com msculos pneumticos. Foram utilizadas duas cmeras digitais
para medir as posies. A topologia escolhida para a rede neural do tipo Kohonen
tridimensional. Os mapas auto-organizveis de Kohonen fazem parte de um grupo de redes
neurais baseadas em modelos de competio, ou simplesmente redes competitivas [Fausett,
1994]. Nestes mapas no existe a necessidade do treinamento tradicional supervisionado, pois
a prpria rede busca encontrar similaridades baseando-se apenas nos padres de entrada. O
artigo mostra que com pouco mais de 200 passos de adaptao possvel se obter um erro
mximo de 3 mm para o controle ponto a ponto.
Gross e Rattan, 1997, apresentaram um controle de velocidade de um cilindro
pneumtico. O controle apresentado composto de uma realimentao do erro de velocidade
e de uma rede neural multicamadas para a compensao das no-linearidades do sistema. Para
o treinamento da rede neural foi utilizada a tcnica de backpropagation com momentum. O
trabalho apresenta resultados de simulao para o erro de velocidade em cilindros
pneumticos, mostrando que ocorre uma reduo de 93,7% do erro no seguimento de
velocidade quando utilizada a compensao por redes neurais.
Song et al., 1997a, propuseram um controlador de posio para um cilindro
pneumtico utilizando redes neurais multicamadas. Como regra de treinamento, utilizou-se
um algoritmo baseado no Filtro de Kalman Estendido (EKF), que uma verso no-linear do
estimador quadrtico linear conhecido como Filtro de Kalman (KF) [Kalman, 1960] e
considerado como um padro na teoria de estimao de estados de sistemas no-lineares
[Einicke e White, 1999]. A rede neural responsvel por todo o clculo do controle, tendo
sido necessrio realizar um treinamento prvio da rede. No so apresentados detalhes do erro
do seguimento de trajetria, mas resultados visuais dos grficos mostram erros inferiores a 1
mm em problema de deslocamento ponto a ponto para uma massa na carga de 10 kg.

10

Choi et al., 1998, utilizaram uma rede neural feed-forward com trs camadas (uma
camada de entrada, uma camada escondida e uma camada de sada) para controlar um
servoposicionador pneumtico linear com 20 cm de comprimento. Como tcnica de
aprendizagem foi utilizada a retropropagao do erro. Foi utilizado um algoritmo PID para o
controle do sistema. Resultados experimentais so apresentados utilizando-se trajetrias
senoidais de frequncia de 0,5 Hz. A estratgia de controle proposta apresenta erros inferiores
a 2,2 mm no seguimento de trajetria para curvas harmnicas com amplitudes de 7 cm.
Ahn et al., 2003, utilizaram um algoritmo de seleo de ganhos atravs de rede neural
para controlar um sistema pneumtico com carga varivel. De acordo com a estratgia
proposta, a rede neural escolhe um conjunto de ganhos apropriados para diferentes valores de
carga. Resultados experimentais sem carga apresentaram erros inferiores a 0,5 mm no
controle ponto a ponto.
Song e Liu, 2006, utilizaram uma rede neural feed-forward para obter um modelo
completo de um sistema pneumtico. A rede neural utilizada foi treinada utilizando o mtodo
de convergncia de Levenberg-Marquardt [Song e Liu, 2006]. O modelo obtido
transformado em um modelo ARX (modelo auto-regressivo, ou seja que depende dos estados
anteriores e possui entradas externas) de terceira ordem. A partir do modelo ARX foi
projetado um controlador digital para o sistema. O artigo apresenta resultados experimentais
com erro no seguimento de trajetrias harmnicas de, no mximo, 3,27 mm. O cilindro
utilizado possui comprimento total de 10 cm, tendo sido utilizados na gerao das harmnicas
amplitudes de aproximadamente 4 cm, resultando em 8 cm de curso total. Trung et al., 2011,
feita a identificao de um atuador pneumtico utilizando redes neurais, tendo como tcnica
de adaptao dos pesos tambm o mtodo de convergncia de Levenberg-Marquardt.
Resultados experimentais atestam a estratgia de modelagem proposta.
Alguns trabalhos anteriormente desenvolvidos no LAMECC/UFRGS serviram de base
inicial para o desenvolvimento deste trabalho, principalmente associados a Dissertaes de
Mestrado e Teses de Doutorado j desenvolvidas nesse tema [Perondi, 2002; Sobczyk, 2005;
Kunz, 2006; Sobczyk, 2009; Suzuki, 2010; Sobczyk et al., 2012]. Alm disso, serviram como
base trabalhos anteriores na rea de inteligncia artificial como auxlio ao controle de sistemas
mecnicos [Gervini et al., 2008; Gomes et al., 2006; Gervini et al., 2003; Gervini et al., 2001].
O projeto, anlise, implantao experimental e teste de um controlador para
seguimento de trajetrias precisas de servoposicionadores pneumticos, constituem a

11

principal contribuio da presente tese de doutorado. Desta forma, o controlador dever ser
capaz de compensar as no-linearidades e variaes paramtricas da dinmica de
servoatuadores pneumticos, de forma a garantir estabilidade e preciso no problema de
seguimento de trajetrias de referncia.
Quando se objetiva utilizar um modelo matemtico de um atuador em sntese de
algoritmos de controle, importante que o mesmo apresente relaes que possam ser
invertidas. Isto permite que muitos controladores, como os baseados na interpretao do
sistema como subsistemas concatenados e os baseados em linearizao por realimentao
possam ser desenvolvidos usando esse modelo. No caso dos servoposicionadores
pneumticos, importante que o modelo da servovlvula apresente essa caracterstica, de
modo que possa ser utilizado na compensao das no-linearidades em algoritmos de
controle, como em Bobrow e McDonell, 1998 e Guenther e Perondi, 2002. Deste modo, o
modelo dinmico do servoposicionador proposto neste trabalho foi elaborado com a
possibilidade de inverso da relao entre a vazo de ar e a tenso de controle, adotando
tambm uma modelagem do atrito que permite sua compensao. Conforme mencionado, a
utilizao de redes neurais tambm tem auxiliado na obteno da inversa das relaes da
dinmica da servovlvula [Carneiro, 2011].
O presente trabalho, atravs da apresentao do desenvolvimento de um modelo
dinmico para um servoposicionador pneumtico, aborda a proposio de um procedimento
para a determinao de modelos baseada no uso de redes neurais para identificar as principais
no-linearidades envolvidas na modelagem de tais sistemas. A identificao dos parmetros
associados a essas no-linearidades geralmente difcil e trabalhosa de ser realizada a partir
de mtodos tradicionais. Os ensaios experimentais para a validao do modelo foram
realizados utilizando-se a bancada experimental descrita no Captulo 2.
A modelagem desenvolvida utiliza a estrutura matemtica clssica para este tipo de
sistema [Vieira, 1998; Perondi e Guenther, 1999; Perondi e Guenther, 2000; Guenther e
Perondi, 2002; Weist et al., 2011], empregando, porm, redes neurais para as estimativas das
vazes mssicas e das foras de atrito.
Nos modelos tradicionais, a vazo mssica geralmente equacionada a partir de
relaes obtidas experimentalmente entre a rea efetiva de abertura de passagem do fluido na
servovlvula com a razo entre as presses a montante e a jusante em relao ao orifcio,
resultando em curvas tridimensionais, tendo como entradas as relaes de presso e o sinal de

12

controle da vlvula (ao qual a abertura dos orifcios proporcional) e, como sada, a vazo
mssica que atravessa os orifcios da servovlvula [Scavarda e Thomasset, 1996; McDonell,
1996; Mar, 2000; Perondi, 2002; Korondi e Gyeviki, 2006; Rapp et al., 2012].
No presente caso, as vazes mssicas da servovlvula so obtidas atravs do uso de
uma rede neural que tem como entradas a tenso de controle e a diferena das presses nas
cmaras e como sada a estimativa das vazes mssicas. O treinamento da rede neural feito
de forma supervisionada a partir de dados de experimentos. No treinamento supervisionado,
as entradas da rede neural, bem como as sadas desejadas so fornecidas (chamadas de
padres de treinamento), e ento, utilizando-se a retropropagao do erro e com o mtodo do
gradiente descendente os pesos da rede so minimizados de forma a aprender os padres de
treinamento.
1.2

Objetivos do Trabalho
O objetivo geral do presente trabalho consiste no desenvolvimento de um controlador

do tipo cascata utilizando redes neurais para um servoatuador pneumtico. De forma que o
mesmo consiga seguir trajetrias de referncia e possua robustez a variaes na massa da
carga.
Os objetivos especficos do presente trabalho so:
i) a proposio de um procedimento para a obteno de modelos matemticos inversveis
de servoposicionadores pneumticos de forma rpida e eficiente, utilizando redes
neurais para identificao das no-linearidades e;
ii) o desenvolvimento de uma lei de controle para seguimento preciso de trajetria
baseada em uma estratgia em cascata com compensao de atrito via redes neurais;
iii) implementao do controlador proposto em um sistema fsico real disponvel em uma
bancada no LAMECC;
iv) realizao de testes a fim de verificar/validar o desempenho e robustez do sistema de
controle proposto.

13

1.3

Organizao do Trabalho
O trabalho est organizado da seguinte forma, no Captulo 2 apresentado a descrio

e modelagem do sistema fsico de um servoatuador pneumtico. No Captulo 3 um


controlador tipo cascata com compensao de atritos projetado, e sua anlise de estabilidade
estudada. No Captulo 4 resultados do modelo e experimentais do controlador proposto so
comparados e analisados de forma a se verificar o desempenho no seguimento de trajetrias e
robustez a variaes da massa terminal. No Captulo 5 so apresentadas as concluses do
presente trabalho.

14

2 MODELAGEM DO SISTEMA DINMICO


O modelo geralmente utilizado para descrever o comportamento dinmico de um
servoposicionador pneumtico constitudo basicamente pelas relaes entre as vazes
mssicas que entram ou saem das cmaras do cilindro atuador, passando pelos orifcios de
controle da servovlvula e pela equao da dinmica do pisto. Neste captulo descrita a
sequncia de procedimentos necessria para a obteno de um modelo no-linear para um
servoposicionador pneumtico. O comportamento dinmico das presses das cmaras
modelado por meio da equao da continuidade. A dinmica do pisto equacionada por
meio da 2a Lei de Newton. Para a obteno do modelo das vazes mssicas da servovlvula e
do atrito presente no mbolo so utilizadas duas redes neurais supervisionadas, cujo
treinamento feito de maneira offline com padres de treinamentos adquiridos na bancada
experimental descrita na Seo 2.1.
2.1

Bancada Experimental para o Servoposicionador Pneumtico


Os parmetros fsicos e geomtricos do sistema, bem como as caractersticas tcnicas

dos elementos eltricos e mecnicos envolvidos (sensores, atuadores e sistema de aquisio de


dados) esto apresentados no Apndice I.
A bancada experimental composta de uma servovlvula (Festo MPYE 5-1/8) que
possui um sistema de realimentao interno garantindo um comportamento aproximadamente
linear de abertura e fechamento em funo da tenso eltrica aplicada. Perondi, 2002,
verificou que esse tipo de vlvula pode apresentar um sobrepassamento (overlap) que
ocasiona uma zona morta de cerca de at 8% da tenso mxima. O mbolo mvel do cilindro
conectado a um sensor linear (Festo POT-1000-TFL) de curso semelhante ao do cilindro
atuador (1 m). Dois sensores eletro-resistivos (HubaControl 510) medem a presso
manomtrica em cada cmara do cilindro. O mecanismo de controle e aquisio de dados
consiste de uma placa de controle (dSPACE DS1104) acoplada a um computador pessoal.
Para as converses analgico-digital (AD) e digital-analgica (DA), a placa de controle
dSPACE utilizada apresenta programas computacionais auxiliares para gerenciamento da
aquisio de dados e mdulos de acoplamento para o software MatLab/Simulink. Assim, os
algoritmos em tempo real de medies e controle programados em MatLab/Simulink so
compilados e enviados para a placa de controle dSPACE conectada ao PC. Os dados

15

adquiridos pela placa de controle dSPACE so enviados para um software supervisrio


(ControlDesk
ControlDesk),
), que permite a exportao dos mesmos para o software MatLab/Simulink,
MatLab/Simulink, onde
os dados so ps-processados.
ps processados. O tempo de amostragem escolhido na aquisio de dados e
controle do sistema fsico de 1 ms.
ms Esse tempo de amostragem suficiente visto que a
servovlvula direcional MPYE 5-1/8
5 1/8 FESTO possui tempo resposta de at 5 ms.
O sistema em estudo est ilustrado na Figura 2.1.. Uma servovlvula proporcional 5/3
vias comanda um cilindro de dupla ao sem haste com dimetro interno
interno de 0,025 m e curso 1
m.. Uma fotografia da bancada experimental apresentada na Figura 2.2. Nesta so
apresentados os sensores de presso e posio,
posio, o cilindro
cilind o de atuao, a servovlvula direcional
e os vasos de presso utilizados, para que a presso de suprimento seja o mais constante
possvel.

Figura 2.1 Desenho esquemtico da bancada experimental e sistema eltrico

16

Figura 2.2 Fotografia da bancada de testes do atuador pneumtico montada no Laboratrio de


Mecatrnica e Controle da UFRGS (LAMECC)

2.2

Modelagem do Servoposicionador Pneumtico


Nesta seo so descritos os principais procedimentos utilizados para a obteno do

modelo matemtico para o servoposicionador pneumtico. A descrio da vazo mssica de ar


na servovlvula feita usando o princpio de conservao da energia, enquanto o equilbrio de
foras no pisto do cilindro estabelecido atravs da Segunda Lei de Newton.

17

No presente contexto, a modelagem consiste na obteno de um conjunto de equaes


que representa o comportamento dinmico do sistema que, alm de auxiliar no conhecimento
da natureza dos fenmenos fsicos envolvidos, fornece informaes teis ao projeto dos
controladores. A modelagem foi desenvolvida de acordo com o mtodo da continuidade [Fox
e McDonald, 1981]. Para que modelo resultante seja tratvel numericamente de acordo com a
abordagem da continuidade, so adotadas algumas hipteses simplificativas. Neste trabalho,
as principais hipteses so:

a energia cintica do gs desprezada;

os efeitos dissipativos (perdas de carga) nas tubulaes e conexes so desprezados;

o ar se comporta como um gs perfeito (a lei geral de estados dos gases vlida);

os calores especficos a presso e volume constantes no se alteram ao longo dos


processos;

os vazamentos nos dutos, servovlvula e no mbolo do cilindro so considerados


insignificantes;

2.3

a dinmica da servovlvula no considerada e

os processos nas cmaras so considerados isentrpicos.


Dinmica das Presses nas Cmaras do Cilindro Atuador
A Figura 2.3 apresenta um esquema do volume de controle com domnio varivel que

representa o atuador pneumtico. Onde p a presso, V o volume, e T a temperatura do


volume de controle, Q a energia calorfica, y a posio do mbolo e pu e pd as presses a
montante e jusante, respectivamente.
Considerando o volume de controle apresentado na Figura 2.3, emprega-se a hiptese
de conservao da energia para realizar o balano energtico entre a energia interna da massa
de fluido que entra no volume de controle, a potncia associada ao movimento do pisto e a
variao da energia interna no volume de controle ao longo do tempo. Como as
transformaes de compresso e expanso das cmaras e consequentes trocas de calor
internas so processos que ocorrem com velocidade relativamente rpida em relao ao fluxo
de calor atravs das paredes do cilindro, as trocas de calor so reduzidas, podendo-se utilizar a
hiptese de comportamento adiabtico para esses processos. Acrescentando-se ainda a

18

hiptese de que os processos so reversveis, resulta em um sistema caracterizado com


comportamento isentrpico.

Figura 2.3 Volume de controle com domnio varivel

Uma medida da energia contida na massa que entra no volume de controle da cmara
,+% 2, onde

1 do cilindro pode ser expressa por

o calor especfico do ar a presso

constante, T a temperatura do ar de suprimento e ,+%

D"% D1 a vazo mssica que

entra ou sai da cmara 1. Essa vazo mssica depende da relao


conforme descrito no Apndice II, onde
suprimento e

*+

a presso atmosfrica.

a presso na cmara 1,

A potncia associada ao movimento do pisto expressa por

% / )'
)'

ou

%/

*+

a presso de

% %,

onde

derivada do volume de controle V1. A variao na energia interna do volume de controle pode
ser expressa por D=

8% % 2@D1, onde

o calor especfico do ar a volume constante e 8%

a massa especfica do ar. Definindo a relao entre os calores especficos .

lembrando que, para um gs ideal, a equao da massa especfica 8%


D %
D1

1 D
=
./ D1

constante do gs, pode-se realizar o balano energtico, do qual resulta


,+% 2 H

% %@

% =/2@,

sendo R a

(2.1)

onde a potncia calorfica dissipada atravs das paredes do cilindro (-) desprezada. O
volume total na cmara 1 expresso por V1 = I J L 5M L
K

&

%N ,

onde A a rea do mbolo, y

o deslocamento do mbolo e V10 o volume morto na cmara 1, incluindo as tubulaes. A


taxa de variao deste volume
Resolvendo a Equao (2.1) para
ento a

%,

I5, onde 5

D5/D1 a velocidade do mbolo.

aps efetuar a derivada do termo da direita, chega-se

19

I.5

O
I J L 5M L
2

%N

/.2

O
I J L 5M L
2

%N

,+%

(2.2)

onde qm1 a vazo mssica que sai da servovlvula para a cmara 1. Sendo qm2 a vazo
mssica que sai da servovlvula para a cmara 2, V20 o volume morto na cmara 2 e L o
comprimento til do cilindro atuador, tem-se para a cmara 2,
I.5

O
I J H 5M L
2

&

&

&N

/.2

O
I J H 5M L
2

&N

,+&

(2.3)

Assumindo que as vazes mssicas so funes das presses no cilindro e da tenso u

aplicada servovlvula, ou seja, ,+%

,+% = % , @ e ,+&

(2.3) podem ser reescritas como

2.4

&

I.5

O
I J L 5M L
2
I.5

O
I J H 5M L
2

%N

&N

Equilbrio das Foras no Pisto

&

/.2

O
I J L 5M L
2
/.2

O
I J H 5M L
2

%N

&N

,+& = & , @, as expresses (2.2) e

,+% = % , @

(2.4)

,+& = & , @

(2.5)

O equilbrio dinmico de foras no mbolo obtido atravs da aplicao da 2a lei de


Newton, e resulta:

#56 L

I=

&@

(2.6)

onde M a massa deslocada, fa a fora de atrito, fe uma fora externa aplicada sobre a
massa M e I=
(Figura 2.4).

&@

a fora de atuao associada diferena de presso entre as cmaras

20

Figura 2.4 Equilbrio de foras no mbolo do cilindro atuador [Perondi, 2002]

As equaes (2.4) a (2.6) constituem um modelo dinmico de quarta ordem do sistema

pneumtico de posicionamento, cujas variveis de estado podem ser P

Q5

&R

Este modelo inclui as no-linearidades caracterizadas pelo produto e quociente de variveis de


estado presentes nas relaes (2.4) e (2.5), pela parcela de atrito no viscoso includa em fa e
pelas relaes (2.7) e (2.8) que descrevem as vazes mssicas na servovlvula.
,+%

,+&
2.5

,+% = % , @

(2.7)

,+& = & , @

(2.8)

Modelo No-Linear de Quarta Ordem


Definindo

expresso (2.6) resulta:

como a diferena de presso entre as cmaras 1 e 2, a

#56 L

(2.9)

Utilizando as expresses (2.4) e (2.5), pode-se escrever a derivada da diferena de


presso em relao ao tempo como:

/.2 T

,+% = % , @
,+& = & , @
H
U
O
O
I J L 5M L %N I J H 5M L &N
2
2
H .I5 T

O
I J L 5M L
2

%N

&

O
I J H 5M L
2

&N

(2.10)

21

Dessa forma possvel agrupar os termos que dependem da tenso na servovlvula u


em uma funo
= %,

& , 5, 5@,

= %,
= %,

= %,

ou seja:

& , 5,

& , 5, 5@

& , 5,

/.2 T

@, e os termos que independem da tenso em uma funo

,+% = % , @
,+& = & , @
H
U
O
O
I J L 5M L %N I J H 5M L &N
2
2

H.I5 T

O
I J L 5M L
2

%N

Com isso, a expresso (2.13) resulta:

= %,

& , 5, 5@

= %,

&

O
I J H 5M L
2

& , 5,

&N

(2.11)

(2.12)

(2.13)

As expresses (2.9) e (2.13) constituem uma forma compacta de descrever o sistema


no-linear de quarta ordem.
2.6

Redes Neurais Artificiais


A mais de 50 anos foram desenvolvidos o algoritmo de treinamento Mnimos

Quadrados Mdios (Least Mean Squares - LMS) [Widrow e Hoff, 1960] e a Regra Perceptron
[Rosenblatt, 1962], ambos publicados pela primeira vez no incio da dcada de 60 e que foram
de fundamental importncia para o desenvolvimento das Redes Neurais Artificias (RNA),
chamadas tambm de apenas Redes Neurais (RN) [Haykin, 1999]. A estrutura bsica do
neurnio (perceptron de Rosenblatt, [Arbib, 2003]) apresentada na Figura 2.5. O neurnio
basicamente composto por suas entradas = % ,

&, ,

@, pelos ganhos nos pesos das entradas

=4% , 4& , , 4 @, uma entrada de polarizao (bias), a funo de ativao e a sada do

neurnio.

22

Figura 2.5 Estrutura bsica de um neurnio

O neurnio pode ser visto como uma soma ponderada de todas as entradas somada a
um termo de bias (polarizao) aplicada a uma funo de ativao. A funo de ativao
uma funo matemtica linear ou no-linear e seu uso surgiu baseado no comportamento do
neurnio biolgico [McCulloch e Pitts, 1943], que ora transmitia os sinais eltricos recebido
pelos dendritos em direo ao axnio e ora no, como se houvesse uma funo de um limiar
matemtico. Na Figura 2.6 so apresentadas as principais funes de ativaes utilizadas nos
neurnios em RN.
Em [Jain et. al, 1996] so descritas muitas formas de conectar os neurnios entre si. A
Figura 2.7 apresenta um possvel agrupamento destas formas. Por no possurem
realimentao, as redes feed-forward apresentam uma maior facilidade na prova da sua
estabilidade em relao s redes recorrentes. Por outro lado, por apresentarem uma ou mais
realimentaes, as redes recorrentes, acabam adicionando estados internos ao sistema o que
dificulta a prova da sua estabilidade.
Em [Jain et. al, 1996] so descritas muitas formas de conectar os neurnios entre si. A
Figura 2.7 apresenta um possvel agrupamento destas formas. Por no possurem
realimentao, as redes feed-forward apresentam uma maior facilidade na prova da sua
estabilidade em relao s redes recorrentes. Por outro lado, por apresentarem uma ou mais
realimentaes, as redes recorrentes, acabam adicionando estados internos ao sistema o que
dificulta a prova da sua estabilidade.

23

Figura 2.6 Exemplos de funes de ativao utilizadas nos neurnios

Figura 2.7 Agrupamento de arquiteturas de redes feed-forward e recorrentes [Jain et. al, 1996]

De forma genrica, podem-se separar as redes neurais em dois grupos: as redes feedforward (propagao para frente) e as redes recorrentes (com algum tipo de realimentao ou
dinmica interna). As redes feed-forward no possuem dinmica interna enquanto as redes
recorrentes possuem de alguma forma uma dinmica interna em sua topologia. Portanto,
quando as redes recorrentes so utilizadas no controle de sistemas dinmicos, a prova de
estabilidade do sistema em malha fechada apresenta um grau de dificuldade mais elevado.

24

Apesar desse fato, as redes feed-forward podero acabar possuindo uma dinmica interna caso
o treinamento da rede seja feito de forma online (isto , durante o controle em malha fechada
do sistema), este no ser o caso de estudo na presente tese. Todas as redes utilizadas neste
trabalho so do tipo feed-forward e foram treinadas de forma offline (isto , antes de serem
utilizadas no controle em malha fechada).
As redes de base radial so muito semelhantes s redes com perceptrons de mltiplas
camadas com a diferena bsica que as funes de ativaes so funes de base radial, so
funes sobre nmeros reais cujos valores dependem apenas da distncia a partir da origem
(por exemplo: funo Gaussiana). As redes competitivas so aquelas em que os neurnios
competem com os seus vizinhos para continuar funcionando, um exemplo para este tipo de
rede quando neurnios que no esto contribuindo adequadamente para o resultado desejado
so podados. O fato de se eliminar um neurnio faz com que a estrutura da rede seja mudada,
adicionando a rede uma dinmica interna. As redes de Kohonen, que so um tipo especial de
redes competitivas so tambm chamadas de Mapas Auto-Organizveis (SOM - SelfOrganizing Maps), que um mtodo de aprendizado no supervisionado (isto , no existem
padres de treinamento). Seu desenvolvimento foi baseado em uma caracterstica distinta do
crebro onde os neurnios transformam os sinais de entrada em uma distribuio de
probabilidade codificada pela sua localizao. As redes de Hopfiled so redes neurais com
realimentao de mltiplos laos com atrasos unitrios. As redes ART (Adaptive Resonance
Theory) foram baseadas na anlise da literatura experimental em viso, fala e
desenvolvimento do crtice. A caracterstica principal de uma rede ART seu processo de
casamento de padres que compara uma entrada externa com um estado interno da rede
neural, este estado interno pode se modificar de acordo com as entradas apresentadas [Haykin,
1999].
Neste trabalho utilizada uma rede neural com propagao para frente (feed-forward)
com mltiplas camadas de perceptrons (multilayer perceptrons - MLP) totalmente conectada
(fully connected). A Figura 2.8 apresenta uma topologia tpica de uma rede neural MLP feedforward totalmente conectada com trs camadas. O termo perceptron foi utilizado pela
primeira vez em [Rosenblatt, 1958] como sendo um modelo matemtico para a representao
de um neurnio. A primeira camada chamada de camada de entrada, utilizando-se,
normalmente, uma funo de ativao linear (purelin), a ltima camada chamada de camada
de sada, enquanto a camada intermediria chamada de camada oculta ou escondida ou

25

intermediria. A principal ideia a de fazer com que as entradas dos neurnios de uma
camada sejam as sadas dos neurnios das camadas anteriores. Quando uma rede neural dita
completamente conectada, isso significa que todos os neurnios (perceptrons de Rosenblatt)
de uma camada anterior esto conectados por pesos com cada neurnio da camada posterior.
Uma rede MLP pode conter um nmero arbitrrio de camadas (camada de entrada, uma ou
mais camadas ocultas e uma camada de sada). No entanto, deve-se evitar um grande nmero
de camadas ocultas, pois essa configurao pode levar a rede a apresentar um comportamento
inadequado, com uma memorizao dos dados de treinamento (overfitting) ao invs de uma
generalizao (predizer corretamente dados ou padres no treinados).
Assim, neste trabalho utilizaram-se redes MLP com apenas uma camada oculta,
conforme apresentado na Figura 2.8. Alm disso, foi utilizada uma de ativao linear
(purelin) para os neurnios da primeira camada e funes de ativao baseada em tangente
hiperblica (tanh) para os neurnios das demais camadas. Este padro de configurao das
funes de ativao para a primeira e segunda camada clssico na literatura, apenas o uso de
uma funo baseado na tangente hiperblica para a sada no o . Geralmente, utilizam-se
funes de ativaes do tipo lineares na camada de sada. Neste trabalho optou-se por utilizar
funes baseadas em tangente hiperblica na camada de sada, pois como a funo
matemtica da tangente hiperblica limitada todas as sadas das redes neurais deste trabalho
tambm o sero.

Figura 2.8 Topologia tpica de uma rede neural MLP feed-forward com trs camadas e totalmente
conectada

As redes MLP utilizam uma tcnica de aprendizado supervisionado chamada de


retropropagao (backpropagation). O aprendizado da RN ocorre por meio de um processo de
adaptao dos pesos das conexes entre os neurnios baseado no clculo do erro entre as
sadas desejadas (esperadas) e as sadas fornecidas pela rede. No aprendizado supervisionado,

26

primeiramente so levantados os padres de treinamento da rede. Estes padres so


compostos por entradas tpicas do sistema cujo comportamento se deseja reproduzir e
respectivas sadas desejadas. Por exemplo, no treinamento de uma funo XOR (ou
exclusivo) os padres de treinamento seriam as entradas e respectivas sadas da operao
lgica, conforme a Tabela 2.1.
Tabela 2.1 Exemplo de padres de treinamento para a operao lgica XOR com duas entradas

Entradas Sada
0
0
0
0
1
1
1
0
1
1
1
0
No algoritmo de backpropagation, geram-se valores aleatrios para o vetor de pesos
wi dos neurnios prximos a zero. Na primeira fase do treinamento os valores tpicos dos
padres das entradas so aplicados nos neurnios da camada de entrada. Em seguida,
realizada a propagao das entradas (fase feed-forward) at a obteno das sadas da RN, as
quais so, ento, comparadas com as sadas esperadas, resultando nos valores dos erros
associados a cada neurnio da camada de sada. Com este erro, possvel recalcular (adaptar)
os pesos que conectam a ltima camada intermediria com a camada de sada.
O algoritmo backpropagation pode ser de colocado de uma forma simplificada
conforme o Quadro 1.

27

Quadro 1 - Algoritmo Backpropagation [Jain et al., 1996].

1. Inicializa-se todos os pesos da RN com valores aleatrios prximos de zero;

2. Escolhe-se um padro de entrada P ' e aplica-se nos neurnios das camadas de


entrada da rede;
5% P '
%
onde 5 a sada do i-simo neurnio da camada de entrada (denominada pelo
ndice 1) e P ' o u-simo padro de entrada da rede.

3. Propaga-se o sinal para frente (forward) na rede neural;


5WX

YZ[5 X\% 4 XW ]^

para todas as camadas posteriores, ou seja: _ 2, , O


onde L o nmero da camada de sada, =. @ a aplicao da funo de
ativao, 5 X\% a sada do i-simo neurnio da camada l-1 e 4 XW o peso que
conecta o i-simo neurnio da camada l-1 ao j-simo neurnio da camada _;

4. Calcula-se a K para cada i-simo neurnio na camada de sada L


b K
aK
= @QD ' H 5 K R
b
onde =. @ a derivada da funo de ativao =. @, K representa o somatrio
das entradas para do i-simo neurnio na camada de sada L, D ' a sada
desejada do padro u para o i-simo neurnio e 5 K a sada atual do i-simo
neurnio da camada de sada L;

5. Calculam-se todos os deltas aWX para cada j-simo neurnio das l camadas
anteriores utilizando a retropropagao do erro:
aWX

Xc%
[ X ] Z[4 Xc%
]
W aW
W

para todas as camadas anteriores, ou seja: _ O H 1, , 1


X
onde representa o somatrio das entradas para do i-simo neurnio na
camada l, 4 Xc%
W o peso que conecta o i-simo neurnio da camada l ao j-simo
neurnio da camada _ L 1 e aWXc% o delta do j-simo neurnio da camada _ L
1;

6. Adaptam-se os pesos da rede utilizando:


4WX
<a X 5WX\%
onde < o fator de aprendizado da rede neural, 5WX\% a sada do j-simo
neurnio da camada _ H 1;

Volte para o passo 2 e repita para o prximo padro de treinamento at que se

obtenha um erro na sada menor que o desejado, ou que at que o mximo nmero de
iteraes tenha sido atingido, ou caso exista perda de generalizao da rede.

28

2.7

Identificao da Fora de Atrito


Para o caso de foras externas nulas, conhecendo-se a acelerao e as presses nas

cmaras, possvel calcular o valor aproximado da fora de atrito, o qual pode ser utilizado
como sada desejada (target output) de uma rede neural, de acordo com a Equao (2.14)
I=

&@

H #56

(2.14)

No projeto desenvolvido, as variveis escolhidas como entradas na rede neural so a


diferena de presso entre as cmaras do cilindro atuador (
do pisto (5).

&)

e a velocidade do mbolo

A arquitetura de rede neural adotada para a identificao da fora de atrito foi a MLP
com aprendizagem supervisionada do tipo backpropagation [Jain et al., 1996], [Haykin,
1999]. Optou-se por esta arquitetura por ela ter apresentado resultados na identificao de
atrito em servoatuadores robticos tipo Harmonic Drive [Gervini, et al., 2003]. A camada de
entrada composta de dois neurnios associados diferena das presses nas cmaras e
velocidade do mbolo e a camada de sada por um neurnio associado fora de atrito
estimado. Decidiu-se, inicialmente, utilizar somente uma camada intermediria (por ser a
representao mais simples de uma rede MLP).
Foram testados diferentes nmeros neurnios na camada intermediria (1,2 3,4, 5,...),
sendo os resultados com quatro neurnios considerados mais adequados. Nmeros menores
de neurnios na camada intermediria causaram dificuldade de estimao da fora de atrito,
devido a dificuldade de convergncia dos parmetros da rede e nmeros maiores de neurnios
na camada intermediria obtiveram incremento de desempenho muito pouco significativo
com relao aos resultados obtidos com apenas quatro neurnios. Na Figura 2.9 ilustrada a
arquitetura da rede neural adotada com dois neurnios de entrada (associados diferena das
presses nas cmaras e velocidade do mbolo), quatro neurnios na camada oculta e um
neurnio na camada de sada (associado fora de atrito estimado). Esta arquitetura de rede
neural j havia sido utilizada em [Machado, 2003] a qual foi baseada em uma rede neural para
identificao de atrito de atuadores robticos [Gervini, 2001].

29

Figura 2.9 Arquitetura da Rede Neural Artificial (RNA) usada para a realizao da estimao da
fora de atrito

A arquitetura dos neurnios est de acordo com [Beale e Jackson, 1990] e mostrada
na Figura 2.10. Conforme explicado anteriormente, foi escolhida a funo tangente
hiperblica para ativao da camada oculta e de sada.

Figura 2.10 Arquitetura dos neurnios da camada oculta e de sada utilizados para a modelagem do
atrito

Aps o treinamento utilizando a tcnica clssica da retropropagao do erro


(backpropagation), a rede apresentou uma taxa de erro de aproximadamente de 0,02 dos
padres apresentados rede (este valor equivale a um erro mdio de 1% do valor desejado,
pois a sada da rede pode variar apenas entre -1 e 1). O erro

de uma rede neural pode ser

calculado conforme Equao (2.15).


1
$ $0

'f%,,g

Z eD' H 5 K e

f%,,g)

(2.15)

com Np o nmero de padres a serem testados, Ns o nmero de neurnios na camada de sada,


D' a sada desejada do padro u para o i-simo neurnio e 5 K a sada atual do i-simo
neurnio da camada de sada L;

30

Na Figura 2.11 so apresentados alguns resultados experimentais utilizados como


padres de treinamento da rede neural para a modelagem do atrito.
atrito

Figura 2.11 Padres de treinamento da RN para estimao do atrito

As entradas da rede neural so a velocidade e a diferena de presses nas cmaras,


enquanto a sada a fora de atrito, conforme ilustrado anteriormente na Figura 2.9.. Os
padres de treinamento foram obtidos atravs de uma srie de ensaios experimentais. Esses
ensaios constituram-se
constituram se da aplicao de um controlador proporcional para o seguimento de
trajetria de posio utilizando como referncia sinais do tipo degrau e tambm sinais do tipo
senoidal.
Os valores dos parmetros utilizados nos experimentos selecionados para a
identificao do atrito esto apresentados na
n Tabela 2.2.
Na Figura 2.12 apresentada
apresentada uma curva
curva da fora de atrito estimada pela rede neural
aps o treinamento sobreposta com a fora de atrito calculada atravs da Equao (2.14) para
o caso de
de uma referncia
refer
senoidal de amplitude de 0,45 m e frequncia de 2 rad/s, com o

31

controlador proporcional com ganho Kp = 8. Cabe salientar que a rede neural para a
estimativa do atrito no foi treinada para um experimento com este ganho para o controlador
proporcional, mesmo assim a rede conseguiu uma estimativa adequada para este novo
conjunto de entradas, que no foram treinadas. Isto indica que a rede neural para a estimativa
do atrito possui uma satisfatria generalizao (termo comumente utilizado em redes neurais
para uma extrapolao adequada dos dados de treinamento).
Tabela 2.2 Parmetros dos experimentos selecionados para o treinamento da rede neural
Intervalo
Ganho proporcional em posio
Referncia
0 s-10 s
2
degrau (0,45 m a -0,45 m)*
10 s-20 s
4
degrau (0,45 m a -0,45 m)*
20 s-30 s
10
degrau (0,45 m a -0,45 m)*
30 s-40 s
4
0,45 sen (2t) m
40 s-50 s
10
0,45 sen (2t) m
* Obs.: a referncia tipo degrau aplicada possui um perodo de 2 rad/s.

Figura 2.12 Fora de atrito experimental (preto) e estimada pela rede neural (azul) para
referncia senoidal com frequncia de 2 rad/s e amplitude de 0,45 m

2.8

8e

Identificao das Vazes Mssicas


Nesta seo apresentada a estratgia de identificao das vazes mssicas das

cmaras atravs de redes neurais. Utilizando as Equaes (2.4) e (2.5), possvel isolar as
vazes mssicas ,+% e ,+& , conforme as Equaes (2.16) e (2.17):

32

,+%
,+&

O
JI J L 5M L %N M
2
/.2

O
JI J H 5M L &N M
2
/.2

L I.5

(2.16)

&

H I.5

&

(2.17)

A rede neural proposta para a realizao da identificao das vazes mssicas das
cmaras 1 e 2 apresentada na Figura 2.13. Visto que as vazes mssicas sofrem influncia
direta da tenso de controle e presses nas cmaras, bem como presso de suprimento
(considerada como constante).

Figura 2.13 Arquitetura da RNA para estimao das vazes mssicas

A rede neural possui trs entradas (tenso eltrica de controle aplicada a servovlvula,
presses nas cmaras 1 e 2) e duas sadas (vazes mssicas nas cmaras 1 e 2). Aps
diferentes testes de treinamento, foram escolhidos quatro neurnios na camada intermediria,
tendo a rede neural, com esse nmero, apresentado aprendizado dos padres considerado
satisfatrio e uma boa generalizao. Aps o treinamento a rede apresentou uma taxa de erro
de aproximadamente 1,5% (0,03) de erro em relao ao valor desejado. O erro

de uma rede

neural foi calculado de acordo com a Equao (2.15).


Os dados utilizados como padres de treinamento para a identificao das vazes
mssicas esto apresentados na Figura 2.14. Os experimentos utilizados para a identificao
da vazo mssica possuem as mesmas especificaes dos realizados para o treinamento da
rede neural de identificao do atrito, conforme apresentado na Seo 2.7. Na Figura 2.14
esto apresentados alguns resultados experimentais representativos das curvas utilizadas no
treinamento da rede neural de identificao das vazes mssicas.

33

Figura 2.14 Sinais


inais utilizados para o treinamento
treinamento da RN para estimao das vazes mssicas

Aps a fase de treinamento, foram realizados alguns testes visando avaliar o


desempenho da rede neural treinada na predio das vazes mssicas em experimentos que
no foram
foram utilizados no treinamento com ganho proporcional
proporcional igual 8 e com referncia
senoidal, de acordo com a Tabela 2.2.. Resultadoss desses testes
teste esto apresentado
apresentadoss na Figuras
iguras
2.15 e 2.16.. possvel perceber que por meio do uso da rede neural foi possvel estimar
adequadamente as vazes mssicas de um experimento para o qual a rede no foi treinada.

34

Figura 2.15 Vazo mssica experimental da cmara 1 (preto) e estimada pela rede neural (azul)

Figura 2.16 Vazo mssica experimental da cmara 2 (preto) e estimada pela rede neural (azul)

2.9

Validao do modelo obtido


Para validar os resultados do modelo proposto, formado pelas Equaes (2.4) a (2.6) e

pelas duas redes neurais treinadas descritas nas sees 2.6 e 2.7, foram realizadas simulaes
da resposta dinmica do sistema em malha aberta. Para tanto, adotou-se o procedimento
descrito a seguir.
Implantou-se inicialmente um controlador proporcional (com Kp = 6), o qual foi
utilizado para a realizao de experimentos em malha fechada. O sinal de controle calculado e
os resultados desses testes foram armazenados em arquivos digitais para uso posterior nas
comparaes entre os resultados experimentais e os das simulaes. As simulaes foram

35

realizadas em malha aberta utilizando-se as curvas do sinal de controle calculadas durante os


experimentos. Foi escolhida a utilizao em malha aberta na simulao, pois as respostas em
malha fechada tendem a mascarar as diferenas entre experimento e simulao. Para tanto,
para que essas curvas pudessem ser utilizadas como entrada do modelo, o valor do passo de
integrao adotado o mesmo do perodo de amostragem dos experimentos (1 ms). Assim, as
simulaes, apesar de serem realizadas em malha aberta, respondem a um sinal de controle
calculado experimentalmente em malha fechada. Com isso, as respostas dos experimentos
realizados em malha fechada podem ser comparadas com as respostas das simulaes
realizadas, por sua vez, em malha aberta.
Na Figura 2.17 est apresentada a curva de velocidade obtida experimentalmente
atravs da derivada do sinal de posio sobreposta com a velocidade prevista pelo modelo
desenvolvido.
Percebe-se que o modelo consegue, a baixas velocidades, reproduzir o comportamento
associado ao fenmeno de stick-slip (adere-desliza). Este fenmeno ocorre quando a fora
resultante no mbolo menor do que o atrito seco e a velocidade menor do que um
determinado limite prximo do zero, definido como a velocidade de quebra (5)* ), que
corresponde ao menor valor da velocidade encontrado em respostas em malha aberta. Em

[Gomes et al., 2006], onde apresentado um estudo do fenmeno de atrito em atuadores


robticos, demonstrado que existe uma velocidade limite (5X + ), abaixo da qual o
comportamento do tipo stick-slip pode ocorrer. O comportamento stick ocorre quando a
velocidade do elemento que se desloca menor do que a velocidade limite ao mesmo tempo
que o equilbrio de torque (ou fora) resultante menor do que o atrito seco (fat). Essas
condies inicializam o modo stick, ou seja, a velocidade vai a zero sobre as trajetrias C e D
da Figura 2.18, onde apresentado um grfico das trajetrias de atrito. Segundo esse modelo,
o movimento s volta a ocorrer quando o torque (ou fora) resultante voltar a ser superior ao
atrito esttico e o efeito Stribeck faz com que a trajetria slip (trajetria B da Figura 2.18) seja
menos amortecida do que a trajetria stick. Comutaes entre os modos stick e slip podem
acontecer antes de se configurar uma velocidade nula, ocorrendo em transies verticais da
trajetria B para as trajetrias C ou D, quando um modo slip se transforma em um stick,
passando da curva C ou D para a B, quando um comportamento stick se transforma em um
slip [Gomes et al., 2006].

36

Figura 2.17 Velocidade do mbolo experimental (preto) e modelo (azul)

Figura 2.18 Trajetrias de atrito idealizadas para representar o fenmeno stick-slip.

Nas Figuras 2.19 e 2.20 so apresentadas sobrepostas as presses da cmara 1 e


cmara 2 obtidas experimentalmente e atravs das simulaes referente ao enchimento e
esvaziamento das cmaras em experimento e em simulao. possvel verificar a ocorrncia
de uma concordncia entre os valores das presses calculados atravs do modelo com os
obtidos experimentalmente, salientando-se que os resultados obtidos por meio das simulaes
foram calculados utilizando os mesmos valores dos sinais de controle aplicados
experimentalmente em malha fechada.
O desempenho das variveis analisadas do modelo foi avaliado segundo critrio
Integral do Erro Absoluto (IAE - Integral of Absolute Error), e os respectivos valores esto
apresentados na Tabela 2.3.
Tabela 2.3 Resultados das simulaes usando o modelo proposto segundo critrio IAE
Critrio

IAE = h| |D1

1,42

1,13x10

&

1,16x105

37

O critrio IAE estabelece um procedimento de avaliao do desempenho do modelo


descrito por meio da Equao (2.18).
IAE = h| |D1

(2.18)

Figura 2.19 Presso na cmara 1 experimental (preto) e modelo (azul)

Figura 2.20 Presso na cmara 2 experimental (preto) e modelo (azul)

Para o treinamento das redes neurais no presente trabalho utilizou-se o fator de

aprendizagem <

0,025. A condio de parada utilizada para o treinamento backpropagation

foi de um erro de 0,01 (equivalente a 0,5%) ou mo mximo 30 iteraes para cada conjunto de
padres, sendo que cada conjunto possui 50.000 amostras (equivalente 50 s com uma
amostragem de 1 ms) conforme apresentado, por exemplo, na Figura 2.14. Foi utilizado

38

tambm um filtro butterworth de 2 ordem offline sem atraso, para os trs sinais de sensores
(posio do mbolo e presses nas cmaras) com um corte de frequncias superiores a 100
Hz, com o objetivo de eliminar rudos de mais alta frequncia.
2.10 Procedimento para o levantamento do Modelo Pneumtico Neural
Nesta seo ser apresentado um procedimento para a obteno de um modelo
pneumtico neural. Para o levantamento do modelo pneumtico neural proposto um
procedimento, composto por uma sequncia de passos da seguinte forma:
1. Levantamento de todas as constantes e parmetros do sistema, tais como:
constantes de calores especficos (Cp e Cv), temperatura de trabalho (T), relao
dos calores especficos (r), massa deslocada (M), comprimento til do cilindro
(L), rea til da seo interna do cilindro (A), etc.
2. Realizao em bancada de experimentos em malha fechada com realimentao
em posio, variando-se os ganhos do controlador proporcional, bem como o
tipo de referncia (senoidal, polinomial, degrau, etc.). Salvando os dados de
posio do mbolo (y), sinais dos sensores de presses nas cmaras (p1 e p2) e
tenso eltrica de controle calculada em malha fechada e aplicada a
servovlvula (u) para cada experimento realizado.
3. Com os dados obtidos no passo 2, obter de forma offline as seguintes
derivadas: velocidade do mbolo (5), acelerao do mbolo (56 ), derivada das
presses nas cmaras 1 e 2 (

& ).

4. Calcular a fora de atrito do sistema real (fa) atravs da Equao (2.14), as

vazes mssicas que entram e saem das cmaras 1 e 2 (,+% e ,+& ) utilizando
as Equaes (2.16) e (2.17), a varivel
Equao (2.13).

atravs da Equao (2.12) e

pela

39

5. Implementa-se uma rede neural para identificao do atrito conforme Seo


2.7, tendo como entradas a diferena das presses ( ) e velocidade do mbolo
(5) e como sada da rede a estimativa da fora de atrito ( ). Treina-se a rede

neural para a estimao do atrito utilizando o algoritmo de treinamento do

Quadro 1, tendo como padres de treinamento a velocidade 5, a diferena das


presses

e a fora de atrito (fa). Ao final do treinamento a rede neural dever

ser capaz de fornecer uma estimativa para o atrito ( ).


6. Implementa-se uma rede neural para a identificao das vazes mssicas
conforme Seo 2.8, tendo como entradas a tenso eltrica aplicada na
servovlvula (u) e presses nas cmaras 1 e 2 (p1 e p2) e como sada e

estimativa das vazes mssicas das cmaras 1 e 2 (,+% e ,+& ). Treina-se a rede
neural para a estimao das vazes mssicas utilizando o algoritmo de

treinamento do Quadro 1, tendo como padres de treinamento a tenso eltrica


aplicada na servovlvula (u), presses nas cmaras 1 e 2 (p1 e p2), as vazes

mssicas calculadas nas cmaras 1 e 2 (,+% e ,+& ). Ao final do treinamento a


rede neural dever ser capaz de fornecer uma estimativa para as vazes
mssicas das cmaras 1 e 2 (,+% e ,+& ).

7. Um modelo matemtico para o sistema pneumtico pode ser obtido utilizando-

se as Equaes (2.2)-(2.4), substituindo-se as variveis Fa, ,+% , ,+& por suas

estimativas l , ,+% e ,+& fornecidas pelas redes neurais treinadas.

Ao final do procedimento obtm-se um modelo matemtico no-linear de quarta

ordem com as seguintes variveis de estado y, 5, p1 e p2.

40

3 SISTEMA DE CONTROLE
A estratgia do controle em cascata foi desenvolvida a partir da metodologia de
reduo de ordem com desacoplamento de sistemas proposta inicialmente em [Utkin, 1987].
Esta estratgia vem sido utilizada com sucesso no controle de robs acionados eletricamente
[Guenther e Hsu, 1993], no controle de acionamentos hidrulicos [Guenther e De Pieri, 1997]
e pneumticos [Perondi, 2002; Sobczyk, 2009]. A principal caracterstica da estratgia em
cascata consiste em escrever o equacionamento do sistema na forma de dois (ou mais)
subsistemas de forma que diferentes esquemas de controle possam ser aplicados a cada um
deles de forma independente.
Assim, de acordo com a estratgia em cascata, pode-se realizar a diviso do sistema de
servoposicionamento pneumtico em dois subsistemas, de forma que um subsistema
mecnico seja acionado por uma fora gerada em um subsistema pneumtico, como
apresentado na Figura 3.1.

Figura 3.1 Interpretao do servoposicionador como dois subsistemas interconectados

Um diagrama de blocos do sistema de controle apresentado na Figura 3.2.

Figura 3.2 Diagrama em blocos da estratgia de controle em cascata neural proposta.

41

Considerando, de acordo com a Equao (2.13), a dinmica do subsistema pneumtico


escrita na forma

(3.1)

E, de acordo com a Equao (2.9), a do subsistema mecnico como


#56

(3.2)

pode-se equacionar a estratgia de controle em cascata por meio dos procedimentos


apresentados nas sees que seguem.
3.1

Seguimento no Subsistema Mecnico


A Lei de Controle de Slotine e Li para Robs, apresentada aqui em uma verso

escalar, mostra-se apropriada para aplicao na estratgia em cascata, pois permite calcular
para o caso ideal (com parmetros conhecidos) o valor do sinal de fora a ser aplicado no
subsistema mecnico para que ocorra seguimento de trajetria com convergncia do erro
tendendo a zero, medida que o tempo avana (Slotine e Li, 1998). Alm disso, como ser
mostrada adiante, a estratgia em cascata permite a avaliao da robustez do sistema quanto
presena de erros nas estimativas de parmetros e de perturbaes. Assim, de acordo com a lei
de Slotine e Li, para se obter o seguimento de trajetria no subsistema mecnico pode ser
utilizada a seguinte expresso:

onde,

#567 L

0L

(3.3)

a fora que deve ser fornecida pelo sistema pneumtico de atuao,

constante positiva,

uma estimativa para a fora de atrito,

uma

uma estimativa para a fora

externa aplicada, e 567 e 0, so, respectivamente, uma acelerao de referncia e uma medida
dos erros de seguimento de posio e velocidade.

Definem-se agora os erros de seguimento de posio, velocidade e acelerao,


respectivamente, como:
5(

5H5 ,

5(

5H5 ,

5(6

56 H 56

(3.4)

42
onde, 5 a posio desejada ao longo do tempo, enquanto sua derivada primeira e segunda

so, respectivamente, a velocidade e a acelerao desejadas. A velocidade e a acelerao de


referncia so, por sua vez, definidas como:
57 m 5 H :5(

(3.5)

567 m 56 H :5(

(3.6)

0 m 5( L :5(

(3.7)

sendo : uma constante positiva. A combinao linear dos erros de seguimento de posio e de
velocidade definida como:

e, consequentemente, sua derivada primeira pode ser expressa por:


0

5(6 L :5(

56 H 567

(3.8)

Isolando a acelerao na Equao (3.8) e substituindo na (3.2), obtm-se a expresso


para o equilbrio dinmico em funo da combinao linear dos erros de seguimento de
posio e velocidade:
#0

H#567 L I

(3.9)

Substituindo 567 (definida na Equao (3.6)) na Equao (3.9), resulta


#0

H#56 L #:5( L I

(3.10)

Define-se agora o erro no seguimento da diferena de presso:

onde

( m

a diferena de presso desejada, a ser definida com base na fora desejada


n

(3.11)
:
(3.12)

43

Atravs das Equaes (3.3), (3.11) e (3.12) pode-se expressar diferena em presso
como

#567 H

0L
I

que, substituda em (3.10), fornece


#0

H#567 H

H (

0 H I ( L #567 L

(3.13)

(3.14)

a qual, simplificada, resulta,


#0
onde

0 H I ( L

(3.15)

o erro da estimativa da funo do atrito, definido por


m

(3.16)

o erro na compensao da fora externa aplicada, definido como


m

(3.17)

A Equao (3.15) representa a dinmica da combinao linear dos erros de seguimento


de posio e velocidade, a qual ser utilizada na prova de estabilidade do sistema global de
controle.
3.2

Seguimento no Subsistema Pneumtico


Para que se consiga alcanar o seguimento da fora no subsistema pneumtico foi

proposto em [Perondi, 2002], o controle da seguinte forma


op

com

H I0 H

! (o

(3.18)

a derivada em funo do tempo da diferena de presso desejada,

positiva para o ganho do erro na diferena de presso e

uma constante

a estimativa na reconstruo da

44

funo

. O desenvolvimento de uma funo inversa (difeomorfismo) para a reconstruo do


= %,

sinal de controle

& , 5,

@ proposto no Apndice III.

Para se obter a dinmica do erro da diferena das presses substitui-se a equao


(3.18) em (3.1)
(
onde

! (o

H I0 L

o erro na reconstruo da funo

(3.19)
pela estimativa

devido a incertezas

paramtricas.
A Equao (3.19) representa a dinmica do erro da diferena das presses nas cmaras
a qual ser utilizada na prova de estabilidade do sistema global de controle.
3.3

Anlise de Estabilidade
Nesta seo ser apresentada a anlise de estabilidade via Lyapunov. Seja a funo

candidata a Lyapunov
2

#0 & L 5( & L (o&

(3.20)

V representa a funo candidata Lyapunov onde 0 a combinao linear dos erros de


seguimento de posio e de velocidade, 5( o erro em posio, (o erro da diferena das
presses, # a massa total deslocada e

uma constante positiva a ser definida.

Substituindo a combinao linear dos erros de seguimento de posio e velocidade

expressa por meio da Equao (3.7) na (3.20), resulta:


2

=:& # L @5( & L 2:#5(5( L #5( & L (o&

(3.21)

Pode-se, ento, reescrever a Equao (3.21) na forma quadrtica matricial:


2

9S $% 9

(3.22)

45

onde se utilizam as seguintes definies

$%

5(
9 m T 5( U
(

:& # L
q :#
0

(3.23)
:#
#
0

0
0r
1

(3.24)

A derivada em funo do tempo da funo candidata a Lyapunov expressa por


#00 L 5(5( L ( ( .

(3.25)

Substituindo agora as Equaes (3.15) e (3.19) na (3.25), resulta


[H

0 H I ( L

]0 L 5(5( L [H

! (o

L I0 L

] (

(3.26)

que, simplificada, pode ser reescrita como:


H

0 & L 5(5( H

! (o

&

0L

0L

(3.27)

Utilizando a combinao linear do erro de posio e velocidade (Equao (3.7))


obtm-se
H

=5 H 57 @& L 5(5( H

! (o

&

0L

0L

(3.28)

Substituindo a expresso para a velocidade de referncia (Equao (3.5)) na Equao


(3.28), resulta
H

=5 H 5 L :5(@& L 5(5( H

! (o

&

0L

0L

(3.29)

Usando agora a expresso para a derivada primeira no tempo do erro de posio


(Equao (3.4)), tem-se:

46

[5( L :5(] L 5(5( H

5( & L = H 2

&

:@5(5( H :&

! (o

&

5( & H

0L

! (o

&

0L

0L

0L

Para simplificar a Equao (3.31) pode-se definir a constante


m2

(3.30)
(

(3.31)

como:
(3.32)

resultando
H

5( & H :&

5( & H

! (o

&

0L

0L

(3.33)

que est na forma


t
H9S $& 9 L 9S l L 9S l L 9S s
com

:&
$& m T 0
0

0
0

0
0U

l m T: U
0
l m T: U
0

0
t mq0r
s
3.4

(3.34)

(3.35)

(3.36)

(3.37)

(3.38)

Anlise de Estabilidade - Caso Ideal


Considere o caso ideal, com o erro paramtrico nulo para a reconstruo da funo

bem como nulas as estimativas das foras externas e do atrito, tem-se:

47
l

t
s

vw
u

(3.39)

Desta forma, a Equao (3.34) resulta:


H9S $& 9

(3.40)

Considerando agora o seguinte teorema do coeficiente de Rayleigh [Noble e Daniel,


1986]:
Teorema do coeficiente de Rayleigh (Rayleigh coefficient): Seja I x y

uma

matriz simtrica, positiva semi-definida com os seguintes autovalores :% { | { : { 0.

Ento, para todo P x y , : }

~ ~
~~

} :% , onde : so os autovalores de I ordenados em

ordem decrescente. Alm disso, o lado direito se tornar uma igualdade, caso P seja o

autovetor

de I, correspondente ao maior autovalor :% .

Ento, segundo o teorema de Rayleigh


:% 9S 9 } 9S $% 9 } :% 9S 9

:& 9S 9 } 9S $& 9 } :& 9S 9


:& 9S 9 } 9S $& 9
9S $% 9 } :% 9S 9

(3.41)
(3.42)
(3.43)
(3.44)

sendo :% e :& os menores autovalores e :% e :& os maiores autovalores de $% e $& ,


respectivamente. Definindo-se agora, a seguinte relao entre autovalores:
;m

:&
:%

A partir de (3.43),(3.44) e (3.45), tem-se:

(3.45)

48
;}

9S $& 9
9S $% 9

(3.46)

ou ainda,
;9S $% 9 } 9S $& 9

(3.47)

Alm disso, de (3.22) e (3.40), tem-se:


2; } H

(3.48)

=1@ L 2; =1@ } 0

(3.49)

Considerando agora o Lema da simples convergncia [Slotine e Li, 1991]


Lema da simples convergncia: Se uma funo real =1@ satisfaz a inequao

=1@ L =1@ } 0 onde um nmero real, ento =1@ } =0@

\*

Pode-se escrever:
=1@ } =0@

\&*

A Equao (3.50) nos informa que a funo

para zero a uma taxa maior do que 2;.


3.5

(3.50)
=1@ converge para exponencialmente

Anlise de Estabilidade - Caso com Erros Paramtricos e na Estimativa das


Perturbaes
Para o caso em que as estimativas das foras externas e do atrito so no nulas bem

como erro paramtrico para a reconstruo da funo

, da Equao (3.34) tem-se:

t
H9S $& 9 L 9S l L 9S l L 9S s

t so escalares, pode-se escrever:


Como 9S l , 9S l e 9S s

(3.51)

49
He9S l e } 9S l } e9S l e

(3.52)

He9S l e } 9S l } e9S l e

(3.53)

t e } 9S s
t } e9S s
t e
He9S s

(3.54)

Considerando agora a inequao de Cauchy-Schwarz, enunciada como [Noble e


Daniel, 1986]:

Inequao de Cauchy-Schwarz: Para todo P e 5 x y


|P S 5| } P& 5&

z%

Pode-se escrever:
H9& l & } e9S l e } 9& l &
H9& l & } e9S l e } 9& l &

t } e9S s
t e } 9& s
t
H9& s
&
&

(3.55)
(3.56)
(3.57)

Substituindo as inequaes (3.55) a (3.57) nas inequaes (3.52) a (3.54), tem-se:


H9& l & } He9S l e } 9S l } e9S l e } 9& l &
H9& l & } He9S l e } 9S l } e9S l e } 9& l &

t } He9S s
t e } 9S s
t } e9S s
t e } 9& s
t
H9& s
&
&

(3.58)
(3.59)
(3.60)

Portanto:
9S l } 9& l &
9S l } 9& l &

t } 9& s
t
9S s
&

(3.61)
(3.62)
(3.63)

50

Agora, usando novamente o teorema de Rayleigh, tem-se:


9S $& 9 { :& 9S 9

(3.64)

H9S $& 9 } H:& 9S 9

(3.65)

ou

Utilizando agora as inequaes (3.61)-(3.63) e aplicando a inequao (3.65) em (3.51),


resulta na seguinte inequao para a derivada da funo candidata Lyapunov
t
} H:& 9S 9 L 9& l & L 9& l & L 9& s
&

(3.66)

t }s
t para a
Supondo que exista um limite superior l & } l , l & } l , s
&

t , tem-se, portanto:
norma dos vetores l , l e s

t 9&
} H:& 9S 9 L l 9& L l 9& L
s

(3.67)

E, a partir da definio de norma euclidiana de dois vetores


%

9&

=9S 9@&

(3.68)

9S 9

9& &

(3.69)

ou

Aplicando agora a equao (3.69) na (3.67), tem-se:

ou

&
t 9&
} H:& 9& L l 9& L l 9& L
s

t M 9&
} JH:& 9& L l L l L
s

Assim, para que

seja negativa, i.e.

0, basta que:

(3.70)
(3.71)

51
t M 9& 0,
} JH:& 9& L l L l L
s

(3.72)

ou seja:
t 0
H:& 9& L l L l L
s
Assim, uma condio suficiente para que
9&

(3.73)

seja negativa definida

t
l L l L
s
:&

(3.74)

A inequao (3.74) indica que existe uma regio compacta para a norma do vetor dos

erros 9, fora da qual a derivada da funo Lyapunov se torna negativa, fazendo com que o

vetor dos erros convirja novamente para dentro desta regio compacta. O tamanho desta
regio depende diretamente dos erros das estimativas das foras de atrito e externa, do erro
paramtrico na estimao da funo
os termos da matriz $& .

e inversamente dos ganhos :,

que compem

52

4 RESULTADOS DE SIMULAES E EXPERIMENTOS


Neste captulo so apresentados resultados obtidos por meio de simulaes e de testes
realizados na bancada experimental. As simulaes foram realizadas utilizando o modelo
pneumtico neural descrito no Captulo 2, enquanto os experimentos foram realizados na
bancada experimental descrita na Seo 2.1. O tempo de ciclo de controle utilizado em ambos
os casos de 1 ms.
4.1

Trajetrias de Referncia
As trajetrias de referncias utilizadas nas simulaes e testes experimentais dos

controladores em malha fechada esto descritas nesta seo. Estas trajetrias foram
selecionadas de forma que os resultados do presente estudo possam ser comparados com os de
trabalhos prvios realizados em bancadas semelhantes [Perondi, 2002; Sobczyk, 2009;
Suzuki, 2010].
Assim, foram utilizadas duas trajetrias distintas: uma senoidal descrita por

onde +

57 =1@

0 C=1@

(4.1)

uma constante com o valor da amplitude mxima da trajetria em cada direo e

a sua frequncia. Os valores numricos utilizados so +

= 0,45 m e = 2 rad/s.

Outra trajetria utilizada a formada por segmentos polinomiais de 7 ordem, com a

seguinte estrutura:

57 =1@
onde,

'~ =1/2@

H 0,4

0}12
0,4
2 } 1 4

H5 '~ [=1 H 4@/2] L 0,4 4 } 1 6


6}18
H0,4

'~ =1@

H161 L 561 H 67,21 L 281

(4.2)

(4.3)

A funo de referncia senoidal permite avaliar o erro no seguimento de trajetrias,


enquanto a referncia polinomial permite tanto uma avaliao das caractersticas do

53

controlador aplicado ao seguimento da trajetria quanto do seu erro de regime. Cabe salientar
que o seguimento suave das trajetrias de referncia, consiste em um grande desafio no
controle de sistemas pneumticos, principalmente quando utilizado para pequenas cargas.
Esta condio ser discutida ao longo deste trabalho, medida que os resultados forem sendo
apresentados.
4.2

Comparao entre o modelo pneumtico neural e experimento em bancada com


ambos em Malha Fechada
Primeiramente sero apresentados os resultados de comparaes em malha fechada

para o modelo pneumtico por serem considerados de menor importncia para a validao do
modelo em relao aos resultados de simulaes em malha aberta para o modelo. Pois
resultados em malha fechada tendem esconder defeitos na modelagem.
Nesta seo so apresentados e discutidos os resultados em malha fechada para uma
referncia senoidal, obtidos por meio de simulaes utilizando o modelo pneumtico neural e
os resultados experimentais obtidos na bancada para o caso de aplicao de uma estratgia de
controle proporcional para a posio.
Em todos os experimentos, foram utilizados filtros butterworth passa-baixas de
primeira ordem nos sinais dos sensores de posio do mbolo e de presses nas cmaras
&

com um corte de frequncia de 250 rad/s. 150 rad/s, 150 rad/s respectivamente.

A estratgia de controle utilizada tanto em simulao quanto para a obteno dos

resultados experimentais foi, portanto


=1@

=57 =1@ H 5=1@@

(4.4)

onde =1@ a tenso eltrica de controle, 57 =1@ a trajetria de referncia, 5=1@ a posio do
mbolo e

a constante de ganho de controle com valor

6. Este controlador possui

limitaes para a aplicao proposta, sendo estes testes realizados principalmente para
permitir a avaliao da capacidade das redes neurais em predizer (generalizar ou extrapolar
em linguagem de redes neurais) resultados ainda no treinados. Esse valor de ganho no foi
utilizado para a obteno dos padres de treinamentos das redes neurais, principalmente para

54

verificar o desempenho da rede na generalizao de padres no treinados. Nos treinamentos


os valores usados foram

4e

10.

A Figura 4.1 apresenta uma simulao em malha fechada realizada com o modelo
pneumtico neural. O objetivo desta simulao verificar se os resultados obtidos para as
amplitudes das variveis so semelhantes as dos experimentos prticos realizados na bancada
utilizando o mesmo ganho de controle.
Na Figura 4.1 apresentado o resultado das simulaes para a posio do mbolo do
cilindro atuador e seu erro com relao referncia senoidal. Na Figura 4.2 apresentado o
resultado obtido na bancada experimental para a posio do mbolo (5) e seu respectivo erro
com relao mesma referncia senoidal. Analisando ambos os grficos, verifica-se que tanto
a simulao como o resultado experimental possuem valores de amplitudes mximas
semelhantes, resultando em um erro de seguimento de trajetria de aproximadamente 15 cm
nos valores de pico.

Figura 4.1 Posio do mbolo do cilindro atuador e seu respectivo erro em simulao para sinal de
controle proporcional (MF) e referncia senoidal

A Figura 4.3 apresenta o resultado de simulao para a velocidade do mbolo do


cilindro atuador e o sinal calculado por meio da lei de controle em malha fechada na
simulao. J, na Figura 4.4 apresentado o resultado obtido na bancada experimental para a
velocidade do mbolo (5) e o sinal calculado por meio da lei de controle ( ) em malha
fechada nos experimentos. Verifica-se novamente que as amplitudes dos sinais de velocidade

55

e de controle so compatveis, pois o modelo pneumtico neural consegue representar o


comportamento do sistema fsico real.

Figura 4.2 Posio do mbolo do cilindro atuador e seu respectivo erro experimental para sinal de
controle proporcional (MF) e referncia senoidal

Figura 4.3 Velocidade do mbolo e sinal de controle em simulao (MF) para referncia senoidal

Os grficos apresentando as curvas das presses nas cmaras do cilindro do atuador


e

&)

podem ser visualizados na Figura 4.5, enquanto os resultados obtidos nos

experimentos esto na Figura 4.6. Verificou-se que os sinais de presso apresentam


amplitudes com valores semelhantes para ambas as cmaras.

56

Figura 4.4 Velocidade do mbolo e sinal de controle experimental (MF) para referncia senoidal

Figura 4.5 Presses nas cmaras

&

em simulao (MF) para referncia senoidal

Figura 4.6 Presses nas cmaras

&

experimental (MF) para referncia senoidal

57

4.3

Comparao entre experimento em bancada em malha fechada e modelo pneumtico


neural em malha aberta para referncia senoidal
Tendo em vista que simulaes em malha fechada podem compensar e assim encobrir

possveis erros na modelagem, sero apresentados a seguir resultados de simulaes em malha


aberta, utilizando como sinal de controle os mesmos sinais aplicados na bancada experimental
e salvos em arquivo. Desta forma, a simulao ser agora realizada em malha aberta e o
modelo pneumtico neural ter como sinal de entrada os mesmos valores numricos gerados
pelo controlador P nos experimentos realizados na bancada pneumtica em malha fechada.
Assim, as simulaes, apesar de serem realizadas em malha aberta, respondem a um sinal de
controle calculado experimentalmente em malha fechada. Com isso, as respostas dos
experimentos realizados em malha fechada podem ser comparadas com as respostas das
simulaes realizadas, por sua vez, em malha aberta.
A Figura 4.7 apresenta o sinal de controle calculado no experimento realizado na
bancada e salvo em arquivo digital. Esse sinal foi posteriormente aplicado como controle em
malha aberta na realizao de simulao.

Figura 4.7 Sinal de controle calculado em experimento de bancada e aplicado em MF no mesmo


experimento, o qual foi salvo em arquivo digital e aplicado como controle em MA na simulao

A Figura 4.8 apresenta os resultados de posio do atuador pneumtico do


experimento na bancada em malha fechada sobrepostos com o das simulaes do modelo em
malha aberta usando os valores de controle calculados em tempo real na bancada pneumtica.
Verifica-se que o modelo consegue reproduzir de forma adequada os resultados obtidos

58

experimentalmente, podendo-se concluir que o modelo consegue ter predizer uma estimativa
da resposta em posio do mbolo do cilindro pneumtico experimental.

Figura 4.8 Comparao de resultados experimental (MF) e em simulao (MA) para a posio do
mbolo

Os resultados obtidos por meio de simulao e de experimentos para a velocidade do


mbolo do cilindro so apresentados na Figura 4.9. Com base nestes resultados verifica-se
uma semelhana entre os valores numricos das mesmas bem como nas frequncias de
oscilao.

Figura 4.9 Comparao de resultados experimental (MF) e em simulao (MA) para a velocidade do
mbolo

59

As Figuras 4.10 e 4.11 apresentam os resultados de simulao e experimento para as


presses nas cmaras do cilindro atuador (

& ).

Verifica-se que os grficos apresentam

resultados com amplitudes de ordem semelhante de grandeza para as presses nas cmaras.

Figura 4.10 Comparao de resultados experimental (MF) e em simulao do modelo pneumtico


neural (MA) para a presso na cmara %

Figura 4.11 Comparao de resultados experimental (MF) e em simulao do modelo pneumtico


neural (MA) para a presso na cmara &

Conforme anteriormente afirmado, o ganho do sinal de controle escolhido para


comparar os resultados no foi utilizado no treinamento das redes neurais, mostrando a
capacidade de generalizao das redes neurais treinadas e utilizadas nas simulaes (atrito e
vazes mssicas). A mesma rede neural treinada para a identificao do atrito e utilizada no

60

modelo foi aplicada no esquema de compensao do mesmo em tempo real no algoritmo de


controle Cascata Neural.
Com base nos resultados apresentados nas Figuras 4.8 a 4.11, pode-se concluir que o
modelo neural do atuador pneumtico apresenta resultados satisfatrios na reproduo por
simulao do comportamento do sistema real, podendo, portanto, ser usada na determinao
inicial dos ganhos dos controladores utilizados nos experimentos, conforme apresentados nas
sees que seguem.
4.4

Resultados experimentais do controlador

Nesta seo so analisados e comparados os resultados experimentais em malha


fechada com os de simulaes realizadas por meio do modelo neural em malha aberta
utilizando uma estratgia de controle
A estratgia de controle tipo
=1@

=57 =1@ H 5=1@@ H

apresentada por meio da Equao (4.5)

G =57 =1@

H 5=1@@ H

[ 7 =1@

onde 57 a velocidade de referncia, 5 a velocidade do mbolo,

desejada calculada por meio da lei de Slotine e Li (Equao 3.12),


presses nas cmaras,
velocidade e

a constante de ganho em posio,

=1@]

(4.5)

a diferena de presso

a diferena entre as

a constante de ganho em

a constante de ganho em diferena de presso. Os ganhos utilizados esto

apresentados na Tabela 4.1.


Tabela 4.1 Ganhos utilizados no controlador PVP

65

4 z 10\

As Figuras 4.12 a 4.14 apresentam os resultados em malha fechada para uma


referncia senoidal usando a estratgia de controle PVP sobrepostos com os resultados da
simulao usando o modelo neural em malha aberta.
Para a obteno desses resultados procedeu-se da mesma forma que na Seo 4.3.
Primeiramente foram realizados os experimentos em bancada usando o controle

em

malha fechada. Os valores numricos dos sinais de controle aplicados nos experimentos foram
salvos e aplicados posteriormente em malha aberta como sinal de entrada no modelo neural.

61

A Figura 4.12 apresenta a curva de posio obtida experimentalmente em malha


fechada para uma referncia senoidal sobreposta com a curva de posio fornecida pelo
modelo em malha aberta. Os grficos apresentam valores de pico de aproximadamente 3 cm
para o experimental erro de posio. A sobreposio dos resultados do experimento em malha
fechada com os da simulao em malha aberta serve, mais uma vez, para avaliar o modelo
neural apresentado no Captulo 2.

Figura 4.12 Comparao entre posies do mbolo experimental (controle


com trajetria
senoidal) e em simulao em malha aberta do modelo, bem como seus respectivos erros

A Figura 4.13 apresenta os grficos para as velocidades e sinal de controle aplicado


em experimento e simulao. No grfico das velocidades verifica-se uma boa semelhana
entre as frequncias da curva experimental e da obtida na simulao. Os ganhos do
controlador foram escolhidos de forma que o sinal de controle no apresentasse
comportamentos de alta frequncia que excitassem as dinmicas (no modeladas) da vlvula
de controle. Em resultados experimentais realizados com valores de ganhos maiores
verificou-se a presena de oscilaes com maiores amplitudes principalmente no sinal de
velocidade.

62

Figura 4.13 Velocidades e sinal de controle experimental


e em simulao em malha aberta
para trajetria de referncia senoidal

Os grficos com a sobreposio dos resultados de experimento e do modelo para as


presses nas cmaras so apresentados na Figura 4.14.

Figura 4.14 Presses nas cmaras do atuador experimental


e em simulao em malha aberta
para trajetria de referncia senoidal

As Figuras 4.15 a 4.17 apresentam resultados experimentais em malha fechada para


uma referncia polinomial utilizando a estratgia de controle

, sobrepostos com os

resultados obtidos em simulao por meio do modelo neural em malha aberta.

63

A Figura 4.15 apresenta a trajetria de posio obtida experimentalmente em malha


fechada para uma referncia polinomial juntamente com a trajetria de posio obtida por
meio de simulao em malha aberta.

Figura 4.15 Comparao entre posies do mbolo experimental (controle


com trajetria
polinomial) e em simulao em malha aberta do modelo, bem como seus respectivos erros

A Figura 4.16 apresenta os grficos para as velocidades e para o sinal de controles no


experimento e na simulao.

Figura 4.16 Velocidades e sinal de controle experimental


e em simulao em malha aberta
para trajetria de referncia polinomial

Os grficos com a sobreposio dos resultados experimentais e de simulaes para as


presses nas cmaras so apresentados na Figura 4.17. Pode-se notar atravs das curvas das
presses nas cmaras, quando o mbolo est parado, que ocorre um esvaziamento das cmaras

64

por efeito principalmente de vazamentos na servovlvula. A ocorrncia deste fenmeno


tambm nas simulaes indica que o modelo pneumtico neural conseguiu atravs do
treinamento, considerar este efeito, mesmo sem ter sido realizado qualquer procedimento
especfico para a identificao deste efeito

Figura 4.17 Presses nas cmaras do atuador experimental


e em simulao em malha aberta
para trajetria de referncia polinomial

Com base nas Figuras 4.12 e 4.15 percebe-se a ocorrncia de um erro mximo de
aproximadamente 3 cm no seguimento de trajetrias e menores que 2 cm no erro ponto a
ponto para a estratgia de controle

Nas prximas sees sero apresentados apenas os resultados experimentais obtidos


atravs da aplicao do controlador cascata neural proposto no Captulo 3.

4.5

Resultados do controlador Cascata Neural com compensao de atrito


Nesta seo so apresentados os resultados experimentais, utilizando o controlador

Cascata Neural descrito no Captulo 3, o qual realiza a compensao do atrito por meio de
estimativas realizadas por redes neurais. Os ganhos utilizados nos testes com o controlador
Cascata Neural esto apresentados na Tabela 4.2.
Tabela 4.2 Ganhos utilizados no controlador Cascata Neural
:
180
10
36

65

Esses ganhos foram obtidos atravs simulaes em experimentos com diferentes tipos
de trajetrias. possvel verificar com base na Figura 4.18 que o erro no seguimento de
trajetria mantm-se inferior a 1,5 cm. importante salientar que o atuador opera sem massa
na carga, ou seja, sua massa total de 293,15 g, que corresponde ao mbolo do pisto. Esta
situao dificulta o seguimento de trajetrias, principalmente em baixas velocidades, estando,
provavelmente, associada relao entre a fora de atrito e a fora inercial, resultando no fato
de que a fora aplicada apresentar valores prximos aos da fora estimada de atrito (como
ser mostrado na Figura 4.21), o que, devido sua natureza (altamente no-linear), com fatos
estocsticos e variantes no tempo, difcil de controlar. Esta afirmao pode ser comprovada
na Seo 4.8, onde so apresentados os resultados com a adio de massa de 5 kg.

Figura 4.18 Posio do mbolo e seu respectivo erro experimental para o controlador cascata neural
com trajetria de referncia senoidal

A Figura 4.19 apresenta os grficos da velocidade e do sinal de controle aplicado.


Destaca-se o baixo nvel de sinais de altas frequncias tanto na velocidade quanto no controle,
permitindo que o movimento seja suave.

66

Figura 4.19 Velocidade do mbolo e sinal de controle experimental para o controlador cascata neural
com trajetria de referncia senoidal

A Figura 4.20 apresenta as presses nas cmaras

&,

bem como o sinal s da

combinao linear dos erros de posio e velocidade utilizado pelo controlador.

Figura 4.20 Presses nas cmaras % e & experimental e sinal de erro s para o controlador cascata
neural com trajetria de referncia senoidal

Os grficos sobrepostos do sinal da fora desejada calculada pela lei de Slotine e Li


(que corresponde fora total desejada incluindo a estimativa neural do atrito), da fora
aplicada e da estimativa da fora de atrito esto apresentados na Figura 4.21.

67

Figura 4.21 Fora desejada calculada pela lei de Slotine e Li em relao fora aplicada e respectivo
erro em fora experimental para o controlador cascata neural com trajetria de referncia senoidal

Conforme mencionado, o sinal da estimao da fora de atrito apresenta valores


prximos ao da fora aplicada. Verifica-se que o erro no seguimento de fora mantm-se
abaixo de 10 N. A Figura 4.22 apresenta as estimativas
fora de atrito

e a estimativa da derivada da

via redes neurais alguns dos sinais utilizados pelo controlador Cascata

Neural.

Figura 4.22 Variveis

utilizadas no controlador cascata neural com trajetria de


referncia senoidal

68

Com base nas Figuras 4.18 a 4.22 possvel verificar que o controlador Cascata
Neural consegue seguir seguimentos de trajetrias senoidais com erros inferiores a 1,5 cm de
forma suave, isto , sem excitar altas frequncias no sistema.
As Figuras 4.23 a 4.27 apresentam o desempenho da estratgia de controle Cascata
Neural para uma referncia do tipo polinomial. Essa escolha foi realizada visando facilitar a
anlise do desempenho do Controlador Neural em uma aplicao que se aproxima de um
problema de controle ponto a ponto.
A Figura 4.23 apresenta o resultado de seguimento de trajetria polinomial de stima
ordem, conforme descrito na Seo 4.1. Verifica-se que o controlador apresenta desempenho
satisfatrio no seguimento da trajetria polinomial, com erro mximo de aproximadamente
1,1 cm no seguimento de trajetrias e menores que 6 mm no erro ponto a ponto. A Figura 4.24
apresenta os grficos de velocidade e de sinal de controle aplicado. Novamente, a estratgia
de controle apresenta baixo nvel de sinais de alta frequncia no controle e no sinal de
velocidade do mbolo do atuador pneumtico. Na Figura 4.25 so apresentadas as presses
nas cmaras

&,

bem como o sinal de combinao linear dos erros de posio e

velocidade s utilizado pelo controlador.

Figura 4.23 Posio do mbolo e seu respectivo erro experimental para o controlador cascata neural
com trajetria de referncia polinomial

69

Figura 4.24 Velocidade do mbolo e sinal de controle experimental para o controlador cascata neural
com trajetria de referncia polinomial

Figura 4.25 Presses nas cmaras % e & experimental e sinal de erro s para o controlador cascata
neural com trajetria de referncia polinomial

A superposio dos sinais da fora desejada (calculada pela lei de Slotine e Li) com o
da fora aplicada est apresentada na Figura 4.26. Verifica-se que o erro do seguimento de
fora ficou abaixo de 8 N.

70

Figura 4.26 Fora desejada calculada pela lei de Slotine e Li em relao fora aplicada e respectivo
erro em fora experimental para o controlador cascata neural com trajetria de referncia polinomial

A Figura 4.27 apresenta as estimativas

e a derivada da fora de atrito estimada

via redes neurais.

Figura 4.27 Variveis

utilizadas no controlador cascata neural com trajetria de


referncia polinomial

Com base nas Figuras 4.23 a 4.27 possvel verificar que o controlador Cascata
Neural consegue seguir seguimentos para uma referncia tipo polinomial com erros inferiores
a 1,2 cm, sem excitar altas frequncias no sistema.

71

4.6

Resultados do controlador Cascata Neural sem compensao de Atrito


Como forma de mostrar a importncia da compensao do atrito no desempenho da

estratgia de controle sero apresentados a seguir os resultados com o controlador Cascata


Neural sem a compensao de atrito. importante salientar que a estratgia de controle
Cascata Neural utiliza trs redes neurais, uma para a estimao das foras do atrito, outra para
a estimao da derivada do atrito e uma ltima para o clculo da inversa do sinal de controle.
Os resultados apresentados a seguir so, portanto, referentes estratgia de controle
utilizando uma rede neural, apenas para o clculo da inversa do sinal de controle.
Os ganhos utilizados so os mesmos que esto apresentados na Tabela 4.2. A Figura
4.28 apresenta o resultado da aplicao da estratgia de controle Cascata Neural sem a
compensao de atrito. Pode-se perceber, com base nos resultados apresentados na Figura
4.28, que o erro no seguimento de trajetria resultou mais elevado (na ordem dos 15 cm) do
que os obtidos anteriormente. Estes resultados poderiam ser melhores com uma melhor
seleo nos ganhos do controlador. Em [Perondi, 2002] aps um ajuste de ganhos o
controlador cascata sem compensao de atritos apresentou erros na ordem de 10 cm para o
seguimento da mesma trajetria senoidal e massa de aproximadamente 3 kg. importante
destacar que o experimento aqui apresentado possui uma carga com cerca de 10% da utilizada
em [Perondi, 2002].

Figura 4.28 Posio do mbolo e seu respectivo erro experimental para o controlador cascata neural
com trajetria de referncia senoidal sem compensao de atrito

72

A Figura 4.29 apresenta os grficos para a velocidade e sinal de controle aplicado.


Com a retirada da compensao do atrito, pode-se perceber a presena de componentes de
altas frequncias no sinal de controle, alm da ocorrncia do fenmeno stick-slip, devido ao
atrito, de forma mais acentuado.

Figura 4.29 Velocidade do mbolo e sinal de controle experimental para o controlador cascata neural
com trajetria de referncia senoidal sem compensao de atrito

Uma comparao entre a fora desejada calculada pela lei de Slotine e Li e a fora
aplicada feita a partir dos resultados apresentados na Figura 4.30. O erro de seguimento de
fora ficou abaixo de 6 N, apesar do erro em posio ser elevado. Isto mostra que o
controlador cascata possui boa capacidade de seguimento de fora, e que o erro de posio
ocorre principalmente por conta de a fora desejada no garantir uma compensao adequada
do atrito.

73

Figura 4.30 Fora desejada calculada pela lei de Slotine e Li em relao fora aplicada e respectivo
erro em fora experimental para o controlador cascata neural com trajetria de referncia senoidal sem
compensao de atrito

O grfico relativo ao seguimento da trajetria polinomial utilizando a estratgia


Cascata Neural sem a compensao explcita do atrito apresentado na Figura 4.31. Neste
caso, as respostas do controlador sem compensao explcita mostram-se com erros maiores
do que com compensao. Observa-se que o erro de regime para este tipo de trajetria ficou
em torno de 10 cm.

Figura 4.31 Posio do mbolo e seu respectivo erro experimental para o controlador cascata neural
com trajetria de referncia polinomial sem compensao explcita de atrito

74

A Figura 4.32 apresenta os grficos para a velocidade e sinal de controle aplicado.


Tambm verificado um sinal de controle com maior intensidade de componentes de altas
frequncias em comparao com o obtido utilizando o controlador Cascata Neural com
compensao de atrito.

Figura 4.32 Velocidade do mbolo e sinal de controle experimental para o controlador cascata neural
com trajetria de referncia polinomial sem compensao de atrito

A superposio das curvas da fora desejada calculada pela lei de Slotine e Li e a fora
aplicada apresentada na Figura 4.33. Verifica-se que o sinal fica contaminado por
componentes de alta frequncia, o que indesejvel, pois em situaes extremas, estas podem
excitar dinmicas no modeladas, podendo, inclusive, levar o sistema a instabilidade.

Figura 4.33 Fora desejada calculada pela lei de Slotine e Li em relao fora aplicada e respectivo
erro em fora experimental para o controlador cascata neural com trajetria de referncia senoidal sem
compensao de atrito

75

4.7

Resultados do controlador Cascata Neural com compensao de Atrito e adio de


massa
Conforme j comentado, visando a avaliar as caractersticas do controlador com

compensao explicita do atrito proposto foi adicionada uma massa de 5 kg como carga a ser
movimentada pelo o mbolo do cilindro atuador. As respostas apresentadas nas Figuras 4.34 a
4.39, foram obtidas utilizando os valores dos ganhos apresentados na Tabela 4.2. Desta forma,
possvel avaliar a robustez da estratgia proposta frente a uma expressiva variao da massa
deslocada.
A Figura 4.34 apresenta o resultado experimental da posio do mbolo do atuador
usando o controlador Cascata Neural com compensao de atrito e com a adio de carga com
massa de 5 kg, no seguimento de uma referncia senoidal. Com base nas Figuras 4.18 e 4.34,
possvel concluir que o controlador consegue seguir a trajetria desejada de forma
semelhante em ambos os casos, mas com um pequeno incremento do erro de seguimento de
trajetria.
A Figura 4.35 apresenta os grficos da velocidade e do sinal de controle aplicado, os
quais apresentam um baixo nvel de oscilao de altas frequncias.
Com base nos resultados apresentados, possvel afirmar que o controlador
desenvolvido apresenta caractersticas favorveis com relao a robustez quanto variao
paramtrica da carga deslocada, sendo esta uma caracterstica muito importante para sistemas
robticos e manipuladores em geral, pois essa variao de carga deslocada uma situao
operacional muito comum nas aplicaes industriais.

76

Figura 4.34 Posio do mbolo e seu respectivo erro experimental para o controlador cascata neural
com trajetria de referncia senoidal e adio de massa

Figura 4.35 Velocidade do mbolo e sinal de controle experimental para o controlador cascata neural
com trajetria de referncia senoidal e adio de massa

Figura 4.36 Foras e respectivo erro para o controlador cascata neural com trajetria de referncia
senoidal e adio de massa

77

Resultados com adio de carga e referncia polinomial esto apresentados nas


Figuras 4.37 a 4.39. Os resultados relativos aos erros de regime mostram-se melhores do que
os obtidos nos experimentos sem carga adicional conforme pode ser observado na Figura
4.37, verificando-se que o erro mximo de regime da ordem de 2 mm.

Figura 4.37 Posio do mbolo e seu respectivo erro experimental para o controlador cascata neural
com trajetria de referncia polinomial e adio de massa

Observando o grfico da velocidade apresentado na Figura 4.38 possvel perceber


que o movimento relativamente suave e que o sinal de controle no apresenta componentes
significativas de altas frequncias. A Figura 4.39 apresenta as curvas de seguimento de fora
com adio de carga para a trajetria desejada polinomial.
Conforme destacado no incio desta seo, os ganhos utilizados nos experimentos
apresentados at o momento com carga adicional de 5 kg so os mesmos sintonizados para
sistema sem carga adicional. A seguir so apresentados os resultados com carga adicional
com os ganhos ajustados para um melhor desempenho nessa situao.

78

Figura 4.38 Velocidade do mbolo e sinal de controle experimental para o controlador cascata neural
com trajetria de referncia polinomial e adio de massa

Figura 4.39 Foras e respectivo erro para o controlador cascata neural com trajetria de referncia
polinomial e adio de massa

4.8

Resultados do controlador Cascata Neural com compensao de atrito com adio de


massa com aumento nos ganhos
Na Seo 4.7 foram apresentados os resultados experimentais referentes situao de

adio de massa de carga de 5 kg sem que houvesse um ajuste nos ganhos do controlador.
Nesta seo sero apresentados os resultados referentes situao em que foi realizado um
ajuste de ganhos nos parmetros do controlador Cascata Neural com a compensao de atrito.
O objetivo desta seo mostrar que o controle de sistemas pneumticos pode ser favorecido

79

com o aumento da carga movimentada em problemas de seguimento de trajetria. Os ganhos


do controlador utilizados nos experimentos esto apresentados na Tabela 4.3.
Tabela 4.3 Ganhos modificados utilizados no controlador Cascata Neural
:
250
7
250

A Figura 4.40 apresenta o grfico da resposta de posio e seu respectivo erro de


seguimento de trajetria com o novo ajuste dos ganhos do controlador Cascata Neural com
compensao de atrito. Pode-se observar com base nos resultados a ocorrncia de uma
reduo no erro de seguimento de trajetria quando comparados com os da Figura 4.18
referente ao caso sem acrscimo de massa, onde os erros de pico atingiram valores de at 1,4
cm.

Figura 4.40 Posio do mbolo e seu respectivo erro experimental para o controlador cascata neural
com trajetria de referncia senoidal e adio de massa com ganhos modificados

Os grficos da velocidade e de sinal de controle esto apresentados na Figura 4.41.

80

Figura 4.41 Velocidade do mbolo e sinal de controle experimental para o controlador cascata neural
com trajetria de referncia senoidal e adio de massa com ganhos modificados

Apesar de a velocidade no apresentar oscilaes significativas, verifica-se a presena


de componentes indesejveis de altas frequncias no sinal de controle, as quais podem excitar
dinmicas no modeladas. As foras calculadas e o respectivo erro so mostrados na Figura
4.42. Da mesma forma que os resultados dos testes anteriormente apresentados, no presente
caso os erros mximos de seguimento de fora ficaram em cerca de 10 N. Conforme discutido
anteriormente, pode-se atribuir as melhorias dos resultados com o aumento de massa ao efeito
benfico da relao fora inercial/atrito necessrias para o seguimento de trajetria. Verificase que quanto maior a carga transportada, maior essa relao e melhores os resultados, fato
este que foi verificado em diferentes testes experimentais para diferentes massas.
No Apndice IV so ainda apresentados os resultados do controlador Cascata Neural
com compensao de atritos aplicado ao controle de seguimento de trajetria do 1 grau de
liberdade de um rob cilndrico pneumtico de cinco graus de liberdade acionado
pneumaticamente. A descrio detalhada deste rob e do aparato de instrumentao e controle
pode ser encontrada em [Rijo, 2013]. Os resultados apresentados no Apndice IV mostram
que a aplicao da estratgia desenvolvida no mbito desta tese de doutorado promissora
para aplicaes em robs pneumticos, tendo apresentado erro de seguimento medido no
atuador da ordem de 5 mm para um seguimento de referncia senoidal de curso de 25 cm
(pico a pico) sem carga. Foram obtidos ao longo do trabalho mais de uma centena de
resultados experimentais para o Controlador Cascata Neural, em diversas situaes (variaes

81

na carga, variaes nas presses de suprimento, variaes nas trajetrias de referncia em


amplitude e frequncia, etc.), mantendo sempre o desempenho e robustez.

Figura 4.42 Foras e respectivo erro para o controlador cascata neural com trajetria de referncia
senoidal e adio de massa com ganhos modificados

82

5 CONCLUSES
Alm dos problemas intrnsecos ao controle dos servoposicionadores pneumticos, a
reviso bibliogrfica indicou tambm que a identificao de parmetros de caractersticas
estticas dos sistemas pneumticos tambm trabalhosa. Para superar essas dificuldades foi
proposta um procedimento para identificar as principais no-linearidades do sistema
pneumtico por meio do uso de redes neurais. Os grficos obtidos e apresentados comparando
resultados de simulao do modelo com os resultados obtidos em experimentos em uma
bancada de testes indicam que o modelo obtido atravs do procedimento proposto adequado
para auxiliar em tarefas como anlise do sistema, sintonia dos ganhos dos controladores e
aplicao em leis de controle baseadas em modelo. Assim, com base nos resultados obtidos
em malha aberta e malha fechada para o modelo neural desenvolvido, pode-se concluir que a
estratgia escolhida para a modelagem do sistema pneumtico vlida (atingindo, assim, com
sucesso um dos principais objetivos especficos propostos).
O controlador em malha fechada baseado em uma estratgia em cascata com
compensao e atrito proposto para o sistema pneumtico (denominado como Cascata Neural)
mostrou resultados promissores no seguimento de trajetrias harmnicas e polinomiais, alm
de, conforme o resultado da anlise de Lyapunov para o controlador proposto, apresentar
caractersticas de estabilidade, mesmo na presena de erros paramtricos.
As comparaes dos resultados do Controlador realizadas com a tcnica de controle
clssica PVP mostraram um melhor desempenho da estratgia de controle proposta. Quando
foi adicionada uma massa de 5 kg de carga ao servoposicionador, o controlador Cascata
Neural manteve comportamento adequado do sistema com um pequeno aumento no erro de
seguimento, mostrando que a estratgia de controle possui relativa robustez a variaes na
massa da carga. O seguimento de trajetrias pelo sistema pneumtico dificultado quando se
opera em baixas velocidades e pouca massa de carga, provavelmente, associada relao
entre a fora de atrito e a fora inercial. Nesse sentido, os resultados de simulaes e de
experimentos permitiram concluir que, quanto maior a massa, melhor o desempenho do
controlador proposto com um adequado ajuste nos ganhos do controlador. Verificou-se que na
literatura a maioria dos artigos privilegia resultados experimentais com massas na carga mais
elevadas (5 kg, 10 kg, 30kg), este fato deve-se a dificuldade de se trabalhar em vazio (sem
adio da massa da carga), principalmente em baixas velocidades, fazendo com que o

83

fenmeno de atrito stick-slip se torne significante e dificulte o controle no seguimento de


trajetrias. No presente trabalho resultados para o seguimento de trajetrias sem adio de
massa na carga foram obtidos e apresentaram desempenho satisfatrio.
Finalmente, pode-se concluir com base nos diversos resultados obtidos na bancada
experimental, que o controlador Cascata Neural proposto consegue seguir trajetrias de
referncia com preciso e com relativa robustez a variaes na massa da carga, o que
exatamente o principal objetivo do presente trabalho.
Como principal contribuio do presente trabalho destaca-se a proposio de um
procedimento sistemtico para a obteno de modelos de sistemas pneumticos, incluindo os
procedimentos de treinamento da rede adequados para a obteno de modelos precisos de tais
sistemas. Outra contribuio refere-se ao desenvolvimento de uma funo inversa
(difeomorfismo) para a relao entre as vazes desejadas e o sinal de controle. importante
salientar que quanto melhor essa funo inversa representa os fenmenos fsicos reais, melhor
o resultado obtido atravs do uso do controlador, pois, a estratgia de controle em cascata
utiliza as vazes para obter as foras desejadas calculadas atravs da Lei de Slotine e Li para
garantir o seguimento da trajetria. Assim, controlando as vazes, podem-se controlar as
dinmicas das presses nas cmaras que fornecem a fora desejada a ser aplicada massa
deslocada e que garante, de acordo com a lei de Slotine e Li, o correto seguimento da
trajetria.
Como trabalhos futuros propem-se:

utilizar a estratgia de controle em um rob pneumtico com cinco graus de


liberdade atualmente em desenvolvimento no LAMECC/UFRGS;

realizar a identificao online da massa da carga com objetivo de se melhorar o


desempenho no seguimento de trajetrias;

implementao da estratgia de controle Cascata Neural em outros tipos de


sistemas, como hidrulicos e mecnicos;

identificar a zona morta e compensar em separado, ao invs de deixar que a


rede neural aprenda o fenmeno;

verificar o efeito da temperatura na dinmica do sistema bem como no


desempenho e na robustez na estratgia de controle proposta.

84

REFERNCIAS BIBLIOGRFICAS

Ahn, K.K.; Pyo, S.M.; Yang, S.Y.; Lee B.R. Intelligent control of pneumatic
actuator using LVQNN. The 7th Korea-Russia International Symposium on Science and
Technology. Proceedings KORUS 2003, v. 1, p. 260-266, 2003.
Aliff, M.; Dohta, S.; Akagi, T. Trajectory control of simple-structured flexible
mechanism using flexible pneumatic cylinders. IEEE/SICE International Symposium on
System Integration (SII), p. 19-24, 2013.
Al-Shabi, M.; Saleem, A.; Tutunji, T.A. Smooth Variable Structure Filter for
pneumatic

system

identification.

Applied

Electrical

Engineering

and

Computing

Technologies (AEECT), 2011 IEEE Jordan Conference on 6-8 Dec. 2011.


Arbib M.A. The Handbook of Brain Theory and Neural Networks. Second Edition.
MIT Press. Cambridge, 2003.
Beale, R.; Jackson, T. Neural computing: an introduction. Adam Higler Bristol.
1990.
Bobrow, J.E.; McDonell, W. Modeling, Identification, and Control of a
Pneumatically Actuated, Force Controllable Robot. IEEE Transactions on Robotics and
Automation, v.15, n. 5, p. 732-742, Outubro 1998.
Borgnakke, C. e Sonntag, R.E. Fundamentos da Termodinmica. Editora Blucher,
traduo da 8 Edio. ISBN: 9788521207924. 2013.
Broadbent, H.R. Electro-pneumatic brakes. Proceedings of the IEE - Part IA: Electric
Railway Traction, v. 97, n. 1, p. 250261, 1950.
Canudas de Wit, C.; Olsson, H.; Astrom, K.J.; Lischinsky, P. A New Model for
Control Systems with Friction. IEEE Trans. on Automatic Control, v. 40, n. 3, p. 419-425,
1995.
Carneiro, J.F.; de Almeida, F.G. A high-accuracy trajectory following controller for
pneumatic devices. The International Journal of Advanced Manufacturing Technology. v. 61,
Issue 1-4, p. 253-267. July, 2012.
Carneiro, J.F.; de Almeida, F.G. A Neural Network Based Nonlinear Model of a
Servopneumatic System. J. Dyn. Sys., Meas., Control, v. 134, n. 2, p. 24502, 2011.

85

Carneiro, J.F.; de Almeida, F.G. Micro tracking and positioning using off-the-shelf
servopneumatics. Journal of Robotics and Computer Integrated Manufacturing, v. 30, n. 3, p.
244-255, 2014.
Carneiro, J.F.; de Almeida, F.G. Using two servovalves to improve pneumatic force
control in industrial cylinders. The International Journal of Advanced Manufacturing
Technology, v. 66, n. 1-4, p. 283-301, 2013.
Chen, H.I.; Shih, M.C. Visual Control of an Automatic Manipulation System by
Microscope and Pneumatic Actuator. IEEE Transactions on Automation Science and
Engineering, v. 10, n. 1, p. 215-218, 2013.
Chiang, M. H.; et al. Large stroke and high precision pneumatic-piezoelectric hybrid
positioning control using adaptive discrete variable structure control. Mechatronics, v. 15,
p. 523-545, 2005.
Chikh, L.; Poignet, P.; Pierrot, F.; Michelin, M. A predictive robust cascade positiontorque control strategy for Pneumatic Artificial Muscles. IEEE American Control
Conference (ACC), p. 6022-6029, 2010.
Choi, G.S.; Lee, H.K.; Choi, G.H. A Study on Tracking Position Control of
Pneumatic Actuators Using Neural Network. IEEE Proceedings of Industrial Electronics
Society, v. 3, p. 1749-1753, 1998.
Choi, H.S.; et al. Development Of Hybrid Robot For Construction Works With
Pneumatic Actuator. Proceedings of the 20th International Symposium on Automation and
Robotics in Construction (ISARC), p. 191-196. Eindhoven, Holland, 2003.
Einicke, G.A.; White, L.B., Robust Extended Kalman Filtering. IEEE Trans. Signal
Processing 47 (9): 25962599. September, 1999.
Faudzi, A.A.M.; et al. Distributed Physical Human Machine Interaction Using
Intelligent Pneumatic Cylinders. International Symposium in Micro-Nano-Mechatronics and
Human Science - MHS, p. 249-254, 2008.
Fausett, L. Fundamentals of neural networks: architectures, algorithms, and
applications. Prentice-Hall, Inc. Upper Saddle River. N.J., USA, 1994.
Feyel, P.; Duc, G.; Sandou, G. LuGre friction model identification and compensator
tuning using a Differential Evolution algorithm. IEEE Symposium on Differential Evolution
(SDE), p. 85-91, 2013.

86

Fok, S. e Ong, E. Position control and repeatability of a pneumatic rodless cylinder


system for continuous positioning. Robotics and Computer-Integrated Manufacturing, v. 15,
p. 365-371, 1999.
Fox, R.W. e McDonald, A.T. Introduo Mecnica dos Fluidos. Editora Guanabara
Dois S. A., Rio de Janeiro, 1981
Gervini, V.I.; Hemerly, E.M.; Gomes, S.C.P. Controle de Rob com Um Elo Flexvel
usando Redes Wavelets Neurais. Congresso Brasileiro de Automtica, 2008, Juiz de Fora.
Congresso Brasileiro de Automtica, 2008.
Gervini,V.I.; Gomes,S.C.P. e Rosa,V.S.

A New Robotic Drive Joint Friction

Compensation Mechanism Using Neural Networks.Journal of the Brazilian Society of


Mechanical Sciences and Engineering, v. 25, p. 135-145, 2003.
Gervini,V.I; Gomes, S.C.P. Identificao e Compensao de Atritos No Lineares de
Atuadores Robticos Via Redes Neurais Artificiais. V Congresso Brasileiro de Redes
Neurais, p. 475-

480, 2001.

Gomes, S.C.P.; Gervini,V.I.; Guimares JR, D.S.; Machado, C.C. Controle de um


manipulador flexvel utilizando redes neurais. Congresso Brasileiro de Automtica, 2006,
Salvador. Congresso Brasileiro de Automtica, 2006.
Gross, D.C.; Rattan, K.S. A feedforward MNN controller for pneumatic cylinder
trajectory tracking control. IEEE International Conference on Neural Networks, v.2, p. 794799, 1997.
Guenther, R.; De Pieri, E.R. Cascade Control of the Hydraulic Actuators.
RevistaBrasileira de CinciasMecnicas, v. 19, no 2, p. 108-120, junho 1997.
Guenther, R.; Hsu, L. Variable Structure Adaptive Cascade Control of Rigid-Link
Electrically Driven Robot Manipulators. Proc. IEEE 32nd CDC, San Antonio, Texas,
dezembro, p.2137-2142, 1993.
Guenther, R.; Perondi, E.A. O Controle em Cascata de um Sistema Pneumtico de
Posicionamento. Anais do XVI Congresso Brasileiro de Engenharia Mecnica
COBEM2001. Uberlndia, MG, Brasil, 2001.
Guenther, R.; Perondi, E.A.; DePieri, E.R.; Valdiero, A.C. Cascade Controlled
Pneumatic Positioning System with LuGre Model Based Friction Compensation. J. of the
Braz. Soc. of Mech. Sci. & Eng. ABCM, v. XXVIII, no. 1, p. 48-57; janeiro-maro 2006.

87

Hagan, M.T.; Demuth, H.B.; Beale, M. Neural Network Design. PWS Publishing
Company, 1996.
Ham, F.M.; Kostanic, I. Principles of Neurocomputing for Science & Engineering.
McGraw-Hill Companies, Inc., 2001.
Han, S.I.; Lee, J.M. Precise Positioning of Nonsmooth Dynamic Systems Using
Fuzzy Wavelet Echo State Networks and Dynamic Surface Sliding Mode Control. IEEE
Transactions on Industrial Electronics, v. 60, n. 11, p. 5124-5136, 2013.
Haykin, S. Neural Networks - A Comprehensive Foundation. Prentice Hall, 2nd
Edition, 1999.
Hesselroth, T.; Sarkar, K.; Van Der Smagt, P.; Schulten, K. Neural network control of
a pneumatic robot arm. IEEE Transactions on Systems Man and Cybernetics, v. 24, n. 1, p.
2838, 1994.
Hodgson, S.; Tavakoli, M.; Pham, M.T.; Leleve, A. Nonlinear Discontinuous
Dynamics Averaging and PWM-Based Sliding Control of Solenoid-Valve Pneumatic
Actuators. IEEE/ASME Transactions on Mechatronics, v. 20, n. 2, p. 876-888, 2015.
Ilchmann, A.; et al. Pneumatic cylinders: modelling and feedback force-control.
International Journal of Control, v. 79, p. 650-661, 2006.
Jain, A.K.; Mao, J. e Mohiuddin, K. Artificial Neural Networks: A Tutorial. IEEE
Computer, v. 29, p. 31-44, 1996.
Kalman, R.E. A new approach to linear filtering and prediction problems. Journal of
Basic Engineering, v. 82, n. 1, p. 3545, 1960.
Korondi, P.; Gyeviki, J. Robust Position Control for a Pneumatic Cylinder.
Proceedings of the 12th International Power Electronics and Motion Control Conference, p.
513 518, 2006.
Kothapalli, G.; Hassan, M.Y. Design of a Neural Network Based Intelligent PI
Controller for a Pneumatic System. IAENG International Journal of Computer Science, v.
35, p. 217-222, 2008.
Kunz, G.O. Desenvolvimento de uma Arquitetura Programvel de Controle em
Tempo Real para um Servoposicionador Pneumtico. Porto Alegre, RS, 2006.
Lee, H.K.; et al. A study on tracking position control of pneumatic actuators.
Mechatronics, v. 12, p. 813-831, 2002.

88

Li, J.; Kawashima, K.; Kagawa, T.; Fujita, T. Trajectory control of pneumatic servo
table with air bearing. IEEE International Conference on Fluid Power and Mechatronics
(FPM), p. 683-690, 2011.
Lischinsky, P.; Canudas de Wit, C.; Morel, G. Friction Compensation for an
Industrial Hydraulic Robot. IEEE Control Systems, p.25-32, 1999.
Machado, C.L.D. Compensao de Atrito em Atuadores Hidrulicos Utilizando
Redes Neurais. Dissertao de Mestrado em Engenharia Mecnica, Centro Tecnolgico,
Universidade Federal de Santa Catarina, Florianpolis - SC, 2002.
Marquardt, D. An Algorithm for Least-Squares Estimation of Nonlinear Parameters.
SIAM Journal on Applied Mathematics v. 11, n. 2, p. 431441, 1963.
McCulloch, W.S.; Pitts, W.H. A Logical Calculus of the Ideas Immanent in Nervous
Activity. Bull. Math. Biophy, no. 5, p. 115-133, 1943.
Meng, D.; Tao, G.; Liu, H.; Zhu, X. Adaptive robust motion trajectory tracking
control of pneumatic cylinders with LuGre model-based friction compensation. Chinese
Journal of Mechanical Engineering, v. 27, n. 4, p. 802-815, 2014.
Messina, A.; et al. Experimenting and modelling the dynamics of pneumatic
actuators controlled by the pulse width modulation (PWM) technique. Mechatronics, v. 15,
p. 859-881, 2005.
Na, J.; Chen, Q.; Ren X.; Guo, Y. Adaptive Prescribed Performance Motion Control
of Servo Mechanisms with Friction Compensation. IEEE Transactions on Industrial
Electronics, v. 61, n. 1, p. 486-494, 2014.
Nergaard, M.; Ravn, O.; Poulsen, N.K.; Hansen, L.K., Neural Networks for
Modelling and Control of Dynamic Systems. Springer-Verlag, London, 2000.
Niiyama, R. Model-based trajectory control of robots with pneumatic actuator
dynamics. IEEE International Conference on Intelligent Robots and Systems (IROS), p. 634639, 2012.
Noble, Ben; Daniel, J.W. lgebra Linear Aplicada. Prentice-Hall do Brasil. 2nd
edio. Rio de Janeiro, 1986.
Perondi, E.A. Controle No-Linear em Cascata de um Servoposicionador
Pneumtico com Compensao do Atrito. Tese (Doutorado em Engenharia Mecnica),
Centro Tecnolgico, Universidade Federal de Santa Catarina, Florianpolis - SC, 2002.

89

Perondi, E.A.; Guenther, R. Controle de um Servoposicionador Pneumtico por


Modos Deslizantes. Congresso Nacional de Engenharia Mecnica - CONEM/2000. Natal,
Brasil, 2000.
Perondi, E.A.; Guenther, R. Controle em Malha Fechada de um Servoposicionador
Pneumtico. Anais do XV Congresso Brasileiro de Engenharia Mecnica COBEM99.
guas de Lindia, SP, Brasil, 1999.
Rahman, R.A.; Sepehri, N. Position Tracking of a Pneumatic Actuator Using
Backstepping-Sliding Mode Control With Adaptive Friction Observer. ASME Symposium
on Fluid Power and Motion Control, ISBN: 978-0-7918-5608-6, 2013.
Rahmat, M.F.; Salim, S.N.S.; Sunar, N.H.; Faudzi, A.A.M.; Ismail, Z.H.; Huda, K.
Identification and non-linear control strategy for industrial pneumatic actuator.
International journal of physical sciences, v. 7, n. 17, p. 2565-2579, 2012.
Rajendran, S.; Nanda, P.S. Electro-Pneumatic Servo System. presented at the 14th
National Conference on Machines and Mechanisms (NaCoMM09), NIT, Durgapur, India,
2009.
Ramirez, I. Modeling and tracking control of a pneumatic servo positioning system.
International Congress of Engineering Mechatronics and Automation (CIIMA), p. 1-6, 2013.
Rapp, P.; Weickgenannt, M.; Tarin, C.; Sawodny, O. Valve flow rate identification
and robust force control for a pneumatic actuator used in a flight Simulator. American
Control Conference (ACC), p. 1806-1813, 2012.
Ren, H.P.; Huang, C. Adaptive backstepping control of pneumatic servo system.
IEEE International Symposium on Industrial Electronics (ISIE), p. 1-6, 2013a.
Ren, H.P.; Huang, C. Experimental tracking control for pneumatic system. IEEE
Industrial Electronics Society, IECON, p. 4126-4130 , 2013b.
Richer, E.; Hurmuzlu, Y. A High Performance Pneumatic Force Actuator System:
Part II-Nonlinear Controller Design. Journal of dynamic systems, measurement, and control,
v. 122, p. 426-434, 2000.
Rijo M.G.Q. Desenvolvimento da Base e Controle do Grau de Liberdade Rotacional
de um Rob Cilndrico com Acionamento Pneumtico. Dissertao de Mestrado, Programa
de Ps-Graduao em Engenharia Mecnica, UFRGS, 2013.
Rosenblatt, F. Principles of Neurodynamics: Perceptrons and Theory of Brain
Mechanisms. DC: Spartan. 1962.

90

Rosenblatt, F. The Perceptron: A Probabilistic Model for Information Storage and


Organization in the Brain. Psychological Review, v. 65, n. 6, p. 386408, 1958.
Saleem, A.; et al. Mixed-reality environment for frictional parameters identification
in servo-pneumatic system. Simulation Modelling Practice and Theory, v. 17, p. 1575-1586,
2009.
Salgado, I.; Chairez, I. Nonlinear Discrete Time Neural Network Observer.
Neurocomputing, v. 101, p. 73-81, 2013.
Sang-Eun, S.; et al. Development of a pneumatic robot for MRI-guided transperineal
prostate biopsy and brachytherapy: New approaches. in Robotics and Automation (ICRA),
IEEE International Conference on, p. 2580-2585, 2010.
Schindele D.; Aschemann, H. Adaptive friction compensation based on the LuGre
model for a pneumatic rodless cylinder. in Industrial Electronics, 2009. IECON '09. 35th
Annual Conference of IEEE, p. 1432-1437, 2009.
Shaojuan, Y.; et al. A New Iterative Learning Controller for Electro-Pneumatic
Servo System. in Intelligent Systems Design and Applications, 2008. ISDA '08. Eighth
International Conference on, p. 101-105, 2008.
Shearer, J.L. Study of Pneumatic Process in the Continuous Control of Motion With
Compressed Air. Transactions of the ASME, p. 233-249, 1956.
Shu, N.; Bone, G.M. Experimental comparison of two pneumatic servo position
control algorithms. in Mechatronics and Automation, 2005 IEEE International Conference,
v. 1, p. 37-42, 2005.
Slotine, J.J.E.; Li, W. Applied Nonlinear Control. Prentice-Hall Inc. New Jersey,
1991.
Smaoui, M.; et al. A study on tracking position control of an electropneumatic
system using backstepping design. Control Engineering Practice, v. 14, p. 923-933, 2006.
Sobczyk, M.R.; Perondi, E.A.; Cunha, M.A.B. A continuous extension of the LuGre
friction model with application to the control of a pneumatic servo positioner. IEEE 51st
Annual Conference on Decision and Control (CDC), p. 3544-3550, 2012.
Sobczyk, M.R.S. Controle em Cascata e a Estrutura Varivel com Adaptao de
Parmetros e Compensao de Atrito de Um Servoposicionador Pneumtico. Tese de
Doutorado, Programa de Ps-Graduao em Engenharia Mecnica, UFRGS, 2009.

91

Song, J.; Bao, X.; Ishida, Y. An Application of MNN Trained by MEKA for the
Position Control of Pneumatic Cylinder. IEEE International Conference on Neural
Networks, v. 2, p. 829 833, 1997a.
Song, J.; Ishida Y. A robust sliding mode control for pneumatic servo systems.
International journal of engineering science, v. 35, p. 711-723, 1997b.
Song, Q.; Liu, F. Neural Network Modeling and Disturbance Observer Based
Control of a Pneumatic System. Proceedings of the 2nd IEEE/ASME International
Conference on Mechatronic and Embedded Systems and Applications, p. 1-5, 2006.
Surgenor, B.W.; Vaughan, N.D.; Uebling, M. Continuous Sliding Mode Control of a
Pneumatic Positioning System. Proceedings of Eighth Bath International Fluid Power
Workshop, p. 270-285, 1995.
Suzuki, R.M. Controle Baseado em Linearizao por Realimentao dos Estados
Aplicado a Um Servoposicionador Pneumtico. Dissertao de Mestrado, Programa de PsGraduao em Engenharia Mecnica, UFRGS, 2010.
Tappan, P.W.; Vaccaro; A.C.; Babcock, L. A Pneumatic Ultrasonic Transmitter for a
Low-Cost Remote Control. Transactions on Broadcast and Television Receivers, IRE, v.
BTR-6, n. 2, p. 31-34. 1960.
Trung, N.T.; Truong, D.Q.; Ahn, K.K. Identification of a pneumatic actuator using
non-linear black-box model. 11th International Conference on Control, Automation and
Systems (ICCAS), p. 15761581, 2011.
Tsai, Y.C.; Huang, A.C. Multiple-surface sliding controller design for pneumatic
servo systems. Mechatronics, v. 18, p. 506-512, 2008.
Utkin, V.I. Discontinuous Control Systems: State of Art in Theory and Applications.
IFAC World Congress on Automatic Control. Preprints, Munich, v. 1, p. 75-94, 1987.
Van Varseveld, R.B.; Bone, G.M. Accurate position control of a pneumatic actuator
using on/off solenoid valves. Mechatronics, IEEE/ASME Transactions on, v. 2, p. 195-204,
1997.
Vieira, A.D. Anlise Terico Experimental de Servoposicionadores Lineares
Pneumticos. Dissertao de mestrado. CPGEM. Centro Tecnolgico. UFSC. Florianpolis,
1998.

92

Virvalo, T. Modelling and design of a pneumatic position servo system realized with
commercial components. Dissertao de Doutorado. Tampere University of Technology.
Tampere, 1995.
Wang, J.; et al. Accurate position control of servo pneumatic actuator systems: an
application to food packaging. Control Engineering Practice, v. 7, p. 699-706, 1999a.
Wang, J.; Pu, J.; Moore, P. A practical control strategy for servo-pneumatic actuator
systems. Control Engineering Practice, v. 7, n. 12, p. 1483-1488, 1999b.
Weist J.; Arteaga, M.A.; Cruz, L.R.; Hebisch, H. Model free control for differential
pneumatic pistons: experimental comparison. International Journal of Control, v. 84, n. 1, p.
138-164, 2011.
Widrow, B.; Hoff, M.E.Jr. Adaptive Switching Circuits. IRE Wescon Convention
Record. 1960.
Zhu, G.G.; et al. An iterative algorithm for model-based predictive control of an
Electro-Pneumatic Valve Actuator. in American Control Conference09, p. 2684-2689, 2009.

93

APNDICE I Parmetros Fsicos do Sistema Servopneumtico, Sensores e Atuadores

I.1

Parmetros Fsicos

Os parmetros do sistema fsico, levantados e utilizados nas simulaes e


experimentos so apresentados na Tabela I.1.
Tabela I.1 Valores numricos dos parmetros do sistema fsico.
Parmetro
ps- presso de suprimento
patm- presso atmosfrica
- calor especfico do ar a presso constante
G - calor especfico do ar a volume constante
r - relao dos calores especficos do ar
R - constante universal dos gases
T - temperatura do ar de suprimento
M - massa deslocada do conjunto (mbolo + carro do cilindro)
L - comprimento til do cilindro do atuador
A - rea til do mbolo do cilindro atuador
V10 - volume morto na cmara 1
V20 - volume morto na cmara 2

I.2

Valor
7,0 x 105 Pa
1,01 x 105 Pa
1005 J/kg.K
718 J/kg.K
1,4
286,9J.kg/K
293 K
0,4 kg
1,0 m
4,5 x 10-4 m2
6 x 10-6 m3
2 x 10-6 m3

Sensores

Para a medio das presses nas cmaras foram utilizados dois sensores de presso
cujas caractersticas so apresentadas na Tabela I.2.
Tabela I.2 Caractersticas tcnicas dos sensores de presso.
Modelo/fabricante
Presso manomtrica de entrada
Corrente eltrica de sada
Resoluo de entrada
Desvio mximo combinado (linearidade + histerese + repetibilidade)
Tenso de alimentao

510 Huba Control


0 a 1 MPa
mA DC
0,3 %fs
0,5 %fs
12 a 33 VDC

Para a medio da posio do mbolo foi utilizado uma rgua potenciomtrica cujas
caractersticas so apresentadas na Tabela I.3.

94

Tabela I.3 Caractersticas tcnicas da rgua potenciomtrica.


Modelo/Fabricante
Curso til nominal
Resoluo de trajeto
Linearidade de resposta
Tenso eltrica de alimentao mxima
Velocidade mxima admissvel
Acelerao mxima admissvel

I.3

MLO POT 1000 TLF FESTO


1m
0,01 mm
0,04 %fs
42 VDC
10 m/s
200 m2/s

Atuadores

Os dados da servovlvula direcional so apresentados na Tabela I.4.


Tabela I.4 Caractersticas tcnicas da servovlvula direcional.
Modelo/Fabricante
Tipo
Presso absoluta de trabalho
Vazo nominal terica
Vazo nominal medida (Vieira, 1998)
Temperatura do fluido de trabalho
Temperatura ambiente
Tenso terica de trabalho
Tempo de resposta na faixa
Potncia absorvida Mximo

MPYE 5-1/8 FESTO


5/3 vias
0 > 10bar
700 l/min
410 l/min
5 a 40 C
0 a 50 C
0 a 10 V DC, posio central em 5 V
2 a 8 V, 5 ms; 200 Hz
20 W

As caractersticas tcnicas do atuador pneumtico linear encontram-se na Tabela I.5.


Tabela I.5 Caractersticas tcnicas do atuador pneumtico linear.
Modelo/Fabricante
Dimetro do mbolo
Construo
Presso de servio
Fora de atuao
Temperatura Admissvel
Componente de carga admissvel verticalmente em
relao ao eixo do cilindro
Curso do amortecimento fim de curso
Velocidade mxima do carro a 6x105Pa e 20 C

DGPL-25 FESTO
0,025 m
Cilindro pneumtico de dupla ao
2x105 a 8x105 Pa
295 N
10C a 60 C
330 N
0,018 m
1 m/s para uma massa de 3 kg

95

I.4

Sistema de Aquisio de Dados e Controle DSPACE

O controle e aquisio de dados so realizados por uma placa dedicada (ds1104),


instalada em um computador pessoal (PC) dedicado. As caractersticas da placa de aquisio
utilizada para o processamento de dados so apresentadas na Tabela I.6.
Tabela I.6 Caractersticas da placa de aquisio e processamento de dados.
Modelo/fabricante
Entradas para converso A/D
Sadas com converso D/A
Entradas/sadas digitais
Frequncia de operao do processador
Memria interna

DS 1104 dSPACE
8 (4 de 16 bits + 4 de 12 bits)
8 (todas de 16 bits)
20 bits configurveis individualmente
250 MHz
32 MB global + 8 MB flash

96

APNDICE II Caracterizao Terica das Vazes Mssicas na Servovlvula


Para o clculo de vazes mssicas de gases ideais considerando-se o processo
isentrpico, e utilizando o princpio da conservao de energia por unidade de massa
[Borgnakke e Sonntag, 2013]

2' L

3' &
2

2 L

3 &
2

(II.1)

com 3' e 3 as velocidades do ar a montante e a jusante respectivamente, 2' e 2 as

temperaturas do ar a montante e jusante, respectivamente. A partir da hiptese que


estabelecida a condio de estagnao a montante, ou seja, 3' 0, obtemos:
3 &
2 L
2

2'

dividindo ambos os termos por

2'
1

(II.2)

2
3 &
L
2' 2 2'

(II.3)

(II.4)

Por outro lado


/

dividindo ambos os termos por


/
como

1H
.

Utilizando as Equaes (II.5) e (II.6)

(II.5)

(II.6)

97
/

ou

1H

ou

(II.7)

./
.H1

(II.8)

2./

=2 H 2 @
.H1 '

(II.9)

substituindo (II.8) em (II.3)


3

1
.

2./2'
2

1 H
.H1
2'

(II.10)

A vazo mssica definida como a variao de massa no volume de controle ao longo


do tempo

,+

D"
D1

(II.11)

onde m a massa contida em um volume de controle e dada por


"

(II.12)

e sua derivada em funo do tempo por


"

L8

Assumindo a hiptese de que em regime permanente 8


"

(II.13)
0, temos
(II.14)

Assumindo o volume de controle na regio estrangulamento de forma cilndrica, com


rea de passagem dada por A(u) e de comprimento x, o volume de controle na regio de
estrangulamento pode ser expresso por

98

utilizando (II.15) em (II.14)

ou

"

"

I= @P

(II.15)

D=I= @P@
D1

(II.16)

I= @8 3

(II.17)

Pela equao dos gases perfeitos


8

/2

(II.18)

Substituindo (II.10) e (II.18) em (II.17)

ou

"

I= @

"

I= @

2./2'
2
1 H
.H1
2'

/2

(II.19)

2.2'
2
1 H
=. H 1@/
2'

(II.20)

Para um processo isentrpico


1

(II.21)

"/2

(II.22)

Para um gas ideal

De (II.21) e (II.22)

ou

"/2

(II.23)

99
%

1 7
"/

7\%
7

(II.24)

Considerando a conservao da massa, i.e.


"

7\%
7

com
1

(II.25)
&

(II.26)

1 7
1 %/

&

(II.27)

As equaes de temperatura montante e jusante ficam na forma


2'

7\%
' 7

7\%
7

dividindo-se (II.29) por (II.28)

2
2'

ou

podemos agora calcular o termo

Sn

2
2'

'

'

2'

'

Aplicando (II.30) e (II.32) em (II.20)

&

(II.28)

&

(II.29)

7\%
7
%
' 7

'

%
7

(II.30)

(II.31)

(II.32)

100

"

2.2'
I= @
Y1 H
=. H 1@/
2' '
%
7

'

'

7\%
7

(II.33)

(II.34)

Finalmente a vazo mssica pode ser escrita como

"
2

2.
I= @ '
Y
=. H 1@/2'

'

&
7

'

7c%
7

Para calcular a vazo mssica no regime saturado deve-se dividir a Equao (II.2) por
2'
2

3 &
1L
2 2

(II.35)

Substituindo (II.8) em (II.35)


2'
2
como

1L

&

./2

&

Onde

=. H 1@3
2./2

(II.36)

(II.37)

a velocidade do som jusante, portanto


2'
2

1L

=. H 1@ 3 &

2

(II.38)

O nmero de mach definido por


#m
Obtendo-se

(II.39)

101

Para mach 1, isto , #

2'
2

1L

2'
2

ou

2'
2

de (II.30)

=. H 1@ &
#
2

(II.40)

=. H 1@
2

(II.41)

1L

'

.L1
2

(II.42)

2 7\%

2'

(II.43)

Substituindo (II.42) em (II.43)


7

2 7\%

.L1

'

(II.44)

Substituindo (II.32) e (II.42) em (II.19)


"

I= @

'

2'

'

%
7

2./2'
2
1 H

&
=. H 1@/
.L1

(II.45)

ou

simplificando

"

&

2.2'

2 7\% . H 1
I= @ '

.L1
=. H 1@/2' & . L 1
"

&

.
2 7\%
2
I= @ '

/2' . L 1
.L1

(II.46)

(II.47)

Resultando assim na Equao para a vazo mssica em regime saturado (snico) com
valor mximo e fixo dado por:

102

"

7c%

.
2 7\%
I= @ '

/2' . L 1

(II.48)

103

APNDICE III Identificao Neural da derivada da Fora de Atrito e da Dinmica


Inversa da Servovlvula (Difeomorfismo)

III.1 Identificao da derivada da Fora de Atrito


Para a estimativa neural da derivada da fora de atrito utilizou-se a mesma arquitetura
neural apresentada na Figura 2.9, que foi utilizada para a estimao da fora de atrito. A
Figura III.1 ilustrada a arquitetura da rede neural adotada com dois neurnios de entrada
(associados diferena das derivadas das presses nas cmaras e acelerao do mbolo),
quatro neurnios na camada oculta e um neurnio na camada de sada (associado derivada
da fora de atrito estimado). A arquitetura dos neurnios a mesma que foi apresentada na
Figura 2.10.

Figura III.1 Arquitetura da Rede Neural Artificial (RNA) usada para a realizao da estimao da
derivada da fora de atrito

Aps o treinamento utilizando a tcnica clssica da retropropagao do erro


(backpropagation), a rede apresentou uma taxa de erro de aproximadamente de 0.024 dos
padres apresentados rede (este valor equivale a um erro mdio de 1,2 % do valor desejado,
pois a sada da rede pode variar apenas entre -1 e 1). O erro

de uma rede neural pode ser

calculado conforme Equao (2.15).


As entradas da rede neural so diferena das derivadas das presses nas cmaras e
acelerao do mbolo, enquanto a sada a derivada da fora de atrito, conforme ilustrado

104

anteriormente na Figura III.1. Os padres de treinamento foram obtidos atravs de uma srie
de ensaios experimentais. Esses ensaios constituram-se da aplicao de um controlador
proporcional para o seguimento de trajetria de posio utilizando como referncia sinais do
tipo degrau e tambm sinais do tipo senoidal.
Os valores dos parmetros do controlador e referncias utilizados nos experimentos
selecionados para a identificao da derivada do atrito foram apresentados na Tabela 2.2.
Na Figura III.2 apresentada a curva da derivada da fora de atrito estimada pela rede
neural aps o treinamento sobreposta com a derivada da fora de atrito calculada atravs da
derivada numrica da Equao (2.14) para o caso de uma referncia senoidal de amplitude de
0,45 m e frequncia de 2 rad/s, com o controlador proporcional com ganho

8. Cabe

salientar que a rede neural para a estimativa do atrito no foi treinada para um experimento
com este ganho para o controlador proporcional, mesmo assim a rede conseguiu uma boa
estimativa para este novo conjunto de entradas, que no foram treinadas. Isto indica que a
rede neural possui uma satisfatria generalizao para a estimativa do atrito.

Figura III.2 Derivada da fora de atrito experimental (preto) e estimada pela rede neural (azul) para
8 e referncia senoidal com frequncia de 2 rad/s e amplitude de 0,45 m

III.2 Identificao da dinmica inversa da servovlvula


Nesta seo apresentada a estratgia de identificao da inversa da dinmica da
servovlvula atravs de redes neurais. Utilizando a equao (2.13), temos,
= %,

& , 5,

= %,

& , 5, 5@

(III.1)

105

Como

= %,

& , 5,

@ podemos inferir que

= %,

& , 5,

@. Baseando-se

nessa equao, a topologia da rede neural proposta para a realizao da identificao da


estimativa neural da tenso de controle da servovlvula apresentada na Figura III.3.

Figura III.3 Arquitetura da RNA para estimao da tenso de controle

A rede neural possui quatro entradas (sinal de controle calculado

mbolo 5 e presses nas cmaras

&)

, posio do

e uma sada (estimao da tenso de controle

ser aplicada a servovlvula). Para o clculo experimental de

foi utilizada a Equao (III.1).

Foram escolhidos quatro neurnios na camada intermediria, tendo a rede neural, com esse
nmero, apresentado aprendizado dos padres considerado satisfatrio e uma boa
generalizao. Aps o treinamento a rede apresentou uma taxa de erro de aproximadamente
1,7% (0.034) de erro em relao ao valor desejado. O erro

de uma rede neural foi calculado

de acordo com a Equao (2.15).


Aps a fase de treinamento, foram realizados alguns testes visando avaliar o
desempenho da rede neural treinada na predio das vazes mssicas em experimentos que
no foram utilizados no treinamento (com ganho proporcional igual 8 e com referncia
senoidal, de acordo com a Tabela 2.2. Resultados destes testes esto apresentados na Figura
III.4. possvel perceber que por meio do uso da rede neural foi possvel estimar
adequadamente a tenso de controle a ser aplicada a servovlvula.

106

Figura III.4 Tenso de controle experimental (preto) e estimada pela rede neural (azul)

III.2 Comandos em MatLab para o clculo da sada de algumas RN


Comandos em MatLab para o clculo da tenso na servovlvula:
un=3.1584e+006;y=0;p1=6.0466e+005;p2=3.0e+005; % exemplo de entradas
% obs.: entradas no SI
Wxy_inversa = [0.5175
0.0346
2.2083
0.9217;...
1.1495
-0.8030
-0.5552
1.5965;...
0.8021
0.6618
0.7035
-0.4279;...
0.5822
0.4866
1.3695
-3.5289];
Wyz_inversa = [-1.1988; 0.8859; 0.9893; 1.9244];
Ofy_inversa = [1.6428 0.9278 1.8335 0.2852];
Ofz_inversa = [-0.9381];
min_un = -3.8060e+006;
min_y =
-0.3934;
min_p1 = 3.8377e+005;
min_p2 = 3.9600e+005;
min_u =
4.082;
max_un = 3.1584e+006;
max_y =
3.1584e+006;
max_p1 = 6.0466e+005;
max_p2 = 6.0876e+005;
max_u =
6.005;
un_sat=((un-min_un)/( max_un - min_un)-0.5)*2;
y_sat=((y-min_y)/( max_y - min_y)-0.5)*2;
p1_sat=((p1-min_p1)/( max_p1 - min_p2)-0.5)*2;
p2_sat=((p2-min_p2)/( max_p2 - min_p2)-0.5)*2;
ve = [un_sat y_sat p1_sat p2_sat];
u_sat=tanh((tanh((ve*Wxy_inversa)+Ofy_inversa)*Wyz_inversa)+...
Ofz_inversa);
u=(u_sat /2+0.5)*( max_u - min_u) + min_u; % tensao u

107

Comandos em Matlab para o clculo da fora de atrito desejada:


vel=1;

% velocidade em [m/s]

p_delta=0

% diferena de presso p1-p2 em Pa

Wxy_atrito = [ 0.0705 0.2261 0.1143 -0.0105; 0.3895 0.1530 0.3502 0.5526];


Wyz_atrito = [1.5223; 0.2878; 0.9805; 0.6473];
Ofy_atrito = [0.3045 0.2896 -0.2929 -0.4528];
Ofz_atrito = [0.0198];
min_atr=-72.6665;
max_atr=71.0760;
min_vel = -0.9826;
max_vel =

0.9953;

min_pdelta = -172112;
max_pdelta = 1.6999e+005;

vel_sat=((vel-min_vel)/( max_vel - min_vel)-0.5)*2;


p_delta_sat=(( p_delta -min_pdelta)/( max_pdelta - min_pdelta)-0.5)*2;
ve = [vel_sat

p_delta_sat];

% vetor das entradas da rede neural

fa_sat=tanh((tanh((ve*Wxy_atrito)+Ofy_atrito)*Wyz_atrito)+Ofz_atrito)
fa=(fa_sat /2+0.5)*( max_atr - min_atr) + min_atr; % forca de atrito

108

APNDICE IV Resultados com controlador Cascata Neural com compensao de


Atrito com utilizando setup do Rob Pneumtico
Com base nos resultados apresentados e discutidos na Seo 4.8, pode-se concluir que
uma forma de melhorar o desempenho do seguimento de trajetrias adicionando massa
carga movimentada. Nesta seo so apresentados resultados experimentais da aplicao de
um atuador pneumtico e sensores de presses e posio utilizados na montagem do rob
pneumtico [Rijo, 2013]. Com este novo setup experimental conseguiu-se reduzir ainda mais
os erros no seguimento de trajetria. As Figuras 4.43 a 4.45, apresentam os resultados
experimentais obtidos em bancada para este novo setup. Cabe salientar que foi feita uma nova
identificao neural de atritos, da inversa da vlvula e da derivada da funo de atrito. Os
ganhos utilizados esto apresentados na Tabela IV.1
Tabela IV.1 Ganhos utilizados no controlador Cascata Neural Setup Rob Pneumtico
:
400
20
80

A Figura IV.1 apresenta o desempenho do controlador Cascata Neural no seguimento


de trajetrias senoidais para este novo setup. Pode-se perceber com base no grfico do erro
em posio que o mesmo fica abaixo de 5 mm. A amplitude total da trajetria foi modificada
para 12,5 cm devido ao curso limitado do novo atuador, e como se manteve a mesma
frequncia de referncia, isto fez com que se obtiveram menores velocidades de referncia.
Ao se controlar estruturas pneumticas o desempenho no seguimento de trajetrias
dificultado quando se tem pouca massa para baixas velocidades, pois nestes casos o fenmeno
do atrito se apresenta com maior importncia. Mesmo sendo este o caso analisado o
controlador Cascata Neural apresentou desempenho satisfatrio no seguimento de trajetrias
com baixas velocidades e sem carga (massa de 0,37 kg). Com base na Seo 4.8 infere-se que
ao se adicionar carga para este novo setup iro se conseguir resultados ainda melhores no
seguimento de trajetria.
A velocidade e o sinal de controle so apresentados na Figura IV.2. O grfico da
velocidade apresenta uma pequena vibrao, esta devido a dificuldades de se controlar em
baixas velocidades e sem carga. O grfico do sinal de controle apresenta uma pequena
oscilao devido aos mesmos motivos. Finalmente a Figura IV.3 apresenta a comparao das
foras calculadas pelo controlador Cascata Neural.

109

Figura IV.1 Posio do mbolo e seu respectivo erro experimental para o controlador cascata neural
com trajetria de referncia senoidal.

Figura IV.2 Velocidade do mbolo e sinal de controle experimental para o controlador cascata neural
com trajetria de referncia senoidal.

Figura IV.3 Foras e respectivo erro para o controlador cascata neural com trajetria de referncia
senoidal.

Вам также может понравиться