Академический Документы
Профессиональный Документы
Культура Документы
Dissertao apresentada na faculdade de Cincias e Tecnologia da Universidade Nova de Lisboa para obteno do grau de Mestre em Engenharia Industrial
Lisboa 2009
Sumrio Durante os ltimos anos tem havido nos meios acadmicos, por parte de um sector da engenharia industrial um esforo no sentido de integrar duas metodologias de controlo que, em muitas situaes reais, esto implementadas de forma autnoma. A primeira, mais ligada engenharia da qualidade, consiste na monitorizao dos processos com recurso a cartas de controlo, ou controlo estatstico do processo (SPC - Statistical Process Control). A segunda abordagem est baseada no ajustamento dos processos recorrendo informao sobre os nveis actuais das respostas ou desvios em relao aos valores de referncia e constitui a engenharia de controlo do processo (EPC). Ambas as metodologias tm por base a identificao e modelao do processo. O presente trabalho apresenta metodologias abrangentes para a identificao e modelao dos processos, baseadas em estimativas dos mnimos quadrados e de mxima verosimilhana, com o objectivo de se captar as dinmicas internas dos processos e assim obter os modelos necessrios implementao integrada, ou no, do controlo estatstico (SPC) e engenharia de controlo (EPC - Engineering Process Control). Pretendendo-se ser o mais abrangente possvel, toda a abordagem foi feita para lidar com sistemas de mltiplas entradas e mltiplas sadas (MIMO Multi-Input/Multi-Output), considerando-se os outros modelos (SISO ou MISO) como casos particulares deste. A metodologia de identificao implementada foi posteriormente utilizada com dados reais provenientes de um processo MISO, obtendo-se assim o modelo que serviu de base para simular o sistema de integrado SPC/EPC. Com base nos resultados obtidos por simulao, pode-se concluir que o sistema integrado permite simultaneamente um melhor ajustamento do processo em relao aos valores de referncia, reduzir a sua variabilidade, detectar alteraes verificadas no processo e, caso seja possvel, alterar o algoritmo de controlo de forma a responder s alteraes verificadas.
Abstract During the last years it has been having in the academic means, on the part of the industrial engineering an effort in the sense of integrating two control methodologies that, in many real situations, are implemented in independent way. The first of these, defended by the quality engineers, is statistical process monitoring by control charts, or statistical process control (SPC). The second approach is based on adjusting the process using information about its current level or deviation from the desired target. Both methodologies are based on model specification and model building of the process. This work presents a comprehensive methodologies for both the model specification and model building of processes, based on least squares estimation and maximum likelihood estimation in order to capture the internal processes dynamics and thus to get the necessary models to be used on the integrated, whether or not, implementation of the statistical process control (SPC) and engineering process control (EPC). Intending to be so comprehensive as possible, the whole approach was made to lead systems of multiple input, multiple output (MIMO), considering the other models (SISO or MISO) as special cases of this. The methods of model specification and model building implemented were later used with real data from a MISO process, thus obtaining the model that formed the basis for simulating the system of integrated SPC / EPC. Based on the results of the simulation, we conclude that the integrated system allows both a better adjustment process in relation to reference values (target), reduce their variability, detecting changes in process and, if possible, to change the algorithm control to respond to process shifts.
Indice
Indice
1 Enquadramento ................................................................................................................ 9 1.1 2 3 Aspectos de controlo do processo .......................................................................... 10 Monitorizao do processo e ajustamento do processo .................................. 10 1.1.1
Objectivos ....................................................................................................................... 13 Introduo....................................................................................................................... 15 3.1.1 3.1.2 3.2 3.2.1 3.2.2 3.3 Controlo do processo em indstrias de processo e produto ............................ 15 Controlo do processo lote a lote (run-to-run) ................................................... 20 Notao ............................................................................................................ 25 Conceitos e definies ..................................................................................... 26
Estrutura .................................................................................................................. 28 Introduo ............................................................................................................... 31 Sistemas de controlo contnuo ......................................................................... 31 Sistemas discretos ........................................................................................... 43 Modelos Autoregressivos ................................................................................. 60 Modelos Mdia Mvel ...................................................................................... 67 Modelos ARMA ................................................................................................ 70 Processos no estacionrios: ARIMA .............................................................. 73 Utilizao de modelos ARIMA em previso ..................................................... 76 Identificao de Modelos ARIMA(p,d,q)........................................................... 78 Estimao dos Parmetros do Modelo ............................................................ 84 Teste de validao em modelos de series temporais ...................................... 88 Modelos de funo de transferncia ................................................................ 89 Identificao de funes de transferncia de processos ................................. 92 Estimao recursiva ....................................................................................... 103
Modelos Matemticos de Processos .............................................................................. 31 4.1 4.1.1 4.1.2 4.2 4.2.1 4.2.2 4.2.3 4.2.4 4.2.5 4.2.6 4.2.7 4.2.8 4.3 4.3.1 4.3.2 4.3.3
Sistemas de Controlo ................................................................................................... 109 5.1 Controlo ptimo ..................................................................................................... 111 Controladores de varincia mnima (MMSE) ................................................. 112 Controlador de Varincia mnima generalizado ............................................. 120 5.1.1 5.1.2
Indice
Anlise Multivariada ...................................................................................................... 123 6.1 Sries temporais Multivariadas ............................................................................. 123 Series temporais multivariadas estacionrias ................................................ 123 Representao de modelos lineares para processos vectoriais estacionrios 126 6.1.1 6.1.2
6.1.3 Construo do modelo inicial e estimativa dos mnimos quadrados para modelos vectoriais ARMA ............................................................................................. 139 6.1.4 6.1.5 6.2 6.2.1 6.2.2 6.2.3 6.2.4 7 7.1 7.2 7.3 8 Estimativa de mxima verosimilhana e validao do modelo ...................... 148 Modelos de cointegrao e de rank reduzido ................................................ 157 Tipos de Representao ................................................................................ 159 Previso com modelos vectoriais ARMAX ..................................................... 161 Controlo ptimo .............................................................................................. 165 Especificao e validao do modelo ARMAX .............................................. 167
Combinao SPC e EPC .............................................................................................. 169 Controlo econmico ............................................................................................... 170 Controlo de custo mnimo com custos fixos de ajustamento e monitorizao171 Monitorizao dos parmetros e estratgias de ajustamento por realimentao . 174 Controlo Adaptativo multivariado ........................................................................... 177 Modelo base de estratgia de controlo adaptativo multi-input multi-output ... 178 7.1.1
7.3.1 8.1
Desenvolvimentos Prticos .......................................................................................... 183 Descrio e caracterizao do processo ............................................................... 183 Processo base ................................................................................................ 183 Processo de estudo ........................................................................................ 185 Anlise de correlao e coeficientes de Yule-Walker .................................... 187 Determinao das ordens do modelo ............................................................ 189 Modelo ARMA(1.2.3, 4) .................................................................................. 193 Modelo ARMA(0.1.2.3.4, 4) ............................................................................ 195 Estratgia de Controlo .................................................................................... 200 Estratgia de integrao ................................................................................ 205 Concluses ..................................................................................................... 217 8.1.1 8.1.2 8.1.3 8.2 8.3 8.2.1 8.3.1 8.3.2 8.4 8.4.1 8.4.2 8.4.3
Indice
1. Enquadramento
1 Enquadramento
O desempenho de um produto, um sistema ou um servio normalmente julgado em termos de confiana (que pode ser definido como um agregado de qualidade, fiabilidade, manutibilidade etc.) e segurana, no negligenciando o custo de alcanar estes atributos. O controlo eficiente dos processos um elemento chave na manuteno e melhoria da qualidade e produtividade. Tradicionalmente, duas diferentes vertentes tcnicas tm contribudo significativamente para o desenvolvimento do controlo dos processos na indstria As tcnicas de ajustamento do processo baseadas em princpios de controlo por realimentao ou feedback tornaram-se um importante recurso do kit de ferramentas utilizado pelos Engenheiros da Qualidade (ver (Box & Luceo, 1997), (Montgomery, 2001), (Del Castillo E. , 2002) , (Box, Jenkins, & Reinsel, 2008)). Uma variedade de tcnicas para o ajustamento dos processos tem sido propostas e estudadas devido ao recente interesse na integrao do controlo estatstico do processo (SPC Statistical Process Control) e controlo da engenharia do processo (EPC Engineering Process Control). Este tema envolve a abordagem de quatro grandes reas de estudo: identificao e modelao de sistemas ou processos, controlo estatstico, engenharia de controlo e a integrao do controlo estatstico com a engenharia de controlo.
Integrao EPC/SPC
A parte fulcral da agregao destas quatro reas, e qual foi dedicado a maioria do tempo durante este trabalho, a parte de identificao e modelao sistemas. A obteno de um bom modelo meio caminho andado para a obteno de bons resultados na aplicao desta metodologia.
10
1. Enquadramento
A engenharia de controlo tem por base o modelo do processo. Apesar de a maioria das metodologias de controlo, P, PI, PID, utilizarem o modelo off-line como uma ferramenta de anlise e projecto, no controlo preditivo, o modelo a parte integrante do algoritmo de controlo e os nveis resultantes so aplicados directamente no processo. No controlo estatstico, na utilizao das cartas de controlo assume-se que, se o processo est sob controlo, o processo tem mdia constante e os dados so completamente no correlacionados. Em engenharia de processo defende-se que quase todos os processos produtivos exibem autocorrelao (Del Castillo E. , 2002), pelo que a obteno de um bom modelo para o processo pressupe que os resduos provenientes do modelo sejam constitudos unicamente por rudo branco, alcanando-se assim as condies ideais para a implementao do controlo estatstico.
1. Enquadramento
11
etc., em muitos dos processos no possvel estabiliz-los num estado satisfatrio apenas recorrendo a estas tcnicas. Apesar dos esforos, o processo continua a exibir a tendncia de se afastar dos nveis pretendidos. Estas situaes podem verificar-se devido a fenmenos conhecidos mas incontrolveis como a variao da temperatura ambiente, humidade, etc. ou correntemente no conhecidas. Nestas circunstncias, ser necessrio recorrer a sistemas de ajustamento ou regulao onde a manipulao de determinadas variveis de entrada do processo tem o efeito de compensar as perturbaes que afectam as caractersticas da qualidade do processo.
2. Objectivos
13
2 Objectivos
Sem haver um objectivo previamente definido na abordagem deste tema, tentou-se, dentro das restries impostas ao desenvolvimento deste trabalho, ir o mais longe possvel no estabelecimento, organizao e implementao de ferramentas que permitissem construir uma metodologia mais ou menos abrangente para o desenvolvimento de tcnicas para a implementao de sistemas integrados EPC/SPC em ambiente industrial. Com o andar do tempo foi-se tendo a sensibilidade da dimenso da matria a abordar e a ficar com a sensao de que seria difcil sair dos fundamentos sem queimar etapas, optando-se por alargar as bases em vez de se avanar para modelos de controlo mais elaborado e especficos. Sendo um dos objectivos do trabalho a estruturao da metodologia, tentou-se abdicar das ferramentas que por vezes se utilizam sem se saber ao certo o que se est a fazer, pelo que, na modelao de sistemas dinmicos, e noutros desenvolvimentos usados ao longo deste trabalho, evitou-se ao mximo utilizar software existente, como por exemplo MATLABS SYSTEMS ID TOOLBOX ou SAS PROC STATE SPACE, uma vez que ao recorrer-se a este tipo de ferramentas, a metodologia proposta passa a depender de ferramentas externas no generalizadas, para alm de se perder a teoria que est por subjacente a esta metodologia, perdendo-se assim tambm a sensibilidade de anlise de dos resultados. Devido grande extenso da matria envolvida neste tema, e s restries em termos de tempo, houve muitos conceitos e metodologias que foram deliberadamente postos de parte ou abordadas de forma muito ligeira, como o caso da metodologia de espao de estados, controladores PID, controladores PID com modelo interno, controlo preditivo, forma cannica do modelo VARMA ou mesmo os modelos no estacionrios e de rank reduzido, sendo que alguns assuntos foram mesmo utilizados na prtica, nas no esto devidamente documentados. Devido ao seu inquestionvel interesse, esses temas devero ser desenvolvidos posteriormente no seguimento deste trabalho. O suporte base de programao e implementao das frmulas e algoritmos apresentados ao longo da parte terica foi basicamente o MATLAB, verso 7.0.0.19920 Da Math Soft Inc. Em certos casos recorreu-se ao Microsoft Visual C++, verso 6, principalmente quando se pretendeu criar ferramentas para utilizao futura como foi o caso dos programas para a determinao de custos mnimo como os apresentados nos anexos I e II. Estas ferramentas foram desenvolvidas numa altura em que os objectivos e processos de estudo ainda no estavam definidos com a intuio de que deveriam ser necessrias numa altura mais avanada.
3. Introduo
15
Introduo
16
3. Introduo
Estas ferramentas revelaram-se bastante teis na presena de processos responsivos, nos quais o comportamento dinmico das variveis de sada apenas devido dinmica dos distrbios e o controlo exercido tem seu efeito completo imediatamente. Na produo discreta, o factor de controlo ser o ponto de operao da mquina (set point). s alteraes na sada no estado estacionrio que se obtm devido a uma alterao unitria na entrada d-se o nome de ganho do sistema. O valor do ganho determinado off-line com recurso a desenho de experincias e a tcnicas de regresso. A literatura disponvel em processos de ajustamento pode ser amplamente classificada de acordo com os problemas a que se destinam: 1. Feedback adjustment for machine tool problems 2. Setup adjustment problems 3. Run-to-run process control in application to semiconductor industry
3. Introduo
17
target e o aumento da variabilidade da sada. Estas causas devem ser detectadas com recurso monitorizao do processo.
18
3. Introduo
Se o modelo obtido apropriado, os resduos no devem conter qualquer informao. Se a autocorrelao foi completamente capturada, os resduos devero ser rudo branco. No diagnstico de validao a funo de autocorrelao dos resduos analisada e validada com recurso a testes estatsticos. Se os resduos mostrarem autocorrelao significativa, ento o modelo deve ser refeito e todos os trs estgios devem ser repetidos at se encontrar um modelo satisfatrio. Modelo Integrativo Mdia Mvel ARIMA(0,1,1) O modelo IMA(1,1) um caso especial dos modelos ARIMA(p,d,q). Este modelo tem servido para representar uma larga gama de sries temporais utilizadas na prtica, tais como procuras de mercado, preos, stocks, caractersticas de processos qumicos e fsicos (temperaturas, viscosidades, concentraes) etc. Este modelo tem-se mostrado tambm bastante apropriado para modelar distrbios que ocorrem nos processos. Com o parmetro AR igual a zero e os parmetros I e MA iguais a um, o modelo pode ser representado pela forma = O modelo caracterizado por dois parmetros e . Este modelo pode igualmente ser reescrito numa forma mais conveniente = = + +
+ +
=
Intuitivamente, uma mistura de shocks aleatrios correntes com a soma de shocks aleatrios. Este modelo bastante utilizado na previso de distrbios e caracterizao da funo de transferncia de processos dinmicos.
3. Introduo
19
custos de ajustamento assumem-se fixos e independentes da magnitude do ajustamento. Os custos de amostragem so aqueles que incorrem na obteno dos valores numricos finais das caractersticas da qualidade. Estes incluem os custos incorridos na amostragem do processo e do processamento de anlises fsicas ou qumicas para se determinar leituras precisas e objectivas das medidas efectuadas. Quando os custos de amostragem so significativos, poder ser indesejvel uma frequncia elevada de amostragem. Estes custos variam fortemente de situao para situao. Enquanto que numa produo os custos de no conformidade podem ser dominantes, noutros processos, os custos de amostragem podem ser bastante elevados, enquanto noutros ainda, os custos de ajustamento podem ser bastante altos, envolvendo a paragem do processo ou custos relacionados com reparaes.
20
3. Introduo
com o incremento das observaes disponveis. A espera pela colecta de uma quantidade significativa de dados entra em conflito com o objectivo de trazer rapidamente o processo para os valores desejados. Uma estratgia ptima para esta situao passa por estimar sequencialmente o offset e ajustar o processo em conformidade. Grubbs props uma elegante regra de ajustamento sequencial para resolver o problema de ajustamento do erro de setup, conhecida como regra harmnica de Grubb (Grubb, 1954/1983). A estratgia de ajustamento proposta consiste em ajustar o processo de acordo com a seguinte equao + = = , , ,
A regra de ajustamento implica que, aps a produo da primeira parte, o processo ajustado em funo do desvio observado. Aps a produo da segunda parte, o processo ajustado em funo de metade do desvio observado e assim por diante. O ajustamento segue a serie harmnica 1, , , , sendo por isso conhecida como a
2 3 1 1
serie harmnica de Grubb. Foram feitos os seguintes pressupostos: 1. O processo estvel sem autocorrelao (sem dinmica) ou alterao na mdia. 2. Os ajustamentos alteram a mdia do processo. 3. Os ajustamentos so exactos e implementados em todas as partes. Os problemas de ajustamento e de setup tem tido recentes desenvolvimentos atravs de estudos de Pan e Del Castillo (Pan & Del Castillo, 2003) e Sulo e Vandevan (Sulo & Vandevan, 1999).
3. Introduo
21
= + + Onde o valor da caracterstica da qualidade do processo (sada) para o lote ; a varivel de controlo (entrada) determinada no fim do processamento do lote 1; a perturbao do processo; o offset do processo (ordenada na origem) e o declive ou ganho. Assume-se que e so constantes ao longo do tempo. Estes valores so desconhecidos e tem que ser estimados a partir dos dados disponiveis. O ganho do processo similar a um coeficiente de regresso que relaciona a alterao da sada com a correspondente alterao na entrada. O ganho do processo estimado atravs de desenho de experincias, anlise de regresso e metodologia de resposta em superfcie (Box & Draper, 2007). Seja 0 e as estimativas iniciais de e . 0 e so tipicamente estimados pela metodologia dos mnimos quadrados a partir dos dados histricos. Tal como como em qualquer outro controlador nestas circunstncias, a varivel de controlo ajustada para invalidar o desvio da resposta, ou seja =
onde o valor de Target. No controlador EWMA proposto, o parmetro desconhecido recursivamente estimado e actualizado e a varivel de entrada determinada ao fim de cada lote. A equao de estimao a seguinte = + onde 0 1 o chamado factor de desconto. O valor de offset estimado substitudo na equao seguinte para determinar o valor da varivel de controlo =
Como notrio, a ideia chave no controlador EWMA que para um predeterminado ganho do processo, o offset e variveis de entrada so actualizadas recursivamente. O valor esperado convergir ento assimptoticamente para o desejado valor de target. Se as perturbaes do processo seguirem o modelo no estacionrio IMA(1,1) = + ~ ,
22
3. Introduo
e o vis do ganho estimado pode ser representado como = sob a condio de que 0 < < 2, o ganho estimado est enviesado no mais que duas vezes o valor estimado, o factor ptimo de desconto dado por =
Contudo, uma estimativa imprecisa dos parmetros desconhecidos e conduz a valores elevados do vis inicial + e dever demorar alguns lotes para o controlador EWMA levar o processo de volta ao target. Controladores de duplo EWMA Os processos de produo podem estar sujeitos a deriva determinstica com o tempo e tender a afastar-se da referncia. Estes fenmenos podem estar relacionados com o envelhecimento das mquinas ou deteriorao das condies ideais de produo com o tempo. O objectivo do controlo por realimentao ajustar as variveis de controlo tal que a sada esteja to prxima quanto possvel da referncia. A utilizao de uma single-EWMA neste caso poder no ser ptima porque no pode compensar a tendncia determinstica. Considere-se um processo que est compensado e sujeito a distrbios e deriva com o nmero de processamentos. O processo pode ser descrito pela seguinte expresso = + + + Como definido anteriormente , , , , correspondem respectivamente sada, ao offset, ao declive, aos distrbios e entrada. a taxa de deriva determinstica. Os seguintes controladores de dupla EWMA aplicam-se a processos produtivos com deriva linear (Moyne, del Castillo, & Hurwitz, 2001) + = + = = +
O controlador de duplo EWMA consiste num filtro para estimar a verdadeira sada do processo e num filtro para estimar a tendncia. A previso igual soma das duas componentes. Duplo EWMA avanado Em (Moyne, del Castillo, & Hurwitz, 2001), Ruey-Shan Guo, Argon Chen e Jing-Jung Chen apresentam o denominado Enhanced EWMA Controller que um controlador baseado em filtros EWMA composto por dois mdulos denominados por Dynamic-
3. Introduo
23
Tunning Loop module e Run-by-Run Feedback Control module. O modulo DynamicTunning Loop utiliza primeiro uma carta de controlo EWMA para determinar a existncia de alteraes mdias ou grandes no processo. Se existir uma alterao mdia ou grande no processo, e o erro controlvel, ento parmetro de controlo (factor de desconto ) alterado para valores altos e inicia o mdulo Dynamic-Tunning Loop de modo a trazer o processo rapidamente aos valores de referncia. No modulo Run-byRun Feedback Control o parmetro de controlo sintonizado baseado no estado corrente do Dynamic-Tunning Loop. Durante a execuo do Dynamic-Tunning Loop, o parmetro de controlo vai diminuindo at atingir o valor predeterminado 0 a partir do qual Run-by-Run Feedback volta s condies iniciais. Se o erro no controlvel, o processo pra disparando assim uma aco de controlo externa. Controlo Run-to-Run para pequenas produes Nos controladores de base EWMA apresentados at aqui pressupunha-se que os processos atingissem o estado estacionrio com um apropriado factor de desconto, mas para atingir o estado estacionrio poder ter que se processar alguns lotes at que o processo atinja os valores de referncia. Este tempo de resposta poder ter consequncias severas nas pequenas produes, frequentemente encontradas at na indstria de semicondutores, onde esta matria tem tido os desenvolvimentos mais recentes. O objectivo dos controladores IIIA (Internal Intercept Iteratively Adjusted) e controladores de EWMA varivel superar esta negligncia e reduzir a alta taxa de retrabalho nas produes iniciais (Krishna B. Misra, 2008).
24
3. Introduo
A convenincia de utilizao de EPC e SPC num processo depende dos seguintes factores: 1. Quando os custos de ajustamento e/ou erros de ajustamento so elevados, melhor no implementar o EPC. 2. Quando os erros medidos so elevados no aconselhvel utilizar o EPC. 3. Quando a amostragem lenta relativamente dinmica do processo, o processo observado no exibe autocorrelao e controlo estatstico ser suficiente. De notar que a reduo da frequncia de amostragem para propsitos de SPC ser til apenas se o processo original estacionrio. A reduo da frequncia de amostragem de um processo no estacionrio ainda produz processos no estacionrios. Uma estratgia de ajustamento baseada no EPC ser aconselhvel em tais casos (Krishna B. Misra, 2008). As cartas de controlo podem ter um papel efectivo na reduo da variao do processo quando existem causas especiais em processos controlados por EPC. O denominado ASPC (Algoritmic Statistical Process Control) uma estrutura que unifica o SPC e o EPC. um sistema que utiliza o EPC para regular o processo e SPC para monitorizar o processo controlado com a finalidade de detectar qualquer alterao do processo em relao ao modelo assumido e rev-lo se necessrio. Existem pelo menos dois mtodos utilizados na integrao do SPC com EPC, o primeiro consiste em monitorizar a sada do processo controlado por EPC, a segunda consiste em monitorizar as aces de controlo do EPC. Um dos problemas com a monitorizao das respostas que quando existem causas especiais, as respostas esto contaminadas pelas aces de controlo, o que resultar numa janela mais pequena para as oportunidades de deteco. No entanto as sadas esto correlacionadas com as entradas, pelo que atravs da monitorizao das aces de controlo, estas situaes podem perfeitamente ser detectadas. A performance da monitorizao de um processo controlado por EPC pode depender da monitorizao das respostas ou aces de controlo, da estratgia de controlo empregue (MMSE ou PID) e da estrutura de autocorrelao subjacente. SPC Algoritmico (Vander Weil, 1992) props um algoritmo de controlo baseado no MMSE (Minimum Mean Square Error) e um esquema de monitorizao da sada por uma carta CUSUM, a que se chamou Algorithmic SPC ou ASPC. (Montgomery D. C., 1994) Investigou dois tipos de causas especiais, uma alterao contnua e uma tendncia linear, e demonstrou que os procedimentos combinados melhoram a performance em relao ao procedimento apenas do EPC (ver tambm: (MacGregor, 1987), (MacGregor J. F., 1990), (Box G. E., 1992), (Capilla, Ferrer, Romero, & Hualda, 1999), (Montgomery D. C., 2001), (Chen, 2002) ). Adicionalmente, a monitorizao de sries autocorrelacionadas tem semelhana visvel com o ajustamento do processo. A performance das vrias cartas de monitorizao tem sido investigada para casos especiais de nvel de alterao ( (Alwan, 1988), (Wardell, 1994), (Vander Weil S. , 1996), (Atienza, 1998)
3. Introduo
25
ARL ARMAX ARX AR(p) BJ Carta CUSUM Carta EWMA EPC FAC FACP Function FCC fdp FT-R LC LIC LSC ISD MSE MIMO MISO MR PCA
Vrias variveis de sada e vrias variveis Multiple Input Multiple Output de entrada Uma varivel de sada e vrias variveis de entrada Amplitudes Mveis Anlise em Componentes Principais Multiple Input Single Output Moving Range Principal Component Analysis
26
3. Introduo
Uma varivel de sada e uma variveis de entrada Engenharia de controlo do processo Erro de previso quadrtico Varincia Mnima
Single Input Single Output Statistical Process Control Squared Prediction Error
A primeira condio significa que todo o tem o mesmo vector mdia e a segunda condio requer que a autocovarincia do processo no dependa de mas apenas do perodo de tempo de que os dois vectores e esto separados (Ltkepohl, 2007). Autocovarincia e Autocorrelao O prefixo auto significa uma aco reflectiva nele prprio, assim a autocovarincia a covarincia que o processo tem com ele prprio. A funo autocovarincia, denominada por , d a medida da dependncia linear (associao linear) entre duas variveis do mesmo processo e + , que esto separadas por perodos ou lags, como funo de k. para qualquer processo discreto, define-se , = , + = + = 0, 1, 2
Pelo que a funo autocovarincia depende apenas da lag , sendo que, para = 0 tem-se = = = . Normalmente torna-se mais simples trabalhar com a autocovarincia normalizada que se obtm dividindo a autocovarincia do processo pela prpria varincia do processo, neste caso , obtendo-se assim a funo denominada autocorrelao. Para um processo estacionrio define-se a funo autocorrelao dada por
3. Introduo
27
= 0, 1, 2
Onde 1 1. Dado que = o que implica que = , estas funes normalmente esto definidas apenas para lags positivas. Tanto a autocorrelao como a autocovarincia na lag do o grau de associao linear entre duas variveis do mesmo processo, e , separadas que esto separadas perodos. Nas relaes entre variveis aleatrias conveniente relembrar as seguintes implicaes: 1. Se e so independente ento so no correlacionadas, isto , = qualquer que seja . 2. Se e so correlacionados isto , para algum , ento e so dependentes. O desvio padro da mdia de um processo autocorrelao. (Bartlett, 1946) mostrou que +
(3.1)
Deste modo, se um processo completamente no correlacionado, ou seja, = 0 para todo o , o desvio padro da mdia do processo ser dado pelo usual . A estimativa da funo autocovarincia pode ser obtida atravs da funo autocovarincia amostral dada por (Del Castillo, 2002) = =
+
=
= , , ,
(3.2)
= , , ,
Rudo branco vectorial (Multivariado) O processo vectorial rudo branco definido como uma sequncia de vectores aleatrios independentes, , 1 , , , em que = 1 , , , tal que
28
3. Introduo
= 0, = , onde a matriz de covarincia assumida positiva definida, e + = 0 para 0 devido independncia. Consequentemente as suas matrizes de covarincia so dadas por
= + =
Operador vec e produto de Kroneker de Matrizes Define-se o operador vec que transforma uma matriz num vector coluna colocando (ou empilhando) as colunas da matriz uma por baixo das outras. Ou seja, se uma matriz de dimenso definida por = 1 , , onde a i-sima coluna de , definese o vector coluna de dimenso 1 dado pela expresso = = , ,
(3.3)
O produto de Kroneker de duas matrizes definido como se segue. Seja = uma matriz de dimenso e = uma matriz de dimenso . Ento o produto de Kroneker de A e C, cuja notao , a matriz da forma =
(3.4)
Uma propriedade bastante til relacionada com o operador vec que se Z=ABC, ento = = ()
(3.5)
3.3 Estrutura
Em linhas gerais, a presente dissertao constituda por quatro partes mais Anexos. A primeira parte, de reduzida dimenso e de natureza predominantemente informativa, inclui os ndices, o enquadramento do tema do trabalho, uma introduo ao tema e os trabalhos mais relevantes nesta rea e ainda algumas abreviaturas, termos e definies utilizadas ao longo este trabalho. A segunda parte que constitui a estrutura principal deste trabalho, constituda pelos captulos 3 a 8, e est dividida em dois grandes blocos. O bloco 1, que vai do captulo 4 ao captulo 7, apresenta os fundamentos tericos onde assenta toda a parte experimental e investigao realizada. O bloco 2 composto pelo captulo 8 e descreve o trabalho efectuado em termos prticos. O bloco 1 por sua vez est dividido em 3 sub-blocos. O sub-bloco 1 composto pelos captulos 4 e 5 e aborda temas relativos a modelos matemticos de processos e sistemas de controlo no domnio escalar, ou seja, trata-se de modelos que apenas usam uma varivel, ou, quanto muito trata-se de modelao de sistemas com uma varivel de entrada e uma varivel de sada. No sub-bloco 2 faz-se a anlise do mesmo tipo de
3. Introduo
29
sistemas mas extrapolando para o plano multivariado. No sub-bloco 3 apresenta-se vrias metodologias de abordagem ao tema objectivo deste trabalho que a integrao do controlo estatstico com engenharia de controlo. O bloco 2 descreve-se e caracteriza-se o processo que serviu de base ao estudo efectuado, apresenta-se os desenvolvimentos prticos efectuados e as concluses preliminares. Bloco 1 O bloco 1 composto pelos captulos 4, 5, 6 e 7. No capitulo 4 introduz-se o conceito de modelao de sistemas dinmicos, faz-se uma abordagem transformada de Laplace e modelao de sistemas dinmicos no espao das fazes (domnio s). A partir desta abordagem passa-se para a modelao discreta com a introduo da transformada z e faz-se a ponte para a modelao no domnio do tempo introduzindo-se os modelos de sries temporais. O subcaptulo 4.2 apresenta os principais conceitos subjacentes teoria das sries temporais e as metodologias de identificao, estimao de parmetros, teste e validao de modelos autoregressivos (AR), mdia mvel (MA), e modelos mistos ARMA e ARIMA. O subcaptulo 4.3 introduz o conceito de funo de transferncia e a sua relao com a resposta ao impulso. Introduz os modelos de varivel exgena ARX e ARMAX e a metodologia de identificao de funes de transferncia de sistemas dinmicos. O ponto 4.3.3 apresenta metodologias de estimao recursiva (on-line) de modelos ARMA e ARMAX. Embora esta metodologia se situe na seco referente a sistemas univariveis, ela tambm aplicvel a sistemas multivarivais. O captulo 5 aborda um dos problemas principais deste trabalho: como ajustar um processo com a garantia de que os ajustamentos efectuados so os mais indicados (ptimos). Este captulo alm de introduzir o conceito de controlo por realimentao (feedback), faz a abordagem a algumas das metodologias de controlo aplicveis aos modelos estudados at este ponto como sejam os controladores tericos de varincia mnima ou o modelo de controlo de Clarke e Gawthrop. O sub-bloco 2 do bloco 1 composto exclusivamente pelo captulo 6 e talvez o captulo core deste trabalho. A seco 6.1 comea por apresentar as sries temporais multivariadas, aborda-se algumas das dificuldades inerentes identificao e representao de forma nica dos modelos mistos ARMA e estabelece-se a metodologia para a construo dos modelos preliminares passando depois estimao dos modelos finais com recurso a estimativas da mxima verosimilhana. A exemplo do que foi apresentado para o caso univariado, a seco 6.2 aborda a introduo das variveis exgenas nos modelos VARMA (uma das designaes aplicadas aos modelos ARMA multivariados - Vector ARMA) passando a denominar-se por modelos VARMAX. Esta seco faz ainda uma abordagem aos sistemas de controlo aplicveis este tipo de processos e finaliza com a apresentao de tcnicas de especificao e validao de modelos VARMAX. O sub-bloco 3 do bloco 1 composto exclusivamente pelo captulo 7. Este captulo apresenta algumas metodologias bsicas de integrao do controlo estatstico com
30
3. Introduo
engenharia de controlo. O subcaptulo 7.1 faz uma abordagem aos custos envolvidos nas estratgias de controlo e apresenta solues para determinar os parmetros de controlo que minimizam os custos envolvidos. No subcaptulo 7.2 faz-se uma ligeira abordagem s cartas de monitorizao Cuscore com nfase na sua vocao para detectar alteraes nos parmetros dos modelos de sries temporais ARMA. No subcaptulo 7.3 apresenta-se o conceito de controlo adaptativo que ser uma das reas onde a integrao EPC/SPC pode ter particularmente sucesso. Nessa mesma seco apresenta-se ainda o caso mais estudado nesta rea nos ltimos anos (Del Castillo & Yeh, An adaptive run-to-run optimizing controller for linear and nonlinear semiconductor processes, 1998) e que constitui uma das maiores referncias deste trabalho. Bloco 2 Neste bloco apresenta-se alguns resultados do trabalho prtico efectuado. A base do trabalho prtico efectuado assenta basicamente nos fundamentos tericos apresentados na seco 6. No ponto 8.1 faz-se uma anlise do processo de estudo e estabelecem-se as indicaes preliminares sobre a estrutura do modelo. Nos pontos 8.2 e 8.3 procedese modelao e validao do modelo que ser utilizado como o modelo representativo do processo nas simulaes a efectuar. No ponto 8.4 apresentam-se os resultados e concluses preliminares resultantes de algumas das simulaes efectuadas. A terceira parte composta pelo captulo 9, designado como Concluses, Recomendaes e Trabalho Futuro. Nesta parte apresenta as concluses gerais do trabalho realizado e das limitaes verificadas. Apresenta-se ainda algumas situaes que se pretendia abordar mas que no foi possvel devido s condicionantes existentes. Finalmente especula-se um pouco sobre o que se poder fazer em sequncia deste trabalho e respectivas potencialidades. A quarta parte composta pelas referncias bibliogrficas.
31
Sistemas lineares
Um sistema considerado sistema linear se se aplica o princpio da sobreposio. O princpio da sobreposio estabelece que a resposta produzida pela utilizao simultnea de duas diferentes funes a soma das duas respostas individuais. Uma equao diferencial linear se os coeficientes so constantes ou funes apenas das variveis independentes. Sistemas dinmicos compostos por componentes lineares invariantes no tempo podem ser descritos por equaes diferencias invariantes no tempo (coeficientes lineares constantes). A esses sistemas atribui-se o nome de sistemas lineares invariantes no tempo. Aos sistemas dinmicos representados por equaes diferenciais cujos coeficientes so funes do tempo atribui-se o nome de sistemas lineares variantes no tempo, por exemplo um sistema em movimento em que a massa total vai variando com o tempo devido ao consumo de combustvel. Um sistema no linear se o princpio da sobreposio no se aplica. Para um sistema no linear, a resposta de duas entradas no podem ser calculadas pelo tratamento das entradas individuais e somando o resultado. Em engenharia de controlo, a operao normal de um sistema no linear pode ser volta de um ponto de equilbrio, e os sinais podem ser considerados pequenos sinais volta do equilbrio. Nestes casos pode ser possvel o sistema no linear num sistema linear. Nesses caos, o sistema linear equivalente ao sistema no linear dentro dos limites da regio de operao.
32
entanto, que ter sempre em mente que a obteno de um razovel modelo matemtico a parte mais importante de toda a anlise. Os modelos matemticos podem assumir as mais diversas formas dependendo da particularidade do sistema e das circunstancias, um determinado modelo pode ser mais apropriado que outro.
f(t) s L
Uma funo do tempo t tal que f(t) = 0 para t < 0 Uma varivel complexa Um smbolo operacional que indica que indica que a quantidade que lhe sucede para ser transformada pelo integral de Laplace 0 A transformada de Laplace de f(t)
F(s)
= =
) =
Ao processo inverso de determinar a funo no domnio do tempo f(t) partir da transformada de Laplace d-se o nome de transformada inversa de Laplace, indicado pelo smbolo operacional L-1 e pode ser determinado pelo seguinte integral de inverso: = =
+
> 0
33
A transformada de Laplace de uma funo () existe se o integral de Laplace converge. O integral convergir se () seccionalmente continua num intervalo finito no domnio > 0 e se de ordem exponencial quando t tende para infinito. Uma funo () diz-se ser de ordem exponencial se uma constante real, positiva existe tal que a funo () Tende para zero quando t tende para infinito. Funo degrau Considere-se a seguinte funo degrau:
f(t) = 0 f(t) = A
onde A uma constante. De notar que este caso um caso especial da funo At , onde
=
0
No desenvolvimento deste integral, assume-se que a parte real de s maior que zero o que implica que zero. Esta funo vlida em todo o plano s excepto no plo s = 0. funo degrau com amplitude unitria (A=1) d-se o nome de degrau unitrio. A funo degrau unitrio que ocorre no ponto t = t0 frequentemente descrita como 1(t - t0). Seguindo a mesma notao, uma funo degrau de amplitude A que ocorre em t = 0 pode ser descrita como f(t) = A1(t). A transformada de Laplace da funo degrau unitrio, que nesta notao poder ser definida como
1(t) = 0 1(t) = 1
1/s ou
1() =
Fisicamente, uma funo degrau que ocorre em t = 0 corresponde a um sinal constante aplicado ao sistema instantaneamente no instante t igual a zero. Funo transladada Especial importncia tem a funo transladada dada por f(t - )1(t - ), onde 0. Esta funo zero para t < . Por definio, a transformada de Laplace de f(t - )1(t - )
34
=
0
1 =
Assumindo-se que f(t) = 0 para t < 0, f()1() = 0 para < 0. Ento pode-se mudar o limite inferior de integrao de - para 0
=
0
=
0
= onde
= ()
= () =
0
Concluindo-se que 1 = , 0
Esta equao estabelece que translao da funo de tempo f(t)1(t) por (onde 0) corresponde multiplicao da transformada de F(s) por e-s. Funo pulso Considere-se a funo pulso = , 0 = 0, 0 < < 0 < 0, 0 <
Onde A e t0 so constantes. A funo pulso aqui descrita deve ser vista como uma funo degrau de amplitude A/t0 que comea em t = 0, e que sobreposta por outra funo degrau negativa, com a mesma amplitude em t = t0, isto () = 1() 1( 0 ) 0 0
35 1 0 1 0 0
= = =
0 0 0
0
1 0
(4.1)
Funo impulso A funo impulso um caso limite especial da funo pulso. Considere-se a funo: () = lim 0 0 ,
0
= 0,
Se a amplitude da funo impulso for A/t0 e a durao t0, a rea abaixo do impulso ser igual a A. Como a durao t0 tende para zero, a altura for A/t0 tende para infinito, mas a rea mantm-se igual a A. A transformada de Laplace da Equao (4.1) para esta funo impulso ser dada por: 1 0 0 1 0 0 = lim 0 0 0 0 =
= lim
0 0
Assim, a transformada de Laplace da funo impulso ser igual rea subjacente funo. funo impulso cuja rea igual a um, d-se o nome funo impulso unitria ou funo delta de Dirac. A funo impulso unitria que ocorre em t = t0 denomina-se por (t t0), e satisfaz as seguintes condies: 0 = 0, 0 = ,
0 = 0
0 = 1
De salientar que tal funo com amplitude infinita e durao zero fico matemtica que no ocorre em sistemas fsicos. Se, contudo, tivermos um pulso na entrada de sistema com uma amplitude bastante grande, com uma durao bastante pequena comparada com a constante de tempo do sistema, ento pode-se aproximar o pulso de entrada a uma funo impulso.
36
O conceito de impulso bastante til na diferenciao de funes descontnuas, podendo inclusive considerar-se a funo impulso como a derivada da funo degrau unitrio 1(t - t0) no ponto de descontinuidade t = t0 ou seja 0 = 1 0
Inversamente, se a funo impulso unitrio (t t0) integrada, o resultado ser a funo degrau unitrio 1(t t0). Teorema da diferenciao real A transformada de Laplace da derivada duma funo f(t) dada por:
= ()
(4.2)
Onde f(0) o valor de f(t) em t = 0. Se todos os valores iniciais e as suas derivadas so iguais a zero, ento a transformada de Laplace da n-sima derivada de f(t) ser dada por snF(s). As demonstraes deste teorema e seguintes podem ser consultadas em (Ogata, 1997) entre outros. Teorema do valor final Se f(t) e df(t)/dt so Laplace transformveis, se F(s) a transformada de Laplace de f(t) e se lim () existe, ento:
lim = lim ()
0
Este teorema relaciona o comportamento no estado estacionrio de f(t) com o comportamento de sF(s) na vizinhana de s = 0. Este teorema aplica-se apenas se e s se lim () existe. Se todos os plos de sF(s) se situam no lado esquerdo (real(s) menor que zero) do plano complexo, o lim () existe. Se sF(s) tiver no eixo imaginrio ou direita do eixo imaginrio, sF(s) exibir, respectivamente, comportamento oscilatrio ou exponencial no domnio do tempo (t), e o lim () no existe. O teorema do valor final no se aplicar em tais casos. Suponha-se que f(t) uma funo sinusoidal, sin(t), a funo sF(s) ter plos em s = j e lim () no existe. Neste caso, este teorema no se aplica. Teorema do valor inicial Este teorema a contraparte do teorema do valor final. Atravs deste teorema pode-se obter o valor de f(t) em t = 0+. Este teorema no nos d exactamente o valor em t = 0, mas num tempo ligeiramente superior a zero. O teorema pode ser enunciado da seguinte forma. Se f(t) e df(t)/dt so ambas transformveis por Laplace e se lim () existe, ento 0 + = lim ()
37
Teorema da integrao real Se f(t) for de ordem exponencial, ento a transformada de Laplace de por () = calculado em t = 0.
() existe e dado
(4.3)
Neste teorema pode concluir-se que a integrao no domnio do tempo converte-se em diviso no domnio s. Se o valor inicial do integral for zero, a transformada de Laplace do integral de f(t) dado por F(s)/s. Este teorema pode ser ligeiramente modificado para lidar com o integral definido de f(t). Se f(t) for de ordem exponencial, a transformada de Laplace do integral definido dado por: =
(4.4)
0
Onde F(s) = L[f(t)]. Teorema da diferenciao complexa Se f(t) transformvel por Laplace, ento, excepto nos plos de F(s) = ()
Onde F(s) = L [f(t)]. Este teorema conhecido teorema da diferenciao complexa. Alm disso, Em geral, = () = () ()
38
1 + 1 1 + + 1 + 1 = 0 + 1 1 + + 1 +
(4.5)
Em que y a sada do sistema (output) e x a entrada (input). A funo de transferncia do sistema obtm-se tomando-se as transformadas de Laplace de ambos os membros da equao (4.5), sob a hiptese de que todas as condies iniciais so nulas, ou seja = = [] []
() 0 + 1 1 + + 1 + = () 0 + 1 1 + + 1 +
Com recurso ao conceito de funo de transferncia possvel representar a dinmica de um sistema por equaes algbricas no domnio s. Se a mais alta potncia de s no denominador da funo de transferncia for igual a n, o sistema diz-se de n-sima ordem. Como exemplo, considere-se o exemplo tpico usado em teoria de controlo, o sistema mecnico linear massa-mola-amortecedor (Figura 4-1). A fora externa u(t) a entrada do sistema e o deslocamento x(t) da massa, medido a partir da posio de equilbrio na ausncia da fora externa, a sada. Este um sistema de entrada simples e sada simples, de segunda ordem. Para se obter a funo de transferncia, executa-se os seguintes passos: 1. Escrever a equao diferencial para o sistema 2. Tomar a transformada de Laplace da equao diferencial, assumindo todas as condies iniciais nulas 3. Tomar a razo da sada X(s) para a entrada U(s).
39
Tomando a transformada de Laplace de ambos os membros desta equao, admitindo todas as condies iniciais nulas, obtm-se 2 + + = () Onde X(s) = L [x(t)] e U(s) = L[u(t)]. A funo de transferncia ser ento dada por () 1 = () 2 + +
Onde e so respectivamente as transformadas de Laplace da entrada e da sada do sistema. Ento a sada pode ser formulada como o produto de com =
(4.6)
Integral de Convulso A multiplicao no domnio complexo equivalente convulso no domnio do tempo, e portanto a transformada inversa de Laplace da equao (4.6) dada pelo integral de convulso
=
0
=
0
Onde = para < 0. Se 1 () e 2 () so funes bem comportadas continuas e de ordem exponencial, ento
= 1 2
(4.7)
= =
40
Resposta ao impulso Como a transformada de Laplace da funo impulso unitrio a unidade, a transformada de Laplace da resposta ao impulso unitrio de um sistema, quando as condies unitrias so nulas ser simplesmente = () A respectiva transformada inversa de Laplace a funo resposta ao impulso, que tambm a funo de transferncia do respectivo sistema = () = () Esta funo tambm chamada a funo peso do sistema. Assim, a funo de transferncia e a funo resposta ao impulso unitrio de um sistema linear invariante no tempo contm a mesma informao sobre a dinmica do sistema. possvel assim obter a informao completa sobre as caractersticas dinmicas do sistema. Suponha-se que um sistema, cuja resposta ao impulso unitrio (), tem uma entrada descrita por uma funo (). Suponha-se ainda que a entrada se inicia em = 0 e dura at 1 . A entrada () pode ser aproximada por uma sequncia de N funes pulso cuja durao 1 = 1 . Se 1 suficiente pequeno quando comparado com a menor constante de tempo do sistema, ento 0 k-simo pulso pode ser considerado como um impulso cuja magnitude a rea 1 1 . A resposta ao k-simo pulso no instante t ser dada pelo produto da rea do impulso e a funo resposta ao impulso atrasada de 1 1 1 ( 1 ) Como o sistema linear, aplica-se o princpio da sobreposio, pelo que a resposta (), do sistema no instante t, sequncia das N funes pulso ser dada pela soma de convulso
1
=
0
1 ( 1 ) 1
(4.8)
onde = 0 para < 0. Se tirarmos o limite, 1 0 (ou ), ento a resposta do sistema ser dada pelo integral de convulso
=
0
( )
(4.9)
41
A ideia chave que dever ser possvel encontrar um conjunto mnimo de variveis que caracteriza o estado de um sistema dinmico num determinado instante t. A evoluo no tempo desses estados dever ser suficiente para determinar completamente o comportamento do sistema (Botto, Controlo ptimo, 2007). Estado O estado de um sistema o menor conjunto de variveis (chamadas variveis de estado) tal que, o conhecimento destas variveis no instante t = t0, juntamente com o conhecimento das variveis de entradas nos instantes t t0, determina completamente o comportamento do sistema em qualquer instante t t0. Assim, o estado de um sistema dinmico no instante t univocamente determinado pelo estado no instante t0 e pela entrada para t t0, e independente do estado e da entrada antes de t0 (Ogata, 1997). O conceito de estado aplicvel no s a sistemas fsicos, mas a qualquer outro tipo de sistema, nomeadamente, a sistemas biolgicos, econmicos, sociais etc. Variveis de estado As variveis de estado de um sistema dinmico so as variveis constituintes do conjunto mnimo de variveis que determinam o estado do sistema dinmico. As variveis de estado, por definio, no necessitam de ser mensurveis ou observareis, e esta liberdade de escolha uma vantagem do mtodo do espao de estados. No entanto, de todo conveniente escolher, se possvel, grandezas facilmente mensurveis para variveis de estado porque a estratgia de controlo ptimo requer a realimentao de todas as variveis de estado. Vector de estado o conjunto das n variveis de estado necessrias para descrever completamente o comportamento de um dado sistema dispostas na forma vectorial. Um vector de estado portanto um vector que determina univocamente o estado x(t) para qualquer instante t t0, uma vez conhecido o estado no instante t = t0 e a entrada u(t) para t t0. Espao de estados Espao n-dimensional constitudo pelos eixos x1, x2, , xn onde podem ser representados os vectores de estados. Qualquer estado pode ser representado por um ponto no espao de estados. Equaes do espao de estados No espao de estados temos trs tipos de variveis: 1. Variveis de entrada 2. Variveis de sada 3. Variveis de estado A representao por espao de estados para um determinado sistema no nica, mas o nmero de variveis de estado o mesmo para qualquer das diferentes representaes do mesmo sistema.
42
A dinmica do sistema deve envolver elementos que memorizem os valores de entrada para t t1, em sistemas de controlo contnuo, os integradores funcionam com dispositivos de memria, sendo que a sada de tais integradores podem ser consideradas como as variveis que definem o estado interno da dinmica do sistema. Nesta perspectiva, as sadas dos integradores comportam-se como variveis de estado. O nmero total de variveis que definem completamente a dinmica do sistema igual ao nmero de integradores que definem o sistema. Considere-se um sistema MIMO com n integradores, contendo r entradas, u1(t), u2(t) ,, ur(t), e m sadas y1(t), y2(t) ,, ym(t). Definindo-se as n sadas dos integradores como variveis de estado: x1(t), x2(t) ,, xn(t). Ento o sistema pode ser descrito por 1 = 1 1 , 2 , , , 1, 2 , , 2 = 2 1 , 2 , , , 1, 2 , , = 1 , 2 , , , 1, 2 , , As sadas do sistema y1(t), y2(t) ,, ym(t) podem ser descritas na forma 1 = 1 1 , 2 , , , 1, 2 , , 2 = 2 1 , 2 , , , 1, 2 , , = 1 , 2 , , , 1, 2 , , Definindo-se () () = , () () () = , () 1 1 , 2 , , , 1, 2 , , , , , = 2 1 , 2 , , , 1, 2 , , 1 , 2 , , , 1, 2 , , 1 1 , 2 , , , 1, 2 , , , , , = 2 1 , 2 , , , 1, 2 , , , 1 , 2 , , , 1, 2 , , = () ()
(4.10)
(4.11)
()
Onde a equao (4.12) a equao de estado e a equao (4.13) a equao de sada (resposta). Se a funo vector e/ou envolvem explicitamente o tempo, ento o sistema dito um sistema variante com o tempo. Se as equaes (4.12) e (4.13) forem linearizadas numa vizinhana do estado operativo, tem-se as equaes de sada e de estado linearizadas
43
(4.14) (4.15)
= + () = () + ()u(t)
Onde A() a matriz de estado, B() a matriz de entradas, C(), a matriz de sada e D() a matriz de transmisso directa. Um diagrama de blocos das equaes (4.14) e (4.15) est representado na Figura 4-2. Se as funes e no envolvem explicitamente o tempo, diz-se que o sistema um sistema invariante no tempo. Neste caso, as equaes (4.14) e (4.15) adquirem a forma = + () = () + u(t)
(4.16) (4.17)
D(t)
u(t)
B(t)
()
+ +
x(t)
C(t)
y(t)
A(t)
Figura 4-2 Diagrama de blocos de um sistema linear contnuo representado em espao de estados
= 0 = 0
= < < +
= , , ,
(4.18)
Vrios mtodos de gerar funes discretas so apresentados nos exemplos que se seguem. Considere-se a x(t) = e-t. Se se retirarem valores desta funo em intervalos de tempo constantes, t = kT0, esta converte-se numa funo discreta 0 = 0 = , , ,
44
1 1
0 0
=0
Neste caso, a rea do rectngulo k calculada multiplicando o valor (constante) do perodo de amostragem T0, pelo valor da funo no instante k-1, ou seja, Ak = w(k-1)T0 (funo escada e atraso). Calculando este integral um passo frente, obtm-se: 1 = 1
+ 1 0
0 0
=0
+ =
Se substituirmos kT0, se definirmos a1 = -1 e b1 = T0/T1, retardando um perodo, obtm-se: + = Que uma equao s diferenas de primeira ordem. Se funes de tempo discreto, que dependem de outras funes de tempo discreto, podem ser escritas de forma recursiva, ento obtm-se equaes s diferenas. Uma equao s diferenas de ordem m dada por + + + = + + + O valor corrente da sada no instante t pode ser determinado recursivamente = + + + +
(4.19)
(4.20)
se forem conhecidos os valores das entradas (inputs) actuais e passados, e os valores das sadas (outputs) passadas.
45
(4.21)
A equao (4.19) a forma normalizada de uma equao s diferenas. A forma correspondente para uma equao diferencial resulta a partir da introduo das diferenas de ordem n + 1 1 + + 1 + = + + 1 + 0 ()
46
0, ,
0 = 0
(4.22)
Deste modo, um sinal amostrado pode ser definido por um trem de impulsos = 0 + 0 0 + 20 20 + ou
=
=0
0 0
(4.23)
=
0
= 1
(4.24)
Se aplicado a um trem de impulsos (4.23) (relembrar que para uma funo transladada no tempo:
= =
=0
0 0 1
(4.26)
De notar que esta transformada de Laplace contm a dimenso s. A transformada de Laplace duma funo discreta 0 surge ento peridica com frequncia 0 = 2 0 (Isermann, 1989) Teorema da amostragem de Shannon Para cobrir um sinal continuo, de banda limitada, com uma frequncia mxima max com um sinal discreto, a frequncia de amostragem ter que ser tal que (Isermann, 1989) 0 > 2 0 <
(4.27)
Deve ser mencionado que sinais contnuos de banda limitada, na realidade, no surgem apenas para sistemas de controlo. Contudo, em sistema de controlo a frequncia de amostragem tem um papel fundamental, de modo a cobrir a dinmica do sistema. Se, por exemplo, o perodo de amostragem for superior constante de tempo do processo, o sinal
47
amostrado no evidencia a dinmica do sistema, ou seja, no existe correlao entre sucessivos valores amostrados (Montgomery, 2001). Elementos de reteno Um amostrador definido pela equao (4.18). Se um amostrador seguindo por um retentor de ordem zero (ZOH - zero order hold), que retm o sinal amostrado (0 durante um perodo de amostragem, ento resultar um sinal em escada (Figura 4-3).
x*
ZOH
x*
t
Figura 4-3 - Amostrador com zero-order hold
O ZOH pode ser modelado como integrador que tem apenas efeito durante um perodo. A sua resposta ao impulso corresponder a um pulso de altura 1 e durao T0.
4.1.2.4 Transformada Z
A transformada a ferramenta ideal para lidar com sistemas discretos. A transformada da necessidade de eliminar o termo irracional 0 na equao (4.26), que resulta sempre que se aplica a Transformada de Laplace a um sinal descrito por um trem de impulsos. Se definirmos = 0 = 0 = 0
+
= 0 0 + 0 1 ln () 0
(4.29)
48
= 0
=
=0
0 1
=
=0
0 1
(4.30)
De notar que, tal como a transformada de Laplace, a transformada tambm contm a dimenso s. A definio (4.30), apenas faz sentido se () converge. Se 0 uma funo limitada, () converge para = 0 > 1. Por vezes denomina-se z de operador de avano e z-1 o operador de atraso, devido associao: 1 0 , 2 20 , . Geralmente, Y(z) uma srie infinita. Muitas funes podem contudo, ser representadas de forma fechada se usarmos as propriedades das series de potencias. Funo degrau Suponha-se a funo degrau: = , 0, = 0,1,2, = 1, 2,
=0
Sendo esta ultima expresso uma srie geomtrica de razo , pode ser descrita de acordo com a forma fechada = 1 = 1 1
Neste caso, se = 1, y* corresponde ao degrau unitrio amostrado com periodo T0, e portanto possvel escrever directamente da tabela de transformadas Z (Isermann, 1989): 1 = 1
49
Linearidade 1 + 2 = 1 + 2
(4.31)
=0
(4.33)
Na mudana para a esquerda os valores da funo original no mudada () desaparecem para = 0,1, , 1 porque a transformada apenas est definida para > 0. Exemplo (funo degrau) 1 + 3 Amortecimento 0 = 0 0
(4.34)
= 3
1 + 1 + 2 1
Valor final
lim (0 ) = lim
1 () = lim 1 () 1 1
0 ()
Pelo que apenas os valores mltiplos dos instantes de amostragem so coincidentes com os valores de () (Botto, Controlo de Sistemas, 2007) Para derivar a transformada inversa, recorre-se ao facto de () e consequentemente ser peridica com 0 = 2 0 e ainda simtrica em relao ao eixo real do plano s. Esta a
50
razo pela qual () tem de ter a operao transformada inversa aplicada apenas ao domnio 0 + 0 . Existem vrios mtodos de aplicar a transformada inversa: 1. Mtodo da expanso em fraces parciais 2. Mtodo da diviso polinomial 3. Mtodo da frmula inversa Os dois ltimos so bastante trabalhosos. O mtodo da expanso em fraces consiste na seguinte sequncia de operaes: 1. Dividir () por z: . 2. Expandir em fraces parciais. 3. Multiplicar por as fraces obtidas no ponto anterior. 4. Consultar a tabela de transformadas e aplicar a transformada inversa.
T0 y(t) u(k)
Um amostrador entrada de um sistema linear opera com funo de transferncia () ou resposta ao impulso (). A entrada do sistema ento descrita pelo trem de impulsos
=
=0
0 0
(4.35)
Com a resposta ao impulso (), a sada () ser dada pelo somatrio de convulso (ver Resposta ao impulso)
=
=0
0 0
(4.36)
51
=
=0
0 0 0
=0
(4.37)
Tal como o integral de convulso para sistemas contnuos, a sada do sistema no instante 0 dada pelo somatrio de convulso de 0 e 0 . Introduzindo a transformada de Laplace (4.26), sada do sistema, 0 (4.37), resulta
descrita por
=
=0
0 0
=
=0 =0
0 0 0
(4.38)
E substituindo = = +
=
= =0
0 0 0 0
=
=0
0 =0
0 0
(4.39)
Considerando que 0 = 0 para < 0. Consequentemente, a transformada de Laplace () da entrada pode ser expresso como um factor separado e, tal como nos sistemas contnuos, a funo de transferncia ser dada por = =
0 0
=0
(4.40)
0 =
=0
(4.41)
Consequentemente, a funo de transferncia no domnio z a relao entre a transformada z da sada amostrada e a transformada z da entrada amostrada que coincide com a transformada z da funo resposta ao impulso. Se o amostrador seguido por um retentor (Figura 4-5), ento tem-se que
52
(4.42)
() =
= 1 1
(4.43)
T0 m(t)
G(s) g(t)
y
y(t)
u(k)
Se a descrio de um sistema linear est na forma de equao s diferenas (equao (4.19)), ento poder ser escrita na forma + + + = + + +
(4.44)
Aplicando directamente a propriedade de mudana (shifting) para o lado direito atraso, tem-se + + + = + + + () Conduzindo-nos directamente para a funo de transferncia no domnio z = () + + + = = () + + + (4.45)
53
+ + + ( ) = () + + + ( ) Onde = 0 , com = , 1,2, correspondente aos instantes de amostragem. Se por outro lado considerar-se 0 como um instante unitrio 0 = 1 ento tem-se + + + + ( ) = () + + + ( ) Ou seja, a equao s diferenas genrica dada por = + () + + + ( ) Introduzindo o operador de atraso definido como: resulta = , ou =
= + + + + + + + () + + + () = + + + + ()
= lim =
1
0 + 1 + + 1 + 1 + +
(4.46)
54
Comportamento Integral No domnio s, o comportamento integral descrito por = 1 1 , directamente da tabela da transformada z verifica-se que =
1 1
1 1 1
1 1 1 1
. Ou seja,
O gradiente estado estacionrio aps uma entrada em degrau de altura 0 ser descrito por
lim () = lim ( 1)
= lim
1
(4.48)
0 + 1 + + 1 + 1 + + 0
Se 0 0 ento o sistema tem um salto descontinuo em = 0. Contudo, na maioria dos processos reais 0 = 0 (Isermann, 1989). Realizabilidade Um sistema descrito por uma funo de transferncia discreta realizvel se o principio da causalidade satisfeito, ou seja, se a varivel de sada () no depende de valores futuros da entrada + , = 1,2, . Assim, necessrio que a sada do sistema no instante , (), seja funo apenas de valores passados da sada e de valores passados e/ou actuais da entrada, ou seja, a ordem do numerador de () tem que ser maior ou igual ordem do denominador de ().
4.1.2.10
Estabilidade
Para o correspondente processo amostrado, de acordo com 3.4 de (Isermann, 1989), com ou sem ZOH, a funo de transferncia em z na forma racional ser dada por = () + + + = = () + + + (4.50)
55
= =
+ + + + + + (4.51)
As razes , = 1, 2, , do polinmio do denominador = 0, so os plos e as razes 0 , = 1, 2, , do polinmio do numerador = 0 so os zeros da funo de transferncia z. Deste modo os plos descrevem o comportamento modal do processo e dependem dos seus acoplamentos internos, pelo que so relevantes para a estabilidade. Os zeros indicam como que a varivel de entrada afecta as variveis internas e como estas, por seu lado, influenciam a varivel de sada (Isermann, 1989). (Botto, Suplemento de Sebenta de Controlo de Sistemas, 2007) e (Isermann, 1989) mostram detalhadamente que um sistema discreto estvel se todos os plos pertencerem ao interior do circulo unitrio, isto , se o modulo de todos os plos de ( for inferior a 1 < 1, = 1, , Se existir pelo menos um plo sobre o circulo unitrio com multiplicidade unitria, isto , = 1, e no existirem plos instveis, o sistema est no limite de estabilidade. O sistema instvel se existir pelo menos um plo fora do circulo unitrio, ou seja, se existir um plo com modulo superior a 1 > 1 ou se existirem plos sobre o circulo unitrio com multiplicidade superior a 1.
4.1.2.11
Para processos com comportamentos complicados e para processos multivariados, os modelos de espao de estados so normalmente mais adequados. Ao contrrio da representao por funo de transferncia, a representao por variveis de estado, para alm da relao entre a entrada e sada, descreve o comportamento e inter-relao das variveis internas, funcionando como variveis de memria do sistema. Existem vrios mtodos possveis para determinar as variveis de estado. Um dos mtodos consiste na transformao do sistema continuo descrito por (4.16)(4.16) e (4.17) recorrendo introduo de ZOH entrada e amostradores entrada e sada (Isermann, 1989). Seguidamente apresenta-se um mtodo por substituio directa na equao s diferenas. Se um modelo descrito por equaes s diferenas existe para um determinado processo, ento a representao de estados pode derivar-se pela introduo das variveis de estado. A partir da equao s diferenas (4.44) e substituindo k por k+n obtm-se + + + + + = + + + + +
(4.52)
Para simplificar faz-se = . O caso para pode sempre ser tido em conta pondo ao parmetros a zero.
56
Baseado nos seguintes pressupostos 1. No presente instante , as sadas + 1 , , ( + 1) so utilizadas como variveis de estado. 2. Com o incremento do instante para + 1, + 1 para + 2 , ou seja () assume o valor de ( + 1), ( + 1) o valor de ( + 2), etc. Conduzindo-nos a que 1 + 1 = 2 () e 2 + 1 = 3 () Pode Introduzir-se as seguintes variveis de estado () = () = () = () = () = ( + ) = ( + ) = ( + ) = ( + )
(4.54) (4.53)
+ + + ( + )
A partir de (4.54) e (4.55) tira-se a equao vectorial s diferenas que consiste na representao de estado da equao s diferenas + + + + = + ()
(4.56)
() =
(4.57)
Com a introduo de um vector de estado , uma matriz sistema em tempo discreto, um vector de controlo e um vector de sada ( + ) () = + () = ()
(4.58) (4.59)
57
Se as duas ltimas equaes so resolvidas de forma sequencial, a equao (4.59) poder ser reescrita numa forma mais expedita ( + ) = ( + )
(4.60)
Estes resultados forma determinados com os pressupostos de que = 1 e 0 = 1 = = 1 = 0, o que corresponde funo de transferncia = + + + = ()
(4.61)
= + () + + () ou = + ( + ) + + ( + ) Da equao (4.54) resulta = + () + + () + ( + ) Substituindo o termo ( + ) dado pela equao (4.55) obtm-se finalmente = + () + + () + + () = + + + + () ou em notao vectorial
(4.64) (4.63) (4.62)
+ ()
(4.65)
58
Esta escolha de variveis de estado referida como Forma cannica de controlabilidade. possvel obter diversas representaes em espao de estado equivalentes, da forma ( + ) = + () () = + () Considerando a transformao linear e no singular, , tal que = (), resulta ( + ) = + () () = + () onde = = = =
As formas cannicas possveis so casos particulares de transformaes lineares a que correspondem estruturas especficas para as matrizes , e (Botto, Controlo ptimo, 2007), (Isermann, 1989), salientando-se 1. Forma cannica de controlabilidade. 2. Forma cannica de observabilidade. 3. Forma cannica do controlador. 4. Forma cannica do observador. 5. Forma cannica de Jordan (ou modal).
4.1.2.12
Os modelos matemticos do processo podem ser determinados com recurso a anlises tericas ou experimentais. Na anlise terica os modelos so determinados pelas equaes de balano, equaes de estado e leis fenomenolgicas. Uma vez determinadas, em geral um sistema de equaes diferenciais que conduzem a modelos tericos de processos que estrutura e parmetros determinados, podem ento ser resolvidas explicitamente.
59
No caso da anlise experimental dos processos o modelo matemtico determinado com recurso a medies. Os valores de entrada e sada so avaliados de modo a que se estabelea um modelo matemtico entre eles. O modelo pode ser no paramtrico, por exemplo uma funo transiente da resposta em frequncia na forma tabular, ou paramtrico, por exemplo uma equao diferencial ou equao s diferenas. Para os modelos no paramtricos recorre-se avaliao das medies com recurso a anlise de Fourier ou anlise de correlao, ao passo que para os modelos paramtricos utilizam-se mtodos de identificao tais resposta ao degrau ou resposta em frequncia ou por estimao de parmetros. Para identificao de modelos paramtricos discretos, os mtodos de estimao de parmetros so especialmente adequados. Para processos invariantes no tempo, assumemse modelos da forma =
()
(4.66)
Em que os parmetros desconhecidos do processo e possivelmente tambm dos distrbios so estimados baseado nas medidas de () e () (Isermann, 1989). Para estimar os parmetros usam-se mtodos tais como mnimos quadrados, variveis instrumentais, mxima verosimilhana, na forma no recursiva ou recursiva.
+ + +
(4.67)
Em que considerado rudo branco ()~(0, ^2 ) . De notar que esta apenas uma variante, uma vez que a notao, a localizao e consequentemente o sinal dos coeficientes podem mudar conforme os autores e/ou objectivos do desenvolvimento.
60
A designao MA resulta de se considerar neste modelo o rudo branco ponderado pelos coeficientes do polinmio . Esta ponderao entendida como uma mdia pesada de ao longo do tempo, e portanto no nula, justificando assim a designao de mdia mvel. Se o modelo no contiver uma ou duas das trs componentes do modelo, o nome do termo e a correspondente ordem desaparecem do modelo. Por exemplo, um processo com uma estrutura ARIMA(0,1,1) pode designar-se por processo IMA(1,1). Estes modelos mostramse bastante teis para construir modelos de funes de transferncia de sistemas que se pretendem controlar ou ajustar na presena de rudo correlacionado, possivelmente no correlacionado (Del Castillo, 2002).
Rearranjando os termos e adaptando a notao (Del Castillo, 2002) e (Box, Jenkins, & Reinsel, 2008) em que e = + + + + + Onde os so os parmetros e uma sequncia de rudo branco, ou seja, um processo estocstico. Este modelo pode tambm ser descrito na forma matricial
= + A diferena deste modelo para um modelo de regresso linear, em que aparece no papel do parmetro de intercepo, que os regressores so variveis desfasadas no tempo (lagged) do mesmo processo, da o nome de modelo autoregressivo. Se os parmetros so de forma tal a que o processo tenha comportamento estacionrio (sem tendncia) ento o valor de coincide com a mdia do processo, ou seja, definindo = , pode escrever-se = + + + + = + Definindo-se = 1 1 2 2 , (4.69) pode ser escrita na forma
(4.68)
61
(4.69)
De acordo com o ponto 4.1.2.10, fazendo a equivalncia entre no domnio e o operador no domnio do tempo, um processo AR(p) estacionrio se e s se estacionrio, o que significa que todas as suas razes se encontram estritamente fora do ciclo unitrio no domnio plano complexo . Os critrios de estacionaridade esto directamente indexados ao posicionamento das razes do polinmio caracterstico no plano , ou como est muito bem documentado em (Ogata, 1997), (Isermann, 1989) ou (Botto, Suplemento de Sebenta de Controlo de Sistemas, 2007). Para se ter uma ideia intuitiva sobre esta matria tome-se como exemplo o processo descrito por (4.66). Se se fizer = 0, = 0, = 1 e = 1 obtm-se o processo AR(p) ( ) =
()
(4.70)
()
De acordo com o ponto 4.1.2.10, o processo estacionrio se as razes de = 0 ou se encontram dentro do ciclo unitrio, ou seja se 0. Passando (4.70) para o domnio o mesmo processo passa a ser descrito na forma = = =
(4.71)
Com = e o nico zero de dado = = /. Ou seja, de acordo com o ponto 4.1.2.10, tem que estar no ciclo unitrio, pelo que / tem que ser maior que zero. Este critrio pode ser facilmente visionado do seguinte modo: expandindo (4.71) tem-se sucessivamente = + = + = + = + Substituindo (4.73) em (4.72) sucessivamente = + + = + +
(4.72) (4.73)
62
= + + + = + + +
= +
+ + + = +
=
=
=
=
=
Ou seja, est-se perante uma srie geomtrica que convergente apenas se e s se < 1.
= + + + + = +
=
Autocovarincia e Autocorrelao de um processo AR(p) Para determinar a autocovarincia tira-se o valor esperado do produto de cada elemento do processo (4.68) por = = + + + + = + + + +
63
Como o ultimo termo da direita nulo, uma vez que se trata duma sequncia de termos independentes e identicamente distribudos (IID). Desta ultima equao e da definio de autocovarincia (Autocovarincia e Autocorrelao, pag.26) obtm-se a funo de autocovarincia = + + + Dividindo por 0 obtm-se a funo autocorrelao = = + + + = 0, 1, 2, 3,
(4.75)
= 0, 1, 2, 3,
(4.74)
Verifica-se que tanto a funo autocorrelao como a funo autocovarincia obedecem mesma estrutura de equao s diferenas. Para um processo estacionrio, isto significa que a autocorrelao ser eventualmente zero para valores de relativamente elevados. Digamos que para processos estacionrios AR(p), a funo autocorrelao decai exponencialmente (tails off). De facto, o decaimento depende da soluo da equao s diferenas para o processo AR(p), onde se pode frequentemente verificar um comportamento oscilatrio, mas o decaimento de ser contudo exponencial (Del Castillo, 2002). As equaes (4.75) para = 1, 2, 3, , so conhecidas como equaes de Yule-Walker. Estas equaes so utilizadas para estimar os coeficientes recorrendo a estimativas dos valores de autocorrelao = . Reescrevendo todas as equaes (4.75), substituindo os valores da autocorrelao pelas estimativas e tendo em conta que = , tem-se 1 2 = + + + + = + + + +
1 = + + + + = + + + +
64
ou de forma sucinta =
(4.76)
Note-se que se trata de sistema bem comportado com a matriz R dos coeficientes quadrada e vector das incgnitas de rank completo. Mais ainda, R uma matriz simtrica e de rank completo, de modo que a invertibilidade est garantida. Tem-se ento que uma estimativa dos coeficientes pode ser determinada atravs do clculo = Varincia de um processo AR(p) A varincia de um processo AR(p) obtm-se atravs da equao (4.74) fazendo = 0 = + + + + Onde, neste caso, o ultimo termo contm o valor esperado do produto de duas variveis aleatrias que tem uma varivel de erro comum , pelo que ser diferente de zero:
(4.77)
= = + + + + =
=
(4.78)
65 = 1, 2, ,
(4.79)
(4.80)
Ou seja, em geral, para o determinante do numerador tem os mesmos elementos que o determinante do denominador, , mas em que a ultima coluna de foi substituda por , ver a equao (4.80): =
(4.81)
A quantidade vistas como funes da lag k, denomina-se como Funo Autocorrelao Parcial. Para um processo autoregressivo de ordem p, a funo autocorrelao parcial ser diferente de zero para k menor ou igual a p e zero para k maior que p. Por outras palavras, a funo autocorrelao parcial de um processo autoregressivo de ordem p corta ( igual a zero) aps a lag p. Os so interpretados como a medida de correlao entre e +1 aps descontar o efeito das variveis intermdias2 , 2 , , +1 (Del Castillo, 2002). A funo autocorrelao parcial dada atravs de (4.80) est definida para qualquer processo estacionrio como uma funo da autocorrelao do processo, mas a caracterstica
66
distintiva de que = para > num processo AR(p) serve para caracterizar a ordem p do processo. A partir da teoria dos mnimos quadrados, pode estabelecer-se que os valores 1 , 1 , , , soluo de (4.80), so os coeficientes de regresso numa regresso linear de em 2 , 2 , , , isto , so os valores dos coeficientes 1 , , que minimizam 0
2 =1
tem mdia zero, o melhor predictor linear, no sentido dos mnimos desvios quadrados, de baseado em 2 , 2 , , ser (Box, Jenkins, & Reinsel, 2008) = , + + , + + + , seja o processo AR ou no. Estimativa da Funo Autocorrelao Parcial A estimativa da autocorrelao parcial (PACF Parcial Autocorrelation Function) pode ser obtida pela substituio dos valores tericos da autocorrelao pelas respectivas estimativas . A partir da equao (4.76) pode-se construir um mtodo recursivo para clculo das PACF. O primeiro passo consiste no clculo das ACF (funo autocorrelao, ver Autocovarincia e Autocorrelao) at a uma razovel ordem de corte (cutoff), por exemplo 4. Seguidamente, seja o vector da equao (4.76) para o caso de = . De forma similar, seja a matriz dos coeficientes para o mesmo caso. Ento, para determinar () como funo de i, implementar o seguinte algoritmo: 1. Ciclo para = 1 at = , incrementando uma unidade: 2. Calcular 3. Inverter 4.
i
1 2
5. Ignorar todos os para 1 1 6. Reter 7. = 8. Fim de ciclo em Desvio Padro da estimativa da Autocorrelao Parcial Na hiptese de que um processo autoregressivo de ordem p, as autocorrelaes parciais (PACF) estimadas de ordem + 1, e acima, so aproximadamente independentes e normalmente distribudas com mdia zero, ento +
67
Onde n o numero de observaes da srie que serviu de base para o ajustamento (Box, Jenkins, & Reinsel, 2008). Assim, e de acordo com o ponto (Autocovarincia e Autocorrelao), o desvio padro (DP) da autocorrelao parcial estimada ser dado por = +
(4.82)
Rearranjando os termos e adaptando a notao (Del Castillo, 2002) em que e , tem-se que um processo MA(q) pode ser descrito por = + Utilizando novamente a definio = , um processo MA pode ser descrito por =
(4.84) (4.83)
Comparando um processo MA(q) puro com um AR(p) puro, verifica-se que o processo MA(q) tem um polinmio igual a 1 e um processo AR(p) tem um polinmio igual a 1. Deste modo, um processo MA ser sempre estacionrio uma vez que o polinmio no depende de pelo que no ter qualquer raiz nem dentro nem fora do ciclo unitrio. Invertibilidade Invertibilidade uma condio matematicamente similar estacionaridade relativamente ao polinmio de um processo MA. A condio de invertibilidade diferente da condio de estacionaridade e tanto se aplica a modelos estacionrios como a modelos no estacionrios. Um processo ARIMA invertvel se este pode ser descrito como um processo AR da forma (Del Castillo, 2002) + + + +
(4.85)
Onde a soma finita ou infinita mas tem que convergir para um valor finito. A invertibilidade significa que a influncia das observaes prvias em decrescem com a idade. Para ilustrar a ideia, considere-se o seguinte modelo MA(1)
68
(4.86)
Invertendo, ou seja, resolvendo para em termos das observaes passadas e presente de = Ou seja = + + + Se < 1, fazendo k tender para infinito, obtm-se a srie infinita = + E as ponderaes do modelo na forma (4.85) so = , pelo que, se
(4.88) (4.87)
= + + + + + +
1 os
desvios presentes dependem de 1 , 2 , . . . , com ponderaes que incrementa com k. Para evitar esta situao requer-se que < 1. Dir-se- ento que a srie invertvel. Esta condio equivalente a que < tal que a srie =0 =0
=
=
Converge para todo o 1, ou seja, encontra-se dentro ou na fronteira do circulo unitrio (Box, Jenkins, & Reinsel, 2008). A condio de invertibilidade para um processo de ordem superior pode obter-se escrevendo (4.85) na forma = Assim, se
=
=
= =
=
69
Que converge se < 1, para = 1, 2, , . Tem-se ento que a condio de invertibilidade para um processo MA(q) que as razes da equao caracterstica = Caem fora do ciclo unitrio (Box, Jenkins, & Reinsel, 2008).
(4.89)
= = + + + + A funo autocovarincia obtm-se a partir de = Apenas os produtos cruzados contemporneos (para o mesmo instante) dos s so diferentes de zero, pelo que a equao anterior fica na forma + + + + + + > = , , ,
A funo autocorrelao surge assim de forma automtica atravs da diviso de por = + + + + + + + + + + >
(4.90)
= , , ,
Verifica-se que a funo de autocorrelao de um processo MA(q) zero aps a ordem q do processo. Por outras palavras, a funo de autocorrelao de um processo mdia mvel corta a partir da lag q. Se os valores de 1 , 2 , , so conhecidos, as q equaes (4.90) podem ser resolvidas para os parmetros 1 , 2 , , , No entanto, ao contrrio das equaes de Yule-Walker para um processo autoregressivo, estas equaes so no lineares, pelo que, excepto para o caso em que q igual a um, estas equaes tem de ser resolvidas iterativamente como descrito no apndice A6.2 de (Box, Jenkins, & Reinsel, 2008). De igual modo, tambm, ao contrrio das estimativas para o modelo autoregressivo, as estimativas resultantes podem
70
no ter grande eficincia estatstica, no entanto podem fornecer uma estimativa grosseira bastante til para a identificao do modelo. Funo Autocorrelao Parcial para MA(1) Substituindo = 1 em (4.90) obtm-se a funo autocorrelao para um processo MA(1) = + = =
Substituindo esta equao na equao (4.81), obtm-se aps alguma lgebra (Box, Jenkins, & Reinsel, 2008) =
+
Verifica-se assim que < , e que a funo autocorrelao parcial dominada por um decaimento exponencial. Se positivo, ento negativo e a funo autocorrelao parcial alterna no sinal. Se negativo, ento positivo e a funo autocorrelao parcial negativa. Dualidade entre processos autoregressivos e mdia mvel Os resultados anteriores mostram alguns aspectos da dualidade os processos autoregressivos e mdia novel. Essa dualidade tem algumas consequncias resumidas na Tabela 4.1 retirada de (Box, Jenkins, & Reinsel, 2008)
Rearranjando os termos e adaptando a notao (Del Castillo, 2002) / (Box, Jenkins, & Reinsel, 2008), tem-se que um processo ARMA(p,q) pode ser descrito por = + + + + Utilizando novamente a notao = , um processo ARMA pode ser descrito na forma
71
= + + + Que tambm pode ter a forma = Ou = Onde e so operadores polinomiais em de grau p e q respectivamente.
(4.91)
Um modelo ARMA(p,q) estacionrio se a componente AR estacionria, isto , se o polinmio tem todas as razes fora do circulo unitrio no plano . Similarmente, o processo invertvel se a parte MA invertvel, isto , se o polinmio tem todas as razes fora do circulo unitrio.
Autocovarincia A autocovarincia obtm-se tirando o valor esperado do produto de (4.91) por (Del Castillo, 2002), (Box, Jenkins, & Reinsel, 2008) = + + + Onde = = a covarincia (cruzada) entre e , ser nula se > 0. Como depende apenas dos shocks que ocorreram acima de numa representao mdia mvel infinita = , segue-se que =0 =
>
Deste modo a equao anterior pode ser expressa por = + + + + + + Com a conveno de que 0 = 1. Verifica-se que a equao anterior implica que = + + + +
(4.92)
72
E consequentemente = + + + ou = + +
(4.93)
Verifica-se que (4.92) no tem soluo nica, pelo que, para um processo ARMA(p,q) existiro q coeficientes de autocorrelao , , , cujos valores dependem directamente da escolha dos q parmetros mdia mvel , bem como nos p parmetros autoregressivos . Alm disso, os p valores , , , + fornecem os necessrios valores de partida para a equao s diferenas = 0, onde + 1, os quais, ento determinam inteiramente a autocorrelao das lags mais altas. Varincia Fazendo = 0 tem-se = + + + que tem que ser resolvida juntamente com as p equaes (4.92) para k= 1, 2, , para se obter 0 , 1 , , .
Tabela 4.1 Resumo das propriedades dos modelos ARMA
Processo AR
Modelo em termos de s Modelo em termos de Pesos Pesos Estacionaridade Invertibilidade ACF
Processo MA
1
Processo ARMA
1 = = 1
= 1
Srie finita Srie infinita Razes de = 0 fora do crculo unitrio Sempre invertivel Infinita (decaimento exponencial e/ou decaimento sinosoidal Acaba em cauda (Tails off)
Srie infinita Srie finita Sempre estacionrio Razes de = 0 fora do crculo unitrio Finita
Srie infinita Srie infinita Razes de = 0 fora do crculo unitrio Razes de = 0 fora do crculo unitrio Infinita (decaimento exponencial e/ou decaimento sinosoidal Acaba em cauda (Tails off) Infinita (dominada por decaimento exponencial e/ou decaimento sinosoidal Acaba em cauda (Tails off)
Corta aps a lag q Infinita (dominada por decaimento exponencial e/ou decaimento sinosoidal Acaba em cauda (Tails off)
PACF
Finita
73
Onde um operador autoregressivo estacionrio. Introduzindo a notao d = d para 1 onde = o operador diferencial, o modelo pode ser escrito na forma = De forma equivalente, o processo pode ser definido com recurso a duas equaes = = Deste modo, verifica-se que diferenciando a srie d vezes, esta pode ser representada por um modelo ARMA estacionrio e invertvel. A forma geral de um processo ARMA no estacionrio homogneo
74
(4.94)
Que normalmente referido com sendo um processo ARIMA(p,d,q). Para analisar um processo ARIMA(p,d,q), normalmente comea-se por diferenciar a srie sucessivamente at esta aparentar um processo estacionrio, determinando-se assim o grau de diferenciao d. O modelo obtido aps a diferenciao ser tratado como um modelo ARMA estacionrio. Expresso geral para as ponderaes (Pesos) Um modelo ARIMA = onde = 1 pode ser representado de vrias formas. Uma das formas consiste numa soma ponderada infinita dos shocks passados e presente = + + +
= +
=
=
=
(4.95)
Em que 0 = 1 e, para simplificao e sem perda de generalidade, se fez = 0. Se em ambos os lados da equao (4.95) se aplicar um operador autoregressivo generalizado dado por =
= + + Obtm-se =
(4.96)
Comparando o membro direito da equao anterior com o membro direito do modelo geral de um processo ARIMA (4.95), tem-se que = Segue-se ento que =
(4.98) (4.97)
Deste modo, as ponderaes podem ser determinadas igualando os coeficientes de na expanso da equao anterior, ou seja, de (4.96) tem-se que
75
+ +
+ + + =
(4.99)
Assim, pode conclui-se que as ponderaes de um processo ARIMA podem ser determinadas recursivamente atravs das equaes (Box, Jenkins, & Reinsel, 2008) = + + + + + Com 0 = 1, = 0 para < 0, e = 0 para > . Forma invertida No ponto 4.2.2 verificou-se que o modelo = Tambm pode ser escrito de forma invertida = ou
> 0
(4.100)
Ou seja, est-se perante uma soma ponderada infinita dos valores observados de adicionada a um shocks aleatrio = + + + Onde, devido condio de invertibilidade, os pesos tem de consistir numa srie convergente. Substituindo dado por (4.100) na equao (4.97), obtm-se = = Ou seja, as ponderaes podem ser determinadas explicitamente igualando os coeficientes de na expanso da equao anterior: = Isto :
76
+ + =
(4.101)
Verifica-se que os pesos de um processo ARIMA podem ser determinados recursivamente atravs da expresso = + + + + > 0
+ +
Em que o smbolo significa o valor esperado calculado no instante . Por outras palavras, qualquer varivel aleatria com ndice > , representa um instante situado no futuro, desfasado de perodos em relao ao instante actual denominado por instante . Assume-se que no actual instante , o valor real da varivel , referente ao perodo , j conhecido. Uma observao gerada pelo processo no instante + poder ser expressa a partir do modelo (4.95), tomando a forma (Box, Jenkins, & Reinsel, 2008)
+ =
=
(4.102)
Onde 0 = 1 e, tal como em (4.99), as ponderaes podem ser determinadas igualando os coeficientes de na igualdade + + + = Equivalentemente, para positivo, com referncia a < , o modelo pode ser escrito de forma truncada + = + + + + + + + + + + + + + = + + + + + + +
77
=
=
Suponha-se que, na origem t, se pretende fazer uma estimativa + do valor da varivel + , que uma funo linear dos valores observados no passado e presente da prpria varivel, , 1 , 2 , . Ento esta ser tambm uma funo linear dos shocks passados e presente , , , Suponha-se que a melhor estimativa (Box, Jenkins, & Reinsel, 2008)
+ = + + + + + Onde os termos , +1 , +2 , so a determinar. Ento, usando (4.102), o mnimo erro mdio quadrtico, MSE, da estimativa ser
+ +
= +
+ +
+
=
+ +
+ = + + + + + + + + + +
+
Ou seja + = + + Onde o erro da previso + a uma distncia de perodos. Verifica-se que o que se pode fazer para minimizar o MSE escolher + igual ao valor esperado + , o que d precisamente a formula geral de uma previso MMSE (minimum mean square error) + = +
(Box, Jenkins, & Reinsel, 2008) apresenta vrias forma de estimar valores futuros para uma srie temporal. Uma forma proposta por (Del Castillo, 2002) para se obter o valor esperado de + no instante , + , a partir da equao s diferenas, passa por se escrever a respectiva equao para o instante + e calcular-se o valor esperado no instante . Ou seja, na respectiva equao s diferenas 1. Substituir os valores 0 pelos valores observados
78
2. Substituir os valores + 1 pelos valores esperados no instante , + 3. Substituir os valores de 0 por = = + +1 4. Substituir os valores de + 1 por + = 0
O nmero de vezes que o processo for diferenciado constituir uma estimativa para o grau de diferenciao d. 2. Identificar o modelo ARMA resultante para A principal ferramenta estatstica utilizada nestes dois passos ser a funo autocorrelao amostral (SACF Sample Autocorrelation Function) e a funo autocorrelao parcial amostral (SPACF Sample Parcila Autocorrelation Function). O seu uso permite no s ter uma ideia da estrutura do modelo mas tambm obter uma estimativa preliminar dos prprios parmetros.
79
>
Alm disso, se = =1 1 , a soluo da equao s diferenas para a k-sima autocorrelao , assumindo razes distintas, da forma = + + + >
(4.103)
A condio de estacionaridade requer que os zeros de caiam fora do circulo unitrio, o que implica que as razes 1 , 2 , , caiam dentro do circulo unitrio. A equao anterior mostra que nos casos de modelos estacionrios em que nenhumas das razes se situam perto da fronteira do crculo unitrio, a funo autocorrelao extinguir-se- rapidamente para valores grandes ou moderados de k. Suponha-se que se est perante o a existncia de uma nica raiz real prxima de um, tal que 1 = 1 onde representa uma quantidade bastante pequena. Ento, para k grande tem-se que 1 1 e a funo autocorrelao decair lentamente e muito prximo da linearidade. O mesmo argumento pode ser aplicado se mais do que uma raiz se aproxima da unidade. Assim, a tendncia para a funo autocorrelao no se extinguir tida como uma indicao da possvel existncia de uma raiz prxima da unidade. A funo autocorrelao estimada tende a seguir o comportamento da funo autocorrelao terica (Box, Jenkins, & Reinsel, 2008). Nesses casos deve-se estar perante processos estocsticos no estacionrios, mas em que, possivelmente, o processo = ser estacionrio. Normalmente, atravs de um simples plot da srie de dados , consegue-se verificar quando que o processo estacionrio ou no. Se o processo apresenta indcios de no estacionaridade, procede-se diferenciao da srie, obtendo-se uma nova srie = = 1 . Se a srie resultante continuar a apresentar indcios de no estacionaridade, esta ser diferenciada novamente at se obter uma srie estacionria, determinando-se deste modo o grau de diferenciao d. Uma vez obtido um processo estacionrio por diferenciaes sucessivas, procede-se identificao de p e q, e estimativa dos parmetros do modelo. Por vezes pode existir o perigo da diferenciao excessiva introduzindo-se assim um termo mdia mvel no invertvel. Adicionalmente a varincia do modelo sobre diferenciado ser inflacionado artificialmente, e isso pode desvirtuar a actual estrutura dos dados. Para ilustra o problema, considere-se por exemplo o seguinte modelo = +
80
Diferenciando-se este processo obtm-se um processo constitudo por rudo branco , mas, se por alguma razo se decidir diferenciar novamente, obtm-se = = Ou seja introduziu-se um termo MA no invertvel com a consequncia lgica de que ser dado mais peso s observaes passadas do que s actuais. Consequentemente, a varincia da srie sobre diferenciada ser inflacionada. Neste exemplo, a varincia de 2 o dobro da varincia de . Tem sido proposta vrias alternativas para detectar a diferenciao excessiva e assim determinar o valor correcto de d. Uma simples abordagem consiste em calcular sucessivamente , , , n e escolher d tal que a varincia seja mnima. Identificao do processo ARMA resultante Aps a obteno do grau de diferenciao d. o prximo passo passa pelo estudo da aparncia das funes de autocorrelao e autocorrelao parcial da srie diferenciada = d , para se procurar pistas sobre a escolha das ordens p e q para os operadores autoregressivo e mdia mvel. Como se viu nas seces anteriores, enquanto que a funo autocorrelao de um processo autoregressivo de ordem p acaba em cauda (decaimento exponencial), a sua funo autocorrelao parcial corta aps a lag p. Contrariamente, a funo autocorrelao de um processo mdia mvel de ordem q corta aps a lag q, enquanto a sua funo autocorrelao parcial acaba em cauda. Se ambas as funes PACF e ACF acabam em cauda, provavelmente est-se perante um processo misto. A Tabela 4.2, extrada de (Del Castillo, 2002), fornece alguns elementos teis para identificao de processos autoregressivos e mdia mvel
Tabela 4.2 Resultados uteis para identificao de processos AR e MA
Processo MA(p)
ACF = 0 para > 1 1+2
=1
Processo AR(q)
acaba em cauda (tails off)
Ruido branco
= 0 para todo o 1
= para >
Para todo o
A funo auto correlao de um processo misto, contendo uma componente autoregressiva de ordem p e uma componente mdia mvel de ordem q uma mistura de decaimento
81
exponencial e ondas sinusoidais amortecidas aps as primeiras (q p) lags. Em sentido inverso, a funo auto correlao parcial de um processo misto dominada por uma mistura de decaimento exponencial e ondas sinusoidais amortecidas aps as primeiras (p q) lags Em geral, o comportamento da funo de autocorrelao de um modelo autoregressivo (mdia mvel) tende a imitar o comportamento da funo autocorrelao parcial de um modelo mdia mvel (autoregressivo) (Box, Jenkins, & Reinsel, 2008). Desvio padro para estimativas de autocorrelao e autocorrelao parcial Quando se faz uma estimativa sempre importante saber qual o nvel de significncia dessa estimativa. sempre importante ter algum indicador que nos d alguma informao sobre a coerncia da estimativa. Neste caso particular, necessita-se de alguma informao que nos permita decidir quando que a autocorrelao e autocorrelao parcial efectivamente zero aps determinada lag p ou q. Para um nmero de lag elevado, na hiptese de que se est perante um processo mdia mvel de ordem q, pode-se determinar o desvio padro da autocorrelao estimada a partir da forma simplificada da frmula de Bartlett (3.1), substituindo os valores tericos pelos valores estimados = + + + +
/
>
Para a autocorrelao parcial utiliza-se o resultado (4.82) que, na hiptese de que se trata de um processo autoregressivo de ordem p, o desvio padro para a autocorrelao parcial de ordem p+1 e superior (Box, Jenkins, & Reinsel, 2008) = >
(4.104)
82
1 ordenados da matriz 11 12 1 21 e os vectores , tal que = , so os 22 correspondentes vectores prprios normalizados; ou seja, os 2 e os satisfazem a condio
= , ,
(4.105)
Com 2 1 2 12 2 0. De forma similar, pode-se definir a noo de Correlao Cannica Parcial entre 1 e 2 , dado outro conjunto de variveis 3 como a correlao cannica entre 1 e 2 , aps estas terem sido ajustadas para o efeito de 3 por 1 regresso linear sobre 3 . Especificamente, seja ij .m = ij im mm mj = . , . para , = 1, 2 e = 3, onde . = im 1 ajustado por regresso linear sobre mm . Assim, ij.m representa a matriz de covarincia entre e aps ajustamento destas variveis para os efeitos de linearidade de outro conjunto de variveis No contexto de modelos de sries temporais ARMA, esta ferramenta poder ser de extrema utilidade seguindo como documenta (Box, Jenkins, & Reinsel, 2008) e (Reinsel, 1997). Neste trabalho apenas se aborda dois casos especiais destas correlaes cannicas: 1. Primeiro, quando = 0, simplesmente se examina a correlao cannica (autocorrelao +1 ) entre e 1 , e esta ser sempre igual a zero num processo MA(q) para . 2. Segundo, quando j=0, examina-se a correlao cannica parcial (autocorrelao parcial +1, +1 ) entre e 1 , dado 1 , , , e esta ser sempre igual a zero num processo AR(p) para . Deste modo, a anlise das correlaes cannicas pode ser vista como uma extenso da anlise das funes de autocorrelao e autocorrelao parcial do processo. Na prtica, baseado em (4.105), est-se a considerar a correlaes cannicas amostrais , que so determinadas a partir dos valores prprios da matriz , ,
, , , ,
(4.106)
, ,
Para vrios valores de lag = 0, 1, e = 0, 1, Critrio de seleco de modelo Outra abordagem para a seleco do modelo o uso de critrios tais como AIC proposto por (Akaike, 1974) ou o Bayesian Information Criteria (BIC) proposto por (Schwarz, 1978). Na implementao desta abordagem, uma gama de potenciais modelos ARMA so estimados por mtodos de mxima verosimilhana, e cada um dos modelos avaliado com recurso a critrios tais como AIC (normalizado pela dimenso da amostra n) dado por , = 2 ln + 2 2 2 ln + +
83
, = +
2 2 onde um estimador de mxima verosimilhana de , e = + + 1 o numero de parmetros estimados no modelo, incluindo os temos constantes. Nestes critrios, o segundo termo corresponde a um factor penalizador pela incluso de parmetros adicionais no modelo. Nesta abordagem, so preferidos os modelos que resultem num menor valor do critrio, em que os valores de AIC e BIC so comparados entre os vrios modelos como base de seleco do modelo. Como o critrio BIC impe uma maior penalizao para o numero de parmetros estimados que o AIC, o uso do critrio BIC para seleco do modelo deve conduzir a modelo cujo numero de parmetros no deve ser superior do que o seleccionado pelo critrio AIC.
Uma desvantagem desta abordagem que vrios modelos podem ter que ser estimados por mxima verosimilhana, os quais so bastante pesados em termos informticos, embora essa questo se coloque cada vez menos. Por essa razo, (Hannan & Rissanen, 1982) props o seguinte procedimento de seleco de modelo 1. Num primeiro estgio do procedimento obtm-se uma estimativa da srie de shocks aleatrios pela aproximao do modelo ARMA desconhecido por um modelo AR (de ordem suficiente alta) de ordem . Esta ordem pode tambm ela ser escolhida com recurso ao critrio AIC. A partir do modelo AR( ) obtm se os resduos = =1 2. Num segundo estgio estima-se os parmetros e atravs de regresso linear de em 1 , , e 1 , , , para vrios valores de p e q. Isto , estima-se modelos aproximados da forma (4.107) com recurso a mtodos de regresso dos mnimos quadrados ordinrios, e estimar a varincia dos erros 2 , .
=
=1
=1
(4.107)
3. Pela aplicao do critrio AIC ou BIC escolhe-se a ordem (p,q) do modelo ARMA 2 que minimize ln , + + ln
84
Sim
Srie estacionria = Estimar ACF e PACF Seleccionar por tentativa um modelo ARIMA(p,d,q)
No
Rudo branco? Sim Adoptar o modelo ARIMA(p,d,q) e combin-lo com o modelo para os resduos
85
que a estimativa dos parmetros obtm-se numa s vez aps um conjunto de N observaes serem colectadas. Isto em contraste com os mtodos de estimao online, que apesar de no fazerem parte deste trabalho, sero abordados de forma ligeira mais frente.
Onde = e = . Para > 0 poder por vezes ser apropriado assumir = 0, ver discusso em (Box, Jenkins, & Reinsel, 2008) . Quando no for apropriado assumir = 0, ento assume-se que = . Para dimenses amostrais normalmente =1 consideradas na anlise de sries temporais, esta aproximao ser adequada. No entanto, poder ser includo como um parmetro adicional a ser estimado. Os valores no podem ser substitudos directamente na equao anterior para calcular os devido ao problema dos valores iniciais para iniciar a equao s diferenas. Suponha-se que os p valores dos e que os q valores anteriores ao inicio da srie so eram dados, ento os valores 1 , 2 , , poderiam ser calculados com recurso equao (4.108) condicionados escolha dos valores iniciais. Deste modo, para qualquer escolha de parmetros , e dos valores iniciais , , pode-se sempre calcular sucessivamente um conjunto de valores , , , w , = 1, 2, , . Assumindo-se que os so normalmente distribudos, o que normalmente um dos pressupostos para a validao do modelo, ento a sua densidade probabilidade ser pela funo verosimilhana
/
, , ,
Onde = 1 , 2 , , , = 1 , 2 , , e , traduz o somatrio dos erros quadrticos como funo dos parmetros , . Maximizando-se a funo verosimilhana com respeito aos parmetros encontrar-se- os parmetros to compatveis quanto possvel com a evidncia da amostra. Neste contexto, o smbolo tem o significado de ser
86
proporcional a, onde a constante de proporcionalidade desconhecida. Tomando o logaritmo da equao anterior, obtm-se a funo verosimilhana logaritmica (loglikelihood) que ter a forma ,
, , = ,
Onde , uma funo de e , sem interesse nesta altura. Os parmetros que maximizem esta funo (verosimilhana logaritmica, ou log-likelihood) so os mesmos que maximizam a funo de verosimilhana, pelo que se torna mais simples trabalhar com ela para obter os parmetros pretendidos. Os erros so estimados a partir dos resduos obtidos com recurso equao (4.108) a partir de escolhas dadas de e . A soma dos quadrados dos erros (resduos)
, =
=
, , ,
A esta forma de clculo chama-se soma dos quadrados condicional porque os seus valores dependem da escolha dos valores iniciais como comentado acima. Para se obter estimativas da mxima verosimilhana (MLE Maximum Likelihood Estimate) de e maximiza-se , , . Para amostras de grande dimenso, o termo , torna-se geralmente desprezvel, pelo que a maximizao de , , implica apenas a minimizao da soma dos quadrados , . Deste modo, para n grande tem-se que a estimativa da mxima verosimilhana (MLE) identifica-se com a estimativa dos mnimos quadrados (OLS Ordinary Least Square), ou seja , = ,
Se o modelo for um modelo estatstico linear, a estimativa dos mnimos quadrados pode-se obter atravs de uma frmula fechada. Os modelos ARIMA so modelos estocsticos, modelos de equaes s diferenas mas nem sempre so modelos lineares nos parmetros. Para os modelos ARIMA, um modelo linear nos parmetros se as derivadas dos resduos, ou seja, as derivadas da equao (4.108) em ordem aos parmetros e , no so funo de qualquer parmetro desconhecido. Estimao de modelos AR(p) fcil verificar que todos os modelos do autoregressivos puros AR(p) so lineares. Um modelo AR(p) pode ser escrito na forma = + + + + Pelo que os resduos a sero da forma
87
= , , ,
Que, portanto, ser um modelo estatstico linear que poder ser ajustado com recurso s normais tcnicas de regresso linear. Para amostras de grande dimenso, os valores iniciais vo ter um efeito muito reduzido, pelo que uma sequncia de variveis aleatrias definidas por um processo AR(p) pode ser escrito na forma + + = +
+ +
Ou, em notao vectorial = + Portanto, o estimador dos mnimos quadrados para os parmetros ser =
(4.109)
Estimao de modelos mistos Os modelos ARIMA(p,d,q) onde > 0 no podem ser estimados pela minimos quadeados ordinrios (formula anterior) porque so no lineares nos parmetros. (Del Castillo, 2002) demonstra este facto com recurso ao exemplo mais simples, ou seja, um processo MA(1) = + = Resolvendo para e assumindo invertibilidade = < 1 , tem-se
Que funo do parmetro desconhecido , pelo que no ser um modelo estatstico linear e, consequentemente, no existir uma formula fechada para um estimador dos mnimos
88
quadrados. A soluo passar pela obteno com recurso ao calculo numrico da minimizao da funo da soma dos quadrados. (Box, Jenkins, & Reinsel, 2008) prope um algoritmo iterativo a partir do modelo ARMA, em que para vrios valores de e , igualmente espaados compreendidos no intervalo ] 1, 1[, se determine os respectivos valores da soma dos quadrados dos resduos , obtidos por (4.108), seleccionando-se posteriormente a combinao do conjunto de valores ; ; = 1, , ; = 1, , , que apresente o resultado mais baixo.
= +
=
Esta estatstica utilizada no teste de Portmanteau, cuja hiptese nula dada por : = , = , ,
Em que, evidentemente, grande valores de Q so devido a grandes autocorrelaes. A hiptese nula rejeitada se > , . Utilizao dos resduos para modificar um modelo ARIMA(p,d,q) Se a ACF da srie dos resduos demonstrarem uma estrutura diferente de rudo branco, ou seja, se houver alguma lag que indique alguma autocorrelao, o modelo inicial dever ser alterado de modo a mover essa autocorrelao. Alternativamente ver Figura 4-6, podese ajustar um modelo ARMA(pe, qe) aos resduos (Del Castillo, 2002) =
(4.110)
O qual, aps captura de toda a correlao remanescente dever produzir uma srie contendo apenas rudo branco. O modelo resultante (4.110) dever ento ser combinado com o modelo original ARIMA(p,d,q) resultando o modelo = Que exactamente um processo ARIMA(p+pe, d, q+qe).
(4.111)
89
Processo dinmico
Yt Sada (output)
O objectivo determinar relao dinmica entre as sries e , em que os pares , so sequncias de observaes disponveis em pontos equidistantes no tempo colectadas de forma sincronizada. Voltando novamente resposta ao degrau; assumindo-se que o processo estvel e que a varivel de entrada se mantm no nvel zero para todo o < 0; se a partir do instante = 0 se fixar o valor da varivel de entrada no nvel um, ento, aps um perodo de transio, a varivel de sada ter atingido a um valor estacionrio num nvel = . Assumindo-se que o processo linear, ento, para qualquer nvel da varivel de entrada, obter-se- a resposta no estado estacionrio dada por = Onde g o ganho estacionrio. A ideia por detrs do modelo de resposta ao degrau, que se pode aplicar uma entrada em degrau unitrio entrada do processo (varivel manipulada) e medir a resposta (varivel de sada) em anel aberto at esta atingir um valor estacionrio. Devido ao facto de se assumir que o processo linear, o conhecimento da resposta ao degrau unitrio permite deduzir a resposta para qualquer outro sinal de entrada. O ganho molda as alteraes do estado estacionrio da sada que eventualmente seria
90
obtido devido a uma alterao unitria na entrada. Evidentemente que este um modelo esttico do tipo do modelo obtido atravs de desenho de experincias com recurso a tcnicas de regresso. Por exemplo, quando se implementa um programa de desenho de experincias (DOE) num processo qumico, est-se apenas interessado no resultado final, quando o estado estacionrio atingido, descartando-se a fase transiente do processo. Nos projectos de controlo, o objectivo fazer com que a sada do processo se mantenha ou regresse rapidamente aos valores desejados/objectivo (target), o que implica que a resposta dinmica evidenciada na fase transiente, seja modelada. Para se modelar a dinmica do processo, necessita-se de conhecer o comportamento da sada do processo, sempre a que alterada a entrada do processo. Se o processo for linear, ento ter-se- para resposta do processo uma combinao linear dos valores passados, e possivelmente do valor presente, da entrada do processo:
= + + =
=
(4.112)
Onde o polinmio de ordem infinita e definida como a funo de transferncia do sistema que, como demonstrado na seco 4.1, coincide com a resposta do sistema ao impulso unitrio. Para se ter uma ideia mais intuitiva da funo de transferncia, considere-se novamente a funo impulso unitrio (Figura 4-8 direita) = =
A resposta do sistema ao impulso unitrio , ser dada pelos pesos 0 , 1 , (Figura 4-8 esquerda), que coincide com a funo de transferncia porque se a entrada, num determinado instante, corresponder a um impulso de magnitude , a resposta ser a resposta ao impulso unitrio multiplicada pela magnitune do impulso de entrada .
Considerando-se um sinal de entrada como uma sequncia de impulso de magnitude , a resposta a esse sinal ser dado pelo somatrio de convulso das respostas individuais de cada impulso, ou pelo integral de convulso (ver seco 4.1.1.3) no caso da anlise continua. Suponha-se que ao sistema descrito pela funo de transferncia da Figura 4-8 que lhe impostos um nvel de entrada nulo para < 0, e que nos trs instantes seguintes, o sinal de entrada discretizado (em forma de impulso) tem a forma representada na Figura 4-9 (lado esquerdo input). No lado direito da Figura 4-9 esto representadas as respostas a cada um dos impulsos sequenciais juntamente com a resposta global do sistema. fcil
91
verificar que a resposta global do sistema (Figura 4-9 a preto) ser dada pela soma acumulada de cada uma das respostas para o mesmo instante, ou seja, por exemplo para = 2, tem-se 2 = = 0 2 + 1 1 + 2 0 . =0
Resposta
Forma incremental Definindo-se = = = e = = = os incrementos em X e Y. Diferenciando (4.112) obtm-se = Ou seja, a forma incremental satisfaz o mesmo modelo de funo de transferncia. Estabilidade Se uma srie infinita 0 + 01 + 1 2 + converge para 1, ou equivalentemente, se os so absolutamente somveis, tal que < ento o diz-se que o sistema =0 estvel. A estabilidade implica que um incremento finito na entrada resulta num incremento finito na sada. A condio de estabilidade significa que os pesos devero tender para zero, ou serem iguais a zero, para grandes valores de , o que implica que o efeito de entradas passadas em respostas futuras desprezvel ou eventualmente nulo a partir de determinado tempo. Funo de transferncia na forma de diviso de polinmios A funo de transferncia escrita na forma (4.112) composta por uma srie infinita, o que no prtico. H toda a convenincia em escrever a funo de transferncia numa forma fechada, ou seja, uma representao mais parcimnia representada pela forma geral de equao s diferenas = + + + + ou
92
= = Onde um polinmio em de ordem e um polinmio de ordem . Ao desfasamento k d-se o nome de atraso entrada resposta (input-output delay) e corresponde ao tempo que o sistema demora a responder a uma determinada entrada. Comparando as duas representaes da funo de transferncia, chega-se chamada representao (r,s,k) da funo de transferncia =
(4.113)
O modelo ARIMA = usado para representar sries temporais relaciona com atravs do filtro linear = onde rudo branco. Verifica-se assim que um modelo ARIMA pode ser utilizado para representar a sada de um sistema dinmico cuja entrada rudo branco e em que a funo de transferncia pode parcimoniosamente expressa como razo de dois operadores polinomiais em . Devido ao paralelismo entre a funo de transferncia discreta e o modelo ARMA, as condies de estabilidade para a funo de transferncia discreta coincidem com as condies impostas ao modelo ARMA, ou seja, que as razes do polinmio = 0 se situem estritamente fora do circulo unitrio. Para um sistema estvel, o ganho estacionrio pode ser determinado a partir da funo de transferncia na forma racional aplicando uma entrada = 1 para todo o , obtendo-se
= =
Este resultado est directamente relacionado com o teorema do Valor final (Teorema do valor final - ver seco 4.1.2.5) da transformada (Del Castillo, 2002).
93
A anlise desta relao poder ser bastante util para a identificao de r, s e k. Igualando os coeficientes de , chega-se relao (Box, Jenkins, & Reinsel, 2008) = + + + + + + + + + + < = = + , + , , + > +
(4.115)
A soluo = , , desta equao s diferenas aplica-se a todos os valores para os quais + + 1. Em geral, os pesos da resposta ao impulso consistem em 1. valores iguais a zero, 0 , 1 , , 1 2. + 1 valores adicionais, , +1 , , + , que no seguem um padro fixo (se < estes valores no existem) 3. Valores com + + 1 seguindo um padro de acordo com a ordem da equao s diferenas, os quais incluem os valores de partida + , +1 , , +1 . Os valores de partida para < sero nulos. Resposta ao degrau A funo resposta ao impulso () pode obter-se atravs da diferenciao da corresponde resposta ao degrau () = () Em que = + + + = + + + + + + + Substituindo (4.116) em (4.114) obtm-se a identidade + + + + = com
(4.118) (4.117) (4.116)
94
+ =
(4.119)
Verifica-se que identidade (4.118) para os pesos da resposta ao degrau paralela identidade (4.114) para os pesos da resposta ao impulso, excepto que o operador do lado direito de ordem + 1 em vez de (Box, Jenkins, & Reinsel, 2008) Utilizando o resultado (4.115), conclui-se que a funo resposta ao degrau definida por: 1. valores iguais a zero, 0 , 1 , , 1 2. valores adicionais, , +1 , , +1 , que no seguem um padro fixo (se < estes valores no existem) 3. Valores com + seguindo um padro de acordo com a ordem + 1 da equao s diferenas = 0, os quais incluem os + 1 valores de partida + , +1 , , + . Os valores de partida para < sero nulos. Conhecendo-se o comportamento tpico das respostas ao impulso e/ou respostas ao degrau , possvel identificar , e de um determinado sistema a partir das respectivas observaes. (Del Castillo, 2002, pp. 140-141) e (Box, Jenkins, & Reinsel, 2008, pp. 451-453) entre outros, contm tabelas que ilustram os comportamentos tpicos das funes de resposta ao impulso e resposta ao degrau para diferentes valores de , e .
Neste modelo e so desvios relativamente ao equilbrio das entradas e sadas dos sistemas. Na prtica, os sistemas esto sempre infectados por distrbios ou rudo cujos efeitos prticos se traduzem na corrupo dos valores esperados para das sadas dos sistemas por uma quantidade , pelo que a identificao em tais condies apenas possvel se o nvel de rudo moderado em comparao com o nvel do sinal que se pretende identificar. Quando o nvel dos distrbios significativo comparativamente ao sinal, este normalmente entra no processo como um parmetro no controlvel, em contraste com . Para modelar os distrbios, (Box, Jenkins, & Reinsel, 2008) prope a modelao de por um processo ARIMA(p,d,q) e a sua incluso no modelo anterior = Onde = +
em que pode ter uma ou mais razes unitrias. Este modelo conhecido na literatura de engenharia de controlo como modelo Box-Jenkins, ou modelo BJ (Figura 4-10):
95
(4.120)
As ferramentas utilizadas em engenharia de controlo para identificao das funes de transferncia so normalmente baseadas em determinadas escolhas de entradas do sistema, como por exemplo impulsos, degraus ou ondas sinusoidais. Estas metodologias so extremamente teis quando os distrbios so relativamente reduzidos em relao aos sinais de entrada e sada. Quando os distrbios so significantes torna-se necessrio o uso de tcnicas estatsticas para estimar a funo de transferncia. Para efeitos de modelao, (Box, Jenkins, & Reinsel, 2008) prope que a entrada do sistema seja assumida como um processo estocstico e no como uma varivel controlada. Pretende-se com isto dizer que, quando o sistema est a correr com objectivos de identificao/modelao, a varivel de entrada deve comportar-se como uma varivel aleatria percorrendo o mximo de valores admissveis de modo a avaliar a resposta do sistema nos mais diversos nveis e transies, pelo que no deve existir qualquer aco de controlo em que a varivel de entrada seja manipulada. Abordagem a sistemas multivariados Do mesmo modo que a funo de autocorrelao utilizada para identificar modelos estocsticos, uma das ferramentas utilizadas para modelao de funes de transferncia de processos a funo de correlao cruzada entre a entrada e sada. Suponha-se que se pretende descrever uma srie temporal da entrada de um sistema fsico, e a correspondente resposta . Ento este par de sries temporais pode ser visto como uma nica srie temporal em que cada observao constituda por vector bidimensional qual se pode chamar processo estocstico bivariado , . Deve-se assumir que os dados so lidos simultaneamente e em intervalos equidistantes resultando um par de valores de uma srie temporal discreta, gerado por um processo bivariado, em que os valores da srie nos instantes 0 + , 0 + 2, , 0 + so descritos por 1 , 1 , 2 , 2 , , , . Funes de covarincia cruzada e correlao cruzada Em geral, um processo estocstico bivariado , no necessita de ser estacionrio. Contudo, como anteriormente, assume-se que um apropriado grau de diferenciao conduz a um processo , , onde = d x e = d y so estacionrios. Como anteriormente, o conceito de estacionaridade implica que os processos constituintes e tem mdia 2 2 constante e e varincias constantes e . Se adicionalmente assumir-se que o processo bivariado normal, ou Gaussiano, ele ser caracterizado unicamente pelo vector das suas mdias , e a sua matriz das covarincias.
96
Os coeficientes de covarincia de cada uma das sries constituintes na lag k so definidos pela frmula usual: = + = + = =
Onde se utiliza a notao () e para a autocovarincia das sries e que constituem a diagonal da matriz das covarincias. Os restantes coeficientes da matriz de covarincia so as covarincias cruzadas entre as sries e na lag +k: = + = , , ,
(4.121)
= , , ,
+
(4.122)
De forma similar ao caso univariado, em condies de estacionariridade (bivariada), a covarincia cruzada deve ser a mesma para todo o , pelo que deve ser funo apenas da lag k. Generalizando-se para srie multivariadas, pode dizer-se que a matriz de covarincia composta por = ,+ = , , ,
Em termos de covarincia cruzada, verifica-se que no igual a . Mas como (ver Figura 4-11): = = =
Apenas se necessita de definir uma funo para = 0, 1, 2, . Tal como j foi dito acima, a funo = , + , como definida em (4.121) chama-se funo de correlao cruzada de um processo bivariado estacionrio, a qual pode tambm ser representada de forma matricial, como se ver mais adiante =
97
De forma similar, correlao entre e + que dada pela quantidade adimensional definida por =
= , , ,
(4.123)
d-se o nome de coeficiente de correlao cruzada da lag k, sendo atribudo o nome de funo de correlao cruzada de um processo bivariado estacionrio funo , definida para = 0, 1, 2, (Box, Jenkins, & Reinsel, 2008). Em contraste com a funo de autocorrelao, geralmente a funo de autocorrelao cruzada no simtrica. Estimao das funes de autocorrelao e autocovarincia cruzadas Aps a diferenciao d vezes das sries originais de entrada e sada, at que estas mostrem comportamento estacionrio, obter-se- = pares de valores 1 , 1 , 2 , 2 , , , disponveis para anlise. A partir desses valores ser ento possvel obter uma estimativa dos coeficientes da covarincia cruzada da lag k dada por
+
= +
= , , ,
(4.124)
= =
= , , ,
Onde e so as mdias amostrais de das sries e respectivamente. De forma similar, as estimativas dos coeficientes de correlao cruzada para a lag k podem obter-se atravs da substituio em (4.123) de pelas respectivas estimativas , por = = 0 e por =
0 :
(4.125)
= , , ,
Um teste primitivo para verificar se certos valores da funo de correlao cruzada , sero efectivamente zero pode ser efectuado atravs da comparao das correspondentes estimativas com os respectivos desvios padro a partir da formula de Bartlett. Bartlett mostrou que, se as sries e no esto correlacionadas, ento (Del Castillo, 2002):
= , , ,
Da que, se duas sries so no correlacionadas e uma rudo branco ( = 0, qualquer que seja ), ento verifica-se que
98
Assim, se as sries e so no correlacionadas e uma rudo branco, a correlao cruzada varia em torno de zero com desvio padro aproximadamente igual a 1 2 . Identificao de modelos de funes de transferncia Suponha-se que o modelo da funo de transferncia = + Pode ser parametrizado de forma parcimoniosa na forma = + O procedimento de identificao composto pelas seguintes etapas: 1. Determinar estimativas preliminares dos pesos da funo resposta ao impulso no para o formato (4.126). 2. Utilizar as estimativas obtidas no ponto anterior para tentar estimar as ordens e dos operadores do denominador e numerador na equao (4.127) e o parmetro de atraso . 3. Substituir os valores estimados na equao (4.115), de acordo com os valores , e obtidos no ponto anterior para estimar os parmetros e da equao (4.127). Uma vez estimados os valores , possvel ter uma ideia das ordens e dos operadores do denominador e numerador na equao (4.127) e do parmetro de atraso comparando o andamento de , com as diversas respostas ao impulso tabeladas em (Del Castillo, 2002, pp. 140-141) e (Box, Jenkins, & Reinsel, 2008, pp. 451-453). Uma vez estimados os valores de , e ento possvel determinar os coeficientes atravs das equaes (4.115). Identificao de funes de transferncia pelo branqueamento da entrada Pelo que foi dito acima, torna-se claro que a correlao dentro de cada uma das sries pode esconder a correlao entre elas, pelo que a identificao dos processos pode ser facilitada se a entrada do sistema na fase de identificao for constitudo unicamente por rudo branco. De facto, sempre que se pode escolher a entrada do sistema a identificar, de todo recomendvel que se opte por rudo branco. Quando tal no possvel, e a entrada seguir outro processo estocstico, uma hiptese a ter em conta ser recorrer ao branqueamento da srie de entrada, conseguindo-se assim uma srie composta por rudo branco. Suponha-se que um processo de entrada , adequadamente diferenciado, estacionrio e pode ser adequadamente representado por um modelo ARMA(p,q) genrico. Ento, a partir de um conjunto de dados, possvel construir o modelo do processo =
(4.127) (4.126)
99
onde rudo branco. Resolvendo em ordem a obtm-se o filtro que ir permitir branquear a srie = Aplicando o mesmo filtro serie de sada obtm-se = Onde no necessariamente rudo branco. Substituindo em (4.120), a funo de transferncia-rudo BJ pode ser reescrita na forma = +
ou
= + 1 Onde = rudo colorido. Multiplicando-se ambos os lados por e tomando-se o valor esperado obtm-se
= + ou seja = + Onde = a covarincia cruzada para a lag k entre as sries e . Desta equao tira-se que: 1. Os valores da srie esto relacionados com valores passados da srie , ou seja, a sada do processo depende dos valores passados, e talvez presente, da entrada, pelo que o membro direito ser diferente de zero; 2. No primeiro termo do membro direito, como rudo branco, tem-se que 2 = = ;
3. O segundo termo do membro direito zero, porque no funo de , e e no esto correlacionados.
100
(4.128)
Verifica-se assim que, aps o branqueamento da entrada, a funo de correlao cruzada entre as duas sries transformadas directamente proporcional funo resposta ao impulso. Na prtica, no necessrio conhecer a funo de correlao cruzada terica , porque a estimativa da funo resposta ao impulso dada directamente atravs dos valores estimados das variveis envolvidas na equao anterior, ou seja = = , , ,
(4.129)
Esta a funo resposta ao impulso estimada, a partir da qual se podem identificar os valores referentes a (r,s,k). Nota 1: Se existir qualquer tipo de controlo por feedback, o que vai acontecer que os valores de entrada vo ser determinados a partir dos valores da sada , pelo que existir sempre alguma correlao entre a srie de entrada a srie de sada . Por outro lado, se a srie de entrada estiver correlacionada com a srie de sada, torna-se difcil determinar se a correlao dentro da srie de sada se deve prpria dinmica do processo ou ao facto de a srie de entrada estar correlacionada com a srie de sada. Nota 2: H no entanto um problema que se levanta com o branqueamento. Nos sistemas fsicos reais, os valores das sries de entrada so referentes aos valores retirados dos actuadores, que normalmente tm tambm alguma dinmica. O que se pretende normalmente que a constante de tempo referente aos actuadores seja insignificante comparativamente com a constante de tempo da dinmica do processo. Ao proceder-se ao branqueamento da srie de entrada, est-se simultaneamente a branquear a dinmica dos actuadores Identificao do modelo do rudo Voltando ao caso geral, suponha-se que o modelo pode ser escrito na forma = + Onde = d . Aps a obteno da funo de transferncia, a serie dos resduos pode obter-se a partir da equao = Alternativamente, o operador pode ser substitudo pelo modelo de funo de transferncia estimado 1 determinado a partir da identificao preliminar
101
= A srie temporal dos resduos obtida poder ento ser ajustada a um modelo ARIMA(p,d,q) com recurso a tcnicas com as funes de autocorrelao e autocorrelao parcial discutidas em pontos anteriores. Modelo ARMAX O modelo de funo de transferncia Box-Jenkins considera dinmicas distintas para o modelo do sistema e das perturbaes. Suponha-se que um particular sistema representado pelo modelo = +
onde pode ser um qualquer factor comum, e portanto ser redundante. Se o factor for igual a ento obter-se- = + Que tambm poder ser escrito na forma = +
(4.130)
Este modelo referido como modelo ARMAX, cujo nome vem da estrutura ARMA mais a varivel exgena. Neste modelo, a varivel exgena e a varivel endgena . Esta forma torna-se mais simples de manipular quando os objectivos do modelo esto relacionados com projecto de controladores como se ver em captulos posteriores.
102
Assume-se que esto disponveis = d pares para anlise e que e ( e se > 0) constituem os desvios em relao aos valores esperados. Se os valores iniciais 0 , 0 e 0 anteriores ao inicio da srie so conhecidos, ento, a partir dos dados possvel determinar, para qualquer escolha dos parmetros , , , , , os valores de = , , , , , , para = 1, 2, , . Na suposio da normalidade dos resduos , possvel obter uma aproximao estimativa da mxima verosimilhana minimizando a funo da soma dos quadrados condicional
, , , , =
=
, , , , , ,
(4.132)
Dados os valores iniciais apropriados, o clculo dos podem ser calculados para qualquer escolha dos valores dos parmetros usando um procedimento em trs estgios: 1. Calcular as sadas do modelo da funo de transferncia a partir da equao = 1 ou outro. 2. Calcular os resduos = 3. Os valores podem ser calculados a partir de (4.131) escrito na forma =
A funo da soma dos quadrados tipicamente no linear nos parmetros, pelo que dever ser resolvida recorrendo a metodologias de clculo numrico, ou de forma iterativa, como discutido anteriormente para os modelos ARIMA. Validao do modelo Neste ponto pretende-se encontrar um procedimento que permita inferir sobre a qualidade do modelo que se obteve, ou seja, se o modelo ou no adequado situao onde ser aplicado. O modelo do sistema foi bem identificado se conseguir captar correctamente, e em simultneo, as caractersticas dinmicas e estacionrias do sistema fsico, com base no conjunto de dados de estimao. aconselhvel que se proceda, quando possvel, a uma validao cruzada do modelo, isto , um teste sobre a capacidade do modelo reproduzir um conjunto de dados diferente do utilizado durante o processo de estimao dos parmetros, designado por conjunto de dados de teste. Validao por anlise de resduos Por um lado, para que o modelo possa ser considerado bom, necessrio garantir a total independncia entre a entrada do sistema , e os resduos do modelo , ou seja, um bom
103
modelo deve conseguir distinguir o que na sada depende da entrada, e o que da sada provm das perturbaes. Por outro lado, por construo do modelo, os resduos , devem constituir uma srie de rudo branco, pelo que no deve existir qualquer autocorrelao para as diversas lags 0. Pode ento concluir-se que para um modelo ideal, os valores dos coeficientes de correlao referidos devero ser baixos, ou seja, devem estar dentro de um intervalo de confiana, tipicamente 2 ou 3 desvios padro. Esta anlise poder ser melhor interpretada com recurso matriz dos coeficientes de correlao entre a entrada e os resduos =
ou seja, pelo que foi dito acima, pode concluir-se que os valores referentes ultima linha da matriz (4.133) devem ser estatisticamente no significativos. Um teste global para a validao do modelo nos primeiros coeficientes de correlao dos resduos dado pela estatstica qui-quadrado (Del Castillo, 2002):
= +
=
(4.134)
onde = , + . Esta estatstica, em que a hiptese nula 0 : = 0, 2 para = 1, 2, , , segue uma distribuio . Evidentemente, a zona de rejeio o lado direito da cauda da distribuio, pelo que valores elevados significaro elevadas autocorrelaes. De forma similar, um teste global para a estatstica de teste para 0 : = 0, para = 1, 2, , , ser dada por
= +
=
(4.135)
104
sries ou short-run. Este tipo de estimao recursiva dos parmetros assume um papel de grande relevo no controlo adaptativo, onde os preditores e so calculados on-line.
onde um vector (1) que contem as ultima observaes, o vector (1) dos parmetros, a matriz () dos regressores, 1 o vector dos parmetros calculado no instante anterior, o valor da nova medida do erro, ou erro de predio, ou inovao e o termo de correco, ou ganho, que pesa o valor do erro de predio actual na estimao do novo vector de parmetros. No que se segue, matriz tem a seguinte estrutura =
Onde cada vector contm o s valores dos regressores utilizados a quando da observao . O critrio dos mnimos quadrados consiste da minimizao da soma dos quadrados dos erros
O minimizador off-line desta funo dado pelo estimador dos mnimos quadrados: =
(4.137)
Para a obteno da verso recursiva desta frmula comea-se por definir a matriz
=
=
(4.138)
105
Em que o factor de esquecimento, que se considera normalmente variante no tempo, 0 < 1, pesando menos o erro de predio obtido com base nas observaes individuais, relativamente s observaes mais recentes. Para o caso de se considerar constante e igual a 1, a equao anterior fica na forma (Del Castillo, 2002)
=
=
(4.139)
A soluo genrica da minimizao do erro de predio quadrtico dado por (Botto, Controlo ptimo, 2007)
(4.140)
=
=
=
=
=
=
Ou seja =
(4.141)
=
=
=
=
+
=
ou seja = + =
+ +
106
Conseguindo-se assim uma expresso na forma (4.136), ou seja, os parmetros recursivos dos estimadores dos mnimos quadrados podem ser determinados atravs do algoritmo: = +
(4.142)
= + Para a implementao deste algoritmo recursivo necessrio inverter a matriz em cada instante. A soluo para este problema dada pelo lema de inverso de matrizes (Del Castillo, 2002): +
= +
Onde A e C so matrizes no singulares. Adaptando este lema matriz na forma = + Resulta ento:
A C B D
= +
Por outro lado, do termo de correco (ou ganho) da primeira expresso (4.142) vem =
+ +
= +
107
Com isto pode-se finalmente estabelecer o algoritmo recursivo dos mnimos quadrados (RLS- Recursive Least Square). Para = 1, 2, 3, , calcular sequencialmente = + =
(4.143)
= As condies iniciais do algoritmo tm de ser definidas. (Botto, Controlo ptimo, 2007) prope como condies iniciais: 1. O vector dos parmetros 0 considera-se normalmente igual a zero. 2. O valor inicial da matriz de covarincia, 0 considera-se normalmente 0 = , > 0 onde o valor a adoptar para a constante influencia simultaneamente, a rapidez de convergncia dos parmetros do modelo, e a estabilidade dessa convergncia (Del Castillo, 2002) prope valores na ordem de 100 ou 1000. 3. O factor de esquecimento considera-se normalmente variante no tempo, 0 < 1, com lim = 1, pesando o erro de predio obtido com base nas observaes iniciais, relativamente s observaes mais recentes.
Onde evidentemente no rudo branco se . Como se viu anteriormente, os modelos, tais como ARIMA ou ARMAX, em que o termo MA est presente, so no lineares nos parmetros, pelo que o mtodo dos mnimos quadrados ordinrio no aplicvel, pelo que ser necessrio recorrer minimizao da soma dos mnimos quadrados ou funo da mxima verosimilhana. Na estimao recursiva, um modo de resolver este dilema passa pelo recurso ao algoritmo dos mnimos quadrados estendido.
108
O algoritmo recursivo estendido dos mnimos quadrados, ou RELS (Recursive Extended Least Squares) corresponde extenso do algoritmo RLS para os modelos de regresso pseudo-linear: = = Onde o vector regressor foi construdo com base em = =
Dado o carcter iterativo da estimao do vector de parmetros, no possvel conhecer com exactido, num determinado instante , o vector de parmetros do modelo, . Para ultrapassar este problema, considera-se sempre o valor de 1 nas aproximaes dos termos 1 , , presentes no vector regressor:
O algoritmo recursivo estendido dos mnimos quadrados, ou algoritmo RELS (Recursive Extended Least Square) vem dado por = + = +
(4.144)
= = , = 1, ,
5. Sistemas de Controlo
109
5 Sistemas de Controlo
Os sistemas de controlo comuns podem ser classificados sistemas de controlo de referncia ou sistemas de controlo terminal. Nos sistemas de controlo de referncia, a varivel controlada () tem de seguir uma referncia varivel () to prximo quanto possvel, resultando em erros de controlo = () que devem ser to pequenos quanto possvel, 0. Se a varivel de referncia muda com o tempo est-se perante um sistema de controlo de referncia varivel. Se a varivel de referncia constante, ento este denomina-se como um regulador. Para sistemas de controlo terminal, o objectivo atingir-se e manter-se um estado final do processo ao fim de um determinado instante (predito ou livre). Tanto para os sistemas de controlo de referncia como para os sistemas de controlo terminal, os valores iniciais ou as perturbaes dos processos tm de ser compensadas o mximo possvel. Alm disso, o problema de controlo passa por tornar processos instveis em sistemas globais estveis conseguidos atravs de controlo por realimentao ou feedback. Estes problemas podem ser resolvidos, em geral pela aplicao de controladores que utilizam a informao retirada das sadas ou estados dos processos para realimentar o prprio processo. O efeito de feedback pode frequentemente ser melhorado com a introduo de elementos controlo de compensao em avano (feedforward).
v xv Gr
Controlador Por feedback
C/D x n B/A
Processo
A Figura 5-1 mostra um anel de controlo simples. Se as perturbaes v so mensurveis, pode-se utilizar a compensao em avano (feedforward) como na Figura 5-2, em combinao com o anel de realimentao (feddback loop) para controlo dos distrbios que no podem ser compensados pelo controlo em avano. O projecto de controlo de sistemas desenvolvido de acordo com o grfico da Figura 5-3.Dependendo do mtodo de projecto e da aplicao, so utilizados como base de projecto os modelos matemticos dos processos e dos sinais (distrbios, variveis de referencia, valores iniciais). Frequentemente, os modelos dos sinais apenas se conseguem estimar de forma aproximada. Por simplicidade, assume-se frequentemente alteraes em degrau, apesar de serem raras na prtica. Contudo, com recurso capacidade actual de
110
5. Sistemas de Controlo
computao, possvel obter-se modelos mais exactos de sinais determinsticos e estocsticos sem grandes esforos.
v
Gs
Controlador feedforward
C/D
n
B/A
Processo
No projecto de controladores lineares h que distinguir dois tipos de sistemas de controlo: sistemas de controlo de parmetros optimizados e sistemas de controlo de estrutura optimizada.
n Processo
Modelo do Processo
Modelo do Sinal
Mtodo de Projecto
Algoritmo de controlo
Figura 5-3 Metodologia de projecto de algoritmos de controlo (Isermann, 1989)
No caso de sistemas de controlo de parmetros optimizados, a estrutura do controlador , isto , a forma e a ordem da equao do controlador, dada e os parmetros livres do controlador so adaptados ao processo controlado atravs de critrios de optimizao ou regras de sintonizao. Sistemas de controlo de estrutura optimizada so sistema em que a estrutura e os parmetros do controlador so adaptados e optimizados estrutura e parmetros do modelo do processo. No primeiro caso tem-se os controladores tipo PID, enquanto que no segundo caso pode enunciar-se os controladores de estado e os controladores de cancelamento (Isermann, 1989). Para projecto, pode recorrer-se a regras de sintonizao, critrios de performance e colocao de plos. A escolha dos critrios de performance tem um papel central no projecto de controladores. Para controlo de sistemas contnuos, o critrio integral tem sido dos mais utilizados, pela integrao dos erros, erros quadrticos, amplitude absoluta, etc., cada um podendo ser
5. Sistemas de Controlo
111
ponderados no tempo. Para sinais discretos, os critrios utilizados tem sido os seguintes (Isermann, 1989):
=
=
Soma do erro
=
=
=
=
A utilizao de no aconselhvel se mudar de sinal, pelo que utilizado mais frequentemente. Contudo, conduz a um comportamento fortemente oscilatrio ao passo que, com e obtm-se um comportamento mais amortecido das variveis de controlo. No projecto analtico prefere-se os critrios de performance quadrticos devido s suas vantagens matemticas. Isso deve-se ao facto de que quando se procura valores extremos, uma simples derivada resulta em relaes que so lineares em . Se aos desvios quadrticos das variveis controladas se adicionar os desvios quadrticos das variveis manipuladas, ponderadas com um factor , obtm-se um acrescento dos graus de liberdade e a possibilidade de uma mais directa infuencia no amortecimento do comportamentodo sistema de controlo. Pelo que, um critrio de performance quadrtica mais geral ser dado pela expresso:
=
=
=
=
Estes critrios quadrticos so adequados tanto para sinais determinsticos como estocsticos (Isermann, 1989).
112
5. Sistemas de Controlo
Substituindo este resultado na expresso acima obtm que = + pelo que o erro mnimo ser cuja varincia corresponder varincia mnima . Isto implica que os ajustamentos sero sempre iguais a zero. Se _0 ( )/, ser necessrio apenas um ajustamento. Se = , no ser necessrio qualquer ajustamento. Este resultado est de acordo com os pressupostos da experincia do funil de Demming, onde apenas se o funil est fora do alvo (target), este apenas necessita de ser ajustado ao alvo, aps o que no ser necessrio mais nenhum ajustamento. Este modelo de processos apenas necessitam de ser monitorizados para se garantir que no h qualquer alterao, pelo que a utilizao de tcnicas de controlo estatstico sero suficientes para os objectivos pretendidos.
Se o grau dos dois polinmios no for o mesmo, sempre possvel substituir os coeficientes inexistentes por zero. Pode-se ento utilizar este modelo para a base para predio, se
5. Sistemas de Controlo
113
1. Aqui assume-se que o valor de no ainda conhecido quando se faz a predio da varivel de sada instantes frente + . A maneira bvia de se obter a predio da sada como se segue
+ =
=
+ +
=
+ = +
=
+ +
=
ou, em geral
+ =
=
+ +
=
Desde que a predio + depende de outras sadas preditas, as quais elas prprias foram preditas em funo de medidas provenientes de sadas passadas, possvel encontrar uma expresso para + que dependa apenas das medidas das sadas medidas , 1 , (Maciejowski, 2002). Suponha-se que se tem um polinmio , de grau menor ou igual a 1, e um polinmio , de grau 1, tal que: = + ou = Multiplicando (5.2) por obtm-se
(5.3)
114
5. Sistemas de Controlo
+ = ou + = + + Deste modo conseguiu-se construir uma expresso em predio instantes frente da sada do processo + apenas depende dos valores conhecidos (presente e passados) da sada do mesmo processo (o ultimo valor possvel envolvido poder ser no mximo + = = ). Poder ento escrever-se a predio para a sada do processo instantes frente na forma + = + a qual apenas envolve sadas do processo conhecidas no lado direito da expresso. Claro que tudo isto depende da existncia das solues e para a equao (5.3). Esta metodologia um exemplo de aplicao de uma equao de Diophantine (Maciejowski, 2002, p. 126). Identidade de Diophantine Na presena de uma expresso do tipo =
em que os polinmios e so ambos de grau . Se no for o caso, os respectivos coeficientes sero iguais a zero. A identidade de Diophantine (ou equao de Diophantine) representa a longa diviso de por , que resulta num quociente e um resto = +
(5.5)
5. Sistemas de Controlo
115
Onde, como anteriormente, uma modulado como sendo rudo branco. Quando o modelo dos distrbios da forma (5.5) est presente, pode-se recorrer novamente soluo de uma equao de Diophantine para se determinar a predio da sada do processo. Nesta situao assume-se que se tem polinmios e que resolvem a equao = + em que o grau do polinmio no mximo 1 e o grau do polinmio no mximo 1. Ou seja, estes polinmios resolvem a equao de Diophantine = Note-se que, neste caso, o primeiro termo do lado direito o polinmio , ao contrrio do caso anterior que era 1. Esta diferena surge devido ao facto de a entrada do processo ser conhecida, ao contrrio do distrbio que deconhecido. Dividindo ambos os membros da equao anterior por tem-se que = + Usando este resultado e (5.5), obtm-se + = + = + +
(5.6)
A diferena entre a situao anterior e esta na utilizao da equao de Diophantine, que, apesar de se ter dividido a predio entre termos passados e termos futuros, neste caso no se conhece o termo presente dos distrbios . Esse termo ter que ser estimado de alguma forma. Uma das formas possveis passa por pegar no sistema formado pelas equaes (5.4) e (5.5) e resolv-lo em ordem a : =
(5.7)
116
5. Sistemas de Controlo
onde a predio da sada obtida pela filtragem da entrada pelo modelo do processo. O diagrama de blocos da Figura 5-4 mostra uma interpretao da expresso anterior (Maciejowski, 2002).
A partir da expresses (5.4) e (5.6) pode-se ento construir uma expresso para a predio para a sada do processo -instantes frente: + + + +
+ =
Tal como em (5.6), esta predio inclui o termo + , que contm apenas predies de valores futuros dos distrbios . A melhor maneira de fazer essas previses seria supor uma determinada natureza de distrbios. No entanto, no seria de bom senso assumir que seja um sinal predizvel de alguma forma porque, se fosse o caso, essa situao deveria reflectir-se nos polinmios C e D. Como o modelo assume que se trata de rudo branco, ento os so independentes e identicamente distribudos com valor esperado nulo, pelo que, nesta situao, faz todo o sentido fazer + = 0. Deste modo obtm-se finalmente o preditor de varincia mnima: + = + +
(5.8)
Para utilizar esta expresso numa estratgia de controlo preditivo, h ainda a necessidade de separar a parte de resposta livre, a resposta predita que ocorre se no houver alterao na entrada do processo (+ = 0), da parte da resposta forada, nomeadamente que depende de (+ . Por outras palavras, necessrio separar a parte que depende das entradas passadas da parte que depende de entradas futuras. Para se atingir esse objectivo, recorre-se a outra equao de Diophantine. Da expresso (5.8), verifica-se que o nico sinal que atravessa a fronteira passado/futuro , que filtrado pela funo de transferncia ()/() ^, pelo que se torna necessrio extrair os primeiros + 1 termos da resposta ao impulso de ()/(). Pelo que se necessita de determinar o par soluo , da equao de Diophantine
5. Sistemas de Controlo
117
= + Em que o grau de no superior a . Substituindo esta expresso em (5.8), obtm-se finalmente (Maciejowski, 2002) + + +
+ = +
= + + +
= + +
(5.9)
= +
Outra das simplificaes foi fazer o horizonte de predio coincidir com o atraso da resposta do sistema. Considere-se ento uma funo de transferncia ARMAX / BJ, e suponha-se que no instante tem que se tomar uma deciso sobre o valor do ajustamento a fazer da varivel de entrada: + = + +
(5.10)
onde k o atraso da resposta do sistema. O segundo termo do lado composto por desvios futuros desconhecidos, +1 , , + , e desvios passados que podem ser estimados a partir dos resduos , 1 , . Para fazer a separao entre desvios passados e futuros, recorre-se novamente equao de Diophantine, fazendo:
118
5. Sistemas de Controlo
(5.11)
(5.12)
onde, como anteriormente, de ordem 1 e de ordem 1, em que = , , , onde os coeficientes inexistentes so substitudos por zero. Para estimar os desvios passados e presente, recorre-se novamente ao modelo original (ARMAX/BJ) resolvendo em ordem a para o instante =
+ =
= + +
Da equao (5.11) pode tirar-se ainda que (() () ^)/() = () . Introduzindo este resultado no ultimo termo do lado direito da ultima expresso obtm-se + = + + () +
(5.13)
Omitindo o operador de retardo por simplicidade de notao, a expresso anterior fica na forma + = + + +
Suponha-se que seja o valor de referncia ou alvo, que normalmente zero, uma vez que normalmente significa o desvio em relao referncia. Para se obter o controlador de varincia mnima, tem que se minimizar o valor esperado dos desvios quadrticos +
2
, ou seja minimizar:
5. Sistemas de Controlo
119
= + +
+
Onde o ultimo termo corresponde ao erro estacionrio ou offset da sada do processo. A partir da expresso (5.13) simplificada, e substituindo os desvios futuros por zero (valor esperado de rudo branco) tem-se ento que + = +
Onde o primeiro termo do lado direito o valor espectvel em para a varivel de sada + no instante + quando o valor da varivel de entrada nulo no instante t, ou seja, se o processo no for controlado. Ento, fazendo = 0 po, r questes de simplicidade,
= +
= + +
+ +
= +
+ +
+ + +
Onde se obtm a igualdade se se ajustar a varivel de entrada de modo a que + = , ou seja, o valor de tem que ser tal que + = + =
Substituindo a lei de controlo (5.14) na expresso do modelo do processo (5.13), obtm-se a equao de sada em malha fechada representada pelo diagrama de blocos da: + = + + () + = + ()
120
5. Sistemas de Controlo
Processo (BJ)
Controlador
= +
Da expresso anterior conclui-se que a sada de um sistema constitudo por um processo BJ e um controlador MMSE em malha fechada, segue um processo MA(k-1). Isso implica que a sada ser estacionria, mas no ser rudo branco puro, uma vez que em geral ser no correlacionada. Pode ainda concluir-se que, em malha fechada, o desvio mdio quadrtico ser dado por (Del Castillo, 2002):
+ = =
=
5. Sistemas de Controlo
121
Que ser minimizado seleccionando tal que + = 0 para todos os instantes t. Uma extenso natural deste critrio, e de acordo com o que foi dito no inicio desta seco, ser estend-lo tambm s variveis de entrada = + + A constante pode ser vista como o multiplicador de Lagrange de 2 que a restrio do MSE do factor manipulvel. Se est escalado de forma centrada em zero, e se o sistema no estado livre (no controlado) no flutua, ento = . Para minimizar , Clarke e Gawthrop props a decomposio de + em + = + + + Em que o ultimo termo o erro de previso, que independente de , e que portanto apenas funo de erros futuros em relao ao instante t. Introduzindo esta ultima expresso, ser dado por (Del Castillo, 2002): + = + + + + + + + + Como os termos cruzados so nulos e = , a expresso anterior reduz+ + se a + = + + + + + Como no funo de , para se minimizar torna-se suficiente minimizar + apenas o ultimo termo da expresso anterior = + = +
+ +
Onde a funo densidade probabilidade de . Assim esta expresso reconhece o facto de que o factor de controlo uma varivel aleatria que depende de que por seu lado depende dos erros . Como se pode verificar, surge uma dificuldade: A densidade de depende da lei de controlo por realimentao (feedback) que se pretende determinar em primeiro lugar. Por outro lado, Clarke e Gawthrop props minimizar o valor esperado condicional: = + , , = + = + + + +
(5.15)
Onde a ultima igualdade surge de se ter tomado o valor esperado condicionada s observaes presentes e passadas. Se as observaes so conhecidas, ento deixa de ser uma varivel aleatria, pelo que e o valor esperado condicional de pode + ser ento determinado usando o critrio da mnima media dos erros quadrticos MMSE (5.13):
122
5. Sistemas de Controlo
+ = + =
() +
onde, por uma questo de simplicidade, se omitiu o operador de atraso. Para minimizar procura-se o mnimo da funo recorrendo aos zeros da derivada: + = + = + + + Como os nicos coeficientes dos polinmios B, F e C que esto envolvidos no termo derivativo + so os coeficientes de ordem zero, tem-se + () = = () Deste modo, tem-se finalmente que = + + = Resolvendo em ordem a obtm-se finalmente o controlador de varincia mnima generalizada de Clarke-Gawthrop: = +
(5.16)
6. Anlise Multivariada
123
6 Anlise Multivariada
6.1 Sries temporais Multivariadas
A anlise multivariada de sries temporais o estudo de modelos estatsticos e mtodos de anlise que descrevem a relao entre vrias sries temporais. Ou seja passa-se de uma varivel usada para quantificar a sada de um determinado processo num determinado instante no caso univariado para uma varivel vectorial = 1 , 2 , que quantifica as diversas variveis mensurveis envolvidas no processo. Os processos multivariveis tm interesse nas mais variadas reas tais com engenharia, fsica, cincias da Terra tais como meteorologia ou geofsica, economia e finanas. Por exemplo, em engenharia, pode-se estar interessado em estudar comportamentos simultneos de corrente e tenso, temperatura, presso e volume, ao passo que em economia pode-se estar interessado simultaneamente em taxas de juro, disponibilidade financeira, desemprego etc. No estudo de processos multi-variados, torna-se necessrio a existncia de uma estrutura que descreva no apenas as propriedades das sries individuais mas tambm a possibilidade de relaes cruzadas entre as sries. Estas relaes so frequentemente estudadas e detectadas da considerao das estruturas de correlao entre as vrias componentes da srie. Os objectivos da anlise e modelao das sries em conjunto so compreender a relao dinmica ao longo do tempo entre as sries e melhorar a preciso da previso para as sries individuais recorrendo informao adicional proveniente da relao entre as sries. A maioria fundamental dos conceitos tericos descritos nas seces anteriores para as sries temporais univariadas estendem-se aos sistemas multivariados, mas surgiro novos problemas e desafios na modelao e anlise das sries temporais multivariadas devido grande complexidade dos modelos e parametrizaes na situao vectorial.
124
6. Anlise Multivariada
processo. Adicionalmente, o vector dever ter uma matriz de covarincia constante definida por = = . Ver (3.2.2-Processo estacionrio). 0
(6.1)
Com 0 = obviamente. Da mesma forma, a matriz de correlao cruzada da lag definida por =
(6.2)
para = 0, 1, 2, , onde 1 2 = 11 0 1 2 , , 0 1 2 . Deste modo, para = , = a funo autocorrelao da i-sima srie , e para , = a funo de correlao cruzada entre as sries e . De notar que = e = , uma vez que = (Reinsel, 1997), ver Figura 4-11 para o caso bivariado. Adicionalmente, as matrizes de correlao cruzada e de covarincia cruzada tem a propriedade de serem no negativas definidas, uma vez que
=
= =
6. Anlise Multivariada
125
Para qualquer inteiro positivo n e qualquer vector constante de dimenso k 1 , , (Reinsel, 1997)
De notar que, apesar dos vectores rudo branco serem independentes e identicamente distribudos (IID) entre eles, os elementos componentes de cada vector no gozam da mesma propriedade. Desvios normais multivariados Um desvio aleatrio vectorial de dimenso um ponto num espao de dimenso . As suas coordenadas so um vector em que cada uma das suas componentes aleatria, mas que, em geral, no so independentes ou identicamente distribudas. O caso especial de desvios normais multivariados definido funo densidade probabilidade Gaussiana multidimensional , =
Onde o parmetro um vector que, como normalmente, a mdia da distribuio, e o parmetro uma matriz simtrica, positiva definida, que, como normalmente, a covarincia da distribuio. Existe um modo bastante geral para construir um vector de desvios com parmetros e , partindo de um vector de desvios aleatrios independentes de mdia zero e varincia unitria: primeiro utilizar a decomposio de Cholesky para factorizar numa matriz triangular multiplicada pela sua transposta =
(6.3)
Este passo sempre possvel porque uma matriz positiva definida, e apenas se necessita de executar este passo para cada matriz distinta. A seguir, sempre que se necessitar um novo desvio , construir um vector com desvios normais independentes de mdia zero e varincia unitria, e ento construir (Teukolsky, Vetterling, & Flannery, 2007)
126
6. Anlise Multivariada
(6.4)
De modo similar, mas em sentido contrrio, dada a decomposio (6.3) e um vector , constitudo por rudo branco multivariado, cujas componentes tem covarincia e mdia conhecidas, tem-se que o vector dado por = tem componentes no correlacionadas com varincia unitria.
(6.5)
=
=
onde uma matriz . O filtro fisicamente realizvel ou causal quando = para < 0, tal que = = se pode expressar apenas em termos de valores passados e presente do processo de entrada . O filtro diz-se estvel se
=
< onde
significa a norma da matriz definida por 2 = . Quando o filtro estvel e a serie de entrada estacionria com matriz de covarincia cruzada xx , a sada um processo estacionrio. A matriz de covarincia cruzada do processo estacionrio ento dada por
= , + =
= =
xx +
= +
=
= + ,
(6.6)
6. Anlise Multivariada
onde =
=
=
(6.7)
onde um vector ruido branco com mdia zero e matriz de covarincia = . Este modelo um generalizao natural dos modelos univariados ARMA(p,q) que ser de grande utilidade na modelao de srie temporais vectoriais.
Um processo vectorial estacionrio ARMA(p,q) definido pela relao (6.7) diz-se causal se puder ser representado na forma (6.6) para qualquer = 0, 1, 2, , com < . = Um processo vectorial ARMA(p,q) diz-se invertvel se puder ser representado na forma
=
=
(6.8)
ou = onde = Estacionaridade
com
< .
Um processo vectorial descrito por um modelo ARMA(p,q) na forma (6.7), estacionrio se todas as razes de = so maiores que um em valor absoluto. Nesse caso, o processo , pode ser representado na forma de mdia mvel (MA) infinita como em (6.6), com = representando a serie matricial convergente para . Invertibilidade De forma similar, um processo vectorial descrito por um modelo ARMA(p,q) na forma (6.7), diz-se invertvel se todas as razes de = so maiores que um em valor absoluto (Reinsel, 1997). Nesse caso, o processo invertvel com
=
=
Representando a srie matricial convergente para e possui uma representao autoregressiva infinita como em (6.8).
128
6. Anlise Multivariada
Segue-se ento que para um processo estacionrio ARMA(, ), os coeficientes matriciais da representao MA infinita (6.6) so determinados a partir da relao = , e consequentemente, igualando os coeficientes com o mesmo expoente, satisfazem a relao = + + + onde = , = para < 0, e = para > . Reciprocamente, nas condies de invertibilidade, os coeficientes de ponderao na representao infinita AR (6.8) so determinados a partir da relao = , e consequentemente, igualando os coeficientes com o mesmo expoente, satisfazem a relao = + + + onde = , = para < 0, e = para > . Matrizes de covarincia de processos vectoriais ARMA Um processo estacionrio ARMA(p,q) dado por (6.7) pode ter uma representao MA infinita dada por (6.6). Ento, a partir de (6.6), fcil de verificar que (Box, Jenkins, & Reinsel, 2008) = < = , , = , ,
Deste modo, torna-se fcil determinar, a partir de (6.7) que as matrizes de covarincia = do processo satisfazem a relao
, =
=
+ ,
=
e, consequentemente,
=
=
= , , ,
=
(6.9)
matrizes de covarincia , podem ser desenvolvidas em termos dos parmetros matriciais AR e MA, e , e , atravs desta forma recursiva. Modelo vectorial autoregressivo Se num modelo vectorial ARMA(p,q), a ordem da componente mdia mvel for zero ento ter-se- um modelo vectorial autoregressivo puro vector ARMA(p,0) ou vector AR(p) ou ainda VAR(q) dado pela expresso
6. Anlise Multivariada
129
Tal como nos processos univariados, as condies de estacionaridade de um processo vectorial AR(p) so as mesmas que para um processo ARMA(p,q), ou seja estacionrio se todas as razes de = so maiores que um em valor absoluto. Nesse caso, o processo tem uma representao MA infinita = = . = , em que = Para um modelo vectorial autoregressivo puro VAR(p), a expresso das matrizes de covarincia (6.9) reduz-se matriz das equaes de Yule-Walker dadas por
=
=
= , ,
(6.10)
Com =
determinar , = , , , , , em termos dos parmetros matriciais AR, e . Reciprocamente, conhecida ou estimada a ordem , as matrizes , , e podem ser determinadas a partir de , , , resolvendo o sistema de equaes matriciais de Yule-Walker
=
=
= , , ,
(6.11)
Estas equaes podem serem escritas na forma matricial como = com soluo =
(6.12)
onde = , , , uma matriz , = , , , uma matriz e uma matriz bloco em que a matriz elementar ndice (, ) composta pela matriz de covarincia . Uma vez determinado a matriz coeficiente a partir de (6.11), a matriz de covarincia pode ser determinada a partir da expresso (Reinsel, 1997)
=
=
= = =
Modelo vectorial mdia mvel Se num modelo vectorial ARMA(p,q), a ordem da componente autoregressiva for zero ento ter-se- um modelo mdia mvel puro vector ARMA(0,q) ou vector MA(q) ou ainda VMA(q) dado pela expresso
130
6. Anlise Multivariada
= + = +
=
Tal como nos processos univariados, as condies de invertibilidade de um processo vectorial MA(q) so as mesmas que para um processo ARMA(p,q), ou seja invertvel se todas as razes de = so maiores que um em valor absoluto. Nesse caso, o processo tem uma representao AR infinita = ou . = = , com = Para um modelo vectorial mdia novel puro VMA(q), a expresso das matrizes de covarincia (6.9) reduz-se a
=
=
(6.13)
Para = 0, 1, , , com = , = e = para > (Reinsel, 1997). Verifica-se assim que para um processo MQ(q), todas as correlaes cruzadas so nulas para lags maiores que q. Reciprocamente, a expresso (6.13) pode ser utilizada para obteno das matrizes coeficiente a partir dos coeficientes de correlao cruzada s de um processo MA(q). Representao de um processo VARMA na forma VAR(1) (Ltkepohl, 2007) prope de modelo VARMA numa representao na forma VAR(1), que poder ser bastante til para predio ou, fundamentalmente, para representao em espao de estados. Suponha-se que tem uma representao VARMA(p, q) standard (6.7)
=
=
= +
=
+
=
: =
6. Anlise Multivariada
131
e onde
+ +
Consequentemente, representaes diferentes do origem mesma estrutura matricial de covarincia do processo. Duas representaes de um modelo ARMA(p, q) com estas
132
6. Anlise Multivariada
propriedades dizem-se observacionalmente equivalentes. (Box, Jenkins, & Reinsel, 2008) d o exemplo de um modelo ARMA(1,1) bivariado = com a forma = =
Este problema similar, mas mais complexo, que o problema da sobreparametrizao e redundncia de parmetros que existe no caso ARMA univariado. Os parmetros de um modelo ARMA(p, q) so identificveis se os parmetros e so unicamente determinados pelas matrizes da resposta ao impulso do operador da representao MA infinita (nica) do processo, ou seja, se no existe outro par de operadores ARMA(p,q) , que seja observacionalmente equivalente a , (Reinsel, 1997).
Para alm das condies de invertibilidade e estacionaridade, i. Todas a s razes de = 0 e todas as razes de ser maiores que zero em valor absoluto = 0 tm de
As duas condies seguintes so suficientes para a identificabilidade dos parmetros num modelo ARMA(p,q) (Reinsel, 1997) ii. As matrizes e no tem factores comuns, a no ser factores unimodulares, isto , se = e = , ento o factor comum tem de ser unimodular, isto uma constante (diferente de zero), e
iii. Com q menor possvel p menor possvel para este q, a matriz , tem que ter rank completo Quando se verifica a propriedade (ii), os operadores e dizem-se left-coprime, e a representao = diz-se ser irredutvel. Uma abordagem particular para identificao, representar o modelo ARMA numa certa forma cannica a partir da qual existe um nico modelo representativo dessa forma para cada classe de modelos ARMA observacionalmente equivalentes. Essa abordagem ser discutida na seco 6.1.2.3 em relao forma cannica escalo (echelon). Modelos vectoriais ARMA no estacionrios Na prtica, muitos processos tm comportamento no estacionrio, frequentemente de natureza homognea, como deriva ou tendncia a nvel local, mas que no global apresentam um padro homogneo. Frequentemente, por exemplo num modelo ARIMA univariado, a no estacionaridade pode ser retirada diferenciando as sries.
6. Anlise Multivariada
133
Para os modelos vectoriais ARMA, as condies para a estacionaridade exigem que todas as razes de = 0 sejam maiores que um em valor absoluto. Generalizando para processos no estacionrios, mas no explosivos, pode-se considerar uma forma geral de modelos vectoriais ARMA, =, , onde alguns valores de = 0 podem ter o valor absoluto igual a um. Mais especificamente, devido ao papel proeminente do operador 1 nos modelos univariados, pode-se permitir apenas algumas razes unitrias, sendo as restantes superiores a um em valor absoluto. Considere-se primeiramente modelos da forma =
(6.14)
Onde = , , , uma matriz diagonal, 1 , 2 , , so inteiros positivos, e = tem todas a razes maiores que um em valor absoluto. Este modelo que referido como modelo vectorial ARIMA, apenas estabelece que aps a diferenciao individualmente de cada srie de um apropriado numero de vezes para a reduzir a uma srie estacionria, a srie vectorial resultante = ser um processo vectorial ARMA(p,q) estacionrio. Como se ver seguidamente, este modelo quase no to geral como o modelo = , onde so permitidas algumas razes de = com valor absoluto igual a um. A utilizao destes modelos em situaes no apropriadas poder conduzir a sobre diferenciao e consequentemente no invertibilidade do operador MA. O aspecto da no estacionaridade (razes unitrias) de um processo vectorial torna-se assim mais complicado comparativamente ao caso univariado, devido em parte possibilidade de cointegrao entre as sries componentes de um processo vectorial no estacionrio. Por exemplo, existe a possibilidade de uma srie componente ser no estacionria, com a srie das suas primeiras diferenas 1 estacionria (neste caso dir-se- cointegrada de ordem um), mas tal que ceras combinaes lineares = sero estacionrias. Nestes casos o processo diz-se cointegrado com vector de cointegrao . Uma interpretao de cointegrao, particularmente relacionada com modelos econmicos, que as sries componentes individuais partilham algumas componentes no estacionaria comuns ou tendncias comuns, e consequentemente, tem tendncia a ter alguns movimentos similares no seu comportamento a longo prazo. Uma estrutura especifica de modelo ARMA no estacionrio em que ocorre cointegrao o modelo = , onde = tem < razes unitrias e todas as restantes maiores que um em valor absoluto, e em que a matriz tem rank igual a = . Deste modo, pode estabelecer-se que existem vectores linearmente independentes tal que tem comportamento estacionrio. Diz-se ento que tem cointegrao rank .
134
6. Anlise Multivariada
multivariado, ou apenas para previso do comportamento futuro do processo. Neste sentido, e tambm porque o objectivo do trabalho passa por obter um modelo do processo que apresente o melhor desempenho possvel, apresenta-se uma abordagem muito ligeira a outras formas representativas que podero revelar-se mais teis para especificao dos modelos dos processos que a forma estandardizada. Um vector ARMA(p,q) pode ser escrito na seguinte forma equivalente
#
(6.15)
se obter uma identificabilidade nica dos parmetros do modelo na forma (6.15), torna-se # necessrio restringir (normalizar) a forma da matriz , que dever ser, no mnimo, triangular inferior com uns (1s) na diagonal. Para especificar a forma cannica, para alm dos habituais indicies p e q, necessrio determinar outro conjunto de ndices, chamados ndices de Kronecker 1 , 2 , , , que iro corresponder ordem dos polinmios em de cada uma das variveis que compem o vector . A forma cannica de um modelo ARMA determinada como sendo a representao (6.15) tal que # , # tem o menor grau de linha possvel, em que o grau da linha de # , # , para i= 1, , , em que o grau do modelo (p, q) vai ser determinado por = = 1 , 2 , , . A especificao destes ndices, conhecidos como ndices de Kronecker, que so nicos para qualquer classe equivalente de modelos ARMA, e determinam o modelo (6.15) de forma nica, no qual os parmetros desconhecidos so identificados de forma nica. Grau McMillan de um processo vectorial ARMA Para qualquer processo vectorial com matrizes de covarincia , define-se a matriz bloco de dimenso infinita, denominada como Matriz de Hankel de covarincia por =
O grau de McMillam M do processo definido pelo rank da matriz H. O processo segue um modelo ARMA finito se e s se o rank da matriz H finito. Para um processo ARMA(p,q), a relao de momentos (6.7) resulta em
para > . A partir daqui pode-se verificar que o rank de H (o grau de McMillan) satisfar a relao , onde = {, }, consequentemente verificar-se- por exemplo a seguinte relao
6. Anlise Multivariada
135
, , , , , , , = com = para > . Consequentemente, todas a linhas constitudas por blocos de H para alm do s-simo bloco linha sero linearmente dependentes das linhas bloco precedentes. Contudo, o grau de McMillan de um vector ARMA(p,q), = = , , = , , poder ser consideravelmente inferior a devido s deficincias de rank nos coeficientes matriciais MA e AR. O grau de McMillan M interpretado como o nmero de combinaes lineares linearmente independentes dos vectores passados e presente , , que so para uma predio ptima para todos os vectores futuros dentro da estrutura ARMA (Reinsel, 1997). Forma cannica implcita pelos ndices de Kronecker A exemplo do que foi feito para a expresso (6.6), as matrizes de covarincia cruzada do processo definido por (6.15), sero dadas por
# =
# =
=
Se () for a i-sima linha de # , ento o i-simo ndice de Kronecker que ser implica a dependncia linear nas linhas da matriz de Hankel da forma
0 ()
=
() =
+ 1
(6.16)
Que pode ser na forma = 0 com = , , 1 , 0 , 0 , . De notar que, por definio do i-simo ndice de Kronecker , o vector 0 na expresso anterior deve ser construdo de modo que a componente ndice i seja 1 e que as componentes com ndice superior a i sejam nulas. Consequentemente, o ndice de Kronecker igual a , implica, em particular, que a representao do modelo ARMA da forma (6.15) deve ser construda de forma a que i-sima linha das matrizes # e # sejam zero para > . Adicionalmente, a expresso (6.16) implica que certos elementos da linha i das matrizes # , para sejam nulos. Especificamente, o l-simo elemento da i-sima linha de 0 deve ser zero sempre que + , porque para as linhas + + , = 0, , , da matriz de Hankel so todas linearmente independentes das linhas anteriores. Consequentemente, o elemento ndice (, ) do operador AR
em (6.15) pode ser especificado para ter coeficientes diferentes de zero apenas para as lags = + 1, , , com coeficientes iguais a zero para qualquer lag abaixo de j (quando ), onde se define
136
6. Anlise Multivariada
+ 1, ,
>
(tal que sempre que se tenha = ). Deste modo, o correspondente numero de parmetros de AR desconhecidos no elemento (, ) de # igual a . Assim, o operador AR # no modelo (6.15) pode ser especificado de forma a que o numero total de parmetros desconhecidos de # igual a =1 =1 = + , enquanto # que o numero de parmetros desconhecidos no operador MA em (6.15), excluindo os # parmetros referentes a # = igual a = (Reinsel, 1997). =1 Forma de rank reduzido do modelo VARMA implcita pelos ndices de Kronecker
# Multiplicando o modelo ARMA na forma cannica (6.15) por vectorial ARMA na forma standard # # =
, obtm-se o modelo
+
=
#
(6.17)
+
=
# . Tem
se ento que o rank igual ao numero de ndices de Kronecker que so iguais ou maiores que a lag j, ou seja, se no conjunto dos ndices de Kronecker existirem n ndices com valor igual ou superior a j, ento o valor de coincidir com o valor n. Consequentemente, as matrizes # , # tero uma linha s com zeros para cada ndice de Kronecker em que > . Deste modo, o rank vai decrescendo medida que j aumenta. Denotando como sendo a submatriz da matriz identidade que selecciona as linhas no nulas de # , # , tal que , # , # so composta apenas pelas linhas no nulas de # , # . Ento tem-se que
# , = # onde =
, ,
rank reduzido das matrizes coeficiente , na forma standard (6.17). Assim, o modelo vectorial ARMA na forma standard pode ser escrito como
=
=
+
=
(6.18)
O modelo vectorial ARMA desta forma pode ser referido como representao de rank reduzido encadeado do modelo ARMA (nested reduzed-rank ARMA model representation) (Reinsel, 1997).
6. Anlise Multivariada
137
= ,
= , ,
(6.19)
onde os so os respectivos vectores prprios. As correlaes cannicas parciais amostrais entre 1 e 2 , dado 3 so definidas de forma similar baseado na amostra = 1 , 2 , 3 , = 1, , , seguindo o procedimento descrito na seco 4.2.6.2 Mtodo das correlaes cannicas. Na anlise de correlao cannica, est-se frequentemente interessado nas combinaes lineares de 1 e 2 que possuam uma forte correlao e, talvez ainda mais importante, quando que algumas das correlaes cannicas entre 1 e 2 so (essencialmente) nulas, uma vez que esse facto pode conduzir a uma reduo substancial da dimenso do estudo das relaes entre os dois conjuntos de variveis. Uma propriedade importante que se existirem (no mnimo) 1 combinaes lineares linearmente independentes de 1 que so completamente no correlacionadas com 2 , seja por exemplo = 1 tal que 1 , = 21 A = 0, ento existem no mnimo correlaes cannicas entre 1 e 2 que so nulas. O facto de se ter 21 A = 0 implica as colunas linearmente independentes de A 1 satisfazem a relao (4.105), 2 11 12 1 21 = 0, para = 0, e consequentemente 22 existem (no mnimo) valores prprios em (6.19). Com efeito, o numero de correlaes cannicas nulas igual a 1 = 1 , onde = 21 . Baseado na amostra de observaes vectoriais, o teste de hiptese de que as ultimas 1 correlaes cannicas populacionais entre 1 e 2 so nulas dado por =
=+
(6.20)
138
6. Anlise Multivariada
O valor esperado envolvido na expresso acima pode ser expresso como (Reinsel, 1997)
() , () , = () () () + () ()
Onde
, = , ,
= , , = , = , , , () = , , , , A minimizao deste critrio um problema de regresso linear dos mnimos quadrados, multivariada normal. A matriz dos coeficientes que minimizam o critrio sero a soluo da equao vectorial de Yule-Walker de ordem m, () = , ,
, =
(6.21)
Tal como no caso univariado, para = 1, 2, , pode-se definir uma sequncia de matrizes , a que se deu o nome de matriz de autoregresso parcial (partial autoregression matrix) de ordem (ou lag) m, como a soluo para das equaes de Yule-Walker de ordem m, que resultam do ajustamento de um modelo AR de ordem m a uma srie (Reinsel, 1997). De forma similar ao caso univariado, segue-se que a sequncia de matrizes autoregressivas parciais , de ordem = 1, 2, , tem a importante qualidade caracterstica de que, se o processo de ordem p, ento = e = 0 para > . Consequentemente, as matrizes tem a propriedade de corte (cutoff) para um modelo AR(p), pelo esta propriedade pode verificar-se bastante til na identificao e especificao de uma estrutura AR pura para um processo multivariado. Contudo, ao contrrio do caso, os elementos das matrizes no so correlaes parciais como a funo de autocorrelao parcial (PACF) no caso univariado.
6. Anlise Multivariada
139
6.1.3 Construo do modelo inicial e estimativa dos mnimos quadrados para modelos vectoriais ARMA
Nesta seco discute-se algumas tcnicas para a especificao preliminar do modelo baseadas em estatsticas amostrais. So abordadas tcnicas como estimativa dos mnimos quadrados e respectivos testes de hiptese associados. So ainda explorados alguns mtodos adicionais para a especificao inicial e seleco de uma estrutura ARMA apropriada, tais como a utilizao do mtodo das correlaes cannicas e critrios de seleco de modelos tais como AIC e BIC.
A estimativa amostral das matriz de covarincia cruzada da lag , , dada pela matriz de covarincia amostral da lag , definida por = =
,
=
= , , ,
(6.22)
com = (ver seco 6.1.1.1). No caso particular da lag zero, tem-se que a matriz de covarincia cruzada = = corresponde matriz de = covarincia amostral de . Assim, o elemento (, ) da matriz dado por
= =
, = , ,
(6.23)
Para uma serie estacionria, os so estimativas amostrais dos valores tericos de ; que so particularmente teis na especificao do modelo para um processo vectorial mdia mvel de baixa ordem, uma vez que um processo MA(q) tem a propriedade de que = para > .
140
6. Anlise Multivariada
Em termos de propriedades assimptticas de correlaes amostrais, salientas o seguinte caso que estrema importncia na anlise dos resduos: suponha-se que um processo vectorial rudo branco, com matriz de covarincia e matriz de correlao 0 , tal que = para 0, ento tem-se (Reinsel, 1997)
= tem matriz de covarincia aproximada dada por onde = e = Onde = , , .. Consequentemente, substituindo pela respectiva
Segue assimptoticamente uma distribuio 2 com 2 graus de liberdade para > na codio de um modelo AR(p) (Reinsel, 1997). Esta estatstica pode ser utilizada como estatstica de teste para testar um modelo AR(p), ou seja, para testar se = num modelo de ordem > . Um teste equivalente o chamado LR teste (likelihood ratio test) para : = . Esta estatstica LR formulada em termos da razo = 1 como log , com uma verso mais precisa para amostras finitas dada por = , Onde =
= +1 .
6. Anlise Multivariada
141
=
=
+ = () +
Onde se definiu =
, , e () = , , .
= +
=
+ = +
Com = , , , e = , , , .
Definindo-se 1. Uma matriz de dados = + , + , , = 2. = + , + , , 3. Uma matriz de dimenso + 1 , , , , = + 1, , cujas linhas tpicas so , = de dimenso com
Ento tem-se = + , que tem a forma geral de um modelo linear multivariado com = observaes. Segue-se que o estimador dos mnimos quadrados (LS Least Square, ou LSE - Least Square Estimator) dos parmetros AR so dados por = () = , ,
(6.24)
, ,
= + 1, ,
= 1
= +1
= + 1 onde =
= +1
142
6. Anlise Multivariada
o vector dos resduos. Este estimador dos mnimos quadrados tambm um estimador de mxima verosimilhana (ML Maximum Likelihood), no pressuposto de uma distribuio normal. Para um modelo AR de ordem genrica, o estimador dos mnimos quadrados (LSE) tem aproximadamente tem aproximadamente as mesmas propriedades distributivas que o estimador dos mnimos quadrados para um modelo linear multivariado normal. Consequentemente, para um modelo estacionrio AR(m), a distribuio de () aproximadamente normal multivariada com vector mdia () e matriz de covarincia que consistentemente estimada por
em que = () (Reinsel, 1997). A determinao da ordem p apropriada do modelo autoregressivo (AR) pode ser baseada na utilizao aproximada do teste LR (Likelihood Ratio Test) descrito atrs. Por exemplo, quando se pretende testar a significncia da matriz AR de m-sima ordem, a hiptese nula 0 : m = 0 contra a hiptese alternativa 0 : 0. A estatstica de teste ser dada pela estatstica LR = , =
(6.25)
onde a matriz de soma dos quadrados dos resduos obtida do ajustamento de um modelo AR de ordem 1 para o mesmo conjunto de N observaes utilizadas no ajustamento do modelo AR(m) (Box, Jenkins, & Reinsel, 2008) (Reinsel, 1997). Para valores elevados de N, quando m = 0 verdadeiro, tem-se que segue aproximadamente uma distribuio , e rejeita-se a hiptese nula para valores elevados de . Consequentemente, o procedimento consiste em ajustar sucessivamente modelos AR de ordens superiores srie, e para cada ordem, testar sucessivamente a significncia da ltima matriz coeficiente includa no modelo.
6. Anlise Multivariada
143
O processo Estas matrizes devero ter um comportamento semelhante a um processo rudo branco. De notar que para qualquer processo misto VARMA, pode ter que se recorrer a ajustamento autoregressivos de ordem bastante elevada antes de se conseguir um modelo que se parea apropriado. Contudo, apesar dos actuais recursos computacionais, no sero desejveis modelos finais de ordem muito elevada. Nesses casos, deve-se inspeccionar o modelo de correlao dos resduos aps ajustamentos AR de baixa ordem, com a possibilidade de detectar modelos mistos ARMA de baixa ordem que se verifiquem apropriados e simultaneamente reduzam o numero de parmetros relativamente a um modelo AR puro. Critrios de seleco de ordem para especificao de modelos Das abordagens estudadas pode-se concluir que o teste LR associado anlise da correlao cannica parcial podero ser bastante teis para a determinao global da ordem AR nos casos em que um modelo de baixa ordem se verifique apropriado ao processo. Em situaes mais complicadas, deve-se considerar modelos mistos ARMA que devero posteriormente ser estimados recorrendo estimativa de mxima verosimilhana. H contudo a necessidade da determinao preliminar de uma adequada ordem (baixa) do modelo misto ARMA que se adeqe s sries. Tal como no caso univariado, existem vrios critrios, tais como AIC,BIC e FPE que normalmente podem ser teis para a determinao das estruras de modelos mais apropriadas. O critrio AIC (normalizado po ) dado por (Ltkepohl, 2007), (Reinsel, 1997) , = + + +
(6.26)
onde o numero de parmetros estimados por mxima verosimilhana para um modelo VARMA, e a correspondente matriz de covarincia estimada dos resduos. O critrio BIC tem uma forma similar = +
(6.27)
O critrio BIC penaliza mais o numero de parmetros utilizado no modelo que o critrio AIC. Um critrio similar que est entre os dois anteriores dado por = +
(6.28)
O critrio FPE (Final Prediction Error) para seleco do modelo VAR(m) dado por = + onde =
(6.29)
144
6. Anlise Multivariada
Estes critrios de seleco de modelo so utilizados para comparar vrios modelos ajustados por mxima verosimilhana srie de dados, de modo a que se escolha o modelo que apresente valores mnimos para cada critrio (Reinsel, 1997).
Onde = 1 , , k , e o = 1t , , kt so independentes e tem distribuio normal 0, , tal que = . Dadas observaes , , e , , , define-se a matriz de dados = , , de dimenso , a matriz = , , de dimenso , e a matriz = , , de dimenso . Neste caso, o estimador de mxima verosimilhana (MLE Maximum Lilekihood Estimator) de o mesmo que o estimador dos mnimos quadrados (LS), e que dado por = Ou seja =
(6.30)
= , ,
Onde = 1 , , a i-sima coluna de . O estimador para a matriz de covarincia do erro dado por =
(6.31)
(Reinsel,
Um modo bastante conveniente de lidar com regresso linear multivariada principalmente quando se impem restries nos parmetros, transformar o modelo linear multivariado na forma de modelo univariado. Partindo da matriz = , , definida acima, define-se = = , , e = = , , onde a i-sima coluna de . Relembrando as propriedades relacionadas com o operador vec, tem-se que se = , ento = = (), e tambm que = .
6. Anlise Multivariada
145
Da expresso linear = + , tem-se que = = + = + onde obviamente = . De notar que = = ou seja , = , onde o elemento (i,j) de . O modelo assim definido tem a forma do modelo de regresso linear univariado geral, ento o estimador de mxima verosimilhana de (MLE) o mesmo que o estimador dos mnimos quadrados generalizado (Reinsel, 1997) =
Tem-se ento que = , = , , um estimador dos mnimos quadrados para cada i. a estimativa de obtida por este mtodo tem distribuio normal multivariada com mdia = e covarincia = =
ou seja, i = e , =
Na estimao de parmetros, normalmente torna-se necessrio restringir alguns parmetros, ou porque o valor deles conhecido, por exemplo em modelos mistos determinstico/estocstico, ou porque os seus valores no so significativos, e portanto sero nulos. Consequentemente, aos estimar-se os valores dos parmetros do modelo a ajustar, essas restries tem de ser impostas. Considere-se o modelo linear, seguindo a notao de (Ltkepohl, 2007) = + , , + que pode ser escrito na forma compacta = + onde
(6.32)
146
6. Anlise Multivariada
= , , = , , = , , , = , , Em que cada coluna de composta por + Define-se ento uma restrio linear para na forma = = +
(6.33)
Onde = um vector de dimenso + 1 1, uma matriz conhecida de dimenso + 1 de rank , um vector no restrito de dimenso 1 dos parmetros desconhecidos e r um vector de dimenso + 1 1 de constantes conhecidas. Todas as restries lineares de interesse podem ser escritas nesta forma. Por exemplo, a restrio = 0 pode ser escrita na forma (6.33) escolhendo = 2 1 + , = , = , , ,
e = 0. Mais genericamente, concluindo-se que o i-simo elemento do vector no significativo, e portanto nulo, para construir esta restrio, procede-se do seguinte modo: 1. Define-se a matriz a partir de uma matriz identidade + 1 + 1 , em que a i-sima coluna foi retirada,
+
de dimenso
2. Define-se o vector a partir do vector em que o i-simo elemento foi retirado 3. Define-se = 0. A representao (6.33) permite impor as restries pela simples reparametrizao do modelo original. Aplicando o operador a (6.32) e substituindo por + tem-se = = + () = + + ou = +
(6.34)
onde = e = (). Esta forma de modelo permite derivar permite derivar estimadores e respectivas propriedades tal como nos modelos originais no restitos (Ltkepohl, 2007).
6. Anlise Multivariada
147
Estimativa GLS (generalized LS) e EGLS (estimated GLS) Denotando por a matriz de covarincia de , o vector de parmetros que minimiza
= =
(6.35)
= +
(6.36)
Este estimador conhecido como estimador dos mnimos quadrados generalizados (GLS Generalized Seast Square) porque minimiza a soma dos erros quadrados generalizados em vez da soma dos erros quadrados , e geralmente assimptoticamente mais que o estimador dos mnimos quadrados multivariado. Sob o pressuposto da normalidade dos dados o estimador GLS equivalente ao estimador da mxima verosimilhana. Segundo (Ltkepohl, 2007, p. 196), nas condies de que um processo de dimenso estvel VAR(p), estacionrio, e rudo branco independente com quartos momentos limitados. Se = = + como em (6.33) com rank de igual a , ento o vector dada por (6.36) um estimador consistente de e
,
(6.37)
onde significa que converge em distribuio para e = igual ao limite de probabilidade . A determinao do estimador requer o conhecimento de matriz de covarincia que normalmente desconhecia, pelo ter que ser substituda por uma estimativa. Recorrendose a um estimador consistente de para substituir em (6.36) um estimador EGLS (Estimated GLS) =
Que tem as mesmas propriedades assimptticas que o estimador Um estimador consistente de pode ser determinado atravs da expresso (Ltkepohl, 2007) = =
(6.38)
148
6. Anlise Multivariada
Onde se utilizou a igualdade = que o estimador dos mnimos quadrados (LS) multivariado no restrito das matrizes coeficiente . Uma hiptese alternativa consiste em determinar num primeiro passo um estimador dos mnimos quadrados (LS) que minimize com respeito a , que obviamanete ser dado por =
=
=
(6.39)
Baseada numa amostra de observaes vectoriais , = 1, 2, , . A abordagem de mxima verosimilhana condicional baseia-se na suposio de que as observaes iniciais , , . .. , + esto tambm disponveis (por convenincia de notao) e so consideradas como fixas, utiliza-se ainda a aproximao para os distrbios iniciais 0 = 1 = = +1 = 0, pelo que ser o numero efectivo de observaes. Assume-se, como costume, que os so independentes e normalmente distribudos com mdia zero e matriz de covarincia no singular . Define-se as matrizes = , , e = , , , com a notao = , , e = , , . Deste modo, o modelo pode ser expresso na forma
=
=
(6.40)
Recorrendo novamente ao operador vec e relao = (), o modelo poder ser expresso em forma de vector. Defina-se os vectores = = , ,
6. Anlise Multivariada
149
= 1, , = 1, ,
=
=
(6.41)
ou na forma
=
=
(6.42)
Introduz-se a matriz de atraso ou desfasagem , que composta por uns na subdiagonal imediatamente a seguir diagonal principal e zeros nos restantes stios. Considerando os valores iniciais de iguais a zero, o parmetro do segundo membro de (6.42) pode ser substitudo por = , , , , , e consequentemente, o termo e em (6.41) fica na forma = , , , , , . Das formas (6.42) e (6.41) obtm-se a relao
=
=
=
= =
(6.43)
Onde se definiu =
resduos , ou seja, ~ , , a funo de mxima verosimilhana (condicional) pode ser escrita na forma (Reinsel, 1997) (ver expresso (6.31), tomando-se o logaritmo) =
(6.44)
= e, com = , ,
150
6. Anlise Multivariada
Para se determinar as equaes de mxima verosimilhana tem que se maximizar a funo de mxima verosimilhana (6.44) com respeito aos parmetros , e . Para , fixos, a maximizao com respeito a dada por =
=
=
onde = = . As derivadas parciais de com respeito a e a so dadas por = 1 e (6.43) se tem (Reinsel, 1997) =
1 , pelo que, de
, , , , ,
Deste modo, estas derivadas podem ser expressas conjuntamente, numa forma mais conveniente = =
(6.45)
=
=
No caso de se ter q=0, ou seja, no caso de se ter um processo autoregressivo AR(p) puro com = , tem-se que = () na notao de 6.1.3 com () = , , e = , onde = , , . Ento a funo de mxima verosimilhana simplificase ganhando a forma
6. Anlise Multivariada
151
= = = Que conduz estimativa de mxima verosimilhana condicional de um modelo AR(p) dada por =
Que o mesmo estimador que o estimador dos mnimos quadrados. Como j foi referido diversas vezes, inclusive na abordagem a sistemas univariados, para > 0, as equaes de mxima verosimilhana, neste caso as equaes (6.45), so altamente no lineares nos parmetros , pelo que tem de ser resolvidas com recurso a procedimentos numricos iterativos tais como o mtodo Newton-Raphson cujas equaes para um estimador de mxima verosimilhana (aproximado) para so (Reinsel, 1997) =
(6.46)
onde uma estimativa inicial de e a estimativa de , necessria em (6.45) pode-se obter a partir da iterao anterior por = . Determinao iterativa da estimativa condicional MLE Para implementar o mtodo iterativo Newton-Raphson (6.46), seria til encontrar uma expresso conveniente para a matriz Hessiana de segundas derivadas parciais. Desprezando os termos de menor ordem que dividem por , uma vez que tendem para zero quando tende para infinito, obtm-se uma aproximao para a Hessiana =
(6.47)
Esta aproximao implica a negligncia de termos que tem a forma de produto interno do vector com as linhas das matrizes das derivadas de com respeito ao parmetro . Esses termos tem a forma de soma termos cruzados de e t s, multiplicados por combinaes desfasadas de e t s que convergem para zero em probabilidade quando divididos por T, devido ao facto de os termos desfasados de e t s serem independentes do valor corrente de t (Reinsel, 1997). O mtodo numrico iterativo pode ser implementado a partir da expresso (6.46) = +
152
6. Anlise Multivariada
A estimativa inicial pode ser obtida, por exemplo, recorrendo estimativa dos mnimos quadrados = , , , , ,
= , , , , ,
=
=
= 1
=
Recorrendo s equaes (6.45) e (6.47), as equaes modificadas de Newton-Raphson para tem uma soluo da forma = +
0 ,
e substituindo na expresso
(6.48)
Com 0 = 1 = = +1 = 0. Na prtica, o procedimento iterativo (6-4) pode ter que ser modificado em certas alturas, por exemplo, pela introduo de um factor de ajustamento de escala do vector de incremento no membro direito de (6.48) para evitar a sada da zona de convergncia e garantir o incremento da funo, ou seja, que decresa em cada iterao. Ou seja, na j-sima iterao, a estimativa dever ser
= +
onde o factor de escala. Outro problema que pode ocorrer que o operador MA estimado pode no ser invertvel em determinadas iteraes, ou seja = 0 pode ter algumas razes menores ou iguais a um em valor absoluto, pelo que este operador poder te que ser ajustado (Reinsel, 1997).
6. Anlise Multivariada
153
Quanto distribuio assimpttica do estimador MLE de , de acordo com (Reinsel, 1997), verifica-se que
quando
(6.49)
quando
(6.50)
No caso de existirem restries lineares, o estimador ML pode ser determinado atravs de iteraes pelo mtodo Newton-Raphson modificado similar a (6.48) dado por = +
(6.51)
onde = 1 Y e 0 a estimativa de da iterao anterior. Igualmente de forma similar, as propriedade assimptticas so dadas por = =
(6.52)
154
6. Anlise Multivariada
um modelo autoregressivo puro de ordem suficientemente alta . A ordem do modelo autoregressivo aproximado pode ser escolhida recorrendo a critrios de seleco tais como o AIC, por exemplo, que sugere um valor de m para o qual o valor da funo + minimizado. Com base no modelo seleccionado, AR( ) determinam-se os resduos =
=
, com = + , , . Num
segundo estdio do procedimento faz-se a regresso linear de em , , e , , para vrios valores de e . Ou seja, estimam-se modelos da forma
=
=
+
=
(6.53)
por regresso linear dos mnimos quadrados e determina-se a estimativa da matriz de covarincia dos erros com base nos resduos obtidos atravs da expresso anterior. Ento, pela aplicao do critrio BIC, a ordem (p,q) do modelo VARMA determinada com base na no resultado que minimiza a funo , + + . O modelo obtido servir de base para a primeira iterao do procedimento iterativo da estimativa de mxima verosimilhana descrito acima. O modelo pode subsequentemente ser validado recorrendo anlise de resduos. A vantagem do procedimento que a determinao da estimativa de mxima verosimilhana bastante pesada em termos computacionais para se experimentar uma larga gama se valores de p e q por esse mtodo. Adicionalmente, os parmetros obtidos pelo mtodo dos mnimos quadrados so geralmente excelentes valores de partida para as iteraes de mxima verosimilhana.
?
Out
In
Os testes de normalidade multivariada utilizados neste trabalho so baseados nos terceiros e quartos momentos centrados da distribuio normal. Se uma varivel aleatria univariada com distribuio normal estandardizada, (0,1), os seus terceiro e quarto
6. Anlise Multivariada
155
momento so dados por 3 = 0 e 4 = 3. Seja um processo rudo branco de dimenso com , e seja uma matriz que satisfaz a relao = . pode ser obtida por exemplo por uma decomposio de Choleski de . Ento = , , = , Ou seja, os componentes de so variveis aleatrias independentes que seguem uma distribuio normal estandardizada. Consequentemente tem-se que
= =
(6.54)
Este resultado ser utilizado na validao da normalidade de processos rudo branco. Para construir o teste, assume-se de que se dispe das observaes 1 , , , a partir das quais se define =
e uma matriz para a qual = e tal que o limite de probabilidade de zero. Define-se ainda = , , = , ,
= ,
= , ,
= , ,
(6.55)
= , ,
= , ,
(6.56)
Deste modo, 1 e so estimadores dos vectores (6.54). Aps estas definies, se rudo branco Gaussiano com matriz de covarincia no singular e valor esperado , , , ento verifica-se que (Ltkepohl, 2007) ,
(6.57)
156
6. Anlise Multivariada
= e =
(6.58)
(6.59)
(6.60)
(6.61)
Adicionalmente tem-se = +
(6.62)
Que pode ser utilizada para um teste conjunto de (6.60) e (6.61). Matrizes de correlao dos resduos Um teste global para determinar a adequao do modelo obtido, por MLE ou LSE, pode ser feito com recurso anlise das matrizes de autocorrelao dos resduos. Uma vez estimados os parmetros de um modelo ARMA(p,q), os resduos podem ser determinados atravs da expresso
=
=
+
=
= , ,
Os elementos individuais das matrizes de correlao e possveis padres devero ser avaliados no sentido em que os resduos devem ter um comportamento de acordo com um processo rudo branco. Os limites de dois desvios padro, 2 podero ser utilizados para garantir a significncia dos das correlaes residuais individuais. Adicionalmente, pode-se aplicar um teste global de ajustamento a uma sequncia de matrizes de correlao residual, teste de portmanteau dado por (Isermann, 1989)
= = =
=
=
(6.63)
6. Anlise Multivariada
157
ou equivalentemente por
(6.64)
De acordo com a hiptese nula em que o processo segue um processo VARMA(p,q), a estatstica de teste tem distribuio aproximada 2 com 2 graus de liberdade. Consequentemente, o modelo rejeitado para grandes valores de s . A distribuio aproximada valida no pressuposto de que suficientemente grande de modo a que as matrizes da representao MA infinita para o modelo ARMA so insignificantes para > .
6.1.5 Modelos de cointegrao e de rank reduzido 6.1.5.1 Modelos de rank reduzido e anlise de correlao cannica parcial
Nesta seco considera-se modelos autoregressivos multivariados AR(p), que podero ser representados por uma estrutura de rank reduzido nos seus coeficientes matriciais j . Mais especificamente, considera-se modelos AR(p) do tipo
=
=
+ +
(6.65)
Neste modelo assume-se que as matrizes tm uma estrutura particular de rank reduzido tal que = +1 = +1 com = 1, 2, , 1. Deste modo, os podem ser representados na forma = , onde e so matrizes de dimenso e respectivamente. Assim a equao anterior pode ser escrita na forma
=
=
+ +
Estes modelos podem resultar em parametrizaes mais parcimoniosas, estruturas mais detalhadas e possivelmente simplificadas, e possivelmente em interpretaes mais teis e interessantes no que diz respeito s inter-relaes entre as sries temporais. Para se obter a informao sobre o rank das matrizes nestes modelos, recorre-se normalmente anlise das correlaes cannicas parciais. Uma das consequncias fundamentais destes modelos que existiro no mnimo correlaes cannicas parciais nulas entre e , dado 1 , , +1 . Ou seja, pode-se determinar uma matriz de dimenso cujas linhas so linearmente independentes tal que = e, consequentemente, = para > . Assim, recorrendo-se anlise das correlaes cannicas parciais para vrios valores de = 1, 2, pode-se identificar a estrutura do rank para o modelo, bem como a ordem global p do modelo AR(p).
158
6. Anlise Multivariada
A estatstica de teste que pode ser utilizada para (por tentativa) especificar o rank dada por
, =
= +
(6.66)
Para = 1, 2, , , onde 1 1 2 0 so as estimativas amostrais das correlaes cannicas parciais entre e , dado 1 , , +1 (ver seco 6.1.2.4). Nas condies de hiptese nula de que dentro da estrutura de modelo de rank reduzido encadeado, a estatstica , tem distribuio assimpttica 2 com 2 graus de liberdade (Reinsel, 1997). Assim, se o valor da estatstica de teste no demasiado grande no se deve rejeitar a hiptese nula.
=
=
= +
=
Perante um processo AR(p), descrito por = , ao colocar-se a hiptese de que o processo no estacionrio e que ter de ser diferenciado a fim de se obter um processo estacionrio, corresponde a colocar-se a hiptese de que = 1 , em que um operador autoregressivo estacionrio de ordem 1. Nesse caso ter-se-
= =
=
Fazer o teste de que tem uma raiz unitria equivalente a colocar a hiptese de que = 1 para o modelo = 1 = 0 para o modelo
=
=
=
De facto, definindo = 1 , fcil de verificar que qualquer modelo AR(p) = + pode ser expresso na forma equivalente =1
6. Anlise Multivariada
159
= +
=
+ = +1 ,
onde 1 = 1 =
=1
1 e =
quadrados obtidos pela regresso de em 1 , 1 , , +1 . Ento, sob a hiptese de um modelo de raiz unitria onde = 1 e de que o processo = 1 estacionrio, tem-se que 1 dada pela expresso
1 =1
2 =+1 1
1 2
Processo dinmico
Yt Sada (output)
160
6. Anlise Multivariada
=
=
(6.67)
Onde so as matrizes coeficiente de dimenso correspondentes resposta ao impulso e um vector de rudo de dimenso . Para se ter uma ideia mais intuitiva da natureza das matrizes , suponha-se que o processo se encontra no estado estacionrio com todas as entradas e sadas inicialmente a zero. Aplicando-se um pulso unitrio no instante zero na varivel de entrada : () = () = > 0
Seja a sequncia de respostas da sada dadas por , , , Tal que o vector das respostas de todas as sadas no instante , , ,
Pode-se ento construir uma matriz que, no instante , mostre como cada varivel de sada responde a cada impulso unitrio de cada varivel de entrada =
A matriz um vector de rudo de dimenso que se assume poder ser representado por um processo ARMA, = . A varivel exgena pode ser constituda por variveis estocsticas e/ou determinsticas ou mesmo incluir variveis com padro sazonal. De notar que a expresso (6.67) pode ser vista como generalizao para a anlise multivariada da funo de transferncia Box-Jenkis. Outro modelo, com maior relevncia neste trabalho, com variveis de entrada exgenas o denominado modelo vectorial ARMAX, ou modelo VARMAX. Esta forma pode ser determinada a partir d a expresso (6.67) assumindo que o operador da funo de transferncia = pode ser representado na forma racional = =
onde =
de ordem s e
de dimenso . Por convenincia assume-se que o factor em o mesmo que o factor autoregressivo no modelo para as perturbaes , ou seja, considera-se dinmicas idnticas para o sistema e para as perturbaes. Deste modo, o modelo ARMAX pode ser expresso na forma
so matrizes
=
=
+
=
(6.68)
6. Anlise Multivariada
161
Esta expresso tambm pode ser escrita noutra forma em que envolve uma matriz coeficiente (triangular inferior) para ou na lag zero, reflectindo assim ligaes instantneas entre as variveis endgena. Estas formas so normalmente referidas como modelo de equaes dinmicas simultneas (dynamic simultaneous equations model). De forma similar aos modelos vectoriais (ou multivariados) ARMA, o modelo ARMAX (6.68) diz-se estvel se todas as razes de = 0 so todas maiores que um em valor absoluto. Nessas condies, se a srie de entrada um processo estacionrio, bem como , ento a sada ser estacionria. O processo ter ento uma representao convergente dada por
= + =
=
+
=
(6.69)
onde =
= .
representam os efeitos que as alteraes nas variveis de entrada provocam nas variveis de sada nas vrias lags de tempo e so conhecidas como matrizes resposta ao impulso. O ganho total do sistema dinmico, ou ganho estacionrio, dado pelos elementos da matriz resposta ao degrau unitrio = 1 = . =0
=
=
(6.70)
onde, por convenincia, se assume que e so processos rudo brando independentes. Nestas condies, a melhor previso (matriz MSE mnima) perodos frente de + , com base na informao disponvel no instante t ser
162
6. Anlise Multivariada
() = + , , , , , A previso ptima perodos frente pode ser expressa atravs da expresso recursiva (Reinsel, 1997)
=
=
+
=
(6.71)
Para = 1, , e
=
=
+
=
>
=
=
Quando esta propriedade se verifica diz-se que no causa ou que no existe feedback de para . Outra forma de obter previses para o modelo ARMAX combinar as variveis exgenas com as variveis endgenas numa nica varivel vectorial = , e a partir dela definir um processo ARMA. De (6.68) e (6.70) verifica-se que satisfaz o modelo ARMA =
(6.73)
Multiplicando tudo pela matriz inversa da lag zero, obtm-se um processo ARMA multivariado na forma standard. A caracterstica bsica deste modelo que ambos os operadores MA e AR so compostos por matrizes bloco - triangulares inferiores. Este facto reflecte a caracterstica exgena das variveis e a no causalidade de para . Se = 0 em (6.68) e (6.70), e consequentemente em (6.73), as variveis e dizem-se 0 instantaneamente no causal, e ento tem-se + , + , , , , , , + , , , , , ,
6. Anlise Multivariada
163
(6.74)
=
=
+
=
(6.75)
Em que se definiu
=
=
() =
=
+ +
=
Pelo que = + ()
=
=
+ +
=
+
=
+ +
=
=
=
+ +
=
Relembrando que = = , = = e que = 0 tem-se que a matriz MSE dos erros de previso perodos frente ser dada por
=
=
+
=
(6.76)
164
6. Anlise Multivariada
Noutras ocasies, ou mesmo dentro do mesmo processo, futuros valores de podem ser previamente conhecidos, por exemplo, variveis manipulveis em que o nvel da varivel pode-se altera de forma determinstica e instantnea, ou outra variveis, que apesar de no serem manipulveis, ou seu valor de alguma forma conhecido. Nesses casos pode-se estar interessados em prever futuros valores de condicional aos valores futuros da varivel exgena e na matriz MSE dos erros de previso. Do modelo ARMAX (6.68) conclui-se facilmente que a previso ptima () de + , condicionada s informaes passadas e tambm ao conhecimento futuro dos valores + , , + satisfaz a relao
=
=
+
=
+
=
(6.77)
Para = 1, , e
=
=
+
=
>
Em que obviamente + para . Da representao MA de ordem infinita (6.69) tem-se que a previso associada expresso (6.77) pode tambm ser determinada a partir da expresso
() =
=
+
=
= + =
=
tem-se ento que a matriz MSE dos erros de previso condicional perodos frente de ser dada por
=
=
(6.78)
Comparando as duas expresses, (6.76) e (6.78), verifica-se que dado por esta ultima expresso igual ao segundo termo da expresso (6.76). Este termo corresponde aos erros de previso devido componente MA do modelo ARMAX, ao passo que primeiro termo do segundo membros de (6.76) correspondente ao erro na previso de valores futuros da varivel exgena.
6. Anlise Multivariada
165
(6.79)
onde significa o valor esperado condicionado informao obtida at ao instante t, e + e + so matrizes no negativas definidas que aplicam as ponderaes relativas aos desvios + 0 + e + + em relao aos valores alvo das respostas e das variveis manipuladas, respectivamente. Para determinar a leis de controlo, conveniente separar os dados conhecidos no instante dos dados desconhecidos. Pelo que o modelo ARMAX (6.68) pode ser simplesmente como + = + + + + +
=1 =1
(6.80)
Onde = , =
+1 =
=1 +1
+1 so as componentes de
+1 que contm as variveis j determinadas no instante t e +1 um termo adicional que contm alguns aspectos de futuras variveis exgenas no manipuladas, cujos valores se assumem conhecidos. Substituindo a expresso anterior na funo de custo, tem-se, aps substituio de +1 do respectivo valor esperado
166
6. Anlise Multivariada
+ + + + + + + + +
+ + +
+ + +
(6.81)
Para minimizar a funo de custo, procede-se sua diferenciao em ordem a +1 e iguala-se a zero, obtendo-se (Reinsel, 1997) = + + + + + + + + + + Que resulta no valor ptimo das variveis de controlo = + + + +
+ + + + + +
(6.82)
Este resultado pode ser generalizado para os casos em que a resposta do sistema no instantnea como no caso estudado, ou seja, quando h um atraso > 0 na resposta em relao aco de controlo . Isto , assume-se que o modelo ARMAX (6.68) pode ser dado por
=
=
+ +
=
+
=
O valor de +1 no influencia a sada antes do instante + + 1, de modo a que no instante , o problema de controlo determinar o valor de de +1 que minimize +
= ++ ++ ++ + + + + + + + +
Neste caso, considera-se a previso ( + 1) perodos frente de ++ condicional informao existente no instante . Pelo que, seguindo o mesmo raciocnio descrito atrs, a equao de controlo ptimo dada por (Reinsel, 1997) = ++ + + +
++ ++ + + + +
(6.83)
A expresso (6.79), com ligeiras alteraes, mas sem perca de objectividade poder ser escrita numa forma mais intuitiva = + + +
(6.84)
Olhando para as duas expresses, verifica-se que no ltimo caso, as ponderaes so constantes (invariantes no tempo) e que o processo pressupe-se instantaneamente no causal. Em termos de implementao, no existem grandes dificuldades em passar de uma expresso para a outra. Contudo, olhando para a ltima expresso e para a expresso (5.15), verifica-se que as semelhanas so evidentes, pelo que esta expresso conhecida como a verso multivariada do ndice de performance de Clarke e Gawthrop (Del Castillo, An adaptative run-to-run optimizing controller for linear and nonlinear semicndutor processes, 1998).
6. Anlise Multivariada
167
Decompondo as variveis exgenas nos trs tipos admissveis, denominando 1 como as variveis exgenas cujos nveis so conhecidos mas que no so passveis de alterao ou manipulao; X2 como as variveis exgenas que se podem manipular com a finalidade de controlar as respostas do sistema; e como X3 as variveis exgenas cujos valores futuros tem que ser previstos, ou seja, variveis exgenas com dinmica; tem-se ento que pode ser definido pelo vector = 1 , 2 , 3 . Com estes pressupostos, um diagrama de blocos de uma possvel implementao do controlador Clarke e Gawthrop multivariado pode dado pela Figura 4-1
G Controlador
Processo
Figura 6-3 Possvel implementao de um sistema de controlo baseado no modelo ARMAX multivariado
, , ,
em que + + = o numero total de variveis exgenas. Admitindo que 3 representado por um processo ARMA dado pela expresso (6.70), ou mesmo por um sistema ARMAX em que as variveis 1 e 2 fazem o papel de variveis exgenas com a restrio de no apresentarem dinmica, ou seja, neste caso seria um sistema ARMAX apenas com variveis determinsticas ou previamente conhecidas. Ou seja, 3 dado por
=
=
+
=
Admitindo ainda, por questes de simplificao mas sem perda de generalidade, que o sistema (6.68) instantaneamente no causal, ou seja = 0. Nestas condies o sistema 0 ARMAX pode ser representado pelo modelo ARMA para a varivel dado por
168
6. Anlise Multivariada
=
=
(6.85)
onde = = =
Deste modo, os mtodos para especificao do modelo ARMAX so bastantes similares aos descritos previamente para o modelo ARMA, com a imposio das devidas restries. A anlise dos resduos til para validar a adequao do modelo especificado. A examinao da autocorrelao, em particular, bastante importante para validar o pressuposto do modelo de que um processo rudo branco. Outra verificao que importante fazer examinar a correlao cruzada entre valores do rudo do modelo ARMAX e os valores do rudo do modelo ARMA da varivel exgena . A existncia substancial de correlao cruzada entre e valores desfasados (lagged) de 0 , podero indiciar alguma inadequao na especificao da estrutura de desfasamentos para a varivel exgena no modelo ARMAX, que dever ser corrigida.
169
170
qualquer causa especial. Consequentemente, alguns dos processos que utilizam apenas o controlo por feedback, podem ser significativamente melhorados com a implementao conjunta de cartas de controlo para a monitorizao estatstica do processo. Este tipo de implementao por vezes referido como SPC algortmico (algoritmic SPC ou ASPC Algoritmic Statistical Process Control) (Vander Weil S. T., 1992). O controlo estatstico deve ser aplicado s variveis de entrada e s variveis de sada. Pontos fora dos limites de controlo devem identificar perodos onde os erros de controlo so grandes ou onde as aces de controlo so elevadas devido a compensaes excessivas devido a causas especiais, que deste modo podem ser detectadas. Esses perodos devero provavelmente constituir boas oportunidades para se proceder procura de causas especiais. De notar que o EPC tem como pressuposto a existncia de um modelo interno em que os resduos (desvios em relao referncia) seguem uma distribuio bem definida - 0, , pelo que qualquer alterao desta distribuio poder significar uma alterao do processo em relao ao modelo que se considerava adequado. A combinao do SPC/EPC poder ser implementada de acordo com o diagrama de blocos da Figura 7-1 (Montgomery D. C., 2001)
171
Quando se utiliza controlo contnuo por realimentao, normalmente assume-se a suposio tctica de que os custos envolvidos so apenas os custos de no conformidade (produto fora dos limites de especificao). No entanto, particularmente na produo discreta, tem que se contabilizar os custos adicionais inerentes aos procedimentos de amostragem e ajustamento.
7.1.1.1 Ajustamento condicionado para custos de ajustamento fixos com modelo de distrbios IMA(1,1)
A maioria dos processos na indstria de produo discreta so considerados processos responsivos, ou seja, o ajustamento efectuado tem efeito total imediato. Mas normalmente estes ajustamentos tem custos fixos inerentes, como por exemplo, ter que parar uma mquina e mudar uma ferramenta. Para estimar os custos de off target, pode recorrer-se uma funo quadrtica fcil de manipular matematicamente =
(7.1)
Onde o custo de off target e uma constante. Para esta funo de custo quadrtica, a minimizao do custo equivalente a minimizar o MMSE. A constante o custo do processo estar a uma unidade de distncia do valor de referncia para um perodo de tempo. Em geral, torna-se mais conveniente trabalhar, no com , mas com a constante normalizada = . Neste caso, o custo off target pode ser dado pela expresso
(7.2)
e o custo mdio de off target para um perodo por uma quantidade de . No pressuposto de que os distrbios podem ser modelados por um modelo IMA(1,1), o desvio padro que o processo exibe quando no existe limite para se proceder ao
172
ajustamento, ou seja, quando o valor de (distncia que limita a zona morta , + ) igual a zero = 0 (ver Figura 7-2) Se a funo de custo for quadrtica com um mnimo em T e assumindo-se conhecido, para se determinar a constante , apenas se necessita de um ponto adicional da curva de custo. (Taguchi, 1987) diz que para se obter um ponto adicional basta conhecer o desvio a partir do qual resulta a rejeio de todo o material produzido durante um perodo de amostragem com um custo de 0 , ou seja =
e consequentemente =
Para se construir uma carta de ajustamento limitado, necessrio conhecer-se o valor que tal que as linhas limites resultar no menor custo global (Figura 7-2). (Box & Luceo, 1997) apresenta uma tabela com valores de , do intervalo mdio entre ajustamentos (AAI) e de para vrios valores de = 2 , em que = 1 a constante de amortecimento. O erro quadrtico mdio do processo ajustado ento dado por 1 + 2 (Box & Luceo, 1997), ou seja, o incremento no desvio padro (ISD) ser dado por = 1 + 2 1 2 .
Zona de actuao
T+L
Zona de actuao
Figura 7-2 Limites de zona morta para cenrios de controlo de custo mnimo
173
qual se passou a chamar de intervalo unitrio, suponha-se ainda que exista a pretenso de reduzir a frequncia de amostragem por razes econmicas ou outras. Tal como no caso anterior, admite-se que o sistema responsivo (sem dinmica) e que os distrbios so aproximadamente modelados por uma srie IMA(1,1), que o custo off target ( ) proporcional ao erro quadrtico mdio, e que existe um custo de ajustamento fixo ( ). Introduz-se agora um terceiro custo ( ), o custo de amostragem. Devido dificuldade de determinar os trs custos envolvidos, , e , (Box & Luceo, 1997) baseado nas seguintes condies 1. O intervalo expresso em funo do intervalo unitrio; 2. O intervalo entre ajustamentos (AAI) tambm expresso em termos do intervalo unitrio; 3. A resultante percentagem de incremento no desvio padro (ISD) expressa em termos de ; fornece uma srie de bacos (Box & Luceo, 1997, pp. 221-222) para valores de = 0.1, 0.2, 0.3, 0.4, 0.5, 0.6 que permitem determinar o melhor valor de L para o cenrio em causa. Para cada valor de , os bacos do o valor do incremento do desvio padro (ISD) e o correspondente intervalo mdio entre ajustamentos (AAI) para vrios valores de e . Suponha-se que uma srie temporal (denomine-se por serie 1) , modelada por uma IMA com parmetro de no estacionaridade = 1 e gerada por um processo rudo branco com desvio padro = 1 , foi amostrada com a periodicidade de intervalos unitrios (ou seja de S em S intervalos da srie original) gerando assim uma serie S. Ento pode-se demonstrar (Box, Jenkins, & Reinsel, 2008) que a srie amostrada (serie S) pode tambm ser modelada por um IMA com parmetro tambm gerado por um processo rudo branco com desvio padro , e as relaes entre os parmetros da srie original (serie 1) e a srie amostrada (srie S) so = e = =
Para valores pretendidos de , e , os bacos fornecem valores de AAI e ISD subjacentes aos pressupostos de que os distrbios seguem um modelo IMA, o sistema responsivo e a funo de custo quadrtica. Nesta condies, para um dado , pode-se determinar os valores de e necessrios para produzir qualquer combinao de valores de ISD e AAI. Quando os custos podem ser estimados, os esquemas de ajustamento por feedback podem ser caracterizados directamente em termos dos custos normalizados , e , em vez dos indicadores AAI e ISD, recorrendo a bacos desenvolvidos por (Box G. E., 1992) e reproduzidos em (Box & Luceo, 1997, pp. 228-229). Atravs destes bacos possvel determinar aproximadamente o dos limites normalizados de zona morta = e o intervalo de amostragem em funo dos valores de , = 2 e = 2 .
174
Clculo numrico Os bacos, apesar de fornecerem normalmente aproximaes adequadas, no so particularmente fceis de ler. Alternativamente, as quantidades e que minimizam os custos esperados, podem ser determinadas a partir de um algoritmo de clculo numrico desenvolvido por (Luceo, Gonzalez, & Puig-Pey, 1996) e que foi implementado sobre a plataforma Visual C++ no mbito deste trabalho (Anexos 1 e 2).
Suponha-se ento que se tem um processo representado por um modelo ARMA(p,q) com esquematizado na Figura 7-3, dado por =
(7.3)
Onde so os dados observados e so variveis normais independentes e 2 identicamente distribudas com mdia zero e varincia . O modelo (7.3) denomina-se por modelo nulo. Suponha-se que existe uma mudana determinstica, que ser referida como uma falha, no processo no instante . Ento, a partir do instante , os dados do processo a serem observados podero ser representados pelo modelo = + onde indica a natureza da falha e a amplitude. Este modelo denomina-se por modelo com discrepncia. Por exemplo, a funo para uma alterao em degrau pode ser definida por
175
1 0
0 < 0
Assumindo-se que o modelo (7.3) invertvel, ento os resduos podem ser obtidos filtrando com o filtro inverso ()/(), ou seja = =
(7.4)
ou seja = + onde = denomina-se como sendo assinatura da falha. Deste modo, os 2 resduos esto no correlacionados com uma mdia variante com o tempo e varincia . O valor de depende do modelo ARMA e consequentemente da estrutura de autocorrelao dos dados. A informao contida na dinmica da assinatura da falha pode ser til na deteco da prpria falha. As cartas tradicionais no fazem uso desta informao, mas a carta de resultados acumulados CuScore (Cumulative Score) podem ter essa informao em conta. O objectivo do teste CuScore detectar alteraes nos parmetros de um modelo estatstico, que uma aplicao natural das cartas de controlo. A estatstica CuScore unilateral dada por = + , = , ,
(7.5)
onde e so respectivamente o detector e o valor de referncia. Se excede o intervalo de deciso, h, ento conclui-se que ocorreu uma falha no processo.
onde a observao e um qualquer parmetro do modelo. A estatstica Cuscore associada com o valor = 0
=
=
(7.7)
176
onde os valores (modelo nulo) obtm-se fazendo = 0 na equao (7.6) e em que o detector dado por =
=0
Consequentemente, a estatstica Cuscore pode ser vista como uma soma acumulada de produtos de resduos do modelo nulo com um detector apropriado . Do modelo com discrepncia (7.4) tem-se que = . Quando no existe nenhuma alterao, assume-se que = 0, pelo que o modelo nulo ser dado por = . Quando existe uma alterao, os resduos passam a ter mdia , pelo que deixam de ser rudo branco. Detectar a alterao equivalente a detectar a alterao de em relao sua mdia anterior (que era zero), ou mais precisamente, procurando nos resduos. O detector para detectar a alterao de em relao ao valor original que era zero = =
=0
O valor de =
=0
Deste modo, a estatstica Cuscore para monitorizar a mdia de um processo normalmente distribudo e autocorrelacionado
=
=
=
=
(7.8)
Onde = . Para implementao computacional, conveniente reescrever esta estatstica na forma recursiva = + Esta estatstica, contudo, no deve ser utilizada directamente. A razo que a maioria dos sistemas comeam com um longo perodo em que o processo no est controlado, durante o qual vagueia por zonas fora de controlo. Quando uma falha ocorre, pode no se situar exactamente numa situao de controlo. Pelo que deve ser substituda pela estatstica Cuscore unilateral (Shu, Apley, & Tsung, 2002) = + ,
177
178
Um controlador adaptativo pode consistir nas seguintes funes: 1. Identificao das caractersticas dinmicas do processo 2. Deciso baseada na identificao do processo 3. Modificao ou actuao baseada na deciso tomada
179
lineares para processos MIMO. No entanto, tm sido feitos alguns estudos em modelo no lineares. Se a superfcie da resposta real do processo for mais ou menos plana em toda a regio operacional, ento um controlador linear dever dar bons resultados. No entanto, os efeitos das no linearidades das variveis de entrada ajustveis na relao funcional e a dinmica de autocorrelao entre as sadas do processo ocorrem bastante frequentemente na produo de semicondutores. Para ultrapassar estas dificuldades, (del Castillo, 1996) apresentou um modelo de controlador auto-sintonizante derivado da filosofia dos controladores de varincia mnima para lidar com os processos de ganho puro mltiplo acoplados com complexos modelos de distrbio. Adicionalmente, implementou uma carta de controlo EWMA multivariada para monitorizar as sadas de controlo com a funo de adicionar uma zona morta ao controlador com o intuito de conjugar a variabilidade das sadas com a reduo das alteraes nas variveis de entrada. (Del Castillo & Yeh, 1998) props outro controlador MIMO R2R denominado de OAQC (Optimizing Adaptative Quality Controller) que era particularmente projectado para lidar com funes de transferncia no lineares.
< no
sim
Figura 7-4 Controlador OAQC com carta SPC actuando como zona morta
180
O sistema de controlo OAQC assume que o comportamento do processo com entradas e sadas pode ser modelado de acordo com uma funo de segunda ordem da forma = + + +
Onde = , 2 , i j
(7.9)
<
expanso quadrtica do vector das variveis de entrada, um vector de dimenso das caractersticas da qualidade, um vector de dimenso que contm os valores de offset, um vector de dimenso n dos factores controlveis, o vector que contm o ndice nos seus componentes e uma sequncia de rudo branco multivariado. Este modelo suficientemente geral para permitir a modelao da maior parte dos distrbios e no linearidades aproximadas que parecem ocorrer nas aplicaes de controlo R2R para os processos de produo de semicondutores. O modelo permite ainda alguma dinmica. Os parmetros , e so estimados on-line recorrendo a algoritmos dos mnimos quadrados recursivos (ver seco 4.3.3). Optimizao no linear A optimizao dos valores das variveis de entrada efectuada com recurso ao ndice de performance (funo objectivo - Figura 7-5) da verso multivariada do controlador de Clarke e Gawthrop um passo frente (seco 6.2.3) dado por = + + +
(7.10)
Que minimizado sujeito s restries na entrada e na sada: em que os vectores , , e so os valores que limitam as zonas de operao das entradas e sadas do processo. A optimizao de em ordem aos factores controlveis realizada com recurso ao clculo numrico atravs ao mtodo Penalty-Barrier". O termo Barrier aplicado s variveis de entrada e garante uma soluo com os valores dentro dos limites. Carta EWMA multivariada Uma carta EWMA (carta de mdias moveis exponencialmente amortecidas) (Lowry, Woodall, Champ, & Rigdon, 1992) adicionada ao anel de controlo com a dupla funo de reduzir a variabilidade das variveis de entrada ou monitorizar as sadas do processo. Actuando como limitadora de zona morta (Figura 7-2) implica que os parmetros do modelo interno do controlador e as variveis de entrada apenas sofrem alteraes quando detectada uma situao em que as sadas do processo se afastam significativamente dos valores de referncia, ou seja, caem fora dos limites da carta EWMA.
181
Actuando como monitor do vector mdia do processo, detecta situaes de alteraes da mdia do processo que controlador no consegue compensar. Estas situaes so normalmente provocadas pela saturao dos actuadores (variveis de entrada).
Funo Objectivo x 10 3.5 3 2.5 2 1.5 1 0.5 0 -1 -0.5 0 0.5 1 Platern speed 1 0.5 0 -0.5 -1
6
Figura 7-5 Exemplo de funo de custo de controlador R2R com varveis de entrada normalizadas
8. Desenvolvimentos Prticos
183
8 Desenvolvimentos Prticos
Ao contrrio de o que estava previsto na data da deciso da abordagem deste tema, no foi possvel fazer o trabalho de campo inerente a este tema. Esse facto ficou a dever-se basicamente ao prazo apertado para a elaborao deste trabalho, e dificuldade actual de identificar situaes reais com interesse de parte a parte na abordagem deste tema. Pelo que a soluo encontrada passou por executar este trabalho tendo por base dados reais, j existentes, referentes a um processo real de fluxo contnuo, disponveis num trabalho realizado anteriormente, dentro do mesmo mbito. Esse trabalho visou a integrao da metodologia do controlo estatstico do processo com engenharia de controlo no contexto de sistemas de produo de fluxo contnuo. Apesar da grande semelhana entre os dois temas, as abordagens so bastantes diferentes, com objectivos bastantes diferentes. Devido ao excelente trabalho feito no mbito do tratamento dos dados em bruto, esse tema no foi abordado neste trabalho, nem to pouco se mexeu nos dados herdados excepo de preencher alguns valores em falta na srie de dados referente sada do processo. Pelo exposto, e devido falta de contacto com o processo real, este processo foi tratado exactamente como se de uma caixa preta se tratasse, apesar de por vezes os dados indiciarem algumas caractersticas prprias que no foi possvel confirmar.
184
8. Desenvolvimentos Prticos
Hm Dn Gr
Variveis de sada As variveis de sada referem-se a trs das caractersticas da qualidade cujos nveis devem ser assegurados: - Visc - Ref - IM
Processo
Variveis de controlo
Visc Ref IM
Este seria o modelo ideal de processo a implementar, porque para alm de se tratar de um sistema MIMO, as variveis de entrada poderiam abranger os tipos existentes no modelo bsico terico (seco 6.2.4). Alm disso, a integrao do controlo estatstico poderia ser bastante til para monitorizar as variveis referentes matria-prima (tipo X1), e assim evitar uma medio contnua dessas variveis. Contudo este modelo no foi possvel implementar devido falta de dados referentes s caractersticas das varveis da matriaprima e s variveis de sada Ref e IM. Consequentemente, essas variveis foram retiradas do modelo base, resultando assim o denominado modelo de estudo composto pelas seis
8. Desenvolvimentos Prticos
185
variveis de controlo e uma varivel de sada, resultando assim um modelo MISO (multiinput/single-output).
Processo
Visc
Os dados foram recolhidos com um perodo de amostragem de quatro horas, e o tempo mdio de processamento de cinco horas. As sries so constitudas por 248 observaes igualmente espaadas (ANEXO III) Dos dados disponveis verificou-se a falta de alguns valores na srie da varivel de sada, nomeadamente as observaes nmero 35, 63, 83 e 134. Essas lacunas formam preenchidas com o valor correspondente mdia entre a observao imediatamente anterior e a observao imediatamente posterior. Todo o trabalho de desenvolvimento prtico assenta nesta srie multivariada. Uma primeira anlise grosseira do comportamento do processo pode ser obtida atravs da visualizao dos grficos das sries envolvidas (ANEXO III). Pode ento verificar-se que se est perante sries estacionrias, pelo que primeira vista ser de excluir qualquer componente integrativa no modelo do processo. Para se ter uma ideia mais quantitativa das caractersticas do processo, determinaram-se
186
8. Desenvolvimentos Prticos
algumas estatsticas preliminares dos dados disponveis, que so apresentadas na Tabela 8.1.
Tabela 8.1 - Estatsticas preliminares
IS
LBC4
LBC8
TemC4
TemC5
Visc
De notar que, por questes de sigilo relativamente ao processo em causa, os valores referentes s variveis de entrada j se encontram centrados em zero, ou seja, os valores apresentados so as diferenas para a mdia. Antes de se prosseguir com a anlise de autocorrelao verificou-se a normalidade dos dados no sentido de averiguar a estabilidade do processo e a possibilidade de implementao de controlo estatstico sem ajustamento. A ferramenta utilizada nesta anlise foi o teste de Kolmogorov-Smirnov.
Tabela 8.2 - Teste Kolmogorov-Smirnov
AA
IS
LBC4
LBC8
TemC4
TemC5
Visc
P value D CV(5%) H
A primeira linha d o valor de percentagem correspondente ao valor da estatstica D (segunda linha) para cada uma das sries. A terceira linha apresenta os valores crticos para uma significncia de 5%. A quarta linha indica a hiptese que no se pode rejeitar, se a hiptese nula (valor 0) se a hiptese alternativa (valor 1). Da anlise da Tabela 8.2 pode ento concluir-se que as sries de entrada AA e IS no do indcios de no normalidade de dados, ao passo que as sries de entrada LBC4, LBC8 TemC4 e TemC5 indiciam claramente um comportamento no normal. Quanto serie de sada, para se ter uma ideia de aderncia dos dados a uma distribuio normal, construiu-se um grfico da distribuio emprica cumulativa (Figura 8-3). Numa anlise preliminar aos dados de sada pode ficar-se com a ideia de que se trata de um processo controlado. Para se ter uma ideia preliminar mais precisa sobre a necessidade de implementao de uma estratgia de controlo mais elaborada, no sentido de se tentar ajustar a mdia do processo e reduzir a sua variabilidade, era conveniente conhecer-se as especificaes do processo.
8. Desenvolvimentos Prticos
187
Varivel Saida: Visc
1 0.9 0.8 0.7 0.6 F(x) 0.5 0.4 0.3 0.2 0.1 0 -3 -2 -1 0 1 x 2 3 4 5
188
8. Desenvolvimentos Prticos
Outro facto que convm ser observado, que nem todas as variveis de entrada parecem ter influncia na sada, ou seja parece existirem variveis de entrada com as quais a varivel de sada no est correlacionada. Isso no quer dizer que a varivel de sada no depende dessa varivel, poder querer dizer que a varivel de sada no sensvel variao verificada nessa varivel de entrada. Este facto poder evidenciar uma boa afinao do processo. Como se pode verificar, no fcil tirar uma concluso, embora preliminar, sobre as ordens do modelo, embora evidencie a existncia da componente autoregressiva. Verifica-se assim que uma tcnica muito til para a anlise univariada torna-se pouco eficaz na anlise multivariada, pelo menos neste caso. Numa anlise puramente exploratria ajustou-se um modelo autoregressivo puro de 3 ordem sem qualquer restrio atravs do modelo de regresso linear como descrito no ponto 6.1.3.3 que se apresenta abaixo. Os valores entre parnteses correspondem aos respectivos desvios padro.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . .
8. Desenvolvimentos Prticos
189
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . . . . . . . . . .
. . . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
A matriz a matriz de covarincia dos resduos aps o ajustamento por este modelo VAR(3). Uma das caractersticas que as matrizes evidenciam que as seis primeiras linhas da stima coluna no so significativas ao nvel de dois desvios padro, pelo que estes valores devero ser nulos. Esse facto sugere que, ao contrrio da hiptese levantada anteriormente, que as variveis de entrada no so influenciadas pela varivel de sada, o que indicia a no existncia de controlo por realimentao. Outro concluso que se pode tirar da observao das matrizes e , que existem poucos coeficientes significativos o que indica que os componentes destas matrizes, caso se conclua que a ordem do modelo pelo menos 3, sero maioritariamente nulos.
190
8. Desenvolvimentos Prticos
Tabela 8.3 - Sumrio de resultados de ajustamento a modelo autoregressivo para diversa ordens
Estes resultados indicam que para um modelo AR puro, um modelo de segunda ordem ser talvez o mais indicado, embora no se excluam as hipteses de primeira e terceira ordem. Considerou-se tambm a possibilidade de um modelo misto ARMA. Recorrendo a mtodos de estimativa dos mnimos quadrados, num primeiro estgio determinaram-se os resduos de um modelo AR de ordem 8 ( = 8) e respectiva matriz de covarincia. Num segundo estgio ajustaram-se vrios modelo ARMA(p,q) para diversas combinaes de p e q, recorrendo a estimativas dos mnimos quadrados, determinando-se para cada combinao os critrios AIC (Tabela 8.4) e AQ (Tabela 8.5).
Tabela 8.4 Critrio AIC para seleco da ordem do modelo ARMA
q p 0 1 2 3 4 5 0 13.613 9.407 9.587 9.853 10.311 10.599 1 13.236 9.558 9.788 10.088 10.535 10.941 2 13.315 9.891 10.112 10.433 10.907 11.311 3 13.519 10.218 10.480 10.826 11.271 11.681 4 13.753 10.527 10.866 11.268 11.757 12.155 5 14.105 10.954 11.328 11.693 12.156 12.515
q p 0 1 2 3 4 5 0 13.613 9.693 10.161 10.717 11.467 12.048 1 13.523 10.131 10.649 11.241 11.980 12.681 2 13.889 10.752 11.261 11.874 12.641 13.341 3 14.384 11.370 11.921 12.555 13.294 14.001 4 14.909 11.972 12.600 13.291 14.069 14.764 5 15.554 12.694 13.357 14.012 14.765 15.414
8. Desenvolvimentos Prticos
191
O critrio AIC aponta para um modelo AR de primeira ordem, no sendo de excluir a segunda ou terceira ordem, ou mesmo um modelo misto at trs parmetros. O critrio HQ aponta mais ou menos para os mesmos resultados, embora exista uma diferena mais acentuada entre modelos de dois parmetros para trs parmetros. Se a deciso fosse tomada apenas com base nestes critrios, a deciso cairia num modelo AR(1). Para se ter uma ideia mais precisa sobre a ordem da componente autoregressiva a seleccionar optou-se por determinar os trs modelos ( = 1, 2, 3) com restrio de parmetros seguindo o procedimento descrito no ponto 6.1.3.5. Para cada modelo determinou-se os indicadores AIC e HC, que privilegiam o menor numero de parmetros, bem como a estatsticas (expresses (6.63) e (6.64)). Para alm destes indicadores, determinou-se ainda o valor de 2 dado por =
= =
= =
(8.1)
que permite medir a percentagem de variao (da varivel de sada) explicada pelo modelo.
Tabela 8.6 Sumario dos resultados obtidos no ajustamento a modelos AR para ordens 1, 2 e 3
Os resultados obtidos esto sumarizados na Tabela 8.6. como se pode verificar, os indicadores AIC, HQ e Q s privilegiam o modelo de primeira ordem, ao passo que os indicadores e 2 apontam para o modelo de terceira ordem. Como o indicador Q s no exclui o modelo de terceira ordem e este demonstra uma melhor adaptao aos dados existentes, optou-se por seleccionar esta ordem caracterizado pelos seguintes parmetros
,
, ,
, ,
, ,
, ,
, , , ,
, ,
192
, , . . , . . . , , . . , . .
8. Desenvolvimentos Prticos
, ,
. , , , , , , ,
, , , , , , ,
, , , , , , ,
, , , , , , ,
, , , , , , ,
, , , , , , ,
, , , , , , ,
A Figura 8-4 apresenta-se um grfico das correlaes cruzadas e autocorrelao dos resduos referentes ao modelo. O grfico referente funo de autocorrelao e correlao cruzada apresenta os limites referentes significncia de 2, ou seja 2 (os grficos referentes s variveis de entrada encontram-se no ANEXO IV).
Coeficientes Yule-Walker dos residuo da Varivel Saida: Visc
AA IS DLBC4 DLBC8 TemC4 TemC5 Saida: Visc
0.2 0.1
-0.1
-0.2
-0.3
10
11
12
13
14
15
8. Desenvolvimentos Prticos
193
A Figura 8-4 indicia a existncia de correlao (marginal) entre a varivel de sada e a variveis TemC4 na lag 4 e IS na lag 6. Esta caracterstica poder estar relacionada com uma fraca estrutura sazonal que ainda se mantm e que poder ser provocada por alguma manuteno peridica ou a outro motivo idntico. Quanto situao verificada na lag 6, considera-se, no mbito deste trabalho, que esta est suficientemente distante para se considerar significativa; de notar que se utilizasse o limite 3 ela no seria significativa. Para colmatar a situao verificada na lag 4 pode-se incluir no modelo uma componente mdia mvel exactamente na lag 4 (Reinsel, 1997), passando o processo a representado por um modelo ARMA com a seguinte estrutura = + + +
(8.2)
Procedendo anlise matriz de covarincia dos resduos, mais precisamente ultima linha, verifica-se que existe pelo menos uma componente 73 que poder indiciar alguma correlao cruzada instantnea. conveniente relembrar que a periodicidade da amostragem de 4 horas e o tempo mdio de permanncia dentro do sistema de seis horas. Isso significa no se deve colocar a hiptese de um modelo ARMA com a seguinte estrutura: = + + +
(8.3)
Em que a matriz os elementos da matriz 0 sero nulos, excepo dos seis primeiros elementos da stima linha. Ao modelo da expresso (8.2) atribui-se a designao sugestiva de modelo ARMA(1.2.3, 4) e, seguindo o mesmo raciocnio, ao modelo da expresso (8.3) atribui-se a designao de modelo ARMA(0.1.2.3, 4)
194
8. Desenvolvimentos Prticos
Coeficientes Yule-Walker da Varivel Saida: Visc 0.2 AA IS DLBC4 DLBC8 0 TemC4 TemC5 Saida: Visc
0.1
-0.1
-0.2
-0.3
10
11
12
13
14
15
ACF Normalizada da varivel Saida: Visc 0.15 0.1 0.05 0 -0.05 -0.1 -0.15 -0.2
10
11
12
13
14
15
sada
Figura 8-5 Coeficientes de Yule-Walker e ACF dos resduos da varivel de sada para o modelo ARMA(0.1.2.3, 4)
A Figura 8-5 mostra o grfico das funes autocovarincia e covarincia cruzada da varivel de sada. excepo de uma correlao muito marginal na lag 4 com a varivel TemC4, o modelo no indicia qualquer autocorrelao (at lag 14) nem qualquer correlao cruzada (pelo menos at lag 15), o que poder partida significar um ajustamento satisfatrio. Os indicadores (Tabela 8.7) referentes ao qualidade do ajustamento, indicam uma melhoria substancial, principalmente os dois primeiros, do modelo ARMA em relao ao modelo AR puro apesar do aumento do nmero de parmetros. O indicador continua no entanto a indicar um mau ajustamento global. O peso relativo do aumento de parmetros em ralao qualidade do ajustamento poder ser maior ou menor conforme o objectivo da utilizao do modelo. Como o primeiro objectivo conseguir um modelo que represente o mais fielmente o processo, neste ponto dar-se- maior peso qualidade do ajustamento.
Tabela 8.7 Indicadores de ajustamento do modelo ARMA(0.1.2.3, 4)
4280.9
0.4328
439.88
P-value 1
AIC 9.962
HQ 11.090
Anlise ao modelo ARMA obtido No esquecendo que se est perante um modelo ARMAX, como um dos objectivos deste trabalho passa pela identificao de modelos ARMA multivariados, optou-se por fazer tambm a anlise do modelo obtido como se tratasse de um modelo ARMA (sem variveis exgenas).
8. Desenvolvimentos Prticos
195
A Tabela 8.8 apresenta os resultados do teste de no normalidade conforme descrito no ponto 6.1.4.3. Do ponto 6.1.4.3 e da Tabela 8.8 tem-se que ~ , , pelo que pode conclui-se que nem todas as variveis apresentam os respectivos resduos normalmente distribudos. No entanto verifica-se que a varivel de sada no indicia no normalidade nos seus resduos. Do ponto 6.1.4.3 e da Tabela 8.9 tem-se que ~ , , pelo que, tambm neste caso, o teste estatstico indicia a no normalidade global dos resduos.
Tabela 8.8 Teste de no normalidade (Skewness e Kurtosis)
AA
IS
DLBC4
DLBC8
TemC4
TemC5
Y - VISC
P-value 0,99215 1 1
Apesar de este modelo satisfazer razoavelmente as pretenses, optou-se por tentar melhor-lo, aumentando a ordem AR, no intuito de reduzir a correlao residual marginal na lag 4 e simultaneamente reduzir o coeficiente (7,1) da matriz de covarincia residual.
O processo de ajustamento foi o mesmo que se utilizou no caso anterior, ou seja atravs da estimativa da mxima verosimilhana. Os resultados globais do ajustamento deste modelo podem ser consultados no ANEXO VI.
196
8. Desenvolvimentos Prticos
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . .
. . . . .
. . . .
. . .
. .
Coeficientes Yule-Walker da Varivel Saida: Visc 0.2 0.1 AA IS DLBC4 DLBC8 TemC4 TemC5 Saida: Visc
-0.1
-0.2
-0.3
10
11
12
13
14
15
ACF Normalizada da varivel Saida: Visc 0.15 0.1 0.05 0 -0.05 -0.1 -0.15 -0.2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Figura 8-6 Coeficientes de Yule-Walker e ACF dos resduos da varivel de sada para o modelo ARMA(0.1.2.3.4, 4)
A Figura 8-6 mostra o grfico das funes autocovarincia e covarincia cruzada da varivel de sada. Como se pode verificar, o modelo no indicia qualquer autocorrelao (at lag 14) nem qualquer correlao cruzada (pelo menos at lag 15), o que poder partida significar um ajustamento satisfatrio. No que se refere matriz de covarincia residual, verifica-se tambm uma ligeira melhoria. Comparativamente, os indicadores (Tabela 8.10) referentes ao qualidade do ajustamento, indicam alguma melhoria, principalmente os trs primeiros, do ltimo modelo em relao ao anterior.
8. Desenvolvimentos Prticos
Tabela 8.10 Indicadores de ajustamento dos modelos ARMA(0.1.2.3, 4) e ARMA(0.1.2.3.4, 4)
197
4280.9 3567,1
0.4328 0,4464
439.88 417,41
P-value 1 1
HQ 11.090 11,602
De notar que os elementos da ltima linha do parmetro so todos nulos, ou seja, a ordem do modelo em relao varivel de sada no aumentou. Isso significa que o melhor ajustamento que se verifica em termos da resposta do processo se deve fundamentalmente melhor identificao das relaes dinmicas entre as restantes variveis do processo. Anlise ao modelo ARMA obtido A exemplo do que se fez para o modelo ARMA(0.1.2.3, 4), tambm para este modelo se procedeu anlise do modelo obtido como se tratasse de um modelo ARMA (sem variveis exgenas). A Tabela 8.11 apresenta os resultados do teste de no normalidade conforme descrito no ponto 6.1.4.3.
Tabela 8.11 Teste de no normalidade (Skewness e Kurtosis)
AA
IS
DLBC4
DLBC8
TemC4
TemC5
Y - VISC
Tal como no modelo anterior, tambm para este modelo se pode concluir que nem todas as variveis apresentam os respectivos resduos normalmente distribudos, nomeadamente a varivel DLBC8 e TemC4. A varivel de sada, neste caso, tambm no indicia no normalidade nos seus resduos. Em relao ao teste global, os resultados tambm no se alteram significativamente em relao ao modelo anterior (Tabela 8.12).
Tabela 8.12 Teste de no normalidade global
P-value 0,99215 1 1
198
8. Desenvolvimentos Prticos
8.3.2.1 Concluses
Em relao ao modelo obtido, foi o modelo possvel com os dados disponveis, mas no se pode concluir que seja bom. O valor de indica um mau ajustamento e o valor de indica que o modelo apenas explica 44,6% da variabilidade. Contudo tem que se ter em conta que o modelo construdo em cima dos dados disponveis e que estes nem sempre so gerados por processos ARMA ou ARIMA. Uma das hipteses aventadas no inicio do estudo deste processo era que o modelo poderia ser simplesmente descrito por um modelo univariado, controlando apenas a varivel de sada (Viscosidade) com recurso ao controlo estatstico. Ou seja o modelo poderia ter a forma, denominada aqui como modelo zero: = + Procedeu-se ao teste de Kolmogorov-Smirnov e conclui-se que no se podia afirmar que os dados de sada eram no normais. Chegados a este ponto, pensou-se que era de todo pertinente comparar os dois modelos. Tal como se procedeu no inicio em relao ao modelo zero, verificou-se a normalidade residual do modelo ARMA(0.1.2.3.4, 4) com recurso ao teste de Kolmogorov-Smirnov.
Tabela 8.13 Teste Kolmogorov-Smirnov aplicado aos resduos do modelo ARMA(0.1.2.3.4, 4)
AA
IS
LBC4
LBC8
TemC4
TemC5
Visc
P- value D CV(5%) H
A primeira linha d o valor de percentagem correspondente ao valor da estatstica D (segunda linha) para cada uma das sries. A terceira linha apresenta os valores crticos para uma significncia de 5%. A quarta linha indica a hiptese que no se pode rejeitar, se a hiptese nula (valor 0) se a hiptese alternativa (valor 1). Em relao Tabela 8.2 verificase que as sries residuais que indiciavam no normalidade, depois de filtrados pelo modelo obtido, passaram a no indiciar no normalidade, que o caso das de entrada LBC4, LBC8 TemC4 e TemC5. Comparativamente, o desvio padro da srie de sada passou de 48.3 para 35.3 que poder corresponder a uma reduo da variabilidade do processo no mximo de 27%. Para se ter uma melhor percepo da melhoria em termos da normalidade dos dados construram-se os grficos da distribuio emprica cumulativa (Figura 8-7) das sries de sada do modelo zero e do modelo obtido, em que claramente visvel uma maior concordncia com a distribuio cumulativa normal para o segundo caso.
8. Desenvolvimentos Prticos
199
0.9
0.9
0.8
0.8
0.7
0.7
0.4
0.4
0.3
0.3
0.2
0.2
0.1
0.1
0 -3
-2
-1
1 x
0 -4
-3
-2
-1
0 x
Figura 8-7 Grfico da distribuio emprica cumulativa das variveis de sada do modelo zero e do modelo ARMA(0.1.2.3.4, 4)
Ainda no sentido de se avaliar qualitativamente o modelo obtido, simulou-se a resposta do modelo s sries de entrada dos dados originais (Figura 8-8).
Varivel Saida: Visc 1250 Simulao Real 1200
1150
Saida: Visc
1100
1050
1000
950
900
50
100 t
150
200
250
200
8. Desenvolvimentos Prticos
1 1
Processo
Optimizador Controlador
O Processo descrito pelo modelo ARMA(0.1.2.3.4, 4) desenvolvido no ponto 8.3.2 dado pela expresso (8.4) e cujo coeficientes se apresentam no ANEXO VI. O vector de entrada constitudo pelas seis variveis de entrada (AA, IS, DLBC4, DLBC8, TemC4 e TemC5) e a varivel composta pela sada do sistema (Viscosidade) que se pretende que se mantenha a um determinado nvel .
8.4.1.1 Controlador
De acordo com o ponto 6.2.3.1, o controlador utiliza uma derivao da verso multivariada do optimizador de Clarke e Gawthrop idntica utilizada por (Del Castillo & Yeh, An adaptive run-to-run optimizing controller for linear and nonlinear semiconductor processes, 1998) e j apresentado na expresso (7.10) dado por = ++ ++ +
(8.5)
8. Desenvolvimentos Prticos
201
(8.6) (8.7)
Aqui, em principio + seria a previso ( + 1) perodos frente de ++ condicional informao existente no instante . o vector das referncias das variveis de sada, uma matriz diagonal com as ponderaes (prioridades) das sadas e uma matriz diagonal com as ponderaes (custos) das entradas. O vectores , , e estabelecem o domnio e contradomnio de actuao do processo. Isto , os valores das entradas esto constrangidos zona entre e , em que o limite inferior e o limite superior; enquanto que as respostas do processo no devem ultrapassar os limites inferiores e os limites inferiores A optimizao de em ordem aos factores controlveis realizada com recurso ao clculo numrico atravs ao mtodo PenaltyBarrier" (Jen, Jiang, & Fan, 2004), (Chen & Goldfarb, 2006). Neste caso recorreu-se funo do MATLAB fmincon.
em que, como anteriormente, = , , o que implica que, para este processo, os elementos da matriz 0 sero nulos, excepo dos seis primeiros elementos da stima linha. Seguindo a notao introduzida, este modelo foi denominado por AR(0.1.2). Os resultados globais do ajustamento deste modelo podem ser consultados no ANEXO VII. Abaixo apresentam-se alguns indicadores.
Tabela 8.14 Indicadores de ajustamento do modelo AR(0.1.2)
6513
. . . . . . .
0,4280
. . . . . . .
537,36
P-value 1
. . . . . . .
AIC 9,977
. . . . . . .
HQ 10,82
. . . . . . .
. . . . . . .
. . . . . . .
202
8. Desenvolvimentos Prticos
. . . . . . .
. . . . . .
. . . . .
. . . .
. . .
. .
Em relao ao modelo ARMA(0.1.2.3.4, 4), este modelo no consegue eliminar os indcios de correlao cruzada (marginal) existente na lag 4 (Figura 8-10) e apresenta um valor do determinante da matriz de covarincia residual muito mais elevado, mas consegue valores aproximados do desvio padro da varivel de sada e de muito semelhantes com uma reduo significativa do numero de parmetros, conseguindo-se assim baixar tambm os indicadores AIC e HQ.
Coeficientes Yule-Walker da Varivel 7 0.2 0.1 0 -0.1 -0.2 -0.3
10
11
12
13
14
15
0.1
-0.1
-0.2
10
11
12
13
14
15
Figura 8-10 Coeficientes de Yule-Walker e ACF dos resduos da varivel de sada para o modelo AR(0.1.2)
8. Desenvolvimentos Prticos
203
= . + . . . + . + . + . + ou
(8.9)
= . + . . . + . + . + . +
(8.10)
em que a diferena para a mdia . Ao analisar esta expresso e a expresso do controlador (8.5) surge um problema que at agora ainda no foi mencionado, talvez porque s surge nas situaes multivariadas, uma vez que temos variveis de entrada desfasadas de uma lag e variveis de entrada desfasadas de duas lags. A questo que se coloca a seguinte: Qual o valor de b na expresso (8.5)? A implementao em espao de estados ter possivelmente resposta (?) para esta pergunta, mas essa abordagem no foi feita neste trabalho. A soluo adoptada neste trabalho, que s foi possvel devido ao facto de se desenvolver a metodologia para sistema MIMO, foi a de tentar minimizar a sada do processo simultaneamente um passo frente e dois passos frente, ou seja, a varivel ++1 que at aqui era uma escalar, passa a ser tratada como uma varivel vectorial definida por +1 , +2 componentes so definidas por
+ = . + + . . . + . + . + .
(8.11)
+ = . + + . + . + . + + . + . + . + Ou seja, em cada iterao existem variveis de entrada que so estimadas simultaneamente um passo frente e dois passos frente, mas obviamente, no sistema entram apenas varveis referentes a esse instante. Outro pormenor que se verifica na expresso (8.10) a ausncia da varivel de entrada DLBC8 (ou 4 ). Como j foi referido, a ausncia dessa varivel no significa que ela no tenha influncia na resposta do processo, significa, isso sim, que a variao dessa varivel dentro dos valores admissveis, ou seja, a gama de valores utilizados para identificao do processo, no altera significativamente a resposta do processo. Embora na determinao do modelo do processo se tenha admitido a existncia de alguma dinmica nas variveis de controlo, para efeitos de controlo, na ausncia de mais informao do processo, considera-se as variveis de controlo como determinsticas e instantneas (o valor da constante de tempo insignificante relativamente constante de tempo do processo). Contudo, em relao s variveis de controlo (entrada), o modelo intrnseco do processo separa a parte proveniente da dinmica da parte proveniente do ajustamento devido presena da componente mdia mvel presente no modelo.
204
8. Desenvolvimentos Prticos
Parmetros Para implementao do sistema de controlo tem que se determinar ainda os valores dos parmetros e , os vectores referentes limites de operao , , e e ainda o valor de referncia da sada do processo . Estes parmetros, normalmente, so definidos de acordo com os gestores dos processos tendo em conta condies econmicas, operacionais e as especificaes das caractersticas da sada do processo. Um algoritmo especifico para sintonizao dos parmetros e poderia passar, por exemplo por simulao iterativa atravs de uma gama de valores possveis dos parmetros, e verificar quais os que produziam os resultados mais prximos dos pretendidos. Neste caso no se aprofundou o mtodo, pelo que os valores utilizados foram determinados atravs de simulao, mas apenas at se obterem uma combinao de valores que satisfizessem as pretenses presentes. Um mtodo mais preciso dever ser implementado posteriormente. Para efeitos de simulao, para os limites operacionais e das variveis de entradas foram utilizados os mnimos e os mximos respectivamente, de cada srie. Para o valor de referncia da varivel de sada , numa primeira fase pensou-se em utilizar a mdia do processo, mas para verificar a eficincia do controlador optou-se por utilizar um valor diferente. De notar que o controlador dever estar projectado para admitir um valor de referncia varivel ( , mas essa situao no muito vulgar neste enquadramento. Simulao do sistema de controlo Para efeitos de validao da estratgia de controlo definida simulou-se o processo durante 600 observaes com os seguintes parmetros: = = = = . Das observaes simuladas obteve-se um desvio mdio de -3.9592 em relao ao valor de referncia e um desvio padro de 38.253. A Figura 8-11 mostra o grfico da varivel de sada das 600 observaes resultante da simulao do processo com controlo integrado. Os grficos relativos s variveis de entrada podem ser consultados no ANEXO VIII. Comparativamente ao sistema sem controlo, para alm de um maior controlo sobre o valor mdio da resposta (parmetro central), verificou-se um decrscimo moderado da variabilidade do processo, ou seja passou-se de 48.3 (Tabela 8.1) para aproximadamente 38.3. O desvio mdio verificado poder dever-se diferena existente entre o modelo do processo e o modelo usado no controlador. Esse facto, de certo modo, reflecte o que se passa na realidade, uma vez que os modelos obtidos nunca conseguem captar a totalidade do comportamento dos processos que normalmente so de ordem bastante superior admitida e frequentemente tem comportamentos no lineares que so captados apenas parcialmente pelos modelos lineares. Ou seja, os modelos nunca so perfeitos. O desvio
8. Desenvolvimentos Prticos
205
mdio verificado, tambm apelidado de erro de offset, pode no entanto ser compensado com a introduo de um compensador PI ou apenas I.
1150
Saida: Visc
1100
1050
1000
950
900
100
200
300 t
400
500
600
206
8. Desenvolvimentos Prticos
de controlo implementadas na entrada do processo devido compensao fora dos limites exigida devido s alteraes do processo.
T Processo
no
SPC
<
sim
SPC
Controlador
Quanto primeira abordagem (zona morta), verificou-se que, no processo em causa, a viabilidade era reduzida devido ao reduzido ratio entre o desvio padro mnimo (desvio padro com o processo ajustado em todos os instantes sem zona morta) e o desvio padro sem qualquer controlo. No que diz respeito segunda abordagem (ASPC), concluise que, devido ao sistema de controlo implementado, no era fcil detectar qualquer situao fora de controlo nas variveis de controlo (entrada) devido ao facto de estas estarem constrangidas (limitadas entre um mximo e um mnimo) pelo prprio controlador, pelo que a verificar-se qualquer situao fora de controlo, esta teria que ser nas variveis de sada.
8.4.2.1 Modelo
Uma vez postas de parte estas duas abordagens, optou-se pelo esquema mais generalista apresentado na Figura 7-1 em que o controlo estatstico tem a dupla funo de alterar os parmetros do controlador, caso seja vivel, e simultaneamente detectar causas especiais.
No modelo implementado (
Figura 8-13), utiliza-se uma carta EWMA para monitorar a mdia do processo. Sempre que detectada uma alterao da mdia do processo > , o sistema verifica se o controlador consegue compensar essa alterao, ou seja, se +1 = + estiver compreendido entre o valor mnimo e o valor mximo admissvel pelo controlador, respectivamente e . Se o controlador consegue compensar a alterao ento lanado um alerta, o controlador actualiza o parmetro que foi alterado (neste caso a mdia), o processo continua, mas espera-se que a causa seja identificada se for o caso (poder tratar-se de um processo com mdia oscilante) e removida. Caso contrrio, o processo pra para que seja identificada a causa e removida. Ou seja, perante uma alterao no processo, sempre emitido um alerta, podendo no entanto, o processo parar ou no.
8. Desenvolvimentos Prticos
207
STOP
No
< + <
Controlador
Processo
= +
De notar que, se a resposta do processo fosse multivarivel, provavelmente ter-se-ia que utilizar uma carta EWMA para cada varivel, uma vez que a carta EWMA multivariada (Lowry, Woodall, Champ, & Rigdon, 1992) no informa qual a varivel que se alterou, pelo que no seria possvel detectar qual o parmetro do controlador a actualizar. Nesse caso, contudo, seria conveniente retirar a componente de correlao das variveis antes do processo de monitorizao (ver ponto 6.1.1.2). Comparativamente ao modelo da Figura 7-4 (Del Castillo & Yeh, 1998), que utiliza uma carta EWMA multivarivel a diferena que nesse caso, sempre que se verifica um situao de fora de controlo, os parmetros do modelo so todos actualizados, pelo que no existe a necessidade de verificar qual o parmetro que se alterou.
8.4.2.3 Simulao
No campo da simulao o trabalho efectuado foi relativamente reduzido, e feito apenas a ttulo exemplificativo do que poder ser o ponto de partida para trabalhos futuros na rea da integrao de EPC/SPC.
208
8. Desenvolvimentos Prticos
Com base no modelo da Figura 8-13 foram simulados trs cenrios diferentes. Em todos os casos foram usados os seguintes parmetros para o controlador: = = = = . No primeiro cenrio tentou-se simular alteraes de um (1) desvio padro na mdia do processo e verificar o comportamento da resposta da carta EWMA, do controlador e da resposta do processo. Como o objectivo no passava pela paragem do processo, os limites e foram estabelecidos de forma a no serem atingidos. Neste cenrio foram utilizados os seguintes valores para a carta EWMA (Montgomery D. C., 2001) = . = . Que para uma alterao de um (1) desvio padro na mdia do processo corresponde a um ARL (Average Run Lenght) de 10,5. Num segundo cenrio, simularam-se alteraes de meio (0.5) desvio padro na mdia do processo, sendo admissveis variaes entre 0 1.5 e 0 + 1.5 sem que o processo fosse parado devido a alarme de alterao no processo no compensada pelo controlador. Tambm aqui o objectivo no passa por parar o processo, mas sim verificar o comportamento do sistema integrado com deteco de amplitudes mais baixas na mdia. Neste cenrio foram utilizados os valores de = . e = . que corresponde a um ARL de 71.2 para 0.5 e de 14.3 para 1. Num terceiro cenrio, simularam-se alteraes de meio (0.5) desvio padro na mdia do processo, sendo admissveis variaes entre 0 1.5 e 0 + 1.5 sem que o processo fosse parado devido a alarme de alterao no processo no compensada pelo controlador. Tambm aqui o objectivo no passa por parar o processo, mas sim verificar o comportamento do sistema integrado com deteco de amplitudes mais baixas na mdia. Tambm neste cenrio foram utilizados os valores de = . e = . que correspondem a um ARL de 41.8 para 0.5 e de 10.5 para 1. Em todos os cenrios a simulao foi composta por 500 observaes e foi introduzida uma alterao de um (1) desvio padro na mdia do processo entre as observaes 100 e 300.
8.4.2.4 Resultados
Cenrio 1 Das observaes simuladas sob as condies descritas para o cenrio 1, obteve-se um desvio mdio de -1.0729 em relao ao valor de referncia e um desvio padro de 37.242. A Figura 8-14 mostra o grfico da varivel de sada das 500 observaes resultante da
8. Desenvolvimentos Prticos
209
simulao do processo com integrao SPC/EPC. Os grficos relativos s variveis de entrada podem ser consultados no ANEXO IX. Como se pode verificar, a rpida deteco da carta EWMA e a consequente alterao do modelo interno do controlador impediu que a perturbao introduzida no processo influenciasse significativamente a sada do processo. A Figura 8-15 mostra a carta EWMA, com os respectivos limites, resultante da simulao do processo nas condies estabelecidas para o cenrio 1. A Tabela 8.16 mostra alguns dos pontos mais significativos dessa carta. No processo verificou-se uma alterao na mdia de um (1) desvio padro no instante 100. Como se pode verificar, a carta detectou uma alterao na mdia logo na observao 108 (o ARL nestas condies de 10.5). Aps a deteco, o sistema alterou o parmetro da mdia adicionando-lhe 1 como est estipulado, e o modelo interno do controlador ficou de acordo com o processo alterado no instante 100. O aumento de 1 na mdia do processo retirado na observao 300. Esta alterao detectada pela carta logo na observao 306 com a consequente actualizao do respectivo parmetro no modelo interno do controlador.
Varivel Saida: Visc 1250
1200
1150
Saida: Visc
1100
1050
1000
950
50
100
150
200
250 t
300
350
400
450
500
Embora a alterao introduzida no processo no seja perceptvel na sada do processo, as suas consequncias so perfeitamente visveis no comportamento das variveis de entrada. Esta constatao vai ao encontro da teoria de suporte da metodologia ASPC (algotithmic statistical process control) que argumenta que se a perturbao no detectvel a partir da
210
8. Desenvolvimentos Prticos
resposta do processo quando este est sob controlo por realimentao, ento ela ser detectvel atravs das alteraes verificadas nas variveis de entrada.
Tabela 8.15 Alguns pontos da carta EWMA
70
LSC
60
50
40
30
20
10
LIC
-10
-20
50
100
150
200
250
300
350
400
450
500
De facto, na Figura 8-16 so perfeitamente visveis as consequncias das alteraes provocadas no processo, com as variveis de controlo a corresponder s solicitaes do controlador no sentido de manter a resposta prxima dos valores de referncia.
8. Desenvolvimentos Prticos
211
H a salientar contudo que, neste caso, a deteco foi efectuada na varivel de sada, e que em princpio, este facto deve despoletar uma anlise ao processo no sentido de identificar a causa da alterao e proceder sua remoo no sentido da melhoria contnua do processo. Existem no entanto processos que no tm mdia constante, ou seja a mdia oscila em torno de um valor mdio. Nesses casos, a implementao de sistema de controlo semelhante a este poder diminuir significativamente a variabilidade do processo.
-2
-4
-6
50
100
150
200
250
300
350
400
450
500
Cenrio 2 Das observaes simuladas sob as condies descritas para o cenrio 2, obteve-se um desvio mdio de -6.0364 em relao ao valor de referncia e um desvio padro de 43.974. A Figura 8-17 mostra o grfico da varivel de sada das 500 observaes resultante da simulao do processo com integrao SPC/EPC. Os grficos relativos s variveis de entrada podem ser consultados no ANEXO X. A Figura 8-18 mostra a carta EWMA, com os respectivos limites, resultante da simulao do processo e a Tabela 8.16 mostra alguns dos pontos mais significativos dessa carta. No processo verificou-se uma alterao na mdia de um (1) desvio padro no instante 100. Como se pode verificar, a carta detectou uma alterao na mdia na observao 110. Aps a deteco, o sistema alterou o parmetro da mdia adicionando-lhe 0.5 como est estipulado. No instante 143 a carta detecta outra alterao na mdia (o ARL para 0.5 de 41.8) e o sistema actualiza novamente o respectivo parmetro, ficando o parmetro da mdia do modelo interno do controlador de acordo com a perturbao sofrida.
212
8. Desenvolvimentos Prticos
1200
1150
Saida: Visc
1100
1050
1000
950
50
100
150
200
250 t
300
350
400
450
500
Figura 8-17 Sada do processo (cenrio 2) Tabela 8.16 Alguns pontos da carta EWMA
Observao 1 110 142 143 148 149 226 340 341 429 430 500
LIC 79,501 79,501 79,501 79,501 79,501 79,501 79,501 79,501 79,501 79,501 79,501 79,501
LSC -28,368 -28,368 -28,368 -28,368 -28,368 -28,368 -28,368 -28,368 -28,368 -28,368 -28,368 -28,368
25,567 81,503 62,825 88,626 67,419 89,034 -40,386 11,801 -38,506 1,047 -31,908 47,450
0,000 17,660 17,660 35,321 35,321 52,981 35,321 35,321 17,660 17,660 0,000 0,000
8. Desenvolvimentos Prticos
213
LSC
50
LIC
-50
50
100
150
200
250
300
350
400
450
500
t
Figura 8-18 Carta EWMA (cenrio 2)
Na observao 149, a carta detecta novamente um aumento da mdia do processo, mas neste caso trata-se de um falso alarme. Se fossem admissveis apenas variaes entre 0 1 e 0 + 1, o processo pararia para que fosse identificada a causa da variao. O falso alarme foi corrigido pelo prprio sistema no ponto 226, ficando o modelo interno do controlador novamente de acordo com a perturbao sofrida pelo processo. O aumento de 1 na mdia do processo retirado na observao 300. Esta alterao s detectada pela carta na observao 341 com a consequente actualizao do respectivo parmetro, mas olhando para a carta (Figura 8-18) verifica-se que esteve muito perto de ser detectada entre as observaes 319 e 322. A alterao s detectada totalmente (1) no ponto 430 passando ento o modelo interno do controlador a estar novamente de acordo com o processo. No grfico referente sada do processo (Figura 8-17) so perfeitamente identificveis as zonas em que o modelo do controlador no est de acordo com o modelo do processo. Na Figura 8-19 pode-se verificar as alteraes efectuadas nas variveis de entrada pelo controlador para compensar as perturbaes detectadas. Nessa figura so perfeitamente detectveis as restries impostas pelo algoritmo de controlo, no que diz respeito aos limites inferiores e superiores impostos nas variveis de entrada, nomeadamente nas variveis TemC4 e IS. Esta situao apelidada na literatura de controlo como saturao dos actuadores.
214
8. Desenvolvimentos Prticos
No global, salienta-se que apesar das perturbaes impostas, o desvio mdio em relao ao valor de referncia e a prpria variabilidade do processo situam-se em nveis aceitveis, comparvelmente aos resultados reais (sem controlo nem perturbaes).
-2
-4
-6
50
100
150
200
250
300
350
400
450
500
Cenrio 3 Das observaes simuladas sob as condies descritas para o cenrio 3, obteve-se um desvio mdio de -2.4004 em relao ao valor de referncia e um desvio padro de 41.113. A Figura 8-20 mostra o grfico da varivel de sada das 500 observaes resultante da simulao do processo com integrao SPC/EPC. Os grficos relativos s variveis de entrada podem ser consultados no ANEXO XI. A Figura 8-21 mostra a carta EWMA, com os respectivos limites, resultante da simulao do processo e a Tabela 8.17 mostra alguns dos pontos mais significativos dessa carta. Tal como nos casos anteriores, no processo verificou-se uma alterao na mdia de um (1) desvio padro no instante 100. Como se pode verificar, a carta detectou uma alterao na mdia na observao 105 (o ARL para 1 de 10.5). Aps a deteco, o sistema alterou o parmetro da mdia adicionando-lhe 0.5 como est estipulado. No instante 115 a carta detecta outra alterao na mdia e o sistema actualiza novamente o respectivo parmetro, ficando novamente de acordo com a perturbao sofrida.
8. Desenvolvimentos Prticos
215
1200
1150
Saida: Visc
1100
1050
1000
950
900
50
100
150
200
250 t
300
350
400
450
500
LIC 60,440 60,440 60,440 60,440 60,440 60,440 60,440 60,440 60,440
LSC -9,307 -9,307 -9,307 -9,307 -9,307 -9,307 -9,307 -9,307 -9,307
216
8. Desenvolvimentos Prticos
70
LSC 60
50 40 30 20 10 0
LIC -10
-20 -30
50
100
150
200
250
300
350
400
450
500
O aumento de 1 na mdia do processo retirado na observao 300. Esta alterao detectada pela carta logo na observao 302 com a consequente actualizao do respectivo parmetro. A alterao detectada totalmente (1) no ponto 360 passando ento o modelo interno do controlador a estar novamente de acordo com o processo. No grfico referente sada do processo (Figura 8-20Figura 8-17) nota-se apenas uma ligeira subida na zona compreendida entre a observao 100 e 110, pouco perceptvel, e uma ligeiro abaixamento na entre as observaes 300 e 350. No global, so pouco perceptveis as consequncias das alteraes que ocorreram. No que diz respeito s variveis de entrada, como se pode verificar na Figura 8-22, os efeitos provocados pelas aces de controlo nas variveis de entrada so bem perceptveis. No global, verifica-se que, para alm de um muito ligeiro aumento no parmetro de disperso, a resposta do processo praticamente no sentiu a perturbao imposta.
8. Desenvolvimentos Prticos
217
-2
-4
-6
50
100
150
200
250
300
350
400
450
500
8.4.3 Concluses
A primeira concluso que se pode retirar que as simulaes efectuadas apontam no sentido de esta metodologia permitir controlar o parmetro central da sada do processo, mantendo-o bastante prximo dos valores de referncia (target), e simultaneamente reduzir a sua variabilidade mesmo perante a presena de alteraes no processo. Outra das concluses que surge dos cenrios simulados, que se obtm melhores resultados com valores de lambda mais baixos. Em geral, verifica-se que valores no intervalo 0.05 0.25 conduzem a bons resultados na deteco de pequenas alteraes (Montgomery D. C., 2001) e que valores de ~3 (limites de trs sigma) funcionam razoavelmente bem para valores de > 0.1. No seguimento do que se vem defendendo ao longo deste trabalho, a obteno de um bom modelo, no sentido de representar correctamente o comportamento do processo, consiste numa ferramenta poderosssima no sentido melhorar significativamente, ou mesmo optimizar o processo. Os mtodos de simulao aqui apresentados so bastante bsicos e com reduzida inferncia estatstica. O objectivo principal dos cenrios simulados, basicamente foi demonstrar algumas das potencialidades da metodologia e exemplificar o trabalho que poder ser desenvolvido a partir daqui.
218
8. Desenvolvimentos Prticos
Aqui simulou-se um caso prtico duma estratgia de integrao do controlo estatstico com engenharia de controlo no intuito de demonstrar as potencialidades da sinergia destas duas metodologias. Outras estratgias existem e foram aqui discutidas e outras existem que no foram abordadas neste trabalho. A estratgia a adoptar na implementao desta metodologia pode variar significativamente de implementao para implementao, de empresa para empresa, de processo para processo, da que muitos autores nesta rea, (Del Castillo, 2002) entre outros, argumentem que o reduzido sucesso verificado at agora na implementao desta metodologia est directamente ligado dificuldade de a transformar num produto comercial genrico.
219
220
Apesar de a abordagem de representao em espao de estados apenas se ter feito esporadicamente, cedo se concluiu que uma abordagem a sistemas multi-input multi-output (MIMO) dever passar por esse tipo de representao uma vez que praticamente toda a filosofia por detrs da engenharia de controlo moderno, como seja o controlo ptimo, controlo preditivo, controlo adaptativo, etc. assenta nessa representao dos processos. No entanto, chegar a esse tipo de representao a partir do trabalho de identificao/modelao efectuado, apenas mais um passo (Ltkepohl, 2007), ou seja, passar de uma representao com a estrutura (6.85) para uma representao do tipo (4.58)/(4.59) bvio. Nesta abordagem, contrariamente abordagem de funo de transferncia tm-se em conta no s as variveis de entrada mas tambm as chamadas variveis de estado que representam o que se passa no interior do sistema. Olhando para o sistema em estudo pode-se facilmente concluir que, por exemplo, uma temperatura no dever ser considerada uma varivel de entrada, mas antes uma varivel de estado que seria funo de uma ou mais variveis de entrada (um determinado fluxo de quantidade de calor e/ou energia, por exemplo). Nos sistemas de controlo baseados na representao de espao de estados o controlo ptimo feito atravs da realimentao das variveis de estado, pelo que a optimizao sempre feita um passo frente. Com isto pode-se concluir que, neste campo, a evoluo natural deste trabalho dever passar por uma abordagem mais profunda da representao deste processo em espao de estados e a aplicao de metodologias de controlo preditivo mais avanadas que simultaneamente permitam assegurar um melhor controlo da resposta transitria. Em relao ao segmento do controlo estatstico do processo, o desafio que se colocava era de que modo se conseguia implementar uma ou mais cartas de controlo de modo a que a informao retirada permitisse simultaneamente detectar alteraes do processo e dar a informao ao controlador sobre os parmetros a alterar. Entre as solues avaliadas, CUSUM ou EWMA, optou-se por uma testar uma carta EWMA com resultados preliminares que se consideram satisfatrios. Como o caso concreto de estudo um sistema MISO, e concluiu-se que no haveria necessidade de implementar cartas de controlo nas variveis de entrada devido ao facto delas estarem constrangidas pelo controlador, no houve a necessidade de abordar sistemas de controlo estatstico multivariado. Como toda a abordagem do tema foi feita para sistemas de entradas mltiplas e sadas mltiplas, a questo que seguidamente se colocaria para um sistema MIMO a seguinte: Para uma implementao multi-input / multi-output esquematizada pelo diagrama de blocos da Figura 8-13, qual o tipo de carta EWMA a utilizar? Na resposta dada argumentou-se que teriam que ser utilizadas cartas univariadas, tantas quantas as variveis de sada, mas as variveis a monitorizar deveriam estar no correlacionadas (ver ponto 6.1.1.2) para evitar que uma alterao detectada numa das variveis no induzisse um falso alarme noutra varivel que com ela estivesse correlacionada. Esta posio continua a ser mantida, uma vez que se necessita de saber o mais rapidamente possvel qual a varivel que sofreu a alterao. Existe no entanto outra questo que se coloca em termos de ARL, ou seja, como que detectada mais rapidamente uma situao de fora de controlo neste caso especifico, com cartas univariadas ou multivariadas?
221
A ferramenta identificada para esclarecer estas dvidas passa pela simulao de uma srie de modelos e situaes o nmero necessrio de vezes de forma a produzir alguma inferncia estatstica que permita validar uma das hipteses formuladas. No campo do controlo estatstico (SPC), pretende-se ainda salientar que, tal como foi dito, apesar de se ter a sensao de que o tema no foi muito desenvolvido, foram desenvolvidas ferramentas que podero proporcionar a obteno de bons resultados nesta rea em trabalhos futuros tanto na vertente da integrao EPC/SPC como na vertente do controlo estatstico multivariado com dados correlacionados. Na primeira vertente defende-se a ideia de que a utilizao de modelos fiveis em processos de simulao pode ser uma ferramenta de grande potencialidade na determinao da estratgia de controlo estatstico a integrar e do tipo de cartas a utilizar. Na segunda vertente, como tambm j foi referido, quanto mais prximo os resduos do modelo estiverem de um processo rudo branco, mais eficaz ser o controlo estatstico aplicado a esses resduos e consequentemente ao processo (Figura 6-1). No campo da integrao do controlo estatstico com a engenharia de controlo, fizeram-se algumas abordagens, umas com mais hipteses de sucesso que outras. Do ponto de vista terico, a estratgia mais audaz de integrao do controlo estatstico com a engenharia de controlo, seria monitorizar os parmetros do modelo do processo atravs de um sistema de cartas Cuscore, para detectar alteraes do processo em relao ao modelo interno do controlador. Esta teoria est bem desenvolvida para os modelos ARMA univariados (Box & Luceo, 1997) embora no se detectassem situaes de aplicao real, talvez devido sua complexidade. Contudo, tentar extrapolar a ideia para sistemas multivariados dever tornarse ainda mais complexo devido grande quantidade de parmetros envolvidos. H no entanto uma abordagem que se pensou fazer, caso o processo de estudo fosse o modelo base (Figura 8-1). A ideia base passa pelo seguinte; quando se est a falar de controlo cujo perodo de amostragem da ordem das horas, trata-se de um controlo indexado superviso de processos. Com este perodo de amostragem faz todo o sentido utilizar o controlo estatstico para monitorizar variveis de entrada no manipulveis no sentido de detectar desvios em relao aos nveis esperados no sentido de ajustar as variveis manipulveis de modo a compensar esses desvios. Suponha-se que se tem um processo como o representado pelo diagrama de blocos da Figura 6-3 com duas variveis de entrada, uma que no manipulada e se supe com nvel constante , e outra que serve para controlar a sada do processo . Faz todo o sentido monitorizar a varivel , recorrendo ao controlo estatstico (uma carta CUSUM ou EWMA por exemplo) de forma a detectar alteraes nessa varivel e a ajustar a varivel no sentido de compensar essa alterao (Figura 9-1).
SPC
Controlador
Processo
222
Para explanar melhor este ponto de vista, de certa forma especulativo, suponha-se que a Figura 9-2 representa a funo objectivo do controlador, que se pretende minimizar. Suponha-se que num determinado instante o nvel da matria-prima de 0.2, e que a varivel manipulvel se encontra no nvel 0.4, valor este determinado atravs de desenho de experincias, resposta em superfcie ou outra metodologia. Se for detectada uma alterao de, por exemplo de 0.6 no nvel da varivel da caracterstica da qualidade, faz todo o sentido alterar o nvel da varivel manipulada para zero no sentido de encontrar o ponto de funcionamento ptimo do processo, condicionado varivel de entrada . Poder sempre argumentar-se que essa caracterstica poderia ser permanentemente medida, que seria o comportamento ptimo, mas nos processos industriais, e no s, existe sempre a componente rentabilidade associada, pelo que poder ser mais econmico ter um controlo por amostragem que uma medio continua. Por outro lado, por vezes as medies so bastantes dispendiosas, ou mesmo necessrio recorrer destruio da amostra, pelo que tambm a a integrao do controlo estatstico com engenharia de controlo seria uma boa soluo.
0.6
0.4
0.2
0 -0.2
-0.4
-0.6
-0.8
-1 -1
-0.8
-0.6
-0.4
0.4
0.6
0.8
Figura 9-2 Exemplo de funo objectivo de um sistema de controlo com duas variveis de entrada
Quanto ao processo estudado, ficou a ideia geral de que as variveis utilizadas como variveis de controlo no eram as mais indicadas devido ao facto de tambm elas
223
apresentarem alguma dinmica e de tambm elas dependerem de outras variveis que no foram provavelmente aqui tidas em conta. Relembrando a representao em espao de estados ( + ) = + () () = + () em que () o vector das variveis de controlo (entrada), o vector das variveis de estado e () o vector das variveis de sada, fica-se com a ideia de que faltam algumas variveis pertencentes ao vector (), e que algumas das variveis utilizadas como pertencentes ao vector () deveriam pertencer efectivamente ao vector (). Ainda em relao ao modelo obtido, pode-se concluir que grande parte da variabilidade no explicada poder dever-se ausncia no modelo desenvolvido de outras variveis que no foram tidas em conta e com as quais a varivel de sada estar fortemente correlacionada, como ser o caso das variveis referentes s caractersticas da matria-prima. H no entanto a salientar que, para os efeitos pretendidos, os dados (reais) disponibilizados serviram de forma satisfatria os objectivos. Na concluso sumria pode-se argumentar que, nos quatro grandes blocos que compem este tema, muita coisa ficou por abordar, mas o trabalho mais urgente a fazer nesta rea, validar o que est feito atravs duma implementao prtica em ambiente industrial. A integrao de lgica fuzzy nos sistemas de controlo e redes neuronais nos processo de identificao e/ou controlo so duas reas que devem merecer alguma ateno em trabalhos futuros.
Referncias
225
Referencias
Akaike, H. (1974). A new look at the statistical model identification. IEEE Trans. Automatic Control , AC-19, 716-723. Alwan, L. C. (1988). Time-series modeling for statistical process control. Journal of Business and Economic Statistics , 6, 87-95. Atienza, O. O. (1998). A SPC procedure for detecting level shifts of autocorrelated processes. Journal of Quality Technology , 30, 340-351. Bartlett, M. S. (1946). On the theoretical specification and sampling properties of the autocorrelated time-series. Journal of the Royal Statistics Society , Ser. B, 8, 27-41. Botto, M. A. (2007). Controlo de Sistemas. Suplemento da Sebenta de Controlo de Sistemas . IST - Lisboa. Botto, M. A. (Setembro de 2007). Controlo ptimo. Sebenta de Controlo ptimo . IST Lisboa. Botto, M. A. (2007). Suplemento de Sebenta de Controlo de Sistemas. IST - Lisboa. Box, G. E. (1992). Statistical process monitoring and feedback adjustment-a discussion. Technometrics , 34, 251-267. Box, G. E., & Draper, N. R. (2007). Response Surfaces, Mixtures, and Ridge Analyses. JOHN WILEY & SONS, INC. Box, G. E., & Jenkins, G. M. (1970). Time Series Analysis: Forecasting and Control. Oakland, Calif.: Holden-Day. Box, G. E., Jenkins, G. M., & Reinsel, G. C. (2008). Time Series Analysis: Forcasting snd Control, 4th ed. Hoboken, New Jersey: John Wiley & Sons, Inc. Box, G., & Luceo, A. (1997). Statistical Control By Monitoring and Feedback Adjustment. JOHN WILEY & SONS, INC. Capilla, C., Ferrer, A., Romero, R., & Hualda, A. (1999). Integration of statistical and engineering process control in a continuous polymerization process. Technometrics , 41, 1428. Chang, Z., Hao, D., & Baras, J. S. (2000). http://hdl.handle.net/1903/6136 . Obtido em 10 de Janeiro de 2009, de Institute for Systems Research Technical Reports: http://hdl.handle.net/1903/6136 Chen, A. a. (2002). Design and performance evaluation analysis of the exponentially weighted moving average mean estimates for process subject to random step changes. Technometrics , 44, 379-389.
226
Referncias
Chen, L., & Goldfarb, D. (August de 2006). Interior-point l2-penalty methods for nonlinearprogramming with global convergence properties. MAthetmatical Programming , pp. Vol. 108, 1-36. del Castillo, E. (1996). A multivariate self-tuning controller for run-to-run process control under dhift and trend sisturbances. IIE TRANSACTIONS , vol. 28, no 12, 1011-1021. Del Castillo, E. (1998). An adaptative run-to-run optimizing controller for linear and nonlinear semicndutor processes. IEEE TRANSACTIONS ON SEMICONDUTOR MANUFACTORING , pp. 285-295. Del Castillo, E. (2002). Statistical Process Adjustment for Quality Control. New York: John Wiley & Sons, Inc. Del Castillo, E., & Yeh, J.-Y. (1998). An adaptive run-to-run optimizing controller for linear and nonlinear semiconductor processes. IEEE Transactions on Semiconductor Manufacturing , Vol. 11, No. 2,pp. 285-295. Grubb, F. E. (1954/1983). An optimal procedure for setting machines or adgusting processes. Journal of Quality Technology , 1983, 15(4): 186-189. Hannan, E. J., & Rissanen, J. (1982). Recursive estimation of mixed autoregressive moving average order. Biometrika , 69, 81-94. Correction, 70, 303, 1983. Isermann, R. (1989). Digital Control Systems; Volume I; Fundamentals, Deterministic Control. Springer-Verlag. Jen, C. H., Jiang, B. C., & Fan, S.-K. S. (2004). General run-to-run (R2R) control framwork using self-tunning control for multiple-input multi-output (MIMO) process. International Journal of Production Research , 4249-4270. Krishna B. Misra. (2008). Handbook of Performability Engineering . Springer. Lowry, C. A., Woodall, W. H., Champ, C. W., & Rigdon, S. E. (1992). A Multivariate Exponentialy Weighted Moving Average Control Chart. Technometrics , Vol. 34, no 1, 46-53. Luceo, A., Gonzalez, F. J., & Puig-Pey, J. (1996). Computing optimal adjustment schemes for the general tool wear problem. Journal of Statistical Computation and Simulation , 54, 87113. Ltkepohl, H. (2007). New Introduction to Multiple Time Series Analysis. Berlin Heidelberg: Springer. MacGregor, J. F. (1990). Discussion of `EWMA control schemes : properties and enhancement' by Lucas and Saccucci . Technometrics , 32, 23-26. MacGregor, J. F. (1987). Interface between process control and on-line statistical process control. American Institute of Chemical Engineers, Cast Newsletter , 9-19. Maciejowski, J. M. (2002). Predictive Control With Constraints. Essex, England: Pearson Education Limited.
Referncias
227
Matos, A. S. (2006). Engenharia de Controlo do Processo e Controlo Estatstico da Qualidade: Metodologia de Integrao Aplicada na Indstria da Pasta de Papel. Tese de Doutoramento . FCT/UNL DEMI, Monte de Caparica. Montgomery, D. C. (1994). Integrating statistical process control and engineering process control. Journal of Quality Technology , 26, 79-87. Montgomery, D. C. (2001). Introduction to Satistical Quality Control. John Wiley & Sons, Inc. Moyne, J., del Castillo, E., & Hurwitz, A. M. (2001). Run-to-Run Control in Semicondutor Nanufacturing. CRC press. Muth, J. F. (1960). Optimal Properties of Expontially Weighted Forecasts of Time Series With Permanent and Transitory Components . Journal of the American Statistical Association , 55, 299-306. Ogata, K. (1970). Engenharia de Controle Moderno. Brasil: Prentice-Hall. Ogata, K. (1997). Modern Control Engineering. PRENTICE HALL. Pan, R., & Del Castillo, H. (2003). E. Scheduling methods for statistical setup asjustment problems. Intenational Journal of Production Research , (41): 1467-1481. Reinsel, G. C. (1997). Elements of Multivariate Time Series Analysis. New York: SpringerVerlag. Schwarz, G. (1978). Estimating the dimension of a model. Ann. Statist. , 6, 461-464. Shu, L., Apley, D. W., & Tsung, F. (2002). Autocorrelated Process Monitoring Using Triggered Cuscore Charts. Quality AND Reliablity Engeneering Interantional , pp. 18, 411 421. Sulo, P., & Vandevan, M. (1999). Optimal adjustment strategies for a process with run to run variation and 0-1 quality loss. IIE Trans. , 31:1135-1145. Taguchi, G. (1987). Systems of Experimental Design, Vol. 2. Unipub, Kraus International Publications, White Plains, NY. Teukolsky, S. A., Vetterling, W. T., & Flannery, B. P. (2007). Numerical Recipes: The Art of Scientific Computing. Cambrige, England. Vander Weil, S. (1996). Monitoring processes that wander using integrated moving average models. Technometrics , 38, 139-151. Vander Weil, S. T. (1992). Algorithmic statistical process control: concepts and an application. Technometrics , 34, 286-297. Vanli, O. A., & Del Castillo, E. (NOVEMBER de 2007). Closed-Loop System Identification for Small Samples With Constraints. TECHNOMETRICS , VOL. 49, NO. 4, 382-394. Wardell, D. G. (1994). Run-length distributions of special-cause control charts for correlated processes. Technometrics , 36, 3-17.
ANEXOS
229
ANEXOS