02 35557

Utilizando Redes Neurais Artificiais no Controle de Robs Mveis Aplicados ao Combate de Incndios Florestais
Gustavo Pessin1, Fernando Osrio1, Soraia Musse2, Vincius Nonnemmacher3, Sandro Souza Ferreira3
1
PIPCA Universidade do Vale do Rio dos Sinos (UNISINOS) Av. Unisinos 950 So Leopoldo RS Brasil Faculdade de Informtica PUC-RS Av. Ipiranga, 6681 Porto Alegre RS Brasil
2
GT JEDi Universidade do Vale do Rio dos Sinos (UNISINOS) Av. Unisinos 950 So Leopoldo RS Brasil
fosorio@unisinos.br, soraia.musse@pucrs.br, {pessin, vnonnenmacher, sandro.s.ferreira}@gmail.com
Resumo. O objetivo deste artigo detalhar o projeto e o desenvolvimento de um sistema multi-agente que opera em um ambiente virtual de simulao realstica1. Neste sistema, uma equipe heterognea de agentes autnomos trabalha cooperativamente a fim de realizar com sucesso a identificao e o combate de incndios florestais, sem interveno humana. Os robs de combate so fisicamente simulados e as informaes sensoriais de cada rob (e.g. GPS, bssola, sonar) servem de entrada para uma Rede Neural que controla os atuadores do veculo para assim realizar navegao com desvio de obstculos de um ponto aleatrio do terreno at um ponto de atuao no combate ao incndio. Os resultados das simulaes demonstram que a Rede Neural controla satisfatoriamente os robs mveis e que o sistema proposto pode vir a ter um papel muito importante no planejamento e execuo de operaes reais de combate a incndios florestais.
1. Introduo
Com a evoluo das pesquisas em robtica, cada vez mais os robs esto se tornando complexos em termos fsicos. A grande variedade de estudos em morfologia robtica tem desenvolvido variaes de robs dotados de diversos meios de locomoo (e.g. pernas, rodas, esteiras). Em paralelo a este desenvolvimento temos a evoluo constante de uma gama extremante grande de sensores (e.g. sistemas de viso, posicionamento, deteco de obstculos). O desenvolvimento de algoritmos e tcnicas para coordenar estes conjuntos fsicos em um ambiente dinmico um desafio extremante complexo [Go et al. 2004]. Dotar robs autnomos de capacidade de raciocnio inteligente e de interao com o meio em que esto inseridos uma rea de pesquisa que tem atrado a ateno de um grande nmero de pesquisadores [Dudek and Jenkin 2000]. Existem diversas reas onde a habilidade de um nico agente autnomo no suficiente ou
Cdigo-fonte e vdeos das simulaes disponveis em http://pessin.googlepages.com
eficiente para a realizao de uma tarefa, em alguns destes casos, como patrulhamento, vigilncia, resgate ou explorao o mais indicado a aplicao de sistemas multirobticos. Sistemas multi-robticos so sistemas onde robs autnomos trabalham cooperativamente a fim de cumprir uma misso, podendo existir interao entre os robs ou no [Osagie 2006]. Um grande sonho de nossa sociedade a aplicao de sistemas robticos substituindo atividades que coloquem em risco a vida humana, em atividades onde a atuao de humanos deficitria ou onde a atuao humana de certa forma ineficiente. A tarefa de monitorao e combate de incndios em reas florestais um caso onde a aplicao de um sistema multi-robtico poderia diminuir consideravelmente os prejuzos humanos, materiais e ambientais. Com relao a incndios florestais, anualmente registram-se cerca de 45.000 incndios nas florestas da Europa. Entre 1989 e 1993, s na zona mediterrnea 2,6 milhes de hectares florestais foram destrudos pelo fogo, o equivalente ao desaparecimento do mapa de um territrio com a dimenso da Blgica em cinco anos [CE 2006]. Os incndios florestais causam diversos tipos de danos humanos, materiais e ambientais. Danos ambientais na fauna e flora afetam desde o solo at o aspecto de sobrevivncia de reas no incendiadas, prejudicando os ambientes naturais e o planejamento florestal. As perdas humanas so mais dramticas, onde este custo dificilmente pode ser quantificado. Quanto a prejuzos humanos, por exemplo, na Austrlia, em 1983 um incndio que atingiu cerca de 400.000ha matou 75 pessoas. No Canad e EUA, incndios entre 1969 e 1994 mataram cerca de 52 pessoas. No Brasil, um incndio no Paran, em 1973 provocou 110 mortes [LIF 2006]. A extenso territorial do Brasil e a diversidade de sua cobertura vegetal, bem como o nmero expressivo de ocorrncias de incndios florestais verificados no pas, so fatores que enfatizam a necessidade de um sistema cada vez mais aprimorado e consistente de deteco e combate de incndios florestais [Batista 2004]. Diversas iniciativas a fim de incrementar a capacidade de reao de rgos pblicos e civis no sentido de evitar desastres tem sido uma das preocupaes junto a rgos como a Secretaria Nacional de Defesa Civil, levando a criao de novos CEPEDs (Centro de Estudos para a Preveno de Emergncias e Desastres). Importantes iniciativas, como a RBV Rede Brasileira de Visualizao, financiada pela FINEP, tambm tem sido incentivadas, onde a competncia de Segurana e Defesa (Civil e Militar) da Rede vem sendo foco de desenvolvimentos junto a nossa Universidade e na qual este projeto se integra. Nossas principais metas neste projeto so: (i) Recolher informaes sobre dados florestais, tipos de vegetao, topografia, e comportamento de incndios para criar o ambiente virtual mais realista possvel; (ii) Simular incndios em florestas, reproduzindo de forma bastante realista o ambiente e a propagao dos focos de incndio; (iii)_Pesquisar ferramentas e tcnicas de combate incndios florestais utilizadas por bombeiros; (iv) Implementar a simulao de agentes mveis autnomos colaborativos capazes de formar uma brigada de combate a incndios; (v) Estudar mtodos de aprendizado de mquina e suas vantagens para o modelo; e (vi) Estudar a robustez das aes dos agentes pela leitura de dados de sensores sujeitos a erros.
Neste artigo apresentamos na Seo 2 caractersticas importantes de robtica mvel que tenham relao com as necessidades deste trabalho. Na Seo 3 descrevemos brevemente conceitos de simulao e modelagem, as ferramentas pesquisadas e as bibliotecas de simulao selecionadas para o desenvolvimento do trabalho. Na Seo 4
descrevemos tcnicas e operaes reais de identificao e combate a incndios florestais. Na Seo 5 descrevemos o ambiente desenvolvido, a operao multi-agente de identificao e combate, o desenvolvimento e a aplicao da Rede Neural no controle dos robs mveis. Finalizamos apresentando a concluso do trabalho realizado.
2. Robtica Mvel
Um rob mvel um dispositivo mecnico montado sobre uma base no fixa, que age sob o controle de um sistema computacional, equipado com sensores e atuadores que o permitem interagir com o ambiente [Marchi 2001, Bekey 2005]. A interao com o ambiente se d atravs de ciclos de percepo-ao que consistem em trs passos fundamentais: (i) Obteno de informao atravs de sensores; (ii) Processamento das informaes para seleo de ao; e, (iii) Execuo da ao atravs do acionamento dos atuadores. Esse conjunto de operaes, em uma anlise superficial, pode parecer simples, porm o controle robusto de sistemas robticos tem complicaes fsicas e mecnicas (como cinemtica e dinmica), eletrnicas (como falta de preciso de sensores) e computacionais que tornam a criao de um conjunto de regras uma tarefa rdua e sujeita a erros. Sensores so os mecanismos de percepo de um rob e realizam medies fsicas (e.g. contato, distncia, orientao, temperatura), provm sinais ou dados crus que precisam ser interpretados pelo crebro do rob. A interpretao destes sinais deve ser a nica maneira de um rob autnomo entender o ambiente que o cerca para poder realizar as mudanas de ao necessrias [JPL/NASA 2007]. Atuadores so os mecanismos de ao de um rob (e.g. motores, pistes, braos manipuladores), controlados por circuitos eletrnicos que recebem valores de ao, valores estes que devem ser calculados pelo crebro do rob e devem estar de acordo com especificaes de fabricantes [JPL/NASA 2007].
3. Simulao e Modelagem
Experimentos em robtica mvel podem ser realizados de duas formas: diretos em um rob real ou em um rob simulado em um ambiente virtual realista [Pfeifer e Scheier 1999]. Usualmente, experimentos em robtica mvel utilizando um rob real exigem enorme despendimento de tempo e de recursos financeiros. Para que seja possvel a implementao fsica real, o sistema multi-agente que propomos deve ser projetado, desenvolvido e testado anteriormente em ambientes de simulao realsticos. A simulao de sistemas robticos especialmente necessria para robs caros, grandes, ou frgeis [Go et al. 2004]. uma ferramenta extremamente poderosa para agilizar o ciclo de desenvolvimento de sistemas de controle robticos eliminando desperdcio de recursos, tanto financeiros como computacionais. Para que uma simulao seja til, entretanto, ele deve capturar caractersticas importantes do mundo fsico, onde o termo importantes tem relao ao problema em questo [Go et al. 2004]. No caso deste trabalho, fundamental que existam restries fsicas no modelo e que exista a possibilidade de trabalho em um terreno irregular, provido de obstculos. Para o desenvolvimento deste trabalho foram pesquisadas algumas ferramentas de simulao, porm, nenhuma mostrou possuir o conjunto completo das caractersticas requisitadas. Uma pequena descrio de cada uma das ferramentas pesquisadas fornecida a seguir.
O Microsoft Robotics Studio (msdn.microsoft.com/robotics) tem como objetivo prover um ambiente para desenvolvimento de simulao robtica. Permite a simulao em terrenos irregulares e livre apenas para uso no comercial. O desenvolvimento dos sensores, dos controles inteligentes e da comunicao entre os robs depende de programao (e.g. C#, VB.NET). O Webots (www.cyberbotics.com) um simulador de robs mveis que tem como base a biblioteca de simulao fsica ODE, inclui modelos prontos de alguns robs comerciais e modela sensores com a capacidade de deteco de obstculos, viso, e manipuladores simples. O usurio pode programar cada rob utilizando C/C++. um produto comercial. Outros ambientes de simulao estudados foram o Khepera Simulator (diwww.epfl.ch/lami/team/michel/khep-sim), o Mission Simulation Facility (ase.arc.nasa.gov/msf), o JUICE (www.natew.com/juice) e o Simulator BOB (www.tu-harburg.de/ti6/mitarbeiter/ pst/Sim/Simulator.html). Um dos requisitos bsicos para nosso ambiente de simulao que todas as bibliotecas de programao sejam software livre e em linguagem C/C++. As bibliotecas utilizadas no desenvolvimento do sistema so: (i) Open Dynamics Engine: (www.ode.org) uma biblioteca desenvolvida para a simulao fsica de corpos rgidos articulados [Smith 2006]. utilizada para o desenvolvimento dos robs e do mundo colisivo. Uma estrutura articulada criada quando corpos rgidos so conectados por algum tipo de articulao, como, por exemplo, um veculo terrestre que tem a conexo de rodas em um chassi. A ODE no tem como objetivos realizar simulao de outras dinmicas alm da dinmica de corpos rgidos (e.g. ondas, fludos, corpos flexveis, fraturas). O sistema de deteco de coliso nativo e suporta diversas primitivas (e.g. esfera, caixa, cilindro, plano, raio). A utilizao da ODE no nosso ambiente fundamental por fornecer restries fsicas, principalmente na definio da morfologia dos robs; (ii) Open Scene Graph: (www.openscenegraph.org) uma biblioteca para desenvolvimento de aplicaes grficas 3D de alta performance. Baseada no conceito de grafos de cena, prov ao desenvolvedor um ambiente orientado a objeto sobre a OpenGL (www.opengl.org), liberando este da necessidade de implementao e otimizao de chamadas grficas de baixo nvel. Um grafo de cena permite a representao de objetos em uma cena com uma estrutura que permite a criao de grupos que podem compartilhar propriedades, assim, podemos definir uma propriedade comum em um nvel hierrquico mais alto e todos os objetos inferiores recebero esta propriedade [Barros et al. 2007]; (iii)_DrawStuff: como a ODE completamente independente de visualizador, iniciar a criao dos corpos e das simulaes pode ser uma tarefa bastante rdua caso no tenhamos uma forma simples e fcil de visualizar os objetos. Por este motivo, a biblioteca DrawStuff disponibilizada em conjunto com a ODE. Basicamente, o DrawStuff um ambiente de visualizao de objetos 3D que tem o propsito de permitir a demonstrao visual da ODE sendo uma biblioteca bastante simples e rpida para utilizao; (iv)_Demeter: (www.tbgsoftware.com) uma biblioteca desenvolvida para renderizar terrenos 3D, desenvolvida para ter rpida performance e boa qualidade visual, pode renderizar grandes terrenos em tempo-real sem necessidade de hardware especial, depende da Simple DirectMedia Layer (www.libsdl.org) para realizar o tratamento das texturas do terreno e da Geospatial Data Abstraction Library (www.gdal.org) para carregar arquivos de elevao.
4. Tcnicas Reais de Identificao e Combate de Incndios Florestais

A fim de melhor entender como proceder no combate a incndios florestais, e assim planejar as estratgias a serem implementadas nos agentes autnomos, foi realizado um estudo sobre as tcnicas reais de operao. Este estudo teve como base os trabalhos de [Antunes 2000, Batista 2004, CPTEC/INPE 2006, LIF 2006, Remel and Pereira 2001]. A operao de combate ou supresso de um incndio envolve seis etapas distintas [LIF 2006]: (i) Deteco: tempo decorrido entre a ignio ou incio do fogo e o momento que ele visto por algum, alguns mtodos so o uso das torres de vigilncia, patrulhamento terrestre, patrulhamento por avio ou imagens de satlites; (ii) Comunicao: tempo compreendido entre a deteco do fogo e o recebimento da informao por um responsvel; (iii) Mobilizao: tempo gasto entre o recebimento da informao da existncia do fogo e a sada do pessoal para combate; (iv) Deslocamento: tempo compreendido entre a sada do pessoal de combate e a chegada da primeira turma ao local do incndio; (v) Planejamento: tempo gasto pelo responsvel pelo combate (QG) para avaliar o comportamento do fogo e planejar a estratgia de combate; e (vi) Combate: tempo consumido na operao de combate ou eliminao do incndio. Existem quatro mtodos de combate ao fogo nos incndios florestais [LIF 2006]: (i)_Mtodo direto: usado quando a intensidade do fogo permite uma aproximao suficiente da brigada linha de fogo, so usadas as seguintes tcnicas e materiais: gua (bombas costais, baldes ou moto-bombas); terra (ps); ou batidas (abafadores); (ii)_Mtodo paralelo ou intermedirio: usado quando no possvel o mtodo direto e a intensidade do fogo no muito grande, consiste em limpar, com ferramentas manuais, uma estreita faixa, prxima ao fogo, para deter o seu avano e possibilitar o ataque direto; (iii)_Mtodo indireto: usado em incndios de intensidade muito grande, consiste em abrir aceiros com equipamento pesado (e.g. trator, motoniveladeira), utilizando ainda um contra-fogo, para ampliar a faixa limpa e deter o fogo, antes que chegue ao aceiro; e (iv)_Mtodo areo: usado nos incndios de copa, de grande intensidade e rea e em locais de difcil acesso s brigadas de incndio, so usados avies e helicpteros, especialmente construdos ou adaptados para o combate ao incndio.
A rapidez e a eficincia na deteco e monitoramento dos incndios florestais so fundamentais para a viabilizao do controle do fogo, reduo dos custos nas operaes de combate e atenuao dos danos. Para pases de grande extenso territorial, como o Brasil, o monitoramento dos incndios florestais atravs de imagens de satlites o meio mais eficiente e de baixo custo quando comparado com os demais meios de deteco [Batista 2004]. O lanamento em 1972 do primeiro satlite Landsat possibilitou detectar alteraes nas reas florestais do espao. Desde ento, as imagens termais e de infravermelho tm sido usadas na deteco de incndios e estudos de mapeamento, permitindo que reas queimadas e no queimadas sejam detectadas atravs do contraste entre os gradientes trmicos [Remel e Pereira 2001].
5. Ambiente de Simulao
O prottipo do sistema foi implementado em C++, a biblioteca OSG responsvel pela sada grfica do prottipo, a biblioteca Demeter responsvel pelo terreno irregular e a biblioteca ODE responsvel pelo realismo fsico, tanto da morfologia robtica como da coliso entre os objetos presentes no ambiente (e.g. robs, rvores, inclinao de terreno). A base do realismo de interao o uso integrado das bibliotecas de
programao ODE, OSG e Demeter. Este conjunto permite que os robs simulados fisicamente respeitem questes como gravidade, inrcia e atrito. Por exemplo, mantendo uma fora f constante nos motores lineares (torque) um veculo ter velocidade v em regies planas, em regies de declive ter v maior e em aclives ter v menor. A implementao do prottipo (Figura 1) iniciou com a criao de um mapa que simula a integrao das informaes de vegetao, topografia e comportamento de fogo baseado em [Antunes 2000, Batista 2004, CE 2006, CPTEC/INPE 2006, Koproski 2005, LIF 2006, Remmel e Perera 2001]. O estudo dos modelos de florestas e resduos florestais de grande importncia para o aprimoramento dos modelos de simulao a serem implementados em ambientes virtuais [Pessin et al. 2007]. A criao dos mapas teve como base cartas topogrficas e o mapa de modelos de combustveis florestais do Ministrio da Agricultura do Brasil.
(a)
(b)
Figura 1. Ambiente completo (a) Um veculo preso em uma rvore e (b) Vista do grupo em deslocamento at o incndio.
Para a simulao da vegetao e correta propagao do incndio, existe uma matriz oculta sob o terreno. Esta matriz possui, para cada rea do terreno, o tipo de vegetao presente, assim, considerando orientao do vento, intensidade do vento e tipo de vegetao de uma rea podemos construir a simulao de propagao do fogo. O fogo pode ser iniciado em uma posio aleatria ou parametrizado em uma posio inicial fixa. A velocidade de propagao respeita dados do modelo retirados de [Koproski 2005], considerando intensidade do vento e sua orientao. Quanto ao vento, tanto a sua intensidade como a sua orientao podem ser geradas aleatoriamente ou configurados a partir de dados parametrizados pelo usurio. O tempo de permanncia do fogo em uma rea relacionado diretamente ao tipo da vegetao presente e se comporta baseado nos valores de tipo de vegetao, inclinao do terreno, intensidade e orientao do vento. Desta forma a propagao do fogo busca simular de modo bastante realstico a forma como o fogo se propagaria em um ambiente real. A simulao da comunicao feita utilizando um sistema baseado em Quadro-Negro (blackboard) [Rezende 2003]. O sistema de comunicao simula a troca de mensagens que vo do agente monitor para o agente lder, do agente lder aos agentes de combate, e dos agentes de combate ao agente lder. Existem casos de comunicao um para um e de um para todos. A fila usada como funo de Quadro-Negro armazena as seguintes informaes: indicador de remetente, indicador de destinatrio, e tipo da mensagem (e.g. aviso de incndio, aviso de fim de incndio, negociao de times, posio do incndio). No ambiente desenvolvido, cada rvore existe como um modelo OSG e como um cilindro ODE, assim, o veculo da Figura 1(a) est, na verdade, colidindo com um
cilindro (no visualizado). O ambiente permite que, atravs de parmetros, possamos habilitar ou no a exibio dos objetos fsicos ao invs de apenas a sua representao grfica, neste exemplo, uma rvore. 5.1. Operao de Identificao e Combate de Incndio O ambiente conta com um grupo de n robs de comportamento reativo (controlados por uma RNA explicada na prxima Seo) e com um agente deliberativo (mecanismo de planejamento). Em se considerando arquiteturas de sistemas multi-agente, o ambiente desenvolvido possui controle centralizado de planejamento e controle distribudo de aes (local em cada rob mvel). Usamos o ambiente para simular a seguinte operao: um agente monitor (satlite) monitora o terreno da rea florestal, ao identificar uma rea com foco de incndio envia uma mensagem para o agente lder. Esta mensagem contm a posio (x,y) do incndio (simulando uma posio UTM) e a densidade da vegetao na rea. O agente lder o agente responsvel pela definio das posies de atuao dos robs bombeiros no combate ao incndio. Aps receber o aviso de incndio do agente monitor, o agente lder envia para todos os agentes de combate uma mensagem informando incio de incndio na posio (x,y) e recebe a distncia vetorial d (Equao_1) de cada agente de combate ao incndio.
d ( P, Q) = ( x2 x1 ) 2 + ( y2 y1 ) 2
(1)
Aps o agente lder receber as respostas dos agentes de combate, envia mensagens de solicitao de formao para atuao da seguinte forma: se no existe vento, solicita os 8 agentes mais prximos ao incndio em formao circular eqidistante com um raio predeterminado; se existe vento, solicita os 4 agentes mais prximos ao incndio em formao semi-circular (ferradura) no sentido contrrio ao do vento, com raio definido de acordo com a intensidade do vento. Esta formao baseada em regras e pode ser visualizada nas Figuras 2 e 3. A regra pr-programada que define a posio final de cada rob na composio da formao da equipe (quando circular eqidistante) pode ser vista nas Equaes 2 e 3. 360 (2) x f = xa + r cos i q 180 360 (3) y f = ya + r sen i q 180 Considere xf e yf como as coordenadas da posio final do agente, xa e ya como as coordenadas da posio central do incndio, r como o raio de atuao, q a quantidade total de agentes e i o ndice do agente. As posies so negociadas e confirmadas com a comunicao entre os agentes da equipe. Os agentes do time possuem quatro sensores de temperatura que servem como alerta, quando a temperatura de um deles excede o mximo especificado, o agente se desloca no sentido do sensor com a menor temperatura e solicita ao agente lder a atualizao da formao do time. O comportamento dos agentes de combate reativo, deslocando-se em direo a posio de seu objetivo especfico desviando de obstculos. O mtodo de combate de incndio simulado o mtodo indireto. Os agentes de combate simulados so motoniveladoras que tem como finalidade cercar o foco de incndio e criar um aceiro (rea livre de
vegetao onde o fogo se extingue pela falta de combustvel). Esta operao pode ser entendida com as Figuras 2 e 3. Quanto ao controle de posicionamento, um sensor do tipo GPS simulado em cada rob. Em experimentos que realizamos com um GPS Garmin Etrex (www.garmin.com) obtivemos um erro mdio de 18,6 metros. Considerando que cada agente possui seu prprio GPS o tratamento deste erro crucial na criao dos aceiros. Tratamos esta informao de duas maneiras, a primeira faz com que o erro mdio deste sensor durante o deslocamento seja usado somado a distncia de criao do aceiro e tambm somado ao final da rea de criao, como mostra a Figura 2(b).
(a)
(b)
Figura 2. Exemplo de formao de combate quando o sentido do vento de 270 e existem 4 agentes de combate: (a) No considera erro no GPS e (b)_Considerando erro no GPS, apresentando limites propositalmente redundantes
A Figura 2(a) apresenta as posies e trajetrias com posicionamento perfeito, o que no possvel de se obter em uma situao real. Devido ao erro de posicionamento do GPS no possvel se estabelecer uma rota que se encaixe perfeitamente como a apresentada nesta Figura. Deste modo a preparao do aceiro (semi-crculo indicado na figura) no ser executada de forma correta. A Figura 2(b) apresenta as correes adicionadas ao algoritmo de modo a obter uma trajetria que permita criar um aceiro incluindo o erro do GPS (eGPS) no modelo de deslocamento dos agentes. As Figuras 3(a) e 3(b) demonstram os resultados obtidos em uma das simulaes realizadas com o prottipo 2D.
(a)
(b)
Figura 3. Simulao 2D considerando o erro de GPS: (a) Trajetrias dos robsbombeiros e (b) Criao do aceiro. Ambas apresentam limites propositalmente redundantes
5.2. Morfologia dos Robs Mveis Os robs mveis foram desenvolvidos com a biblioteca de simulao de corpos rgidos artculos ODE. A Figura 4(b) apresenta o veculo desenvolvido. Dada a existncia de
restries fsicas, a nica maneira de controlar o veculo das Figuras 4(b) e 4(c) com a aplicao de foras em seus dois motores simulados, que so: um motor angular (para o giro do volante) e um motor linear (para o torque). Alm do GPS e termmetro descritos na Seo anterior, cada rob possui tambm uma bssola (Figura 4(a)), responsvel pela obteno da orientao do veculo e, em conjunto com o GPS, responsvel pela obteno do azimute (orientao em que deve se deslocar para atingir o alvo). Os sensores de distncia so sonares simulados, apresentando as caractersticas de capacidade de medir distncias entre 15cm e 11m, como o Polaroid 6500 (www.senscomp.com). Nas Figuras 4(b) e 4(c), cada trs linhas brancas representam um sensor.
(a)
(b)
(c)
Figura 4. Sensores desenvolvidos: (a) A bssola responsvel pela orientao, e, junto com o GPS, permite obter o azimute para o alvo, (b)_e_(c)_Sensores de distncia.
5.3. Rede Neural Artificial Quando um rob recebe a coordenada da posio do incndio do agente lder, ele deve se deslocar de sua posio atual (aleatria) at a posio de atuao. Para realizar esta navegao, desviando de obstculos, o agente usa uma Rede Neural Artificial (RNA) do tipo backpropagation. As entradas da RNA so obtidas pelos sensores presentes no rob e as sadas so as foras a serem aplicadas nos atuadores. A RNA possui 9 entradas: orientao do veculo e orientao para o alvo (obtidos atravs de bssola e GPS simulados) mais as proximidades de obstculos medidas por 7 sensores simulados do tipo sonar. As sadas so: fora a aplicar no motor linear (torque, de 0.0 a 3.0) e fora a aplicar no motor angular (giro da barra da direo, de 0.8 a 0.8). A base de dados para treinamento da RNA foi obtida a partir de um sistema de regras simples, rodamos 15 simulaes com diferentes pontos de incio e destino para obter dados especficos de navegao e 12 simulaes para obter dados de desvios de obstculos, obtendo um total de 7.720 registros. Esta base de dados foi dividida em 70% para treino e 30% para teste, e, usando o SNNS (www-ra.informatik.uni-tuebingen.de/SNNS/) foram geradas seis Redes Neurais Artificiais com 4, 9, 18, 24, 30 e 36 neurnios na camada oculta. Foi realizado o treino de cada RNA e anlise de 500, 1.000, 1.500 e 2.000 ciclos. A Tabela 1 apresenta os dados de treino e teste das Redes Neurais desenvolvidas, os valores apresentados so o Erro Mdio Absoluto (Mean Absolute Error - MAE) (Equao 4).
EMAE = 1 N
x x
i =1 i
_ i
(4)
Tabela 1. Erro Mdio Absoluto das RNAs.

Exp. 1 Treino Teste Giro Veloc. Giro Veloc. 0,228 0,479 0,223 0,478 0,170 0,478 0,174 0,477 0,136 0,424 0,139 0,424 0,138 0,412 0,143 0,412 0,235 0,465 0,229 0,462 0,144 0,413 0,145 0,413 0,131 0,402 0,136 0,401 0,128 0,397 0,134 0,396 0,231 0,468 0,223 0,463 0,133 0,403 0,138 0,405 0,134 0,396 0,139 0,399 0,137 0,391 0,142 0,393 0,190 0,412 0,191 0,410 0,142 0,314 0,135 0,318 0,127 0,285 0,128 0,292 0,096 0,261 0,100 0,269 0,145 0,383 0,150 0,384 0,135 0,355 0,139 0,358 0,124 0,338 0,128 0,341 0,116 0,319 0,121 0,323 0,142 0,452 0,144 0,445 0,139 0,400 0,142 0,401 0,137 0,374 0,140 0,374 0,133 0,360 0,136 0,359 Exp. 2 Treino Teste Giro Veloc. Giro Veloc. 0,220 0,450 0,222 0,445 0,158 0,401 0,161 0,404 0,150 0,388 0,153 0,390 0,149 0,386 0,152 0,389 0,135 0,454 0,139 0,453 0,131 0,406 0,135 0,408 0,130 0,395 0,135 0,398 0,129 0,391 0,133 0,394 0,290 0,476 0,275 0,473 0,131 0,408 0,136 0,409 0,125 0,344 0,130 0,346 0,112 0,311 0,117 0,316 0,209 0,474 0,203 0,473 0,177 0,392 0,176 0,392 0,140 0,220 0,140 0,229 0,130 0,205 0,132 0,215 0,159 0,382 0,157 0,383 0,142 0,340 0,145 0,346 0,130 0,317 0,135 0,325 0,126 0,304 0,132 0,311 0,229 0,471 0,221 0,464 0,136 0,402 0,138 0,401 0,123 0,373 0,126 0,374 0,114 0,342 0,118 0,346 Exp. 3 Treino Teste Giro Veloc. Giro Veloc. 0,230 0,472 0,227 0,472 0,153 0,437 0,157 0,438 0,142 0,411 0,147 0,412 0,143 0,408 0,149 0,409 0,141 0,426 0,146 0,428 0,128 0,376 0,134 0,379 0,125 0,361 0,131 0,366 0,125 0,349 0,132 0,354 0,183 0,475 0,186 0,471 0,137 0,416 0,141 0,417 0,134 0,392 0,139 0,396 0,135 0,382 0,141 0,387 0,172 0,446 0,171 0,444 0,130 0,340 0,133 0,341 0,132 0,289 0,136 0,294 0,112 0,183 0,116 0,194 0,188 0,309 0,187 0,317 0,127 0,294 0,131 0,301 0,122 0,288 0,126 0,296 0,115 0,283 0,119 0,291 0,246 0,470 0,232 0,462 0,172 0,452 0,147 0,446 0,141 0,397 0,143 0,396 0,137 0,384 0,141 0,385
RNA 9x4x1 9x4x1 9x4x1 9x4x1 9x9x1 9x9x1 9x9x1 9x9x1 9x18x1 9x18x1 9x18x1 9x18x1 9x24x1 9x24x1 9x24x1 9x24x1 9x30x1 9x30x1 9x30x1 9x30x1 9x36x1 9x36x1 9x36x1 9x36x1
Ciclos 500 1000 1500 2000 500 1000 1500 2000 500 1000 1500 2000 500 1000 1500 2000 500 1000 1500 2000 500 1000 1500 2000
A RNA que apresentou o menor MAE tanto no giro como na velocidade foi a com 24 neurnios na camada oculta, com 2.000 ciclos de treino da terceira semente aleatria. Esta RNA foi convertida em um programa C e utilizada nos robs. 5.4. Aplicao da Rede Neural Artificial Aps a implementao da RNA no controle de navegao com desvio de obstculos nos robs mveis, realizamos uma srie de simulaes com o ambiente contendo 3 robs, com pontos de incio e destino aleatrios e com uma quantidade parametrizada de cilindros. Os resultados podem ser visto nas Tabelas 2 e 3. Para tornar as simulaes mais rpidas, trabalhamos em um terreno pequeno, representado 80m x 100m, cada veculo tem dimenses de 2,5m x 3m e cada cilindro tem dimetro de 1m. A Figura 5 apresenta imagens de seqncias de uma simulao onde podemos ver o resultado correto de navegao com desvio e o posicionamento final dos robs.
Tabela 2. Resultado das simulaes com 10 cilindros.
Simulao 1 2 3 4 5 6 Quantidade de cilindros 10 10 10 10 10 10 Quantidade de chegadas satisfatrias 3 3 2 3 3 3 Quantidade de colises 0 0 0 0 0 0 Quantidade de trajetos errados 0 0 1 0 0 0
Tabela 3. Resultado das simulaes com 20 cilindros.

Simulao 7 8 9 10 11 12 Quantidade de cilindros 20 20 20 20 20 20 Quantidade de chegadas satisfatrias 2 3 2 3 1 2 Quantidade de colises 0 0 0 0 1 1 Quantidade de trajetos errados 1 0 1 0 1 0
Nas duas colises observadas, apenas o sensor frontal identificava o cilindro, e o veculo seguia em frente com velocidade reduzida. Esse tipo de desvio existia na base de treino, que devia priorizar giro para direita, porm, por ter produzido alguns erros na simulao, encoraja a construo de uma base de treino maior.
(a)
(b)
(c)
(d)
Figura 5. Seqncias de uma simulao com navegao e desvio satisfatrios.
6. Concluso
O objetivo deste trabalho foi detalhar o projeto e o desenvolvimento de um sistema multi-agente que opera em um ambiente virtual de simulao realstica. Onde uma equipe heterognea de agentes autnomos trabalha cooperativamente a fim de realizar com sucesso a identificao e o combate de incndios em reas florestais, sem interveno humana. A abordagem implementada adota estratgia centralizada, mas com controle de ao distribudo, onde cada agente possui autonomia na execuo das tarefas que lhe so passadas. Os robs de combate so fisicamente simulados com a biblioteca ODE e as informaes sensoriais de cada rob (e.g. GPS, bssola, sonar) servem de entrada para uma Rede Neural que controla os atuadores do veculo para assim realizar navegao com desvio de obstculos de um ponto aleatrio at um ponto de atuao no combate ao incndio. O ambiente desenvolvido apresenta simulao de propagao de fogo baseado em tipos de vegetao, orientao e intensidade do vento. A comunicao atravs do uso de blackboard se mostrou bastante prtica e simples de
implementar. Os resultados das simulaes demonstram que a Rede Neural controla satisfatoriamente os robs mveis e que o sistema proposto pode vir a ter um papel muito importante no planejamento e execuo de operaes reais de combate a incndios florestais e possivelmente em outras tarefas similares, como acidentes nucleares ou desastres ambientais.
Referncias
Antunes, M. A. H. (2000) Uso de satlites para deteco de queimadas e para avaliao do risco de fogo. Ao Ambiental, 12:24-27. Barros, L. M., Gonzaga, L., Raposo, A. B. (2007) Open Scene Graph: conceitos bsicos e aplicaes em realidade virtual, Tutorial on IX Symposium on Virtual and Augmented Reality (SVR). Batista, A. C. (2004) Deteco de incndios florestais por satlite, Revista Floresta 34, Mai/Ago, 237-241, Curitiba, Paran. Bekey, G. A. (2005) Autonomous Robots: From Biological Inspiration to Implementation and Control. Cambridge, USA: The MIT Press, 2005. 577 p. CE - Comisso Europia (2006) O que faz a Europa? Incndios florestais. http://ec.europa.eu/research/leaflets/disasters/pt/forest.html, setembro. CPTEC/INPE (2006) Centro de previso do tempo e estudos climticos - Instituto nacional de pesquisas espaciais, www.cptec.inpe.br/queimadas, outubro. Dudek, G., Jenkin, M. (2000) Computational Principles of Mobile Robotics Cambridge, London, UK: The MIT Press, 280 p. Go, J., Browning, B., Veloso, M. (2004) Accurate and flexible simulation for dynamic, vision-centric robots. International Joint Conference on Autonomous Agents. JPL/NASA (2007) Jet Propulsion Laboratory/NASA wwwrobotics.jpl.nasa.gov, maio. Koproski, L.P. (2005) O fogo e seus efeitos sobre a heperto e a mastofauna terrestre no parque nacional de Ilha Grande, Dissertao de mestrado, UFPR. LIF - Laboratrio de Incndios Florestais (2006) Pesquisas e projetos em preveno e combate de incndios florestais, UFPR, www.floresta.ufpr.br/~firelab, setembro. Marchi, J. (2001) Navegao de robs mveis autnomos: estudo e implementao de abordagens, Dissertao de Mestrado, Universidade Federal de Santa Catarina. Osagie, P. (2006) Distributed Control for Networked Autonomous Vehicles. Dissertao de Mestrado, KTH CSC, Royal Institute of Technology, Sweden. Osrio, F. S., Musse, S. R., Vieira, R., Heinen, M. R., Paiva, D. C. (2006) Increasing Reality in Virtual Reality Applications through Physical and Behavioural Simulation In: Proceedings of the Virtual Concept Conference. Springer Verlag, v.2, p. 1-45. Pessin, G., et al. (2007) Simulao Virtual de Agentes Autnomos para a Identificao e Controle de Incndios em Reservas Naturais, IX Symposium on Virtual and Augmented Reality (SVR), v.1, p. 236-245. Pfeifer, R., Scheier, C. (1999) Understanding Intelligence. Cambridge, Massachusetts, USA: The MIT Press. Remmel, T. K., Perera, A. H. (2001) Fire mapping in a northern boreal forest: assessing AVHRR/NDVI methods of change detection, Forest Ecology and Management 152:119-129. Rezende, S.O. (2003) Sistemas inteligentes: fundamentos e aplicaes, Ed. Manole, So Paulo. Smith, R. (2006) Open Dynamics Engine v0.5 User Guide.

02 35557

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

02 35557

Загружено:

Авторское право:

Доступные форматы

Utilizando Redes Neurais Artificiais no Controle de Robs Mveis Aplicados ao Combate de Incndios Florestais

fosorio@unisinos.br, soraia.musse@pucrs.br, {pessin, vnonnenmacher, sandro.s.ferreira}@gmail.com

Cdigo-fonte e vdeos das simulaes disponveis em http://pessin.googlepages.com

4. Tcnicas Reais de Identificao e Combate de Incndios Florestais

Tabela 1. Erro Mdio Absoluto das RNAs.

Tabela 3. Resultado das simulaes com 20 cilindros.

Figura 5. Seqncias de uma simulao com navegao e desvio satisfatrios.

Вам также может понравиться