Congreso Grave

Control cooperativo de sistemas multi-agentes y sus aplicaciones
Ileana Grave, Yu Tang y Mihir Sen
Resumen— En este trabajo se estudia el problema de sin- En la literatura, un algoritmo de consenso sin lı́der para
cronización de sistemas no lineales desde el punto de vista sistemas Lagragianos basado en el Laplaciano como matriz
de control. En él se unifican los principales conceptos sobre de interconexión se presenta en [2], mientras que en [3] se
la teorı́a de sincronización y se considera a cada uno de los
agentes como sistemas disipativos. Se diseñan nuevas leyes de considera el problema desde el punto de vista pasivo. Sin
control con diversos objetivos: El primero de ellos es lograr embargo, en ambos casos, la sincronización no se logra en
sincronización de velocidad o posición con retroalimentación de una referencia dada. Los trabajos mencionados anteriormente
posición, mientras que el segundo es obtener sincronización en tienen la limitante común, del uso de la velocidad en la ley
cierta posición deseada de sistemas Lagrangianos considerando de control; lo que representa un inconveniente en su imple-
a la posición como estado medible.
mentación. Cabe mencionar que el caso de sincronización
y seguimiento de trayectoria para sistemas Lagrangianos
I. INTRODUCCI ÓN
utilizando retroalimentación de posición es atacado en [4]
En la naturaleza pueden observarse comportamientos co- utilizando observadores.
operativos entre individuos; tales como parvadas de aves El resto del escrito se organiza como sigue. En la Sección
y bancos de peces que se reagrupan para evitar a los II se presentan los conceptos necesarios para estudiar sis-
depredadores. Otro tipo de fenómenos naturales, son los temas interconectados a partir de la teorı́a de grafos y la
grupos de luciérnagas que se iluminan al mismo tiempo, teorı́a de control. En la Sección III se desarrolla una variación
péndulos acoplados; entre otros [1]. Tales hechos ilustran el a la ley para sincronización de agentes disipativos con el
concepto de sincronización. Según la definición de la Real objetivo de lograr sincronización de velocidad o posición de
Academia Española, sincronizar es “hacer coincidir en el agentes distribuidos en una topologı́a bidireccional utilizando
tiempo dos o más movimientos o fenómenos”. como salida a la variable de posición. La Sección IV se
Desde el punto de vista de control, se han estudiado las trata el caso de sincronización con regulación empleando
condiciones que permiten llevar determinadas variables de retroalimentación de posición para sistemas Lagrangianos.
un grupo de sistemas (bajo una interconexión adecuada) Los resultados obtenidos se presentan en la Sección V y las
a cierto valor común mediante leyes de control locales; conclusiones en la Sección VI.
definido formalmente como consenso. Entre los problemas II. PRELIMINARES
de control abordados a partir de la teorı́a de sincronización se
La teorı́a de grafos es una herramienta útil para representar
encuentran: la formación de vehı́culos aéreos no tripulados,
la interconexión entre agentes. Una definición importante
redes sensoriales, generadores eléctricos, redes robóticas y
para el diseño de la ley de control se presenta a continuación:
la sincronización de osciladores caóticos, entre otros. Cada
Un grafo dirigido está fuertemente conectado si dos vértices
uno de estos grupos de sistemas está formado por sistemas
cualquiera pueden ser unidos por una trayectoria y está
autónomos que se comunican entre sı́ para cumplir con el
débilmente conectado si dos vértices cualquiera pueden ser
objetivo final; los cuales son conocidos como agentes. El
unidos por una trayectoria débil [5].
caso de interés en este estudio, es el de lograr sincronización
Otra forma general, compacta y ampliamente utilizada
entre agentes por medio de leyes de control locales.
para expresar la interconexión entre agentes es por medio
En esta trabajo, el problema de sincronización con retroali- de la matriz Laplaciana L [6], la cual se construye a través
mentación de posición a una posición deseada es resuelto por de la Matriz de Adyacencia y la Matriz de Grado de un grafo
medio de la utilización de un filtro de primer orden. En ella dirigido ponderado.
la teorı́a existente sobre técnicas de sincronización entrada- La Matriz de Adyacencia de un grafo dirigido ponderado
salida con acoplamiento lineal se utiliza para desarrollar A = [aij ] es aquella en la que los elementos aij son no
leyes de control basadas en retroalimentación de posición que negativos y se forma a partir de las conexiones que existen
permitan lograr sincronización de la variable de interés. Cada entre los nodos del grafo. Si existe un borde que conecta
uno de los agentes se considerará como una clase de sis- al elemento i con el elemento j (respetando la dirección
temas no-lineales, especı́ficamente sistemas disipativos. Los definida por el grafo), entonces al elemento aij se le asigna
resultados obtenidos se aplican a manipuladores robóticos el peso asociado, de lo contrario se le asigna el valor de cero.
interconectados donde además el consenso es forzado a cierta La Matriz de Grado ∆ = [∆ij ] de un grafo G es una
posición deseada. matriz diagonal donde
∆ij = 0, i 6= j

M. Sen pertenece al Departamento de Ingenierı́a Aeroespacial y Mecánica ∆=
de la Universidad de Notre Dame, Notre Dame, IN 46556. ∆ii = degout (vi ), i = j
Pn
degout (vi ) = j=1 aij es el grado de salida del nodo vi y se toma como salida a la variable filtrada zi y K está
y está dado por la suma de los elementos fila de la matriz definida como en la Ec. (4).
de adyacencia. La función candidata de Lyapunov para los N agentes del
A partir de las matrices anteriores, la Matriz Laplaciana sistema es
asociada al grafo G se construye como N N
1X X
(zi − zj )T (zi − zj )
X
V =2 Vi + (6)
L(G) = L = ∆ − A. (1) 2 i=1
i=1 j∈Ni
En el diseño de la ley de control, será necesario en donde Vi representa la función de almacenamiento de energı́a
algunas ocasiones representar a la matriz Laplaciana como para el i-ésimo agente y Ni es el conjunto de agentes
el producto de dos matrices, esto se puede lograr por medio transmitiendo sus salidas al agente i.
del producto de Kronecker. Del álgebra lineal, el producto La derivada de la función de Lyapunov, sustituyendo a la
de Kronecker de dos matrices A ∈ Rm×n y B ∈ Rp×p se ley de control (5) y a la Ec.(4), obtiene la forma
define como
N X
a11 B · · · a1n B
 
ẏiT Kd (zi − zj )
X
V̇ ≤ −2
A ⊗ B :=  .. .. .. mp×np
∈R (2) i=1 j∈Ni
 
. . .
N X
am1 B ··· amn B
(zi − zj )T A(zi − zj )
X
−
Una propiedad importante para A, B > 0, matrices positivas i=1 j∈Ni
definidas, es que el producto de Kronecker A⊗B es positivo N X
definido.
X
+ (zi − zj )Kd (ẏi − ẏj ) (7)
III. SINCRONIZACI ÓN DE SISTEMAS i=1 j∈Ni
MULTIAGENTES En la derivada de la función anterior, se aprecia que es nece-

En esta sección los resultados reportados por Chopra y sario reescribirla de manera conveniente para continuar con
Spong [3] se extienden con el fin de generar una nueva ley el diseño; lo que se logra aprovechando las caracterı́sticas del
de control basada en la retroalimentación de posición para grafo considerado. En él, existen dos trayectorias dirigidas
lograr sincronización de velocidad o posición de sistemas que van del primer al último agente, cruzando a todos los
(Qi , Si , Ri ) − Disipativos [7] del tipo Qi = 0, Si = 12 I agentes interconectados en forma ordenada. A una de estas
y Ri = 0 (sistemas pasivos). Las leyes de control obtenidas trayectorias se le denomina Nv y permite establecer las
se aplican a masas puntuales y los resultados finales se siguientes relaciones:
comparan con los del algoritmo original, tomado de [3], en N X
X
el que se utiliza retroalimentación de velocidad. (zi − zj )Kd (ẏi − ẏj ) =
Cada sistema es no lineal expresado en la forma i=1 j∈Ni
N X
ẋi = fi (xi ) + gi (xi )ui
(zi − zj )T Kd (ẏi − ẏj )
X
2 (8)
yi = hi (xi ), (3) i=1 j∈Nv
N X
con las variables del sistema definidas como xi ∈ Rn , la
ẏiT Kd (zi − zj ) =
X
entrada ui ∈ Rm y la salida yi ∈ Rm . En el diseño, se −2
i=1 j∈Ni
considera que los agentes están interconectados por medio
N X
de un grafo no dirigido en forma de anillo o configuraciones
(zi − zj )T Kd (ẏi − ẏj ),
X
en lı́nea. −2 (9)
i=1 j∈Nv
Como se mencionó anteriormente, el objetivo final es que
la ley de control contenga únicamente términos de posición, tales relaciones facilitan escribir la derivada de la función
por lo que se utiliza un filtro de primer orden para cada uno candidata de Lyapunov como
de los agentes con la siguiente dinámica N X
(zi − zj )T A(zi − zj ) ≤ 0.
X
żi = −Azi + Kẏi (4) V̇ = −2 (10)
i=1 j∈Ni
donde A = AT > 0 y K = KT > 0.
A continuación, se considera el conjunto E = {xi ∈
A. Sincronización de velocidad. Rn , i = 1, · · · , N |V̇ ≡ 0} caracterizado por todas las
A continuación, se diseña la ley de control para lograr sin- trayectorias en las que {(zi − zj )T A(zi − zj ) ≡ 0 ∀j ∈
cronización de velocidad con retroalimentación de posición Ni , ∀i = 1, · · · , N }. Por el principio de invarianza de
asumiendo que el sistema (3) es pasivo de ui → ẏi , donde LaSalle, todas las soluciones del sistema (3) en lazo cerrado
la entrada de control se considera de la forma con (5) convergen al conjunto invariante mas grande con-
X tenido en E, conforme t → ∞. La definición de grafo fuerte-
ui = −K (zi − zj ), i = 1, ..., N, (5) mente conectado permite concluir que existe sincronización
j∈Ni de la variable zi .
Dado que zi es la versión filtrada de la velocidad, donde
zi − zj ≡ 0 ⇒ ẏi − ẏj ≡ 0 1 T 1 1
(11) Vi = ėi Mi ėi + eTi Kp ei + zTi zi . (16)
2 2 2
existe sincronización de velocidad. Finalmente, se observa
que es posible alcanzar sincronización de velocidad uti- La derivada de la función candidata de Lyapunov corre-
lizando retroalimentación de posición. sponde a
IV. SINCRONIZACI ÓN DE SISTEMAS V̇ = 2ėTi {τi − Ci ėi − Kp ei − Kd zi }

LAGRANGIANOS + ėTi Ṁi ėi + 2eTi Kp ėi + zTi {−Azi + Kd ėi }
N X
Como una aplicación de la teorı́a de sincronización de
(zi − zj )T (żi − żj )
X
agentes, se muestra una aplicación de la teorı́a de sin- +
i=1 j∈Ni
cronización de agentes cuyo objetivo final es lograr sin-
N X
cronización de n robots totalmente actuados a cierta posición
(ei − ej )T Kps (ėi − ėj ),
X
+ (17)
deseada utilizando retroalimentación de posición. A lo largo
i=1 j∈Ni
de la Sección, se considera a cada robot representado por
la cual, aprovechando que la gráfica de interconexión tiene
Mi (qi )q̈i + Ci (qi , q̇i )q̇i + Gi (qi ) = τi , (12)
una trayectoria dirigida que cruza a todos los agentes y que
donde qi ∈ Rn son las coordenadas generalizadas para el Ṁi (qi ) − 2Ci (qi , q̇i ) es antisimétrica, puede reescribirse
sistema con n grados de libertad, τi ∈ Rn es el vector como
de fuerzas generalizadas, Mi (qi ) ∈ Rn×n es la matriz de N N X
inercia simétrica positiva definida, Ci (qi , q̇i )q̇i es el vector zTi Azi −2 (zi −zj )T A(zi −zj ). (18)
X X
V̇ = −2
de fuerzas Centrı́petas y de Coriolis y Gi (qi ) ∈ Rn es el i=1 i=1 j∈Nv
vector de fuerzas gravitacionales. La matriz Ci (qi , q̇i ) tiene
cierta propiedad que hace a la matriz Ṁi (qi ) − 2Ci (qi , q̇i ) Considerando el conjunto invariante donde zi ≡ 0 ⇒ q̇i = 0
antisimétrica [8]. y zi − zj ≡ 0 ⇒ q̇i − q̇j = 0, a partir del sistema (13) en
Cada uno de los robots es un sistema (Qi , Si , Ri ) − lazo cerrado con la entrada de control (14) se obtienen N
Disipativo del tipo Qi = 0, Si = 21 I y Ri = 0. Para ecuaciones de la forma
facilitar el diseño, la ley de control para lograr sincronización N
X X
se desarrolla a partir del sistema en lazo cerrado con la ley − Kp ei − Kps (ei − ej ) = 0. (19)
de control de regulación. i=1 j∈Ni
El objetivo de control en el caso de regulación tradicional,
es hacer que el error de posición ei = qi − qd y el error Para simplificar el resultado final, las ecuaciones anteriores
de velocidad ėi = q̇d , donde qd es la posición de referencia son expresadas en forma del producto de Kronecker a partir
para las variables de configuración, tiendan a cero ei (t) → 0, del vector de error e = [eT1 , . . . , eTN ]T ∈ RnN y la matriz
ėi (t) → 0 como t → ∞. Laplaciana L (sin considerar las ganancias de control dentro
El sistema (12) puede reescribirse a partir de su dinámica de las gráficas) de la siguiente manera
de error de la siguiente manera
−(IN ⊗ Kp )e − (L ⊗ Kps )e = 0
Mi (qi )ëi + Ci (qi , q̇i )ėi + Gi (qi ) = τi , (13) − (IN ⊗ Kp + L ⊗ Kps ) e = 0 (20)
| {z }
el cual será el sistema a utilizar para desarrollar la ley L
de sincronización. Para lograr sincronización en el valor con Kp ∈ Rn , Kps ∈ Rn matrices de gananacias diagonales
deseado, la entrada del sistema (13) se considera como positivas definidas y IN ∈ RN ×N una matriz identidad, la
τi = Gi (qi ) − Kp ei − Kd zi matriz L es positiva definida. Gracias a esto y al principio
X X de invarianza de LaSalle, es posible concluir que existe
− Kps (ei − ej ) − Kd (zi − zj ). (14) sincronización de posición a la posición deseada.
j∈Ni j∈Ni
Para continuar con el diseño, se define como candidata a V. SIMULACIONES

función de Lyapunov a
Los resultados del algoritmo presentado en la sección IV
N N se aplican al caso de tres brazos robóticos para ejemplificar
1
(zi − zj )T (zi − zj )
X X X
V =2 Vi + el diseño. Cada uno de los agentes es un robot manipulador
i=1
2 i=1 j∈Ni de dos grados de libertad, la posición está descrita por un
N
1X X vector qi ∈ R2 de ángulos de la articulación y las entradas
+ (ei − ej )T Kps (ei − ej ) (15) están dadas por el vector de torques τi ∈ R2 aplicado a las
2 i=1 j∈Ni uniones de cada robot. A partir de [9], el primer agente está
dado por sistemas reales. El caso de sincronización de posición a cierta
posición deseada para sistemas Lagrangianos fue estudiado
M1 (q1 ) =
extendiendo los resultados existentes para sistemas pasivos y
2.351 + 0.168 cos(q12 ) 0.102 + 0.084 cos(q12 )

desarrollando una nueva ley de control con retroalimentación
0.102 + 0.084 cos(q12 ) 0.102 de posición. Como trabajo futuro, ambos resultados pueden
C1 (q1 , q̇1 ) = ser analizados considerando retardos en la comunicación,

−0.168 sin(q12 )q̇12 −0.084 sin(q12 )q̇12
diferentes grafos de interconexión, cambios en la topologı́a,
0.084 sin(q12 )q̇11 0 pérdidas de comunicación, incertidumbres en los parámetros
o la presencia de perturbaciones en las mediciones. Todos
G1 (q1 ) =
estos aspectos se pueden incorporar al diseño de la ley de
3.921 sin(q11 ) + 0.168 sin(q11 + q12 )

g , (21) control con el fin de obtener una ley de control que logre
0.168 sin(q11 + q12 ) mejores resultados en la implementación.
mientras que el segundo y tercer agente a sincronizar se REFERENCIAS
definen al igual que [10], con matrices [1] S. H. Strogatz, SYNC: The Emerging Science of Spontaneous Order.
New York Hyperon, 2003.
M2 (q2 ) = M3 (q3 ) = [2] W. Ren, “Distributed leaderless consensus algorithms for networked
8.77 + 1.02 cos(q22 ) 0.76 + 0.51 cos(q22 )

euler-lagrange systems,” International Journal of Control, vol. 82,
no. 11, pp. 2137–2149, Nov. 2009.
0.76 + 0.51 cos(q22 ) 0.62 [3] N. Chopra and M. W. Spong, Passivity-based control of multi-agent
C2 (q2 , q̇2 ) = C3 (q3 , q̇3 ) = systems, ser. Advances in Robot Control: From Everyday Physics to
Human-like Movements, S. Kawamura and M. Svinin, Eds. Springer-
−0.51 sin(q22 )q̇22 −0.51 sin(q22 )(q̇21 + q̇22 )

Verlag, 2006.
0.51 sin(q22 )q̇21 0 [4] A. Rodriguez-Angels and H. Nijmeijer, “Mutual synchronization of
robots via esimated state feedback: A cooperative approach,” IEEE
G2 (q2 ) = G3 (q3 ) = Transactions on Control Systems Technology, vol. 12, no. 4, pp. 542–
554, July 2004.
7.6 sin(q21 ) + 0.63 sin(q12 + q22 )

g (22) [5] C. Godsil and G. Royle, Algebraic Graph Theory, ser. Graduate Texts
0.63 sin(q21 + q22 ), in Mathematics. Springer, 2001, no. 207.
[6] R. Olfati-Saber and R. M. Murray, “Consensus problems in networks
en las que g = 9.81m/s2 representa la aceleración grav- of agents with switching topology and time-delays,” IEEE Transac-
itacional. Las posiciones iniciales y la posición de refer- tions on Automatic Control, vol. 49, no. 9, pp. 1520–1533, Sept. 2004.
[7] J. C. Willems, “Dissipative dynamical systems-part i: General theory,”
encia común para los agentes son q1 = [0.3, 0.7]T , q2 = Arch. Rational Mechanics Analysis, no. 45, pp. 321–351, 1972a.
[0.2, 0.5]T , q3 = [0, 0.2]T y qd = [0.8, 0.1]T ; respectiva- [8] J.-J. Slotine and W. Li, Applied Nonlinear Control. Englewood Cliffs:
mente. La entrada de control para cada uno de los agentes Prentice Hall, 1991.
[9] F. Reyes and R. Kelly, “Experimental evaluation of model-based
se considera como controllers on a direct-drive robot arm,” Mechatronics, no. 11, pp.
267–282, 2001.
τ1 = −Kp e1 − Kd z1 − Kps (e1 − e2 ) [10] L. Kruise, “Modeling and control of a flexible beam and a robot arm,”
Ph.D. dissertation, Univ. of Twente, Enschede, 1990.
− Kd (z1 − z2 ) − G1 (q1 )
τ2 = −Kp e2 − Kd z2 − Kps (e2 − e1 ) − Kps (e2 − e3 )
− Kd (z2 − z1 ) − Kd (z2 − z3 )
− G2 (q2 ) Fig. 1. Grafo de interconexión para la Ley de control (23).
τ3 = −Kp e3 − Kd z3 − Kps (e3 − e2 )
− Kd (z3 − z2 ) − G3 (q3 ) (23)
i=1
0.8 i=2
para un grafo como el que se muestra en la Figura 1. Los i=3
0.6
q1,i (rad)
resultados obtenidos en simulación se presentan en la Figura

0.4
2 en ella se observa que existe sincronización de posición a
0.2
la referencia dada de cada uno de los agentes. Los valores
utilizados en simulación se definen a continuación: 0
0 5 10 15 20 25 30
Tiempo (s)
8 0 9 0

A= , Kd = Kds = , (24) 0.8
i=1
0 90 0 17 0.6
i=2
i=3
q2,i (rad)
0.4
1 0 7 0

Kp = , Kps = . (25) 0.2
0 1 0 7 0
−0.2
VI. CONCLUSIONES 0 5 10 15 20 25 30
Tiempo (s)
Una ley de control basada en retroalimentación de posición
fue generada para el problema de sincronización de ve- Fig. 2. Gráfica de la posición para tres brazos robóticos bajo la ley de
locidad y sincronización de posición, esto simplifica la control (23).
implementación de leyes de control para sincronización en

Congreso Grave

Загружено:

Сведения о документе

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Congreso Grave

Загружено:

Авторское право:

Доступные форматы

Control cooperativo de sistemas multi-agentes y sus aplicaciones

Ileana Grave, Yu Tang y Mihir Sen

MULTIAGENTES En la derivada de la función anterior, se aprecia que es nece-

IV. SINCRONIZACI ÓN DE SISTEMAS V̇ = 2ėTi {τi − Ci ėi − Kp ei − Kd zi }

Para continuar con el diseño, se define como candidata a V. SIMULACIONES

resultados obtenidos en simulación se presentan en la Figura

Вам также может понравиться