Вы находитесь на странице: 1из 14

El Filtro Kalman

Juan J. Perea

Resumen
En este estudio se presenta el Filtro de Kalman. Tecnica desarrollada en base a premisas estadsticas, permite determinar
la evolucion de un sistema estocastico sobre el que se induce ruido en los datos de partida. Presentamos las caractersticas
generales, as como los ejemplos a los que se puede aplicar. Describimos dos de las metodologas existentes que permiten
extender el uso del Filtro de Kalman a problemas no lineales. Tambien se realiza una implementacion de un sistema planetario
que se desplaza en una trayectoria elptica.
Key words: Filtro de Kalman, Filtro Kalman Linealizado, Filtro Kalman Extendido, Factor de Ganancia, Covarianza

1. Introduccion
Analticamente, el comportamiento de un sistema dinamico determinista esta caracterizados a traves variables
dependientes de la posicion y del tiempo, descritos mediante ecuaciones diferenciales y especificados por restricciones en el contorno del sistema. Con estas premisas, para implementar cualquier sistema determinista se
comenzara con el modelado de las ecuaciones dinamicas adaptadas al modelo a estudio. Se comparan los resultados obtenidos con los que, empricamente, deberan darse y en virtud de esta comparativa se modifica el modelado,
considerando resultados obtenidos en experiencias previas(si las hay). Sin embargo al analizar un sistema determinista lo que se produce es:
No existe un modelo matematico que describa perfectamente el comportamiento de un sistema real.
En los sistemas dinamicos existen perturbaciones que no pueden ser modeladas mediante expresiones funcionales.
Los sensores no son perfectos y presenta una respuesta estadstica.
En consecuencia, se deben establecer algoritmos que, considerando las leyes fsicas funcionales, permitan el
modelado realista de sistemas dinamicos, de manera que se obtengan resultados acordes con la realidad. Para ello,
se tienen que considerar las incertidumbres propias de la fenomenologa, el ruido que presentan los datos adquiridos
y las propias imprecisiones que introducen los sensores o la estadstica de su respuesta.
Uno de los algoritmos que opera sobre sistemas estocasticos es el Filtro de Kalman(F K) utilizado en una
enorme variedad de aplicaciones como ingeniera, economa, tecnologa militar, tecnicas nucleares... Llamado en
as en honor a su inventor Rudolf E. Kalman suele utilizarse para poder identificar el estado oculto (no medible) de
un sistema dinamico lineal. Si bien, se han aplicado, con ciertas restricciones, para el estudio de sistemas dinamicos
no lineales.
De manera sucinta, el F K puede definirse como un algoritmo recursivo o ptimo de procesamiento de datos
orientado a sistemas discretos. Se define como o ptimo porque impone la condicion de mnimo sobre el criterio de
convergencia y porque incorpora toda la informacion que se le suministra para determinar el filtrado. Recursivo
porque no necesita mantener todos los datos previos, lo que facilita su implementacion en sistemas de procesado en
1

Email address: jperea@us.es (Juan J. Perea ).


Pie de pagina autor 1

PVD 2010/2011

Dpto. Matematica Aplicada I, Universidad de Sevilla, Espana

Procesamiento de Vdeo Digital

tiempo real. Con el F K se estiman los estados de un sistema de manera o ptima, con lo que se minimiza el ndice
del error cuadratico medio.
Desde un punto de vista teorico, el F K es un algoritmo que permite obtener valores correctos en sistemas
dinamicos lineales. Presenta similitudes con el modelo Bayesiano o con el Modelo oculto de Markov, pero donde
el espacio de estado, de las variables ocultas, es continuo y donde tanto las variables ocultas presentan un comportamiento gaussiano 2
El F K utiliza un modelo de sistema dinamico (es decir, basado en leyes fsicas del movimiento), en el que
se conocen las entradas de control o medidas, como las obtenidas a traves de sensores. De este modo se genera
una estimacion de las magnitudes que varan en el sistema cuya precision es mejor que la obtenida utilizando
u nicamente las medidas.
Una de las multiples aplicaciones se da en el procesamiento de imagenes por ordenador y mas concretamente en
el seguimiento de los objetos. El problema que se plantea es que los datos adquiridos a traves de los sensores estan
sometido ruido electronico a la estadsticas de los dispositivos. Esto a veces se reduce mediante el uso de camaras de
alta calidad si bien, nunca puede ser eliminado, por lo que a menudo es conveniente utilizar un metodo de reduccion
de ruido. La naturaleza iterativa predictor-corrector del F K puede ser u til, porque solo es necesario considerar la
variable de estado en una u nica ocasion. Este proceso se repite, considerando una restriccion diferentes en cada
instante de tiempo.
En la mayora de las aplicaciones, el numero de valores del estado es mucho mayor (mas grados de libertad) que
el de los valores observables que se miden. Sin embargo, mediante la combinacion de una serie de mediciones,
el F K puede estimar el estado total.
El estudio Lo desarrollamos en tres partes, en una primera se describen las caractersticas del F K definido sobre
problemas lineales. Con el fin de solventar esta traba se han propuesto tecnicas que intentan extenderlo a problemas no lineales que seran descritas a continucion. Seguidamente, se describira la implementacion de un sistema
planetario (utilizando la libera OpenCV y las guas de [1]), que se desplaza en trayectoria elptica. Finalmente, se
enumeraran las distintas aplicaciones del F K a parte de procesamiento de imagenes y posibles mejoras, sobretodo
en el planteamiento no lineal.

2. El Filtro de Kalman Lineal


En el analisis de las imagenes en movimiento, no es posible determinar con total precision la posicion de los
objetos que en ella aparece. Sobre todo porque se introducen imprecisiones por las propias limitaciones de los
dispositivos utilizados en el analisis, por la perspectivas en las imagenes a analizar, fenomenos com la iluminacion
de la escena...
Sera deseable poder utilizar al maximo la informacion que se puede obtener del estudio de las imagenes, de
modo que se obtenga la secuencia total minimizando los efectos de las incertidumbre, que se denominan ruido.
A la informacion que se puede obtener de las multiples medidas realizadas, se le puede anadir informacion anexa
intimamente relacionada con las ecuaciones del movimiento, de modo que la conjuncion con leyes fsicas informacion de muestreo, puede ayudar en la obtencion de la maxima informacion en referencia a los fenomenos de
movimiento producidos en la secuencia de imagenes.
Generalmente el procesos de analisis se suele dividir en dos partes, en una primera, denominada fase de prediccion, se utiliza la informacion obtenida con anterioridad, a un instantes dado, para predecir la ubicacion de objetos
en una imagen. En una segunda fase se realiza la mediada sobre la imagen y se compara con el resultado predicho
y se rectifica.
El proceso de estimacion y rectificacion es llevado a cabo mediante diferentes procesos, siendo uno de los mas
importantes por sus aplicaciones y versatilidad el F K. Otro metodo importante es el algoritmo de condensacion
que es implementado en vision por ordenador de una clase mas amplia de metodos conocidos como filtros de

con frecuencia una distribucion multivariable gaussiana

Quinto curso de Ingeniera Informatica

partculas. La diferencia principal entre el F K y el algoritmo de condensacion es la forma en la que se describe la


densidad de probabilidad del estado es descrito.
Una de las multiples ventajas que presenta el F K es que no es necesario tener una miriada de medidas previas
para conseguir la situacion de maxima la probabilidad a posteriori del sistema. Su idea basica es que, a partir de un
conjunto de hipotesis es posible, construir un modelo con el que determinar el estado del sistema, de manera que
su probabilidad a posteriori sea maxima.
Por maximizar la probabilidad a posteriori de las medidas previas se quiere indicar que cada nuevo estado,
evaluado a partir de los estados anteriores y sus incertidumbres, tiene una mayor probabilidad de ser la correcta, es
decir mas proximo al valor real, que la previa. De este modo, conforme se avanza en el analisis la probabilidad de
que cada resultado sea el correcto aumenta.
Las hipotesis basicas que rigen el correcto funcionamiento de un F K son:
1. Que el sistema modelado se comporte como un sistema lineal. Lo que implica que el estado del sistema en
un instante k se puede obtener a traves producto de una matriz de coeficientes con otra que haga referencia
al estado del sistema en un instante inmediatamente anterior k 1.
2. Que el ruido, al que esten sujetas cada una de las mediciones, sea de tipo blanco. De este modo se asegura
que no depende del instante de tiempo considerado.
3. Que la naturaleza del ruido, y por lo tanto de la imprecision, siga los patrones descritos por la estadstica
gaussiana. Lo que implica que puede ser modelado con precision utilizando u nicamente el promedio y la
covarianza (Se restringe situaciones de tiempo muerto del dispositivo).
Con estas tres hipotesis se asegura que, aunque se combine informacion de diferentes fuentes para todos los
instantes, se va a conseguir maximizar la probabilidad. Con lo que se pueden conseguir o ptimos resultados combinando se obtiene nueva informacion de distintas fuente o bien de una u nica fuente en todo instante.
2.1. Fundamento Matematico
Como ya se ha mencionado, una de las caractersticas mas relevantes del F K es la posibilidad que presenta de
fusionar datos procedentes de diferentes fuentes. Con esta perspectiva se va a mostrar el fundamento matematico
sobre el que se asienta el F K Suponganse dos datos, que hacen referencia a la posicion por ejemplo, y que se
designaran como x1 y x2 ambos con valores de incertidumbre. Como consecuencia del ruido ambos presentaran
incertidumbre de tipo de Gauss. De este modo, los datos presentaran no solo un valor medio x1 y x2 si no sus
respectivos valores de desviaciones estandar 1 y 2 . El analisis de los valores de dichas magnitudes de una idea
de precision de las medidas x1 y x2 La distribucion de probabilidad asociada a la localizacion, considerada como
una funcion de distribucion gaussian es:
(
)
(x xi )2
1

i = 1, 2
exp
2i2
i 2
Dadas dos medida, cada una con una distribucion de probabilidad de Gauss, se espera que cualquier valor x
situado entre estas dos medidas debera ser proporcional a p(x) = p1(x) p2(x). Resulta que este producto es otra
distribucion gaussiana de la que se puede evaluar su media y su desviacion estandar, cumpliendose:
(
)
(
)
(
)
(x x1 )2
(x x2 )2
(x x1 )2
(x x2 )2
p12 (x) exp
exp
= exp

(1)
212
222
212
222
pi (x) =

Considerando que una distribucion de Gauss es maxima en su valor medio, es posible calcular su valor promedio
simplemente calculando la derivada de p(x) respecto a x e igualandola a 0, con lo que se tiene:

(
)
dp12
(x12 x1 )2
(x12 x2 )2
=
+
dx x=x12
12
12
Dado que la funcion de distribucion de probabilidad p12 (x) nunca es 0, se deduce que el termino en entre
parentesis debe ser 0. Con lo que se tiene:

Procesamiento de Vdeo Digital

(
x12 =

22
12 + 22

(
x1 +

12
12 + 22

)
x2

(2)

As, el nuevo valor promedio x12 es una combinacion ponderada de los dos medios medios x1 y x2 , donde
los valores de ponderacion se obtienen por las incertidumbres relativas de las dos mediciones. Analizando este
hecho, se puede concluir que en situaciones donde una de las desviaciones estandar sea mucho menor que la
otra, por ejemplo 2 , la nueva medida sera esencialmente la media la que tiene asociada precisamente esa menor
incertidumbre, en este caso x2
Calculada x12 , segun la ecuacion 2, se puede sustituir en la ecuacion 1 con lo que se puede determinar la
2
incertidumbre 12
como:
12 22
+ 22
De lo afirmado hasta ahora se puede deducir que una nueva medida, y su incertidumbre, puede ser combinada
con los valores previos, para obtener un estado mas preciso del sistema
Esta propiedad de que dos medidas, con sus incertidumbres, sean de tipo Gauss, cuando se combinan son
equivalentes a una sola Esta propiedad de que dos mediciones de Gauss, cuando se combinan, son equivalentes a
una sola, es una de las mas importantes a la hora de aplicar el F K. Esto significa que cuando se tienen M medidas,
y se pueden combinar las dos primeros, luego la tercera con la combinacion de las dos primeras, el cuarto la
combinacion de los tres primeros, y as sucesivamente. Este es el proceso tpico que se sigue en las operaciones de
procesamiento de imagenes a traves de ordenador donde se obtiene una medida seguida de otra y as sucesivamente.
Generalizando este resultado para cada una de la M medidas de tipo (xi , i ) a lo largo del tiempo, es posible
calcular el estado actual de una estimacion (
xi ,
i ) de la siguiente manera. En el paso de tiempo inicial (paso 1),
solo se tiene una primera medida x
1 = x1 con su incertidumbre
1 = 1 . Sustituyendo estos valores en la ecuacion
2 se obtiene la estimacion para la siguiente iteracion de iteracion:
2
12
=

x
2 =

12

12

2
22
x1 + 2 1 2 x2
2
+ 2
1 + 2

Reordenando esta ecuacion se tiene:


x
2 = x
1 +

22
(x2 x
1 )
12 + 22

Para el calculo de la ecuacion asociada a la dispersion


22 , se sustituye
22 =
12 , con lo que se tiene:

22
12

22 +
12
Reordenando datos, de modo analogo al efectuado anteriormente se tiene la varianza de una determinada medida
para x2 mediante proceso iterativo:
(
)

22 = 1 2 1 2
12

2 +
1
Con las expresiones obtenidas se esta en disposicion de distinguir entre la informacion antigua (la conocida
antes de efectuar la nueva medicion) de la nueva ( la obtenida tras la nueva medida). La nueva informacion
(x2 x
1 ), que sera la obtenida en el paso 2, suele ser denominada innovacion. Tambien puede afirmarse que el
factor de actualizacion o ptima iterativo es ahora:

22 =

K=

12

12
+
22

(3)

A K se le denomina factor de ganancia de actualizacion. Utilizando esta definicion de K, se obtiene la expresion:

Quinto curso de Ingeniera Informatica

x
2 = x
1 + K(x2 x
1 );

22 = (1 K)
12

2.2. Sistemas Dinamicos


Sin perdida de generalidad, para mostrar la aplicacion del F K a problemas de dinamica, se va a analizar una
situacion monodimensional en la que se va a intentar localizar un objeto en un determinado punto x del espacio y
un conjunto de medidas realizadas sobre ese punto, si bien se va a obviar situaciones en las que el objeto se podra
estar moviendo entre dos medidas consecutivas. Esta restriccion es similar a una de las hipotesis fundamentales de
los algoritmos dinamicos de integracion temporal, en los que se supone que en cada intervalo de tiempo, el sistema
alcanza una situacion de equilibrio instantaneo.
Al aplicar a sistemas dinamicos el F k, aparece una etapa que suele denominarse de prediccion durante la cual
se utilizamos los datos conocidos para averiguar donde se espera que se encuentre el sistema antes de realizar la
nueva medida del estado del sistema.
En la practica, la fase de prediccion se realiza inmediatamente despues de efectuar una nueva medicion, pero
antes de que la nueva medida sea incorporada a la estimacion del estado del sistema. Un ejemplo de esto podra ser
cuando se mide la posicion de una partcula a lo largo del tiempo, entre un instante t otro instante consecutivo t+dt.
Si la partcula se desplaza a una velocidad v, el proceso de prediccion vara, ya que, con los valores conocidos en
t, se evaluara el estado del sistema no solo en el instante t sino tambien en el instante t + dt como paso previo a la
incorporacion de datos de la nueva medicion. De este modo, la nueva informacion adquirida en el instante t + dt,
no se fusiona con el estado previo del sistema, sino que se proyectara el estado previo sobre el instante t + dt.
En el contexto del F K, aplicado a sistemas dinamicos, existen tres tipos de movimiento a tener en cuenta:
1. Movimiento Dinamico. Es el desplazamiento del sistema esperado como resultado directo del estado en el
que se encontraba el sistema la u ltima vez que se efectuaron mediciones. Si se efectua la medida de la
posicion x la partcula, con una velocidad, en dicha posicion, v en un instante de tiempo t, se espera que
transcurrido un tiempo dt, de modo que en total en sistema se encuentre en in instante t + dt, el sistema se
encuentre en una posicion x + v t, posiblemente con la misma velocidad.
2. Control del Movimiento. Es el movimiento esperado como consecuencia de alguna influencia externa efectuada sobre el sistema, y que no ha sido considarada en la formulacion del modelo del movimiento dinamico.
Un ejemplo de este control es el caso de estimar el estado de un sistema sobre el que ejercemos un control
y conocemos las condiciones impuestas para que se desplace. Este es el caso de los sistemas de roboticos,
donde el control se ejerce un control sobre el sistema, un robot por ejemplo, para que acelere, gire, siga
adelante... Es evidente que, en este caso, si el robot estaba en x y se mueve con velocidad v en el tiempo t, a
continuacion, en el instante t + dt se espera que que no solo se haya trasladado una posicion x + v dt (como
lo habra hecho sin el control), si no tambien que la haya hecho en base a las restricciones impuestas sobre
el movimiento.
3. Movimiento Aleatorio. Es consecuencia de alteraciones que se producen en el movimiento y que escapan
al control. El efecto de movimiento aleatorio sera simplemente aumentar la diferencia en la prediccion de
estados en el tiempo. En el movimiento aleatorio se incluye cualquier movimiento que no sea conocido o
controlado. Llegados a este punto se hace necesario realizar una puntualizacion en lo referente a la estadstica
que rige el movimiento aleatorio, e sta debe ser gaussiana.
Por lo tanto, para incluir la dinamica al modelo de simulacion sobre el que actua el F K, lo primero que hara
es una .actualizacioncomo paso previo a la inclusion de la nueva medida. Este paso de actualizacion se incluiran:
primero la aplicacion de cualquier informacion poseda sobre el movimiento de la partcula en base a su estado
previo. Lo segundo sera la imposicion de las restricciones, conocidas sobre el movimiento y que son controladas
y ejercidas. Finalmente se incorporan las interacciones de los eventos aleatorios que ha podido afectar al estado del
sistema, desde la u ltima medida . Una vez incorporados estos factores, se puede introducir la nueva medida.
En la practica, el movimiento dinamico es particularmente importante cuando el estado del sistema es mas
complejo que el del modelo de simulacion. A menudo, cuando un objeto se mueve, existen multiples componentes
que afectan al .estado, tales como la posicion y la velocidad. En este caso, por supuesto, el estado evoluciona de

Procesamiento de Vdeo Digital

acuerdo a la velocidad que creemos que tenga. El manejo de sistemas con multiples componentes de sera tratada
en la seccion 2.3
2.3. Ecuaciones de Kalman
Como punto de partida se va a considerar el factor de ganancia, obtenido en la ecuacion 3, que afecta a las
estimaciones. Si la incertidumbre de la nueva medida es muy grande, entonces e sta, en esencia no contribuye
en nada a la informacion sobre el sistema, y por lo tanto las ecuaciones se reducen al resultado conocido en el
momento k 1. Por el contrario, si el proceso de medicion se comienza con un conjunto de medidas con una alta
varianza y tras ellas se con una gran precision se puede creer erroneamente mas en la nueva que en las anteriores
y en consecuencia discriminar la previas cuando en realidad todas ellas tienen igual certeza(varianza) con lo que el
nuevo valor esperado se encontrara entre ellos.
En la figura 1 se muestra la evolucion de las incertidumbres a lo largo del tiempo y como se reunen las nuevas
observaciones.

magnitud medida

magnitud conocida
ahora
magnitud conocida
en paso anterior

Figura 1. Combinacion de distribuciones de resultados medidos N (zk , k ), conocidos previamente N (xk1 , k1 ) y evaluada con el modelo
N (xk , k ).

La idea de una actualizacion que es sensible a la incertidumbre puede ser generalizada a muchas variables de
estado. El ejemplo mas simple de esto, sera en en el contexto del seguimiento de vdeo, donde los objetos se pueden
mover en dos o tres dimensiones. En general, el estado puede contener elementos adicionales como puede ser la
velocidad del observador que esta realizando el seguimiento. En cualquiera de los casos generales, se necesitara
una notacion poco mas para hacer un seguimiento de lo que estamos hablando. Se va a generalizar la descripcion
del estado en el instante k como funcion del estado en el instante previo k 1:
xk = F xk1 + Buk + wk
donde xk es ahora el vector ndimensional de las componentes o variables de estado y F es una matriz cuadrada
de n n a la que suele denominarsele matriz de transferencia, la cual es multiplicada por el estado en el instante
previo xk1 . El vector uk esta asociado al nuevo instante k y de c dimensiones. Su funcion es la de permitir
controles externos sobre el sistema; B es una matriz de nc dimensiones y relaciona estas entradas de control con el
cambio de estado, wk es una variable aleatoria (normalmente se llama el ruido del proceso) asociadas a los eventos
aleatorios o las fuerzas que directamente afectan al estado actual del sistema. Se supone que las componentes de
wk obedecen a una distribucion gaussiana N (0, Qk ) para cualquier matriz de covarianza de dimensiones n n
Qk 3 .
En general, se efectuan zk medidas bien directa, bien indirectamente, de xk las variable de estado. Por ejemplo,
si se desea determinar la velocidad de una partcula, bien de puede medir conociendo su desplazamiento doppler en
la frecuencia propia, y la deflexion de un foton que interactue con ella (efecto Compton) en el primer caso caso la
3

En ocasiones se le permite variar en el tiempo, aunque a menudo no lo hace

Quinto curso de Ingeniera Informatica

medida zk sera xk con ruido anadido, mientras que en el segundo no sera posible la obtencion directa por violacion
del principio de indeterminacion. As pues se puede afirmar que el vector m-dimensional de las mediciones zk
vendra caracterizado por:
zk = Hk xk + vk
donde Hk es una matriz de m n dimensiones y vk es el error en la medicion. En este analisis se ha supuesto que
las magnitudes presentan una distribucion de Gauss N (0, Rk ) para una matriz de covarianza Rk de m m.
Para aclarar todo lo dicho hasta ahora se puede utilizar el siguiente ejemplo, supongase un haz de partculas, no
interactuantes entre s, que inciden sobre una rejilla de absorcion (por ejemplo una trampa de Talio). El estado de
cada una de esas partculas vendra descrito por dos variables de posicion, x e y, y dos velocidades, vk y vy . Estas
cuatro variables seran los elementos de la xk vector de estado. Esto sugiere que la correcta forma de F es:


1 0 dt 0
x


0 1 0 dt
y

F =
xk = ;

0 0 1 0
vx


0 0 0 1
vy
Sin embargo, como consecuencia del principio de indeterminacion solo sera posible determinar su posicion,
siempre descrita por una densidad de probabilidad de caracter gaussiano, por lo tanto:

zx
zk =
zy
k

Esto hace que la configuracion de H quede:

1 0

0 1

H=

0 0

0 0
En este caso, la velocidad de cada de la partcula no tiene por que ser constante (de hecho no lo sera) y por lo
tanto se asignara un valor de Qk que reflejase esto. analysis techniques on a video stream. Se podra elegir un Rk
basado en la estimacion de la precision con la que se ha determinado la posicion de la partcula en la secuencia de
captura
Llegados a este punto, solo queda unir estas expresiones a las formas generalizadas de la actualizacion de las
ecuaciones. El proceso comienza calculando la estimacion a priori del estado x
k , con el superndice se indica
que la medida es del instante inmediatamente anterior al de la nueva medicion. La relacion que permite calcular la
estimacion a priori, esta dada por:
x
k = F xk1 + Buk1 + wk
Utilizando Pk para referirse a la covarianza del error, se tiene que la estimacion a priori en el momento k se
obtiene a partir del valor en el instante k 1 mediante la ecuacion:
Pk = F Pk1 F T + Qk1
Esta ecuacion constituye la base de la parte de prediccion del estimador, y nos dice lo que se espera, basada
en lo que ya se ha detectado. A partir de esta expresion se obtiene el factor de ganancia de Kalman. Con este factor
se puede conocer el peso de la nueva informacion frente a lo que estimado. La expresion de dicho factor se da por:

Procesamiento de Vdeo Digital

Kk = Pk HkT (Hk Pk HkT + Rk )1


La expresion anterior se simplifica considerando el caso monodimensinal utilizado sobre el que se puede de2
terminar la posicion. Hk sera una matriz de 1 1. Por lo tanto, si el error en la medida es k+1
, entonces Rk es
tambien una matriz de 1 1 que contiene esta magnitud valor. As mismo, Pk es la varianza k2 . Con lo que la
ecuacion anterior se reduce a:
K=

k2
2
k2 + k+1

Como puede comprobarse la expresion obtenida es la misma que se obtuvo previamente (ecuacion 3) La importancia de esta expresion radica en que permite calcular de manera o ptima los valores actualizados de xk y Pk
cuando esta sea posible:

xk = x
k + Kk (zk Hk xk )

Pk = (I Kk HK )Pk
Analizando los resultados obtenidos, se puede afirmar que la restriccion ejercida sobre la linealidad de la dinamica del sistema, implica importantes limitaciones en los parametros que describen el F K. Sin embargo, el concepto
del F K sigue teniendo la misma validez para problemas asociados a sistemas no lineales, si bien es necesario
efectuar ciertas aproximaciones orientadas a transformar las magnitudes no lineales en lineales, sin que ello altere
la casustica del problema dinamico observado.
Una manera de manejar las no linealidades de la dinamica de estado y las medidas del modelo es linealizarlas
utilizando desarrollo en serie de Taylor. Ademas, se hace necesario calcular nuevos valores para las matrices F y
B, en todo instante de tiempo, a partir de un estado x. Los valores as obtenidos se aproximaran a los reales y las
funciones de control en las proximidades del valor particular de x, (debido al proceso de linealizacion) y permitira
obtener buenos resultado. Sin embargo, esto no es suficiente y se requiere de imposiciones anexas, como que las
variaciones temporales entre el resultado real y el predicho, en un paso de tiempo, sean muy pequenas.
A partir de ahora, se van a mostrar las caractersticas de dos de las tecnicas mas utilizadas en la implementacion
del F K en situaciones no lineales, la tecnica del Filtro de Kalman Linealizado (LF K) y la tecnica del Filtro de
Kalman Extendido (EF K), en base al estudio realizado por [5].

3. El Filtro Kalman no Lineal:


En cada una de ellas se sigue un proceso distinto. En la EKF lo que se linealiza es el estado actual, mientras
que en la LF K se opera sobre la trayectoria nominal precalculada. Desde el punto de vista teorico, tanto la LKF
como la EKF no son o ptimas, ya que se propagan, analticamente, a traves una la linealizacion de primer orden
en un sistema con comportamiento no lineal. Basicamente operan sobre desarrollo en serie de Taylor y consideran
despreciables los infinitesimos de orden igual o superior a 2. El conjunto de aproximaciones realizadas en los algoritmos asociados a LKF y EKF puede generar representaciones del modelo poco adecuadas. La linealizacion
suele generar errores importantes, en el valor medio de las medidas y en la covarianza, lo que ocasiona la divergencia entre el filtro y los resultados reales Por lo general, operar sobre la trayectoria precalculada, esto es con la
tecnica LKF , ofrece resultados mas eficientes en implentaciones en tiempo real, si bien los resultados son menos
precisos que en la EKF , lo cual se hace mas evidente conforme aumenta la no linealidad del problema planteado.
Si se opta por una implementacion en tiempo real la eficiencia de la LKF es aun mayor si se precalcula la matriz
del estado de transicion y la ganancia de Kalman. Sin embargo, el problema que se presenta en la linealizacion de
la trayectoria nominal es que su diferencia con la trayectoria real se hace importante conforme evoluciona en el
tiempo. Comparativamente la EKF generalmente, ofrecen mejores resultados que la LF K, operando con rangos
relativamente pequenos del espacio de estados.

Quinto curso de Ingeniera Informatica

Si se opta por la EKF , basicamente, hay dos de implementaciones: una de ellas opera sobre el espacio total
de estado, conocida como formulacion directa, mientras que la otra lo hace sobre el error del espacio de estados,
denominada formulacion indirecta. En la formulacion directa, el sistema es esencialmente regido por el movimiento
analizado, mientras que en la formulacion indirecta se opera casi exclusivamente sobre los errores del sistema y
es casi independiente del movimiento. En ambas se considera la degradacion que se sufre en el rendimiento como
consecuencia de la incertidumbre en la trayectoria de referencia.
La aplicacion la practica de la LKF y EKF se realiza a traves de la estimacion total del Estado, en relacion
con la estimacion de estado de error.
Se considera que la relacion asociada al proceso de estimacion y su correspondiente relacion con las medidas
efectuadas se expresan en terminos de las ecuaciones 4 y 5:
xk+1 = f (xk , k) + wk

(4)

zk = h(xk , k) + vk

(5)

donde f y h son funciones conocidas, xk es el vector de estado en el instante k R , wk R es el vector de


ruido del proceso, zk Rm es el vector de medidas o datos y vk Rm es el vector de ruido asociado a la medida.
Tanto los vectores wk como vk son nulos en media gaussiana, cuyas relaciones de error estan relacionadas, a
traves de las ecuaciones 6, 7 y 8:

Q i = k
k
E[wk wiT ] =
(6)
0 i = k
n

R i = k
k
E[vk viT ] =
0 i = k
E[wk wiT ] = 0

(7)

i, k

(8)

donde E| | representa la esperanza, el superndice T hace referencia a la traspuesta de la matriz, Qk es la


matriz de covarianza del ruido del proceso y Rk hace referencia la covarianza del ruido asociado a la medicion.
Si f y h con funciones continuas e infinitamente diferenciables, entonces la influencia de las perturbaciones en
la trayectoria puede ser representada mediante un desarrollo en serie de Taylor alrededor la trayectoria nominal. En
situaciones donde las perturbaciones sean pequenas Se puede obtener una buena aproximacion al ignorar terminos
de grado superior a 1.
3.1. El Filtro de Kalman Linealizado (LF K)
Las no linealidades pueden presentarse en el problema bien a traves del proceso dinamico, bien por la toma de
datos (referente al sistema de medida), por lo tanto se tiene que en las ecuaciones 4, 5 la medida de datos seran
xk + xk , transformandose en las ecuaciones 9 y 10:
xk+1 = f (xk + xk , k) + wk

(9)

zk = h(xk + xk , k) + vk

(10)

donde hace referencia a las perturbaciones en los valores nominales


Considerando que x es pequeno, las funciones f pueden ser aproximadas mediante en desarrollo en serie de
Taylor y considerando solo los infinitesimos de primer orden, se tiene:
[
]
f (xk , k)
xk+1 = f (xk , k) = f (xk , k) +
xk +

x
x=xk

En estas operaciones suele elegirse la trayectoria nominal xk , de manera que satisfaga la ecuacion determinista

xk = f (xk , k); con lo que se obtiene:

Procesamiento de Vdeo Digital

[
(xk+1 xk+1 ) =

]
f (xk , k)
xk +

x
x=xk

La expresion zk = h(xk + xk , k) + vk se puede expresar en terminos de desarrollo en serie de Taylor, con lo


que se tiene:
(zk h(xk k) =

]
h(xk , k)
xk +

x
x=xk

Considerando las expresiones xk+1 = xk+1 xk+1 y zk = zk h(xk , k) y tomando solamente los terminos
de primer orden se tiene:
La ecuacion dinamica linealizada queda:
xk+1 = k xk + wk

(11)

La ecuacion de medidas linealizada queda:


zk = Hk xk + vk

(12)

En este caso, el termino medida hace referencia a la diferencia entre la medicion total menos la predicha. k
y Hk son las matrices obtenidas al calcular las derivadas parciales de la trayectoria nominal, segun las expresiones
13 y 14

(
k =

f
=

x x=x

f
m
x1

(
Hk =

f1
x1
f2
x1
..
.

h1
x1
h2
x1
..
.

x x=x

h
m
x1

f1
f1

x2
xm
f2
f2

x2
xm
.. . .
.
. ..
.
fm
fm

x2
xm
h1
h1

x2
xm
h2
h2

x2
xm
.. . .
.
. ..
.
hm
hm

x2
xm

(13)

x=x
k

(14)

x=x
k

Computacionalmente la tecnica LKF es mas ventajosa en comparacion con la EKF , pero el error cometido es
mucho mayor conforme aumentan las diferencias entre la trayectoria real y la nominal, como se demuestra en [2]:
En la figura 2se ilustra la configuracion de la tecnica LF K (implementacion a traves del error de estado)
En resumen, se puede afirmar que la tecnica de linealizacion LF K, se asienta en tres pilares fundamentales:
1. Las no linealidades tanto de la dinamica como en las medidas se pueden aproximar mediante desarrollo en
serie de Taylor, considerando solo los terminos de primer orden.
2. La medida obtenida con la linealizacion del filtro, constituye el valor total menos el de la medida predicha,
es decir, zk = zk h(xk , k).
3. El concepto basico es que el filtro linealizada la estimacion del incremento las magnitudes, para posteriormente reconstruir las magnitudes totales anadiendo el incremento de la estimacion al valor de la parte
nominal.

Quinto curso de Ingeniera Informatica

Sistema no
Lineal
Medida predicha

Fuente
Aadida

FKE

Figura 2. Esquema de configuracion de la tecnica LF K.

3.2. El Filtro de Kalman Extendido (EF K): con estimacion del error de estado
Un modo de solucionar la divergencia producida al operar con la trayectoria nominal, como se hace con la
tecnica LF K, es operar sobre la trayectoria estimada. Es decir, realizar el desarrollo en serie de Taylor sobre la
estimacion de la trayectoria. Sobre esta magnitud es la que opera el Filtro de Kalman extendido EF K, que es
similar a la tecnica LF K, pero operando sobre la trayectoria estimada en lugar de la trayectoria nominal precalculada. En consecuencia, la u nica diferencia, con respecto al desarrollo anterior, es cambiar xk por x

k en las
derivadas parciales de las ecuaciones 13 y 14. Es decir, las derivadas parciales se evaluan a lo largo de la trayectoria
actualizada con las previsiones obtenidas con el filtro, las cuales estan intimamente relacionadas con las medidas.
En consecuencia, la secuencia de ganancia del filtro depende de la secuencia de medicion de la muestra. Con esta
tecnica si las diferencias entre la trayectoria estimada y la real son pequenas la linealizacion seguira siendo valida.
La idea basica de la EKF es linealizar sobre cada estimacion tan pronto como se calcula. Cada vez que se
estima un nuevo estado se incorpora en el proceso de estimacion optimizandose el proceso.
Existen dos configuraciones en la implementacion del EF K[2],[7] en una se ellas se estima el error de estado,
mientras que en la otra se estima sobre el estado total. En la figura 3 se muestra la configuracion de la aplicacion
EKF con la estimacion del error de estado.

Sistema no
Lineal

Fuente
Aadida

Medida predicha

FKE

Figura 3. Esquema de configuracion de la tecnica EF K con estimacion del error de estado

Para la configuracion de EF K con estimacion de error en el espacio de estados presenta algunas diferencias
importantes.
x
k = x

xk ) es obtenido mediante la suma nominal (


x
k + xk El vector estimado del estado total (
k ) con el
incremento estimado de las cantidades ( x
k ).
x

xk , k) Para el EF K, la estimacion en el paso actual se utiliza para calcular el siguiente punto


k+1 = f (
nominal. es decir, el siguiente punto alrededor se llevara a cabo la linealizacion.
x

on es nulo ya que tras la ya que tras la actualizacion que se


k+1 = 0 Para un EKF , El estado de predicci
realiza en el EKF , el incremento x
k se reduce a cero. La proyeccion de x
k con el siguiente paso es trivial.
La u nica proyeccion no trivial es la proyeccion de x
k sobre x

Procesamiento de Vdeo Digital

3.3. El Filtro de Kalman Extendido: configuracion del estado total estimado


Las variables basicas del Estado en un LKF son cantidades incrementales () en lugar de las cantidades totales. Sin embargo, en EKF es accesible para realizar un seguimiento de las estimaciones totales en vez de los
incrementales. La ecuacion basica de la medida linealizada, para el EKF se puede expresar en terminos de
zk h(
x
k , k) = Hk xk + vk
Hay que considerar que cuando se opera con variables de estado adicionales las medidas ofrecidas al F K
es zk h(
x
on de la
k , k) en lugar de la medida total (no linear) zk . Considerar el incremento de la estimaci
actualizacion en el paso k
[
]

x
k = x

x
k + Kk zk h(
k , k) Hk xk
en la que la medida del residuo se escribe como zk = zk h(
x
on predicha de la medida es
k , k) y la estimaci

la suma h(
xk , k) y Hk xk . Esta es la medida del ruido menos la medida predicha basada en corregir la trayectoria
en lugar de la nominal.
Sumando x

on de actualizacion se tiene:
k a ambos lados de la ecuaci

k = x

k + x
k + x
k + Kk [zk zk ]

y finalmente

x
k = x

k + Kk [zk zk ]

que es la ecuacion de actualizacion estimada escrita en terminos de cantidades totales y no incrementales. Simplemente se dice que la estimacion a priori, se corrige mediante la adicion de la medida residual, debidamente
ponderada, por el factor de ganancia de Kalman, la matriz Kk . Tras la actualizacion con la EF K, se hace que
la cantidad incremental tienda a cero y la proyeccion de x
on trik k en el instante siguiente adquiera la soluci
vial. La u nica proyeccion no trivial es la proyeccion x
k proyectada sobre x

es de la dinamica no lineal
k a trav
x

xk ). Algo a tener en cuenta es que el ruido blanco aditivo fuerza a la funcion wk a que valga cero, en el
k+1 = f (
paso proyectado.

Una vez que x

k+1
, que puede ser expresada como h(
x
k+1 es determinada, la medida predicha z
k+1 , k + 1) y la

medida del residual k + 1, se obtiene a partir de la diferencia de zk+1 y zk+1


.
Con este paso el filtro esta preparado para operar a traves un bucle recursivo como el ilustrado en la figura 4.
Sistema no
lineal

Fuente
Aadida

Medida predicha

FKE

Figura 4. Esquema de configuracion de la tecnica EF K con estimacion del error de estado

Quinto curso de Ingeniera Informatica

4. Sobre la Implementacion:
Para mostrar la operacion del F K se ha simulado un sistema planetario de una partcula de masa relativa unidad
y sometida a un campo, de tipo conservativo, con centro activo en el centro de la imagen. Sobre la trayectoria se
induce un ruido aleatorio para evidenciar la trayectoria filtrada. Se ha elegido una elptica para evidenciar las tres
leyes de Kepler, sobre todo la referente a la segunda, la asociada a la velocidad aerolar constante, segun la cual
el a rea barrida por el radiovector, que conecta a la partcula con el centro generador de campo, es constante en
tiempos iguales.
Los detalles de implementacion estan comentados en el archivo Kalman.cpp ubicado dentro del directorio de
implementacion.

5. Otras aplicaciones del Filtro Kalman


Como se dijo en la seccion 1 el F K es un algoritmo estadstico recursivo con el que se puede establecer el estado
interno de un sistema a partir de mediciones con alteraciones aleatorias, el ruido. Por este hecho, se ha extendido
procesamiento de datos en a reas tan dispares como la economa, los sistemas de navegacion...
Merecen destacar:
Sistemas de de navegacion por GPS [5]: Operan tomando los datos de al menos 4 satelites de posicionamiento
global, en incrementos de tiempo del orden de milisegundos y aplican las rectificaciones en base a la ubicacion
que el propio sistema determina. Esta fenomenologa es no lineal, lo que ocurre es que el tiempo de muestreo es
6 o rdenes de magnitud superior a la frecuencia de pulsos con las que emiten los satelites.
Modelos de Balances Economicos[9] Sobretodo en el estudio de los valores en bolsa y como afecta los eventos
polticossociales a balance de valores.
Modelos Estructurales de Macroeconoma[4] Basado en modificar el error de pronostico y la varianza del
error de prediccion, de modo similar al modelado no lineal EKF . De este modo se obtienen vectores de estado
autoregresivos que permiten determinar las evoluciones del mercado.
Tecnicas Nucleares[8] Basicamente los procesos de transiciones energeticas obedecen a principios estocasticos, a lo que hay que anadir la estadstica de los dispositivos. Como consecuencia, el proceso de deteccion y
procesamiento.
Vision por Radar para Seleccion de Coordenadas[6] Aprovecha una de las propiedades del F K y es la fusion
de datos procedentes de diferentes fuentes. En este caso unifica informacion de navegacion inercial, junto con
el posicionamiento por radar, prescinde del sistema GPS. Pondera la informacion de modo que se rectifican
mutuamente.
Seleccion de Objetivos mediante GPS [6] Opera de modo analogo al anterior, pero con un procesamiento
redundante prioritario, que es el GPS. Se aplican modelos linealizados, ya que se requiere mayor precision al
equipar sistemas JDAM.
Los casos citados no son mas que una pequena muestra de la miriada de aplicaciones que tiene el F K en sistemas
dinamicos.

6. Conclusiones y Perspectivas de Futuro


Analizando las multiples aplicaciones F K se llega a la conclusion de que puede ser aplicado a cualquier sistema, que requiera del procesamiento de informacion contaminada con ruido, independientemente de su naturaleza.
Donde se ofrecen perspectivas es en la linealizacion del modelo a partir de sistemas no lineales, ya que en virtud
del estudio realizado considerar terminos de desarrollo en serie hace que la convergencia de los resultados esta condicionada por el orden de u ltimo termino considerado. A nuestro modo de ver es posible mejorar esta precision
utilizando el Metodo de los Residuos Ponderados, e imponiendo dos hipotesis:

Procesamiento de Vdeo Digital

1. Que las magnitudes que intervienen en el sistema satisfagan en todo instante de tiempo las ecuaciones del
F K. Lo cual es casi trivial, ya que si no sera imposible obtener algun tipo de resultado coherente.
2. Que las magnitudes de estado alcancen un estado de equilibrio en cada instante de tiempo, pero en sentido
ponderado. Esta u ltima exigencia es la que difiere de la considerada en los tratamientos de linealizacion
convencionales y es la que entronca con el Metodo de los Residuos Ponderados.
Las restricciones impuestas seran una extrapolacion de las consideradas por [11] en su estudio sobre los metodos
de integracion temporal en los sistemas dinamicos.
Referencias
[1] B. Bradski, A. Kaehler, Learning OpenCV: Computer Vision with the OpenCV Library, OReilly, 2008.
[2] R. Brown, P. Hwang, Introduction to Random Signals and Applied Kalman Filtering, John Wiley & Sons, New York, 1997.
[3] D. Cankut, M. Sahin Real-time deformation monitoring with GPS and Kalman Filter, Earth Planets Space, Vol 52, pp 837840, 2000.
[4] M. Dueker, C.B. Derbak, Kalman Filtering with Truncated Normal State Variables for Bayesian Estimation of Macroeconomic Models.,
Economics Letters, Issue 1, pp. 5862, 2006.
[5] J. DahJing, C. Ta-Sun, Critical Remarks on the Linearised and Extend Kalman Filters with Geodetic Navigation Examples,
Measurement, Vol. 43, pp. 10771089, 2010.
[6] J. Ferrante, A Kalman Filter-Based Radar Track Data Fusion Algorithm Applied to a Select ICBM case, Radar Conference, Proceedings
of the IEEE, pp 457462, 2004.
[7] M.S. Grewal, A.P. Andrews, Kalman Filtering, Theory and Practice Using MATLAB, second ed., John Wiley & Sons, Inc., 2001.
[8] P. Kalman, T. Keszthelyi, Intense Few-Cycle HardUVPulseInduced Internal conversion processes, Phys. Rev. A, Vol 82, No. 2, 2010.
[9] G. Kaur, Kalman Filter and its Economic Applications, MPRA Paper, University of California, No. 22734, 2010.
[10] H.A. Klotz, C.B. Derbak, GPS-aided Navigation and Unaided Navigation on JDAM., Position Location and Navigation Symposium,
IEEE, pp. 412419, 1998.
[11] S. Modaka, E.D. Sotelino The Generalized Method for Structural Dynamics Applications., Advances in Engineering Software, Vol 33,
pp. 656575, 2002.

Вам также может понравиться