Академический Документы
Профессиональный Документы
Культура Документы
Integrada
Martín España
2010
AADECA
Asociación Argentina de Control Automático
ISBN 978-950-99994-7-3
ii
Índice
Capítulo 1: Introducción 1
1.1 Sistemas de referencias 2
1.2 Clasificación de los métodos de navegación 3
1.2.1 Métodos de extrapolación 3
1.2.2 Métodos de referenciamiento absoluto 3
Radionavegación 4
Navegación Celeste 5
Navegación con mapa 6
1.3 Navegación Inercial 6
1.3.1 Navegación inercial con plataforma estabilizada 8
Bloqueo de gimbal 11
1.3.2 Navegación inercial con instrumentos fijos al vehículo (strapdown) 11
Propagación de errores en la navegación inercial strapdown 12
1.4 Navegación multisensor o integrada 14
iii
Teorema de Euler 48
3.1.4 Espacio vectorial de pequeñas rotaciones y diferencial de una MCD 48
Interpretación geométrica 50
3.1.5 Rotaciones alrededor de los ejes coordenados: Ángulos de Euler 50
Relación entre los ángulos de Euler y la MCD 51
3.1.6 Parámetros simétricos de Euler o cuaterniones 53
Relación entre cuaterniones y MCD 54
Representación hipercompleja y álgebra de cuaterniones 55
Transformación de vectores de 3 mediante cuaterniones 56
Relación entre cuaterniones y ángulos de Euler 57
Diferencial de cuaterniones 58
3.2 Ecuaciones cinemáticas de la orientación 59
3.2.1 Ecuación cinemática de la MCD 59
3.2.2 Ecuación cinemática del cuaternión de orientación 60
3.2.3 Ecuación cinemática del ángulo vectorial de rotación: Ecuación del
“coneo” 61
3.2.4 Ecuación cinemática de los ángulos de Euler 63
iv
6.3 Dinámica del error de navegación en coordenadas ECEF 110
6.4 Dinámica del error de las ecuaciones de navegación en coordenadas LGV 111
6.4.1 Error angular de posición en terna LGV 111
Geometría del error angular de posición 112
6.4.2 Error de orientación o error angular de plataforma 114
Geometría del error angular de plataforma 114
6.4.3 Relación entre los errores de posición y de plataforma: error angular
inercial 116
Geometría del error angular inercial 117
6.4.4 Propagación del error de velocidad 117
Diferencial de la rotación por transporte 117
Diferencial de la gravedad 118
6.4.5 Ecuaciones generales de la dinámica del error en terna LGV 119
6.5 Ejemplos de ecuaciones de errores y aplicaciones 120
Ejemplo 6.1: Ecuaciones del error en coordenadas geográficas. 120
Ejemplo 6.2: Error de navegación en terna {g} para un vehículo en
reposo sobre la Tierra. 122
Ejemplo 6.3: Autoalineación de un vehículo estacionario sobre la Tierra.
125
v
8.3.5 Mediciones de un receptor GPS 165
Efectos atmosféricos 166
8.4 Medición del pseudo-rango con código 168
8.4.1 Posicionamiento estándar con un receptor GPS 169
8.4.2 Precisión del posicionamiento estándar 172
Fuentes y presupuesto de errores en la medición de código 173
8.5 Modelo de la fase Doppler 174
8.5.1 Relación entre la medida de la fase Doppler y la distancia al satélite 177
Comparación entre las mediciones de pseudo-rango y fase 178
8.6 Medida del Doppler y Estimación de la Velocidad 178
8.6.1 Precisión de la estimación de la velocidad. 180
Referencias 222
vi
Prólogo
Fruto de la alta integración y miniaturización de los circuitos digitales son los sistemas
embebidos basados, ya sea, en las clásicas tarjetas PC/104 para los sistemas con
requerimientos de mayor flexibilidad funcional o, para aquellos orientados a
aplicaciones específicas, en tecnologías como los SoC (System on a Chip), FPGA (Field
Programmable Gate Arrays) o ASIC (Application Specific Integrated Circuit). En todos
los casos el resultado es una gran capacidad de cómputo y comunicaciones disponibles a
bordo de un móvil. Una consecuencia importante de esta nueva realidad es la
posibilidad de implementar poderosos algoritmos numéricos que estiman, con una alta
tasa de salida de datos, simultáneamente los parámetros de navegación y las
imprecisiones instrumentales. Esto se realiza usando una variada gama de instrumentos
cuyos datos son procesados ni bien están disponibles y no necesariamente en forma
sincrónica. Estos algoritmos, llamados de navegación integrada, emplean métodos de
fusión de datos con origen en la teoría del filtrado no lineal de procesos estocásticos.
Los algoritmos más utilizados constituyen extensiones del Filtro de Kalman ya sea en
sus versiones analíticas, i.e.: EKF (Extended Kalman Filter) y LKF (Linearized Kalman
Filter) o Bayesianas, i.e: SPKF (Sigma Point Kalman Filter) y UKF (Unscented
Kalman Filter). La principal ventaja de estas técnicas es que, se benefician de la
diversidad de fuentes de información instrumental para reducir la incertidumbre de los
estimados. De este modo, la certidumbre resultante resulta siempre mejor que la mejor
vii
de todas provista por cada instrumento tomado individualmente. Esto hace posible por
un lado, utilizar instrumentos que proveen sólo información parcial del estado de
navegación y por otro reducir las exigencias de calidad y precisión de cada instrumento
en particular. Dado que, tanto el costo como el volumen de los instrumentos crecen
rápidamente con la precisión requerida, la complementación de instrumentos,
posibilitada por los nuevos algoritmos, hace de estos últimos el sustrato natural del
software embebido usado en los nuevos y ubicuos sistemas de navegación, expandiendo
y reforzando aún más su campo de aplicaciones.
viii
actuales y se formula la estructura del modelo matemático de una unidad de medidas
inerciales. El Capítulo 3 estudia las diversas representaciones de la orientación de un
cuerpo en el espacio y formula las ecuaciones diferenciales (cinemáticas) que describen
su evolución en el tiempo. El Capítulo 4 introduce los sistemas de coordenadas usuales
junto con los elementos de geodesia requeridos en la disciplina. En particular, se
justifican los distintos modelos del campo geo-gravitacional utilizados según el tipo de
aplicación. En el Capítulo 5 se deducen las ecuaciones de navegación para las ternas de
navegación usuales. El Capítulo 6 estudia la dinámica de propagación de los errores de
las ecuaciones de navegación. En el Capítulo 7 se describen los algoritmos de
navegación inercial de tipo strapdown en tiempo real para las ternas ECEF y LGV. El
Capitulo 8 presenta los sistemas de Navegación Satelital Global (GNSS) operativos o en
curso de serlo y se concentra en la descripción de las señales, los servicios y los
observables del sistema GPS. En el Capitulo 9 se describen los métodos de fusíón de
datos usados en la navegación integrada y se exponen ejemplos de aplicación.
Finalmente, en el Apéndice A se deduce la expansión en armónicos esféricos del campo
gravitatorio terrestre usado, principalmente, en aplicaciones espaciales.
Martín España
Abril 2010
ix
x
Capítulo 1
Introducción
Desde tiempos remotos, motivados por sus desplazamientos sobre la tierra o el mar, los
seres humanos han utilizado diversas técnicas de navegación. Algunas permiten
determinar el valor absoluto de los parámetros de navegación del vehículo (o del
individuo) gracias a mediciones referidas a cuerpos exteriores al mismo, por ejemplo,
los objetos cercanos en la navegación “a vista”, los astros de posición conocida en el
firmamento*, el campo geomagnético local que, mediante una aguja imantada, permite
determinar el rumbo respecto del norte magnético (técnica utilizada antiguamente en
China, en Europa y en algunas civilizaciones mesoamericanas). Otras técnicas se basan
en la medición de la velocidad de variación de los parámetros de navegación, lo que
requiere conocer sus valores iniciales en un punto de partida. En este caso, los nuevos
parámetros de navegación son determinados por “extrapolación” integrando la
velocidad de cambio. Este procedimiento, tradicionalmente usado en la navegación
marina, es conocido en inglés con el nombre de “dead-reckoning” en alusión al método
de medir la velocidad de un barco respecto de un cuerpo muerto supuestamente inmóvil
sobre la superficie del agua. Similarmente, en aeronavegación se utiliza la medición de
la velocidad respecto del aire exterior obtenida mediante tubos de Pitot. La medición de
la velocidad combinada con el conocimiento del rumbo magnético permite estimar la
posición por extrapolación desde una posición conocida anterior.
*
Esto incentivó la invención de astrolabios a partir del siglo XV y más tarde sextantes y cronómetros.
1
Las limitaciones inherentes a todas las técnicas de extrapolación han hecho que la
navegación inercial pura sea cada vez menos utilizada en nuestros días, exceptuando
aplicaciones en las que se requiere de una autonomía total del vehículo o que deba
asegurarse inmunidad a fallas y a posibles interferencias exteriores. Ejemplos de
aplicaciones en las que está vedada toda información exterior al vehículo son los
submarinos en misiones íntegramente debajo del agua o los misiles balísticos
intercontinentales. La aviación civil es, por su parte, un ejemplo de aplicación de la
navegación que combina regularmente ambas tecnologías. Los métodos de
referenciación absoluta mas utilizados en aeronavegación son radio señales
provenientes de estaciones en Tierra (sistemas VOR, NDB, ILS, etc. Kayton/Fried,
1997) o en el espacio (sistemas satelitales de navegación global como el GPS). A pesar
de esto, ningún avión prescinde de información inercial ya sea para complementar la no
inercial o como fuente de información redundante en prevención de fallas.
Las ternas: ECEF (Earth Centered Earth Fixed) y ECI (Earth Centered Inertial) cuyos
ejes, respectivamente, (xe, ye, ze) y (xi, yi, zi) son indicados en la Figura 1.1, comparten
su origen en el centro de masa de la Tierra (CM) y el eje zezi que coincide, a su vez,
con el eje de rotación terrestre. Los otros dos ejes están contenidos en el plano
ecuatorial. En el caso de la ECEF estos ejes son solidarios a la Tierra mientras que en la
terna ECI permanecen inmóviles en el espacio inercial (o como suele decirse respecto
de las “estrellas fijas”). La terna ECEF, regularmente utilizada en navegación en las
cercanías de la Tierra, ha sido adoptada por los Sistemas Satelitales de Navegación
2
Global (GNSS) tales como GPS, GLONASS y GALILEO a los que dedicaremos el
capítulo 8. Por su parte, la terna ECI tiene, desde un punto de vista matemático, el
interés de que, en este caso, las ecuaciones de Newton adoptan la forma más simple
posible. En cambio, para una referencia no inercial (p.e. la ECEF) las ecuaciones se
obtienen mediante transformaciones de las ecuaciones en ECI que, como se verá en
detalle en al Capítulo 4, incluyen términos originados en las aceleraciones aparentes de
Coriolis o centrípeta.
Los métodos de navegación son tan variados como los principios físicos que permiten
medir o calcular los parámetros de navegación o como los sistemas de referencias
respecto de los cuales éstos están referidos. A grandes rasgos y como fuera sugerido en
la introducción de este capítulo, pueden distinguirse dos grandes clases: los métodos de
extrapolación y los métodos de referenciamiento absoluto (véase también la
clasificación propuesta por Kayton/Fried, 1997):
Como en este caso los parámetros de navegación se obtienen por integración de las
mediciones, los errores en las mediciones y/o en las condiciones iniciales inducen
errores de navegación que crecen polinomialmente con el tiempo. Por esta razón para
trayectorias prolongadas estos métodos requieren ser actualizados con mediciones
absolutas de la posición o la orientación. A pesar de estas limitaciones, tienen el interés
de ser independientes de referentes exteriores al vehículo y la ventaja de disponer de
información en forma casi continua o a una alta tasa de muestreo.
3
usado el nombre de auto-localización. Contrariamente a los sensores intraceptivos, las
mediciones exteroceptivas suelen ser adquiridas en instantes discretos y no siempre en
tiempo real. Se destacan en este grupo los sistemas que utilizan los siguientes
principios, algunos de los cuales son desarrollados más abajo:
Radionavegación.
Navegación celeste.
Navegación con mapa.
Rebote de señal (sonar, radar, lidar).
Navegación por imágenes (visión/reconocimiento de formas)
Sensores de distancia (explorador laser).
Radionavegación
Se basan en una red de estaciones radiotrasmisoras de referencia fijas a la Tierra o
montadas sobre plataformas móviles (espaciales, terrestres, marinas o aéreas). Los
instrumentos/receptores a bordo del vehículo detectan las señales emitidas y calculan su
posición relativa respecto de las estaciones emisoras de referencia. El desplazamiento
en la frecuencia de la portadora de la señal debido al efecto Doppler permite medir su
velocidad radial respecto de las estaciones emisoras. Los sistemas de radionavegación
terrestre más usados en aeronavegación son los NDB (Non-Directional Beacons) o
radiofaros no direccionales, los VOR (VHF-Omnidirectional Range) y los DME
(Distance Measurement Equipment) (Kayton/Fried, 1997). Los dos primeros miden la
dirección que une al vehículo con la fuente emisora y el último la distancia a un punto
de referencia. El primero es el más antiguo en vigencia y consiste en una red de
emisores polarizados verticalmente con portadora de entre 200 y 1600KHz. Mediante el
principio “goniométrico” el receptor detecta las direcciones de procedencia de la señal
de dos o más emisores con las que calcula la posición del vehículo. Entre las ventajas de
los NDB para la aeronavegación figuran su bajo costo de mantenimiento, la posibilidad
de delegar la responsabilidad de la precisión al usuario y el hecho de que la propagación
inherentemente “terrestre” extiende su alcance más allá de la curvatura del horizonte.
Sus principales limitaciones son la orografía local y el efecto de las reflexiones
ionosféricas a estas frecuencias. Los VOR son ciertamente los más difundidos en la
aeronavegación comercial. Su estándar adoptado por la OACI (Organización de la
Aviación Civil Internacional) consiste de una portadora de entre 108 y 118 MHz. En
esta banda, la reflexión ionosférica es casi inexistente y la propagación en línea recta
evita la interferencia entre estaciones más allá del horizonte. Contrariamente a los NDB,
la señal transportada por la portadora VOR provee directamente la información de la
dirección de procedencia lo que simplifica las funciones del receptor (Hurley et all.,
1951). Una considerable mejora tecnológica introducida en la segunda generación de
esta tecnología es la denominada Doppler VOR (Anderson/Flint, 1959) que permite
reducir la imprecisión del ángulo de procedencia de 2,8º a 0,4º.
4
(Tactical Air Navigation) con una portadora única en el rango 960-1215 MHz, lo que
permite antenas de mayor portabilidad.
La superación del requerimiento de que el receptor del usuario cuente con un reloj de
alta estabilidad y, más aún, sincronizado con los otros relojes de la red sobreviene
gracias a la introducción del concepto de medición de “pseudo-rangos”. Este concepto
consiste en disponer y utilizar un número redundante de mediciones de distancias (4 en
R3 ó 3 en R2) a los elementos de la red de referencia todas afectadas por el mismo sesgo
del reloj del receptor y a partir de ellas determinar, simultáneamente, las coordenadas de
la posición y el sesgo horario. Este método es utilizado en nuestros días por los más
ubicuos sistemas de radionavegación: los GNSS entre los que se cuentan el sistema GPS
(EEUU), el GLONASS (Rusia) y el futuro GALILEO (UE). La gran ventaja de los
sistemas GNSS es que permiten, en todo instante y bajo cualquier condición
atmosférica, posicionar un receptor ubicado en cualquier punto interior a la constelación
de satélites de referencia con un error acotado. El seguimiento de la fase de cada
portadora por parte del receptor hace posible además medir la velocidad radial de éste
respecto de cada satélite (medición conocida como “Doppler” o delta-pseudo-rango”) y
aún obtener, mediante técnicas interferométricas, posicionamientos relativos con
precisión de centímetros o medir directamente los parámetros de la orientación de un
receptor multi-antena. Estas metodologías son la base de los más modernos sistemas de
navegación de alta precisión y algunas de ellas serán discutidas en el Capítulo 8.
Navegación Celeste
El fundamento de la navegación celeste es la medición de la elevación y azimut de uno
o más cuerpos celestes de referencia. Esta medición combinada con la del tiempo y la
predicción del movimiento relativo de los astros permitió desde tiempos remotos
posicionar en latitud y longitud a un observador sobre la Tierra. Modernamente, algunos
de estos sistemas utilizan catálogos de estrellas junto con relojes de alta precisión y
algoritmos de reconocimiento de patrones estelares para determinar la latitud, la
longitud y la orientación de vehículos espaciales o aéreos de gran altura. Estos
instrumentos utilizados en combinación con una plataforma inercial estabilizada
permiten actualizar periódicamente la orientación de ésta última evitando la
acumulación de los errores por integración ya referida en el párrafo 1.3.3.
5
estocástico de fusión de datos puede ser usada para restimar los parámetros de
navegación y aun recalibrar los instrumentos inerciales durante el curso de la
navegación. Estos esquemas de navegación integrados son introducidos brevemente
más abajo en el párrafo 1.4 de este Capítulo y serán tratados en más en detalle en el
Capítulo 9.
Un campo de aplicación en creciente expansión de esta técnica son los robots móviles
en ambientes interiores tales como ambientes industriales, comercios, almacenes, etc.,
en los que se aprovecha la estructura conocida del entorno y la buena definición de los
sensores ambientales en cortas distancias. Ciertos algoritmos le permiten a la
computadora del robot explorar y aprender el mapa medioambiental cuando éste se
modifica (Masson, 2003).
6
Si P i , f i , g ig 3 denotan las coordenadas en la terna de referencia inercial ECI,
respectivamente, de la posición de un móvil, la fuerza por unidad de masa (fuerza
específica) actuante sobre él y la aceleración gravitacional en función de su posición, la
aplicación de los principios de la mecánica clásica permite arribar a la siguiente
ecuación diferencial cuya solución determina la posición y la velocidad del móvil
futuras t t0 .
i P
V i g i (P ) f i(t ); P (t ) P ; V(t ) V ; (1.1)
g 0 0 0 0
Para sistemas de referencia no-inerciales, la Ec. (1.1) deberá ser corregida mediante los
términos correspondientes a las aceleraciones aparentes de Coriolis y centrípetas.
Las mediciones a bordo de un vehículo con las que cuenta un sistema de navegación
inercial son de dos tipos: la fuerza específica o aceleración inercial –medida con
acelerómetros– y la velocidad angular –medida con giróscopos. Resulta importante
distinguir entre aceleración y aceleración inercial o fuerza específica. En efecto, el
principio cinemático de la relatividad nos advierte que sin mediciones relativas a algún
objeto externo, es imposible determinar el estado de movimiento de un vehículo
moviéndose libremente en un campo gravitacional. En consecuencia, un acelerómetro
sólo podrá medir la fuerza específica o componente no gravitacional de la aceleración
impresa al vehículo ya sea por efecto de la propulsión, la sustentación o la resistencia
mecánica, aerodinámica e hidrodinámica. Lo anterior, junto con el principio cinemático
mencionado más arriba, implica la necesidad de conocer la aceleración gravitacional en
cada punto del espacio mediante algún modelo matemático, aspecto que será abordado
en el Capítulo 4. Por su parte, un giróscopo mide la velocidad angular de un cuerpo
respecto del espacio inercial. En base a las mediciones de los giróscopos, el sistema de
navegación inercial calcula la variación de la orientación del vehículo. En el Capítulo 2
se presentan los principios físicos y tecnológicos de los sensores inerciales modernos y
se describen además los parámetros que caracterizan su desempeño.
7
Los errores de medida en los instrumentos inerciales y en los parámetros de
navegación iniciales inducen errores que crecen polinomialmente con el tiempo
(ver más adelante en este Capítulo).
Requieren de la actualización periódica de los parámetros de navegación con
mediciones absolutas.
Giróscopos Acelerómetros
Gimbals
Eje interior
Plataforma estabilizada
Eje medio
Lectura del Lectura del rumbo (yaw)
cabeceo (pitch) Vehículo
Figura 1.2: Suspensión cardánica de una plataforma giroestabilizada LGV.
8
Como se ve en la figura, una plataforma estabilizada permite medir directamente estos
ángulos (ángulos de Euler) que caracterizan la orientación instantánea del vehículo
respecto del sistema de referencia elegido.
g
ω ref (t ) eg ρ g eg K g V g sen( )zg (1.2)
Para sistemas de alta performance el lazo de control de la Figura 1.3 resulta un desafío
tanto desde el punto de vista tecnológico como teórico. En particular, los actuadores
deben tener gran rango dinámico y ancho de banda para ser capaces, a la vez, de
compensar rápidas y pequeñas perturbaciones y responder a los comandos de ref, los
rodamientos deben estar diseñados par minimizar la fricción coulombiana en los ejes y
todo el sistema (gimbals + plataforma) debe estar debidamente balanceado respecto de
los ejes para minimizar los acoplamientos cinemáticos. Los sistemas más avanzados
utilizan sofisticadas herramientas de observación y control multivariable no lineales y
adaptables. Entre las soluciones de muy alta performance propuestas citamos: Shtessel
(1995), Royalty (2005) o Li et al. (1998). Véase también el número del IEEE Control
Systems Magazine, de Febro de 2008 dedicado al tema.
9
Perturbaciones
p
ref + c + p
Controlador Gimbals +
Actuador
plataforma
Giróscopos
g
fcorr f g (2Ω g ρ g ) V g Ω g (Ω g P g ) (1.3)
g g g (P) f g ; Vg (t ) V ;
V (1.4)
g corr 0 0
10
determinar las velocidades de variación de las coordenadas curvilíneas (latitud) y
(longitud) que luego son integradas para obtener la posición del vehículo.
g g ( , , h )
Vg
g
V (t0 )
Ω e Cálculo de:
g
V g g,h, Kg, g y las , ,h
Aceleró- f Vg
metros
coordenadas
curvilíneas:
(2Ω g ρ g )
Computadora
g, g
de Navegación
Bloqueo de gimbal
La capacidad de la suspensión cardánica para aislar la plataforma de los movimientos
del vehículo se ve afectada en ciertas situaciones patológicas. En efecto, si, como
resultado de alguna maniobra, dos ejes de la suspensión resultaren paralelos será
imposible aislar la plataforma de las rotaciones del vehículo según un eje ortogonal a
ambos. Esta situación se presenta típicamente cuando un avión pica en cabeceo (roll) a
90º, en este caso, como puede verse en la Figura 1.1, el eje externo se alinea con el eje
interior y ya no es posible aislar la plataforma de las rotaciones perpendiculares a ésta
alrededor del eje de yaw. Esta condición, conocida como bloqueo de gimbal, traduce,
como se verá en el Capítulo 2, una limitación esencial de la caracterización de la
orientación de un cuerpo mediante los ángulos de Euler. El uso de un cuarto gimbal
redundante permite evitar el bloqueo y es la solución adoptada en vehículos estratégicos
que usan esta tecnología. Una solución matemáticamente equivalente consiste en
sustituir la suspensión cardánica por una suspensión hidráulica (gimbals hidráulicos)
consistente en una plataforma esférica con flotabilidad nula en un medio fluido
(Wang/Williams, 2008).
11
plataforma que sólo miden desviaciones respecto de la velocidad angular nula en un
lazo de control, los giróscopos de un sistema strapdown deben poder registrar todo el
rango de velocidades angulares del vehículo. De este modo, puede decirse que con esta
tecnología, las complicaciones mecánicas son sustituidas por mayores exigencias sobre
los sensores inerciales y sobre la complejidad de los algoritmos numéricos.
N
O
E
D x
y a
D
x a
a y x
y
ax
UMI ay D
Figura 1.5 Navegación strapdown bidimensional.
La UMI consta de una dupla de acelerómetros que mide las aceleraciones según las
direcciones fijas al vehículo ax y ay y un giróscopo que mide la velocidad angular del
vehículo D en la dirección hacia abajo (D). Si D es el ángulo de la proa del vehículo
respecto de la dirección Norte se tiene:
12
t
D D D (t ) D (t0 ) D ()d
t0
s sx cos D sen D
s g N ; sb ; Cbg ( D ) s Cb ( D )s
g g b
(1.7)
s
E s
y sen D
cos D
P g V
g a g C g ( )ab ; P g (t ) P , V g (t ) V
b D 0 0 0 0
(1.9)
; (t )
D D D 0 0
N D aˆ
N
aN
a
aE E
aˆ E
Figura 1.6: Efecto del error de orientación sobre las coordenadas de la aceleración.
13
a cos( D ) sin( D ) aˆ N
ag N (1.10)
aE sin( D ) cos( D ) aˆ E
Junto con la anterior las siguientes ecuaciones modelan los errores en las componentes
de la velocidad y la posición en terna “g” para pequeños valores del ángulo D :
g VN aN aN N aE g
ˆ
V D ; V g (t0 ) V0
VE aE aˆ E E aN (1.11)
; (t )
D D D 0 0
D (t ) 0 D (t t0 )
a a (t t0 ) 2
V g (t ) V0 ( g E 0 )(t t0 ) E D (1.12)
aN aN 2
a (t t0 ) 2 aE D (t t0 )3
P g (t ) P0 V0 (t t0 ) ( g E 0 )
aN 2 aN 6
14
parametrización, etc. Estos algoritmos necesitan conocer la perfomance de cada sensor,
y una evaluación incorrecta de éstas últimas podría traducirse en estimaciones erradas.
x(t) Sensores
Vehículo
exteroceptivos. y (tk )
m(t)
Sensores
interoceptivos. Hardware Software
m(t )
+
Modelo de m̂ modelo extrapol. Modelo de los -
calibración. xˆ f ( xˆ , mˆ ) sensores exter.
yˆ hk ( xˆ , pˆ e ) yˆ ( t k )
mˆ ( m , pˆ i ) xˆ (t )
p i (tk ) x (t k ) p e (t k )
y (t k )
Filtro de fusión de datos
15
índice k califica también a la función hk( , ) del modelo del sensor. Esto es debido a que
el conjunto de sensores activos no necesariamente es el mismo en todo instante Las
mediciones m(t ) son preprocesadas con el modelo inverso del sensor, residente en la
computadora de navegación, que depende del conjunto de parámetros pˆ i para obtener la
estimación mˆ (t ) de las mediciones introceptivas. Las ecuaciones diferenciales de la
cinemática (ver capítulo 5) representadas por le modelo f(x,m), permiten extrapolar las
estimaciones de los parámetros de navegación a partir de sus estimaciones iniciales.
Las mediciones exteroceptivas y (tk ) disponibles en el instante tk son comparadas con
las correspondientes salidas extrapoladas calculadas usando el modelo del grupo de
sensores activos en dicho instante y la estimación actual xˆ (tk ) de los parámetros de
navegación. La innovación y (tk ) es procesada por el filtro de fusión de datos para
actualizar (corregir) tanto a xˆ (tk ) como a las estimaciones de los parámetros pˆ i (tk ) y
pˆ e (tk ) de los sensores intro- y exoceptivos, respectivamente. Esta última acción es
denominada calibración de los instrumentos. Finalmente la solución instantánea xˆ (t ) de
las ecuaciones diferenciales del extrapolador calculada en tiempo real es el resultado de
la navegación accesible a una tasa de muestreo sólo limitada por la velocidad de cálculo
de la computadora de navegación.
16
Capítulo 2
Instrumentos Inerciales
Los sistemas de navegación inercial son aquellos que utilizan como instrumentos
exclusivamente acelerómetros y giróscopos. Dado que la aceleración gravitacional no
puede ser medida por instrumentos inerciales estos sistemas de navegación requieren
necesariamente de un modelo matemático del vector gravitación en función de las
coordenadas del vehículo, tema que es tratado en el Capítulo 4.
Entre las ventajas de los sensores inerciales (sensores introceptivos por excelencia) se
destacan que sus medidas son independientes del medio en que se mueve el vehículo y
que no requieren de ninguna referencia exterior al mismo. Estas características sumadas
a su capacidad de ofrecer información a alta frecuencia hacen de la navegación inercial
una de las opciones más utilizadas desde su inserción a principios del siglo XX.
17
A partir de mediados de los 90´s, los sensores inerciales micromaquinados de estado
sólido han suscitado un creciente interés. En éstos la estructura mecánica sensible al
movimiento forma parte del circuito electrónico integrado de adquisición de la medida.
Los principios físicos que conducen a nuevos sensores inerciales de este tipo son hoy en
día objeto de intensa investigación en muchos laboratorios del mundo. Esta tecnología,
aplicable a numerosos tipos de microsensores, es conocida como micro-
electromechanical systems o MEMS (ver IEEE Proc., Special Issue, 1998). Sus ventajas
más relevantes son la miniaturización y robustez de los sensores y la posibilidad de
producción masiva a bajo costo. Lo anterior hace a los sensores MEMS aptos para una
vasta gama de nuevas aplicaciones. Entre los campos clásicos y las muevas áreas
favorecidas por esta tecnología mencionamos las aplicaciones biomédicas, la robótica
móvil, aplicaciones de realidad virtual, vehículos autónomos, mini y micro satélites, etc.
Junto a los sensores MEMS el capítulo presta atención a los giróscopos ópticos.
Tecnologías que a nuestro entender son las más promisorias para la navegación
strapdown.
2.1 Acelerómetros
*
En el Capítulo 4 se discute la diferencia entre fuerza gravitatoria y fuerza gravitacional.
18
Un análisis elemental conduce a la siguiente función de transferencia entre la fuerza
específica actuante en la dirección del eje sensible y el desplazamiento de la masa
testigo:
H (s)
x( s)
1/ M 1/ M (2.1)
f ( s ) s 2 D s K s 2 r s 2
r
M M Q
4 K BTD 4 K BT r
RTAE m / s 2 Hz (2.2)
M QM
d 2 P i i
2
P f i gi (2.3)
dt
19
que compensa el efecto del campo. Por ejemplo, esto es lo que medirá un acelerómetro
en reposo sobre una mesa con su eje sensible en la dirección de la vertical local.
a) Los primeros forman parte de una nueva generación de acelerómetros que utilizan
como principio la alteración de la frecuencia de oscilación de un segmento mecánico,
normalmente un cristal de cuarzo, frente a cambios en el esfuerzo a la tracción que éste
soporta. Los efectos no lineales son compensados utilizando dos segmentos que, en
reposo vibran a la misma frecuencia de resonancia. La fuerza específica en el eje
20
sensible altera diferencialmente el estado de tensión de cada segmento provocando una
diferencia entre ambas frecuencias de oscilación proporcional a la excitación. Un
esquema simplificado del principio se ilustra en la Fig. 2.3 (ver Le Traon et al. 2005).
Eje sensible
f1 f2
Segmento1 Segmento2
b) Una onda acústica superficial como las descritas inicialmente por Lord Rayleigh
(1842-1919), puede ser generada y entretenida sobre un cristal piezoeléctrico mediante
una distribución periódica de electrodos implantados en su superficie. Los
acelerómetros que usan este principio (ver Motamedi, 1994, Titerton, 1997) disponen de
una viga en voladizo cargada en su extremo con una masa testigo (ver Fig.: 2.4).
Electrodos de excitación
Masa testigo
Anclaje a eje
la carcasa sensible
Viga
21
d) El principio de los acelerómetros capacitivos se muestra en la Fig. 3.a). La fuerza
específica exterior produce un desplazamiento de la masa testigo alterando la capacidad
entre dos placas conductoras fijas a la carcasa, capacidad que puede ser medida
eléctricamente de diversas maneras. Las Figs. 3.b) y 3.c) muestran las estructuras
mecánicas más utilizadas en su fabricación. En la primera, llamada de estructura
vertical, la masa testigo se mueve en la dirección perpendicular a plano que la contiene
alterando su separación respecto de la placa fija. En al configuración lateral de la Fig.
3.c), la masa se mueve en el plano que la contiene alterando la separación entre un
conjunto de electrodos dispuestos en peine. La dependencia de la sensibilidad en lazo
abierto de los acelerómetros capacitivos es proporcional a la magnitud:
MA
S (2.4)
dK
a)
Electrodos
b) c)
Aceleración
Suspensión Anclaje Aceleración
Peine
Anclaje sensor
Masa Masa
Electrodos
Suspensión
Figura 2.5: Configuración típica de un acelerómetro MEMs.
2.2 Giróscopos
Los giróscopos miden rotación angular. Se distinguen los que miden la velocidad
angular instantánea de los que miden cambios en el ángulo rotado alrededor de su eje
sensible. En la literatura inglesa los primeros son denominados “rate gyros” y los
segundos “rate integrating gyros (RIG)”. Los giróscopos del segundo tipo son
particularmente útiles en vehículos sujetos a vibraciones aleatorias de amplio ancho de
banda y elevada potencia media. En primer lugar, porque frente a grandes excursiones
22
en magnitud de la velocidad angular los sensores de cambio angular reflejarán
excursiones acotadas. En segundo lugar, porque la medición analógica que proveen es el
verdadero ángulo rotado, en cambio, cuando esta magnitud debe obtenerse integrando
numéricamente muestras de velocidad angular deberá recortarse su espectro (antialias)
degradándose la información angular efectiva. Finalmente, como veremos en el
Capítulo 7, los algoritmos de navegación inercial procesan directamente estos
incrementos angulares.
Desde el punto de vista de los principios físicos utilizados los giróscopos pueden
clasificarse en rotatorios, vibratorios y ópticos.
Resorte
Lectura angular
Gimbal
Rotor
Carcasa
: momento angular
=xH
: en el eje sensible
Al igual que los acelerómetros es posible obtener mediciones más estables y precisas de
la velocidad angular realimentando la excursión del ángulo de presesión para
23
transformar al sensor en un instrumento de cero. Un esquema de este principio es
ilustrado en la Figura 2.7, en él, la medida es la corriente I proporcional al par
restitutivo T que a su vez es proporcional a la velocidad angular en el eje sensible del
instrumento.
: en el eje sensible
ωp
Rodamiento
Lectura IαT
angular
Servo
Amortiguación
viscosa
Eje sensible
Oscil. primaria
Brazos de
excitación. Referencia
Soporte
Amp. del oscilador
Amplif.
Brazos de Soporte
lectura. Demodulador
Amplif.
Oscil. secundaria Amp. de lectura
Figura 2.8: Principio del giróscopo de doble diapasón de cuarzo de Systron Donner.
En una masa vibrante forzada a rotar se originan fuerzas de Coriolis (ver Capítulo 5)
que inducen vibraciones secundarias ortogonales a la vibración original y al eje de
rotación. De este modo, parte de la energía del modo de vibración primario es
transferida a un modo secundario como consecuencia de la rotación. La amplitud de las
oscilaciones secundarias resulta ser así una medida de la velocidad angular en el eje
sensible del instrumento. Este principio ha dado recientemente lugar a diversos
desarrollos de giróscopos sin motores, partes rotatorias, ni rodamientos, construidos con
tecnología MEMS muchos de ellos integrados en un mismo circuito con la electrónica
de medición. La oscilación primaria es normalmente un modo resonante de la propia
estructura mecánica sintonizado a la frecuencia nominal que define el factor de escala
del instrumento. La sintonía puede afinarse electrostáticamente usando electrodos ad-
hoc.
24
Giróscopo de diapasón
La versión más clásica de la aplicación de este principio es posiblemente la del
giróscopo de doble diapasón sintonizado (tuning fork) tallado en una pieza de cuarzo
piezoeléctrico (ver Fig. 2.8) de alto Q para la unidad inercial Motion Pack de Systron
Donner desarrollada a principios de los 90´s. Una oscilación primaria inducida en las
ramas superiores se manifiesta en una velocidad periódica lineal v en la dirección del
plano que las contiene. Cuando el diapasón rota según el eje sensible a la velocidad
angular , una aceleración de Coriolis a=2vx periódica actúa sobre cada una de estas
ramas perpendicularmente al plano mencionado. Estas fuerzas se traducen en un par
periódico torsional en la unión entre ambos diapasones que induce una oscilación
secundaria fuera del plano en las ramas inferiores. La señal piezoeléctrica producida por
las ramas inferiores es demodulada usando como referencia la señal del oscilador
primario para obtener a la salida una señal DC proporcional a
Electrodos sensores Electrodos
de sintonía
Electrodo de anclaje
excitación
masa
Sentido
masa Modo de excitación de la
v oscilación
anclaje
Electrodo de
Electrodos excitación
de sintonía acor = 2v x
Electrodos sensores Modo sensor
Figura 2.9: Giróscopo MEMS vibratorio y modos de oscilación.
Tabla 2.1
La Figura 2.9 ilustra una versión integ rada de diapasón sintonizado desarrollada en el
laboratorio Charles Stark Draper en 1991 (Bernstein et al. 1993 y también Yazdi et al.
25
1998). Mediante un peine de electrodos de excitación se induce electrostáticamente una
oscilación (modo de excitación) de las masas testigos de unos 10m de amplitud.
Expuesto a una velocidad angular en el eje sensible normal al plano del sustrato sobre
el que se mueven las masas, se induce en estas últimas un movimiento oscilatorio
ortogonal al modo primario de excitación (ver modo sensor). Este último movimiento es
detectado capacitivamente mediante electrodos sensores.
Electrodo detector
Figura 2.10: Principio de giróscopo MEMS basado en un disco vibratorio.
26
natural (modo de excitación o primario) en el plano que lo contiene mediante electrodos
dispuestos en su periferia.
Electrodos sensores
Anclaj Flejes de sostén
Anillo
vibrante
Modo Modo sensor
Electrodos de
i ió
Figura 2.11: Principio de giróscopo MEMS de anillo vibrante.
Tabla 2.2
27
2.2.3 Giróscopos ópticos
El principio en el que se basan todos los giróscopos ópticos es el efecto descubierto por
el físico francés Georges Sagnac en 1913 y que lleva su nombre. Los primeros
instrumentos que utilizaron este efecto fueron los ring laser gyro desarrollados a partir
de 1975. A partir de 1985 hace su aparición una nueva tecnología basada en este efecto
denominada fiber optic gyros (FOG) y considerada en un principio como una alternativa
de bajo costo de la primera. La motivación fundamental de los giróscopos ópticos
fueron desde un principio los requerimientos de precisión y rango dinámico impuestos
por los nuevos sistemas strapdown. Otras ventajas son: una inherente lectura digital,
arranque casi instantáneo, baja sensibilidad a las perturbaciones mecánicas, total
independencia mecánica de su medio ambiente. Junto con la tecnología MEMS
acaparan actualmente la mayor atención de los centros de desarrollo de instrumentos
inerciales.
r
A: área
La Fig. 2.12 ilustra el principio de Sagnac. Supóngase que el anillo, al que es solidario
el punto P, rota alrededor de su eje de simetría a una velocidad angular 0. Sean t+
(trayecto en azul) y t- (trayecto en rojo) los tiempos que emplean sendos rayos de luz
partiendo de un mismo punto P y moviéndose respectivamente en el sentido antihorario
y horario hasta reencontrar a dicho punto. Es fácil advertir de la geometría del problema
que si c es la velocidad de la luz y A el área incluida en el anillo, dichos tiempos
satisfacen:
De la anterior, resulta una diferencia del camino recorrido por ambos rayos que, en
primera aproximación ( c 2 r 2 2 ), resulta proporcional a la velocidad angular . Un
desarrollo en elementos diferenciales de ángulo permite demostrar que el área en la
expresión (2.5) es la encerrada por el camino óptico independientemente de la forma
que éste tenga. El efecto Sagnac habilita así la medición absoluta del movimiento
angular de un sistema de referencia solidario al anillo.
28
Giróscopos de láser en anillo (RLG )
Consisten en una cavidad óptica resonante en camino cerrado con 3 o más espejos
dentro de la cual la luz puede propagarse en ambas direcciones. La cavidad provee una
ganancia láser que permite sostener la resonancia de ambos rayos en contra-propagación
a una frecuencia compatible con la longitud de los respectivos caminos ópticos.
Típicamente la ganancia es producida por un gas de He-Ne que llena el interior de la
cavidad. La cavidad es construida con material de muy baja expansión térmica de modo
de limitar los cambios mecánicos de longitud del camino óptico. La expansión
remanente es compensada mediante un servo piezoeléctrico que desplaza alguno de los
espejos de modo de mantener la resonancia centrada en el pico de ganancia del gas. Sin
rotación absoluta, la cavidad genera dos rayos resonantes a igual frecuencia con un
número entero p de longitudes de onda encerrados en el camino óptico.
Una rotación en un eje ortogonal al plano del camino óptico determina un cambio en
ambos caminos ópticos dado por (2.6). La condición de auto sustentación de la
resonancia dada por la invariancia del entero p se traduce en sendos cambios en las
longitudes de onda en los rayos en pro y contra de la rotación en el eje sensible. Esta
condición es expresada mediante las relaciones:
p Lp / p Lc / c L Lp Lc p ( p c ) p (2.7)
Con L expresada por la (2.6) la rotación induce una frecuencia de batido entre ambos
rayos dada por:
L 4 A 4 A
v v v (2.8)
L cL L
Para valores típicos de A, , L y , L/L= < 10-6, lo que refleja la gran estabilidad
y pureza espectral requeridas de la cavidad láser para asegurar la factibilidad de la
medición de la velocidad angular mediante un RLG. En cuanto a la frecuencia de batido
es posible medir rangos de valores desde algunos Hz a algunos MHz, lo que habla del
amplio rango dinámico del sensor. La frecuencia de batido se mide mezclando ambos
haces en un arreglo de prismas (“prisma mezclador” en la Fig. 2.13) situado en uno de
los vértices lo que produce un patrón de interferencia cuya periodicidad espacial puede
ser medida con fotodiodos. La frecuencia de batido, producto de la rotación angular,
induce una velocidad de desplazamiento de las bandas de interferencia proporcional en
dirección y sentido a la velocidad de angular. El pasaje de las bandas bajo el campo
óptico de los diodos produce impulsos que contados durante un intervalo fijo son una
medida del ángulo total rotado en dicho intervalo respecto de una terna inercial. Puesto
que cada pulso corresponde a un período igual a 1/v, para cada pulso el ángulo rotado
será:
/ v L / 4 A (2.9)
29
Fotodetector de lectura
Prisma mezclador
Bandas de interferencia
Anodo
Eje sensible de
rotación Actuador
vibratorio (dither)
Espejo c/control
piezoeléctrico
Espejo plano
Cátodo
Figura 2.13: Diagrama de un giróscopo de laser de 3 espejos.
Para muy bajas velocidades angulares las frecuencias de resonancia de ambos modos de
propagación resultan muy cercanas ( v 0 en la Ec. (2.8)). En estas condiciones y por
razones similares a las que provocan la sincronización de osciladores electrónicos aun
muy levemente acoplados, v en (2.8) puede caer abruptamente a cero limitando la
resolución del instrumento. El acoplamiento entre ambos modos en contra propagación
se debe a la mutua transferencia de energía debida a la dispersión hacia atrás de la
radiación (back-scattering) incidente sobre la superficie de los espejos de la cavidad. La
técnica mas usual para evitar la sincronización entre resonancias consiste en provocar
mecánicamente una fluctuación angular (mechanical dither) en el eje sensible del
instrumento con lo cual se minimiza el tiempo en que el sensor permanece en zona de
sincronía de resonancias. Algunos efectos secundarios de este paliativo y sus soluciones
son discutidas por Smith, (1987)
Los altos costos de producción de este tipo de instrumento están ligados a la precisión
del pulido y a la calidad del material de los espejos y del tubo laser. Por un lado, es
necesaria una baja dispersión hacia atrás (usualmente 0.02%) para lograr una buena
resolución y por otro, una alta reflectividad (usualmente 99.97%) para reducir las
perdidas en la cavidad y mejorar la precisión del factor de escala (alto “Q” implica
precisión en ). El estado del arte en tecnología del pulido de espejos permite hoy en día
lograr, sin usar la fluctuación angular, resoluciones del orden de 0.1º/s (ver Smith,
1987).
30
de fibra óptica que constituyen un camino cerrado de luz procedente de una fuente
externa tal como un diodo superluminiscente.
N espiras de
fibra óptica
Detector
Divisor
Fuente de luz
Figura 2.14 Esquema de un giróscopo de fibra óptica.
A la entrada, este haz es dividido en dos haces en contrapropagación (Fig. 2.14) que son
luego recombinados al final de su recorrido (entre 100m y 3Km). El detector
interferométrico mide la diferencia de fase entre ambos haces que, a su vez, es una
medida de la diferencia de camino recorrido y por tanto proporcional a la velocidad
angular
L 8NA 4RL
2 (2.10)
c c
Un IFOG tiene algunas ventajas notables frente al RLG: no requiere de alto voltaje, al
no usar una luz coherente de ancho de banda puntual no tiene el problema de
insensibilidad para bajas velocidades angulares (no requiere dither), finalmente, sus
costos son, en general, más reducidos. Por otra parte, la variancia del error en la medida
en resulta ser inversamente proporcional al la longitud da la fibra óptica, por lo que
la perfomance del instrumento es escalable con la longitud de la fibra. Algunos
resultados permiten esperar que la perfomance de los IFOG llegue a superar a la de los
RLG. Ver por ejemplo el IFOG desarrollado por Sanders et al. (2002) con estabilidad
del sesgo <0.0003°/hr, densidad espectral de ruido <0.00008 deg/√hr y error en factor
de escala <0.5 ppm. Los esfuerzos más recientes en la tecnología IFOG se concentran
en su abaratamiento y miniaturización.
31
Además de los instrumentos, el gabinete alberga la electrónica de sensado, de filtrado y
de acondicionamiento de las señales y, en ciertos casos, de digitalización de las
mediciones. A dicho gabinete, incluyendo los instrumentos y la correspondiente
electrónica, se lo denomina Unidad de Medidas Inerciales (UMI). El número de
sensores inerciales en una UMI es variable dependiendo de la aplicación. En este
volumen se considerarán UMI´s completas, es decir, aquellas diseñadas para proveer
medidas vectoriales de fuerza específica y velocidad angular inerciales según tres ejes
mutuamente ortogonales denominados ejes sensibles de la UMI. Usualmente, esto se
logra disponiendo una terna de giróscopos y otra de acelerómetros paralelos a los ejes
sensibles (xm, ym y zm en la Fig. 2.15). Mediante el cálculo de las correspondientes
proyecciones, las 6 magnitudes inerciales pueden también obtenerse con un número
redundante de instrumentos (superior a 6) y no necesariamente dispuestos
ortogonalmente. Se considera como mediciones provistas por la UMI las 6 componentes
de las magnitudes inerciales vectoriales proyectadas según sus ejes sensibles.
x-giro x-acel
y-giro xm
y-acel z-giro xy
mx
ym z-acel
xz
m
z
Figura 2.15: Unidad de medidas inerciales.
x xy xz
m σ m yx y yz ; σ m 9 (2.12)
zx zy z
m
32
alineación entre la dirección sobre la que es tomada la componente de la medida * y el
correspondiente eje sensible nominal de la UMI. En la Fig. 2.15 se compara la dirección
sobre la que se adquiere la componente mx con el eje x nominal. Para pequeños valores
de xy y xz los efectos de la no-ortogonalidad y del error en el factor de escala para la
componente x admiten la aproximación de 1er orden: (1 x )mx xy my xz mz .
Similarmente para las otras filas de la matriz adimensional (2.12). El conjunto de
parámetros que caracterizan la parte determinista del modelo de cada terna (2.11) se
agrupan, respectivamente, en los vectores p m 12 , con m=f ó según el tipo de
sensor. Las componentes de cada vector p m son medidas experimentalmente en mesas
de ensayo y usualmente el fabricante provee valores promedios para la población de
instrumentos de cada tipo. La performance de una unidad inercial está asociada a la
estabilidad y precisión con que se conoce cada vector p m y las características
estadísticas de las perturbaciones estocásticas.
R ()e S
j 2 f
R () d S ( f ) d R () ( f )e j 2 f df (2.14)
Es fácil demostrar que, por ser R () una función real y simétrica, bajo las condiciones
de la definición (2.14), S ( f ) resulta ser también una función real y simétrica. Dado
que el valor medio de la potencia instantánea de la perturbación es
t : R (0) E 2 (t ) de acuerdo con la Ec. (2.14) rescrita como:
R (0) S
( f )df (2.15)
*
Puede pensarse a esta dirección como aquella sobre la cual yace el sensor inercial individual, distinta del
correspondiente eje nominal de la UMI.
33
en alguna zona del espectro de la señal. Si U es la unidad de medida de , S ( f ) se
expresa en [U]2 /[Hz] .
i ) E n(t ) 0
(2.16)
ii ) S n ( f ) cte. 2n [U ]2 /[ Hz ] ; n [U ] / [ Hz ]
Ruido “markoviano”
n(t) S. L. (t)
Figura 2.16.
ν Aν (2.17)
Movimiento browniano
El movimiento browniano o proceso de Wiener tambien llamado caminata aleatoria es
el “ruido markoviano” que surge de integrar un ruido blanco a partir de un dado instante
inicial to.
Su modelo matemático es similar al de la Ec. (2.17) con A=0 y condición inicial nula.
Teniendo en cuenta que w(t) es estacionario se toma to=0. En el caso escalar el ruido
browniano queda definido por la relación:
t
w(t ) w ()d dw(t ) w (t )dt (2.18)
0
*
Convendría calificarlo “en sentido restringido”. El lector puede consultar la definición general de
proceso markoviano, por ejemplo, en Bucy/Joseph, 1987).
34
E{w(t )} 0
t1 t2
Rw (t1 , t2 ) E{w(t1 ) w(t2 )} E n()d n()d (2.19)
0 0
t1 t2
d d E{n( )n()} n2 min(t1 , t2 )
0 0
2n()
2w (t )[U ]2 [T ]2 Rw (t , t ) n2 t (2.20)
a) b)
35
Superposición de perturbaciones estocásticas
Las perturbaciones estocásticas que afectan las mediciones inerciales según el modelo
(2.11) son, en general, una superposición de los procesos aleatorios mencionados en el
párrafo anterior es decir:
ξ m nm m bm ; m , f
(2.21)
bm m w ; bm (0)
Z 0
ζ m mζ m ηm ζ m ; ζ m (0) v.a.(0, Pζ , m )
0 0 m w m
ξ m mζ m n m I I ζ m n m (2.22)
N (0, Q ); w N (m , Qw ); n m N (0, Qm )
Dado que las medias inerciales en la práctica son integradas, es usual definir las
siguientes perturbaciones integrales:
Para las cuales, según sea i= ó V se hablará de ángulo integral o velocidad integral
respectivamente. El ángulo y la velocidad brownianos son casos particulares de
procesos de la forma (2.23).
36
navegación integrada estos parámetros deben ser determinados por el usuario para el
instrumento específico en uso. Como se describe en el Capitulo 8, en el segundo caso la
calibración se hace en tiempo real y forma parte del esquema de estimación de las
incertidumbres presentes. En ambos casos lo que importa es la inestabilidad o
repetibilidad del parámetro. La primera denominación se refiere a su variabilidad a lo
largo de la navegación o de la vida útil del instrumento, la segunda, a cambios entre
encendidos consecutivos. En navegación integrada la inestabilidad es tomada como la
incertidumbre inicial del parámetro correspondiente mientras que el modelo y las
estadísticas del ruido son utilizados en el diseño del filtro de fusión de datos.
Otros datos típicos de la performance de una UMI son: el rango dinámico de los
instrumentos, la nolinealidad del factor de escala expresado en % del rango, el ancho de
banda AB[Hz] y la sensibilidad del sesgo y del factor de escala con la temperatura.
Según sea el nivel de calidad la inestabilidad del sesgo (rate/acceleration bias
instability en ingles) se expresa para los giróscopos en [º/hr] o en [º/seg] y en el caso de
los acelerómetros en [mg] o [g].
El ruido blanco de medición aditivo y continuo (rate white noise o acceleration white
noise), caracterizado por su densidad espectral de potencia DEP, es también
denominado ARW (angle random walk) o VRW (velocity random walk) según se trate
de los giróscopos o de los acelerómetros y expresado según las siguientes formas
equivalentes:
La resolución del instrumento esta íntimamente ligada a la potencia del ruido fondo y
éste el ancho de banda AB del instrumento lo que conduce a las siguientes relaciones
entre la resolución y el ARW o el VRW:
37
Parámetro/Calidad Rate grade Tácticos Aviación RLG Navegación
MEMS MEMS IFOG IFOG RLG IFOG
Las Tablas 2.3 y 2.4 indican los rangos de performance usuales establecidos para estas
denominaciones así como las tecnologías más usadas al presente.
38
Capítulo 3
Cinemática de la Orientación
de un Cuerpo en el Espacio
La Fig. 3.1 muestra dos ternas de vectores ortonormales de orientación positiva donde
una de ellas {a} es considerada la de referencia y la otra {b} la de un cuerpo rígido dado.
La condición de orientación positiva (regla de la mano derecha) es equivalente a decir
que el producto triple de sus componentes satisface:
a1 (a 2 a3 ) 1; b1 (b 2 b3 ) 1 (3.1)
Los ejes de la terna {b} apuntan normalmente según direcciones del cuerpo de interés
para la aplicación. Por ejemplo, en un vehículo el eje x suele estar en el eje longitudinal,
cercano a la dirección del desplazamiento y los otros dos en un plano ortogonal con uno
de ellos paralelo a la vertical en condiciones nominales de movimiento. Se supondrá
que la terna {b} se obtiene trasladando la terna {a} paralela a sí misma al punto p de la
localización del cuerpo y aplicándole una rotación continua arbitraria en un intervalo de
tiempo [to,t) tal que {b(to)}{a}.
39
Como interesa definir un conjunto de parámetros que caractericen la orientación* de {b}
respecto de {a}, uno de los propósitos de este capítulo es introducir las
parametrizaciones más usuales de la orientación de un cuerpo as saber:
a3 ba
b3
b2
P
a2
a3
a1 b1
a2
a1
Figura 3.1: Orientación relativa de dos ternas en el espacio
*
En ingles “attitude” dio lugar al anglisismo “actitud”, usual en la jerga técnica en nuestro idioma.
40
v a p a (t ) ω a (t ) p a (t ) S(ω a (t ))p a (t ); v a , p a (t ), ω a (t ) 3 (3.3)
a3 (t)
V=(t)P
O
a2
a1
Figura 3.2
0 v3a v2a
S( v ) v3a
a
0 v1a ( v u) a S( v a )u a ; v a , u a 3 ; v, u 3 (3.4)
v2a v1a 0
Para lo que sigue, conviene además introducir la definición de versor α α / ; α ,
3 y de las siguientes ternas de números:
1 0 0
e1 0 ; e2 1 ; e3 0
(3.5)
0 0 1
p a (t ) Ca (t , t0 )p a (t0 );
(3.7)
a (t , t ) S(ω a (t ))Ca (t , t ); Ca (t , t ) I
C 0 0 0 0
Las Ecs. (3.7) describen la evolución temporal de las coordenadas, respecto de la terna
{a}, de la posición del punto móvil p sometido a una rotación caracterizada por el vector
velocidad angular instantáneo (t), a partir del instante t0.
41
Demostramos a continuación una propiedad importante de la matriz Ca (t , t0 ) , que
llamaremos de rotación, solución de la ecuación diferencial matricial (3.7).
Propiedad 1:
La matriz de rotación a coeficientes reales Ca (t , t0 ) solución de (3.7) es:
i ) Ortogonal (unitaria) : Ca (t , t0 )T Ca (t , t0 ) I ; t p a (t ) p a (t0 ) ; t (3.8)
ii ) Propia : det(Ca (t , t0 )) c1 (t ) (c2 (t ) c3 (t )) 1 0; t (3.9)
Donde c1 (t ), c2 (t ), c3 (t ) representan las columnas de Ca (t , t0 )
d a
C (t , t0 )T Ca (t , t0 ) Ca (t , t0 )T S(ω a (t ))T Ca (t , t0 ) Ca (t , t0 )T S(ω a (t ))Ca (t , t0 )
dt
Ca (t , t0 )T (S(ω a (t )) S(ω a (t ))Ca (t , t0 ) 0
det(C (t , t ))
2
a
0
1; t det(Ca (t , t0 )) 1 (2.10)
Ca (t , t0 ) v (t ) (t ) v (t )
Ca (t , t0 ) v (t ) (t ) v (t ) (3.11)
2 2 2
v (t )T Ca (t , t0 )T Ca (t , t0 ) v (t ) v (t ) (t ) v (t ) (t ) 1
42
por ejemplo, si (t) 0, pero no solamente en este caso). Lo visto hasta ahora permite
enunciar:
Propiedad 2:
Toda rotación alrededor de un punto fijo admite en todo instante t un único eje
invariante θ(t ) tal que:
θ(t ) Ca (t , t0 )θ(t ) (3.12)
Denotaremos, en lo que sigue con ω (t ); t to al vector de la velocidad angular
a
ab
instantánea de una terna {b(t)} que rota respecto de la terna fija {a} expresado en
coordenadas de esta última con el origen O coincidente en ambas ternas (punto fijo, ver
Fig. 3.3) y supondremos que en un instante to {b(to)}≡{a}. Operando con la solución de
(3.7) sobre cada uno de los componentes de {a} teniendo en cuenta que aia ei ; i 1, 2,3
(definiciones (3.5)) se obtiene:
b (t )
a
1
b 2a (t ) b 3a (t ) Ca (t , t0 ) a1a a a2 a3a Ca (t , t0 ) I (3.13)
a3 •p
b3(t) ω aab (t )
b2(t)
O a2
a1
b1(t)
Figura 3.3: Rotación de una terna {b} respecto de una terna fija {a}.
Notar que en el caso trivial de no rotación todo eje orientado es invariante.
43
Donde, la columna ci (t ) de Ca contiene las coordenadas de bi en la base {a}. Por otra
parte, un dado vector p3 se expresa en coordenadas según cada terna de acuerdo con:
De acuerdo con (3.14), cada bi se expresa como una combinación lineal de los
elementos de la base {a} según: bi j Ca ( j , i )a j donde Ca ( j , i ) es el coeficiente (j,i)
de la matriz Ca . Por lo tanto de la (3.15) se obtiene:
p a Cba pb Ca p b
(3.16)
pb Cba p a (Ca ) 1 p a (Cba )T p a
a3
b3
2,3 b2
a2
Cba (3, 2)
C ba (2, 2)
a1
b1
Figura 3.4
44
Por lo que los coeficientes Cba ( j , i ) son los cosenos directores a j , bi cos j ,i ;
i, j 1, 2,3 de los elementos de {b} sobre los elementos de {a} (ver Fig. 3.4).
Hemos visto entonces que entre dos ternas positivas con un mismo origen O existe una
única MCD Cba que describe la rotación relativa entre ambas ternas de acuerdo con
(3.14) y a su vez convierte las coordenadas de un vector de 3 expresadas en cada terna
de acuerdo con las Ecs. (3.16). Más aun, la composición de rotaciones y de cambios de
coordenadas son fácilmente descritas mediante el producto usual de matrices. Estas
propiedades hacen de la MCD una de las parametrización fundamentales tanto desde el
punto de vista práctico como teórico para especificar la orientación de un cuerpo. Sin
embargo, dadas las 6 condiciones de ortonormalidad entre sus columnas:
0, si i j
ciT c j (3.18)
1, si i j
t
θba (t ) ω aab ()d ; (3.19)
to
La dirección del vector θba (t ) corresponde al eje invariante de la rotación que llamamos
Eje de Euler, mientras que el módulo de ba (t ) θba (t ) , llamado ángulo de Euler, es el
ángulo rotado alrededor del Eje de Euler en el sentido horario cuando el vector θba (t ) es
mirado desde el origen. Por tratarse de un eje invariante, θba (t ) tiene las mismas
coordenadas tanto en {a} como en {b(t)}, lo que justifica suprimir el superíndice sin
riesgo de ambigüedad en la notación.
45
Dado que para este caso particular las siguientes matrices conmutan (de hecho en
cualquier instante de tiempo ambas matrices son proporcionales)
t
S(ω aab (t )); S(θba (t )) S(ω aab ())d (3.20)
to
la ecuación diferencial (3.7) admite una solución explícita (ver por ejemplo
Zadeh/Desoer 1963, pp. 340) para la matriz de rotación o MCD introducida mediante la
definición (3.16), solución que escribimos a continuación.
•p a
θba (t )
a3
b3(t)
ω aab (t )
b2(t)
a2
a1
b1(t)
En la Ec. (3.22) se enfatiza el hecho de que Cba es sólo función del ángulo vectorial θba
suprimiendo la variable tiempo en la misma. Puesto que
S(θba )θba θba θba 0 S(θba ) θba , de la Ec. (3.22) resulta que Cb (θ ab )θ ab θ ab .
2 a
46
A continuación se reescribe la Ec. (3.22) según dos formas alternativas que permiten
calcular la MCD a partir del eje y ángulo de Euler:
Cba (θba ) exp(S(θba )) I senba S(θba ) (1 - cos ba )S 2 (θba )
(3.24)
C (θba ) exp(-S(θ ab )) I senba S(θ ab ) (1 - cos ba )S 2 (θ ab )
a
b
De la Ec. (3.22) se obtiene una relación que permite calcular el ángulo de Euler a partir
de la MCD.
traza(Cba ) 1
traza (Cba (θba )) traza(Cba (θba )) 1 2 cos ba cos(ba )= (3.25)
2
Notar que la traza(Cba (θba )) es sólo función del módulo del ángulo rotado y no de las
coordenadas del eje de rotación. De las Ecs. (3.24), reexpresadas como sigue:
surgen las siguientes relaciones que permiten calculara el eje de Euler a partir de la
MCD cuando senba 0 :
x (Cba (3, 2) Cba (2,3)) / 2senba ;
y (Cba (1,3) Cba (3,1)) / 2senba ; (3.27)
z (Cba (2,1) Cba (1, 2)) / 2senba
Si bien la Ec. (3.27) es indeterminada cuando senba 0 , la Ec. (3.25) permite decidir
que o bien no hay rotación alguna (cos(ba )=1 Cba =I ) , o bien cos(ba )= - 1 y en tal
caso las coordenadas del versor θba se obtienen usando:
47
C(2,1) x C(2,1) y C(1,3) x
; ; (3.28)
C(2,3) z C(3,1) z C(2,3) y
Cuando senba 0 las dos soluciones de la Ec. (3.25) de signo opuesto se corresponden
con dos soluciones de las Ecs. (3.27) con sentido opuesto para el eje de Euler, lo que
refleja el hecho de que una rotación de un ángulo ba alrededor de θba es equivalente a
una rotación de un ángulo ba alrededor de θba . De este modo, de acuerdo con la
Propiedad 2 y las Ecs. (3.22) a (3.28) es posible asociar a cada MCD una rotación
uniforme alrededor de un eje que es invariante bajo dicha rotación. En otros términos es
posible afirmar que el resultado de cualquier rotación es equivalente a una única
rotación descrita por el un ángulo vectorial θ de módulo y eje θ . Este resultado es
clásicamente expresado por el:
Teorema de Euler
El resultado final de cualquier movimiento de un cuerpo rígido con un punto fijo es
indistinguible de una rotación alrededor del único eje invariante bajo dicha rotación.
Entre las ventajas de esta parametrización destacamos la de requerir el número mínimo
de parámetros (las 3 componentes del vector θba 3 en dirección y módulo), sin
embargo la falta de redundancia no permite supervisar errores numéricos como en la
MCD. Por otra parte, su claro sentido geométrico resulta de interés en muchas
aplicaciones, aunque, como veremos más adelante, no exista una regla sencilla para la
composición de rotaciones expresadas con esta parametrización.
1 2 1
C( θ) I S( θ) 2 S(θ) S(θ)3 ... o( ) (3.29)
2! 3!
o( )
lim 0 (3.30)
0
48
C( v1 , v 2 ) exp(S( v1 )) exp(S( v 2 ))
[I S( v1 ) o( )][I S( v 2 ) o( )] (3.32)
I S( v1 ) S( v 2 ) o( ) I S( v1 v 2 ) o( )
Donde max( , ) . De la última igualdad y la definición de la exponencial resulta
trivialmente además que:
Así, para ángulos suficientemente pequeños las rotaciones conmutan y los ángulos se
componen vectorialmente. La MCD resultante es independiente de la secuencia de
rotaciones elegida.
Dadas 2 MCD cercanas Cba (θba ) y C ˆ a (θˆ ) , donde la segunda debe entenderse como
b ba
(θ a ) exp(S(θ a ))
ˆ a Cb C
C b a
(3.34)
ˆa C
Cba C (θb ) exp(S(θb ))
b
Y definimos la diferencia:
ˆb C
Cba Cba C a I)
ˆ b (C
a a
(3.35)
Cb (C b I )Cˆb
a a
Teniendo en cuenta las (3.29) y (3.30) la diferencia Cba satisface las relaciones:
que permiten definir el operador diferencial o parte lineal de las diferencias (3.35) de
las dos maneras siguientes:
Las relaciones anteriores vinculan las desviaciones angulares vectoriales que producen
un dado Cba de acuerdo con:
*
La unicidad de los ángulos así definidos está asegurada por la Propiedad 2. Ver también el párrafo 3.1.3.
49
Interpretación geométrica:
Sean las ternas {a} y {b} distantes de un ángulo vectorial θba y { â } y { b̂ } separadas
respectivamente de las primeras por los pequeños ángulos de desalineamiento b̂b y aaˆ
indicados en la (Fig. 3.6). De las expresiones (3.34) se tiene:
ˆ a Ca C
b (θ ) Cb Cbˆ C(θ ) Cbˆ θ θbb
b a b b b b
C b ˆ
(3.39)
(θ a )Ca Caˆ Ca C
ˆa C
C (θ a ) Caˆ θ a θ
b b a b a aaˆ
Lo que se interpreta como que, en el primer caso, la diferencia entre Ĉba y Cba se explica
por un desalineamiento θb θbbˆ en la terna de “llegada” y en el segundo caso por un
desalineamiento θ a θ aaˆ en la terna de “partida”.
aaˆ
â
a
ba b
b̂b
b̂
za
zb za za
yb
ya ya
ya
xa xa
xa
b
b
Ca ( ) b
Ca ( ) Ca ( )
1 0 0 cos 0 sen cos sen 0
0 cos sen 0 sen cos 0
1 0
0 sen cos sen 0 cos 0 0 1
Figura 3.6: Angulos y rotaciones elementales de Euler.
50
Ejemplificamos con una rotación positiva alrededor del eje x, descrita en coordenadas
como θba e1 . Calculamos primeramente los términos:
0 0 0 0 0 0 0 0 0
S(θba )= 0 0 ; S 2 (θba )= 0 2
0 2 0 1 0 ;
(3.40)
0 0 0 0 2 0 0 1
1 0 0
C (e1 ) exp( S(e1 )) 0 cos sen
b
a
(3.41)
0 sen cos
Con un procedimiento similar se obtienen las respectivas MCD asociadas a las otras
rotaciones elementales de Euler indicadas en la Fig. 3.6.
yb’ ya
yb”’
xb”=xb
xb’
a Cba ' Cbb ''' Cbb ''
x
za=zb’ a b’ b” b= b”’
51
Cba Cbb'' ()Cb''b' ()Cb'a () (@x b )(@yb' )( @za )
(3.42)
1 0 0 cos 0 sen cos sen 0
0 cos sen 0 1
0 sen cos 0
0 sen cos sen 0 cos 0 0 1
1
Cba ( e 3 , e 2 , e1 ) I S(e 3 ) S(e 2 ) S(e1 ) 1 (3.44)
1
De la Ec. (3.43) se obtienen, asimismo, las siguientes relaciones inversas que permiten
calcular los ángulos de Euler a partir de la MCD para la secuencia elegida.
La última de las Ecs. (3.45) establece una ambigüedad para el valor de que es
subsanada imponiendo ( / 2, / 2] . Sin embargo, cuando / 2 las
expresiones para y de las anteriores resultan indeterminadas. En efecto, para cada
uno de estos casos límites la (3.43) se reescribe, respectivamente:
0 0 1
b
: Ca sen cos cos sen cos cos sensen 0
2
sensen cos cos cos sen sen cos 0
(3.46)
0 0 1
sen( ) cos( ) 0
cos( ) sen( ) 0
y análogamente:
52
0 0 1
b
: Ca sen cos cos sen cos cos sensen 0
2
sensen cos cos cos sen sen cos 0
(3.47)
0 0 1
sen( ) cos( ) 0
cos( ) sen( ) 0
Por lo que, según el caso, sólo será posible determinar la suma o la diferencia de los
ángulos y Geométricamente lo anterior es consecuencia de que una rotación de
90º del ángulo intermedio hace que y constituyan rotaciones alrededor de un
mismo eje de la terna de referencia sumándose o restándose sus efectos. La indefinición
de y resultante del pasaje de por las singularidades / 2 puede, sin ciertos
recaudos, provocar la perdida definitiva del seguimiento del primer par de ángulos por
parte del algoritmo de navegación. Este fenómeno, observado inicialmente en
plataformas estabilizadas, es denominado “gimbal lock” en la literatura inglesa.
Wertz, (1988, pp. 417) demuestra que cualquier rotación puede ser descompuesta en
una secuencia de, a lo sumo, 3 rotaciones elementales de Euler no colineales. Esto
equivale a afirmar que cualquier MCD puede expresarse como el producto de, a lo
sumo, tres rotaciones elementales no colineales. Dados 3 ángulos de Euler , , es
necesario aún especificar la secuencia i-j-k de los ejes alrededor de los cuales son
aplicadas las rotaciones. Una misma rotación resultante puede obtenerse usando
cualquier secuencia de ejes siempre que no haya dos ejes consecutivos iguales (Wertz,
1988, Ap. E). Esto da lugar a 6 permutaciones con 3 ejes distintos (o de tipo I, tal como
la secuencia 3-2-1 en el ejemplo (3.42)-(3.45)) más 6 secuencias con los ejes 1º y 3º
coincidentes (ó de tipo II). Así, 12 secuencias diferentes pueden dar lugar a una misma
rotación resultante (y por consiguiente a una misma MCD) por lo que esta
representación sólo resulta univoca una vez especificada la secuencia de ejes elegida.
Como el lector podrá advertir, las secuencias de tipo I conducirán siempre a
singularidades para un valor del ángulo intermedio / 2 (ver Eqs. (3.45), (3.46) y
(3.47)). En cambio, para las secuencias del tipo II en que ik, la singularidad se
presentará cuando el ángulo intermedio adopte el valor condición, en este caso,
para que y constituyan rotaciones superpuestas alrededor de un mismo eje de la
terna de referencia. Por otra parte, las ambigüedades de este caso son evitadas
imponiendo (0, ]
53
3.1.6 Parámetros simétricos de Euler o cuaterniones
Para una dada rotación entre las ternas {a} y {b} definida por un ángulo vectorial θba
(eje-vector de Euler), como el expresado en la Fig. 3.8, establecemos: x cos
z cos y cos y definimos el cuaternión qba (θba ) 4 , asociado a la rotación
así como su conjugado qba (θba )* , según:
1
a θba sin ba
qb 2
qba (θba ) a ba
qb 4 cos ba
(3.48)
2
a
q b
qba (θba )* a qba (θ ab )
qb 4
Donde: qba sin 2ba θba 3 , qba 4 cos 2ba son, respectivamente, la “parte
vectorial” y la “parte escalar” del cuaternión. También es usual la siguiente notación
[vector, escalar]: qba (θba ) qba , qba 4 . Para simplificar la notación y mientras no surjan
ambigüedades de sentido denotamos además: qba q q1 q2 q3 ; [qba , qba 4 ] [q, q4 ] .
T
Claramente, de la definición surge que el cuaternión no depende del sentido del eje-
vector de Euler, i.e.: qba (θba ) qba (θ ab ) y que el cuaternión tiene norma unitaria, i.e.:
2
qba qbaT qba q12 + q22 + q32 + q42 = 1 .
a3
θba
z
y a2
x
a1
54
de las expresiones (3.24) surgen las siguientes expresiones que permiten calcular la
MCD en función del cuaternión o su conjugado asociado a una misma rotación entre
ternas:
Cba (qba ) exp(S(θ ab )) I 2q4 S(q) 2S 2 (q) Cba (qba )* I 2q4 S(q) 2S 2 (q)
(3.49)
Cba (qba ) exp(S(θba )) I 2q4 S(q) 2S 2 (q) Cba (qba )* I 2q4 S(q) 2S 2 (q)
1
traza (Cba ) traza (Cba ) 3q42 q12 q22 q32 4q42 1 q4 (traza (Cba ) 1)1/ 2 (3.52)
2
1
Cba Cba 4q4S(q ) S(q ) Cba Cba (3.53)
2(1 trazaCba )1/ 2
La ambigüedad de signo en las Ec. (3.52) y (3.53) es sólo aparente ya que como es
posible ver de las (3.50) y (3.51) un cambio de signo en todas las componentes del
cuaternión produce la misma MCD y por tanto la misma rotación.
55
s rq s1i s2 j s3k s4
(r1i r2 j r3 k r4 )(q1i q2 j q3 k q4 )
(3.56)
i (r4 q1 r3 q2 r2 q3 r1q4 ) j (r3q1 r4 q2 r1q3 r2 q4 )
k (r2 q1 r1q2 r4 q3 r3q4 ) (r1q1 r2 q2 r3 q3 ) r4 q4
r4 r3 r2 r1 q1
r r4 r1 r2 q2
rq
3
(3.57)
r2 r1 r4 r3 q3
r1 r2 r3 r4 q4
qT (q v a )
2
Si en la anterior se usan la igualdad (que el lector podrá verificar): S 2 (q) q I qqT ,
2
junto con las relaciones qba 1 y (3.49), se obtiene finalmente la regla de
transformación de coordenadas mediante cuaterniones.
56
vb I 2q4 S (q) 2S 2 (q) v a Cba (qba ) v a
v q a v q (q a )
b
q
b a b *
(3.60)
0 0 0
Consideremos ahora las ternas {a}, {b} y {c}. Los ángulos vectoriales θ ab / θbc / θ ac se
corresponden, respectivamente, con las rotaciones “desde” las ternas {b}/{c}/{c}
“hacia” las ternas {a}/{b}/{a}. Usando la definición (3.48) establecemos los
respectivos cuaterniones:
θ ab sin ab / 2 θ bc sin bc / 2
θ ac sin ac / 2
qba (θ ab ) ; qb (θbc )
c
; q ca (θ ac ) ; (3.61)
cos ab / 2 cos bc / 2 cos ac / 2
-
q e (eei ) ei sin e , cos e q ,q4 ; i 1, 2,3 (3.65)
2 2
57
Una vez más la notación hipercompleja nos facilita el cálculo de estas composiciones
elementales. En efecto partiendo de la definición de productos hipercomplejos (3.56),
el cuaternión resultante en notación se obtiene según:
qba q x ()q y ()q z ( ) (i sin cos )( j sin cos )(k sin cos ) =
2 2 2 2 2 2
i - sin cos cos sin sin cos j sin cos cos - sin cos sin
2 2 2 2 2 2 2 2 2 2 2 2
k - sin cos cos cos sin sin cos cos cos sin sin sin
2 2 2 2 2 2 2 2 2 2 2 2
(3.66)
Los cuaterniones ofrecen una parametrización muy eficaz de la orientación debido que
sólo tienen un parámetro redundante comparado con 6 de las MCD lo que se refleja en
importantes ventajas computacionales mientras que comparten con las MCD una ley
sencilla de composición. Esta última propiedad los hace preferibles en ciertos casos a
otras parametrizaciones como los ángulos de Euler o el ángulo vectorial de rotación
(eje y ángulo de Euler) que, aunque sin parámetros redundantes no poseen una ley de
composición sencilla. Otra ventaja respecto de estas últimas parametrizaciones es la de
no presentar singularidades o ambigüedades para ningún valor de sus parámetros que
deba resolverse con información suplementaria. Cabe sin embargo señalar como
desventaja cierta dificultad para interpretar geométricamente el sentido de sus
parámetros.
Diferencial de cuaterniones
Tal como para las MCD dados dos cuaterniones cercanos qba (θ ab ) y qˆ ba (θˆ ab ) ,
conformamos las siguientes composiciones que definen respectivamente, los ángulos
vectoriales θa y θb :
ˆ ba = qˆ ba (q (θa ) q0 )
qba (θ a ) qba - q
, (3.68)
(θb ) q0 )qˆ ba
qba (θb ) (q
58
1 θb
1 2 θ
2 b
q ( θ b ) 2 ;
1 4 θ
1 b
1
(3.69)
1 θ a
1 2 θ
2 a
q ( θ a ) 2
1 4 θ
1 a
1
θ a θb b
q(θ ) 2 q
a 1 b
a (θ ab ) ; q(θ ) 2
b 1 q a (θ ab ) (3.70)
0 0
{b(t)}
θba θb ' b
{a} {b’}={b(t+t)}
x
ab
59
a (t , t ) S(ω a (t ))Ca (t , t );
C Cba (to , to ) Cba (to ) (3.71)
b o ab b o
A partir de las (3.71) y (3.72) es fácil ver, además, que según en que sistema de
coordenadas esté expresada la velocidad angular ω ab (t ) , la ecuación de propagación de
la MCD a partir de la condición inicial arbitraria: Cba (to , to ) Cba (to ) (o su transpuesta
según corresponda) se escribe:
a (t , t ) S(ω a (t ))Ca (t , t ) C
C b (t , t ) S(ωb (t ))Cb (t , t )
b o ab b o a o ba a o
(3.73)
a (t , t ) Ca (t , t )S(ωb (t )) C
C b (t , t ) Cb (t , t )S(ω a (t ))
b o b o ab a o a o ba
qba qba (t t ) qba (t ) qba ' qba (t ) qba (qbb ' q 0 ) (3.75)
T
Recordando que q 0 0T 1 , calculamos la derivada temporal del cuaternión
mediante:
b '
q a
1 θ b ' b sin b ' b / 2
0
q ba lim b
qba lim
t 0 t t 0 t cos b ' b / 2 1
(3.76)
θbb '' b
1 a lim 1 a ωbab (t )
qb t 0 t qb
2 2 0
0
Donde, la anteúltima igualdad surge del desarrollo de 2º orden de las funciones seno y
coseno mientras que la última igualdad se obtiene usando la definición de velocidad
60
angular vectorial instantánea en coordenadas de {b} (nótese que el ángulo θbb ''b tiene el
mismo sentido positivo de rotación que ωbab (t ) ):
θbb ''b
ωbab (t ) lim (3.77)
t 0 t
La Ec. diferencial (3.76) describe la evolución temporal del cuaternión qba (θba ) función
de la rotación “acumulada” θba desde la terna {a} hacia la terna {b} en el instante t. La
función forzante es la velocidad angular ωbab (t ) de la terna {b} respecto de {a} en
coordenadas de {b}. Conjugando la Ec. (3.76) y usando la propiedad del conjugado de
una composición de cuaterniones introducida más arriba, se obtiene la ley de
propagación del cuaternión qba (θ ab ) :
*
1 ω b 1 ω b
(q ) q (θ ab ) ab qba ba qba
a *
b
b
a (3.78)
2 0 2 0
Combinando las Ecs. (3.76) y (3.78) se obtienen las ecuaciones cinemáticas similares a
las Ecs. (3.73) para la MCD según el sistema de coordenadas al que esté referida la
velocidad angular entre las ternas. Intercambiando índices se obtienen las ecuaciones
para los cuaterniones conjugados.
1 ωbba b 1 ω aab a
q ba q
a q a
b qb
2 0 2 0
(3.79)
1 b ωba a
1 a ωbab
q a q a
b
q b qb
a
2 0 2 0
3.2.3 Ecuación cinemática del ángulo vectorial de rotación: Ecuación del “coneo”
Como vimos, el ángulo vectorial instantáneo entre dos ternas que giran relativamente
queda asociado ya sea a la MCD mediante la Ec. (3.22) o al cuaternión definido por las
Ecs. (3.48) (o (3.74)). Esto ofrece al menos dos vías para formular una ecuación
diferencial para θba (t ) : a) el desarrollo empleado por Bortz (1971) que consiste en
reemplazar la (3.22) en cualquiera de las (3.73), o b) reemplazar la (3.48) en cualquiera
de las (3.79) siguiendo a Savage (1997, 3.3.1 parte I ). Los pasos algebraicos resultan
un poco más sencillos en el segundo caso por lo que elegiremos ese camino para nuestro
desarrollo. Para simplificar la notación denotamos:
Tomamos por caso la última de las Ecs. (3.79) rescrita usando la expresión del producto
(3.58) según la notación [vector, escalar]:
61
1 θ 1 1 1
q sin , cos ω, 0 [cos ω sin θ ω, sin θω] (3.81)
2 2 2 2 2 2 2
1
f1 cos ; f 2 sin (3.82)
2 2
1 1
f1 sin f 2 ;
2 2 2
(3.83)
1 cos 2 sin 2 f 2 f1
f2 1
2 2
2 f2
1 1
q f 2θ, f1 ω, 0 f 2θ ω f1ω, f 2θ ω (3.84)
2 2
Mientras que por otra parte derivando el cuaternión respecto del tiempo resulta:
d
q f 2θ, f1 f2θ f 2θ , f1 (3.85)
dt
Igualando las partes escalar y vectorial de las (3.84) y (3.85) surgen las igualdades:
1 1 1 f f
f1 f 2 f 2θ ω θ ω 2 θ ω f2 22 1 1 θ ω (3.86)
2 2 2 f2
1 1 f1 1 1 f
f2θ f 2θ f 2θ ω f1ω θ ω θ ω 2 1 1 (θ ω)θ (3.87)
2 2 f2 2 2 f2
De la Ec. (3.87) surge la ecuación de estado para el vector después de sustituir las
definiciones de f1 y f3.. Finalmente, usando las identidades:
1 cos( / 2)
u • v u u u v u 2v , tan( / 2) (3.88)
sin( / 2)
1 1 sin ba
θ ba ω aab θba ω aab 2 1 ba θba θba ω ab ; θba (to ) θba
a 0
(3.89)
2 ba 2(1 cos ba )
62
Cuando se substituye la solución de (3.89) en la Ec. (3.22) y en las Ecs. (3.48) se
obtienen, respectivamente, las soluciones para tto de la ecuación cinemática de la
MCD (3.71) y la correspondiente del cuaternión (3.79), de este modo, usando las (3.22)
y (3.48) se tiene:
De (3.89) se observa que sólo si θba (t ) se mantiene paralela a ω aab (t ) resulta ser
θ ba ω aab . En este caso las rotaciones (alrededor de un eje invariante) son conmutativas,
es decir no dependen del orden en que son ejecutadas. La composición no conmutativa
de dos ángulos de rotación no paralelos, ej.: θ1 seguido de θ2 , puede obtenerse
mediante el artificio de hacer θ(t0 ) θ1 en la (3.89), expresar a θ 2 T como una
rotación uniforme con velocidad angular constante durante un tiempo T y hallar la
solución de la solución de la Ec. diferencial (3.89) en t=T. La no conmutatividad del
vector θba esta representada por los dos últimos términos de la (3.89):
63
ab x" . Cuando el cambio ocurre simultáneamente en los tres ángulos, la velocidad
angular entre ambas ternas es la composición vectorial de las velocidades angulares en
cada eje. A continuación se expresa dicha velocidad angular en coordenadas de {b}.
1 0 0 1 0 sin
0 Cb ''Cb ' 1
b b b ''
Ca 0 0 cos sin cos M321 (, )
b 1
(3.93)
ab
0 0 1 0 sin cos cos
Ese importante destacar que las ecuaciones anteriores resultan singulares en el pasaje de
por / 3 . Como se mostró en el párrafo 1.1.5 esta singularidad esta asociada la
abrupta indistinguibilidad entre los ángulos y y a la consiguiente indefinición de
sus valores. Este hecho constituye una seria limitación para el uso de esta
parametrización en la integración numérica de las ecuaciones cinemáticas de la
orientación.
64
Capítulo 4
Geometría de la Tierra,
Ternas de Referencia y Gravedad
Dado que las ecuaciones de la mecánica se enuncian de modo diferente según estén o no
referidas a un sistema inercial, resulta necesario, además, distinguir las ternas inerciales
de las que no lo son. Las primeras, idealmente “animadas de un movimiento lineal
uniforme” o bien “fijas respecto de las estrellas”, son aquellas que, al menos desde un
punto de vista práctico, verifican las leyes de Newton en su forma más simple.
Contrariamente, las ternas no inerciales son solidarias a un objeto en rotación o en
movimiento no uniforme (como la Tierra o el mismo vehículo).
Son objeto de este capítulo, algunos principios básicos de geodesia y gravitación que
atañen a la navegación en la vecindad de la Tierra, así como la descripción de las
principales ternas de referencia utilizadas en la práctica.
65
4.1 Geometría de la Tierra
66
a adoptar en 1984 como superficie de referencia un elipsoide geocéntrico de revolución
alrededor del eje de los polos terrestres con su diámetro mayor en el plano ecuatorial y
su diámetro menor en el eje nominal. Sucesivas mejoras a este sistema introducidas
más tarde concluyeron finalmente en el actual Elipsoide WGS 84 definido por la
National Imagery and Mapping Agency (NIMA) que describimos más adelante y
llamaremos en lo sucesivo el elipsoide normal. La excelente aproximación del Geoide
por el elipsoide normal se traduce en diferencias de alturas entre ambos inferiores a los
100m. en todo el planeta. Cabe destacar que el sistema WGS84 sirve actualmente como
referencia para el sistema GPS y otros sistemas satelitales de navegación global (GNSS:
Global Navigation Satellite System) a los que nos referiremos en el Capítulo 9.
e1
P
e2
h Q0 Geoide e3
P0 N e4
S
Q
Elipsoide normal
Nivel Medio
del Océano
En la Fig. 4.1 se indican: la proyección S sobre el elipsoide normal del punto genérico P
según la vertical geodésica; la altura geodésica h de P sobre el elipsoide normal; la
ondulación o altura del Geoide sobre el elipsoide en el punto Q y la altura ortométrica
de P sobre el Geoide dada por la longitud de la curva PP , tangente en todo punto a la
0
dirección de la plomada.
Sup. terrestre
CTP
Sup. equipotencial
Geoide
P: Posición del vehículo
Elipsoide
normal
vg: Vertical geodésica
va: Vertical
Ejes del astronómica
elipsoide (Gravedad)
Centro de a
masa de la c
Tierra
O
Figura 4.2: Cuadrante de meridiano terrestre y definiciones de latitud.
67
En el cuadrante de meridiano representado en la Fig. 4.2 se comparan la superficie
terrestre (y sub-oceánica) con el Geoide y el elipsoide normal. Se indican la superficie
equipotencial que pasa por el punto P, la línea normal al elipsoide, o vertical geodésica
y la dirección del vector gravedad o dirección de la plomada. Los ángulos a c y
indicados en la figura, se denominan, respectivamente, latitud astronómica, latitud
geocéntrica y latitud geodésica.
Elipsoide : S0 x, y, z; ( x 2 y 2 ) / a 2 z 2 / b 2 1
(4.1)
Elipse : E0 ( x, y, z ) S0 ; y 0 x 2 / a 2 z 2 / b 2 1
dx zS a 2
( , ) tan
2 2 dz xS b 2
(4.2)
xS 0, zS b
2
*
Dirección astronómica media del polo terrestre entre 1900-1905, fija inercialmente.
68
a cos
xS
2
1
(1 sen )
2 2
2 12 ; [ , ] (4.3)
b(1 ) sen 2 2
zS
2
1
(1 sen )
2 2
z
( , ) tan( c ( S )) s (1 2 ) tan( ( S ))
2 2 xs
(4.4)
c
2
En los capítulos siguientes necesitaremos conocer los radios de curvatura según las
direcciones del paralelo y del meridiano locales en función de la latitud de cada punto
del elipsoide de referencia. Introducimos primeramente el Radio normal Rn (ver Fig.
4.3):
xs a
Rn ( ) (4.5)
cos( ) (1 sin 2 ( ))1/ 2
2
b 1
zS ( ) Rn ( ) (1 2 ) 2 sen( ) Rn ( )(1 2 )sen( ) (4.7)
a
(1 ( dx
dz 2 3/ 2
) ) a (1 2 )
Rm ( ) (4.9)
d2z
dx 2
(1 2 sin 2 ( ))3/ 2
De las Ecs. (4.5) y (4.9) surge la siguiente relación entre los radios Rn y Rm sobre la
elipse normal:
69
z
y
a
a
x z P
Plano Meridiano 0º 90º-
r
b
h
S(xs,zs)
rs
c
O a x
Rn
Rm (, h) Rm ( ) h (4.11)
70
4.2 Ternas de referencia
4.2.1 Terna Centrada Terrestre (ECEF) y terna Inercial Centrada Terrestre (ECI)
Ambas ternas tienen su origen en el centro de masa nominal de la Tierra, su eje “z” es
paralelo al eje nominal terrestre y sus ejes “x” e “y” están contenidos en el plano
(ecuatorial) ortogonal a “z” (ver Fig. 4.4). La terna centrada terrestre {e} (ECEF: Earth
Centered-Earth Fixed) es solidaria a la Tierra, su eje “x” pasa por el meridiano 0º BHI y
su eje “y” completa la terna ortonormal positiva. La terna inercial centrada terrestre {i}
(ECI: Earth Centered Inertial) conserva su orientación invariante en el espacio inercial
y es considerada inercial mientras sean despreciables los efectos de la rotación de la
Tierra alrededor del Sol. Usualmente, sus ejes “x” e “y” se elijen coincidentes con los de
la terna ECEF en el instante inicial de la navegación. Por definición, la terna ECEF rota
(junto con la Tierra) a la velocidad angular terrestre Ωe respecto de la ECI alrededor
del eje “z” común a ambas ternas (eje invariante de la rotación).
e i
z ºz Vector velocidad
Ωe angular de la Tierra
Meridiano de P
Greenwich
Plano
Ecuatorial
e
y
O
i
y
i
x
e t
e
x
71
Las coordenadas cartesianas de un punto genérico P según las ternas ECEF y ECI se
denotan respectivamente:
P e x e y e z e ; Pi xi y i z i
T T
(4.13)
e N c
z z U
c y
e
O D
U N
e
x
E
72
1 0 0 sen cos 0
Cce ( ENU ) 0 sen c cos c cos sen 0
0 cos c sen c 0 0 1
(4.14)
sen cos 0
sen c cos sen c sen cos c
cos c cos cos c sen sen c
Las siguientes ecuaciones permiten relacionar las coordenadas ECEF con las
coordenadas curvilíneas esféricas (c, r) del punto P:
x e r cos c cos
P e y e r cos c sen (4.15)
z e r sen c
0
P 0
c
(4.17)
r
Las ternas LGV (Local Geodetic Vertical), que llamaremos geodésicas, están centradas
en el centro de gravedad de la Tierra, su eje z es paralelo a la vertical geodésica local
(con sentido U ó D) y sus ejes horizontales, x e y, son paralelos al plano tangente al
elipsoide WGS84 en el punto de la proyección del punto P (S en la Fig. 4.6). Cuando
los ejes x e y son paralelos a las direcciones cardinales (E/O ó N/S) la salida del sistema
de navegación queda automáticamente referida a estos ejes lo que resulta muy
conveniente en muchas aplicaciones (p.e.: el rumbo de un vehículo o la orientación de
un objeto a bordo del mismo).
73
procedimiento es particularmente crítico en las vecindades de los polos donde pequeños
desplazamientos en la dirección E-O inducen grandes cambios en la dirección N-S.
Esto se traduce, como veremos en el próximo capítulo, en dificultades numéricas
importantes en los algoritmos de navegación inercial. Lo anterior motiva el uso de
ternas geodésicas “no-cardinales” obtenidas a partir de las cardinales mediante la
rotación de un ángulo positivo alrededor de su eje z llamado ángulo de deriva o
“wander angle”. Por abuso de lenguaje, estas ternas son comúnmente llamadas ternas
de navegación y denotadas con “n”. Existen diversas estrategias para definir la rotación
(t)@z y algunas de ellas serán descritas en el Capítulo 5.
e
z N
N U
P E
E
g
y ||N g
h
z ||U
S D
g Terna “g”
x ||E
O y
e
U N
e E
x
Terna “l”
Figura 4.6: Representación de las ternas ECEF y LGV-ENU.
cos sen 0 0 1 0
C n
g ( ENU ) ( @ z ) sen cos 0 ; C l ( NED )
g ( ENU ) 1 0 0 (4.18)
0 0 1 0 0 1
Tal como la terna geocéntrica, la terna geodésica rota respecto de la terna ECEF a
medida que el vehículo se desplaza. La MCD del cambio de coordenadas entre la terna
geográfica y la ECEF se obtiene en función de y de modo similar a la Ec. (4.14):
sen cos 0
C sen cos
g
e sensen cos (4.19)
cos cos cos sen sen
En virtud de la definición (4.5) y las Ecs. (4.6) y (4.8), las coordenadas cartesianas en
terna {e} del punto P se expresan en función de sus coordenadas geodésicas (,h)
según:
74
x e ( Rn () h) cos() cos()
P e y e ( Rn () h) sin() cos() (4.20)
z e ((1 2 ) Rn ( ) h) sin( )
tan() ( x e / y e )
rxye R p (, h) ( Rn ( ) h) cos( ) (4.21)
, h
z e ((1 2 ) Rn ( ) h)sen( )
xg 0
g
P y Rn sin() cos( )
g 2
(4.22)
z g ( Rn h) 2 Rn sin 2 ()
N
α
ψg
n
xb
y
ψ
xn
α
E
Figura 4.7: Rumbos geográficos y de navegación.
75
Las coordenadas en terna {n} de un punto P se determinan a partir de la (4.22) y la
primera de la (4.18), o bien, a partir de la (4.20) y usando además la (4.19) como:
De las Ecs. (4.19) y (4.18) resulta la MCD Cen en función de y
C S S S C C C S S S S C
Cen Cng Ceg S S C S C S C C S S C C (4.24)
C C C S S
a) b) Δλ
O N N
P U
cos() E
v vg
Terna
va LGV en P sin( )
P
ξ
Figura 4.8: Componentes de la deflexión vertical.
*
Observadas respecto del vector gravedad local.
76
-
δvg (4.26)
tan
Dado que δvg 50arcseg , la MCD que expresa el cambio de coordenadas entre la terna
LGV {g} y la LAV {a} puede obtenerse como la composición de pequeñas rotaciones
de Euler alrededor de los ejes de la terna {g} (ver Ec.
¡Error! No se encuentra el origen de la referencia. del Capítulo 2) donde resulta:
1 tan( )
Cag tan( ) 1 (4.27)
1
Por otra parte, la MCD correspondiente al cambio de coordenadas entre la terna {e} y la
terna {a} resulta de un modo análogo a la (4.19):
sena cos a 0
C sen a cos a sen a sena cos a
a
e
(4.28)
cos a cos a cos a sena sen a
Cbl xl
yl
Nivel (l) g-NED
zl
Figura 4.9: Ternas del Cuerpo (b), de mediciones (m) y de “nivel” (l g-NED).
La terna asociada al cuerpo del vehículo, que denotamos con el superíndice “b” (body),
permite describir la orientación de éste respecto de la terna de navegación. El origen de
la terna del cuerpo (P en las Figs. 4.1 a 4.6) es un punto característico del vehículo,
usualmente su centro de masa, cuya posición y velocidad respecto de la terna de
navegación de referencia interesa conocer en todo instante. Si bien los ejes de la terna
del cuerpo pueden ser arbitrarios, estos suelen ser elegidos conforme a los planos de
77
simetría del vehículo y/o a sus condiciones de desplazamiento nominal. Muy
frecuentemente (y regularmente en aeronavegación), el eje xb (de guiñada o roll) apunta
en la dirección de avance del vehículo (o su “nariz”), el eje zb (de rumbo o yaw) apunta
hacia “abajo” y el eje yb (de cabeceo o pitch) completa la terna positiva (ver Fig. 4.9).
Con la definición anterior de los ejes, la orientación del vehículo respecto de la terna
geodésica {l} queda determinada por los 3 ángulos de Euler: g(yaw o rumbo
geográfico según la Fig. 4.7), (pitch) y roll) (ver Fig. 4.9) aplicados en la secuencia
3-2-1. La MCD del cambio de coordenadas correspondiente resulta de acuerdo con la
Ec. (3.42) del Capítulo 3 y usando la notación empleada en la Fig. 3.7 *:
En función de los mismos ángulos pero respecto de la terna geodésica {g} la orientación
del vehículo queda definida por la secuencia de rotaciones:
S C g C S S g S S g C S C g C C
Por último, la MCD que vincula la terna del cuerpo {b} con la terna {n} se obtiene
desarrollando la anterior después de sustituir g por g y resulta:
*
Cuando convenga por razones de espacio se utilizará la notación: sen()=S, cos()=C
78
4.3 Modelos Globales de Gravitación y Gravedad
GM T a
n
V (r , c , ) 1 Cn ,0 Pn (sen( c ))
r n 2 r (4.32)
n
Pn , m (sen c ) Cn ,m cos(m) S n , m sen(m)
m2
En la práctica, los modelos globales del potencial gravitacional terrestre son descritos
por truncamientos de la serie (4.32). Los mejores modelos disponibles actualmente son:
el GRIM 5 (colaboración entre: el Geodetic Research Institute de Munich y el Groupe
de Recherches de Geodesie Spatiale, Francia) y el EGM96 (colaboración entre: NASA-
GSFC, National Imaging and Mapping Agency (NIMA) y Ohio State Univ.) y utilizan
un orden máximo mayor o igual a n=360. Los coeficientes gravitacionales son
determinados combinando modelos analíticos de las perturbaciones (mareas, presión
atmosférica y otros) y observaciones que incluyen gravimetría superficial y satelital†,
monitoreo de órbitas satelitales, altimetría satelital por laser y radar, redes geodésicas
GPS, etc.
*
En la practica, el semieje mayor del elipsoide normal cumple esta condición con un alto grado de
aproximación.
†
Los datos aportados por la misión satelital “Gravity Recovery and Climate Experinent (GRACE)” desde
2002 combinados con otras fuentes permitirán mejorar la estimación de los coeficientes gravitacionales y
seguir su evolución.
79
Cada término se anula en 2m longitudes (planos meridianos).
Cuando m=0, los H n,0 son independientes de la longitud. Sus coeficientes
asociados Cn ,0 , n 2,... son los dominantes de cada grupo n.
Cuando m=0, las Pn ,0 (sen( c )) alcanzan su valor máximo (+1) o mínimo (-1)
en los polos.
Las funciones Pn ,m (sen( c )) son simétricas respecto del Ecuador cuando n+m
es par y antisimétricas cuando n+m es impar.
Cuando m≠0 las funciones Pn ,m (sen( c )) se anulan en los polos y en n-m
latitudes. Si n=m, sólo se anulan en los polos.
El potencial gravitatorio U(P) ejercido sobre una masa rotando con la Tierra resulta de
la superposición del potencial gravitacional V(P) y del “potencial centrífugo” W(P)
provocado por la fuerza centrífuga debida a la velocidad angular terrestre :
1 2 1
W ( P) P 2 r 2 cos 2 c
2 2 (4.34)
U ( P) V ( P)+W ( P)
*
De tessera, en latín, mosaico.
80
Aceleraciones Gravitacional y Gravitatoria
A partir del potencial gravitacional expresado en armónicos esféricos (4.32) es posible
obtener el vector gravitación expresado en la Terna Vertical Geocéntrica Local (LGCV)
(E-N-U) mediante las relaciones:
T
g cg ( , c , r ) cV g gc E g gc N g gUc
1 V 1 V V (4.35)
g gc E ; g gc N ; c
g gU ,
r cos c r c r
GM 1 n a n
g c
gE 2
r cos c
m(Cn ,m sin m S n ,m cos m ) Pn ,m (sin c )
r
n 2 m0
GM a n
n
g gc N
r2
(Cn ,m cos m S n ,m sin m ).( Pn ,m 1 (sin c ) m tan c Pn, m (sin c )
r
n 2 m0
GM
n
n
a
c
g gU 2 1 (n 1) (Cn ,m cos m S n ,m sin m ) Pn ,m (sin c )
r n 2 m 0 r
(4.36)
Aplicando las mismas expresiones (4.35) al potencial W(P), dado por la primera de las
(4.34), se obtiene la expresión para la gravedad centrifuga: g w W en terna (LGCV)
(E-N-U), de donde, junto con la 2ª de las (4.34), resulta la gravedad actuando sobre una
masa solidaria a la Tierra:
0
g (, c , r ) U g g g r cos c sen c
c c c
g
c
w
c
g
2
(4.37)
cos c
Dado que Pn ,m se anula en n-m latitudes mientras que cos(m ) y sen(m ) lo hacen en a
lo sumo 2n longitudes, el índice n define la resolución angular sobre la esfera (longitud
de onda espacial del armónico) es decir, la escala de la información que contiene. Por
otra parte, la simetría casi esférica de la Tierra hace que con alturas crecientes el factor
(a/r)n suavice rápidamente las altas frecuencias espaciales presentes en los armónicos
superiores. Esto adquiere particular relevancia en ciertas aplicaciones satelitales. Así,
sobre órbitas de alturas bajas (Low Earth Orbits 1000 Km de altura) y medias (Middle
81
Earth Orbits a 20.000 Km) resoluciones, respectivamente, de 10º (n=36) y de 30º (n=
12) se traducen en aproximaciones de una muy aceptable precisión. Más aún, para estas
órbitas, la fuerte simetría axial y el efecto de promediado del campo gravitatorio a lo
largo de la orbita permite descartar los términos no zonales del desarrollo (4.32) lo cual
conduce a la aproximación (Wertz-1978):
GM T
a
n
GM T
a
n
V ( , c , r ) 1 Cn ,0 Pn ,0 (sen c ) 1 J n Pn (sen c )
r n 2 r r n 2 r
(4.38)
La excelente aproximación geométrica del Geoide por el elipsoide normal motiva el uso
de este último también como referencia gravitatoria. Así, por definición, el elipsoide
normal posee una masa igual a la masa terrestre total, rota a la velocidad angular
terrestre nominal e y genera un hipotético potencial gravitatorio normal Un del cual
su propia superficie So es equipotencial. Un es la superposición del potencial
gravitacional normal Vn y el potencial centrífugo definido mediante la (4.34). De
acuerdo con el Teorema de Stokes-Poincaré (Torge 2001) Un queda unívocamente
definido sobre y al exterior de So, por la solución del siguiente problema laplaciano con
condiciones de contorno:
82
P exterior a S0 2Vn ( P) 0;
P S0 Vn ( P ) U 0 W ( P ); (4.39)
GM T
r P Vn ( P)
r
Donde, la segunda de las (4.39) es la condición de que S0 sea una superficie de potencial
constante igual a U0 y la tercera, la condición de que para grandes distancias el potencial
gravitacional normal resulte indistinguible del potencial gravitacional terrestre lejano.
Constante Valor
f : Achatamiento 298,257223563-1
Excentricidad 0,08181919084
Hofmann & Moritz-2006 demuestran que el potencial con simetría axial solución de las
(4.39) es tal que: a) la solución Vn( h) es un fórmula exacta cerrada función de las
coordenadas geodésicas h del punto P sobre { [0, 2] }Ç{h0}
independientemente de la longitud y, b) que el potencial gravitatorio sobre So adopta
el valor:
GM T 2 a 2
Uo arctan( E / b) (4.40)
E 3
83
γ ( P) U n ( P); γ g ( P) Vn ( P) (4.42)
Vista la simetría axial del potencial normal y la condición de que el elipsoide normal es
una superficie equipotencial, la gravedad normal γ ( P) expresada en coordenadas
geodésicas (LGV-ENU) sobre y fuera del elipsoide normal adopta la forma:
Donde N h) y U (, h) son funciones cerradas (exactas) de sus argumentos cuyas
expresiones pueden consultarse en NIMA-TR8350-2, 2004 o en Hofmann/Moritz, 2006.
Cuando el punto P( , , h ) no pertenece al interior de S0, por definición, γ ( P) es
ortogonal al elipsoide geocéntrico equipotencial con-focal con S0 de potencial igual a
U n ( P) (Hofmann/Moritz, 2006), pero no necesariamente es ortogonal a S0, salvo, claro
está, si h=0. Esto, junto con la simetría axial del potencial normal explica la ausencia de
la componente E de γ g (, h) y la existencia de la componente residual N-S en la Ec.
(4.43) para h>0. Cuando h=0 resulta la Fórmula de Somigliana (Hofmann/Moritz,
2006):
1 k sin 2
U (, 0) ( ) o ; (4.44)
1 2 sin 2
(1 f ) p
k 1 0,001931852
o
h h
2
84
El error de la aproximación (4.45) es inferior a 0.15g para h20Km (Hofmann/Moritz
2006). Los mismos autores proponen la siguiente aproximación de la componente Norte
( N ) con un error inferior a 0.1g para h20Km:
N (, h) N (, h) 8.08 106 h[ Km]sen(2 ) m / seg 2 (4.46)
Hsu (1998) propone un modelo polinomial global para U (, h) con errores <0.01g
para h30Km.
GM T ze
2n
a
Vn (P ) 1 J 2 n P2 n ( )
e
(4.47)
r n 1 r r
Con:
γ eg (P e ) eVn (P e ); γ ce (P e ) eW (P e ) (4.49)
85
Aproximación J2
Dado que los coeficientes gravitacionales decrecen rápidamente con el índice n el
término dominante de la serie (4.47) (también de las (4.32) y (4.38)) corresponde al
coeficiente zonal J2 (@1.082x10-03). En efecto, J2 supera casi en 3 órdenes de magnitud a
cualquier otro coeficiente gravitacional y refleja el abultamiento ecuatorial y
consiguiente achatamiento en los polos del Geoide. Para ciertas aplicaciones, esto
justifica truncar la serie (4.47) en el primer término lo que conduce a la siguiente
aproximación del potencial gravitacional normal.
GM T a
2
Vn (P ) VJ 2 (P )
e e
1 J 2 P20 ( z / r )
e
r r (4.50)
GM T J 2a2 2
1 2 1-3(z / r )
e
r 2r
3 J 2 a 2 15 J 2 a 2 2 e
(1 2r 2 2r 2 s ) x
xe
GM 2 2
3J a 15 J 2 a 2 e
eJ 2 γ egJ 2 (P e ) γ ce (P e ) 3 T (1 2 2 2
s ) y 2 y e (4.51)
r 2r 2r
2 2
0
(1 3 J 2 a 15 J 2 a s 2 ) z e
2r 2 2r 2
Con:
86
(1997) la fuente más significativa de error del modelo de gravedad corresponde a la
estimación de la componente horizontal no tenida en cuenta por el modelo normal, de
allí la importancia del modelado de la deflexión vertical introducida en el párrafo 4.3.4.
T ( P) U ( P) U n ( P)
(4.53)
δg ( P ) g ( P) γ ( P) T ( P)
0 -g
δg C 0 - γ -g
g
g
a
g
(4.54)
-g -g
( g )
g γ
g g
corr (, , h; , ) ( g ) N (4.55)
g U
g ( PG ) g ( PG ) γ (QE )
(4.56)
g ( PG ) g ( PG ) (QE )
87
información de base con que se cuenta para la determinación de las perturbaciones de
gravedad ya sea en altura o sobre la superficie terrestre.
Casi todos los métodos, para obtener las perturbaciones de la gravedad g fuera del
Geoide a partir de las anomalías de gravedad se basan en la solución del problema de
valores en la frontera de un potencial newtoniano (o problema de Dirichlet). La mayoría
de ellos usan al Geoide como superficie equipotencial teórica de frontera y se inspiran
en el hecho de que U y Un tienen la misma componente centrífuga (comparar (4.34) con
(4.41)) por lo que T(P) en (4.53) es puramente “gravitacional” y por lo tanto armónico
( 2T 0 ) por encima de la topografía terrestre. El resultado surge de una
aproximación de la solución de 2T 0 con valores de T estimados sobre el Geoide en
base a datos digitalizados de las anomalías de gravedad. Un interesante estudio sobre
estos métodos, denominados de “continuación hacia arriba” (upward continuation
Hofmann/Moritz, 2006) publicado recientemente por Jekeli et al. (2007), concluye que
la principal fuente de error es la discretización espacial de los datos de anomalía y el
truncamiento de la integral de Stokes que resuelve el problema armónico. Grejner-
Brzezinska/Wang, (1998) reportan el diseño de un sistema de navegación integrado
INS/GPS de alta precisión (con errores <5 cm. en posición y <10 arc-seg. en
orientación), como componente de un sistema de mapeo mediante georreferenciación
automática de imágenes aéreas. El modelo de gravedad del sistema de navegación
incorpora una grilla de valores de la deflexión de la vertical en altura obtenida mediante
un método de alta fidelidad de la continuación hacia arriba de la anomalía de gravedad
como los descritos por Jekeli et al. (2007).
88
Capítulo 5
Ecuaciones Cinemáticas
y Ecuaciones de Navegación
Las ecuaciones cinemáticas son las ecuaciones diferenciales que describen los
movimientos traslacional y rotacional de un móvil respecto de un dado sistema de
coordenadas de referencia. Si P es la posición de un vehículo en una dada terna de
referencia o de navegación {} y la orientación (posición angular) de la terna del cuerpo
del vehículo {b} respecto de {} está caracterizada, por ejemplo, por la MCD Cb , las
ecuaciones cinemáticas determinan la evolución temporal de P y Cb . Las funciones
forzantes de las ecuaciones cinemáticas son: el vector de la aceleración lineal y el vector
de la velocidad angular del móvil, ambos relativos al sistema de referencia elegido. En
presencia de un campo gravitacional como el terrestre la aceleración lineal es la
composición de la aceleración gravitacional y la aceleración inercial o fuerza específica
provocada por fuerzas inerciales tales como la propulsión, la resistencia aerodinámica o
la sustentación.
Los sistemas de navegación inercial son por definición aquellos que utilizan
exclusivamente acelerómetros y giróscopos como instrumentos de medida. Por lo
expuesto, dado que la aceleración gravitacional no puede ser medida por instrumentos
inerciales un sistema de navegación inercial requiere necesariamente de un modelo
matemático de la gravitación en función de las coordenadas del vehículo.
89
En los primeros 3 párrafos de este capítulo se deducen las ecuaciones de navegación
para los tres sistemas de referencia mas utilizados, a saber: ECI, ECEF y LGV. El lector
podrá extender el procedimiento expuesto a otros sistemas de referencia que puedan ser
de su interés. En el párrafo 5.4 se analizan aspectos dinámicos de las ecuaciones de
navegación. En particular se describen dinámicas inestables inherentes a estas
ecuaciones y un método usado en aeronavegación para paliar estos efectos.
i mg i F i
mP (5.1)
g
i g i Ci f b
P (5.2)
g b
Puesto que la fuerza específica efectivamente medida por los acelerómetros a bordo del
vehículo es fb y no fi, es necesario conocer en todo momento la MCD* Cib que
transforma las coordenadas referidas a la terna de la unidad de mediciones inerciales
(UMI)† a las coordenadas en la terna inercial. Agrupando la ecuación cinemática (5.2),
la Ec. (3.73) que describe la evolución de Cbi y la ecuación de la velocidad: V i P i se
obtiene el sistema de ecuaciones de estado de navegación en coordenadas inerciales:
P i V i ; P i (0) P0i
V i g i (P i ) Ci f b ; Vi (0) V i (5.3)
g b 0
i Ci S(ωb );
C Cbi (0) Cbi ,0
b b ib
Donde los vectores velocidad angular y fuerza específica respecto del sistema inercial
ωbib y f b medidos por la UMI son las funciones forzantes del sistema y P0i , V0i y Cib ,0
la posición, la velocidad y la orientación iniciales.
Cuando, como es usual en la práctica, la terna ECI se hace coincidir con la ECEF en el
instante inicial P i (0) P e (0) . En caso de que la posición inicial del móvil esté
expresada en sus coordenadas geodésicas ( , , h ), de acuerdo con la (4.20) se usará:
*
Usamos la MCD con fines ilustrativos pero es válida cualquier otra representación de la orientación
vista en el Cap. 3.
†
Salvo indicación expresa, consideramos la UMI alineada con la terna del vehículo (b) o en su defecto
conocida la MCD que relaciona a ambas.
90
x e ( Rn h) cos( ) cos( )
P i (0) P e (0) y e ( Rn h) sin() cos() (5.4)
z e ( Rn (1 2 ) h) sin( )
Ceg (0) se obtiene a partir de la latitud y la longitud geodésicas locales , (ver Ec.
(4.19)):
1) r P i ; P e Cie P i (5.8)
2) c arcsen( z e / r ); arctan( x e / y e ) (5.9)
Con Cie calculada mediante la (4.12). Para calcular luego g ig Cic g cg (, c , r ) se deberá
actualizar Cic CieCec mediante las Ec. (4.12) y (4.14).
91
En el segundo caso, se podrá usar la siguiente expresión de la gravitación normal
expresada en coordenadas terrestres {e} y en función también de las coordenadas
terrestres del punto P (ver Ec. (4.48)):
c0 c1s 2 c2 s 4 c3 s 6 .. ck s 2 k .. x e
GM
γ eg (P e ) 3 T c0 c1s 2 c2 s 4 c3 s 6 .. ck s 2 k .. y e (5.10)
r
d 0 d1s d 2 s d3 s .. d k s .. z
2 4 6 2k e
ee ee
Pe
Cie γ eg ( P e ) Cie
γ ig
V e (t0 ) P e (t0 )
fb fi Pi
Aceleró-
C i
b
metros Vi
Girós- ωbib C ib
C S(ω Orientación
i b
copos b ib )
Derivando dos veces respecto del tiempo la relación: P i Cie P e y recordando que
ωiee Ωee = constante, se obtienen sucesivamente:
i P e Ci P e Ci S(ω e )P e + Ci P e
P i C e e e ie e
(5.11)
C S(Ω )S(Ω )P + C S(Ω )P Ci S(Ωe )P e Ci P
P i i e e e i e e e
e e e e e e e e
92
Usando la notación producto vectorial y después de reordenar términos, se obtiene el
vector aceleración inercial en coordenadas terrestres:
i ]e Ce P
[P i Ωe (Ωe P e ) 2(Ωe P e ) P
e (5.12)
i e e e
i ]e Ωe (Ωe P e ) 2(Ωe P e ) P
[P e g e f e (5.13)
e e e g
e V
P e Ce f b g e (Ωe , P e ) 2(Ωe V e ) (5.15)
b e
En la cual se usó: la igualdad: ωbeb ωbib Ωbe , la linealidad del operador S(.) y las
relaciones (3.73). Resumimos las anteriores en las siguientes ecuaciones de estado de
navegación en coordenadas ECEF.
P e V e ; P e (0) P0e
V C f g (Ω , P ) 2(Ω V ) ;
e e b e e e e e
Ve (0) V0e (5.17)
b e e
C S(ω ) S (Ω )C
C e e b e e
; C (0) C
e e
b b ib e b b b ,0
Las condiciones iniciales de posición y velocidad son similares a las determinadas para
la terna ECI (ver Ecs. (5.4) y (5.7)), mientras que para el cálculo de la orientación inicial
son útiles las ecuaciones (5.5) y (5.6). Respecto del cálculo de la orientación, es válido
nuevamente el comentario al final del párrafo 5.1.
93
Para alturas orbitales, podrá usarse la expansión de la gravitación en armónicos
esféricos expresada en coordenadas geocéntricas mediante las Ecs. (4.36) y (4.37) o
bien la obtenida a partir de la aproximación del potencial gravitatorio con simetría axial
γ e (P e )
V e (t0 ) P e (t0 )
fb fe Pe
Aceleró- Cbe
metros Ve
2(Ω ee V e )
Girós- ωib Cbe Orientación
b
Cb (t )S(ωeb )
e b
copos ωbie
Cbe Ω ee
(4.38) hasta un orden máximo n=nmax. En este caso se deberá actualizar la MCD
Cec ( c , ) mediante las Ec. (4.12) y (4.14) previa conversión de coordenadas mediante
las (5.8) y (5.9).
En coordenadas LGV, el uso de la gravedad normal tiene el interés de que ésta pude
calcularse en forma cerrada en función de las coordenadas de la posición. En la práctica
se utilizan las siguientes aproximaciones de γ con grado decreciente de exactitud y
expresadas en función de las coordenadas geodésicas del punto P:
0 0 0
h 0 γ (, h) N (, h) N (, h)
g
0 (5.18)
U (, h) U (, h) U (, h)
Donde N (, h), U (, h) son expresiones exactas publicadas en el informe NIMA-
TR8350-2 (2004) mientras que N (, h), U (, h) son las aproximaciones dadas por las
Ecs. (4.44), (4.45) y (4.46). La formulación (5.18) tiene particular interés para la
navegación de precisión en alturas atmosféricas ya que permite ser corregida usando la
Ec. (4.55) que reproducimos a continuación:
( g )
γ corr
g
(, , h; , ) ( g ) N ( g ) N (5.19)
g U
1
94
transformación Pe→(,h) mediante las relaciones (4.21) y por otra actualizar la MCD
Ceg usando la expresión (5.6) para obtener:
n CnS(ωe )P e + Cn P
V e P
e = Ce V
n S(ωe ) P e = Ce V
n S(ω e ) P e (5.22)
e ne e n ne n en
i ]n V
[P n ωn V n Ω n (Ω n P n ) 2(Ω n V n ) (5.23)
en e e e
n
Nótese respecto de la (5.12) el término suplementario ωen V n de tipo Coriolis
provocado por la traslación del vehículo “arrastrando” consigo la terna de referencia.
n
Como se verá en el párrafo siguiente la velocidad angular ω en , denominada rotación
por transporte (craft rate en inglés) y denotada de ahora en más n , cumple un rol
particular en la mecanización de las ecuaciones de navegación en coordenadas LGV.
i ]n g n f n
[P (5.24)
g
95
n (2Ωn ω n ) V n Ω n (Ωn P n ) g n f n
V e en e e g
(5.25)
Cbn f b g n (2Cen Ωee ωen
n
) Vn
n S(ω n )Cn
C (5.26)
e en e
Conocida Cen , de acuerdo con la Ec. (4.24), se calcula la longitud, la latitud y el ángulo
, del vehículo mediante:
arcsen(Cen (3,3));
arctan(Cen (3, 2) / Cen (3,1)); (5.27)
arctan(C (1,3) / C (2,3))
n
e
n
e
Las dos primeras de las Ecs. (5.27), junto con la altura geodésica h, calculada mediante:
n
ωin ρ n Cen Ωee ρ n Ωen (5.30)
A partir de Cbn y de acuerdo con la Ec. (4.31) se calculan los ángulos de Euler de la
orientación del vehículo mediante:
96
g arctan (Cbn (1,1) / Cbn (1, 2)) ;
arcsen(Cbn (1,3)); (5.31)
arctan (Cbn (2,3) / Cbn (3,3))
N
α ψg xb
n
y
ψ
xn
α
E
yb
Figura 5.3: Relación entre las ternas del cuerpo, de navegación y geográfica en
el plano horizontal.
0
n
g γ g
0 (5.32)
U (, h)
En caso de que la aproximación resultare insuficiente podrá usarse alguna versión mas
precisa de las (5.18) o recurrir a las correcciones (5.19).
n Cn f b g n (P e ) (2Ω n ρ n ) V n ; Vn (0) V n
V b e 0
h Vzn
; h(t0 ) h0
(5.33)
n Cn S(ωb ) S(ρ n Ω n )Cn
C ; Cn (0) Cn
b b ib e b b b ,0
n S(ρ n )Cn
C ; C (0) C
n n
e e e e ,0
97
LGV relativa a la ECEF permanece invariante frente a desplazamientos en la dirección
U-D. En cambio, los desplazamientos contenidos en el plano cardinal (N-S, E-O) varían
la orientación relativa entre ambas ternas a la velocidad angular ρ (rotación por
transporte) proporcional a la proyección de la velocidad del vehículo sobre dicho plano.
En efecto, los cambios en latitud , longitud y ángulo de deriva producen una
rotación por transporte expresada en la terna geográfica {g} como (ver Fig. 5.4):
ze
(Rn+h)cos
N
U
Meridiano de
Greenwich E
·
P
Rn+h= radio
“normal”
ye
xe
VN
E
Rm ( ) h
VE
N cos( ) (5.35)
Rn ( ) h
VE
U sen( ) tan( )
Rn ( ) h
98
1
0 0
Rm ( ) h
1
ρ g K g V g z g ( sen( ) ); K g 0 0 (5.36)
R ( ) h
n
0 0 0
Notar que, bajo el cambio de coordenadas Cng , K se transforma como un tensor, i.e:
K n Cng K g Cng y además que, dado que la transformación Cng (Ec. (4.18)) deja
invariante al eje z, se conserva la componente “U” o “z” del vector
1 S2 C 1
2
C 2 S 1
2
C S C S
; ; (5.38)
R x Rm h Rn h R y Rm h Rn h T Rn h Rm h
resulta:
1/ T 1/ R y 0 Vx / T Vy / R y
n
K 1/ R x 1/ T 0 ρ n Vx / R x Vy / T (5.39)
0 0 0 sen( )
Las mecanizaciones que usan 0 son denominadas “de deriva de azimut” (o wander
azimuth en inglés). Para la selección sen( ) resulta nz 0 y la mecanización
recibe el nombre de azimut libre aludiendo al hecho de que el sistema equivalente de
navegación con plataforma no es actualizado en azimut con los desplazamientos en
longitud. Notar que en este caso 0 en vehículos estacionarios o moviéndose sobre
un meridiano. Es fácil imaginar diversos caminos cerrados sobre la superficie terrestre
que produzcan distintos incrementos de al final del circuito por lo que en general no
dependerá de la posición sino del camino recorrido desde el inicio de la navegación. Si,
en cambio, se elije (e ) sin , lo que equivale a nz nz , la componente
vertical local de la velocidad angular de la terna de navegación respecto de la terna
99
n n n
inercial es tal que in , z z z 0 . A esta mecanización se la denomina de Foucault
ya que reproduce el comportamiento de una terna sobre el conocido péndulo que lleva
su nombre. También en este caso nz es finita en latitudes polares: nz ( ) e .
2
La tabla 5.1 resume las características de las selecciones de nz más utilizadas en la
práctica, mientras que la Fig. 5.5 muestra esquemáticamente la mecanización de las
ecuaciones de navegación en coordenadas LGV. El recuadro indicado en la figura
como plataforma analítica concentra el cálculo de la transformación de coordenadas
entre la terna del cuerpo y la terna {n}. Su nombre ese motivado por los sistemas
clásicos de navegación que utilizan como referencia una plataforma estabilizada
respecto de esta última terna.
γ n ( , , h ) , , h
Plataforma
analítica V n (t0 ) Vn
fb fn V n Vn h(t0 )
Aceleró- Cbn
Vz h
metros Cbn g , ,
ω b (2Ω ρ )
n
e
n
Girós- ωib
b nb
C (t )S(ω
n b
)
b nb
copos nz Cálculo de S(n )Cen
ωbin , ,
n
Ω n
n
Cbn n
e Cen Ω e
ωin e
100
5.4 Dinámica Inestable de las Ecuaciones de Navegación
Las ecuaciones de navegación poseen como veremos dinámicas inestables que si no son
debidamente tenidas en cuentas se traducen en divergencias numéricas en los sistemas
de navegación “strap-down”. El sistema de coordenadas más apto para estudiar esta
dinámica es el LGV por lo que en lo que sigue adoptamos esta terna de referencia para
describirlas. Consideremos la componente z (vertical geodésica local) de la ecuación
diferencial (5.25), llamada del “canal vertical”, con condiciones iniciales respecto del
elipsoide normal: h(t0 ) y h(t0 ) Vz (t0 ) .
h h
2
ˆ
h(t ) h(t ) h(t ) nz (, h) nz (, hˆ) 22s h(t ) (5.43)
101
La raíz positiva origina una dinámica inestable resultando en un crecimiento
exponencial de h(t ) y Vz (t ) para cualquier error inicial distinto de cero. A modo de
ejemplo, un error inicial: h(t0 ) 0; Vz (t0 ) 1m / s producirá al cabo de 15min un
error en la posición vertical de 1300m! Este mecanismo es consecuencia de la doble
integración realimentada por el modelo de gravedad (ver las Figs. 5.1, 5.2 y 5.4) y, por
tanto, resulta inherente a las ecuaciones de navegación. Claramente, las consecuencias
negativas de la inestabilidad vertical serán más acentuadas mientras más prolongada sea
la navegación. Para evitar sus efectos se requiere poder actualizar periódicamente el
estado de la navegación utilizando alguna medición independiente de las medidas
inerciales. La introducción de filtros de fusión de datos que da lugar a la técnica de
navegación integrada desarrollada en el Capítulo 8 es la manera natural de subsanar
este problema. A continuación presentamos una solución ad hoc comúnmente utilizada
en la aeronavegación.
hmed h h (5.45)
Si bien las divergencias del modelo (5.46) respecto de la realidad pueden ser muy
variadas, para demostrar los efectos del filtro estabilizador sobre la inestabilidad del
canal vertical bastará suponer un desconocimiento en la posición y velocidad iniciales
y/o un error de medición de la fuerza específica. Se supondrá además que el canal
horizontal provee sin error los valores de Vx y Vy. Denotando con 1y 2
respectivamente a la altura y la velocidad vertical del sistema perturbado por los errores
y afectado por las señales de compensación u1 y u2 generadas por el filtro estabilizador,
las Ecs. (5.46) se reescriben:
1 2 u1 ; 1 (t0 ) hˆ(t0 )
(5.47)
2 czn (Vx ,Vy ) nz (, 1 ) fˆzn u2 ; 2 (t0 ) Vˆz (t0 )
102
Donde fˆzn f zn nz es la mejor estimación disponible de la fuerza específica f zn (la
medición acelerométrica en caso de no disponerse de otra fuente de información) y nz
el error de estimación (o de medida dado el caso) desconocido. Definimos además:
3 ˆ n a la estimación de n y agregamos a las Ecs. (5.47) la ecuación:
z z
3 u3 (5.48)
u1 k1 (1 hmed )
u2 k2 (1 hmed ) 3 (5.49)
u3 k3 (1 hmed )
1 z1 h
e 2 z2 Vz (5.50)
3 z z
n n
k1 1 0 k1 h(t0 )
e k2 22s 0 1 e k2 h ; e(t0 ) Vz (t0 ) (5.52)
k 0 0 k3 n
3 z
con condiciones iniciales e(t0 ) desconocidas. Como es sabido (véase por ejemplo Kuo,
1995), el sistema (5.52) es exponencialmente estable para valores k1, k2, k3 tales que las
raíces del siguiente polinomio característico tienen parte real negativa
103
advierte que para h constante, independientemente del valor desconocido del sesgo:
nz , h() h y el error en velocidad vertical es nulo ( Vz () 0 ). Más aún, el filtro
provee una estimación de estado estacionario del sesgo ˆ n () con error de estimación
z
m
nz () 22s h 3 x106 h 2
(5.54)
seg
Debe contrastarse este resultado con los errores linealmente creciente en velocidad y
cuadráticamente creciente en altura que producen los sesgos en los acelerómetros al
integrar las ecuaciones de navegación. Como consecuencia de lo anterior, para
velocidades uniformes el filtro estabilizador vertical permite omitir el término de
Coriolis en las Ecs. del filtro (5.47), (5.48), (5.49) y utilizar un modelo de gravedad
constante.
A continuación ilustramos un diseño posible del filtro estabilizador. Para una dada
constante de tiempo T>0 elegimos las raíces del polinomio (5.53) tales que
1 1 , 2,3 1 j 1 (5.55)
T T T
k1 3 ; k2 4 2 2s 2 ; k3 2 3 (5.56)
T T T
Para el diseño debe tenerse en cuenta que si se desea seguir cambios rápidos en la
aceleración se deberá aumentar el ancho de banda lo que aumentará del efecto del ruido
en la medición barométrica. Por otra parte, una dinámica lenta atenuará los efectos del
ruido de medida pero acentuará los efectos de los errores de los acelerómetros y de las
condiciones iniciales. Cuando las estadísticas del ruido h y del error en los
acelerómetros son conocidas es posible estimar óptimamente tanto las variables 1, 2
y3 como el sesgo acelerométrico y el error del baro-altímetro mediante el Filtro de
Kalman. Esto será objeto de Capítulo 8.
nz (, 1 )
z Vˆz
+ +
f zn + 2 2 1 1 ĥ
- - -
- ˆ hˆ(t0 )
(2Ω n ρ n ) V n h(t0 )
z
k2 k1
h
ˆ )
3 ( z +
- h
k3
hmed
104
Figura 5.5: Mecanización del filtro estabilizador vertical.
Para el diseño determinista las constantes de tiempo usuales van entre 40seg a 400seg.
Adoptando un valor de T=100seg, las constantes resultan:
k1 3.0 x102 seg 1 ; k2 4.0 x104 seg 2 k3 2.0 x106 seg 3 (5.57)
Como se advierte, el filtro goza de múltiples ventajas: a) hereda la estabilidad propia del
baró-altímetro, b) tiene una respuesta en frecuencia mucho más alta que éste y definible
por diseño, c) permite medir la velocidad vertical y d) goza de cierta insensibilidad en
baja frecuencia a los errores acelerométricos y del modelo de gravedad.
105
Capítulo 6
Modelo y Dinámica de los Errores
de las Ecuaciones de Navegación
Como consecuencia de lo anterior, también se apartan de sus valores reales todas las
magnitudes de interés que denotamos en general con y(t). Los aspectos generales del
problema pueden describirse mediante el esquema de la Figura 6.1.
x(t0 )
Vehículo, real y
x=? y
μ
μ̂ Mecanización de ŷ
navegación: x̂
ξ
xˆ (t0 )
Figura 6.1: Comportamiento diferencial entre el vehículo real y la
mecanización de navegación.
106
Dinámica de las pequeñas perturbaciones
El método que usaremos para describir la dinámica de los errores del algoritmo inercial
es el llamado de las pequeñas perturbaciones, para lo cual, dado vector o variable v̂ ,
definimos su error o desviación respecto de su valor real v (desconocido) como:
v v vˆ (6.1)
En un sistema de navegación inercial, las ecuaciones (6.2) o (6.3) serian las ecuaciones
cinemáticas. Las soluciones de la primera deben asociarse a la evolución real del estado
cinemático mientras que las de la segunda corresponden a la evolución de dicho estado
calculada en base en valores errados ya sea de las magnitudes inerciales o de las
condiciones iniciales.
o( x , u )
lim 2 2
0
x 0
u 0 ( x u )1 / 2
107
Las soluciones de estas ecuaciones lineales variantes con el tiempo (6.5) describen la
evolución temporal de la parte lineal del error de la solución de (6.3). Sus funciones
forzantes son los errores en las funciones forzantes respecto de las reales desconocidas y
sus condiciones iniciales el error en la estimación del estado inicial.
Por el principio de superposición (válido para los sistemas lineales) es posible calcular,
a partir de estas ecuaciones, los efectos individuales de las perturbaciones ya sea, sobre
las condiciones iniciales o sobre las funciones forzantes. Esto permite establecer el
presupuesto de errores que consiste en distribuir el error total según cada una de sus
causas. Volvemos ahora a las ecuaciones cinemáticas formuladas en Capítulo 5.
Con base en los resultados del párrafo anterior, el error Cb (definido como en la Ec.
(6.1)) satisface la siguiente ecuación derivada perturbando la Ec. (6.6):
Sustituyendo en (6.7) la diferencial matricial Cbv Cbv S(θb ) (ver Ec. (3.37) del
Capítulo 3) y, por otra parte, derivando esta última expresión respecto del tiempo se
obtienen:
108
Un procedimiento similar, pero partiendo de la diferencial Cbv S(θ )Cbv ,
correspondiente a la segunda de las Ecs. (3.37), conduce a la ecuación alternativa de la
propagación del error angular:
Los casos más usuales de propagación del error angular considerados a continuación
serán vistos como casos particulares de las Ecs. (6.9) y (6.10).
Para este caso {}º{}, por lo que ωi ωi 0 . De las (6.9) y (6.10) se obtienen las
dos expresiones alternativas del error angular inercial y sus respectivas ecuaciones de
propagación:
Cib CibS( ψb ) ψ
b ψb ωibb ωibb ; ψb (t0 ) ψ0b
(6.12)
Cib S( ψi )Cib ψ
i ψi Cibωibb Cib ωibb ; ψi (t0 ) ψi0
Las funciones forzantes de las ecuaciones dinámicas del error ((6.11) y (6.12)) son las
perturbaciones sobre las mediciones inerciales: f b , ωbib (a veces denotados como
b f b ; b ωbib ) que agrupamos en el vector:
ξ ωb
ξ bib (6.13)
ξ f f
ψb ψi
xib V i ; xii V i (6.14)
P i P i
Combinando las expresiones (6.11) y (6.12), las ecuaciones de estado lineal variante en
el tiempo que modelan la propagación de las dos versiones del error de navegación
(6.14) resultan:
109
S(ωibb ) 0 0 ψb I 0
i
x ib Cˆ S(f b ) 0 g i / Pi V i 0 I ξ
b g P
i
Pi 0 (6.15)
0 I3 0 0
Fbi x ib Bibξ
ˆ i ωb ) 0
S(C 0 ψ i C ˆi 0
b ib b
i
x i S(C
i ˆ f ) 0 g / P i
i b i
V 0 ˆ i ξ
C
b g Pi b
P i 0 (6.16)
0 I3 0 0
Fii xii Bii ξ
Donde, g ig / P i Pi
es el jacobiano de la gravitación en coordenadas inerciales evaluado
en Pˆ i cuya expresión depende del modelo de gravedad utilizado. Para una discusión de
las opciones y expresiones involucradas se remite al lector al párrafo 5.1 del capítulo
anterior, Ecs.(5.8) a (5.10).
Para este caso {}º{e}, y ωivv Ωee . Aplicando pequeñas perturbaciones a las
ecuaciones de navegación (5.17), suponiendo Ωee conocida (i.e.: ωiee 0 ) y el modelo
de gravedad normal, las ecuaciones del error de traslación resultan:
De las Ecs. (6.9) y (6.10) surgen las dos expresiones alternativas del error angular y sus
respectivas ecuaciones de propagación:
φb φe
xbe V e ; x ee V e (6.19)
P e P e
110
S(ωbib ) 0 0 φb I 0
e b
x be Cˆ S(f ) 2 S (Ωe ) γ e e V e 0 ˆ e ξ
C
b e P P b
(6.20)
0 I3 0 P 0
e
0
Fbe xbe Bbe ξ
S(C ˆ e ωb ) 0 0 φ e C ˆe 0
b ib b
e
x e S (C
e ˆ f ) 2S (Ω ) γ e V 0
e b e e ˆ e ξ
C
b e P P b
P e 0 (6.21)
0 I 0 0
3
Fe xe B e ξ
e e e
Donde γ eP Pe
es el jacobiano de la gravedad normal en terna “e” respecto de la posición.
Las (6.22) requieren las diferenciales Cbn y Cen cada una asociada a un error angular
propio. En el primer caso, se trata del error de orientación del vehículo respecto de la
terna de navegación y en el segundo del error de orientación de la terna de navegación
respecto de la terna terrestre (ECEF). Como se vio en el párrafo 5.3, éste último está
relacionado con el error en la posición del vehículo en coordenadas geodésicas, por lo
que lo llamaremos error angular de posición.
111
Igualando las Ecs. (6.23) y (6.24) y después de pos-multiplicar por Cen y agrupar
términos, resulta la ecuación de propagación del error angular de posición:
El lector podrá verificar que la definición alternativa: Cen Cen S(θe ) conduce a la
ecuación del error angular de posición equivalente a la (6.25) bajo la transformación
θe Cen θn :
ze
α
Pˆ , nˆ
Φ
λ P, n
ye
xe
Figura 6.2
112
E 0 1 0
θ N cos cos 0 0
g (6.27)
U sin sin 0 1
El diagrama de la Figura 6.3 muestra las 3 ternas en juego del problema: la ECEF o {e},
la LGV o {n} y la terna de navegación calculada (erróneamente) {nˆ} {c} . Indica
además las MCD que vinculan estas ternas. La MCD estimada (calculada) Ĉen asociada
a los errores , y , la MCD real (desconocida) entre la ternas {e} y la {n}
local y la MCD que vincula las ternas {n} y {nˆ} {c} . Esta última, consecuencia del
error angular θ n θ nˆ, n , se expresa mediante:
(θ n ) Cn C
ˆe
e n C nˆ Cc exp(S (θ ) )
n n n
C (6.30)
(θn ) Cn (θn )
C c
zc
yn yc
n zn n̂ c
θn θc,n xc
xn
e
xe
Figura 6.3
113
6.4.2 Error de orientación o error angular de plataforma.
Sustituyendo la diferencial Cbn S( n )Cbn que define el error angular de “plataforma”
n en la 3ª ecuación de las (6.22) se obtiene:
n S( n )Cn S(ωb ) Cn S(ωb ) S(ω n )Cn S(ω n )S( n )Cn (6.31)
C b b ib b ib in b in b
Igualando (6.31) y (6.32) luego de agrupar términos y pos-multiplicar por Cbn resulta:
n
ωin se obtiene de la última de las (6.22) introduciendo Cen S(θ n )Cen :
n
ωin ρ n Ωen ρ n S(θn )Cen Ωee ρ n Ωen θn (6.34)
n n ωin
n n
ωin n n ωin
n
ρ n Ωen θn ωib
n
(6.35)
n (Ωen ρ n ) Ωen θn ρ n Cbn ωbib
Dado que la orientación del vehículo es usualmente caracterizada por los ángulos de
Euler: (rumbo), (pitch) y roll) (definidos en el párrafo 4.2.5 del Capítulo 4),
interesa relacionar al error de orientación n con las desviaciones de estos ángulos. Para
114
esto partimos de la transpuesta de la Ec. (4.31) que reescribimos transponiendo cada
uno de sus términos, según:
Cn Cb'
b'
b
Cb (( / 2 ) @ z )( @ y ) (( ) @ x b ) Cb'n Cb'b
n n b'
(6.37)
Con:
cos sen cos sensen 1 0 0
C C C cos cos sen sen cos 0 cos sen
n
b
n
b'
b'
b
( n ) C n
C zp
yn p yp
n zn n̂ p
n p,n
n
xn xp
yb
zb
Cn̂b ( , , ) Cpb
C (, , )
n
b b
xb
Figura 6.4
En el diagrama de la Figura 6.4 se indican las ternas {b}, {n} y {p} y las MCD que
vinculan las coordenadas entre cada una de ellas. El error angular n , correspondiente al
desalineamiento (“tilt”) entre la terna {n} y la plataforma analítica {p} determina la
MCD entre ambas:
115
( n ) C n C
ˆb
b n C p exp(S ( ))
n n
C (6.41)
6.4.3 Relación entre los errores de posición y de plataforma: error angular inercial
Consideremos la diferencial de la siguiente composición de MCDs:
Cib Cie Cen Cbn Cbi Cie Cen Cbn Cie Cen Cbn Cie Cen Cbn (6.42)
Suponiendo sin error la MCD Cie y substituyendo las diferenciales Cen Cen S(θ n ) y
Cbn Cbn S( b ) en la anterior calculamos:
Cpn
y yp zp
z
p,n
x xp
θc,n
p,c
yc zc
c Ccp
C n
xc
Figura 6.5
116
Geometría del error angular inercial
El error angular inercial ψ n tiene un claro el sentido geométrico que se advierte al
calcular la MCD Ccp a partir de las definiciones (6.30) y (6.41):
n f n n (ρ n 2Ω n ) V n ρ n V n 2(θ n Ω n ) V n Cn f b g n (6.47)
V e e b
Vx Vy n Vx Vy n
ρn ( )x ( )y ( sin )z n (6.48)
T Ry Rx T
1 1
Rn ( S ) Rm ( S )(1 O( 2 ))
Rn h Rm h
117
1 cos sen cos sen O ( 2 )
0
T Rn h Rm h Rm h
1 cos 2 sen 2 1 sen 2 cos 2 1
R y Rm h Rn h Rn h Rm h Rn h R x
Vy Vx
ρn xn y n ( sin )z n (6.50)
Rn h Rn h
x y
Vy Vy h Vy x h
x
Rn h R n h 2 Rn h
(6.51)
Vx Vx h Vx y h
y
R n h R n h 2 Rn h
La componente z depende de la mecanización adoptada para nz (ver Tabla 5.1).
Consideramos 3 casos:
1. Azimut libre:
z 0 z 0 (6.52)
2. Foucault:
z e sen z n Ωen z n Cen Ωee
(6.53)
z z n Cen Ωee z n S( θn )Cen Ωee z n S(Ωen ) θn
VE tan
0 U tan usando E
Rn h
VN
1
g
ρ VE (6.54)
Rn h
VE tan
VN 0
ρ g 1
V
1
0 h ρ g
Rn h
E R h E R h
n n
tan VE 2
VE sec
Diferencial de la gravedad
La configuración: “terna LGV + gravedad normal” es la mas adaptada a vehículos sub-
atmosféricos tanto por su precisión como por su sencillez matemática. Como se mostró
en el Capítulo 4, en la gran mayoría de estas aplicaciones resulta suficiente la siguiente
aproximación de 2º orden (en la altura geodésica h) de la gravedad normal en terna g-
LGV (ver Ecs. (4.44) y (4.45)):
118
g g γ g 0 N U 0 0 (h, )
T T
(6.55)
h
2
2 h
(h, ) s ( ) 1 2 1 f m 2 f sin ( ) 3
a a
1 k sin 2 e2 a 2 b
k 0,001931852; s ( ) e ; m
1 e 2 sin 2 GM
( g )
g γ
g g
corr (, , h; , ) ( g ) N (6.56)
g U
ˆ ˆ (hˆ,
ˆ )ˆ
ˆ
g g (h, ) g ˆ (hˆ,
ˆ) ˆ ˆ ˆ
(h, )
(6.57)
1 0
g )
Con: h h hˆ;
ˆ ; g g ˆ g ;
ˆ ˆ , y además:
(hˆ,
ˆ) (hˆ,
ˆ)
(h, ) h (6.58)
h
119
n S(ωin
n
) n S(Ωen )θn ρ n Cbn ωbib
V n S(f n )n S(υn )V n S(V n )[ρ n 2S(Ωn )θn ] Cn f b g n
e b
(6.60)
n n
θ S(ρ )θ ρ n n
h Vzn
Con:
g y Vy x h
1
g n g x Cng g g ; ρ n Vx y h (6.61)
0 Rn h
z /( Rn h)
1 0
g
θ 0 1 E (6.64)
N
0 tan
Por la misma razón, el error x definido en (6.62) queda reducido al siguiente vector de
dimensión 9.
T T
x g g )T (V g )T E N h g )T (V g )T (π g )T 9
(6.65)
120
Las últimas 3 componentes de x corresponden al error de posición que denotamos
π g E N h . Reescribimos la Ec. (6.54) en la forma:
T
ρ g RV V g R π g (6.66)
Con:
0 1 0 0 0 E
1 1
RV 1 0 0 ; R 0 0 N (6.67)
Rn h Rn h
tan 0 0 2
VE sec 0 U
0 0 E /( Rn h)
Φ U 0 N /( Rn h) ; ΦV RV (6.69)
sec2 0 /( R h)
N N U n
Usando una vez más la (6.68) junto la (6.66) después de algunas manipulaciones
algebraicas determinamos el siguiente término de la 2ª de las Ecs. (6.60):
donde:
0 0 E /( Rn h)
V S(V ) g
2U 0 N /( Rn h) ; (6.73)
2 sec 2 0 /( R h)
N N U n
121
Con las definiciones anteriores y las siguientes:
g V g V V g V π g C g f b g g
V (6.75)
V b
evaluamos ahora:
0 0 0 E /( Rn h)
g g g
T π S( ) U E R π N E tan N /( Rn h) π g
N 2
U /( Rn h)
N (1 sec ) E
(6.76)
θ g TV V g T π g (6.77)
π g ΠV V g Π π g (6.78)
Con:
1 0 1 0 0 0 E /( Rn h)
ΠV 1 0 0 ; Π N E tan N /( Rn h) (6.79)
Rn h 0 0 1 0 0 0
Agrupando las Ecs. (6.71), (6.75) y (6.78), la Ec.(6.63) del error de navegación resulta
para este ejemplo:
Φ ΦV Φ Cbg 0 0 ωbib
x V
g
VV V x g 0 Cbg I f b
0 ΠV Π 0
0 0 g g (6.80)
ξ
F g x g B g ξ; ξ g
g
Ejemplo 6.2: Error de navegación en terna {g} para un vehículo en reposo sobre la
Tierra.
La condición de reposo sobre la Tierra impone:
122
g V g ρ g 0; ω g Ω g
V ig
(6.81)
g C
C g 0
b e
Para los fines del análisis de este ejemplo y el siguiente se usará la aproximación (6.55)
g
para la gravedad g . Bajo estas condiciones la fuerza específica y la velocidad angular
inerciales junto con sus respectivas mediciones provistas por los instrumentos inerciales
a bordo resultan:
f b γ b fˆ b γ b f b
(6.82)
ωbib b
Ωe Cbg Ω eg ˆ bib
ω Ω e ω ib
b b
Las condiciones (6.81) imponen los siguientes valores para las matrices definidas en el
ejemplo 6.1:
0 0 0
Φ S(Ω ); Φ U
g
0 0
N 0 0
V S( γ g ); VV 2S(Ωeg ); V 0 (6.83)
Π 0
De este modo, la matriz de la dinámica del error (6.80) para este ejemplo resulta:
0 U N 0 ( Rn h) 1 0 0 0 0
U 0
1
0 ( Rn h) 0 0 U 0 0
N 0
0 ( Rn h) tan
1
0 0 N 0 0
0 0 0 2U 2 N 0 0 0
g
F 0 0 2U 0 0 0 0 0 ; (6.84)
0 0 0 2 N 0 0 0 0 0
0 0 0 0 ( Rn h) 1
0 0 0 0
1
0 0 0 ( Rn h) 0 0 0 0 0
0 0 0 0 0 1 0 0 0
Esta matriz permite extraer algunas conclusiones sobre la dinámica del error:
123
De estos valores surgen los siguientes períodos de oscilaciones autosostenidas: dos
llamados de Shuller: T1,2 81seg; T3,4 88seg y dos llamados de Foucault: T5,6 23,93
hs. Los primeros corresponden aproximadamente al periodo de oscilación de un
péndulo de brazo igual al radio terrestre: T1234 a / 84 seg . El segundo período
corresponde al de la rotación sideral terrestre (período de rotación de la Tierra respecto
de las estrellas fijas).
La Fig. 6.6 presenta las formas de onda de las componentes del vector de error
provocadas por un desconocimiento inicial en la componte N(0)=0,1º. Se destacan las
oscilaciones de Shuller moduladas por oscilaciones más lentas de Foucault. Tanto en la
velocidad como en el error de plataforma, se advierte una transferencia cíclica y
conservativa de la energía entre oscilaciones N-S y E-O. Dicha transferencia es
provocada por la rotación terrestre y tiene un período de 24hs. El gráfico inferior
derecho muestra los errores de desplazamiento en metros según las direcciones E,N,U y
evidencia el importante efecto que tienen sobre la posición los errores iniciales de
alineación de la plataforma analítica.
VelE
Figura 6.7: Respuesta del vector de error a un error inicial VU(0)= 0,01m/seg.
124
la respuesta en rampa de la posición en la dirección “arriba”. Esta dinámica está
asociada a uno de los polos en el origen del sistema (6.84).
125
u Vˆ
ˆ ; K 62
u g K E KV (6.86)
H
uV ˆ
VN
Mediciones b Software
Orientación
Girós. Cbg Navegador y posición
inercial
Velocidad
Acels. Cbg
VˆE , VˆN
b
ug 0
K
Figura 6.9: Esquema de mecanización de la autoalineación en reposo.
Cabe señalar que siendo la velocidad del vehículo Vg=0 su valor calculado V̂ g es en sí
mismo el error de velocidad y de acuerdo con la definición (6.1):
V̂ g V g (6.87)
Las condiciones anteriores implican suprimir las últimas 4 filas y columnas de la matriz
F g de la (6.84), de modo que el modelo lineal que describe los apartamientos de la
condición nominal de reposo del navegador realimentado de la Fig. 6.9 resulta:
x F g x g u g ; (6.89)
Donde:
g VˆE
; u K KHx;
g
x 5
(6.90)
VH VˆN
y además:
126
0 U N 0 R 1 h Eg
n
U 0 0 1 0 gN
Rn h
0 0 0 1 0 g ; ξg g ;
H ; F 0 0 0 0 U (6.91)
0 0 0 0 1
N
g
0 0 0 2 U E
0 0 2U 0 g
N
Condición que es posible lograr dado que, como es fácil demostrar, las matrices (Fg,H)
conforman un par observable (ver por ejemplo Goodwin et al., 2001 para una
exposición general sobre el tema). En efecto, bajo esta condición es posible asignar
valores propios con parte real negativa a la matriz del sistema en lazo cerrado:
Alc (K ) F g KH . El resultado es que si los errores instrumentales son nulos (g=0) el
error x converge exponencialmente a cero asegurando la alinearon asintótica de la
plataforma analítica.
T
4 0 -0.0178 0 80 0
K 10 0.0178 0 -0.2 0 80 (6.93)
127
1,2,3,4,5 =-0.0010, -0.0030, -0.0040, -0.0040 + 0.0017i, -0.0040 - 0.0017i (6.94)
Cuando g¹0, la estabilidad asintótica del sistema realimentado (6.92) asegura que
x 0 , pero no que x 0 . Efectivamente, como es fácil comprobar en este caso,
x converge a:
VˆE 0 N E /
(6.96)
VˆN 0 E N /
De las Ecs. (6.96) resulta que, con resoluciones £100g pueden obtenerse errores de
nivelación N , E 104 [rad ] . Con estos valores y para las resoluciones giroscópicas
usuales resulta ser: U N , VˆN / Rn E por lo que, de la 1ª fila de la Ec. (6.92) se
obtiene una estimación del límite inferior en la precisión de la determinación del azimut
128
usando instrumentos inerciales (función de girocompás) en función de la resolución del
giróscopo E :
U E / e cos (6.97)
129
Capítulo 7
Algoritmos “Strapdown”
de Navegación Inercial
Si bien es posible usar métodos de integración numérica generales estándar tales como
Runge-Kutta, predictor corrector etc., se aprovecha mejor la capacidad de cómputo
disponible con algoritmos adaptados a la estructura particular de las ecuaciones
cinemáticas. Esta idea está en la base de una línea de investigación muy activa durante
el pasado reciente, entre cuyos resultados mas significativos se destacan los trabajos
pioneros de Savage, (1966), Jordan, (1969) y Bortz, (1971) y más recientemente, los
trabajos de Savage (1998) partes I y II y Savage (2006) que consolidan la maduración
del tema.
130
La primera parte del capítulo desarrolla el algoritmo en terna LGV mientras que la
segunda lo hace en terna ECEF. Gracias a una formulación matemática más simple, el
segundo enfoque permite una mejora significativa de la precisión en traslación
especialmente en vehículos rápidos a la vez que reduce considerablemente la
complejidad numérica del algoritmo de navegación.
tl
fˆ
b
vl ()d ; Parámetros de
tl 1 navegación
tl
Algoritmo de entregados a
integración intervalos Ts > Tl.:
ωˆ ib ()d ;
b
α l
numérica. Posición,
tl 1
Velocidad,
Mediciones inerciales
Computadora de Orientación
entregadas a intervalos Tl.
navegación.
Ecuaciones de orientación:
1 n ωbib 1 ωinn n
q bn qb qb (7.1)
2 0 2 0
ωinn ρ n Ωen ρ n Cen Ωee
Ecuaciones de traslación:
V n Cn f b γ n (2Ω n n ) V n ; Vn (0) V n
b e 0
(7.2)
h Vzn ; h(t0 ) h0
e Ce S(ρ n ) q e 1 q e ρ
n
C n n n n (7.3)
2 0
131
Como se menciona en el párrafo 5.3, para trayectorias cercanas a la Tierra será
suficiente usar el modelo de gravedad que en terna LGV es (ver Ec. (5.32)):
0
n
γ ( , h ) 0 (7.4)
U (, h)
Donde U (, h) representa la aproximación de Hofmann/Moritz (ver Párrafo 4.41 y Ec.
(4.45)):
2 a 2b h h
2
U ( , h) ( ) 1 2 1 f 2 f sin ( ) 3 (7.5)
2
GM T a a
7.1.1 Notación
Siguiendo a Savage (1998), se subdividen los cálculos de la integración de las
ecuaciones de navegación según tres cadencias. Esto permite agregar flexibilidad y
aprovechar mejor la capacidad de cómputo instalada a bordo, especialmente cuando las
cinemáticas de orientación y de traslación poseen escalas de tiempo diversas. En las
cadencias más rápidas se ejecutan los cálculos más sencillos pero que requieren de
mayor precisión en el tiempo. Estos cálculos están relacionados con la actualización de
los parámetros de la orientación y de las componentes de alta frecuencia de la
velocidad.
132
tk 1 tk M Tm ; tk , j tk j Tm; tk , j ,i tk j Tm iTl (7.7)
Ts
tk,1,2 tk,5,3
1
1 sin()
(t ) ωbib ωbib 2 b
1 2(1 cos()) ( ωib ); (tk , j ) 0 (7.9)
2
1 1 sin()
θ (t ) ωin
n n
θ ωin 2 1
n
θ (θ ωin ); θ(tk ) 0 (7.10)
2 2(1 cos())
Como se advierte de la Ec. (7.9), kb, j (t ) depende de la velocidad angular del vehículo
respecto de la terna inercial ωbib medida por los giróscopos, mientras que θ nk (t ) depende
133
n
de la velocidad angular de la terna {n} respecto de la terna inercial: ωin Ω n ρ n . (ver
la expresión general (5.37) de ρ n en el apartado 5.3.1)
En general, la integral entre los instantes tk,j,i y t tk,j,i de una función integrable del
tiempo v(t ) se denotará:
t
vk , j ,i (t ) v()d
tk , j , i
t k , j , i 1
(7.11)
vk , j ,i (tk , j ,i 1 ) vk , j ,i:i 1 v( )d
tk , j , i
134
permite actualizar la MCD Cbb (( kk ) 1) en intervalos más cortos en función del ángulo
kb, j: j 1 (j=0 a M-1) rotado por la terna del vehículo respecto de la terna inercial en cada
intervalo Tm= Ts/M:
Cálculo de Cnn (( kk ) 1) :
Para los valores usuales de Ts, el vector de rotación angular θ nk:k 1 de la terna {n} puede
considerarse colineal con ωinn ( k ) en cada intervalo Ts. Esto permite suprimir los términos
de orden superior de la Ec. (7.10) y justifica la primera aproximación de la siguiente
ecuación.
tk 1
ˆ inn ( k ) (tk 1 ) ωinn ( k ) (tk )
ω
ω ()d
n n(k )
θ k :k 1 in Ts (7.16)
tk
2
1 sin() 1 1 1
2
1 (1 2 ...) O(2 ) (7.19)
2(1 cos()) 12 60 12
135
Dado que este factor pondera al término de 2° orden de la Ec. (7.9) se concluye que, a
menos de errores de orden O(4 ) en el 2º miembro, dicha ecuación diferencial resulta
aproximable mediante la siguiente:
1 1
(t ) ωbib ωbib ( ωbib ); (tk , j ) 0; tk , j t tk , j 1 ; (7.20)
2 12
Para Tm pequeños la 1ª integral de ωbib es el término que más contribuye a (t ) tanto en
la (7.9) como en la (7.20), por lo cual, cuando ωbib sea suficientemente suave en cada
intervalo Tm, podrá afirmarse que (t ) O( t tk ) y, por tanto, que
2
O(2 ) O( t tk ) . Por consiguiente, la diferencia entre los 2º miembros de las Ecs.
4
(7.9) y (7.20) resultan de orden O( t tk ) , de lo cual resulta que la diferencia entre la
5
integral de la Ec. (7.20) y la solución de (7.9) es de orden O( t tk ) . Tan buena
aproximación ha motivado que todos los algoritmos de cálculo digital de (t ) tomen
como referencia de precisión la integral de la Ec. (7.20):
t
1 1
ωib 2 ωib 12 ( ωib ) d ;
b b b
k , j (t ) tk , j t tk , j 1 ; (7.21)
tk , j
1
(t ) ωbib ωbib ; (tk , j ) 0; tk , j t tk , j 1 ; (7.22)
2
Por las razones comentadas más arriba, la falta del término de 2° orden de la Ec. (7.20)
3
produce errores del orden O( t tk ) en las soluciones de la Ec. (7.22) respecto de la
(7.21). A pesar de que esto pueda representar en la práctica un grado aceptable de
aproximación en muchos casos, la simplificación de Miller no evita tener que calcular la
integral implícita (7.22).
136
1
(t ) ωbib α ωbib ; (tk , j ) 0
2 ; tk , j t tk , j 1 ;
b α (tk , j ) 0 (7.23)
α (t ) ωib
Lo que hace aún más interesante el uso de la (7.23) es el resultado demostrado por
Savage (2006) usando la teoría de Picard de aproximaciones sucesivas de las soluciones
de ecuaciones diferenciales (ver, por ejemplo, Boyce/Diprima, 1997 para la teoría de
aproximaciones de Picard), según el cual los errores en las soluciones de la (7.23) son
de un orden inferior a los alcanzados por la aproximación de Miller (7.22) (ver los
excelentes análisis de los errores derivados de estas aproximaciones para la dinámica de
coneo en Ignagni, 1994 y para la combinación de las dinámicas de coneo y sculling
definida más abajo en Ignagni, 1998). Es decir, los errores en (t ) son ahora del orden
4
O( t tk ) ! Visto este resultado y basándonos en Savage (1998, parte I), a
continuación presentamos el algoritmo digital de integración de la Ec. (7.23) para lo que
previamente introducimos la notación:
ωib ()d
b
k , j (t ) (7.24)
tk , j
t
1
(ωib () 2 k , j () ωib ())d
b b
k , j (t ) k , j (t ) β k , j (t ); (7.25)
tk , j
t
1
β k , j (t )
2t k , j () ωbib ()d ; (7.26)
k, j
βk , j (t ) βk , j ,i βk , j ,i (t );
1
t
βk , j ,i (t ) k , j ( ) ωib b
( ) d t
2t k , j ,i t tk , j.i 1 (7.27)
k , j ,i
tk , j , i
1
βk , j ,i k , j ( ) ωib b
( )d
2t
k, j
137
k , j (t ) k , j ,i k , j ,i (t );
t
k , j ,i (t ) ωib ()d ; t
b
k , j ,i t tk , j.i 1 (7.28)
tk , j , i
tk , j , i
k , j ,i ωib ()d b
tk , j
t k , j , i 1
1 1
β k , j ,i 1 k , j ,i k , j ,i 1
2 2 k , j ,i () ωbib ()d ; (7.29)
tk , j , i
Para evaluar el último término de la Ec. (7.29), supondremos una variación de bib
lineal respecto del tiempo a lo largo de dos intervalos consecutivos [tk , j ,i , tk , j ,i 1 ] . Esto
equivale a la existencia para cada i=1,.. L-2 de vectores constantes ai, bi tales que:
tk , j ,i 1 tk , j ,i 1
1
α k , j ,i 1 ωbib d [ai bi ( tk , j ,i )]d aiTl biTl 2
t k , j ,i t k , j ,i
2
(7.31)
t k , j ,i
1
α k , j ,i ωbib d aiTl biTl 2
tk , j ,i 1
2
α k , j ,i 1 α k , j ,i α k , j ,i 1 α k , j ,i
ai ; bi (7.32)
2Tl Tl 2
138
t k , j , i 1 tk , j , i 1
1 1
α k , j ,i d
b
ib [ bib d ] bib d
2 tk , j , i
2 tk , j , i tk , j , i
t k , j , i 1
1 1
2
tk , j , i
[ai ( tk , j ,i ) bi ( tk , j ,i ) 2 ] [ai bi ( tk , j ,i )]d
2
t k , j , i 1 (7.33)
1 1
[ai bi ( tk , j ,i ) bi ai ( tk , j ,i ) 2 ]d
2
2 tk , j , i
2
1 ( t k , j , i ) 3 1
ai b i α bk , j ,i α bk , j ,i 1
4 3 12
tk , j ,i 1
1 1
β k , j ,i 1 k , j ,i k , j ,i 1 α bk , j ,i α bk , j ,i 1 (7.34)
2 12
Este algoritmo es considerado de orden 2 dado que en la Ec. (7.34) aparecen productos
de los ángulos integrales presente y pasado: α k , j ,i 1 α k , j ,i , consecuencia de haber
supuesto una variación lineal bib en dos intervalos consecutivos. El lector
comprobará que es posible obtener algoritmos de orden superior suponiendo para
bib una variación polinomial de grado mayor a uno, lo que conduce a expresiones
de la corrección de coneo en función de ángulos integrales de dos o más períodos
consecutivos pasados (un análisis generalizado que incluye algoritmos de orden
superior dos puede consultarse en Ignagni, 1998). Finalmente, destacamos que los
ángulos integrales α k , j ,i i=1,…,L son provistos directamente por la electrónica de
adquisición de los giróscopos la cual integra la medición de la velocidad angular en
cada intervalo de adquisición Tl con el fin de promediar el ruido de medición.
139
7.1.3 Integración de las ecuaciones de traslación.
h Vzn z n V n
C e Ce S(ρ n ) (7.36)
n n
hk 1 hk hk 1 ;
t k 1
Vzn (tk ) Vzn (tk 1 ) (7.37)
hk 1 Vzn ( ) d
2
Ts
tk
Por su parte, la actualización de la matriz Cen requiere del ángulo vectorial de rotación
de la terna {n} respecto de {e} entre dos instantes de tiempo sucesivos solución de la
ecuación de Laning/Bortz del tipo de las (7.9) y (7.10) con velocidad angular ρ n . Para
vehículos atmosféricos (terrestres o aéreos) y valores usuales de Ts, el vector de rotación
k 1 en el intervalo [tk, tk+1] es lo suficientemente pequeño* como para suponer no-
rotante a ρ n en el intervalo. Esto permite aproximar la ecuación de Laning/Bortz
mediante el primer término, con lo cual:
tk Ts
Ts
nk (k1) n ( k ) ( ) d nk (k1) nk ( k ) (7.38)
tk
2
ˆ k 1 nk ( k )Ts
ˆe e ˆ ˆ ˆ
C n ( k 1) Cn ( k ) exp(S (k 1 )) k 1 , k , a
ˆ k (7.39)
ˆ
nk (k1) K n ( k ) ( ˆ k , hk )Vkn(1k ) z n kn (, zk )
k 1 , a
Las integraciones por trapecios† usadas en (7.37) y (7.38) se justifican para variaciones
suaves de la velocidad vertical y de la rotación por transporte, respectivamente.
*
Para la velocidad orbital terrestre (ground speed) 7Km/seg y Ts <0.1 seg, 0.01[rad].
†
Savage (1998 II, secc. IV-C) propone un método de mayor precisión y complejidad numérica para el
140
Con el valor de k 1 determinado mediante la (7.38), la siguiente regla permite
actualizar Cen y calcular las nuevas coordenadas curvilíneas.
t
n ( k ) ( )d V n ( k ) V n ( k ) (t )
V n ( k ) (t ) Vkn ( k ) V (7.41)
k k
tk
g u n(k )
k (t ) γ n ( k ) d g u kn (k1) g u kn ( k ) (tk 1 ) (7.42)
tk
c u n(k )
k (t ) (2Ωen ( k ) n ( k ) ( ) V n ( k ) ( )d c u nk (k1) c u nk ( k ) (tk 1 ) (7.43)
tk
f u n(k )
k (t ) Cbn((k )) f b ( d ; u nk (k1) u nk ( k ) (tk 1 ) (7.44)
tk
Vkn ( k ) (t ) f u nk ( k ) (t ) g u nk ( k ) (t ) c u nk ( k ) (t );
Vkn(1k ) f u nk (k1) g u nk (k1) c u nk (k1) (7.45)
Vkn(1k ) Vkn ( k ) Vkn(1k )
Una vez accesible el resultado de la Ec. (7.18), ésta junto con la (7.45) permiten
actualizar la velocidad según la terna n(k+1) al final de intervalo cada Ts como sigue.
calculo de la posición.
141
Cálculo de los términos de gravedad y Coriolis
Por ser una función “suave” de la posición, especialmente cuando se trata de vehículos
de trayectorias atmosféricas con limitada variación vertical*, la gravedad puede ser
aproximada por su valor medio en el intervalo de integración. Del mismo modo, cuando
la velocidad y consiguiente rotación de transporte sean lo suficientemente lentas, es
posible aproximar el término de Coriolis por su valor medio en un intervalo Ts. Bajo las
hipótesis que justifican estas aproximaciones, el término de gravedad + Coriolis: gc u nk (k1)
se calcula utilizando la formula de los trapecios como sigue:
un( k )
gc k 1
k 1
ˆ n(k ) γn(k ) ( , h ) (2Ωn(k ) n(k ) ) Vn(k ) Ts
γˆ nk(k1) (2Ωen(k ) ˆ nk(k1) ) V k ¨k e k k
2
(7.47)
n(k ) , n(k ) ,
En la que se utilizan los parámetros conocidos en el instante tk: k , Vkn ( k ) , V k k
K n ( k ) , de acuerdo con.
ˆ n(k) Vn(k) V
V n(k)T ;
k1 k k s
γˆn(k)
k1 γ (k , hˆ¨k1)
n(k)
f u nk (, kj ) f u nk ( k ) (tk , j );
t
(7.49)
u nk (, kj ) (t ) C f (d ; u nk (, kj )1 u nk (, kj ) (tk , j 1 )
n(k ) b
b()
tk , j
f u nk ( k ) (t ) f u nk (, kj ) u nk ,( kj ) (t ) (7.50)
f u nk (,0k ) 0
f u nk (, Mk ) f u nk (k1)
*
Este no es el caso de cohetes zonda o lanzadores satelitales por ejemplo.
142
Retomamos ahora el término u nk ,( kj ) (t ) de la Ec. (7.49) que rescribimos como:
t
u nk ,( kj ) (t ) Cbn((kk ,) j ) C f (d Cbn((kk ,) j ) ubk (, kj , j ) (t )
b(k , j ) b
b() (7.52)
tk , j
t
ubk (, kj , j ) (t ) C f (d
b(k , j) b
b( ) (7.53)
tk , j
Donde Cbn(( kk ,) j ) es actualizado como sigue en función del ángulo kb, j 1: j previamente
calculado mediante la iteración (7.35):
Cbn((kk ,0)
)
Cbn(( kk ))
Cbb (( kk ,, jj ) 1) exp(S(kb, j 1: j ));
(7.54)
Cbn((kk ,) j ) Cbn((kk ,) j 1) Cbb (( kk ,, jj ) 1) ; j 1,..., M
Cbn((kk ) 1) Cbn((kk ,)M )
El resultado final de la iteración anterior: Cbn((kk ) 1) junto con la (7.12) permiten reiniciar el
ciclo del cálculo Cbn a partir Cbn((kk 1)1) .
Cbb (( kk ,, jj ,)i ) puede ser calculado en cada paso de la iteración (7.35) (al final de cada
intervalo Tl). A continuación procedemos a evaluar el término que surge de la Ec.
(7.55):
tk , j , i 1
para lo cual usaremos en primer lugar, la hipótesis de que bib es no rotante en cada
intervalo Tl, para escribir:
143
δkb, j ,i (t ) ωbib (t )
t [tk , j ,i , tk , j ,i 1 ] (7.58)
δkb, j ,i (t ) α k , j ,i (t );
t t k , j , i 1
tk , j , i 1
v k , j ,i 1 α k , j ,i ( ) f b (d
b ( k , j ,i )
k , j ,i 1
tk , j , i
tk , j , i 1
(7.61)
v k , j ,i 1
tk , j , i
α k , j ,i ( ) v k , j ,i (d
tk , j , i 1
tk , j , i
α k , j ,i ( ) v k , j ,i (d
tk , j , i 1
(7.62)
1 1
α k , j ,i 1 v k , j ,i 1 α () f ( v k , j ,i ( ω ( d
b b
k , j ,i ib
2 2 tk , j , i
bk (, kj ,,ij,1i ) v k , j ,i 1 v rt k , j ,i 1 v sc k , j ,i 1
1
v rt k , j ,i 1 α k , j ,i 1 v k , j ,i 1 (7.63)
2
tk , j , i 1
1
v sc k , j ,i 1
2 α
tk , j , i
k , j ,i ( ) f b ( v k , j ,i ( ωbib ( d
144
productos de variaciones integrales de ambas magnitudes inerciales y por lo tanto son
correcciones de 2º orden del primero. Cuando a lo largo de Tl ocurre una rotación de la
terna del vehículo respecto de la terna inercial, v rt k , j ,i 1 corrige la impulsión v k , j ,i 1
debido al cambio de orientación de la terna {b} (el producto vectorial proyecta v k , j ,i 1
sobre los ejes actuales de {b}). A esto debe su nombre este término: corrección por
rotación. El término v sc k , j ,i 1 merece un análisis más detallado. Cuando en el
intervalo Tl puedan despreciarse las variaciones tanto de la fuerza específica como de la
velocidad angular (i.e. f b const. y ωbib const. ) se tendrá (ver definiciones (7.28) y
(7.60)):
α k , j ,i ( ) ωbib ( tk , j ,i )
(7.64)
v k , j ,i () f b ( tk , j ,i )
de donde, sustituyendo en la última de las (7.63), surge claramente para este caso que el
integrando del término v sck , j ,i 1 resultará despreciable y por tanto:
1
bk (, kj ,,ij,1i ) v k , j ,i 1 α k , j ,i 1 v k , j ,i 1 (7.65)
2
f b () ci di ( tk , j ,i ); tk , j ,i 1 tk , j ,i 1 (7.66)
Lo que implica suponer una variación lineal con el tiempo de ambas magnitudes
inerciales en coordenadas del cuerpo. Sustituyendo las (7.30) y (7.66) respectivamente
145
en las (7.28) y (7.60) se obtienen, además de las (7.31), las siguientes relaciones con los
incrementos integrales de la fuerza específica:
1 1
v k , j ,i ci Tl di Tl 2 ; v k , j ,i 1 ci Tl di Tl 2 (7.67)
2 2
1
v sc k , j ,i 1 [α k , j ,i v k , j ,i 1 v k , j ,i α k , j ,i 1 ] (7.68)
12
A partir de las expresiones (7.55), (7.56), (7.63), (7.68) es posible calcular el término
u nk (, kj )1 requerido en cada paso de la iteración (7.51) (al final de cada intervalo Tm),
mediante el siguiente algoritmo que procesa las magnitudes integrales α k , j ,i y v k , j ,i
enviadas a la más alta frecuencia desde la electrónica de los sensores inerciales:
S(Ωee ) eeS(e z ); e z 0 0 1
T
(7.70)
1 ω b 1 Ω e e
q be qbe ib e qb
2 0 2 0
146
V e Ce f b γ e 2Ωe V e ; Ve (0) V e
b e 0
(7.71)
P e V e
e sin(Ts ee / 2)
Cee(( kk ) 1) exp(S(Ts Ωee )) ; q ee(( kk ) 1) z ; (7.73)
e
cos(Ts e / 2)
Pe P e
e
X ; X ; e
(7.74)
e
V e
V
0 I3
A e
; w e (t ) γ e (P e (t )) Cbe f b (t ) (7.75)
0 2 S ( Ω )
*
La validación numérica de este enfoque, cuyo desarrollo no habia sido publicado previamente, es tratada
en Carrizo et al. 2007.
147
las ecuaciones de traslación (7.71) se agrupan en la siguiente ecuación de estado:
e AXe
0 e e
X e ; X (tk ) X k dado (7.76)
w (t )
tk 1
0
Xek 1 e ATs Xek e A (t ) e d ;
w ( )
(7.77)
tk
1 1 I Q(t )
e At I At ( At ) 2 ( At )3 .... (7.78)
2! 3! 0 R (t )
t
R (t ) e 2S ( Ωe )t
; Q(t ) R () d ; (7.79)
0
t t
U(t ) Q( ) d ; W (t ) U( ) d (7.80)
0 0
P
t
k 1
0
X k 1 k 1 e A (t k 1 )
w e ( ) d X k 1 X k 1
g f
(7.82)
Vk 1 tk
148
Donde se introducen los términos de gravedad y de fuerza específica:
Q(tk 1 ) e e
tk 1
X kg 1
tk
R (t ) γ (P ( )) d ;
k 1
(7.83)
Q(tk 1 ) e
tk 1
X R (t ) f ( ) d
f
k 1
tk k 1
γ e (P e (t )) γ e P e (tk ) V e (tk ) (t tk )
γ e
γ e P e (tk ) e V e (tk ) (t tk ) γ ek b k (t tk ) (7.84)
P Pe (tk )
γek
bk
Q(tk 1 ) Q(tk 1 )
tk 1 tk 1
Xkg1 R (t ) d γ k R (t ) ( tk ) d b k
e
tk k 1 tk k 1
Ts Ts
Q( ) Q ( ) Q ( ) Q ( )
Ts s T
R ( ) d γ k R ( ) (Ts ) d b k R ( ) d ( γ k Ts b k ) R ( ) d b k
e e
0 0 0 0 (7.85)
dU( )
Ts
U(Ts ) e U(Ts ) e W(Ts ) U(Ts )
( γ k Ts b k ) b k Q(T ) ( γ k Ts b k ) U(T ) b k Q(T ) Ts b k
Q (T )
s 0 dQ ( ) s s s
U(Ts ) e W(Ts )
γ k U(T ) b k
Q(Ts ) s
Una vez más, las matrices constantes que intervienen en la expresión anterior pueden
calcularse a priori fuera del algoritmo en funcion del Ts elegido.
149
Q(tk 1 ) Q(tk 1 (tk . j Tm / 2)) Q(Ts ( j 12 )Tm ) Q( j )
R (t ) R (t (t T / 2)) R (T ( j 1 )T ) R ( j ) ; j 0,.., M 1 (7.87)
k 1 k 1 k. j m s 2 m
M 1
Q( j )
X kf 1 R( j) u e
k, j (tk , j 1 ) (7.89)
j 0
El resultado final de la iteración anterior: Cbe ((kk )1) junto con la (7.72) y la (7.73) permiten
reiniciar el ciclo del cálculo Cbe a partir Cbe ((kk 1)1) . En cuanto al cálculo del término
ubk (, kj , j ) (t ) en (7.90) el desarrollo reproduce los mismos pasos que para la terna LGV
desde la (7.55) hasta el pseudo-código expresado por (7.69).
150
terna. Otro especto que motiva el uso de estas coordenadas es la forma sencilla que en
ellas adopta la expresión de la gravedad normal (fórmula de Somigliana en el capítulo
4). Sin embargo, como se demuestra en este capítulo la formulación en terna LGV no
resulta las más adecuada desde el punto de vista numérico.
Las ecuaciones cinemáticas según la terna terrestre (ECEF) son considerablemente más
sencillas que las expresadas en terna LGV. Como fuera señalado en Wei/Schwarz
(1990), esto permite suprimir aproximaciones mejorando la precisión y reduciendo la
complejidad e intensidad del cálculo en tiempo real. Más específicamente en ECEF: a)
La corrección por Corilolis se calcula en forma exacta en cada paso del algoritmo que
transforma el estado cinemático anterior mediante una matriz constante conocida a
priori; b) La rotación de la terna “e” en cada intervalo Ts es constante y conocida a
priori en forma exacta; c) La ausencia de la rotación de transporte reduce la complejidad
de las ecuaciones. Las ventajas numéricas señaladas se acentúan en alta velocidad (alta
rotación de transporte) como satélites o inyectores satelitales. En Carrizo et all. (2007)
se demuestra que en vehículos rápidos los errores inducidos por la aproximación del
término de Coriolis en terna LGV pueden dominar en varios ordenes de magnitud a los
provocados por las otras aproximaciones numéricas. En la misma referencia se compara
el desempeño de ambos algoritmos para idénticos valores de Tl, Tm y Ts, sobre una
trayectoria sintética (generada con el método expuesto en Giribet et al. 2007) de un
inyector satelital similar al vehículo DELTA-II de NASA. El resultado es una
divergencia en la posición en la versión LGV más de 3 órdenes de magnitud superior en
relación a la observada en terna ECEF.
Como la ECEF es la terna estándar de los sistemas GNSS, a las ventajas anteriores se
suma una mejor adecuación del algoritmo de propagación del estado cinemático a la
navegación integrada inercial-GPS (objeto del capítulo 9). En particular, los modelos
matemáticos de las medidas de pseudo-rango y Doppler (considerados en el próximo
capítulo) son los mismos que los adoptados por los receptores GPS. La mayor
simplicidad de los modelos de estas mediciones exteroceptivas se traducen además en
ventajas numéricas en la implementación del algoritmo de navegación integrada. Por
último cabe destacar que para ciertas aplicaciones como la geo-referenciación
automática de imágenes adquiridas mediante sensores remotos tanto aéreos como
satelitales la terna de preferencia es la ECEF.
151
Capítulo 8
Navegación Satelital Global
Los Sistemas Satelitales de Navegación Global (GNSS según sus siglas en inglés) son
sistemas de radionavegación pasiva con estaciones de referencias a bordo de satélites en
órbita alrededor de la Tierra. La constelación de satélites constituye un sistema de
referenciación absoluta que permite a un receptor alcanzado por las señales satelitales
medir su distancia respecto de cada satélite y determinar, por triangulación, su propia
posición en coordenadas ECEF, terna de referencia estándar adoptada por todos los
sistemas GNSS.
La posición de cada satélite visible es determinada en el propio receptor con base en sus
parámetros orbitales (efemérides) transmitidos junto con la señal recibida. La distancia a
cada trasmisor satelital se calcula escalando con la velocidad de propagación de la luz
en el vacío la medida del tiempo de propagación de la correspondiente señal.
Clásicamente, la medición precisa de intervalos de tiempos entre eventos no co-
localizados ha requerido relojes de alta precisión y una muy buena sincronía entre ellos.
Sin embargo, la introducción del concepto de pseudo-distancia o “pseudo-rango” hizo
posible reducir los requerimientos de alta calidad y sincronía en el reloj del receptor
permitiendo su miniaturización y masificación. El concepto utiliza un número
redundante de mediciones de tiempos de propagación (al menos 4 en 3 ó 3 en 2)
todos afectados por idénticas imprecisiones del reloj del receptor (de calidad comercial)
y a partir de ellas determina, simultáneamente, las coordenadas de la posición del
receptor y el sesgo horario de su reloj. De éste modo, el mismo concepto hace posible
posicionar un receptor y propagar el tiempo preciso medido a bordo de los satelites de
referencia.
Una gran ventaja de los GNSS es que permiten, en todo instante y casi
independientemente de las condiciones atmosféricas, posicionar un receptor ubicado en
casi cualquier punto del espacio circundante a la Tierra con un error acotado y una
precisión uniforme. El desplazamiento Doppler, medido al sintonizar la portadora,
permite calcular la velocidad radial del receptor respecto de cada satélite y,
consiguientemente, determinar el vector velocidad en las mismas coordenadas del
sistema de referencia satelital. Los receptores modernos pueden además rastrear la fase
de la portadora emitida por los satélites, lo cual, mediante técnicas interferométricas,
permite posicionamientos de muy alta precisión y aún medir directamente la orientación
de un receptor equipado con múltiples antenas. Los métodos interferométricos son la
base de los más modernos sistemas de navegación de alta precisión.
Los sistemas GNSS han sido tributarios del rápido desarrollo durante las últimas
décadas de un número considerable de tecnologías críticas tales como: vehículos
espaciales altamente confiables; relojes atómicos de alta precisión y estabilidad (<1 seg.
en 3x106 años); buena estabilidad a corto plazo de osciladores de cuarzo; técnicas
precisas de rastreo satelital y de cálculo de efemérides y métodos avanzados de
modulación de portadora.
152
Las aplicaciones actuales y potenciales de los GNSS son innumerables y abarcan todas
las ramas de la ingeniería, la arquitectura, la salud, el manejo territorial, de recursos
naturales y de catástrofes, los sensores remotos, entretenimientos y, por supuesto, todos
los medios de transporte que, junto con las aplicaciones militares, constituyen el motor
original de esta tecnología.
153
Las funciones del segmento espacial son: a) recibir y almacenar la información
preveniente del segmento de control, b) mantener el tiempo preciso a bordo, c) modular
y transmitir las portadoras con los respectivos códigos de cada satélite y los mensajes de
navegación y d) asegurar la localización espacio-temporal asignada por el segmento de
control de cada satélite dentro de su órbita.
Plano del
Ecuador
60o
Figura 8.1: Órbitas del segmento espacial del sistema GPS proyectadas sobre
el plano del Ecuador.
La Figura 8.2 indica las portadoras de las señales en el espacio para las 3 constelaciones
consideradas, todas ubicadas en la región RNSS (Radionavigation Satellite Service) de
la banda L. Esta región incluye a la zona protegida de interferencias ARNS
(Aeronautical Radio Navigation Service) destinada a la aeronavegación comercial y
sometida a estrictas regulaciones internacionales.
El sistema GPS utiliza el método CDMA (Code Division Multiple Access) para emitir
sus señales según dos códigos con un canal de código independiente asignado a cada
satélite. Sobre su portadora L1 (1575.42 Mhz) en la zona ARNS trasmite, “en fase”, una
señal de precisión para aplicaciones militares con el código denominado P(Y) code (que
puede ser encriptado) y otra “en cuadratura” con código C/A (Coarse-Acquisition code)
de libre acceso. El código P(Y) también es trasmitido sobre la componente en fase de
una segunda portadora L2 (1227.60 MHz) ubicada fuera de la zona protegida ARNS. A
partir de los primeros satélites del plan de modernización: Block IIR-M
(Repelenishment and Modernized) lanzados en 2005, GPS también trasmite en
154
cuadratura sobre la portadora L2 la nueva señal civil L2C con código C/A. Los satélites
del bloque Block IIF (follow on), con inicio de lanzamientos en 2009, incluyen dos
nuevas señales de seguridad de vida (SOL: Safety of Life) sobre la portadora L5
(1176.45 MHz) con un código similar al P(Y)*. Culminado el proceso de
modernización, el sistema GPS ofrecerá señales en 3 bandas de frecuencias diferentes a
sus usuarios civiles, lo que implicará una significativa mejora en precisión y
confiabilidad respecto de la situación actual.
*
El satélite SVN49 del Bloque IIR-M lanzado en marzo de 2009 es el primero en trasmitir en la
frecuencia L5 en forma experimental. Se prevé una constelación operativa en L5 para 2018.
155
conllevarán 5 tipos de datos: a) de navegación, b) de integridad, c) comerciales, d)
señales reguladas por el poder público (PRS: Public Regulated Service) y e) del servicio
de búsqueda y rescate o SAR (Search And Rescue). Esta última banda es una novedad
del sistema GALILEO y está dedicada a la emisión de datos sobre situaciones de
emergencias a los operadores de este servicio. Las señales destinadas a los servicios
comerciales (CS) y PRS son de acceso restringido y estarán encriptadas, mientras que el
resto serán de acceso libre (OS: Open Service))). El sistema ofrecerá datos de
navegación OS y SOL en 6 señales, incluyendo 3 “portadoras piloto” sin datos*, sobre
las bandas E5a/L5 y L1.
*
Las portadoras piloto facilitan el rastreo y la medición de la distancia al satélite emisor por parte del
receptor.
†
Como veremos en el próximo capitulo sus efectos pueden ser paliados si cada satélite emite en más de
una frecuencia y el receptor está capacitado para recibirlas.
156
parámetros del modelo ionosférico son subidos a la constelación y posteriormente
difundidos por vía del mensaje de navegación.
La precisión con la cual es posible corregir los errores del segmento espacial (incluido
el retraso ionosférico) depende de la densidad de estaciones de rastreo, de la cantidad de
estaciones de referencia que ve cada satélite en un dado instante y de la frecuencia de
renovación de estos datos por parte del segmento de control. Por este motivo, el nuevo
programa de modernización del segmento terreno del sistema GPS, acordado en
septiembre de 2007 elevó a 11 las estaciones de monitoreo MS (Monitor Station),
agregando a las 5 originales manejadas por la USAF, localizadas en Hawaii, Colorado
Springs, las islas Ascensión (Atlántico Sur), Diego García (Indico Sur) y Kwajalein
(Pacífico Norte), las recientes 6 administradas por la agencia NIMA (National Imagery
and Mapping Agency) y localizadas en: Washington, DC, Inglaterra, Argentina,
Ecuador, Arabia Saudita y Australia. También prevé a mediano plazo la incorporación
de 5 nuevas estaciones más. Asimismo, a la estación de control central MCS (Master
Control Station) en Colorado Springs se agregó la MCS en Gaithersburg, Maryland. La
actual red de estaciones MS de GPS asegura la visibilidad desde cada satélite de al
menos 2 MS el 100% del tiempo (Yinger, et.al., 2003). Las 3 antenas de subida de datos
(GA: Ground Antenna) ubicadas, respectivamente, en Ascensión, Diego García y
Kwajalein actualizan los parámetros orbitales de la efemérides de los satélites y sus
respectivos relojes atómicos (con precisión de nanosegundos) al menos una vez por día.
Estos datos son incorporados al mensaje de navegación incluido en la señal trasmitida
desde cada satélite. Con la sustitución de la actual constelación por las nuevas
generaciones de satélites: Block IIR/IIF, el segmento espacial dispondrá de la
funcionalidad de auto-navegación relativa, lo que permitirá actualizar con mayor
frecuencia los parámetros del mensaje prescindiendo del segmento terreno, que, de
todos modos, seguirá asegurando la supervisión a largo plazo de los parámetros del
mensaje de navegación.
El segmento terreno del sistema GALILEO estará conformado por dos subsistemas: el
GCS (Ground Control Segment) y el GMS (Ground Mission Segment). El GCS
dispondrá de una red global de 5 estaciones TTC (Telemetry Tracking and Control) para
el mantenimiento, control orbital, supervisión paramétrica y salud de los satélites. El
GMS se apoyará en una red global de 30 estaciones GSS (Galileo Sensor Stations)
equipadas con receptores de referencia dedicadas al monitoreo continuo de las señales
en el espacio (SIS) emitidas por la constelación. Mediante esta red el GMS realiza la
determinación orbitográfica y la sincronía de tiempos (ODTS: Orbitography
Determination and Time Synchronization) incluyendo el cálculo de los desfasajes de los
relojes y la predicción de sus derivas, resultados que serán retransmitidos a la
constelación a intervalos de 100 minutos. Asimismo el GMS calculará la función de
157
integridad de la señal de cada satélite luego traducida en mensajes de alerta difundidos
por la constelación asegurando que el intervalo entre la detección de una falla y su
notificación al usuario TTA (Time to Alert) sea inferior a 6 segs. Cinco estaciones
globales de enlace ULS (Up-Link-Stations) permitirán la comunicación del segmento
terreno con el segmento espacial.
Como se mencionó más arriba, actualmente el sistema GPS trasmite en forma operativa
en dos portadoras. Las frecuencias de ambas portadoras son múltiplos enteros
coherentes de la frecuencia del reloj atómico estándar a bordo de cada satélite de
10,23Mhz de tal modo que:
El sistema ofrece dos servicios básicos: el SPS (Standard Positioning Service) y el PPS
(Precise Positioning Service). Ambos utilizan multiplexado de tipo CDMA, el primero
con código C/A y el segundo con código P(Y). Ambos códigos se montan sobre las
portadoras usando modulación de tipo BPSK (Binary Phase Shift Keying) que consiste
en rotar en 180º la fase de la portadora cada vez que hay un cambio de estado en la señal
trasmitida lo que permite distinguir entre dos estados. Las tasas de cambio de estado
(chip-rate) están sincronizados con el reloj atómico de referencia que para el código
C/A es de 1,023MHz y para el código P(Y) es de 10,23MHz. Cada satélite tiene
asignada una secuencia de bits (+1 ó -1) única para ambos códigos de ambos servicios.
El código C/A del servicio SPS utiliza secuencias binarias pseudoaleatorias (PRBS)
lineales de longitud máxima N=1023 bits ancho de pulso Tc=1/1,023 nanoseg.y
duración total igual a 1ms. Estas secuencias son de tipo “Gold” caracterizadas por ser
estadísticamente cuasi ortogonales bajo la operación binaria de correlación cruzada
(Gold, 1967). Esto permite discriminar fácilmente entre dos secuencias distintas. Por su
parte, el PPS codifica la señal con secuencias PRBS no-lineales, llamadas P-code, de
gran longitud (N1014) y ancho de pulso Tp=1/10,23 nanoseg. reiniciadas al principio
de cada semana. Desde su inicio en 1994, este código es usado en su forma encriptada
Y-code con el fin de limitar su uso sólo a usuarios autorizados.
La Figura 8.3 demuestra la jerarquía en los procesos de modulación de las señales GPS.
El nivel del bit del dato de navegación es sumado modulo-2 al correspondiente nivel del
bit de la secuencia del código C/A ó P(Y) según el caso. Esta operación aprovecha el
hecho de que los chip rates de ambos códigos son múltiplos enteros del bit rate (tasa de
bits por unidad de tiempo) de los datos de 50Hz. De este modo, con una longitud
Td=20mseg. cada bit de datos recubre un numero entero de bits de cualquiera de los dos
códigos correspondiendo, respectivamente, a 20 secuencias PRBS completas del código
C/A y 2x105 bits del código P(Y). El nivel resultante de la primera operación binaria
modula en BPSK la componente en cuadratura de la portadora L1, mientras que el
resultado de la segunda operación modula las componentes en fase, tanto de la
portadora L1 como de la L2. Así, la portadora L1 es modulada por ambos códigos (en
fase y en cuadratura), mientras que la L2 está dedicada exclusivamente al código P(Y).
158
La administración del sistema puede decidir no modular con datos al código P(Y)
montado sobre una u otra portadora.
Portadora L1 1575.42
90
Código C/A 1.023 MHz Señal L1
Señal L2
Portadora L2 1227.6 MHz
Td Tc
Bits de datos
Código
modulado c/datos
Código PRBS
Portadora
Portadora
modulada
Figura 8.4: Modulación BPSK de la portadora GPS.
Donde: Wc , WP1 y WP2 son, respectivamente, las potencias promedio de las señales
transportadas por el código C/A sobre la frecuencia f1 (L1) y por el código P(Y),
respectivamente, sobre f1 y f2 (L2); Di (t ) (=1) es la secuencia de bits de los datos del
mensaje trasmitido por el satélite i; CAi (t ) (=1) es la secuencia PRBS del código C/A
159
que además de expandir el espectro identifica al satélite i; Pi (t ) (=1) es la
correspondiente al código P(Y); 1i y i2 son las fases indeterminadas (ambiguas y no
coherentes entre sí) de las respectivas portadoras.
K
s (t ) s i (t ) n(t ); K nº de satelites visibles.
i 1 (8.3)
s i (t ) 2W i Di (t i )CAi (t i ) sen(2( f1 f Di )t 1i ); i 1,..., K
160
En la etapa de RF del receptor, la señal s(t) es amplificada por un amplificador de bajo
ruido, luego filtrada para eliminar el ruido fuera de banda base y, clásicamente, reducida
en frecuencia mezclándola con la señal de frecuencia intermedia fIF:
La fase IF es independiente (no es coherente con) de la fase de las señales que llegan a
la antena del receptor. A la salida del mezclador, la señal es nuevamente filtrada con un
filtro pasabanda de 20 a 30Mhz de ancho centrado en fIF. El resultado es una señal,
imagen de la señal (8.3), trasladada en frecuencia, tal como:
K
y (t ) y i (t ) n(t ); K nº de satelites visibles.
i 1 (8.5)
y i (t ) W i Di (t i )CAi (t i ) sen(2( f Di f IF )t i ); i 1,..., K
En esta ecuación, n(t ) es la imagen del ruido de recepción en la banda pasante del
filtro. Dado que en esta banda la señal y el ruido son amplificados igualmente, esta
operación preserva la relación señal ruido en la banda base. La fase
i 1i IF PB , donde PB incluye la fase que agrega el filtro pasa-banda y los
retardos de línea que, igual que IF , no dependen del satélite.
Resta aún por extraer de y(t) la información crucial requerida por el receptor para
resolver la navegación, a saber: a) el código CAi (t ) que determina el único satélite que
lo usa, b) i : el tiempo de transito entre el satélite i y el receptor (medida de la distancia
radial), c) f Di : el desplazamiento Doppler (medida de su velocidad radial), d) Di(t): la
cadena de bits de datos que contiene el mensaje emitido por el satélite i, e) la fase
i que, cuando está disponible, permite el posicionamiento de alta precisión mediante
métodos de interferometría. Esta información se determina numéricamente a partir de la
señal digitalizada a la salida de la etapa de RF* (Ec.(8.5)) y que denotamos:
K
yk yki nk (8.6)
i 1
*
Incluye la antena, amplificador de bajo ruido, supresión de portadora, rechazo de imagen y filtrado.
161
8.3.1 Adquisición de la señal
Consiste en una búsqueda en el espacio de todos los posibles valores de y f D para
cada código CAi (t ) de los satélites visibles. Cuando el receptor no tiene ninguna
información de su tiempo y posición (y por tanto de la constelación visible) el proceso
de búsqueda puede tomar varios minutos y es denominado “arranque en frío”. La
búsqueda se efectúa correlacionando la secuencia {yk} con las señales complejas
generadas internamente por el receptor para cada código CAi de cada satélite
potencialmente visible:
xk (ˆ i , fˆDi ) CAi (kTs ˆ i ) exp( j (2( fˆDi f IF )kTs )); i 1,..., K (8.8)
yk 1 N
() R(ˆ i , fˆDi )
N k 1
i f Di
R(ˆ , fˆDi ) exp( ji )
i
162
8.3.3 Demodulación del tren de bit de datos
Una vez asegurados la sintonía y el rastreo de los valores instantáneos de los parámetros
i , f Di de la señal discreta yki de cada satélite, recién entonces es posible demodular el
tren de pulsos de datos y leer los parámetros del mensaje, para lo cual debe asegurarse
el rastreo de la señal durante la duración total del mismo.
i
sDk 2 exp( j (2( f Di f IF )kTs ˆ í ))
(8.9)
2 cos(2( f Di f IF )kTs ˆ í ) j 2sen(2( f Di f IF )kTs ˆ í )
K
i
yk sDk CAi (kTs ) sDk
i i
CAi (kTs i ) ykj sDk
i
CAi (kTs i )nk (8.10)
j 1
De este modo se suprimen tanto el código como la portadora intermedia dando como
resultado las señales en fase y cuadratura:
S I (k ) Di (k ) cos(ii )
(8.13)
SQ (k ) Di (k ) sen(ii )
163
En un lazo de Costas (ver p.e. Parkinson/Spilker, 1996) como el mostrado
esquemáticamente en la Figura 8.6, la fase ˆ i es manipulada numéricamente para
reducir el ángulo ii a la salida del discriminador, concentrando así la energía de
salida sobre la señal en fase SI(k), de modo que esta última señal da el signo del bit de
datos actual.
CAi (kTs i )
S I (k ) D i (k ) cos(ii )
Re(.)
yk
Filtro pasa
bajos
SQ (k ) Di (k ) sen(ii )
i
sDk (ˆ i ) Im(.)
Control de ii
ˆi
la fase
tg1(SQ / SI )
Figura 8.6: Lazo de Costas y demodulación de los bits de datos del satélite i.
La Figura 8.7 resume los procesos al interior de un receptor GPS. En ella se muestra en
forma esquemática el tratamiento en paralelo de cada canal de datos caracterizado por
su código CDMA específico.
164
propagación de las señales. Incluye los parámetros del modelo ionosférico*, la salud y
estado de cada satélite, el número de la semana y el “almanaque”. Este último es un
conjunto de datos de efemérides de baja precisión de toda la constelación actualizados
una vez por semana. El almanaque permite al receptor saber que satélites están visibles
o cuando aparecerán sobre el horizonte con sólo adquirir la señal de uno de ellos.
Almanaque
Por cada satélite visible, un receptor GPS puede realizar tres mediciones directas. El
pseudo-rango, basado en el código PRBS específico para cada satélite, la fase de la
*
Modelo de Klobuchard (Parkinson/Spilker, 1996).
165
portadora y su velocidad radial relativa al satélite. El modelo matemático de estas
mediciones, llamadas observables, requiere tener en cuenta la existencia de 3 escalas de
tiempo simultáneas, cada una de ellas asociadas a un reloj independiente (ver Fig, 8.9).
Llamaremos: tg al tiempo global de la constelación que, por ser el más preciso, lo
equiparamos al tiempo absoluto t (ºtg); ts(t) al tiempo indicado por el reloj del satélite
en el instante t y tu(t) al tiempo indicado por el reloj del receptor (usuario) en el mismo
instante (ver Fig. 8.9 a). Los desvíos instantáneos respecto del “tiempo absoluto” de los
tiempos indicados por los relojes se definen como:
ts (t ) ts (t ) t
(8.14)
tu (t ) tu (t ) t
a) 0
tg(t) t=tg
ts ts
tu ts(t)
tu
tu(t)
0 tt ts tu
tr t=tg
b)
ts(tt)=tt+ts ts
tu
tu(t )=tr+t
r
Efectos atmosféricos
En los más de 20.000Km de su trayectoria a la Tierra la señal GPS atraviesa medios
atmosféricos con diversos índices de refracción que afectan su fase y velocidad de
propagación instantáneas. En algún punto entre los 1000 y 600Km de altura entra en la
ionosfera y mucho más cerca, en los últimos 50Km, inicia su tránsito por la troposfera.
Estas dos capas de la atmósfera son las que más afectan la propagación e inciden de
modo tal en el tiempo total de propagación que resulta imprescindible tenerlas en cuenta
en un modelo de las mediciones GPS. El efecto de ambas capas es claramente diferente
tanto cuantitativa como cualitativamente y por ende convendrá distinguirlos.
166
La ionosfera, considerada como un plasma iónico anisotrópico e inhomogéneo de
densidad electrónica variante con el tiempo y el espacio, induce un efecto dispersivo
sobre la señal. En medios dispersivos el índice de refracción varía con la frecuencia de
la onda electromagnética. Así, al atravesar tal medio una portadora modulada por una
banda base de ancho no nulo ve afectada diferencialmente las velocidades y las fases de
sus componentes frecuenciales. El resultado es que la portadora viaja a una velocidad vf,
llamada velocidad de fase, distinta a la de la envolvente de modulación vg, llamada
velocidad de grupo, con la que se propaga la información montada sobre la portadora
que, en el caso de la señal GPS corresponde al código PRBS de cada satélite. La
relación teórica entre estas velocidades queda expresada mediante la siguiente fórmula
(Misra/Enge, 2006) que relaciona los correspondientes índices de refracción: nf=c/vf y
ng=c/vg.
dn f
ng n f f (8.16)
df
40.3e 40.3e
nf 1 2
ng 1 (8.17)
f f2
167
ligeramente superior a la unidad*, lo que se traduce en una reducción de la velocidad de
propagación y por ende en un alargamiento aparente de la distancia satélite-usuario que
oscila entre los 2,5m y 25m dependiendo de la elevación del satélite. Existe una
variedad de modelos del retraso troposférico de la señal GPS que difieren en sus
hipótesis y suposiciones básicas acerca de los perfiles estándar en altura de la
temperatura y la humedad a la latitud del lugar. Sin embargo, el sistema GPS no provee
ninguna información sobre los parámetros de estos modelos por lo que, si fuera
requerido, el usuario debe implementar su propio modelo con base en datos de la
atmósfera local. Al igual que con el retraso/adelanto ionosférico, la oblicuidad de la
línea de vista al satélite determina la longitud del rayo dentro del medio y por tanto debe
ser tenida en cuenta en los modelos respectivos.
Utilizando el valor del instante de trasmisión (según el reloj del satélite) “estampado” en
la señal y el tiempo de recepción de ésta, establecido por el reloj del receptor, este
último determina su pseudo-rango us respecto del satélite definido como la medición
del tiempo de propagación ˆ us multiplicada por la velocidad de la luz en el vacío c.
En los errores de medición se incluyen, por un lado, los errores aleatorios s en la
determinación de los tiempos tu (t r ) y ts (t t ) y, por otro, los inducidos por perturbaciones
debidas a reflexiones espurias de la señal antes de llegar a la antena del receptor. Estas
reflexiones conocidas como efecto “multipasos”, dependen de la topología local y de la
dirección de propagación e interfieren la recepción sobre el camino directo de la señal.
En función del tiempo real de propagación y teniendo en cuenta el error s y el efecto
multipasos que denotamos cM us , la (8.19) se rescribe:
*
Al nivel del mar el índice es n1.0003 y mucho más cercano a la unidad por encima de los 10Km.
†
Si no se indica otra cosa, las posiciones y velocidades en este capítulo están expresadas en terna ECEF,
estándar en los GNSS.
168
El retraso electrónico en el satélite es tenido en cuenta en el estampado del tiempo sobre
la señal por lo que su efecto residual es despreciable frente al retraso electrónico en el
receptor, así, en la práctica, H es asimilado totalmente a tu .
La técnica estándar es la base de los servicios SPS y PPS (cada uno con una portadora y
un código propios) mencionados más arriba y es la que describimos en este capítulo
haciendo énfasis en su aplicación al servicio SPS sin restricciones de uso civil. Los
otros métodos pueden utilizar más de un receptor, más de una frecuencia, varias épocas
o instantes de medida y la medición de la fase de la portadora que como veremos resulta
mucho mas precisa. Para una descripción de estos métodos el lector puede consultar por
ejemplo Misra/Enge, 2006.
*
El receptor puede compensar parcialmente los términos de spui usando los parámetros del modelo de
Klobuchard y las correcciones de efemérides y del reloj de cada satélite trasmitidas en el mensaje. Cabe
señalar que la precisión de estas correcciones se degradan con la antigüedad de dichos parámetros.
169
El método estándar define como error residual de medida al término ui spui cM ui i
con lo cual las (8.25) se transforman en las siguientes s ecuaciones con 4 incógnitas: las
coordenadas de PuT xu , yu , zu en terna ECEF y el error del reloj del receptor tu .
Usando las medidas iu (t ) , el receptor calcula, mediante un método iterativo de tipo
Newton-Raphson, la solución que minimiza la suma de los cuadrados de los residuos de
las mediciones en cada instante t:
s 2
H (Pu , tu ) iu (t ) ( Rui (Pˆ s , Pu ) ctu ) (8.28)
i 1
Llamando iu (Pu , tu ) Rui (Pˆ s , Pu ) ctu introducimos los siguientes vectores de s:
2
H (Pu , tu ) ρu (t ) ρ u (Pu , tu ) (8.30)
170
Denotando con rui (Pˆ i Pu ) / Rus (Pˆ s , Pu ) al versor de línea de vista al satélite, es fácil
ver a partir de la (8.31) que dicho jacobiano resulta:
(ru1 )T c
ρ u (Pu , tu ) (ru2 )T c
J s 4 (8.32)
( xu yu zu tu ) ...
s T
(ru ) c
Si (Pu* , tu* ) son los valores reales desconocidos buscados y (Pu , tu ) valores genéricos
suficientemente cercanos a dichos valores, entonces:
P 2 2
ρ u (Pu , tu ) ρ u (Pu* , tu* ) J u o( Pu , tu ); (8.33)
tu
Donde:
xu
Pu Pu Pu* yu ; tu tu tu* ; (8.34)
zu
2
2 P 4
H (Pu , tu ) ρ u (Pu* , tu* ) ρ u (Pu , tu ) ξu (t) J u ξu (t) o( Pˆ i Pu ) (8.35)
tu
2
Pˆ u Pu*
J *
ξ u (t) (8.36)
tˆu tu
Pˆ u Pu* Pˆ u Pu*
=(J J ) J ξ u (t) = * +(JT J ) 1 JT ξ u (t)
T 1 T
(8.37)
tˆu tu
ˆ *
tu tu
171
exclusivamente de la geometría de la constelación visible (independiente de las
distancias). En particular, cuando las líneas de vista de los satélites se ubican próximos
a un único plano que pasa por el usuario, J tiende a ser deficiente en rango (con
columnas linealmente dependientes) y los errores de posicionamiento tienden a infinito.
Sin embargo, el diseño de las órbitas de la constelación es tal que esta posibilidad está
excluida para casi cualquier punto sobre la Tierra desde el cual resulten visibles 4 o más
satélites.
Pˆ u Pu*
E{ } * + (J T J ) 1 J T E{ξ u } (8.38)
tˆu tu
Sesgo de la estimación
P
Q Pe ,t cov( u ) (J T J ) 1 J T cov(ξ u )J (J T J ) 1 4 x 4 (8.39)
tu
u
De la (8.38) surge que si los errores de medida iu son segados la estimación de la
posición también lo será. Este es el caso en general, sin embargo, por convención, los
estándares de precisión se definen suponiendo esos errores insesgados además de
idénticamente distribuidos y de variancia constante u2 . Bajo estas suposiciones, el
estimador (8.38) resulta insesgado y su covariancia en coordenadas ECEF a partir de la
(8.39) es:
g x
1 2
Ge g y
Q Pe , t u ( J J ) u
2 T
; Q e u2G e (8.40)
u g z P
g x g y g z g
C 0 S
C S S C S C
g
e
(8.41)
C S S CC
172
E
N P g C g P g
u e u
U
(8.42)
g ee g en g eu
2
QPg Ce Q Pe C g u Ce G C g u g en g nn
g e 2 g e e
g nu
g eu g nu guu
Propagación: p
Retraso ionosférico del código cI ui :
Dirección zenital: 2-10m (rms), factor de oblicuidad: FO=1-390°-5°
Retraso troposférico del código cTui :
Dirección zenital: 2-3m (rms); factor de oblicuidad: FO=1-1090°-5°.
Recepción: re
Ruido de medida c/código s 0.25-0.5m (rms).
Multi-pasos (ambiente libre) c/código cM ui 0.5-1m (rms).
173
Los valores rms de los errores de propagación son estimados sobre la vertical local. El
factor de oblicuidad (FO) es un multiplicador que tiene en cuenta el aumento de la
longitud del camino con el ángulo de incidencia en la capa atmosférica correspondiente.
Suponiendo independientes cada una de las fuentes, a partir de los valores indicados
arriba se obtiene la magnitud del error equivalente para el usuario URE (User
equivalent Range Error):
Para la formulación del modelo de fase debe tenerse en cuenta que tanto en el satélite
como en el receptor, la potadora de frecuencia nominal fo es generada por un oscilador
que al mismo tiempo es el reloj que mide el tiempo. Así, si s y u son las fases en
ciclos, respectivamente, de la portadora del satélite y de su réplica en el receptor y si
[tuo , tu ] y [tso , ts ] son dos intervalos de tiempo medidos, respectivamente, por el reloj del
receptor y el del satélite, de la condición de oscilador-reloj para cada portadora resulta:
d s d u
fo (8.45)
dts dtu
Dado que un evento ocurrido en el instante absoluto t ocurre, según cada reloj, en los
instantes ts (t ) t ts (t ) y tu (t ) t tu (t ) , (8.44) implica además:
Derivando las anteriores respecto del tiempo absoluto t, se tienen las frecuencias
“absolutas” de los respectivos osciladores-relojes:
174
d u d u dtu d tu
fu (t ) f o (1 )
dt dtu dt dt
(8.47)
d s d s dts d ts
f s (t ) f o (1 )
dt dts dt dt
De donde surgen las siguientes relaciones entre las frecuencias nominal y locales y las
derivadas respecto del tiempo absoluto (o derivas) de los desvíos temporales de los
relojes respectivos.
d tu f u f o
Du (t )
dt fo
(8.48)
d ts f fo
Ds (t ) s
dt fo
Con base en las (8.44) definimos la fase total us (tur ) [ciclos] a la diferencia entre la fase
de la portadora en el satélite en el instante de trasmisión tst (tiempo del satélite):
s (tst ) [ciclos] y la fase de la portadora nominal replicada en el receptor en el instante
de recepción tur (tiempo del receptor): u (tur ) [ciclos].
us (t r ) u (t r ) s (t r ) (8.52)
f o (t r t o ) u (t r ) u (t o ) s (t r ) s (t o ) (8.53)
175
Lo que demuestra que la diferencia de fase sincrónica se mantiene invariante en tanto se
verifique la condición de enganche de la portadora.
Los receptores diseñados para medir la fase total miden, en el instante de enganche tuo ,
solamente la fracción de ciclo (mantisa) de dicha fase que, junto con el modelo de
medición, se escriben:
Fase de batido
us * (tur ); tur tuo
0
us * (tuo ) us (tuo ) N us (tuo ) tu
o
tu inicio del
u
“phase lock”
us (tuo ) f
us *
“Ambigüedad” entera
Nus (tuo ) s
Diagrama de fasores
Figura 8.11: Evolución temporal de la fase de batido y diagrama de fasores.
A partir de tuo y en tanto el PLL mantenga enganchada la portadora con su réplica local,
el receptor mide continuamente la fase total us (tur ) descontada de la ambigüedad entera
constante y desconocida N us (tuo ) . Esta magnitud, llamada comúnmente fase de batido,
fase Doppler o simplemente fase de portadora, representada pictóricamente en la Fig.
8.11, junto con su modelo de medida, se expresan matemáticamente como:
176
d s r d s* r
f Ds u (tu ) u (tu ) (8.57)
dtu dtu
Sin entrar en los detalles de diseño, diremos que para el seguimiento continuo de la fase
Doppler el receptor utiliza un contador interno que, según corresponda, se incrementa o
decrementa en una unidad cada vez que la fase pasa por “0” ó “1” (0 ó 2 en el
diagrama de fasores de la Fig. 8.11). Así, la medida us se compone de una parte entera,
almacenada en el contador, y una parte fraccionaria dada por la medición electrónica
instantánea de la diferencia de fases entre los fasores de ambas señales (ver figura). Al
momento de interrumpirse la condición de enganche, la cuenta de ciclos enteros deja de
tener validez. De reiniciarse el enganche, al nuevo período le corresponderá un nuevo
valor N us . Cuando una secuencia desenganche/re-enganche pasa inadvertida, el contador
de ciclos enteros contiene un valor erróneo para el nuevo período de phase-lock, en este
caso se habla de pérdida de ciclos o cycle slip.
De acuerdo con lo señalado en el párrafo 8.4.2 (Ecs. (8.21)), junto con la (8.23), el
término del tiempo de propagación en (8.59) se escribe como:
177
Lsu * (tur ) Rus (Pˆ s , Pu ) E s c(Tus I us ) c(tu ts ) Bus (t o )
(8.61)
Lsu (tur ) Lsu * (tur ) cmus s
Lsu (tur ) Rus (Pˆ s , Pu ) E s c(Tus I us ) c(tu ts ) Bus (t o ) cmus s (8.62)
Como surge de comparar los siguientes valores típicos para un receptor de alta gama.
los errores en la medición del código son hasta 2 órdenes de magnitud superiores a los
correspondientes a la medición de la fase. A pesar de su gran precisión el uso de la
medida de la fase como observable de la distancia satélite/receptor se ve limitado por la
presencia de la ambigüedad Bus que de ningún modo podría considerarse como un
residuo de medición dado que su valor puede ser arbitrariamente grande. Por esta razón,
los métodos que utilizan la medida de la fase para el posicionamiento del receptor
requieren determinar esta ambigüedad para lo cual utilizan información suplementaria
provista por otros receptores cercanos y/o en otras frecuencias de portadora. El más
popular de estos métodos, llamados interferométricos, es tal vez el lambda method
(least-squares ambiguity decorrelation adjustment) desarrollado inicialmente por
Teunissen. Dado que el abordaje de estos métodos de posicionamiento de alta precisión
excede el alcance de este libro, se recomienda al lector interesado consultar las
referencias: Teunissen, (1994), Teunissen, (1995), Teunissen et al. (1995) y también
una discusión sobre el tema en el Cap. 6 de Misra/Enge, (2006).
A pesar de su inferior precisión, la medida del pseudo rango con código tiene el interés
de ser no ambigua, lo que permite el posicionamiento con un sólo receptor y una sola
frecuencia.
Derivando respecto del tiempo la primera de las ecuaciones (8.61) y teniendo en cuenta
las (8.57) y (8.48) se tiene:
178
d s* r d ˆs
Lsu * (tur ) u (tu ) f Ds P Pu E s c(Tus Ius ) c( Du Ds )
dtu dt (8.63)
(rus )T (Pˆ s P u ) E s c(Tus Ius ) c( Du Ds )
Donde, como en (8.32), rus es el versor de la línea de vista al satélite s. En general los
cambios en E s , Tus y Ius son muy lentos por lo cual sus derivadas temporales resultan
despreciables o al menos asimilables al error residual de la medida de f Ds . De este
modo, definiendo los vectores velocidad del satélite (calculado con datos de efemérides)
y del receptor como Vˆ s Pˆ s y V P , el modelo de la medición de la de la magnitud
u u
Donde, el residuo s s incluye: los errores de medida de la frecuencia Doppler, las
derivadas temporales E s , T s y I s , el desconocimiento o inestabilidad de la deriva del
u u
*
reloj satelital y las variaciones del efecto de las reflexiones múltiples sobre la fase.
Cabe señalar que para vehículos en movimiento este último efecto tiene carácter
aleatorio. En la práctica los errores residuales s pueden considerarse insesgados con un
valor rms para el término s del orden de 0,03 á 0,08m/seg para la portadora L1, lo que
da a esta medición una gran precisión cuando además de la velocidad v u se estima el
término cDu . Para esto reescribimos la (8.64) para cada satélite visible i=1,…,s como:
ˆi
i f Di (rui )T V (rui )T Vu cDu i ; i 1,..., s (8.65)
Siendo las i funciones conocidas de las mediciones f Di y de los datos de efemérides
ˆ i y el versor r i . Este
de los satélites visibles con los que se calculan las velocidades V u
último es calculado usando la posición del usuario determinada con las medidas de
pseudo-rango. El efecto del error de posicionamiento sobre rui es considerado
despreciable para las distancias nominales de los satélites.
*
Del orden de 10-12 actualmente con expectativas de rápida mejora a mediano plazo.
179
1
ε s (8.67)
s
V ˆ
u
(J T J ) 1 J T υ (8.68)
ˆ
Du
V ˆ Vu
u
E{ } E{(J T J ) 1 J T υ} + (J T J ) 1 JT E{ ε } (8.69)
Dˆ u Du
Sesgo de la estimación
Vu
Q v , Du cov( ) (J T J ) 1 JT cov( ε )J (J T J ) 1 4 x 4
Dˆ u (8.70)
cov( ε ) I; 0,03 - 0,08 m/seg,
2
Una diferencia significativa de las (8.69) respecto de las (8.38) es que en muchos casos
el error residual ε puede considerarse insesgado al igual que la estimación de la
velocidad. La covariancia del error de estimación de la velocidad, dada por la (8.70),
depende de la geometría de la constelación visible del mismo modo que para la
posición, por lo que resultan válidos los mismos coeficientes de dilución de precisión
introducidos en el párrafo 8.4.2.
180
Capítulo 9
Navegación Integrada
Las técnicas de fusión procesan datos provenientes de diversas fuentes para estimar las
variables deseadas. Su interés radica en que mientras más fuentes de información se
dispongan más se reduce la imprecisión de la estimación a la vez que aumenta su
confiabilidad y disponibilidad. La navegación integrada consiste en la aplicación de
estos métodos a la estimación del vector de los parámetros de navegación o estado
cinemático, visto como un proceso continuo modelado por las ecuaciones cinemáticas
(descritas en el capítulo 5) con las magnitudes inerciales como entradas. La información
sobre el proceso está representada por las medidas de las magnitudes inerciales,
usualmente disponibles a una alta tasa de muestreo (o en tiempo continuo), las
mediciones exteroceptivas adquiridas en instantes discretos (no necesariamente
equiespaciados) y la información a priori (antes de las medidas) sobre el estado
cinemático de partida. El carácter estocástico de este proceso se debe a: a) las
perturbaciones en las mediciones, b) la incertezas en las condiciones iniciales y c) las
incertezas y efectos no modelados de los sensores y la gravedad.
181
La metodología expuesta se aplica a diversos casos: a) navegación con ayuda de radar,
b) sistema inercial con baro-altímetro, c) navegación con ayuda de GPS, d) alineación
con posición conocida. Para el caso c) se consideran dos ejemplos prácticos: el primero
usa datos reales adquiridos a bordo de un avión beachcraft B200 y el segundo un vuelo
simulado de un lanzador satelital de tipo Delta IV. En cada caso se estudia la incidencia
de los errores instrumentales y del desconocimiento de las condiciones iniciales.
Donde, pi es el vector de parámetros que agrupa las incertidumbres del modelo de los
instrumentos inerciales y, como se vio en el capítulo 2, ξ es un vector de
perturbaciones estocásticas. Las medidas inerciales se suponen disponibles en los
instantes de muestreo ts, y las medidas exteroceptivas yk en los instantes (no
necesariamente equi-espaciados) tk. Estas últimas se relacionan con el estado cinemático
x k mediante un modelo matemático supuesto conocido*:
y k H k (x k ; p e ) k ; k N (0, R k ) (9.3)
El vector p e agrupa los parámetros inciertos del modelo de la medición y k , la cual se
ve afectada por el vector estocástico, discreto, aditivo, supuesto centrado, gaussiano e
independiente k con matriz de covariancia Rk. El índice k en H k enfatiza el hecho de
*
De ahora en más, cuando convenga a la simplificación de la notación, las variables evaluadas en los
instantes discretos tk serán denotadas: v(tk)=vk.
182
que el sensor exteroceptivo no es necesariamente el mismo en cada instante de
adquisición. Para simplificar la notación se evita indexar al vector pe del instrumento.
y k 2 y k 1 yk
Sistema de
μ (t s ) μ (t s ) μ (t s ) adquisición de
(t)
xk-2 xk-1 xk
x(t)
Proceso
Figura 9.1 Esquema de tiempos del sistema de medidas.
Donde:
x xy xz
σ m yx y yz ; σ m 9 (9.5)
zx zy z
m
b
p m m 12 (9.6)
σ m
*
Formalmente, ecuación diferencial estocástica de Ito (ver Jazwinski, 1970)
183
ζ m mζ m ηm ; ηm N ( ηm , (t )Q, m (t )); ζ m (0) v.a.(0, P, m )
(9.7)
ξ m mζ m n m ; n m N (0, Qm )
Donde (t ) es el "delta” de Dirac y (t )Qζ , m (t ) debe entenderse como una distribución
matricial definida bajo el signo integral que satisface:
t
b
p σ
p i p b 24 (9.11)
f f
σ f
184
p i i
p p e e ξ p (t ); t tk ; p(tk ) p k N {pˆ k , Pp (tk )}
(9.12)
p g g
ξ p (t ) N (0, (t )Q p ); Q p diag (Qi , Q e , Q g )
x(t )
χ (t ) p(t ) (9.13)
ζ (t )
185
Yk {y k , y k 1 , y k 2 ,....} (9.15)
Como es sabido (ver por ejemplo Papoulis, 1991), el estimador óptimo en el sentido
medio-cuadrático del estado aumentado χ (t ) , dadas todas las medias disponibles hasta
dicho instante, es valor esperado condicionado a las mediciones Yk que, en función de la
densidad de probabilidad condicional p (χ (t ) / Yk ) , se escribe:
E χ (t ) / Yk ... χ (t ) p(χ (t ) / Y )dχ k k ; t t k , t k 1 (9.16)
Paso 1 -Predicción:
Dada la densidad de probabilidad condicional a posteriori en un instante tk: p (χ k / Yk ) ,
las ecuaciones a derivadas parciales de difusión hacia delante (o de Fokker-Plank, ver
Papoulis, 1991 o Åström, 1970) permiten, en teoría, determinar la densidad de
probabilidad de transición: p (χ (t ) / χ k ) t tk del proceso estocástico Markoviano
representado por la primera de las Ecs. (9.14). Conocida ésta densidad de transición, se
obtiene, mediante un cálculo de la densidad marginal a priori, la siguiente densidad de
probabilidad condicional:
Paso 2 -Actualización:
Para asegurar el procedimiento recursivo, cuando la nueva medición y k 1 está
disponible, la densidad condicional p(χ k 1 / Yk 1 ) permite actualizar el estimador
óptimo a posteriori.
E χ k 1 / Yk 1 ... χ k 1 p (χ k 1 / Yk 1 )dχ k 1 (9.18)
186
La última igualdad resulta de la condición de markovianidad de χ (t ) . Para el cálculo de
la densidad condicional p(y k 1 / χ k 1 ) se usa el modelo de observación dado por la 2ª de
las Ecs. (9.14) para escribir:
p(y k 1 , ηk 1 / χ k 1 ) p(y k 1 / ηk 1 , χ k 1 ) p ( ηk 1 / χ k 1 )
(9.20)
(y k 1 k 1 (χ k 1 ) ηk 1 ) p( ηk 1 )
p (y k 1 / χ k 1 ) (y k 1 k 1 (χ k 1 ) ηk 1 ) p ( ηk 1 )dηk 1
(9.21)
pk 1 (y k 1 k 1 (χ k 1 ))
p(y k 1 , χ k 1 / Yk ) p (y k 1 / χ k 1 , Yk ) p (χ k 1 / Yk )
(9.22)
p(y k 1 / χ k 1 ) p(χ k 1 / Yk )
187
interés es doble, por un lado, en el caso en que pueda invocarse la gaussianidad de todas
las variables aleatorias, las distribuciones quedan caracterizadas exclusivamente por
estos dos momentos. En tal caso la solución es exacta y equivale al algoritmo óptimo
bayesiano. Por otro, bastan dichos momentos para obtener el mejor estimador lineal
bajo cualquier distribución, que coincide con el óptimo no lineal para el caso gaussiano
(ver Kailath, 1983 o Papuolis, 1991). Ambos métodos heredan lo pasos de predicción y
actualización mencionadas en este párrafo.
χˆ (χˆ , μ(t )); χˆ (tk ) χˆ k χˆ k
(9.25)
yˆ k 1 k 1 (χˆ k 1 ); χˆ k 1 χˆ (tk 1 )
Deberá tenerse en cuenta que la Ec. (9.25) presupone usar, en lugar de la expresión para
μ dada por la (9.2) o la (9.9), su estimación basada en el PEC y el modelo de
calibración de los instrumentos inerciales:
μˆ (μ; pˆ i ) (9.26)
188
χ (t ) χ (t ) χˆ (t )
(9.27)
y k 1 y k 1 yˆ k 1
Donde, los jacobianos y k 1, son evaluados sobre las trayectorias χˆ (t ); μ(t )
t tk , tk 1 . Con el fin de simplificar la notación, de ahora en más se denotará:
k 1 = k 1, (χˆ k 1 )
(t ) = (χˆ (t ), μ(t )) (9.29)
(t ) (χˆ (t ))
E χ k E χ k χˆ k E χ k 0
Pk cov(χ k ) E (χ k E χ k )(χ k E χ k )T (9.30)
E χ k χ k T
Como es fácil demostrar, la linealidad de estas ecuaciones junto con la primera de las
condiciones (9.30) asegura que las desviaciones son tales que E χ (t ) 0;
t tk , tk 1 con lo cual su covariancia coincide con la del predictor χˆ (t ) , en efecto:
189
cov(χ (t )) P (t ) E (χ (t ) E χ (t ))(χ (t ) E χ (t ))T (9.32)
E χ (t )χ (t )T E (χ (t ) χˆ (t ))(χ (t ) χˆ (t ))T
Del mismo modo, la covariancia de la predicción de la medida y k 1 se calcula usando:
el PEC; junto con la (9.31):
Py (k 1) E y k 1y k 1T E (k 1χ k 1 ηk 1 )(k 1χ k 1 ηk 1 )T (9.35)
k 1 E χ k 1χ k 1T kT1 R k 1 k 1S k 1 STk 1kT1
Py (k 1) k 1 E χ k 1χ k 1T kT1 R k 1 (9.36)
Donde el segundo término del segundo miembro debe ser visto como una corrección a
la estimación a priori χˆ k 1 proporcional a la innovación y k 1 . Como puede verse por
ejemplo en Kailath (1983) o tambien Jazwinski (1970), el mejor de los estimadores
lineales es único y satisface la condición de ortogonalidad:
E χ k 1 (y k 1 )T 0 (9.38)
χ k 1 χ k 1 χˆ k 1 χ k 1 K k 1y k 1
190
Sustituyendo en la condición anterior la expresión (9.37) se obtiene:
Py (k 1) E χ k 1yTk 1 K k 1Py (k 1) (9.39)
Py (k 1) E χ k 1yTk 1 Pk1kT1 S k 1 (9.41)
191
9.3.2 Implementación numérica del FKE
Para el cálculo de la ganancia de Kalman (9.42) es necesario calcular previamente la
matriz de covariancia Pk1 solución de la ecuación diferencial matricial lineal (9.33) en
el instante tk+1. Como puede demostrarse por simple sustitución, esta última ecuación
tiene por solución (ver por ejemplo Zadeh/Desoer, 1963):
t
P (t ) (t , tk ) Pk (t , tk )T (t , ) ()Q() ()T (t , )T d (9.46)
tk
(t , ) (t ) (t , ); (, ) I ; t y t , t , t
(9.47)
k k 1
tk ,n tk nTs ; n 0,..., M k
(9.48)
M k Ts tk 1 tk
tk ,n 1
Qk , n 1 (tk , n 1 , ) ()Q() ()T (tk , n 1 , )T d (9.50)
tk , n
escribimos tk ,n , tk ,n 1 :
192
Por su parte, introduciendo las (9.52) en la (9.50) resulta la aproximación:
x(t) Sensores
Vehículo
exteroceptivos.
(t)
Sensores
y (tk )
Inerciales
Hardware μ(t )
Software Modelo de μˆ (t ) +
INS Modelo de los -
calibración. sensores exter.
xˆ a(xˆ , pˆ g ) B(xˆ )μˆ yˆ ( t k )
μˆ (μ; pˆ i ) yˆ H k ( xˆ , pˆ e ) xˆ k ,n
pˆ i (t k ) pˆ g (t k )
pˆ e (tk )
x (t k ), pˆ g (t k ) p e (tk )
p i (tk )
y (t k )
Algoritmo FKE Pk ,n
1. Inicialización
Las condiciones iniciales del algoritmo en el instante tk corresponden a la mejor
estimación disponible del vector de estado extendido en dicho instante junto con su
matriz de covariancia.
pˆ i (tk )
xˆ k
χˆ k ; pˆ k pˆ e (tk ) ; Pk (9.54)
pˆ k pˆ g (tk )
193
2. Propagación de la estimación a priori del estado cinemático
El estado cinemático xˆ k , n es propagado en los instantes tk,n, n=1,…,Mk, aplicando el
PEC y usando la versión determinista de la ecuación cinemática (9.1) integrada
numéricamente mediante alguno de los algoritmos descritos en el Capítulo 7.
Esta operación esta representada por el bloque INS en la Fig. 9.2 cuya entrada es el
vector de medidas inerciales corregido con el modelo de calibración determinista (9.26):
μˆ (t ) (μ(t ); pˆ i (tk )); t tk , tk 1 (9.56)
xˆ k , n , junto con su matriz de covariancia teórica Pk ,n , constituyen las salida del sistema
de navegación entregadas a la tasa 1/Ts.
4. Cálculo de la innovación
a) En el instante tk,Mk= tk+Ts, se adquiere la nueva medida exteroceptiva y k 1 .
b) Con la estimación a priori del estado en tk+1 calculada en el punto 2), se evalúa
el modelo del sensor exteroceptivo activo en ese instante para obtener yˆ k 1 (2ª
de las Ecs. (9.25)).
c) Se calcula la innovación: y k 1 y k 1 yˆ k 1 .
194
7. Cálculo de la corrección del estado a posteriori de la medida
Usando la Ec. (9.37) se corrige la predicción para obtener la nueva estimación a
posteriori del estado ampliado: χˆ k 1 . Este valor deviene la condición inicial del nuevo
ciclo que se reinicia en 1). Debe destacarse que en este paso no sólo se actualiza el
estado cinemático sino también el vector de los parámetros de los instrumentos y del
modelo de gravedad (ver líneas punteadas en la Fig. 9.2).
Pv
d dE
d d N
a
dU dU
N
Pa
E
dE dN
2 2
dH
Fig. 9.3: Navegación integrada radar/inercial
195
dE
d d N Cea (Pve Pae ) Cea Ceg Pvg Paa
a
(9.58)
dU
p i b b 6
b
(9.60)
f
g E
x(t ) g
χ (t ) ; x V ; π N ;
15 9
(9.61)
b(t ) π h
Donde, se usó la definición de la desviación del estado cinemático dada por la Ec. (6.65)
del Ejemplo 6.1 del Capítulo 6.
*
Se recomienda al lector extender este ejemplo al caso en que se desconozcan otros paramentros de los
modelos de calibración, de la gravedad o de las mediciones externas.
196
x F g (x (t ))x B g (t )(b ξ b ) ;
Φ ΦV Φ Cbg 0
(9.62)
F (x (t )) V
g
VV V 99 ; B g (t ) 0 Cbg 96
0 ΠV Π 0 0
De este modo, tenienedo en cuenta que en la ecuación general para el estado aumentado
(9.14): p b , =0 y =0 resulta finalmente:
F g (t ) B g (t ) 1515
B g (t ) 0 1512
(t ) ; (t ) (9.63)
0 0 0 I
Modelo de la innovación.
El modelo no lineal del sensor externo (correspondiente a la Ec. (9.25)) lo constituyen
las Ecs. (9.57) y (9.59). A partir de esas ecuaciones procedemos a calcular el jacobiano
k , para cada instante tk, definido mediante las Ecs. (9.29) con lo cual se formula el
modelo de las innovaciones (9.31):
y k 1 k 1χ k 1 ηk 1 (9.64)
Donde, de acuerdo con la definición del estado aumentado (9.61), la matriz k tiene la
forma:
d , , d , ,
y k yˆ k y k d a k Cea (Ceg Pvg ) k (9.66)
d E d N dU ˆ k
d E d N dU ˆ k
N U
Pv
Elipsoide normal
o ( 2 )
Rn hv
Usando los valores calculados por el sistema de navegación expresamos: Pˆ vg (Ceg Pvg )
(ver Fig. 9.4).
197
0
Pˆ vg ( Rn hˆ) o( 2 ) (9.67)
1 o( 2 )
ˆ e P g
(Ceg Pvg ) Ceg Pˆ vg C (9.68)
g v
0 0
P h o( 2 ) 0
v
g
(9.69)
1 o( 2 ) h
como:
0
ˆe 0 C
(Ceg Pvg ) C ˆ e (θg P g )
g g v
h
(9.70)
( Rn h) N 0 ( Rn h) 0
ˆ e ( R h) E C
C ˆe ( R h) 0 0 π
g n g n
h
0 0 1
Con
0 ( Rn h) 0
d , , Aˆe
C , k A A A Ce C g ( Rn h) 0 0 (9.72)
d E d N dU
0 0 1
A partir de las Ecs. (9.57) se determinan las filas del jacobiano en la Ec. (9.72):
d 1 1
d EA d NA dUA sen() sen( ) sen()cos () cos ()
d d N dU d
A
E
A A
d
1
sen()cos ( ) sen()cos () cos ( ) (9.73)
d d N dU d
A
E
A A
sen( ) /(dcos()) cos( ) /(dcos ()) 0
d d NA dUA
A
E
198
Finalmente C,k en (9.72) resulta:
Satélite i
Pˆ i
R iu
Ri
rui Antena
GPS
Pue
ri l
UMI
Pe Al centro de coordenadas
Figura 9.5.
199
Se elije como terna de referencia o de navegación la ECEF por ser la referencia estándar
en general de los sistemas GNSS.
x(t ) φe
χ (t ) pi (t ) ; x e V e 9 ; (9.75)
p e (t ) P e
Expresamos el término bilineal en los vectores (σ m , m ) de la Ec. (9.4): σ m m según
la siguiente forma equivalente:
L(m)σ m σ m m; L(m) 39 , σ m 33 (9.76)
De este modo, a partir del modelo de calibración (9.4)/(9.9), se obtienen las siguientes
expresiones de los errores en las mediciones inerciales:
ωbib b L(ω)σ
b b L(f )σ ξ B pi (μ)pi ξ
f f f
(9.77)
I L(ω) 0 0
B pi (μ)
0 0 I L ( f )
Donde:
Rui R ui Pˆ i Pue
(9.79)
ˆi
Rui rui (Pˆ i P ue ) rui (V Vue )
200
desconocimiento o inestabilidad de la deriva del reloj satelital y las variaciones en el
error sobre la fase de las reflexiones múltiples (ver párrafo 8.6).
Se supondrá que en los instantes tk se obtienen s pares de mediciones independientes
dados por la Ec. (9.78):
i (t )
y i (tk ) ui k ; i 1,..., s (9.80)
u (tk )
El modelo de las mediciones (9.80) es función del vector p e que agrupa el conjunto de
parámetros inciertos en las Ecs. (9.78):
T
p e tu Du sp1 sp s s 2 (9.81)
tu Du (9.82)
R iu Pˆ i (P e Cbe l b ) (9.83)
Modelo de la innovación.
A partir de las Ecs. (9.78), establecemos las innovaciones para las mediciones GPS (ver
Ecs. (9.27),(9.28))
201
i r iT R iu sp i ctu i
y i (tk ) (9.84)
i i ˆ i Rui cDu i
ˆ e l b P e S(C
R iu P e Cbe l b P e S( e )C ˆ e l b ) e (9.85)
b b
En la cual se tuvo en cuenta que l es conocido sin error y además Pˆ i 0 dado que los
errores de efemérides (o de posicionamiento) del satélite i ya fueron incluidos en el
término spi. Así, la desviación del pseudo rango resulta:
ˆ e l b ) e ) ct sp i
i riT (P e S (C b u i
(9.86)
ˆ e l b ) 0 rT xe 0 p c 0 1 p
riT S(C b i i (i ) e i
i r i r i R
Rui R i (9.87)
u u
i Pˆ i V b b
ˆ e (ω
ˆ e C e ˆe b
R u b ib l ) S (Ω )Cb l (9.88)
i V e Ce (ω b b ˆe
R u b ib l ) Cb (ω ib l ) S (Ω )Cb l
b b e e b
ˆ e (ω b b e ˆe b ˆe b
V e S( e )C b ib l ) S (Ω )S ( )Cb l Cb S (l )ω ib
e b
b b e (9.89)
V e S(Cˆ e (ω ˆe b e ˆe b
ib l )) S (Ω )S (Cb l ) Cb S (l )ω ib
e b
b
ˆ e (ωb b ˆe b e ˆe b
V e S(C b ib l )) S (Ω )S (Cb l ) Cb S (l )ω ib
e b
Por otra parte, de la definición del versor r i R ui / Rui junto con la (9.85) resulta:
ˆ e l b ) e
r i ( Rui ) 1 (1 r i r iT )R ui ( Rui ) 1 (1 r i r iT ) P e S(C b (9.90)
202
iT (1 r i r iT ) P e S(C
Rui ( Rui ) 1 R ˆ e l b ) e
u b
b b
r iT V e S(C ˆ e (ω ˆe b e ˆe b
ib l )) S (Ω )S (Cb l ) Cb S (l )ω ib
e b
b
(9.91)
iT (1 r i r iT )S(C
( Rui ) 1 R ˆ e l b ) r iT S(C ˆ e (ωb b ˆ e b e
ib l )) S (Ω )S (Cb l )
e
u b b
iT e
iT (1 r i r iT )P e r iT C ˆ e S(l b )ωb
r V ( R i ) 1 Ru u b ib
iT i iT ˆe iT ˆe b b ˆe b
R u (1 r r )S (l ) / Ru r [S (Cb (ω ib l )) S (Ω )S (Cb l )]
i i e
c
i T (1 r i r iT ) / R i x e r T C b
ˆ e S(l b ) I L(ω
i c
i
r iT R u u i b
ib ) 0 0 p i (9.92)
0 c 0 p e i
b
Donde se usó: ω ˆ eω
ˆ eeb C b ib Ω
e
y lˆe C
ˆ e l b . Nótese que, gracias a los términos
b
ˆ e e ˆ
S(l ) l y S(l )ω l ω , el brazo de palanca hace que las magnitudes
e e b b b b
ib ib
i sean sensibles a las componentes del error de actitud e y del error giroscópico
ωbib ortogonales al vector l. Dicha sensibilidad se ve habilitada por las velocidades
lineal y angular: Ri y ωˆ eeb . Este hecho ofrece a esta configuración un gran potencial
u
El modelo de las innovaciones de ambas medidas del receptor GPS en relación a cada
satélite i y para cada instante tk, se resume en las siguientes ecuaciones:
i (tk )
y i (tk ) ki χ k Cix , k Cpi i ,k Cpi e, k χ k ηk ; i 1,..., s
i (tk ) (9.93)
ηik N (0, R ik );
Donde, con base en las Eqs. (9.86) y (9.92) las sub-matrices de ki son:
203
riT S( l e ) 0 riT
C i
i iT (1 r r ) / R
x ,k
c r R i
u
T i iT i
u
0 0 0 0
Cpi i ,k T ˆ e b T ˆ e b b (9.94)
ri Cb S(l ) ri Cb S(l ) L(ωib ) 0 0
c 0 0 1(i ) 0
Cpi e ,k
0 c 0 0
S(Ωe ) 0 0 C ˆe 0
b
e
ˆ e fˆ b ) 2 S (Ωe ) γ e / P e
x e S (C x 0 ˆ e (B p ξ )
C (9.95)
b e P Pˆ e b pi i
0 I 0 0 0
3
t Du tu
u
Du Du tu N (0, (t )Qtu )
p e sp1 s1 ; Du N (0, (t )Q Du ) (9.97)
si N (0, (t )Q si )
sp s ss
Es un sencillo ejercicio que se deja al lector demostrar que a partir de las (9.95) a (9.97)
se obtienen tanto la matriz de la dinámica del error del vector de estado aumentado
(t ) como la matriz (t ) de las Ecs. (9.29). Mismas que luego serán usadas para el
diseño del FKE.
204
9.5.1 Arquitectura del sistema
El sistema está compuesto por una UMI Systron Donner/Motion Pack (SD) estabilizada
en temperatura, un magnetómetro vectorial True North Rev. 2X, un receptor de GPS y
una computadora de navegación del tipo PC-104 con sistema operativo RTLinux. Por el
momento el magnetómetro es usado solamente para estimar el rumbo (yaw) inicial del
avión, pero se prevé en un futuro próximo integrar sus medidas al sistema de
navegación lo cual redundará en una mejor estimación del azimut, principalmente
durante las fases de adquisición de imágenes durante las cuales el vuelo es recto y
nivelado. La computadora adquiere, valida y almacena la información que recibe de los
sensores. La aplicación no requiere de la navegación en tiempo real. Los datos son
simplemente almacenados en vuelo y “navegados” a posteriori para alimentar el
algoritmo de generación de las imágenes del SAR.
Una vez por segundo el receptor GPS envía a la PC el mensaje de navegación (a través
un puerto RS232) y el “pulso por segundo” (PPS) cuyo flanco ascendente indica el
inicio del segundo en el tiempo GPS. Del mensaje se extraen para cada satélite visible:
su efemérides y correcciones del tiempo, su pseudo rango y delta-pseudo-rango así
como el número del segundo asociado al próximo pulso PPS. Este número lo recibe el
módulo de tiempo real que maneja el sincronismo con una cola FIFO de tiempo real.
El flanco ascendente del PPS interrumpe al RTLinux para ejecutar la función de lectura
del tiempo de la PC y almacenarlo junto al valor del segundo GPS ya almacenado en la
FIFO previamente generando así un archivo de texto a dos columnas que permite la
sincronización de los datos de los distintos sensores.
Las figuras 9.6 y 9.7 muestran la trayectoria del avión calculadas por el sistema de
navegación. Una ampliación de los datos representados en la figura 9.6 permitiría
observar que el avión luego de aterrizar en la misma pista de despegue se aparta de ella
en dirección hacia el hangar.
La Fig. 9.8 muestra la evolución de la orientación del vehículo durante el vuelo según
sus ángulos yaw, pitch y roll. Las variaciones positivas y negativas del pitch coinciden
205
con los períodos de ascenso y descenso del avión en la Fig. 9.7 mientras que los
cambios en roll se traducen en giros o cambios en yaw. Este último parámetro se
representa entre +180º y -180º.
Fig. 9.6: Trayectoria sobre el plano tangente local, posición de partida en el origen.
206
Fig. 9.9: Desvío estándar del error de estimación en posición.
Las Figs. 9.9 y 9.10 muestran que los desvíos estándar del error en longitud, latitud y
altura calculados por el FKE decrecen rápidamente y en los primeros segundos alcanzan
valores asintóticos cercanos a los 2,5m. Este nivel de precisión es propio de la
navegación integrada fuertemente acoplada y no podría lograrse con posiciones y
velocidades obtenidas únicamente con el servicio de posicionamiento estándar (SPS)
del GPS. Los desvíos estándar en velocidad no son mostrados por razones de espacio
aunque exhiben un perfil similar al de la posición con un valor asintótico de 0.06 m/s.
La Fig 9.11 muestra la evolución del desvío estándar del error de orientación del avión
desde el reposo hasta que inicia el ascenso. Se observa como los errores esperados en
pitch y roll decrecen rápidamente gracias a la información provista por los
acelerómetros horizontales aun con el avión casi en reposo. Sin embargo, dado que los
giróscopos utilizados no pueden medir la velocidad angular de la Tierra, el error en yaw
crece mientras el avión está en reposo sobre la pista (velocidad nula).
Cuando el avión empieza a moverse (a los 45seg) el GPS provee la información que
mejora la estimación del rumbo del avión. Por la misma razón, el error en yaw decrece
abruptamente a partir de los 175seg durante la aceleración del carreteo para terminar en
valores pequeños durante y después del despegue (ver FIg. 9.11). Esto efecto, debido a
la mejora notable en la observabilidad de los parámetros de navegación durante las
aceleraciones lineales es utilizado en lugar de los largos procedimientos de alineación
especialmente con giróscopos sin resolución suficiente como para medir la velocidad
angular de la Tierra.
207
Fig. 9.11: Desvíos del error de estimación de orientación
durante los primeros segundos de vuelo.
La Fig. 9.12 muestra, en una escala ampliada, los desvíos teóricos calculados por FKE
en vuelo. Se observa que en los tramos de vuelo rectilíneo, los desvíos en roll y pitch
alcanzan un piso de 0.01°. Sin embargo, justamente durante estos tramos tiende a crecer
el desvío en azimut aunque en todo momento se mantiene entre 0.05º-0.1°.
En lo que sigue se ilustra un método para verificar que las estadísticas provistas por el
FKE son consistentes con valores calculados. Para esto se comparan las correcciones
x(tk) sobre el estado cinemático calculadas mediante la Ec. (9.37) (ver Fig. 9.2),
calculadas una vez por segundo a partir de mediciones de pseudo rango y delta pseudo
208
rango, con los intervalos de confianza teóricos del 95% (1,96) determinados con las
covariancias también calculadas por el FKE.
Los resultados se muestran en las Figs. 9.13 y 9.14, respectivamente, para las
correcciones en latitud, altura y ángulos pitch y yaw. No se incluyen los gráficos de
longitud y roll que se asemejan a los de latitud y pitch. En todos los casos se constata
que el intervalo de confianza es eficaz para las muestras medidas por lo que se pudo
concluir que tanto la parametrización de los sensores inerciales como el funcionamiento
del algoritmo son satisfactorios. Así mismo se observó que las estimaciones de pi y pe
convergen, lo que apoya la hipótesis de consistencia del modelo propuesto para los
instrumentos.
209
9.5.3 Conclusiones
Un análisis preliminar muestra que la estructura de los modelos elegidos tiene la
complejidad suficiente para la aplicación. Los resultados de navegación indicaron que la
precisión alcanzada satisface los requerimientos de navegación para la adquisición de
imágenes SAR y también de otros remotos aerotransportados (ver España et all., 2006).
En particular cumple con las máximas exigencias para posición y ángulos pitch y roll.
210
Apéndice A
Modelo del Potencial
Gravitacional Terrestre
V ( P) 4G( P) (A.1)
V ( P) 0 (A.2)
a
V ( P) V ( P) (A.3)
GM T
1 2 V 1 V 1 2V
r cos c 0 (A.4)
r 2 r r r 2 cos c c c r 2 cos 2 c 2
V (r , c , ) R(r )Y ( c , ); r a , (A.5)
211
1 2 R
r K (A.6)
R r r
1 Y 1 2Y
cos c Y cos 2 2 K
(A.7)
Y cos c c c c
r ( n 1)
R (r ) n ; 0n (A.8)
r
Veremos más adelante que n debe ser un entero positivo. Dado que las soluciones rn
contemplan efectos de masa a grandes distancias exteriores al volumen de cualquier
esfera de radio finito, el modelo gravitacional debido exclusivamente a la masa terrestre
sólo incluye soluciones del tipo r-(n+1).
Por otra parte, las soluciones Y(c, de (A.7) pueden obtenerse separando nuevamente
la solución en factores de tal modo que sustituyendo Y(c,=F(c)L() en (A.7) e
introduciendo una nueva constante de separación M se obtiene, por un lado, la ecuación
para la función de la longitud:
2 L
ML 0 (A.9)
2
1 F M
cos c n(n 1) cos 2 F 0 (A.10)
cos c c c c
dG dG ( c ( x))
cos( c )
d c dx
212
2 F m2
(1 x ) n(n 1) F 0 (A.12)
x x 1 x2
(1 x 2 ) m / 2 d n m 2
F ( x) Pn ,m ( x) n nm
( x 1) n ; n m 0 (A.13)
2 n ! dx
1 dn 2
Pn ,0 ( x) Pn ( x) n n
( x 1) n (A.14)
2 n ! dx
Pn ,m ( x) (1) n m Pn ,m ( x) (A.15)
(n m)!
Pn ,( m ) ( x) (1) m Pn ,m ( x) (A.16)
(n m)!
Pn , m (1) 0; m 0
(A.17)
Pn (1) (1) n
Relaciones de recurrencia:
213
Pn ( x) (2n 1) Pn ( x),
(A.19)
2(2n 1)(n m)!
Pn ,m ( x) Pn ,m ( x)
(n m)!
Es posible demostrar que los polinomios de Legendre normalizados conforman una base
ortonormal del espacio de Hilbert L2[-1,1] y que las funciones generalizadas de
Legendre son ortonormales en [-1,1], es decir:
1
Pn ,m , Pl ,m Pn,m ( x) Pl ,m ( x)dx n,l ; n, l m
1
(A.20)
De las definiciones (A.13), (A.14) y (A.19) resultan las primeras funciones de Legendre
normalizadas para x=sen():
214
n,m , k ,l n , m (, )k ,l (, )ds
S1
2 /2
d
0 / 2
n ,m (, )k ,l (, )cos()d 4n,k m,l
n,m , k ,l 0; n, m, k , l
n
Y ( c , ) Cn , m n,m ( c , ) S n , m n,m ( c , ) (A.25)
n 0 m0
1 1
4
Cn , m Y , n , m Y (, )n , m (, )ds
4 S1
(A.26)
1 1
4
Sn,m Y , n , m Y (, )n ,m (, )ds
4 S1
En particular para m=0 y según las Ecs. (A.19) se tiene " n0:
1
4
Cn ,0 Y (, ) Pn ( sen())ds
S1 (A.27)
S n ,0 0
215
solución del llamado problema de Dirichlet y resulta de las (A.25), (A.5) y la 1ª de las
(A.8):
n 1 n
a
V (r , c , ) C
n ,m n,m ( c , ) Sn ,m n,m ( c , ) (A.28)
n0 r m0
En efecto: en primer lugar, la serie (A.28) es claramente convergente para ra dado que
su mayorante (A.25) lo es; en segundo lugar, V (r , c , ) cumple la condición de borde:
V (r , c , ) r a Y ( c , ) y en tercer lugar, de acuerdo con (A.5) y la primera de las
(A.8), cada término de la serie convergente (A.28) satisface la ecuación (A.4) la cual,
dada la linealidad del operador laplaciano, también es satisfecha por V (r , c , ) (y por
V (r , c , ) ).
GM T
V (r , c , ) V (r , c , )
a
GM T a n n
n ,0 n
C P (sen c ) Pn,m (sen c ) Cn , m cos(m ) S n , m sen(m )
r n 0 r m 1
(A.29)
n
1 r
Cn , m
(2n 1) M T n ,m (, )dm
Tierra
a
n
(A.30)
1 r
Sn,m
(2n 1) M T n ,m (, )dm
Tierra
a
216
0,0 1; 0,0 0, r 1,0 0
r 1,0 (, ) 3rsen() 3z
r 1,1 (, ) 3r cos () cos() 3x
(A.31)
r 1,1 (, ) 3r cos ()sen() 3 y
r 2 2,1 (, ) 15r 2 cos ()sen() cos() 15 zx
r 2 2,1 (, ) 15r 2 cos ()sen()sen() 15 zy
De las anteriores resulta en primer lugar que A0,0 1 y además que los siguientes
momentos de 1º orden son nulos cuando el centro de coordenadas coincide con el centro
de masa de la Tierra
1 1 1
C1,0
3aM T
zdm;
Tierra
C1,1
3aM T
xdm;
Tierra
S1,1
3aM T
ydm
Tierra
(A.32)
Por otra parte, dado que el eje z nominal de la Tierra coincide con el eje que maximiza
su momento de inercia respecto de él, los siguientes momentos cruzados también son
nulos.
3 1 3 1
C2,1
5 MT zxdm; S
Tierra
2,1
5 MT zydm
Tierra
(A.33)
V ( r , c , )
n
GM T
a n
n,0 n
1 C P (sen( c )) Pn,m (sen c ) Cn ,m cos(m) Sn ,m sen(m)
r n2 r m2
(A.34)
217
Apéndice B
Matriz Jacobiana
de la Aproximación J2
3 J 2 a 2 15 J 2 a 2
(1 2
2
( z / r )2 ) x
2r 2r x
GM T 3J 2 a 15 J 2 a 2
2
2
eJ 2 γ gJ 2 (P ) γ c (P ) 3 (1
e e e e
(z / r) ) y y
2
(B.1)
r 2r 2 2r 2
2 2
0
(1 3 J 2 a 15 J 2 a ( z / r ) 2 ) z
2r 2 2r 2
J J 2 (P e ) γ eJ 2 / P e γ egJ 2 / P e γ ce / P e J g (P e ) J c (P e ) (B.2)
Con:
1 0 0
J c ( x, y, z ) 0 1 0
2
(B.3)
0 0 0
1 3x 2 3J 2 a 2 5 x 2 15 J 2 a 2 z 2 7 x2
J g (1,1) 1 (1 ) (1 )
r3 r2 2r 2 r2 2r 4 r 2
1 3 y 2 3J a 2 5 y 2 15 J 2 a 2 z 2 7 y2
J g (2, 2) 3 1 2 2 2 (1 2 ) (1 )
r r 2r r 2r 4 r 2
1 3z 2 9 J a 2 5 z 2 15 J 2 a 2 z 2 7z2
J g (3,3) 3 1 2 2 2 (1 2 ) (3 )
r r 2r r 2r 4 r 2
1 3 xy 15 J 2 a 2 xy 105 J 2 a 2 xyz 2
J g (1, 2) 3 2 (B.4)
r r 2r 4 2r 6
1 3 xz 15 J 2 a 2 xz 15 J 2 a 2 xz 7z2
J g (1,3) 3 2 (2 )
r r 2r 4 2r 4 r 2
1 3xy 15 J 2 a 2 xy 105 J 2 a 2 xyz 2
J g (2,1) 3 2
r r 2r 4 2r 6
1 3 yz 15 J 2 a 2 yz 15 J 2 a 2 yz 7z2
J g (2,3) 3 2 (2 )
r r 2r 4 2r 4 r 2
218
1 3xz 45 J 2 a 2 xz 105 J 2 a 2 xz 3
J g (3,1) r 2 2r 4
r3 2r 6
(B.5)
1 3 yz 45 J 2 a 2 yz 105 J 2 a 2 yz 3
J g (3, 2) 3 2
r r 2r 4 2r 6
219
Apéndice C
Momentos de 1º y 2º orden
de un Proceso Estocástico Continuo Lineal
Sea un proceso markoviano que responde al siguiente modelo de estado lineal variante
en el tiempo para tt0:
t
Entre las (C.1) y (C.4) escribimos el modelo del proceso incremental χ χ χˆ según:
Por su parte, para la matriz de covariancia del proceso (C.1) se expresa como:
220
Para evaluar el último término de la ecuación anterior, partimos de la solución general
del sistema (C.5):
t
χ (t ) Φ(t , t0 )χ (t0 ) Φ(t , )G ()ξ ()d
t0 (C.8)
(t , t ) F (t )Φ(t , t ); Φ(t , t ) I
Φ 0 0 0 0
Dada la independencia entre ξ (t ) y χ (t0 ) y usando las (C.8) y la definición del delta de
Dirac tiene:
t
G (t ) E ξ (t )χ (t )T G (t ) E ξ (t )ξ ()T G ()T Φ(t , )T d
t0
t
G (t ) (t )Q(t )G ()T Φ(t , )T d
t0
(C.9)
t t
G (t ) (t )Q(t )d G (t )T G (t ) (t )Q(t )d G (t )T
t0
1 1
G (t ) (t )Q(t )d G (t )T G (t )Q(t )G (t )T
2 2
221
Referencias
Anderson, S. R. & R.B. Flint, 1959; “The CAA Doppler omnirange”; Proceedings of the
IRE, 47, May.
Andrieu Ch., A. Doucet, S. Singh, V. B. Tadic, 2004; “Particle Methods for Change
Detection, System Identification and Control”; IEEE Proc., Vol. 92, No. 3, March.
Arfken G.B., H.J. Weber, (1995), Mathematical Methods for Physicists, Academic
Press, Ca., USA.
Åström K. J., 1970, Introduction to Stochastic Control Theory, Academic Press, 1970.
222
Boyce, W. E., R.C. Diprima, 1997, “Elementary Differential Equations and Boundary
Value Problems”, VI ed., John Wiley & Sons, Inc.
Bucy R., P. Joseph, 1987, Filtering for Stochastic Processes With Applications to
Guidance. Chalsea, Pub. Co. NY.
Butcher J. C., 2003, “Numerical methods for ordinary differential equation”, John
Wiley and Sons, 2ª Ed..
Chung D., Park C. G. & Lee J. G., 1996, “Observability Analysis of Strapdown Inertial
Navigation System Using Lyapunov Transformation”, Proceedings of the 35th
Conference on Decision and Control Kobe, Japan, December.
Enge P., T. Walter, S. Pullen, Ch. Kee, Yi-Ch. Chao, Y.-J. Tsai, 1996; “Wide Area
Augmentation of the Global Positioning System” Proc. IEEE, Vol. 84, No. 8, Aug.
Farrell, Jay; Barth, Matthew, “The global positioning system and inertial navigation”,
McGraw-Hill, New York. Gabrielson T.B., 1993, “Mechanical-thermal noise in
micromachined acoustic and vibration sensors” IEEE Tr. Electron Devices, Vol. 40,
May.
Geen J.A., S.J. Sherman, J.F. Chang and S.R. Lewi, 2002s, “Single-chip surface
micromachining integrated gyroscope with 50 deg/hour root Allan variance”, IEEE
Journal of Solid-State Circuits, Vol. 37, No. 12, December 2002.
Geiger W., B. Folkmer, J. Merz, H. Sandmaier, W. Lang, 1998, “A new silicon rate
gyroscope,” Proc. IEEE Micro Electro Mechanical Systems Workshop (MEMS’98),
Heidelberg, Germany, Feb.
Giribet J. I, España M., Miranda C. ,2007; “Synthetic Data for Validation of Navigation
Systems,” Acta Astronautica, Vol. 60, N. 2, pp 88-95.
Gold, R. “Optimal Binary Sequences for Spread Spectrum Multiplexing”, 1967; IEEE
Trans. Inform. Theory, vol. IT-13, pp.619-621, Oct.
223
Goodwin, G. C., Stefan F. G. y Salgado M. E., 2001; Control System Design; Prentice
Hall.
Grewal M. S., L. R. Weill, A. P., Andrews 2007. “Global Positioning Systems, Inertial
Navigation and Integration”, John Wiley & Sons. Inc., New Jersey, EEUU.
Hein G., J. Godet, J.-L. Issler, J. Martin, P. Erhard, R. Lucas-Rodriguez and T. Pratt,
2002; “Status of Galileo frequency and signal design”, Proc. of IONGPS, Portland,
USA.
Hsu Y. D., “An Accurate and Efficient Approximation to Normal Gravity” 1998,
Position Location and Navigation Symposium, IEEE, 20-23 April.
Hyder A. K, Shahbazian E., Waltz E., 2003, “Multisensor Fusion” Proceedings of the
NATO Advanced Research Workshop on Multisensor Data Fusion, Springer.
IEEE Std. 1554, 2005, Recommended Practice for Inertial Sensor Test Equipment,
Instrumentation, Data Acquisition, and Analysis, Integrated Sensors, microactuators &
Microsystems (MEMS); 1998 Número especial de los Proceedings of the IEEE, Vol. 86,
nº 8, Aug.
Jazwinski, A.H., 1970, “Stochastic Processes and Filtering Theory”. Academic Press,
New York.
Jekeli, C.,· Lee J. K., Kwon, J. H., 2007, Modeling errors in upward continuation for
INS gravity compensation, J. Geod. Vol. 81, pp: 297–309,
Jekeli, C., 1997, The effect of Earth’s gravity on precise, short-term, 3-D free-inertial
navigation. Navigation Vol. 44 (3) pp:347–357.
Jiang Y and Lin Y , 1992, “Error estimation of INS ground alignment through
observability analysis”, IEEE Trans. Aerosp. Electron. Syst. 28 92–6.
224
Jordan, J. W., 1969, “An Accurate Strapdown Direction Cosine Algorithm” NASA
TND- 5384, Sept.
Kailath T. , 1983, “Lectures on Winner and Kalman Filters”, Courses and Lectures No.
140, Spinger, NY, 2nd Ed.
Kautsky, J. and N.K. Nichols, 1985, "Robust Pole Assignment in Linear State
Feedback," Int. J. Control, 41, pp. 1129-1155.
Kayton M., W. R. Fried, 1997; “Avionics Navigation Systems”, 2nd Ed., John Wiley &
Sons.
Kuo, B., 1995, “Automatic Control Systems, 7th edition, Prentice Hall
Kwok C., D. Fox, M. Meil,2004; “Real-Time Particle Filters”; IEEE Proc., Vol. 92,
No. 3, March.
Laning J. H.,1949, The vector analysis of finite rotations and angles”; MIT,
Cambridge, Special Report, 6398-S-3, 1949.
Laub, A.J. and M. Wette, 1984, Algorithms and Software for Pole Assignment and
Observers, UCRL-15646 Rev. 1, EE Dept., Univ. of Calif., Santa Barbara, CA, Sept..
Le Traon, O.; Janiaud, D.; Lecorre, B.; Pernice, M.; Muller, S.; Tridera, J.-Y., 2005;
“Monolithic Differential Vibrating Beam Accelerometer Within An Isolating System
Between The Two Resonators”; IEEE-Sensors, Oct..
Luo R. C. ,Y. Ch. Chou, O. Chen; 2007; “Multisensor Fusion and Integration:
Algorithms, Applications, and Future Research Directions”, Proceedings of the 2007
IEEE International Conference on Mechatronics and Automation, Harbin, China, Aug.
Lutz M., W. Golderer, J. Gerstenmeier & D. Schubert, 1997; “A precision yaw rate
sensor in sillicon micromachining,” Tech Dig 9th Intl. Conf. Solid State Sensors and
Actuators (Transducers ’97), Chicago, IL:847-850; June.
225
and Dynamics, Vol. 6, No. 4,. Misra, P., P. Enge, 2006; “Global Positioning System.
Signal Measurements and Performance”, Ganga-Jamuna Press, 2nd Edit.
Parkinson B. W. and J. J. Spilker, editors, 1996; “The global positioning system: theory
and applications”; American Institute of Aeronautics and Astronautics, Vols. I y II.
Pullen S. and P. Enge, 2004; “A Civil User Perspective on Near-Term and Long-Term
GPS Modernization”; Proceedings of GPS/GNSS Symp. 2004, Tokyo, Japan,
November 17-19.
Sanders, S., Strandjord, L. and Mead, D., 2002; “Fiber-Optic Gyro Technology Trends
– A Honeywell Perspective”, Invited Paper, 15th Optical Fiber Sensors Conference
Technical Digest, Vol. 1, pp. 5-8.
Savage P. G., 1998; “Strapdown Inertial Navigation Integration Algorithm Design Part
1: Attitude Algorithms”;· Journal of Guidance, Control and Dynamics, Vol 21, No 1,
Jan.
Savage P. G., 1998 “Strapdown Inertial Navigation Integration Algorithm Design Part
2: Velocity and Position Algorithms”; Journal of Guidance, Control and Dynamics,Vol
21, No. 2, Mar.
226
Subramanian H. V. K. Varadan, V. V. Varadan and M. J. Vellekoop, 1997; “Design and
Fabrication of Wireless Remotely Readable MEMS Based Microaccelerometers”;
Smart Mater. Struct. 6 730-738.
Teunissen P.J.G., P.J. de Jonge and C.C.J.M. Tiberius, 1995; “The Lambda-Method For
Fast GPS Surveying” Proceedings of International Symposium “GPS technology
applications”, Bucharest, Romania, September 26-29, pp. 203-210.
Teunissen P.J.G., 1994; “A new method for fast carrier phase ambiguity estimation.”
Proceedings IEEE Position, Location and Navigation Symposium PLANS '94, Las
Vegas, NV, April 11-15, pp. 562-573.
Titterton D. H., and J. Weston, 2004, “Strapdown Inertial Navigation Technology”, IEE
& AIAA, 2nd Edition.
Titterton D.H. & J.L. Weston, 1997, “Strap Down Inertial Navigation Technology”,
Peter Peregrinus Ltd., IEE, Londres.
Toran-Marti F. and J. V. Traveset, 2004; “The ESA EGNOS Project: The First Step of
the European Contribution to the Global Navigation Satellite System (GNSS)”;
Navigare Conference, Winterthur (Switzerland), June.
Van Der Merwe R. ,2004; “Sigma-Point Kalman Filters for Probabilistic Inference in
Dynamic State-Space Models” Ph.D Thesis, School of Science & Engineering at
Oregon Health & Science University, April.
Wahr, J., 1999, Geodesy and Gravity, Zamisdat Press (FTP: zamisdat.mines.edu).
Wei, M., & Schwarz, K. P. , 1990; “A strapdown inertial algorithm using an earth-fixed
cartesian frame”. Navigation: Journal of the Institute of Navigation, 37(2), 153–167.
Wertz James R., (Editor); 1978; “Spacecraft Attitude Determination and Control”;
Kluwer Academic Publishers, Holanda.
World Geodetic System 1984, 2004; National Imagery Agency (NIMA) Technical
Report Nº TR8350-2 actualizado en junio.
227
Yazdi N., F.Ayazi & K. Najafi; 1998; “Micromachined Inertial Sensors”; IEEE, Proc.,
Vol. 86, No. 8, Ag.
Yinger C. H., W. A. Feess, V. Nuth, R.N. Haddad, 2003; “GPS Accuracy vs. Number of
NIMA Stations”, Proceedings of ION GPS Sept. 9-12.
Zadeh, L. A.; Desoer, Ch. A., 1963; Linear System Theory-The State Space Approach;
McGraw-Hill Book Co., N. York.
228