Вы находитесь на странице: 1из 238

Fundamentos de la Navegación

Integrada
Martín España

2010

AADECA
Asociación Argentina de Control Automático
ISBN 978-950-99994-7-3
ii
Índice

Capítulo 1: Introducción 1
1.1 Sistemas de referencias 2
1.2 Clasificación de los métodos de navegación 3
1.2.1 Métodos de extrapolación 3
1.2.2 Métodos de referenciamiento absoluto 3
Radionavegación 4
Navegación Celeste 5
Navegación con mapa 6
1.3 Navegación Inercial 6
1.3.1 Navegación inercial con plataforma estabilizada 8
Bloqueo de gimbal 11
1.3.2 Navegación inercial con instrumentos fijos al vehículo (strapdown) 11
Propagación de errores en la navegación inercial strapdown 12
1.4 Navegación multisensor o integrada 14

Capítulo 2: Instrumentos Inerciales 17


2.1 Acelerómetros 18
2.1.1 Acelerómetros realimentados de péndulo 20
2.1.2 Acelerómetros micromaquinados MEMS 20
2.2 Giróscopos 22
2.2.1 Giróscopos rotatorios 23
2.2.2 Giróscopos vibratorios 24
Giróscopo de diapasón 25
Giróscopo de disco oscilante 26
Giróscopo de anillo vibratorio 26
2.2.3 Giróscopos ópticos 28
Giróscopos de láser en anillo (RLG) 29
Giróscopos interferométricos de fibra óptica (IFOG) 30
2.3 Unidades de medidas inerciales (UMI) 31
2.3.1 Modelo matemático de una UMI 32
2.3.2 Caracterización de las perturbaciones estocásticas 33
Ruido blanco contínuo 34
Ruido “markoviano” 34
Movimiento browniano 34
Superposición de perturbaciones estocásticas 35
2.4 Performance y categorías de los instrumentos inerciales 36

Capítulo 3: Cinemática de la Orientación de un Cuerpo en el Espacio 39


3.1 Parametrizaciones de la orientación de un cuerpo en el espacio 39
3.1.1 Rotaciones alrededor un punto 40
3.1.2 Matriz de cosenos directores (MCD) 43
3.1.3 Angulo vectorial de rotación o eje y ángulo de Euler 45
Rotaciones alrededor de un eje de dirección invariante 45
Relación con la MCD 46

iii
Teorema de Euler 48
3.1.4 Espacio vectorial de pequeñas rotaciones y diferencial de una MCD 48
Interpretación geométrica 50
3.1.5 Rotaciones alrededor de los ejes coordenados: Ángulos de Euler 50
Relación entre los ángulos de Euler y la MCD 51
3.1.6 Parámetros simétricos de Euler o cuaterniones 53
Relación entre cuaterniones y MCD 54
Representación hipercompleja y álgebra de cuaterniones 55
Transformación de vectores de 3 mediante cuaterniones 56
Relación entre cuaterniones y ángulos de Euler 57
Diferencial de cuaterniones 58
3.2 Ecuaciones cinemáticas de la orientación 59
3.2.1 Ecuación cinemática de la MCD 59
3.2.2 Ecuación cinemática del cuaternión de orientación 60
3.2.3 Ecuación cinemática del ángulo vectorial de rotación: Ecuación del
“coneo” 61
3.2.4 Ecuación cinemática de los ángulos de Euler 63

Capítulo 4: Geometría de la Tierra, Ternas de Referencia y Gravedad 65


4.1 Geometría de la Tierra 66
4.1.1 El Geoide y Otras Superficies de Referencia 66
4.1.2 Geometría del Elipsoide Normal 68
4.2 Ternas de referencia 70
4.2.1 Terna Centrada Terrestre (ECEF) y terna Inercial Centrada Terrestre (ECI)
70
4.2.2 Terna Vertical Geocéntrica Local (LGCV) 72
4.2.3 Terna Vertical Geodésica Local (LGV) 73
4.2.4 Terna Vertical Astronómica Local (LAV) 76
4.2.5 Ternas del cuerpo y de los instrumentos 77
4.3 Modelos Globales de Gravitación y Gravedad 78
4.4 Aproximaciones del Potencial Gravitacional Terrestre 81
4.4.1 Gravedad Normal 82
Gravedad normal en coordenadas terrestres (ECEF) 84
Aproximación J2 85
4.4.2 Perturbaciones de la Gravedad 86

Capítulo 5: Ecuaciones Cinemáticas y Ecuaciones de Navegación 89


5.1 Ecuaciones de Navegación en Coordenadas ECI 90
5.2 Ecuaciones de Navegación en Coordenadas ECEF 92
5.3 Ecuaciones de Navegación en Coordenadas LGV 95
5.3.1 Rotación por transporte 97
5.4 Dinámica Inestable de las Ecuaciones de Navegación 101
5.4.1 Filtro Estabilizador del Canal Vertical 102

Capítulo 6: Modelo y Dinámica de los Errores de las Ecuaciones de


Navegación 106
Dinámica de las pequeñas perturbaciones 107
6.1 Dinámica del error angular de orientación del vehículo 108
6.2 Dinámica del error de navegación en coordenadas ECI 109

iv
6.3 Dinámica del error de navegación en coordenadas ECEF 110
6.4 Dinámica del error de las ecuaciones de navegación en coordenadas LGV 111
6.4.1 Error angular de posición en terna LGV 111
Geometría del error angular de posición 112
6.4.2 Error de orientación o error angular de plataforma 114
Geometría del error angular de plataforma 114
6.4.3 Relación entre los errores de posición y de plataforma: error angular
inercial 116
Geometría del error angular inercial 117
6.4.4 Propagación del error de velocidad 117
Diferencial de la rotación por transporte 117
Diferencial de la gravedad 118
6.4.5 Ecuaciones generales de la dinámica del error en terna LGV 119
6.5 Ejemplos de ecuaciones de errores y aplicaciones 120
Ejemplo 6.1: Ecuaciones del error en coordenadas geográficas. 120
Ejemplo 6.2: Error de navegación en terna {g} para un vehículo en
reposo sobre la Tierra. 122
Ejemplo 6.3: Autoalineación de un vehículo estacionario sobre la Tierra.
125

Capítulo 7: Algoritmos de Navegación Inercial 130


7.1 Integración numérica de las ecuaciones de navegación en terna LGV 131
7.1.1 Notación 132
7.1.2 Integración numérica de las ecuaciones de orientación 134
Cálculo de Cnn (( kk ) 1) 135
Cálculo del ángulo kb, j: j 1 135
7.1.3 Integración numérica de las ecuaciones de traslación 140
Algoritmo digital de la actualización de la posición 140
Algoritmo digital de la actualización de la velocidad 141
Cálculo de los términos de gravedad y Coriolis 142
Cálculo del término de la fuerza específica 142
7.2 Integración numérica de las ecuaciones de navegación en terna ECEF 146
7.2.1 Integración de las ecuaciones de orientación 147
7.2.2 Integración de las ecuaciones de traslación 147
Cálculo del término de la gravedad 149
Cálculo del término de la fuerza específica. 149
7.3 Comparación entre los algoritmos en ternas LGV y ECEF 150

Capítulo 8: Navegación Satelital Global 152


8.1 Arquitectura de los sistemas GNSS 153
8.1.1 El segmento espacial 153
8.1.2 El segmento terreno 156
8.2 Características de la señal GPS 158
8.3 El receptor GPS 160
8.3.1 Adquisición de la señal 162
8.3.2 Sintonía y rastreo de la señal 162
8.3.3 Demodulación del tren de bit de datos 163
8.3.4 Contenido del mensaje GPS 164
Estructura de la trama del mensaje GPS 165

v
8.3.5 Mediciones de un receptor GPS 165
Efectos atmosféricos 166
8.4 Medición del pseudo-rango con código 168
8.4.1 Posicionamiento estándar con un receptor GPS 169
8.4.2 Precisión del posicionamiento estándar 172
Fuentes y presupuesto de errores en la medición de código 173
8.5 Modelo de la fase Doppler 174
8.5.1 Relación entre la medida de la fase Doppler y la distancia al satélite 177
Comparación entre las mediciones de pseudo-rango y fase 178
8.6 Medida del Doppler y Estimación de la Velocidad 178
8.6.1 Precisión de la estimación de la velocidad. 180

Capítulo 9: Navegación Integrada 181


9.1 Formulación del problema 182
9.1.1 Descripción del sistema de medida 183
9.1.2 Estado aumentado del sistema de navegación 184
9.2 Estimación óptima Bayesiana del estado aumentado 185
Paso 1 –Predicción 186
Paso 2 –Actualización 186
9.3 Filtro de Kalman extendido (FKE) 188
9.3.1 Predicción: Propagación del estimador a priori 188
9.3.2 Actualización: Regresor lineal óptimo 190
9.3.3 Implementación numérica del FKE 192
9.4 Ejemplos de aplicación de la Navegación Integrada 195
9.4.1 Instrumentación inercial integrada con datos de radar 195
Modelo del sensor exteroceptivo 196
Ecuación de las desviaciones 196
Modelo de la innovación 197
9.4.2 Instrumentación inercial integrada con GPS 199
Desviación del estado aumentado 200
Modelo de los sensores exteroceptivos 200
Modelo de la innovación 201
Ecuación de las desviaciones 204
9.5 Desarrollo y validación de un sistema de navegación para un avión 204
9.5.1 Arquitectura del sistema 204
9.5.2 Resultados experimentales 205
9.5.3 Conclusiones 210

Apéndice A: Modelo del Potencial Gravitacional Terrestre 211


A.1 Propiedades de las funciones asociadas de Legendre 213
A.2 Funciones Armónicas Esféricas 214
A.3 El Potencial Gravitacional 215

Apéndice B: Matriz Jacobiana de la Aproximación J2 218

Apéndice C: Momentos de 1º y 2º orden de un Proceso Estocástico


Continuo Lineal 220

Referencias 222

vi
Prólogo

La rápida expansión del campo de aplicación de la navegación ha ido de la mano del


acelerado avance de las tecnologías de integración masiva de componentes electrónicos
y unidades de cómputo, juntamente con el desarrollo de actuadores y sensores
miniaturizados en tecnología MEMS (Micro Electro Mechanical Systems). En la
actualidad, las aplicaciones abarcan campos tan diversos como la microcirugía, la
neuro-navegación, los vehículos autónomos (aéreos, terrestres y subacuaticos), las
misiones espaciales o los servicios basados en la localización del usuario. Es posible
afirmar que las funciones de casi cualquier dispositivo portátil o diseñado para
desplazarse en el espacio (autónomamente o no) son susceptibles de ser mejoradas,
ampliadas o automatizadas gracias a la inclusión de un sistema de navegación en alguna
de sus variantes. Esto incluye teléfonos celulares, herramientas y sensores a bordo de un
móvil en cualquier medioambiente La navegación autónoma, habilitada mayormente
por estas nuevas tecnologías, ha abierto a su vez nuevas fronteras y líneas de
investigación relativas el diseño de sistemas cooperativos conformados por conjuntos de
entidades dinámicas independientes que comparten información y objetivos comunes.
Ejemplos de estos sistemas son los grupos de robots en celdas de manufactura, las
flotillas de vehículos en misiones de rescate y los arreglos reconfigurables de
microsatélites en vuelo coordinado. Este último concepto es sin duda una de las ideas
más novedosas formuladas por la industria espacial del presente siglo y seguro
impactará decisivamente en las nuevas tecnologías de observación de la Tierra desde el
espacio. En particular, motiva actualmente enormes esfuerzos de desarrollo de nuevos
diseños de radares espaciales tanto para las aplicaciones de observación SAR (Synthetic
Aperture Radar) como de supervisión.

Fruto de la alta integración y miniaturización de los circuitos digitales son los sistemas
embebidos basados, ya sea, en las clásicas tarjetas PC/104 para los sistemas con
requerimientos de mayor flexibilidad funcional o, para aquellos orientados a
aplicaciones específicas, en tecnologías como los SoC (System on a Chip), FPGA (Field
Programmable Gate Arrays) o ASIC (Application Specific Integrated Circuit). En todos
los casos el resultado es una gran capacidad de cómputo y comunicaciones disponibles a
bordo de un móvil. Una consecuencia importante de esta nueva realidad es la
posibilidad de implementar poderosos algoritmos numéricos que estiman, con una alta
tasa de salida de datos, simultáneamente los parámetros de navegación y las
imprecisiones instrumentales. Esto se realiza usando una variada gama de instrumentos
cuyos datos son procesados ni bien están disponibles y no necesariamente en forma
sincrónica. Estos algoritmos, llamados de navegación integrada, emplean métodos de
fusión de datos con origen en la teoría del filtrado no lineal de procesos estocásticos.
Los algoritmos más utilizados constituyen extensiones del Filtro de Kalman ya sea en
sus versiones analíticas, i.e.: EKF (Extended Kalman Filter) y LKF (Linearized Kalman
Filter) o Bayesianas, i.e: SPKF (Sigma Point Kalman Filter) y UKF (Unscented
Kalman Filter). La principal ventaja de estas técnicas es que, se benefician de la
diversidad de fuentes de información instrumental para reducir la incertidumbre de los
estimados. De este modo, la certidumbre resultante resulta siempre mejor que la mejor

vii
de todas provista por cada instrumento tomado individualmente. Esto hace posible por
un lado, utilizar instrumentos que proveen sólo información parcial del estado de
navegación y por otro reducir las exigencias de calidad y precisión de cada instrumento
en particular. Dado que, tanto el costo como el volumen de los instrumentos crecen
rápidamente con la precisión requerida, la complementación de instrumentos,
posibilitada por los nuevos algoritmos, hace de estos últimos el sustrato natural del
software embebido usado en los nuevos y ubicuos sistemas de navegación, expandiendo
y reforzando aún más su campo de aplicaciones.

Por lo dicho anteriormente, los nuevos resultados de la teoría de fusión de datos se


potencian sinérgicamente con los avances tecnológicos en instrumentación y
computación. Esto confiere a la disciplina un dinamismo particular y gran interés en
muchos laboratorios de investigación. Frente a esta realidad caracterizada por la
innovación, el presente volumen busca exponer, lo más rigurosamente posible, los
fundamentos conceptuales en los que se basa la actividad entendiendo que de este modo
el lector podrá beneficiarse de un material que le permitirá comprender, desarrollar o
anticipar nuevas tendencias.

La navegación integrada es un ejemplo claro de interdisciplinariedad que toca a un


mosaico de tecnologías y métodos matemáticos de los cuales, la mayoría de los textos
actuales exponen aspectos parciales. Así, para abarcar la diversidad inherente a esta
tecnología el investigador y el tecnólogo se ven obligados a recorrer una extensa
bibliografía. Dadas las necesidades de nuestro medio en el cual el desarrollo de esta
tecnología es aun incipiente la obra ofrece, a quienes deseen iniciarse en el tema, un
punto de partida único y coherente que abarca la diversidad de aspectos que conducen a
la comprensión y al diseño de los sistemas de navegación actuales.

La obra expone rigurosamente los fundamentos matemáticos de los métodos modernos


de la navegación integrada entendiendo que sólo la comprensión cabal de éstos
permitirá a ingenieros y tecnólogos desarrollar nuevos sistemas de navegación y al
investigador innovar en el tema. Dichos fundamentos incluyen las tecnologías actuales
de los instrumentos de navegación, los sistemas de navegación satelital global junto con
los modelos matemáticos de sus mediciones, los métodos numéricos de integración de
las ecuaciones diferenciales cinemáticas, la representación de la orientación de un
cuerpo, las transformaciones de coordenadas entre distintos sistemas de referencia, la
modelización del campo geo-gravitatorio y la descripción matemática de los métodos de
fusión de datos.

Más de 10 años de experiencia en la materia se reflejan en aportes metodológicos,


puntos de vista novedosos y descripción de aplicaciones en cuyo desarrollo participé en
forma directa. Dicha experiencia estuvo vinculada al diseño y desarrollo de unidades de
navegación para la Comisión Nacional de Actividades Espaciales y a mi labor como
profesor de la asignatura que dicto desde 2006 en el Departamento de Investigación y
Doctorado de la Facultad de Ingeniería de la UBA.

El libro consta de 9 capítulos. En el Capítulo 1 se define el concepto de navegación y se


clasifican los métodos clásicos según la instrumentación utilizada. Se introducen
conceptos como navegación inercial, navegación strapdown y navegación integrada que
luego serán abordados en detalle en el resto del volumen. En el Capítulo 2 se enuncian
los principios físicos y principales tecnologías empleadas en los instrumentos inerciales

viii
actuales y se formula la estructura del modelo matemático de una unidad de medidas
inerciales. El Capítulo 3 estudia las diversas representaciones de la orientación de un
cuerpo en el espacio y formula las ecuaciones diferenciales (cinemáticas) que describen
su evolución en el tiempo. El Capítulo 4 introduce los sistemas de coordenadas usuales
junto con los elementos de geodesia requeridos en la disciplina. En particular, se
justifican los distintos modelos del campo geo-gravitacional utilizados según el tipo de
aplicación. En el Capítulo 5 se deducen las ecuaciones de navegación para las ternas de
navegación usuales. El Capítulo 6 estudia la dinámica de propagación de los errores de
las ecuaciones de navegación. En el Capítulo 7 se describen los algoritmos de
navegación inercial de tipo strapdown en tiempo real para las ternas ECEF y LGV. El
Capitulo 8 presenta los sistemas de Navegación Satelital Global (GNSS) operativos o en
curso de serlo y se concentra en la descripción de las señales, los servicios y los
observables del sistema GPS. En el Capitulo 9 se describen los métodos de fusíón de
datos usados en la navegación integrada y se exponen ejemplos de aplicación.
Finalmente, en el Apéndice A se deduce la expansión en armónicos esféricos del campo
gravitatorio terrestre usado, principalmente, en aplicaciones espaciales.

Es mi deseo expresar un muy especial agradecimiento a Juan Ignacio Giribet y a Juan


Carrizo, ambos de la Facultad de Ingeniería de la UBA, por su valiosa participación en
diversos desarrollos compartidos. Su generosa disposición en numerosas y valiosísimas
charlas contribuyó significativamente a la concreción y depuración de esta obra. Vaya
también un agradecimiento genérico a los estudiantes de mi materia que esforzadamente
asimilan, critican y aplican los conceptos de esta obra logrando finalmente convencerme
del interés de los mismos.

Finalmente, quiero dejar sentado mi reconocimiento a la CONAE, institución que me


cobijó y estimuló con sus ambiciosos proyectos y desafíos a ingresar en este
apasionante campo de la tecnología moderna.

Martín España
Abril 2010

ix
x
Capítulo 1
Introducción

Es costumbre denominar “parámetros de navegación” al conjunto de valores numéricos


que describen la posición, la velocidad y la orientación de un vehículo respecto de un
dado sistema de referencia y en unas dadas unidades. Con base en esta denominación,
definimos navegación como “el arte y la ciencia que permiten determinar los
parámetros de navegación de un vehículo con información disponible a bordo del
mismo.”

Desde tiempos remotos, motivados por sus desplazamientos sobre la tierra o el mar, los
seres humanos han utilizado diversas técnicas de navegación. Algunas permiten
determinar el valor absoluto de los parámetros de navegación del vehículo (o del
individuo) gracias a mediciones referidas a cuerpos exteriores al mismo, por ejemplo,
los objetos cercanos en la navegación “a vista”, los astros de posición conocida en el
firmamento*, el campo geomagnético local que, mediante una aguja imantada, permite
determinar el rumbo respecto del norte magnético (técnica utilizada antiguamente en
China, en Europa y en algunas civilizaciones mesoamericanas). Otras técnicas se basan
en la medición de la velocidad de variación de los parámetros de navegación, lo que
requiere conocer sus valores iniciales en un punto de partida. En este caso, los nuevos
parámetros de navegación son determinados por “extrapolación” integrando la
velocidad de cambio. Este procedimiento, tradicionalmente usado en la navegación
marina, es conocido en inglés con el nombre de “dead-reckoning” en alusión al método
de medir la velocidad de un barco respecto de un cuerpo muerto supuestamente inmóvil
sobre la superficie del agua. Similarmente, en aeronavegación se utiliza la medición de
la velocidad respecto del aire exterior obtenida mediante tubos de Pitot. La medición de
la velocidad combinada con el conocimiento del rumbo magnético permite estimar la
posición por extrapolación desde una posición conocida anterior.

Una limitación de los métodos de extrapolación clásicos es la dependencia de sus


mediciones respecto de un medio (aire o agua) que no solamente es usualmente
perturbado por corrientes o vientos sino que además sus propiedades físicas cambiantes
(temperatura, la presión, la humedad, etc.) alteran la estabilidad de la medición ya se de
la velocidad o de la aceleración. Durante el siglo XX se desarrollaron instrumentos
inerciales que permiten medir, a bordo del vehículo, su aceleración y velocidad angular
respecto de un sistema inercial (sistema fijo respeto de las estrellas) en forma estable e
independientemente de las condiciones ambientales. Esta ventaja motivó una gran
difusión de estos instrumentos, en particular, en las aplicaciones a la aeronavegación y
al desarrollo de cohetes. Sin embargo, como veremos, toda técnica de extrapolación
conlleva una propagación de errores en los parámetros de navegación de magnitud
creciente polinomialmente con el tiempo. Por esta razón y como veremos mas adelante,
esta técnica es usualmente combinada con sistemas de medición absoluta de los
parámetros de navegación.

*
Esto incentivó la invención de astrolabios a partir del siglo XV y más tarde sextantes y cronómetros.

1
Las limitaciones inherentes a todas las técnicas de extrapolación han hecho que la
navegación inercial pura sea cada vez menos utilizada en nuestros días, exceptuando
aplicaciones en las que se requiere de una autonomía total del vehículo o que deba
asegurarse inmunidad a fallas y a posibles interferencias exteriores. Ejemplos de
aplicaciones en las que está vedada toda información exterior al vehículo son los
submarinos en misiones íntegramente debajo del agua o los misiles balísticos
intercontinentales. La aviación civil es, por su parte, un ejemplo de aplicación de la
navegación que combina regularmente ambas tecnologías. Los métodos de
referenciación absoluta mas utilizados en aeronavegación son radio señales
provenientes de estaciones en Tierra (sistemas VOR, NDB, ILS, etc. Kayton/Fried,
1997) o en el espacio (sistemas satelitales de navegación global como el GPS). A pesar
de esto, ningún avión prescinde de información inercial ya sea para complementar la no
inercial o como fuente de información redundante en prevención de fallas.

1.1 Sistemas de referencias

Un sistema de referencia es una terna de 3 vectores ortogonales con base en un punto


origen que permite definir las coordenadas en que son representados los parámetros de
navegación. Para poder expresar sus resultados, todo sistema de navegación requiere
utilizar una o más ternas de referencia en sus distintas fases de cómputo. En el Capítulo
3 se presentarán en forma detallada las ternas de referencia usuales y las
transformaciones de coordenadas que las vinculan, mientras tanto mencionamos algunas
que son de interés a los fines de la presente introducción.

zi ze e Plano tangente local


al elipsoide normal.
Vertical
U geodésica
Meridiano de N
Greenwich. E
P ·
 g
yg z
xg
 ye
Ejes fijos resp.
CM
de las estrellas. i yi
x 
 et Ecuador
xe
Figura 1.1: Ternas de referencia.

Las ternas: ECEF (Earth Centered Earth Fixed) y ECI (Earth Centered Inertial) cuyos
ejes, respectivamente, (xe, ye, ze) y (xi, yi, zi) son indicados en la Figura 1.1, comparten
su origen en el centro de masa de la Tierra (CM) y el eje zezi que coincide, a su vez,
con el eje de rotación terrestre. Los otros dos ejes están contenidos en el plano
ecuatorial. En el caso de la ECEF estos ejes son solidarios a la Tierra mientras que en la
terna ECI permanecen inmóviles en el espacio inercial (o como suele decirse respecto
de las “estrellas fijas”). La terna ECEF, regularmente utilizada en navegación en las
cercanías de la Tierra, ha sido adoptada por los Sistemas Satelitales de Navegación

2
Global (GNSS) tales como GPS, GLONASS y GALILEO a los que dedicaremos el
capítulo 8. Por su parte, la terna ECI tiene, desde un punto de vista matemático, el
interés de que, en este caso, las ecuaciones de Newton adoptan la forma más simple
posible. En cambio, para una referencia no inercial (p.e. la ECEF) las ecuaciones se
obtienen mediante transformaciones de las ecuaciones en ECI que, como se verá en
detalle en al Capítulo 4, incluyen términos originados en las aceleraciones aparentes de
Coriolis o centrípeta.

En transportes intra-atmosféricos (aéreos, marinos o terrestres) es usual utilizar una


terna centrada en el CM cuyo eje z sea ortogonal al plano tangente local al elipsoide
normal (ver definición en el Capítulo 3) denominada terna de la vertical geodésica local
o LGV (Local Geodetic Vertical) . Un caso particular es la terna geográfica, denotada
con el superíndice “g” en la Figura 1.1, cuyos ejes (xg, yg, zg) son paralelos,
respectivamente, a las direcciones Este, Norte y Arriba (Up) locales.

1.2 Clasificación de los métodos de navegación

Los métodos de navegación son tan variados como los principios físicos que permiten
medir o calcular los parámetros de navegación o como los sistemas de referencias
respecto de los cuales éstos están referidos. A grandes rasgos y como fuera sugerido en
la introducción de este capítulo, pueden distinguirse dos grandes clases: los métodos de
extrapolación y los métodos de referenciamiento absoluto (véase también la
clasificación propuesta por Kayton/Fried, 1997):

1.2.1 Métodos de extrapolación


Utilizan mediciones de las derivadas temporales (velocidades y aceleraciones lineales o
angulares) o de variaciones relativas de los parámetros de navegación respecto de un
valor anterior. Los valores absolutos de los parámetros de navegación son obtenidos
mediante integración o acumulación de las mediciones a partir de un valor inicial. Los
instrumentos típicos son: sensores inerciales, odómetros, codificadores rotatorios,
sensores de velocidad del aire, etc. y son denominados intraceptivos por no depender de
una referencia exterior. En los sistemas que utilizan el efecto Doppler (electromagnético
o acústico) para medir la velocidad, la posición también se determina por extrapolación
y por lo tanto quedan incluidos en este grupo.

Como en este caso los parámetros de navegación se obtienen por integración de las
mediciones, los errores en las mediciones y/o en las condiciones iniciales inducen
errores de navegación que crecen polinomialmente con el tiempo. Por esta razón para
trayectorias prolongadas estos métodos requieren ser actualizados con mediciones
absolutas de la posición o la orientación. A pesar de estas limitaciones, tienen el interés
de ser independientes de referentes exteriores al vehículo y la ventaja de disponer de
información en forma casi continua o a una alta tasa de muestreo.

1.2.2 Métodos de referenciamiento absoluto


Utilizan sensores que miden directamente los parámetros de navegación (i.e.:
coordenadas de posición, velocidad u orientación) respecto de un dado sistema de
referencia mediante la detección e identificación de señales u objetos exteriores al
vehículo. Por esta razón se los denomina genéricamente exoceptivos. Cuando el
parámetro medido es directamente la posición del móvil respecto de algún hito
conocido, situación frecuente en robótica móvil (Siegwart/Nourbakhsh, 2004), es más

3
usado el nombre de auto-localización. Contrariamente a los sensores intraceptivos, las
mediciones exteroceptivas suelen ser adquiridas en instantes discretos y no siempre en
tiempo real. Se destacan en este grupo los sistemas que utilizan los siguientes
principios, algunos de los cuales son desarrollados más abajo:

 Radionavegación.
 Navegación celeste.
 Navegación con mapa.
 Rebote de señal (sonar, radar, lidar).
 Navegación por imágenes (visión/reconocimiento de formas)
 Sensores de distancia (explorador laser).

Radionavegación
Se basan en una red de estaciones radiotrasmisoras de referencia fijas a la Tierra o
montadas sobre plataformas móviles (espaciales, terrestres, marinas o aéreas). Los
instrumentos/receptores a bordo del vehículo detectan las señales emitidas y calculan su
posición relativa respecto de las estaciones emisoras de referencia. El desplazamiento
en la frecuencia de la portadora de la señal debido al efecto Doppler permite medir su
velocidad radial respecto de las estaciones emisoras. Los sistemas de radionavegación
terrestre más usados en aeronavegación son los NDB (Non-Directional Beacons) o
radiofaros no direccionales, los VOR (VHF-Omnidirectional Range) y los DME
(Distance Measurement Equipment) (Kayton/Fried, 1997). Los dos primeros miden la
dirección que une al vehículo con la fuente emisora y el último la distancia a un punto
de referencia. El primero es el más antiguo en vigencia y consiste en una red de
emisores polarizados verticalmente con portadora de entre 200 y 1600KHz. Mediante el
principio “goniométrico” el receptor detecta las direcciones de procedencia de la señal
de dos o más emisores con las que calcula la posición del vehículo. Entre las ventajas de
los NDB para la aeronavegación figuran su bajo costo de mantenimiento, la posibilidad
de delegar la responsabilidad de la precisión al usuario y el hecho de que la propagación
inherentemente “terrestre” extiende su alcance más allá de la curvatura del horizonte.
Sus principales limitaciones son la orografía local y el efecto de las reflexiones
ionosféricas a estas frecuencias. Los VOR son ciertamente los más difundidos en la
aeronavegación comercial. Su estándar adoptado por la OACI (Organización de la
Aviación Civil Internacional) consiste de una portadora de entre 108 y 118 MHz. En
esta banda, la reflexión ionosférica es casi inexistente y la propagación en línea recta
evita la interferencia entre estaciones más allá del horizonte. Contrariamente a los NDB,
la señal transportada por la portadora VOR provee directamente la información de la
dirección de procedencia lo que simplifica las funciones del receptor (Hurley et all.,
1951). Una considerable mejora tecnológica introducida en la segunda generación de
esta tecnología es la denominada Doppler VOR (Anderson/Flint, 1959) que permite
reducir la imprecisión del ángulo de procedencia de 2,8º a 0,4º.

El DME es un sistema “activo” basado en la medición del tiempo de respuesta de una


estación de referencia a una interrogación emitida por el vehículo. El tiempo de ida y
regreso de la señal es medido con el reloj del receptor por lo que no es necesaria
ninguna sincronización entre relojes. Inclusive la estabilidad del reloj no es crítica en el
método vistas las cortas diferencias de tiempos involucradas. Es usual que estos equipos
estén ubicados en estaciones VOR (VOR/DME) de modo que la combinación de ambos
permite medir en forma absoluta el radio y la dirección a dicha estación. En el ámbito
militar las funciones VOR/DME están integradas en los sistemas conocidos como Tacan

4
(Tactical Air Navigation) con una portadora única en el rango 960-1215 MHz, lo que
permite antenas de mayor portabilidad.

Desde un punto de vista conceptual es posible medir “pasivamente” (con señales


unidireccionales) los tiempos de propagación a un receptor desde los emisores de
referencia de una red “estampando” el instante de emisión en la propia señal emitida y
luego comparar a éste con el tiempo de recepción en el receptor. Esto requiere, sin
embargo, de una alta sincronía y estabilidad de todos los relojes involucrados. Las
importantes mejoras en la precisión y la estabilidad de la medición del tiempo
alcanzadas a partir de los años 70´s mediante relojes atómicos (con estabilidad de largo
plazo del orden de 1 parte en 1013) dieron un impulso decisivo a estas técnicas.

La superación del requerimiento de que el receptor del usuario cuente con un reloj de
alta estabilidad y, más aún, sincronizado con los otros relojes de la red sobreviene
gracias a la introducción del concepto de medición de “pseudo-rangos”. Este concepto
consiste en disponer y utilizar un número redundante de mediciones de distancias (4 en
R3 ó 3 en R2) a los elementos de la red de referencia todas afectadas por el mismo sesgo
del reloj del receptor y a partir de ellas determinar, simultáneamente, las coordenadas de
la posición y el sesgo horario. Este método es utilizado en nuestros días por los más
ubicuos sistemas de radionavegación: los GNSS entre los que se cuentan el sistema GPS
(EEUU), el GLONASS (Rusia) y el futuro GALILEO (UE). La gran ventaja de los
sistemas GNSS es que permiten, en todo instante y bajo cualquier condición
atmosférica, posicionar un receptor ubicado en cualquier punto interior a la constelación
de satélites de referencia con un error acotado. El seguimiento de la fase de cada
portadora por parte del receptor hace posible además medir la velocidad radial de éste
respecto de cada satélite (medición conocida como “Doppler” o delta-pseudo-rango”) y
aún obtener, mediante técnicas interferométricas, posicionamientos relativos con
precisión de centímetros o medir directamente los parámetros de la orientación de un
receptor multi-antena. Estas metodologías son la base de los más modernos sistemas de
navegación de alta precisión y algunas de ellas serán discutidas en el Capítulo 8.

Navegación Celeste
El fundamento de la navegación celeste es la medición de la elevación y azimut de uno
o más cuerpos celestes de referencia. Esta medición combinada con la del tiempo y la
predicción del movimiento relativo de los astros permitió desde tiempos remotos
posicionar en latitud y longitud a un observador sobre la Tierra. Modernamente, algunos
de estos sistemas utilizan catálogos de estrellas junto con relojes de alta precisión y
algoritmos de reconocimiento de patrones estelares para determinar la latitud, la
longitud y la orientación de vehículos espaciales o aéreos de gran altura. Estos
instrumentos utilizados en combinación con una plataforma inercial estabilizada
permiten actualizar periódicamente la orientación de ésta última evitando la
acumulación de los errores por integración ya referida en el párrafo 1.3.3.

En la configuración “star tracker” un sensor estelar (usualmente un telescopio con


campo de visión angosto enfocando su imagen sobre una placa CCD) sigue una o más
estrellas mediante comandos ejercidos sobre los ejes de su suspensión cardánica
montada sobre una plataforma inercial. Su posición angular provee así directamente la
información absoluta de la orientación inercial de la plataforma al menos según dos
ángulos (p.e. azimut y elevación). Como veremos, esta información exterior (no-
inercial) comparada con la provista por instrumentos inerciales y procesada por un filtro

5
estocástico de fusión de datos puede ser usada para restimar los parámetros de
navegación y aun recalibrar los instrumentos inerciales durante el curso de la
navegación. Estos esquemas de navegación integrados son introducidos brevemente
más abajo en el párrafo 1.4 de este Capítulo y serán tratados en más en detalle en el
Capítulo 9.

Navegación con mapa


También llamada “por ajuste de mapas”, esta técnica consiste en producir un mapa local
del medioambiente del vehículo usando sensores montados sobre el mismo tales como:
cámaras, sonar, radar, laser, etc. que detectan hitos, referencias externas o morfologías
preestablecidas. El mapa local es comparado con un mapa global de la región accesible
al vehículo previamente codificado en una base de datos almacenada en la memoria de
la computadora de navegación. El sistema de navegación “ajusta” el mapa local dentro
del mapa global y cuando lo logra determina la posición global y la orientación del
vehículo. El ajuste del mapa puede resultar extremadamente demandante en recursos
computacionales si estuviese basado exclusivamente en la búsqueda exhaustiva dentro
del mapa global. Para reducir esta búsqueda se apela a métodos de filtrado no lineal que
combinan información de otras fuentes tales como instrumentos inerciales. Schon et al.
(2006) describen aplicaciones de la teoría de filtros bayesianos de partículas a la
navegación con mapa de vehículos submarinos, aéreos y terrestres. Los desafíos de
estos métodos son las exigencias impuestas a los sensores y a los algoritmos de
detección para evitar ambigüedades que confundan la localización.

Un campo de aplicación en creciente expansión de esta técnica son los robots móviles
en ambientes interiores tales como ambientes industriales, comercios, almacenes, etc.,
en los que se aprovecha la estructura conocida del entorno y la buena definición de los
sensores ambientales en cortas distancias. Ciertos algoritmos le permiten a la
computadora del robot explorar y aprender el mapa medioambiental cuando éste se
modifica (Masson, 2003).

Una técnica usada en aeronavegación es la conocida como navegación con ayuda de


terreno que utiliza modelos digitales de elevación almacenados en la memoria de la
computadora de navegación. Estos modelos son correlacionados con los perfiles
altimétricos adquiridos en vuelo mediante un radar o lidar. Un algoritmo selecciona el
perfil que maximiza la correlación y de este modo estima la desviación de la trayectoria
en la dirección transversal al paso nominal. Con esta información se corrigen los
parámetros de navegación y/o se recalibran los instrumentos inerciales. Bergman et al.
(1997) proponen como solución el uso de un estimador bayesiano óptimo combinando
un modelo digital de terreno con un radar y un baroaltímetro.

1.3 Navegación Inercial

En tanto que método de extrapolación, la navegación inercial se sustenta en el siguiente


principio básico de la cinemática: Conocidos en un instante inicial la velocidad, la
orientación y la posición de un móvil así como los valores instantáneos presentes y
futuros de su aceleración lineal y su velocidad angular relativas a un dado sistema de
referencia, es posible calcular la posición, la velocidad y la orientación del vehículo en
todo instante futuro. Cabe destacar que, la aceleración lineal y la velocidad angular de
un cuerpo, contrariamente a la posición, la velocidad y la orientación, pueden ser
medidas sin información exterior al mismo.

6
Si P i , f i , g ig 3 denotan las coordenadas en la terna de referencia inercial ECI,
respectivamente, de la posición de un móvil, la fuerza por unidad de masa (fuerza
específica) actuante sobre él y la aceleración gravitacional en función de su posición, la
aplicación de los principios de la mecánica clásica permite arribar a la siguiente
ecuación diferencial cuya solución determina la posición y la velocidad del móvil
futuras t  t0 .

i P
V  i  g i (P )  f i(t ); P (t )  P ; V(t )  V ; (1.1)
g 0 0 0 0

Para sistemas de referencia no-inerciales, la Ec. (1.1) deberá ser corregida mediante los
términos correspondientes a las aceleraciones aparentes de Coriolis y centrípetas.

Las mediciones a bordo de un vehículo con las que cuenta un sistema de navegación
inercial son de dos tipos: la fuerza específica o aceleración inercial –medida con
acelerómetros– y la velocidad angular –medida con giróscopos. Resulta importante
distinguir entre aceleración y aceleración inercial o fuerza específica. En efecto, el
principio cinemático de la relatividad nos advierte que sin mediciones relativas a algún
objeto externo, es imposible determinar el estado de movimiento de un vehículo
moviéndose libremente en un campo gravitacional. En consecuencia, un acelerómetro
sólo podrá medir la fuerza específica o componente no gravitacional de la aceleración
impresa al vehículo ya sea por efecto de la propulsión, la sustentación o la resistencia
mecánica, aerodinámica e hidrodinámica. Lo anterior, junto con el principio cinemático
mencionado más arriba, implica la necesidad de conocer la aceleración gravitacional en
cada punto del espacio mediante algún modelo matemático, aspecto que será abordado
en el Capítulo 4. Por su parte, un giróscopo mide la velocidad angular de un cuerpo
respecto del espacio inercial. En base a las mediciones de los giróscopos, el sistema de
navegación inercial calcula la variación de la orientación del vehículo. En el Capítulo 2
se presentan los principios físicos y tecnológicos de los sensores inerciales modernos y
se describen además los parámetros que caracterizan su desempeño.

Las ventajas reconocidas de un sistema de navegación inercial son (Kayton/Fried,


1977):
 Producen información de los parámetros de navegación a muy alta tasa de
muestreo y con gran ancho de banda.
 Sus medidas son no interferibles y no requieren de estaciones o puntos de
referencia externos.
 Utiliza información accesible en todo instante y en todo punto (sobre y fuera del
planeta) con calidad independiente del medio donde se mueva el vehículo.

Entre sus desventajas mencionamos sin embargo:


 Necesita conocer la orientación y la posición iniciales del vehículo.
 La adquisición del rumbo inicial requiere la inmovilidad del vehículo durante el
proceso llamado de “girocompás”, que puede durar algunos minutos, y de
giróscopos de resolución suficiente como para medir la velocidad angular de la
Tierra (15º/hr).

7
 Los errores de medida en los instrumentos inerciales y en los parámetros de
navegación iniciales inducen errores que crecen polinomialmente con el tiempo
(ver más adelante en este Capítulo).
 Requieren de la actualización periódica de los parámetros de navegación con
mediciones absolutas.

Existen esencialmente dos formas de implementar los sistemas de navegación inercial.


La más clásica, empleada en las primeras aplicaciones, utiliza una plataforma
estabilizada respecto del sistema de referencia y sobre ésta se montan los instrumentos
inerciales. Actualmente, la mayoría de las aplicaciones prescinde de una plataforma
estabilizada y utilizan mediciones de instrumentos inerciales fijos a la estructura del
vehículo. Esta última configuración es conocida con el nombre de strapdown en la
literatura inglesa y sus ventajas se cifran en una significativa reducción en costos y en la
complejidad mecánica del sistema. A continuación introducimos brevemente las dos
tecnologías.

1.3.1 Navegación inercial con plataforma estabilizada


Una plataforma estabilizada o plataforma inercial está diseñada para mantener su
orientación respecto de un dado sistema de referencia, por lo cual, debe poder rotar
libremente en 3 dimensiones respecto de la estructura del vehículo que la alberga. De
hecho, y dado que su orientación permanece fija respecto del sistema de referencia
elegido, se puede decir que es el vehículo el que rota libremente alrededor de la
plataforma. La solución clásica a este problema es la conocida suspensión cardánica (en
honor a su inventor el matemático italiano Girolamo Cardano (1501-1576)) que
consiste, como se muestra en la Fig. 1.2, en tres anillos encastrados (“gimbal rings” en
inglés), cada uno de ellos suspendido por un soporte de tipo pivote solidario al anillo
inmediato exterior estando la plataforma sostenida por el eje pivote más interno. Para
vehículos intra-atmosféricos con sistema de referencia LGV es usual que el eje exterior
corresponda al azimut (yaw), el medio al cabeceo (pitch) y el interior a la guiñada (roll).

Eje externo (yaw)


Vehículo

Giróscopos Acelerómetros

Gimbals
Eje interior
Plataforma estabilizada

Eje medio

Lectura del Lectura del rumbo (yaw)
cabeceo (pitch) Vehículo
Figura 1.2: Suspensión cardánica de una plataforma giroestabilizada LGV.

8
Como se ve en la figura, una plataforma estabilizada permite medir directamente estos
ángulos (ángulos de Euler) que caracterizan la orientación instantánea del vehículo
respecto del sistema de referencia elegido.

En condiciones ideales de fricción nula en los ejes, exacto balanceo de la estructura


mecánica (centro de gravedad de la plataforma en la intersección de los tres ejes) y
ausencia de pares externos (ambientales, flexibilidad de cables, etc.), la plataforma no se
vería afectada por ningún par exterior independientemente del estado de movimiento del
vehículo lo que aseguraría, de acuerdo con la segunda ley de Newton, la invariancia de
la orientación de la plataforma respecto de un sistema inercial. En la práctica es
necesario implementar un sistema de control para desacoplar la plataforma del
movimiento del vehículo. Con este fin se disponen 3 servo-motores respectivamente en
la cabecera de cada uno de los ejes de la suspensión cardánica y tres giróscopos
mutuamente ortogonales montados sobre la plataforma. Los giróscopos son usados en
un lazo de servo-control de la velocidad angular inercial ω p de la plataforma tal como
el indicado en la Figura 1.3. Cuando ω ref  0 , el par vectorial c actuante sobre los
servo-motores tiende a cancelar el par de perturbación p. El resultado es un par efectivo
nulo sobre la plataforma que se traduce en la invariancia de su orientación inercial.

En caso de una referencia no inercial es posible mantener la plataforma alineada con


dicha referencia precalculando adecuadamente la consigna ω ref (t )   3 . Por ejemplo,
cuando el sistema de referencia está fijo a la Tierra la referencia es la velocidad angular
de la Tierra: ω ref  e . En cambio, si se usa la terna geográfica con orientación cardinal
(ejes paralelos a las direcciones E, N, U), al desplazarse, el vehículo “arrastra” consigo
la referencia por lo que a e debe adicionarse la “rotación de transporte”  debida al
desplazamiento de la terna de referencia a la misma velocidad V del vehículo sobre la
superficie de curvatura no nula del elipsoide normal (ver definiciones en el párrafo
5.3.1). Denotando con el superíndice “g” la expresión de los vectores en coordenadas
geográficas resulta:

g
ω ref (t )  eg  ρ g  eg  K g V g   sen( )zg (1.2)

Donde: K g representa el tensor de curvatura local del elipsoide normal expresado en


coordenadas “g”,  el cambio en longitud,  la latitud local y zg el versor local
ortogonal al elipsoide normal.

Para sistemas de alta performance el lazo de control de la Figura 1.3 resulta un desafío
tanto desde el punto de vista tecnológico como teórico. En particular, los actuadores
deben tener gran rango dinámico y ancho de banda para ser capaces, a la vez, de
compensar rápidas y pequeñas perturbaciones y responder a los comandos de ref, los
rodamientos deben estar diseñados par minimizar la fricción coulombiana en los ejes y
todo el sistema (gimbals + plataforma) debe estar debidamente balanceado respecto de
los ejes para minimizar los acoplamientos cinemáticos. Los sistemas más avanzados
utilizan sofisticadas herramientas de observación y control multivariable no lineales y
adaptables. Entre las soluciones de muy alta performance propuestas citamos: Shtessel
(1995), Royalty (2005) o Li et al. (1998). Véase también el número del IEEE Control
Systems Magazine, de Febro de 2008 dedicado al tema.

9
Perturbaciones

 p 
ref + c + p
Controlador Gimbals +
Actuador
plataforma

Giróscopos

Figura 1.3: Lazo de “servo-control” de la velocidad angular de una plataforma


giroestabilizada.

Los 3 acelerómetros mutuamente ortogonales montados sobre la plataforma estabilizada


miden las componentes de la aceleración inercial según el sistema de referencia elegido.
Para el caso de una terna de referencia inercial, estas magnitudes junto con la
gravitación determinan el movimiento del vehículo (Ec. (1.1)). Cuando el sistema de
referencia es no-inercial, es necesario corregir las mediciones de fuerza específica con
las aceleraciones aparentes. En particular, para la terna de referencia geográfica, la
fuerza específica corregida por los efectos de Coriolis y de la fuerza centrífuga debidos
a la rotación terrestre y a la rotación de transporte resulta ser (ver párrafo 5.3 del
Capítulo 5):

g
fcorr  f g  (2Ω g  ρ g )  V g  Ω g  (Ω g  P g ) (1.3)

De la anterior surge la siguiente ecuación análoga a la (1.1):

 g  g g (P)  f g ; Vg (t )  V ;
V (1.4)
g corr 0 0

Es usual englobar la aceleración centrípeta y la aceleración gravitacional en el término


de la gravedad aparente: g g (P)  g gg (P)  Ω g  (Ω g  P g ) y, consiguientemente,
reescribir las Ecs. (1.3) y (1.4) como sigue:
g
fcorr  f g  (2Ω g  ρ g )  V g
(1.5)
V g  g g (P)  f g ; Vg (t )  V ;
corr 0 0

La Figura 1.4 ilustra en forma esquemática la mecanización del cálculo de la posición y


de la velocidad en un sistema de navegación con plataforma estabilizada según la terna
geográfica. La computadora de navegación corrige las señales provistas por los
acelerómetros con las aceleraciones aparentes y le adiciona la gravedad aparente local
calculada mediante un modelo matemático en función de la posición. El resultado ( V g)
es integrado para obtener la velocidad V g cuyas 2 primeras componentes (las
horizontales) corresponden al cambio instantáneo de las coordenadas geográficas del
vehículo en los sentidos E y N respectivamente y su 3ª componente (la vertical) a la
variación de su altura sobre el plano tangente local al elipsoide normal. El tensor de
curvatura local Kg, calculado en función de la posición, permite junto con el vector V g ,

10
determinar las velocidades de variación de las coordenadas curvilíneas  (latitud) y 
(longitud) que luego son integradas para obtener la posición del vehículo.

g g ( ,  , h )
Vg
g
V (t0 )
Ω e Cálculo de:
g
  V g g,h, Kg, g y las , ,h
Aceleró- f Vg
metros 
 coordenadas
curvilíneas: 
(2Ω g  ρ g ) 
Computadora
g, g
de Navegación

Figura 1.4: Mecanización de un navegador inercial con plataforma en coordenadas


LGV.

Bloqueo de gimbal
La capacidad de la suspensión cardánica para aislar la plataforma de los movimientos
del vehículo se ve afectada en ciertas situaciones patológicas. En efecto, si, como
resultado de alguna maniobra, dos ejes de la suspensión resultaren paralelos será
imposible aislar la plataforma de las rotaciones del vehículo según un eje ortogonal a
ambos. Esta situación se presenta típicamente cuando un avión pica en cabeceo (roll) a
90º, en este caso, como puede verse en la Figura 1.1, el eje externo se alinea con el eje
interior y ya no es posible aislar la plataforma de las rotaciones perpendiculares a ésta
alrededor del eje de yaw. Esta condición, conocida como bloqueo de gimbal, traduce,
como se verá en el Capítulo 2, una limitación esencial de la caracterización de la
orientación de un cuerpo mediante los ángulos de Euler. El uso de un cuarto gimbal
redundante permite evitar el bloqueo y es la solución adoptada en vehículos estratégicos
que usan esta tecnología. Una solución matemáticamente equivalente consiste en
sustituir la suspensión cardánica por una suspensión hidráulica (gimbals hidráulicos)
consistente en una plataforma esférica con flotabilidad nula en un medio fluido
(Wang/Williams, 2008).

1.3.2 Navegación inercial con instrumentos fijos al vehículo (strapdown)


La creciente ubicuidad de los sistemas de navegación inercial en las últimas décadas es
directamente atribuible a las posibilidades que abre la tecnología strapdown para la
miniaturización de estos sistemas al prescindir de una plataforma estabilizada. Un
tratamiento in extenso de esta tecnología puede ser consultado en Titterton/Weston,
1997.

Sin plataforma, la terna de la unidad de mediciones inerciales (UMI), en particular la de


los acelerómetros, no está alineada con la terna de referencia o de navegación, por lo
que es necesario determinar analíticamente la orientación relativa entre ambas ternas
para poder resolver la fuerza específica medida según los ejes de la terna de navegación
(Ec. (1.3)). Este procedimiento es conocido como plataforma analítica y requiere
integrar numéricamente y en tiempo real la medición del vector velocidad angular
provista por la UMI. Por su parte, a diferencia de los giróscopos montados sobre la

11
plataforma que sólo miden desviaciones respecto de la velocidad angular nula en un
lazo de control, los giróscopos de un sistema strapdown deben poder registrar todo el
rango de velocidades angulares del vehículo. De este modo, puede decirse que con esta
tecnología, las complicaciones mecánicas son sustituidas por mayores exigencias sobre
los sensores inerciales y sobre la complejidad de los algoritmos numéricos.

El aumento del nivel de integración y de la capacidad de cálculo de las computadoras


digitales así como los nuevos desarrollos en materia de sensores inerciales produjo una
migración de las aplicaciones hacia la tecnología strapdown. Esta tendencia se ve
acentuada, de un lado por el rol que adquiere la tecnología MEMS (sistemas micro
electro mecánicos) en la miniaturización de las unidades inerciales (ver número
especial: IEEE Proceedings, Aug. 1998) y, del otro, por la posibilidad de implementar
en la computadora de navegación abordo complejos algoritmos numéricos de fusión de
mediciones inerciales y no-inerciales (satelitales u otros). Estos algoritmos, que como
veremos mas abajo son la base de los sistemas de navegación integrada, permiten
potenciar las prestaciones de los instrumentos inerciales reduciendo sus exigencias de
estabilidad y precisión. Como resultado, actualmente sólo unas pocas aplicaciones de
navegación de precisión usan plataformas estabilizadas entre las que se cuentan los
vehículos estratégicos intercontinentales (Wang/Williams, 2008). Este libro se abocada
principalmente a los métodos y componentes requeridos por la configuración strapdown
y a la inserción de esta ultima en los sistemas de navegación integrada.

Propagación de errores en la navegación inercial strapdown


A modo de ejemplo, consideremos el problema de la navegación cartesiana
bidimensional referida a una terna geográfica local con origen en un punto fijo de la
superficie terrestre, tal como se indica en la Figura 1.5.

N
O
E
D x
y a
D
x a
a y x
y
ax

UMI ay D 
Figura 1.5 Navegación strapdown bidimensional.

La UMI consta de una dupla de acelerómetros que mide las aceleraciones según las
direcciones fijas al vehículo ax y ay y un giróscopo que mide la velocidad angular del
vehículo D en la dirección hacia abajo (D). Si D es el ángulo de la proa del vehículo
respecto de la dirección Norte se tiene:

12
t
D   D   D (t )   D (t0 )   D ()d 
t0

aN  ax cos  D  a y sin  D (1.6)


aE  ax sin  D  a y cos  D

Introduciendo la siguiente notación, que será justificada en el Capítulo 4, para un vector


s genérico expresado respectivamente en coordenadas “g” y “b”.

s   sx   cos  D sen  D 
s g   N  ; sb    ; Cbg ( D )     s  Cb ( D )s
g g b
(1.7)
s
 E s
 y   sen  D
cos  D 

Las dos ultimas Ecs. (1.6) se reescriben:

a g  Cbg (D )ab (1.8)

Para unos dados vectores de posición y velocidad iniciales en el instante t0 y funciones


(forzantes) ab(t) y D(t), la posición, velocidad y orientación del vehículo en
coordenadas geográficas locales corresponde a la solución de las siguientes ecuaciones
diferenciales no lineales de la cinemática:

P g  V
 g  a g  C g ( )ab ; P g (t )  P , V g (t )  V
b D 0 0 0 0
(1.9)
   ;  (t )  
D D D 0 0

En el Capítulo 4 se presentarán formulaciones más generales de estas ecuaciones y se


discutirán sus implicancias para la navegación inercial. Mientras tanto, simplificaremos
la presentación para esta introducción suponiendo: D0 y a=constante. Bajo estas
condiciones, consideraremos los efectos de los errores en el conocimiento de las
condiciones iniciales: P0 , V0 , 0 , y de sesgos constantes  x ,  y y  D ,
respectivamente, en las mediciones acelerométricas y de la velocidad angular.

N  D aˆ
N

aN
a

aE E
aˆ E

Figura 1.6: Efecto del error de orientación sobre las coordenadas de la aceleración.

Un error  D en el conocimiento de la orientación del vehículo hará diferir las


componentes en terna geográfica de la aceleración calculada con las Ecs. (1.6)
(indicadas con ^ en la Fig. 1.6) de sus valores reales de acuerdo con:

13
 a  cos( D )  sin( D )   aˆ N 
ag   N      (1.10)
 aE   sin( D ) cos( D )   aˆ E 

Junto con la anterior las siguientes ecuaciones modelan los errores en las componentes
de la velocidad y la posición en terna “g” para pequeños valores del ángulo  D :


 g   VN    aN    aN    N     aE     g
ˆ
V         D ; V g (t0 )  V0

 VE   aE   aˆ E    E   aN  (1.11)
   ;  (t )  
D D D 0 0

Las soluciones de las Ecs (1.11) son:

 D (t )  0   D (t  t0 )
 a   a   (t  t0 ) 2
V g (t )  V0  ( g   E  0 )(t  t0 )   E  D  (1.12)
 aN   aN  2
 a  (t  t0 ) 2  aE   D (t  t0 )3
P g (t )  P0  V0 (t  t0 )  ( g   E  0 )  
 aN  2  aN  6

De las anteriores se destaca el crecimiento polinomial con el tiempo (cúbico en el caso


de la posición) de los errores provocado por el desconocimiento de las condiciones
iniciales y por los sesgos instrumentales.

Esta característica, propia de los métodos de extrapolación (ver el siguiente párrafo)


exige, o bien instrumentos de muy alta calidad o bien la reinicialización periódica de los
parámetros de navegación.

1.4 Navegación multisensor o integrada

Las técnicas de fusión de datos permiten combinar información proveniente de distintas


fuentes para inferir los valores de las variables que se desean estimar. En general puede
decirse que la eficacia de estas técnicas se basa en que mientras más fuentes de
información se dispongan de una misma variable más podrá reducirse su imprecisión o
incrementar la confiabilidad de su estimación. En teoría, una adecuada combinación de
mediciones adquiridas por diversos sensores producirá siempre un resultado mejor que
el que se obtendría usando solamente el mejor de los sensores disponibles. La mejora
cuantitativa de la estimación resultante de la fusión de datos dependerá de la
perfomance da cada sensor específico, del tipo de proceso y de las condiciones en que
se adquieran los datos (calidad y cantidad por unidad de tiempo de la información
adquirida, etc.) y del algoritmo de fusión de datos utilizado. Todo algoritmo de fusión
de datos sólo funcionará correctamente bajo ciertas y determinadas circunstancias
consistentes, entre otras, con las hipótesis simplificadoras postuladas en su diseño. Por
lo tanto, la selección del tipo de algoritmo y las condiciones en que éste es utilizado
pueden ser cruciales para la calidad del resultado. Cada algoritmo de fusión de datos
requiere de información a priori como por ejemplo: las estadísticas de los procesos
aleatorios involucrados, el grado de dependencia estadística (o correlación) entre las
mediciones fusionadas, la estructura del modelo de cada sensor y su correspondiente

14
parametrización, etc. Estos algoritmos necesitan conocer la perfomance de cada sensor,
y una evaluación incorrecta de éstas últimas podría traducirse en estimaciones erradas.

La tecnología actual permite disponer a bordo de casi cualquier vehículo de una


variedad de instrumentos de navegación de bajo consumo y volumen reducido. Esto
combinado con la accesibilidad de una alta capacidad de computo, se tradujo en las
ultimas décadas en un desarrollo sostenido de nuevos algoritmos de fusión de datos
cada vez mas eficientes y precisos con las consiguientes mejoras en la confiabilidad,
continuidad y precisión de las estimaciones (Luo et al., 2007). En particular para las
aplicaciones de navegación estos esquemas permiten potenciar la complementariedad
entre los sensores intra- y exoceptivos. Como se dijo, los primeros pueden ofrecer altas
tasas de información de velocidades y aceleraciones (lineales o angulares) de los
parámetros de navegación pero no pueden evitar la acumulación de errores debida al
proceso de integración de las mediciones. Por su parte, los sensores exoceptivos
(cámaras CCD, GPS, sonar, radar, lidar, star-trackers, radio-beacons, altímetros, etc.)
proveen directamente información posicional con errores acotados pero a instantes
discretos y con retardos lo que se traduce en graves limitaciones para aplicaciones como
el control de vehículos en tiempo real, la adquisición de imágenes con sensores remotos,
enfoque de imágenes SAR, etc.

x(t) Sensores
Vehículo 
exteroceptivos. y (tk )
m(t)
Sensores
interoceptivos. Hardware Software

m(t )
+
Modelo de m̂ modelo extrapol. Modelo de los -
calibración. xˆ  f ( xˆ , mˆ ) sensores exter.
yˆ  hk ( xˆ , pˆ e ) yˆ ( t k )
mˆ ( m , pˆ i ) xˆ (t )
p i (tk ) x (t k ) p e (t k )
y (t k )
Filtro de fusión de datos

Fig. 1.7: Sistema de navegación con integración de mediciones introceptivas y


exteroceptivas. x agrupa las variables de navegación, pi y pe son los parámetros de
los sensores.

La Figura 1.7 muestra un esquema típico de navegación integrada con fusión de


mediciones introceptivas y exteroceptivas. El vector x contiene los parámetros de

navegación a estimar, los vectores m y m corresponden, respectivamente, a las

magnitudes introceptivas y a sus mediciones. Por otra parte, y (tk ) es el vector de las
mediciones exteroceptivas adquiridas en el instante tk. Como normalmente los sensores
introceptivos proveen información a alta tasa de muestreo, en la figura se suponen
funciones continuas del tiempo. Por su parte, los datos exoceptivos están indexados con
el índice tk porque en la práctica son adquiridos en instantes discretos. Véase que el

15
índice k califica también a la función hk( , ) del modelo del sensor. Esto es debido a que
el conjunto de sensores activos no necesariamente es el mismo en todo instante Las

mediciones m(t ) son preprocesadas con el modelo inverso del sensor, residente en la
computadora de navegación, que depende del conjunto de parámetros pˆ i para obtener la
estimación mˆ (t ) de las mediciones introceptivas. Las ecuaciones diferenciales de la
cinemática (ver capítulo 5) representadas por le modelo f(x,m), permiten extrapolar las
estimaciones de los parámetros de navegación a partir de sus estimaciones iniciales.

Las mediciones exteroceptivas y (tk ) disponibles en el instante tk son comparadas con
las correspondientes salidas extrapoladas calculadas usando el modelo del grupo de
sensores activos en dicho instante y la estimación actual xˆ (tk ) de los parámetros de
navegación. La innovación y (tk ) es procesada por el filtro de fusión de datos para
actualizar (corregir) tanto a xˆ (tk ) como a las estimaciones de los parámetros pˆ i (tk ) y
pˆ e (tk ) de los sensores intro- y exoceptivos, respectivamente. Esta última acción es
denominada calibración de los instrumentos. Finalmente la solución instantánea xˆ (t ) de
las ecuaciones diferenciales del extrapolador calculada en tiempo real es el resultado de
la navegación accesible a una tasa de muestreo sólo limitada por la velocidad de cálculo
de la computadora de navegación.

El modelo extrapolador surge de las ecuaciones cinemáticas que se estudian en el


Capítulo 5 y su versión digital en forma de algoritmo de navegación inercial en tiempo
real es desarrollada en el Capítulo 7. El Capítulo 6 aborda el problema de la sensibilidad
de las ecuaciones cinemáticas a los errores iniciales e instrumentales y estudia las
ecuaciones de propagación de los mismos. El Capítulo 8 se centra en los sistemas
satelitales que habilitan los sensores exoceptivos mas difundidos actualmente: los
Sistemas Satelitales de Navegación Global (GNSS) y sus observables. En el Capítulo 9
se estudian los métodos numéricos, basados en la teoría del filtrado no lineal que
permiten la fusión de datos provenientes de una diversidad de sensores dando lugar a las
técnicas de navegación integrada. En el mismo Capítulo se describen aplicaciones que
usan otros modelos de sensores exoceptivos.

16
Capítulo 2
Instrumentos Inerciales

El principio de equivalencia fuerte de la teoría de la relatividad nos advierte que sin


mediciones relativas a algún objeto externo, no es posible determinar el estado de
movimiento de un móvil libre en un campo gravitacional y en particular medir su
aceleración (gravitacional). Por otra parte, sí son detectables las fuerzas no
gravitacionales ejercidas sobre un cuerpo y trasmitidas a través de su estructura sólida.
Llamaremos inerciales a estas últimas fuerzas y acelerómetro al dispositivo usado para
medirlas. Del mismo modo llamaremos giróscopo al instrumento que permite medir la
velocidad angular de un cuerpo en rotación respecto de un sistema inercial sin usar una
referencia exterior. Tanto la aceleración como la velocidad angular de un cuerpo son
magnitudes vectoriales, por lo que la medición de cada una de ellas requiere conocer su
proyección sobre al menos 3 ejes no coplanares.

Los sistemas de navegación inercial son aquellos que utilizan como instrumentos
exclusivamente acelerómetros y giróscopos. Dado que la aceleración gravitacional no
puede ser medida por instrumentos inerciales estos sistemas de navegación requieren
necesariamente de un modelo matemático del vector gravitación en función de las
coordenadas del vehículo, tema que es tratado en el Capítulo 4.

Entre las ventajas de los sensores inerciales (sensores introceptivos por excelencia) se
destacan que sus medidas son independientes del medio en que se mueve el vehículo y
que no requieren de ninguna referencia exterior al mismo. Estas características sumadas
a su capacidad de ofrecer información a alta frecuencia hacen de la navegación inercial
una de las opciones más utilizadas desde su inserción a principios del siglo XX.

En este Capítulo se introducen los principios de funcionamiento y principales


tecnologías disponibles para el diseño de acelerómetros y giróscopos. El lector
encontrará una descripción detallada de estas y otras variantes tecnológicas en Titterton
et al. 1997. Los sensores inerciales son usualmente seleccionados en base a ciertos
parámetros de perfomance. Entre ellos destacamos: a) el sesgo de la medida, b) la
imprecisión del factor de escala, c) las respectivas inestabilidades o repetibilidad de
estos parámetros y d) el ruido de fondo que limita la resolución del instrumento. Las
diferentes tecnologías disponibles ofrecen diversos compromisos entre los parámetros
mencionados por lo cual la selección puede no resultar sencilla. Un aspecto que
condiciona la selección es claramente su uso y puesto que la tendencia dominante, así
como el foco de este volumen, son los sistemas strapdown este será el tipo de
aplicaciones que guiará nuestro interés en este capítulo. Como se mencionó en el
Capítulo 1 esta opción impone demandas muy específicas. En particular para los
giróscopos, interesa buena estabilidad del factor de escala y amplio rango de velocidad
angular. Visto el tipo de aplicaciones de la tecnología strapdown también resultan
importantes en la decisión el tamaño, el costo y el nivel de consumo eléctrico requerido
por el instrumento.

17
A partir de mediados de los 90´s, los sensores inerciales micromaquinados de estado
sólido han suscitado un creciente interés. En éstos la estructura mecánica sensible al
movimiento forma parte del circuito electrónico integrado de adquisición de la medida.
Los principios físicos que conducen a nuevos sensores inerciales de este tipo son hoy en
día objeto de intensa investigación en muchos laboratorios del mundo. Esta tecnología,
aplicable a numerosos tipos de microsensores, es conocida como micro-
electromechanical systems o MEMS (ver IEEE Proc., Special Issue, 1998). Sus ventajas
más relevantes son la miniaturización y robustez de los sensores y la posibilidad de
producción masiva a bajo costo. Lo anterior hace a los sensores MEMS aptos para una
vasta gama de nuevas aplicaciones. Entre los campos clásicos y las muevas áreas
favorecidas por esta tecnología mencionamos las aplicaciones biomédicas, la robótica
móvil, aplicaciones de realidad virtual, vehículos autónomos, mini y micro satélites, etc.
Junto a los sensores MEMS el capítulo presta atención a los giróscopos ópticos.
Tecnologías que a nuestro entender son las más promisorias para la navegación
strapdown.

Se establecen además modelos matemáticos suficientemente generales para las unidades


de medición inercial y se describen las perturbaciones aleatorias que los afectan. Esto
permite definir los parámetros que caracterizan la perfomance de los sensores tales
como: la sensibilidad, el rango, el ancho de banda, la resolución, la linealidad del factor
de escala, el sesgo de medición y la sensibilidad fuera del eje sensible. En los sensores
multidimensionales interesa además la descorrelación de las mediciones según sus ejes
ortogonales. La temperatura afecta tanto las estadísticas de las perturbaciones como las
propiedades mecánicas y eléctricas del dispositivo, por los que es deseable conocer la
sensibilidad de todos los parámetros respecto de la temperatura (TCS: Temperature
coefficient sensibility) en caso de que ésta realice excursiones importantes durante el
uso. Además de ser crucial a la hora de la selección del instrumento para la aplicación
específica, como se verá otros capítulos, la parametrización de la perfomance es
instrumental en los algoritmos navegación integrada y en la calibración en tiempo real.

2.1 Acelerómetros

eje sensible resorte


aceleración
inercial masa
x
carcasa reposo escala
Figura: 2.1: Principio de funcionamiento de un acelerómetro.

La configuración básica de un acelerómetro consiste de una masa testigo


contrabalanceada por un elemento elástico fijo a la carcasa del instrumento (solidaria a
su vez al vehículo en el caso strapdown o a la plataforma inercial estabilizada, ver Fig.
2.1). De este modo, de acuerdo con la 2ª ley de Newton una fuerza inercial (no
gravitatoria*) actuante sobre la carcasa produce un desplazamiento de la masa testigo
respecto de la primera. Este desplazamiento es transformado en una señal medible.

*
En el Capítulo 4 se discute la diferencia entre fuerza gravitatoria y fuerza gravitacional.

18
Un análisis elemental conduce a la siguiente función de transferencia entre la fuerza
específica actuante en la dirección del eje sensible y el desplazamiento de la masa
testigo:

H (s) 
x( s)

1/ M   1/ M  (2.1)
f ( s ) s 2  D s  K s 2  r s   2
r
M M Q

Donde K es la constante elástica del resorte, D el amortiguamiento y M la masa testigo.


El diseño del dispositivo tiene en cuenta el factor de calidad Q  KM / D y la
frecuencia de resonancia r  K / M . La sensibilidad en baja frecuencia se mejora
reduciendo r aunque esto reduce en general el ancho de banda. Por otra parte, dadas
r y M, la forma de la respuesta queda determinada por el factor de amortiguamiento
que, como se advierte de la (2.1), queda fijado por Q. En los instrumentos
miniaturizados la principal fuente de perturbaciones mecánicas es el movimiento
Browniano de las moléculas del gas que rodea a la masa testigo y a su suspensión
elástica. En Gabrielson (1993) (ver también Yazdi et al., 1998) se demuestra que este
efecto se traduce en un ruido total de aceleración equivalente (RTAE) dado por:

4 K BTD 4 K BT r
RTAE    m / s 2 Hz  (2.2)
M QM

Donde KB es la constante de Boltzman y T la temperatura en ºK. Las Ecs. (2.1) y (2.2)


ponen de manifiesto el compromiso de diseño entre las constantes Q, M y r En
particular, altos valores de la calidad Q producen bajos valores del RTAE pero a costa
de que por encima de cierto valor de Q aparezcan resonancias indeseables
( Q    H ( jr )   ).

Como una fuerza gravitatoria actúa en forma distribuida y, en la práctica,


uniformemente sobre todo el dispositivo, su acción no produce desplazamientos
relativos de la masa testigo y por lo tanto no es registrada por el acelerómetro. Así, un
acelerómetro a bordo de un vehículo sólo medirá la aceleración inercial de este último,
llamada también fuerza por unidad de masa o fuerza específica, en la dirección del
movimiento de la masa testigo o eje sensible del acelerómetro. Dado que una
aceleración es una magnitud vectorial, una unidad inercial contiene usualmente 3
acelerómetros con sus ejes sensibles mutuamente ortogonales.

De acuerdo con las leyes de inercia y gravedad de Newton, la siguiente ecuación


modela el comportamiento de un acelerómetro.

d 2 P i  i
2
 P  f i  gi (2.3)
dt

Donde Pi, fi y gi son, respectivamente, su posición la fuerza específica actuante y la


aceleración gravitatoria expresados respecto de un sistema de referencia inercial. De
(2.3) surge que un acelerómetro inercialmente en reposo ( P  i  0 ) en un campo
gravitatorio registra la fuerza específica en este caso de sustentación: fi= -gi [m/seg2]

19
que compensa el efecto del campo. Por ejemplo, esto es lo que medirá un acelerómetro
en reposo sobre una mesa con su eje sensible en la dirección de la vertical local.

2.1.1 Acelerómetros realimentados de péndulo


El principio de funcionamiento enunciado más arriba corresponde a una medición a lazo
abierto de la aceleración. Para obtener mediciones más estables y precisas se recurre a
una configuración en lazo cerrado que mantiene fija la masa testigo (masa del péndulo)
en su posición de reposo. Un diseño usual para alta sensibilidad es el acelerómetro de
pivote con realimentación de fuerza. Un esquema de un diseño unidireccional se ilustra
en la Fig. 2.2.

Ipar restitutivo eje


sensible
servo
amp.
bobina
motora
posición
cero
péndulo
bobina
excitación imán carcasa
Figura 2.2: Esquema de un acelerómetro unidireccional de tipo péndulo.

El elemento flexible es sustituido por un lazo de regulación que mantiene al péndulo en


la posición cero. El sensado del ángulo del pivote puede ser capacitivo, inductivo
(mostrado en la figura), óptico o resistivo. Este último basado en cambios de la
resisitividad del pivote con la flexión. La medida de la aceleración es proporcional a la
corriente que produce el par restitutivo que regresa al péndulo a su posición de cero. Al
limitarse el desplazamiento de la masa testigo (masa del péndulo), se aumenta el rango
dinámico y se asegura que el funcionamiento del sensor sea siempre en su zona de
máxima sensibilidad y uniformemente lineal sobre toda su escala de medida la que así
puede abarcar de 4 a 5 órdenes de magnitud (relación entre la resolución y la
aceleración máxima). El rango de estos sensores puede alcanzar los 100g. Las
principales fuentes de error son: el sesgo de medida (0.1mg a 10mg), resultado de pares
elásticos residuales y desplazamientos en la medición del cero, la inestabilidad del
factor de escala debido a efectos térmicos (TCS »0.1%) y un umbral de ruido
(resolución) en RMS: » 10g.

2.1.2 Acelerómetros micromaquinados MEMS


Los acelerómetros MEMS se agrupan según los siguientes principios básicos de
funcionamiento: a) de segmento resonante, b) de onda acústica superficial, c)
piezoresistivos y d) capacitivos.

a) Los primeros forman parte de una nueva generación de acelerómetros que utilizan
como principio la alteración de la frecuencia de oscilación de un segmento mecánico,
normalmente un cristal de cuarzo, frente a cambios en el esfuerzo a la tracción que éste
soporta. Los efectos no lineales son compensados utilizando dos segmentos que, en
reposo vibran a la misma frecuencia de resonancia. La fuerza específica en el eje

20
sensible altera diferencialmente el estado de tensión de cada segmento provocando una
diferencia entre ambas frecuencias de oscilación proporcional a la excitación. Un
esquema simplificado del principio se ilustra en la Fig. 2.3 (ver Le Traon et al. 2005).

Eje sensible

f1 f2
Segmento1 Segmento2

Figura 2.3: Esquema de acelerómetro vibratorio en configuración diferencial.

b) Una onda acústica superficial como las descritas inicialmente por Lord Rayleigh
(1842-1919), puede ser generada y entretenida sobre un cristal piezoeléctrico mediante
una distribución periódica de electrodos implantados en su superficie. Los
acelerómetros que usan este principio (ver Motamedi, 1994, Titerton, 1997) disponen de
una viga en voladizo cargada en su extremo con una masa testigo (ver Fig.: 2.4).

Electrodos de excitación
Masa testigo

Anclaje a eje
la carcasa sensible
Viga

Figura 2.4: Principio del acelerómetro de ondas acústicas superficiales.

La frecuencia de la onda resonante es alterada variando la tracción mecánica sobre la


superficie del cristal. La fuerza específica impresa al anclaje en la dirección del eje
sensible flexiona la viga alterando su tensión superficial y provocando una variación en
la frecuencia de la onda acústica superficial que resulta así una medida de la fuerza
específica aplicada. La medida de estos dispositivos es directamente digitalizable y
alcanza una resolución de 9 a 10 bits, sin embargo, usualmente el ancho de banda solo
alcanza algunos pocos Hz.

c) Los acelerómetros piezoresistivos son los primeros en haber sido micromaquinados.


Su estructura mecánica es similar a la mostrada por la Fig. 2.4. En este caso, un
piezoresistor montado sobre la viga mide el estado de tensión de la misma modificado
por la flexión producida por la aceleración inercial de la carcasa. Sus principales
ventajas son la simplicidad de su estructura, la del proceso de fabricación y la de la
electrónica de medición. Sin embargo, la sensibilidad estática de los acelerómetros
piezoeléctricos es inferior a la de los capacitivos y la temperatura la afecta
significativamente con un coeficiente de temperatura de la sensibilidad típico de hasta
0.2%/ºC.

21
d) El principio de los acelerómetros capacitivos se muestra en la Fig. 3.a). La fuerza
específica exterior produce un desplazamiento de la masa testigo alterando la capacidad
entre dos placas conductoras fijas a la carcasa, capacidad que puede ser medida
eléctricamente de diversas maneras. Las Figs. 3.b) y 3.c) muestran las estructuras
mecánicas más utilizadas en su fabricación. En la primera, llamada de estructura
vertical, la masa testigo se mueve en la dirección perpendicular a plano que la contiene
alterando su separación respecto de la placa fija. En al configuración lateral de la Fig.
3.c), la masa se mueve en el plano que la contiene alterando la separación entre un
conjunto de electrodos dispuestos en peine. La dependencia de la sensibilidad en lazo
abierto de los acelerómetros capacitivos es proporcional a la magnitud:

MA
S (2.4)
dK

Donde M es la masa testigo, A el área efectiva de la capacidad, K la constante elástica y


d el espacio inter-electrodos.

a)
Electrodos

b) c)
Aceleración
Suspensión Anclaje Aceleración
Peine
Anclaje sensor
Masa Masa

Electrodos
Suspensión
Figura 2.5: Configuración típica de un acelerómetro MEMs.

Entre las ventajas de los acelerómetros capacitivos mencionamos su alta sensibilidad,


bajo ruido, baja deriva del sesgo y baja sensibilidad a la temperatura. Actualmente es
posible fabricar acelerómetros MEMS capacitivos en silicio con perfomances que
cubren desde las aplicaciones automotrices de bajo costo hasta las de alta precisión con
resolución inferior a 1 g / Hz en un ancho de banda de 100Hz, TCS»150ppm/ºC y
sensibilidad del sesgo a la temperatura »30mg/ºC (Yazdi et al. 1998). Ciertamente los
dispositivos de esta gama no son los estándares del mercado pero demuestran las
posibilidades de una tecnología en rápida evolución.

2.2 Giróscopos

Los giróscopos miden rotación angular. Se distinguen los que miden la velocidad
angular instantánea de los que miden cambios en el ángulo rotado alrededor de su eje
sensible. En la literatura inglesa los primeros son denominados “rate gyros” y los
segundos “rate integrating gyros (RIG)”. Los giróscopos del segundo tipo son
particularmente útiles en vehículos sujetos a vibraciones aleatorias de amplio ancho de
banda y elevada potencia media. En primer lugar, porque frente a grandes excursiones

22
en magnitud de la velocidad angular los sensores de cambio angular reflejarán
excursiones acotadas. En segundo lugar, porque la medición analógica que proveen es el
verdadero ángulo rotado, en cambio, cuando esta magnitud debe obtenerse integrando
numéricamente muestras de velocidad angular deberá recortarse su espectro (antialias)
degradándose la información angular efectiva. Finalmente, como veremos en el
Capítulo 7, los algoritmos de navegación inercial procesan directamente estos
incrementos angulares.

Desde el punto de vista de los principios físicos utilizados los giróscopos pueden
clasificarse en rotatorios, vibratorios y ópticos.

2.2.1 Giróscopos rotatorios


La base de su funcionamiento es la conservación del momento angular. Son los más
clásicos y están conformados por un volante rotatorio impulsado por un motor eléctrico
suspendido en un montaje cardánico con ambos ejes perpendiculares al eje del volante.
Este último eje es soportado por rodamientos de muy bajo rozamiento.

Resorte
Lectura angular 
Gimbal

Rotor

Carcasa

: momento angular
=xH
: en el eje sensible

Figura 2.6: Esquema de giróscopo monoaxial encapsulado.


Según el principio giroscópico, para un momento angular H en el volante, una velocidad
angular  impresa en el eje sensible en cuadratura genera un par de presesión =xH
sobre el gimbal en un eje perpendicular a ambos. Cuando este par es contrabalanceado
por un resorte lineal (indicado en al Figura 2.6) o una barra de torsión, el ángulo de
presesión resultante (es una medida de la velocidad angular en el eje sensible
mientras que H determina la sensibilidad del instrumento.

Constructivamente, el rotor y el gimbal están encapsulados y el conjunto inmerso en un


fluido que induce una amortiguación viscosa y determina la respuesta dinámica
resultando es una transferencia entre  y  similar a la (2.1). Suprimiendo el resorte, la
viscosidad del fluido determina una velocidad de presesión angular limite  p   p
proporcional al par T y por tanto a la velocidad angular en el eje sensible. De este modo,
la lectura del ángulo de presesión  resulta proporcional a la integral de la velocidad
angular (ángulo rotado) en el eje sensible lo que convierte al instrumento en un sensor
de tipo RIG. Como la viscosidad del fluido depende de la temperatura, los instrumentos
más precisos regulan la temperatura de su interior.

Al igual que los acelerómetros es posible obtener mediciones más estables y precisas de
la velocidad angular realimentando la excursión del ángulo de presesión para

23
transformar al sensor en un instrumento de cero. Un esquema de este principio es
ilustrado en la Figura 2.7, en él, la medida es la corriente I proporcional al par
restitutivo T que a su vez es proporcional a la velocidad angular en el eje sensible del
instrumento.

: en el eje sensible
 ωp

Gimbal Motor de torsión

Rodamiento
Lectura IαT
angular 
Servo

Amortiguación
viscosa

Figura 2.7: Esquema de giróscopo realimentado con un servomotor de torsión.

2.2.2 Giróscopos vibratorios

 Eje sensible
Oscil. primaria
Brazos de
excitación. Referencia
Soporte
Amp. del oscilador
Amplif.
Brazos de Soporte
lectura. Demodulador
Amplif.
Oscil. secundaria Amp. de lectura
Figura 2.8: Principio del giróscopo de doble diapasón de cuarzo de Systron Donner.

En una masa vibrante forzada a rotar se originan fuerzas de Coriolis (ver Capítulo 5)
que inducen vibraciones secundarias ortogonales a la vibración original y al eje de
rotación. De este modo, parte de la energía del modo de vibración primario es
transferida a un modo secundario como consecuencia de la rotación. La amplitud de las
oscilaciones secundarias resulta ser así una medida de la velocidad angular en el eje
sensible del instrumento. Este principio ha dado recientemente lugar a diversos
desarrollos de giróscopos sin motores, partes rotatorias, ni rodamientos, construidos con
tecnología MEMS muchos de ellos integrados en un mismo circuito con la electrónica
de medición. La oscilación primaria es normalmente un modo resonante de la propia
estructura mecánica sintonizado a la frecuencia nominal que define el factor de escala
del instrumento. La sintonía puede afinarse electrostáticamente usando electrodos ad-
hoc.

24
Giróscopo de diapasón
La versión más clásica de la aplicación de este principio es posiblemente la del
giróscopo de doble diapasón sintonizado (tuning fork) tallado en una pieza de cuarzo
piezoeléctrico (ver Fig. 2.8) de alto Q para la unidad inercial Motion Pack de Systron
Donner desarrollada a principios de los 90´s. Una oscilación primaria inducida en las
ramas superiores se manifiesta en una velocidad periódica lineal v en la dirección del
plano que las contiene. Cuando el diapasón rota según el eje sensible a la velocidad
angular , una aceleración de Coriolis a=2vx periódica actúa sobre cada una de estas
ramas perpendicularmente al plano mencionado. Estas fuerzas se traducen en un par
periódico torsional en la unión entre ambos diapasones que induce una oscilación
secundaria fuera del plano en las ramas inferiores. La señal piezoeléctrica producida por
las ramas inferiores es demodulada usando como referencia la señal del oscilador
primario para obtener a la salida una señal DC proporcional a 


Electrodos sensores Electrodos
de sintonía
Electrodo de anclaje
excitación

masa
Sentido
masa Modo de excitación de la
v oscilación

anclaje
Electrodo de
Electrodos excitación
de sintonía acor = 2v x 
Electrodos sensores Modo sensor
Figura 2.9: Giróscopo MEMS vibratorio y modos de oscilación.

Tecnología actual Perfomance prevista Comentarios

Rango de operación º/s 100-6000 100-6000 Seleccionable

Sesgo al encendido º/h 10-150 <1

Inestab. sesgo º/h 3-30 <1 -40º-85º

Inestab. fact. esc. % 0.03-0.15 <0.01

Ruido de fondo [º/s]/ Hz 0.5-3 0.02

Sensibilidad a g [º/h]/g 10 0,5

Tabla 2.1

La Figura 2.9 ilustra una versión integ rada de diapasón sintonizado desarrollada en el
laboratorio Charles Stark Draper en 1991 (Bernstein et al. 1993 y también Yazdi et al.

25
1998). Mediante un peine de electrodos de excitación se induce electrostáticamente una
oscilación (modo de excitación) de las masas testigos de unos 10m de amplitud.
Expuesto a una velocidad angular  en el eje sensible normal al plano del sustrato sobre
el que se mueven las masas, se induce en estas últimas un movimiento oscilatorio
ortogonal al modo primario de excitación (ver modo sensor). Este último movimiento es
detectado capacitivamente mediante electrodos sensores.

La Tabla 2.1 refleja la perfomance alcanzable actualmente en giróscopos de diapasón,


así como la esperable en unos años habida cuenta de las tendencias en el desarrollo de
esta tecnología (ver Barbour, 2004; Geen, 2002).

Giróscopo de disco oscilante


El mismo principio es utilizado en un diseño originalmente propuesto en la Universidad
de California en Berkley (Juneau et al., 1997 y también Lutz et al. 1997)) que consiste
en un disco en rotación oscilatoria alrededor de su eje. Una rotación de entrada
contenida en el plano del disco (ω) induce, por Coriolis, una oscilación secundaria en
torno de un eje que es perpendicular simultáneamente a ω y eje del disco y por tanto
contenida en el plano éste último (ver Fig. 2.10). La oscilación secundaria es captada
por electrodos capacitivos situados debajo del disco. El dispositivo permite así medir la
componente bidimensional (dos ejes de rotación simultáneos) del vector velocidad
angular proyectada sobre el disco. El ruido de fondo tiene una densidad de
0.3[º/s]/ Hz . Aún en condiciones de perfomance óptima el diseño actual propuesto por
Juneau et al. (1997) adolece de sensibilidades cruzadas entre ambos ejes sensibles. Sin
embargo, los diseños futuros contemplan usar un rebalance de fuerzas en lazo cerrado
que permitirá mejorar la perfomance y evitar el acoplamiento entre ejes. Más
recientemente, un diseño de alta perfomance con disco oscilante fue logrado por Geiger
et al. (1998) para un solo eje sensible con una densidad de ruido de 0.27º/h
(0.005[º/s]/ Hz ), estabilidad del sesgo de 65º/h, y error en el factor de escala< 0.2%.

Electrodo detector
Figura 2.10: Principio de giróscopo MEMS basado en un disco vibratorio.

Giróscopo de anillo vibratorio


La General Motors y la Universidad de Michigan (EEUU) desarrollaron conjuntamente
un concepto de giróscopo vibratorio basado en un anillo puesto a oscilar en su modo
natural (modo de excitación o primario) en el plano que lo contiene mediante electrodos
dispuestos en su periferia.

La General Motors y la Universidad de Michigan (EEUU) desarrollaron conjuntamente


un concepto de giróscopo vibratorio basado en un anillo puesto a oscilar en su modo

26
natural (modo de excitación o primario) en el plano que lo contiene mediante electrodos
dispuestos en su periferia.

La Figura 2.11 ilustra la estructura del anillo micromaquinado en un bloque de silicio


cristalino y los modos elípticos de excitación y sensor que determinan movimientos
radiales de los puntos en la periferia del anillo. Una velocidad angular ejercida según el
eje de simetría del anillo genera fuerzas de Coriolis oscilantes en el plano del anillo que
inducen el modo secundario o sensor a 45º del modo primario. Los movimientos de este
último modo son captados por los electrodos capacitivos también dispuestos sobre la
periferia del anillo. También en este caso la frecuencia de resonancia es sintonizable
electrostáticamente. Este concepto tiene varias ventajas sobre los presentados
anteriormente usualmente subrayadas en la literatura, entre las que citamos: a) la
simetría propia del anillo lo hace poco sensible a vibraciones espurias inducidas por el
medio, b) dado que ambos modos (excitación y sensado) comparten la misma
frecuencia de resonancia la sensibilidad es amplificada por al factor de calidad Q de la
estructura, c) su funcionamiento es poco sensible a la temperatura que afecta igualmente
ambos modos de oscilación, d) las asimetrías de masa o rigidez, propias del proceso de
fabricación, pueden ser compensadas electrónicamente mediante los electrodos de
balanceo.

Electrodos sensores
Anclaj Flejes de sostén


Anillo
vibrante
Modo Modo sensor

Electrodos de
i ió
Figura 2.11: Principio de giróscopo MEMS de anillo vibrante.

Se espera que a corto plazo una línea de diseño introducida recientemente en la


Universidad de Michigan basada en una estructura íntegramente construida en
polisilcon permita fabricar giróscopos de calidad táctica con ruido de fondo de una
densidad del orden de 0.001[º/s]/ Hz (Ayazi/Najafi, 1998). La tabla 2.2 resume algunos
parámetros de perfomance actualmente alcanzables mediante esta tecnología.

Rango de operación º/s 1000 Comentarios

Sesgo al encendido º/h <0.06 1

Inestab. sesgo en func. º/h 0.05 1min

Inestab. fact. esc. % <1 -40º-85ºC

Ruido º/s rms <0.1 0-45Hz

Tabla 2.2

27
2.2.3 Giróscopos ópticos
El principio en el que se basan todos los giróscopos ópticos es el efecto descubierto por
el físico francés Georges Sagnac en 1913 y que lleva su nombre. Los primeros
instrumentos que utilizaron este efecto fueron los ring laser gyro desarrollados a partir
de 1975. A partir de 1985 hace su aparición una nueva tecnología basada en este efecto
denominada fiber optic gyros (FOG) y considerada en un principio como una alternativa
de bajo costo de la primera. La motivación fundamental de los giróscopos ópticos
fueron desde un principio los requerimientos de precisión y rango dinámico impuestos
por los nuevos sistemas strapdown. Otras ventajas son: una inherente lectura digital,
arranque casi instantáneo, baja sensibilidad a las perturbaciones mecánicas, total
independencia mecánica de su medio ambiente. Junto con la tecnología MEMS
acaparan actualmente la mayor atención de los centros de desarrollo de instrumentos
inerciales.

r


A: área

Figura 2.12 Principio de Sagnac

La Fig. 2.12 ilustra el principio de Sagnac. Supóngase que el anillo, al que es solidario
el punto P, rota alrededor de su eje de simetría a una velocidad angular 0. Sean t+
(trayecto en azul) y t- (trayecto en rojo) los tiempos que emplean sendos rayos de luz
partiendo de un mismo punto P y moviéndose respectivamente en el sentido antihorario
y horario hasta reencontrar a dicho punto. Es fácil advertir de la geometría del problema
que si c es la velocidad de la luz y A el área incluida en el anillo, dichos tiempos
satisfacen:

ct  2r  r t  4r 2  4 A


  t  t  t  2  2 (2.5)
ct  2r  r t  c r  2 2
c
4A
 L  ct  (2.6)
c

De la anterior, resulta una diferencia del camino recorrido por ambos rayos que, en
primera aproximación ( c 2  r 2 2 ), resulta proporcional a la velocidad angular . Un
desarrollo en elementos diferenciales de ángulo permite demostrar que el área en la
expresión (2.5) es la encerrada por el camino óptico independientemente de la forma
que éste tenga. El efecto Sagnac habilita así la medición absoluta del movimiento
angular de un sistema de referencia solidario al anillo.

28
Giróscopos de láser en anillo (RLG )
Consisten en una cavidad óptica resonante en camino cerrado con 3 o más espejos
dentro de la cual la luz puede propagarse en ambas direcciones. La cavidad provee una
ganancia láser que permite sostener la resonancia de ambos rayos en contra-propagación
a una frecuencia compatible con la longitud de los respectivos caminos ópticos.
Típicamente la ganancia es producida por un gas de He-Ne que llena el interior de la
cavidad. La cavidad es construida con material de muy baja expansión térmica de modo
de limitar los cambios mecánicos de longitud del camino óptico. La expansión
remanente es compensada mediante un servo piezoeléctrico que desplaza alguno de los
espejos de modo de mantener la resonancia centrada en el pico de ganancia del gas. Sin
rotación absoluta, la cavidad genera dos rayos resonantes a igual frecuencia con un
número entero p de longitudes de onda encerrados en el camino óptico.
Una rotación en un eje ortogonal al plano del camino óptico determina un cambio en
ambos caminos ópticos dado por (2.6). La condición de auto sustentación de la
resonancia dada por la invariancia del entero p se traduce en sendos cambios en las
longitudes de onda en los rayos en pro y contra de la rotación en el eje sensible. Esta
condición es expresada mediante las relaciones:

p  Lp /  p  Lc /  c  L  Lp  Lc  p ( p   c )  p  (2.7)

Con L expresada por la (2.6) la rotación induce una frecuencia de batido entre ambos
rayos dada por:

L 4 A 4 A
v  v v (2.8)
L cL L

Para valores típicos de A, , L y , L/L= < 10-6, lo que refleja la gran estabilidad
y pureza espectral requeridas de la cavidad láser para asegurar la factibilidad de la
medición de la velocidad angular mediante un RLG. En cuanto a la frecuencia de batido
es posible medir rangos de valores desde algunos Hz a algunos MHz, lo que habla del
amplio rango dinámico del sensor. La frecuencia de batido se mide mezclando ambos
haces en un arreglo de prismas (“prisma mezclador” en la Fig. 2.13) situado en uno de
los vértices lo que produce un patrón de interferencia cuya periodicidad espacial puede
ser medida con fotodiodos. La frecuencia de batido, producto de la rotación angular,
induce una velocidad de desplazamiento de las bandas de interferencia proporcional en
dirección y sentido a la velocidad de angular. El pasaje de las bandas bajo el campo
óptico de los diodos produce impulsos que contados durante un intervalo fijo son una
medida del ángulo total rotado en dicho intervalo respecto de una terna inercial. Puesto
que cada pulso corresponde a un período igual a 1/v, para cada pulso el ángulo rotado
será:

   / v  L / 4 A (2.9)

Lo que da la medida de la sensibilidad (resolución) del instrumento (2 a 6 arcseg) en


tanto que sensor de ángulo (RIG).

29
Fotodetector de lectura

Prisma mezclador
Bandas de interferencia

Tubo laser Carcasa

Anodo
Eje sensible de
rotación  Actuador
vibratorio (dither)
Espejo c/control
piezoeléctrico
Espejo plano
Cátodo
Figura 2.13: Diagrama de un giróscopo de laser de 3 espejos.

Para muy bajas velocidades angulares las frecuencias de resonancia de ambos modos de
propagación resultan muy cercanas ( v  0 en la Ec. (2.8)). En estas condiciones y por
razones similares a las que provocan la sincronización de osciladores electrónicos aun
muy levemente acoplados, v en (2.8) puede caer abruptamente a cero limitando la
resolución del instrumento. El acoplamiento entre ambos modos en contra propagación
se debe a la mutua transferencia de energía debida a la dispersión hacia atrás de la
radiación (back-scattering) incidente sobre la superficie de los espejos de la cavidad. La
técnica mas usual para evitar la sincronización entre resonancias consiste en provocar
mecánicamente una fluctuación angular (mechanical dither) en el eje sensible del
instrumento con lo cual se minimiza el tiempo en que el sensor permanece en zona de
sincronía de resonancias. Algunos efectos secundarios de este paliativo y sus soluciones
son discutidas por Smith, (1987)

Los altos costos de producción de este tipo de instrumento están ligados a la precisión
del pulido y a la calidad del material de los espejos y del tubo laser. Por un lado, es
necesaria una baja dispersión hacia atrás (usualmente 0.02%) para lograr una buena
resolución y por otro, una alta reflectividad (usualmente 99.97%) para reducir las
perdidas en la cavidad y mejorar la precisión del factor de escala (alto “Q” implica
precisión en ). El estado del arte en tecnología del pulido de espejos permite hoy en día
lograr, sin usar la fluctuación angular, resoluciones del orden de 0.1º/s (ver Smith,
1987).

Giróscopos interferométricos de fibra óptica (IFOG)


Las ventajas inherentes de los giróscopos ópticos motivaron una nueva línea de
desarrollo de este tipo de instrumentos que pudiese paliar las desventajas de los RLG
principalmente asociadas a los costos de producción y la insensibilidad para bajas
velocidades angulares por sincronización de las resonancias. En los años 70´s se
demostró en la Universidad de Utha (ver Barbour, 2004) la posibilidad de medir un
patrón de interferencia debido al efecto Sagnac usando dos haces de luz en contra-
propagación dentro de una fibra óptica cerrada en bucle. En lugar de una cavidad
resonante cerrada y controlada por espejos generando internamente una luz coherente
por efecto láser el giroscopio interferométrico de fibra óptica (IFOG) consiste en espiras

30
de fibra óptica que constituyen un camino cerrado de luz procedente de una fuente
externa tal como un diodo superluminiscente.


N espiras de
fibra óptica
Detector
Divisor
Fuente de luz
Figura 2.14 Esquema de un giróscopo de fibra óptica.

A la entrada, este haz es dividido en dos haces en contrapropagación (Fig. 2.14) que son
luego recombinados al final de su recorrido (entre 100m y 3Km). El detector
interferométrico mide la diferencia de fase  entre ambos haces que, a su vez, es una
medida de la diferencia de camino recorrido y por tanto proporcional a la velocidad
angular 

L 8NA 4RL
  2   (2.10)
 c c

Retroalimentando la fase medida mediante un controlador proporcional+integral sobre


la frecuencia generada por el circuito de potencia óptica es posible anular la diferencia
de fase. De este modo, el IFOG se comporta como un instrumento de cero (donde su
sensibilidad es máxima) en el cual el desplazamiento en la frecuencia óptica es una
medida del ángulo mecánico rotado con lo cual el instrumento se convierte en un RIG.
Esta es la configuración preferida en muchas aplicaciones debido a su mayor rango
dinámico y mayor estabilidad del factor de escala.

Un IFOG tiene algunas ventajas notables frente al RLG: no requiere de alto voltaje, al
no usar una luz coherente de ancho de banda puntual no tiene el problema de
insensibilidad para bajas velocidades angulares (no requiere dither), finalmente, sus
costos son, en general, más reducidos. Por otra parte, la variancia del error en la medida
en  resulta ser inversamente proporcional al la longitud da la fibra óptica, por lo que
la perfomance del instrumento es escalable con la longitud de la fibra. Algunos
resultados permiten esperar que la perfomance de los IFOG llegue a superar a la de los
RLG. Ver por ejemplo el IFOG desarrollado por Sanders et al. (2002) con estabilidad
del sesgo <0.0003°/hr, densidad espectral de ruido <0.00008 deg/√hr y error en factor
de escala <0.5 ppm. Los esfuerzos más recientes en la tecnología IFOG se concentran
en su abaratamiento y miniaturización.

2.3 Unidades de medidas inerciales (UMI)

Los instrumentos inerciales de un sistema de navegación strapdown normalmente están


agrupados dentro de un gabinete (o carcasa) y al cual son mecánicamente solidarios.

31
Además de los instrumentos, el gabinete alberga la electrónica de sensado, de filtrado y
de acondicionamiento de las señales y, en ciertos casos, de digitalización de las
mediciones. A dicho gabinete, incluyendo los instrumentos y la correspondiente
electrónica, se lo denomina Unidad de Medidas Inerciales (UMI). El número de
sensores inerciales en una UMI es variable dependiendo de la aplicación. En este
volumen se considerarán UMI´s completas, es decir, aquellas diseñadas para proveer
medidas vectoriales de fuerza específica y velocidad angular inerciales según tres ejes
mutuamente ortogonales denominados ejes sensibles de la UMI. Usualmente, esto se
logra disponiendo una terna de giróscopos y otra de acelerómetros paralelos a los ejes
sensibles (xm, ym y zm en la Fig. 2.15). Mediante el cálculo de las correspondientes
proyecciones, las 6 magnitudes inerciales pueden también obtenerse con un número
redundante de instrumentos (superior a 6) y no necesariamente dispuestos
ortogonalmente. Se considera como mediciones provistas por la UMI las 6 componentes
de las magnitudes inerciales vectoriales proyectadas según sus ejes sensibles.

x-giro x-acel
y-giro xm
y-acel z-giro   xy
mx
ym z-acel
 xz
m
z
Figura 2.15: Unidad de medidas inerciales.

2.3.1 Modelo matemático de una UMI


Es necesario distinguir entre las magnitudes inerciales físicas proyectadas sobre los 3
ejes sensibles ortogonales de la UMI que denotamos vectorialmente como
  
m b (f b ó ωb )   3 y los valores medidos denotados como m b (f b ó ωb )   3 .
Supondremos que ambas ternas de valores están vinculadas mediante el siguiente
modelo matemático cuya estructura es formalmente idéntica para ambas ternas de
magnitudes:

mb   I  m  mb  b m  ξ m (2.11)

 x  xy  xz 
 
 m  σ m    yx y  yz  ; σ m   9 (2.12)
  zx  zy  z 
 m

Donde: I es la matriz identidad de dimensión 3; las componentes del vector b m   3


representan los sesgos de medida según cada dirección; ξ m es un vector de
perturbaciones estocásticas aditivas; los elementos de la diagonal de  m corresponden a
los errores en el factor de escala de cada medición de la terna y los elementos ij fuera
de la diagonal son los pequeños ángulos en radianes que describen el error angular de

32
alineación entre la dirección sobre la que es tomada la componente de la medida * y el
correspondiente eje sensible nominal de la UMI. En la Fig. 2.15 se compara la dirección

sobre la que se adquiere la componente mx con el eje x nominal. Para pequeños valores
de  xy y  xz los efectos de la no-ortogonalidad y del error en el factor de escala para la
componente x admiten la aproximación de 1er orden: (1   x )mx   xy my   xz mz .
Similarmente para las otras filas de la matriz adimensional (2.12). El conjunto de
parámetros que caracterizan la parte determinista del modelo de cada terna (2.11) se
agrupan, respectivamente, en los vectores p m  12 , con m=f ó  según el tipo de
sensor. Las componentes de cada vector p m son medidas experimentalmente en mesas
de ensayo y usualmente el fabricante provee valores promedios para la población de
instrumentos de cada tipo. La performance de una unidad inercial está asociada a la
estabilidad y precisión con que se conoce cada vector p m y las características
estadísticas de las perturbaciones estocásticas.

2.3.2 Caracterización de las perturbaciones estocásticas


Las perturbaciones estocásticas están representadas por ruidos aditivos caracterizados
por sus momentos de 1º y 2º orden:

Valor medio:  (t)=E (t)


(2.13)
Función de autocorrelación: R (t1 , t2 )  E{(t1 )(t2 )}

Para   t2  t1 , diremos que  es estacionario de 2º orden cuando y sólo cuando


 (t) =constante y R (t1 , t2 )  R ( ) . Para  real la estacionareidad de 2º orden implica
además la condición de simetría R ( )  R () . Si R ( ) es absolutamente integrable
respecto de  es posible definir la transformada de Fourier y su inversa, i.e:
  

  R ()e S
 j 2 f 
R () d      S ( f )   d   R ()   ( f )e j 2 f  df (2.14)
  

Es fácil demostrar que, por ser R () una función real y simétrica, bajo las condiciones
de la definición (2.14), S ( f ) resulta ser también una función real y simétrica. Dado
que el valor medio de la potencia instantánea de la perturbación es
 t : R (0)  E  2 (t ) de acuerdo con la Ec. (2.14) rescrita como:


R (0)  S

 ( f )df (2.15)

S ( f ) es la densidad de potencia a lo largo del eje f  (-¥, ¥) llamada por esto


densidad espectral de potencia (DEP o PSD en inglés). Claramente, puesto que
R (0)  0 , S ( f )  0,  f   , de otro modo sería posible “filtrar potencia negativa”

*
Puede pensarse a esta dirección como aquella sobre la cual yace el sensor inercial individual, distinta del
correspondiente eje nominal de la UMI.

33
en alguna zona del espectro de la señal. Si U es la unidad de medida de , S ( f ) se
expresa en [U]2 /[Hz] .

Ruido blanco continuo


Se llama así al proceso estocástico n(t) estacionario de 2º orden tal que:

i ) E n(t )  0
(2.16)
ii ) S n ( f )  cte.  2n [U ]2 /[ Hz ] ;   n [U ] / [ Hz ]

Formalmente, a partir de la definición anterior y de las (2.14) es posible decir que la


función de autocorrelación del ruido blanco es la función generalizada de Dirac, i.e.:
Rn ()   2n ()[U ]2 . Nótese que las unidades de () deben ser [seg]-1.

Ruido “markoviano”

n(t) S. L. (t)

Figura 2.16.

En referencia a la instrumentación inercial, el sentido habitual del concepto de un “ruido


markoviano” corresponde a la respuesta a un ruido blanco de un sistema lineal estable
(sin polos en el semi-plano complejo derecho abierto) * que se representa como:

ν  Aν   (2.17)

Movimiento browniano
El movimiento browniano o proceso de Wiener tambien llamado caminata aleatoria es
el “ruido markoviano” que surge de integrar un ruido blanco a partir de un dado instante
inicial to.

w(t) 1/s w(t)[U][T]


to
Figura 2.17.

Su modelo matemático es similar al de la Ec. (2.17) con A=0 y condición inicial nula.
Teniendo en cuenta que w(t) es estacionario se toma to=0. En el caso escalar el ruido
browniano queda definido por la relación:
t
w(t )   w ()d   dw(t )  w (t )dt (2.18)
0

Sus momentos de 1er y 2º orden resultan respectivamente:

*
Convendría calificarlo “en sentido restringido”. El lector puede consultar la definición general de
proceso markoviano, por ejemplo, en Bucy/Joseph, 1987).

34
E{w(t )}  0
t1 t2

Rw (t1 , t2 )  E{w(t1 ) w(t2 )}  E   n()d   n()d    (2.19)
 0 0 
t1 t2
  d   d  E{n( )n()}  n2 min(t1 , t2 )

0 0
2n()

De la última expresión se advierte que w(t) no es estacionario de 2º orden. En particular


el valor medio de la potencia instantánea calculado, haciendo t1=t2 en (2.19), crece
linealmente con el tiempo con pendiente igual a la DEP del ruido blanco que lo genera:
 2n .

 2w (t )[U ]2 [T ]2  Rw (t , t )   n2 t (2.20)

La Fig. 2.16 demuestra un ejemplo de integración del ruido blanco de medida de un


giróscopo que mide velocidad angular en reposo. La DEP del ruido blanco en la
velocidad angular es 2  0.992 [ / seg]2 /[Hz] El resultado es un proceso de Wiener,
denominado ángulo browniano cuyo desvío estándar calculado a los 1000seg. es:
   t[seg][]  31,3[] . La Fig. 2.16 a) muestra un conjunto de 1000 realizaciones
de dicho proceso en el intervalo 0-1000 seg. Se advierte una dispersión de las curvas
creciente con la raíz cuadrada del tiempo. La Fig. 2.16 b) muestra un diagrama de
barras de las muestras en el instante t=1000seg en el que puede observarse su relación
con el desvío estándar teórico de la muestra.

En presencia de ruido blanco en la medición de la fuerza especifica por parte de un


acelerómetro, el proceso análogo al ángulo browniano es denominado velocidad
browniana con desvío estándar:  v  f t[seg][m] /[seg] , siendo f2 [m / seg]2 /[Hz] la
DEP del ruido blanco sobre la medida.

a) b)

Figura 2.18: Ejemplo de ángulo browniano de un giróscopo.

35
Superposición de perturbaciones estocásticas
Las perturbaciones estocásticas que afectan las mediciones inerciales según el modelo
(2.11) son, en general, una superposición de los procesos aleatorios mencionados en el
párrafo anterior es decir:

ξ m  nm   m  bm ; m  , f
(2.21)
bm  m  w ; bm (0)

El proceso bm representa la inestabilidad del sesgo atribuible a la superposición una


deriva temporal de valor medio no nulo m con un proceso de Wiener como el
representado en la Fig. 2.17. La condición inicial bm (0) es una variable aleatoria de
valor medio nulo dado que en caso contrario su valor medio queda incluido en el sesgo
bm .

Una representación que engloba todos los procesos incluidos en ξ m , m  , f y que


usaremos más adelante, es la siguiente:

 Z 0  
ζ m   mζ m  ηm    ζ m     ; ζ m (0)  v.a.(0, Pζ , m )
 0 0 m  w  m
ξ m   mζ m  n m   I I  ζ m  n m (2.22)
  N (0, Q ); w  N (m , Qw ); n m  N (0, Qm )

En las cuales   N (, Q) denota un proceso vectorial estocástico, continuo,


estacionario, independiente y normal de valor medio  y densidad espectral matricial
Q. Mientras que con v.a.(v , Pv ) se indica al vector aleatorio v de valor medio v y
matriz de covariancia Pv .

Dado que las medias inerciales en la práctica son integradas, es usual definir las
siguientes perturbaciones integrales:

i    m dt  ni ; (i, m)  (, ) /(V , f ) (2.23)

Para las cuales, según sea i= ó V se hablará de ángulo integral o velocidad integral
respectivamente. El ángulo y la velocidad brownianos son casos particulares de
procesos de la forma (2.23).

2.4 Performance y categorías de los instrumentos inerciales

El procedimiento para la determinación de los coeficientes del modelo (2.11) es


conocido con el nombre de calibración mientras que se denomina análisis del ruido a la
determinación de las estadísticas de las perturbaciones (2.21) (ver IEEE Std.
1554/2005). La performance o desempeño de una UMI depende de estos parámetros
cuyos valores nominales son publicados por el fabricante en las hojas de datos
usualmente acompañados por la dispersión de los mismos o, en su defecto, por los
valores máximos y mínimos sobre la población. En aplicaciones de precisión y en

36
navegación integrada estos parámetros deben ser determinados por el usuario para el
instrumento específico en uso. Como se describe en el Capitulo 8, en el segundo caso la
calibración se hace en tiempo real y forma parte del esquema de estimación de las
incertidumbres presentes. En ambos casos lo que importa es la inestabilidad o
repetibilidad del parámetro. La primera denominación se refiere a su variabilidad a lo
largo de la navegación o de la vida útil del instrumento, la segunda, a cambios entre
encendidos consecutivos. En navegación integrada la inestabilidad es tomada como la
incertidumbre inicial del parámetro correspondiente mientras que el modelo y las
estadísticas del ruido son utilizados en el diseño del filtro de fusión de datos.

Otros datos típicos de la performance de una UMI son: el rango dinámico de los
instrumentos, la nolinealidad del factor de escala expresado en % del rango, el ancho de
banda AB[Hz] y la sensibilidad del sesgo y del factor de escala con la temperatura.
Según sea el nivel de calidad la inestabilidad del sesgo (rate/acceleration bias
instability en ingles) se expresa para los giróscopos en [º/hr] o en [º/seg] y en el caso de
los acelerómetros en [mg] o [g].

El ruido blanco de medición aditivo y continuo (rate white noise o acceleration white
noise), caracterizado por su densidad espectral de potencia DEP, es también
denominado ARW (angle random walk) o VRW (velocity random walk) según se trate
de los giróscopos o de los acelerómetros y expresado según las siguientes formas
equivalentes:

DEPARW: 1[°/seg]/ Hz=1[°/seg] = 60[°/hr],


DEPVRW: 1[g]/Hz=9,8[m/seg]/[seg] = 588[m/s]/hr].

La resolución del instrumento esta íntimamente ligada a la potencia del ruido fondo y
éste el ancho de banda AB del instrumento lo que conduce a las siguientes relaciones
entre la resolución y el ARW o el VRW:

Resolución del giróscopo [°/seg](rms)=


={DEP[°/seg]2/[Hz]*AB[Hz]}1/2=ARW([°/seg]/[Hz])*AB[Hz]

Resolución del acelerómetro [g](rms)=


={DEP[g]2/[Hz]*AB[Hz]}1/2=VRW([g]/[Hz])*AB[Hz]

Los instrumentos inerciales se clasifican de acuerdo a su performance. En general se


conviene en agruparlos según las clases: calidad regular (rate grade), tácticos y
estratégicos. En particular para los giróscopos se considera además un nivel de calidad
llamada de aviación.

• Calidad “Navegación”: Horas de navegación sin ayuda.


• Calidad “Aviación”: Pueden alcanzan calidad navegación con ayuda externa
• Calidad “Táctico”: Navegación sin ayuda en segundos o pocos min. Pueden
alcanzar calidad navegación con ayuda externa.
• Calidad “Regular (o rate grade)”: Sólo útiles con ayuda externa.

Tabla 2.3: Categorías de Giróscopos.

37
Parámetro/Calidad Rate grade Tácticos Aviación RLG Navegación
MEMS MEMS IFOG IFOG RLG IFOG

Angulo browniano >0,5 0,5-0,05 <0.05 <0,001


(ARW) [°/h]

Inestabilidad del >10 1-10 <0.1 <0,01


sesgo [°/h] (1nm/hr)

Inestabilidad del 0,1-1 0,01-0,1 <0.01 <0,001


factor de escala %

Rango dinámico 50-1000 >500 50-300 >400


[°/seg]

Ancho de Banda >70 ~500 ~100 100-500


[Hz]

Costo UMI $US 500-5K 5K-20K 20K-50K 50-100K

Tabla 2.4: Categorías de Acelerómetros.


Parámetro/Calidad Regular MEMS Tácticos Navegación

Vel. browniana (VRW) 0.5-5mg/Hz 50-500 [mg/ Hz] <10 [g/


[g/h] (airbag) Hz]

Inestabilidad del sesgo 10-100[mg] 0.2-1[mg] 10-100 g


[g]

Inestabilidad del factor >1% 100-1000 ppm <100ppm


de escala %.

Rango dinámico [g] 2-50 (airbag) >50 2-50

Ancho de Banda [Hz] DC-400 50-300 50-300

Las Tablas 2.3 y 2.4 indican los rangos de performance usuales establecidos para estas
denominaciones así como las tecnologías más usadas al presente.

38
Capítulo 3
Cinemática de la Orientación
de un Cuerpo en el Espacio

Al igual que su posición, la orientación de un cuerpo en el espacio es relativa al sistema


de referencia elegido. Los sistemas de referencias considerados en navegación son
bases ortonormales, o sea, formadas por ternas de vectores de módulo unitario
(versores) mutuamente ortogonales en el espacio euclidiano de dimensión 3: 3. Dadas
tres direcciones ortogonales o ejes en el espacio 3 subsiste la ambigüedad de decidir el
sentido del versor que “orienta” a cada eje. Existen sólo dos maneras de asignar
“flechas” a estos ejes sin que una asignación pueda obtenerse a partir de la otra
mediante alguna rotación de los tres ejes en su conjunto. A cada una de estas maneras
las llamamos “orientación de la terna” y por definición llamaremos a una positiva y a la
otra negativa. Aunque definiremos más precisamente este concepto, la orientación
positiva suele llamarse “de la mano derecha” por que corresponde a cerrar el primer
versor sobre el segundo como los dedos sobre la palma de la mano derecha mientras que
el pulgar de la misma mano indica la dirección del tercer versor. Para evitar
ambigüedades, por convención se adopta entonces la orientación positiva para las ternas
de referencia.
Un objetivo primordial de la navegación consiste en conocer en todo instante tanto la
orientación del vehículo respecto de las diversas ternas de referencia relevantes para la
aplicación en curso, cuanto, las transformaciones de coordenadas que vinculan a dichas
ternas. Para describir y caracterizar matemáticamente la orientación relativa entre ternas
se utilizan ciertos conjuntos de parámetros, llamados parametrizaciones, cuyos valores
numéricos son actualizados permanentemente por el algoritmo de navegación. En este
capítulo se introducen las parametrizaciones más usadas en la práctica para la
orientación de un cuerpo.

3.1 Parametrizaciones de la orientación de un cuerpo en el espacio

La Fig. 3.1 muestra dos ternas de vectores ortonormales de orientación positiva donde
una de ellas {a} es considerada la de referencia y la otra {b} la de un cuerpo rígido dado.
La condición de orientación positiva (regla de la mano derecha) es equivalente a decir
que el producto triple de sus componentes satisface:

a1  (a 2  a3 )  1; b1  (b 2  b3 )  1 (3.1)

Los ejes de la terna {b} apuntan normalmente según direcciones del cuerpo de interés
para la aplicación. Por ejemplo, en un vehículo el eje x suele estar en el eje longitudinal,
cercano a la dirección del desplazamiento y los otros dos en un plano ortogonal con uno
de ellos paralelo a la vertical en condiciones nominales de movimiento. Se supondrá
que la terna {b} se obtiene trasladando la terna {a} paralela a sí misma al punto p de la
localización del cuerpo y aplicándole una rotación continua arbitraria en un intervalo de
tiempo [to,t) tal que {b(to)}{a}.

39
Como interesa definir un conjunto de parámetros que caractericen la orientación* de {b}
respecto de {a}, uno de los propósitos de este capítulo es introducir las
parametrizaciones más usuales de la orientación de un cuerpo as saber:

 La matriz de cosenos directores (MCD).


 El eje y el ángulo de Euler.
 Los ángulos de Euler.
 Los parámetros simétricos de Euler o cuaterniones.

a3 ba
b3
b2

P
a2
a3
a1 b1

a2
a1
Figura 3.1: Orientación relativa de dos ternas en el espacio

No es de extrañar que estas parametrizaciones estén íntimamente relacionadas con un


clásico teorema de Euler (1707-1783) sobre las rotaciones de un cuerpo con un punto
fijo en el espacio (ver teorema de Euler más abajo). Por esta razón es que,
primeramente estudiaremos las rotaciones arbitrarias alrededor de un punto lo que nos
conducirá a formular más precisamente el teorema de Euler y desarrollar las distintas
parametrizaciones de la orientación.

3.1.1 Rotaciones alrededor un punto


La velocidad lineal instantánea v(t)3 de un punto p3 en rotación alrededor de un
eje posiblemente variante en el tiempo que contiene al origen de coordenadas O, fijo en
el espacio euclidiano 3, está dada por el producto vectorial:

v (t )  ω(t )  p(t ) (3.2)

Donde el vector (t)3 tiene la dirección del eje de rotación y la magnitud de la


velocidad angular instantáneos (ver Fig. 3.2). De ahora en más, denotamos con v a al
elemento de 3 constituido por las coordenadas de v3 respecto de una terna {a}. En
función de las coordenadas respecto de una terna de referencia fija en el tiempo y
positiva {a} centrada en O, la ecuación anterior se reescribe como:

*
En ingles “attitude” dio lugar al anglisismo “actitud”, usual en la jerga técnica en nuestro idioma.

40
v a  p a (t )  ω a (t )  p a (t )  S(ω a (t ))p a (t ); v a , p a (t ), ω a (t )  3 (3.3)

a3 (t)

V=(t)P

O
a2
a1
Figura 3.2

La matriz antisimétrica S( v a ) representa al operador producto-vectorial v  expresado


en coordenadas de {a} es decir:

 0 v3a v2a 
 
S( v )   v3a
a
0 v1a   ( v  u) a  S( v a )u a ; v a , u a   3 ; v, u  3 (3.4)
 v2a v1a 0 


Para lo que sigue, conviene además introducir la definición de versor α  α /  ;   α ,
3 y de las siguientes ternas de números:

1  0  0 
e1  0  ; e2  1  ; e3  0 
    (3.5)
0  0  1 

Usando la definición (3.4), la ecuación diferencial lineal variante en el tiempo (3.3) y su


solución en función de la matriz de transición o matriz fundamental, Ca (t , t0 ) se
expresan, respectivamente, como sigue (ver por ejemplo Zadeh/Desoer, 1963):

p a (t )  ω a (t )  p a (t )  S(ω a (t ))p a (t ) (3.6)

p a (t )  Ca (t , t0 )p a (t0 );
(3.7)
 a (t , t )  S(ω a (t ))Ca (t , t ); Ca (t , t )  I
C 0 0 0 0

Las Ecs. (3.7) describen la evolución temporal de las coordenadas, respecto de la terna
{a}, de la posición del punto móvil p sometido a una rotación caracterizada por el vector
velocidad angular instantáneo (t), a partir del instante t0.

41
Demostramos a continuación una propiedad importante de la matriz Ca (t , t0 ) , que
llamaremos de rotación, solución de la ecuación diferencial matricial (3.7).

Propiedad 1:
La matriz de rotación a coeficientes reales Ca (t , t0 ) solución de (3.7) es:
i ) Ortogonal (unitaria) : Ca (t , t0 )T Ca (t , t0 )  I ; t  p a (t )  p a (t0 ) ; t (3.8)
  
ii ) Propia : det(Ca (t , t0 ))  c1 (t )  (c2 (t )  c3 (t ))  1  0; t (3.9)

  
Donde c1 (t ), c2 (t ), c3 (t ) representan las columnas de Ca (t , t0 )

Usamos primeramente (3.7) y la definición (3.4) para obtener:

d a
C (t , t0 )T Ca (t , t0 )  Ca (t , t0 )T S(ω a (t ))T Ca (t , t0 )  Ca (t , t0 )T S(ω a (t ))Ca (t , t0 )
dt
 Ca (t , t0 )T (S(ω a (t ))  S(ω a (t ))Ca (t , t0 )  0

De la anterior surge que: Ca (t , t0 )T Ca (t , t0 )  constante=Ca (t0 , t0 )T Ca (t0 , t0 )  I ; t lo


2
que implica i) y, visto que: p a (t )  p a (t )T p a (t )  p a (t0 )T Ca (t , t0 )T Ca (t , t0 )p a (t0 ) 
2
p a (t0 ) ; t su consecuencia directa la preservación de la norma del vector p a (t0 )
bajo la transformación Ca (t , t0 ) . Usando ahora la propiedad del determinante de un
producto de matrices y la ortogonalidad de Ca (t , t0 ) (Ec. (3.8)) resulta:

 det(C (t , t )) 
2
a
0
 1; t  det(Ca (t , t0 ))  1 (2.10)

Por la continuidad de la solución de la ecuación diferencial (3.7) respecto de sus


condiciones iniciales y, siendo además det(Ca (t0 , t0 ))  1 , resulta que
  
det(Ca (t , t0 ))  1, t  t0 . La ortonormalidad de las columnas c1 (t ), c2 (t ), c3 (t ) y la
definición de determinante permiten finalmente comprobar ii).

De la propiedad anterior surge que si ((t ), v(t )) y ((t ), v(t )) son, respectivamente, un
par valor/vector propios de Ca (t , t0 ) y sus conjugados, entonces:

Ca (t , t0 ) v (t )   (t ) v (t ) 

Ca (t , t0 ) v (t )   (t ) v (t )  (3.11)
2 2 2
v (t )T Ca (t , t0 )T Ca (t , t0 ) v (t )  v (t )   (t ) v (t )   (t )  1

Como Ca (t , t0 ) es real y sus tres valores propios cumplen que


det(Ca (t , t0 ))  1 2  3  1 , de la Ec. (3.11) resulta, a menos de un reordenamiento de
índices, que: 1 (t )  1 ; 2 (t )  3 (t ) , 2 (t )  3 (t )  1 . Esto incluye el caso
1 (t )  2 (t )  3 (t )  1 correspondiente a la “no rotación” Ca (t , t0 )  I (que ocurriría,

42
por ejemplo, si (t)  0, pero no solamente en este caso). Lo visto hasta ahora permite
enunciar:

Propiedad 2:
Toda rotación alrededor de un punto fijo admite en todo instante t un único eje

invariante θ(t ) tal que:
 
θ(t )  Ca (t , t0 )θ(t ) (3.12)

Denotaremos, en lo que sigue con ω (t ); t  to al vector de la velocidad angular
a
ab

instantánea de una terna {b(t)} que rota respecto de la terna fija {a} expresado en
coordenadas de esta última con el origen O coincidente en ambas ternas (punto fijo, ver
Fig. 3.3) y supondremos que en un instante to {b(to)}≡{a}. Operando con la solución de
(3.7) sobre cada uno de los componentes de {a} teniendo en cuenta que aia  ei ; i  1, 2,3
(definiciones (3.5)) se obtiene:

b (t )
a
1
b 2a (t ) b 3a (t )  Ca (t , t0 ) a1a a a2 a3a   Ca (t , t0 ) I (3.13)

De este modo y de acuerdo con (3.9), la terna {b(t)} permanece positiva t  t0 .

a3 •p
b3(t) ω aab (t )

b2(t)

O a2
a1

b1(t)

Figura 3.3: Rotación de una terna {b} respecto de una terna fija {a}.

3.1.2 Matriz de cosenos directores (MCD)


Consideremos ahora dos ternas ortonormales positivas {a} y {b} no coincidentes que
comparten el mismo origen O, donde la segunda sea el resultado de una rotación
continua arbitraria a partir de la primera (con el origen O como punto fijo). Según la
Propiedad 1, existe una matriz de rotación Ca ortogonal y propia tal que, como en
(3.13), vincula ambas ternas según:
  
b   C a   C  c (t ), c (t ), c (t )
a a a a
1 2 3
(3.14)


Notar que en el caso trivial de no rotación todo eje orientado es invariante.

43

Donde, la columna ci (t ) de Ca contiene las coordenadas de bi en la base {a}. Por otra
parte, un dado vector p3 se expresa en coordenadas según cada terna de acuerdo con:

p   pia ai   pibbi (3.15)


i i

De acuerdo con (3.14), cada bi se expresa como una combinación lineal de los
elementos de la base {a} según: bi   j Ca ( j , i )a j donde Ca ( j , i ) es el coeficiente (j,i)
de la matriz Ca . Por lo tanto de la (3.15) se obtiene:

p   pia ai   Ca ( j , i ) piba j  pia   Ca ( j , i ) pib


i j i i

Como se ve, la matriz de rotación Ca es la misma que transforma las coordenadas de un


punto en la terna {b} en las coordenadas del mismo punto en la terna {a}. Por esto es
que introducimos la notación, usada de ahora en más: Cba  Ca . Por lo que de la
ecuación anterior resultan:

p a  Cba pb  Ca p b
(3.16)
pb  Cba p a  (Ca ) 1 p a  (Cba )T p a

Donde la última igualdad es una consecuencia directa de la (3.8).

a3
b3

2,3 b2
a2
Cba (3, 2)

C ba (2, 2)
a1
b1
Figura 3.4

Usando el hecho de que los productos escalares  ai , v ; i=1,2,3, de un vector v3


por los elementos de una base ortonormal corresponden a sus componentes en dicha
base (ver Gel´fand, 1961 pp 22), cada elemento bi se expresa a su vez como:

bi    a j , bi  a j   Cba ( j , i )a j ; i, j  1, 2,3 (3.17)


j j

44
Por lo que los coeficientes Cba ( j , i ) son los cosenos directores  a j , bi  cos  j ,i  ;
i, j  1, 2,3 de los elementos de {b} sobre los elementos de {a} (ver Fig. 3.4).

Hemos visto entonces que entre dos ternas positivas con un mismo origen O existe una
única MCD Cba que describe la rotación relativa entre ambas ternas de acuerdo con
(3.14) y a su vez convierte las coordenadas de un vector de 3 expresadas en cada terna
de acuerdo con las Ecs. (3.16). Más aun, la composición de rotaciones y de cambios de
coordenadas son fácilmente descritas mediante el producto usual de matrices. Estas
propiedades hacen de la MCD una de las parametrización fundamentales tanto desde el
punto de vista práctico como teórico para especificar la orientación de un cuerpo. Sin
embargo, dadas las 6 condiciones de ortonormalidad entre sus columnas:

  0, si i  j
ciT c j   (3.18)
1, si i  j

resultan redundantes 6 de los 9 parámetros que la caracterizan aunque sean necesarios


actualizarlos todos durante la navegación. Más aun, en cada instante de actualización
deberán validarse numéricamente las condiciones (3.18) a riesgo de falsear resultados
provenientes de suponer erróneamente que (Cba )T  Cba . Esta desventaja tiene como
lado positivo la posibilidad de usar la redundancia paramétrica para supervisar la
propagación de errores. Para ciertas aplicaciones estas desventajas pueden hacer
preferible otras parametrizaciones como las que introducimos más adelante.

3.1.3 Angulo vectorial de rotación o eje y ángulo de Euler


De acuerdo con la Propiedad 2, el resultado final de cualquier rotación de un cuerpo
alrededor de un punto fijo admite una única dirección invariante bajo la rotación que
corresponde al valor propio unitario de la MCD asociada. La importancia en si misma
de esta propiedad justifica estudiar más en detalle las:

Rotaciones alrededor de un eje de dirección invariante


Cuando la velocidad angular ω aab (t ) se mantiene paralela a si misma, (ver Fig. 5),
definimos el ángulo vectorial θba (t ) rotado por la terna {b} desde {b(t0)}={a} hasta
{b(t)}; (θba (t ) : a  b(t ) ) mediante la integral vectorial:

t
θba (t )   ω aab ()d ; (3.19)
to

La dirección del vector θba (t ) corresponde al eje invariante de la rotación que llamamos
Eje de Euler, mientras que el módulo de ba (t )  θba (t ) , llamado ángulo de Euler, es el
ángulo rotado alrededor del Eje de Euler en el sentido horario cuando el vector θba (t ) es
mirado desde el origen. Por tratarse de un eje invariante, θba (t ) tiene las mismas
coordenadas tanto en {a} como en {b(t)}, lo que justifica suprimir el superíndice sin
riesgo de ambigüedad en la notación.

45
Dado que para este caso particular las siguientes matrices conmutan (de hecho en
cualquier instante de tiempo ambas matrices son proporcionales)

t
S(ω aab (t )); S(θba (t ))   S(ω aab ())d  (3.20)
to

la ecuación diferencial (3.7) admite una solución explícita (ver por ejemplo
Zadeh/Desoer 1963, pp. 340) para la matriz de rotación o MCD introducida mediante la
definición (3.16), solución que escribimos a continuación.

Cba (t )  exp   S(ω aab ())d    exp(S(θba (t ));


t
(3.21)
 to 

•p a
θba (t )
a3
b3(t)
ω aab (t )
b2(t)

a2
a1

b1(t)

Figura 3.5: Rotación con eje invariante de {b} respecto de la {a}.

Relación con la MCD


A partir de la Ec. (3.21) y usando la definición de la exponencial de una matriz
(Zadeh/Desoer, 1963 o Titterton/Weston, 1997, pp. 296), es posible obtener la
expresión de la MCD del cambio de coordenadas en función del ángulo el vectorial:
θba .

senba (1  cos ba ) 2


Cba (θba )  exp(S(θba ))  I  S(θba )  S (θba ) (3.22)
ba ba 2
x   0 - z y 
   
θba   y  ; S(θba )    z 0 - x  (3.23)
 z   - y x 0 
  

En la Ec. (3.22) se enfatiza el hecho de que Cba es sólo función del ángulo vectorial θba
suprimiendo la variable tiempo en la misma. Puesto que
S(θba )θba  θba  θba  0  S(θba ) θba , de la Ec. (3.22) resulta que Cb (θ ab )θ ab  θ ab .
2 a

Claramente y en concordancia con la Propiedad 2, θba es paralelo a la única dirección


propia con valor propio unitario de Cab .

46
A continuación se reescribe la Ec. (3.22) según dos formas alternativas que permiten
calcular la MCD a partir del eje y ángulo de Euler:
 
Cba (θba )  exp(S(θba ))  I  senba S(θba )  (1 - cos ba )S 2 (θba )
(3.24)
 
C (θba )  exp(-S(θ ab ))  I  senba S(θ ab )  (1 - cos ba )S 2 (θ ab )
a
b

Destacamos que, de su definición, el ángulo vectorial θba progresa en el sentido inverso


al del operador matricial de cambio de coordenadas, i.e.: mientras que θba es el ángulo
rotado desde la “terna inicial” {a} hasta la “terna final” {b} (ver la primera de las Ec.
(3.24)), inversamente, Cba opera sobre las coordenadas en la “terna final” {b} para
obtener las coordenadas en la “terna inicial” {a}. La segunda de las Ecs. (3.24) hace
explícita la dependencia de Cba respecto del ángulo rotado θab en el mismo sentido en
que opera la MCD (observar el cambio de signo en el segundo término de la ecuación).

De la Ec. (3.22) se obtiene una relación que permite calcular el ángulo de Euler a partir
de la MCD.

traza(Cba )  1
traza (Cba (θba ))  traza(Cba (θba ))  1  2 cos ba  cos(ba )= (3.25)
2

Notar que la traza(Cba (θba )) es sólo función del módulo del ángulo rotado y no de las
coordenadas del eje de rotación. De las Ecs. (3.24), reexpresadas como sigue:

Cba (θba )  exp(S(θba ))


      
 cos   2x (1  cos )  x  y (1  cos )   z sen  x  z (1  cos )   y sen 
       
  x  y (1  cos )   z sen cos   2y (1  cos )  y  z (1  cos )   x sen 
      
  x  z (1  cos )   y sen  y  z (1  cos )   x sen cos   2z (1  cos ) 

(3.26)

surgen las siguientes relaciones que permiten calculara el eje de Euler a partir de la
MCD cuando senba  0 :

  x  (Cba (3, 2)  Cba (2,3)) / 2senba ;

  y  (Cba (1,3)  Cba (3,1)) / 2senba ; (3.27)

  z  (Cba (2,1)  Cba (1, 2)) / 2senba

Si bien la Ec. (3.27) es indeterminada cuando senba  0 , la Ec. (3.25) permite decidir
que o bien no hay rotación alguna (cos(ba )=1  Cba =I ) , o bien cos(ba )= - 1 y en tal

caso las coordenadas del versor θba se obtienen usando:

47
  
C(2,1)  x C(2,1)  y C(1,3)  x
 ;  ;  (3.28)
C(2,3)  z C(3,1)  z C(2,3)  y

Cuando senba  0 las dos soluciones de la Ec. (3.25) de signo opuesto se corresponden
con dos soluciones de las Ecs. (3.27) con sentido opuesto para el eje de Euler, lo que

refleja el hecho de que una rotación de un ángulo ba alrededor de θba es equivalente a

una rotación de un ángulo ba alrededor de θba . De este modo, de acuerdo con la
Propiedad 2 y las Ecs. (3.22) a (3.28) es posible asociar a cada MCD una rotación
uniforme alrededor de un eje que es invariante bajo dicha rotación. En otros términos es
posible afirmar que el resultado de cualquier rotación es equivalente a una única

rotación descrita por el un ángulo vectorial θ de módulo  y eje θ . Este resultado es
clásicamente expresado por el:

Teorema de Euler
El resultado final de cualquier movimiento de un cuerpo rígido con un punto fijo es
indistinguible de una rotación alrededor del único eje invariante bajo dicha rotación.

Entre las ventajas de esta parametrización destacamos la de requerir el número mínimo
de parámetros (las 3 componentes del vector θba   3 en dirección y módulo), sin
embargo la falta de redundancia no permite supervisar errores numéricos como en la
MCD. Por otra parte, su claro sentido geométrico resulta de interés en muchas
aplicaciones, aunque, como veremos más adelante, no exista una regla sencilla para la
composición de rotaciones expresadas con esta parametrización.

3.1.4 Espacio vectorial de pequeñas rotaciones y diferencial de una MCD


 
Dados el ángulo vectorial  θ   θ , con     y θ un versor de  3 y la MCD
escrita de acuerdo con la (3.22) como: C( θ)  exp(S( θ)) , las condiciones de
convergencia de la exponencial de una matriz (Zadeh/Desoer, 1963) aseguran:

1  2 1 
C( θ)  I  S( θ)   2 S(θ)   S(θ)3  ...  o( ) (3.29)
2! 3!

Donde o( ) es tal que:

o( )
lim 0 (3.30)
 0 

La Ec. (3.29) justifica la siguiente aproximación de primer orden para   1 

C( θ)  I  S( θ) (3.31)

Consideremos ahora dos versores no necesariamente colineales v1 y v 2 y la composición


no conmutativa de rotaciones caracterizada por el producto de las MCDs para  ,    :

48
C( v1 ,  v 2 )  exp(S( v1 )) exp(S(  v 2 ))
 [I  S( v1 )  o(  )][I  S(  v 2 )  o(  )] (3.32)
 I  S( v1 )  S(  v 2 )  o( )  I  S( v1   v 2 )  o( )
Donde   max(  ,  ) . De la última igualdad y la definición de la exponencial resulta
trivialmente además que:

C( v1 ,  v 2 )  C( v1   v 2 )  o( ) (3.33)

Así, para ángulos suficientemente pequeños las rotaciones conmutan y los ángulos se
componen vectorialmente. La MCD resultante es independiente de la secuencia de
rotaciones elegida.

Dadas 2 MCD cercanas Cba (θba ) y C ˆ a (θˆ ) , donde la segunda debe entenderse como
b ba

una estimación o medición de la primera, conformamos las siguientes composiciones


que definen, respectivamente, los ángulos vectoriales θ a y θb *:

 (θ a )  exp(S(θ a ))
ˆ a Cb  C
C b a
(3.34)
ˆa C
Cba C  (θb )  exp(S(θb ))
b

Y definimos la diferencia:

ˆb C
Cba  Cba  C  a  I)
ˆ b (C
a a
(3.35)
Cb  (C b  I )Cˆb
a a

Teniendo en cuenta las (3.29) y (3.30) la diferencia Cba satisface las relaciones:

Cba ( θa )  Cba S( θ a ) Cba ( θb )  S( θb )Cba


lim  0; lim  0 (3.36)
 a 0  a b
 0  b

que permiten definir el operador diferencial o parte lineal de las diferencias (3.35) de
las dos maneras siguientes:

 Cba ( θ a )  Cba S( θ a );


(3.37)
 Cba ( θb )  S( θb )Cba

Las relaciones anteriores vinculan las desviaciones angulares vectoriales que producen
un dado  Cba de acuerdo con:

Cba S( θ a )  S( θb )Cba  S( θ a )  Cba S( θb )Cba  S(Cba  θb )


(3.38)
  θ a  Cba  θb

*
La unicidad de los ángulos así definidos está asegurada por la Propiedad 2. Ver también el párrafo 3.1.3.

49
Interpretación geométrica:
Sean las ternas {a} y {b} distantes de un ángulo vectorial θba y { â } y { b̂ } separadas
respectivamente de las primeras por los pequeños ángulos de desalineamiento b̂b y aaˆ
indicados en la (Fig. 3.6). De las expresiones (3.34) se tiene:


ˆ a  Ca C 
b (θ )  Cb Cbˆ  C(θ )  Cbˆ  θ  θbb
b a b b b b
C b ˆ
(3.39)
 (θ a )Ca  Caˆ Ca  C
ˆa C
C  (θ a )  Caˆ  θ a  θ
b b a b a aaˆ

Lo que se interpreta como que, en el primer caso, la diferencia entre Ĉba y Cba se explica
por un desalineamiento θb  θbbˆ en la terna de “llegada” y en el segundo caso por un
desalineamiento θ a  θ aaˆ en la terna de “partida”.

 aaˆ

a
ba b
b̂b

Figura 3.6: Ternas a, b y sus aproximaciones.

3.1.5 Rotaciones alrededor de los ejes coordenados: Angulos de Euler


Particularizamos ahora la expresión (3.22) para el caso de rotaciones alrededor de los
ejes coordenados de un cuerpo x, y, z llamadas rotaciones elementales de Euler.

za
zb za za 
yb

ya ya
 ya
xa xa
xa
b
b
Ca ( )  b
Ca ( ) Ca (  )
      
1 0 0  cos  0  sen   cos  sen  0
0 cos  sen   0   sen  cos  0
   1 0   
0  sen  cos  sen  0 cos    0 0 1
Figura 3.6: Angulos y rotaciones elementales de Euler.

50
Ejemplificamos con una rotación positiva  alrededor del eje x, descrita en coordenadas
como θba  e1 . Calculamos primeramente los términos:

0 0 0  0 0 0  0 0 0 
S(θba )=  0 0  ; S 2 (θba )=  0 2
  0   2 0 1 0  ;
 (3.40)
0  0   0 0 2  0 0 1 

que substituimos en la segunda de las Ecs. (3.24) para obtener la matriz de


transformación de coordenadas (MCD) que opera en el mismo sentido que la rotación:

1 0 0 
C (e1 )  exp( S(e1 ))  0 cos  sen 
b
a
 (3.41)
0  sen  cos  

Con un procedimiento similar se obtienen las respectivas MCD asociadas a las otras
rotaciones elementales de Euler indicadas en la Fig. 3.6.

Relación entre los ángulos de Euler y la MCD


En la Fig. 3.7 se ejemplifica como, la terna del cuerpo {b}, de ejes xb, yb, zb, coincidente
inicialmente con la terna de referencia {a}, de ejes xa, ya, za, resulta de la secuencia de
rotaciones elementales: (@xb)(@yb’)(@za) (lease: una rotación de un ángulo 
alrededor del eje zb, seguida de una rotación de un ángulo alrededor del eje yb’,
seguida de una rotación de un ángulo  alrededor del eje xa).

yb’ ya
yb”’ 
xb”=xb

 xb’

a Cba ' Cbb ''' Cbb ''
x
za=zb’  a b’ b” b= b”’

zb”  b’a b”b’ bb”


zb”’
Figura 3.7: Composición de rotaciones elementales de Euler.

Componiendo matricialmente estas rotaciones se obtiene la MCD que transforma las


coordenadas entre ambas ternas en función de los ángulos de Euler ,  y :

51
Cba  Cbb'' ()Cb''b' ()Cb'a ()  (@x b )(@yb' )( @za )
(3.42)
1 0 0  cos  0 sen  cos  sen 0 
 0 cos  sen   0 1
 0  sen cos  0
0 sen cos   sen 0 cos    0 0 1 

 cos  cos  cos sen  sen 


Cba    cos sen  sensen cos  cos  cos   sensensen sen cos   (3.43)
 sensen  cos sen cos   sen cos   cos sensen cos  cos  

A partir de la (3.43), es fácil constatar la validez de las aproximaciones (3.32) y (3.33)


para pequeños valores de  ,  y  :

 1  
Cba ( e 3 , e 2 , e1 )  I  S(e 3 )  S(e 2 )  S(e1 )    1   (3.44)
 
   1 

Donde e1 , e 2 , e3 son los versores, expresados en coordenadas, de las direcciones


positivas de los ejes x,y, z, respectivamente.

De la Ec. (3.43) se obtienen, asimismo, las siguientes relaciones inversas que permiten
calcular los ángulos de Euler a partir de la MCD para la secuencia elegida.

  arctan(Cba (2, 3) / Cba (3, 3))


  arctan(Cba (1, 2) / Cba (1,1)) (3.45)
  arcsen (Cba (1, 3))

La última de las Ecs. (3.45) establece una ambigüedad para el valor de  que es
subsanada imponiendo   ( / 2,  / 2] . Sin embargo, cuando    / 2 las
expresiones para  y  de las anteriores resultan indeterminadas. En efecto, para cada
uno de estos casos límites la (3.43) se reescribe, respectivamente:

 0 0 1
 b
  : Ca   sen cos   cos sen cos  cos   sensen 0 

2
 sensen  cos  cos  cos sen  sen cos  0 
(3.46)
 0 0 1
  sen(   ) cos(   ) 0 

 cos(   )  sen(   ) 0 
y análogamente:

52
 0 0 1
 b
   : Ca    sen cos   cos sen cos  cos   sensen 0 

2
 sensen  cos  cos   cos sen  sen cos  0 
(3.47)
 0 0 1
   sen(   ) cos(   ) 0 

  cos(   )  sen(   ) 0 

Por lo que, según el caso, sólo será posible determinar la suma o la diferencia de los
ángulos  y   Geométricamente lo anterior es consecuencia de que una rotación de
90º del ángulo intermedio  hace que  y  constituyan rotaciones alrededor de un
mismo eje de la terna de referencia sumándose o restándose sus efectos. La indefinición
de  y  resultante del pasaje de  por las singularidades  / 2 puede, sin ciertos
recaudos, provocar la perdida definitiva del seguimiento del primer par de ángulos por
parte del algoritmo de navegación. Este fenómeno, observado inicialmente en
plataformas estabilizadas, es denominado “gimbal lock” en la literatura inglesa.

Es sabido que el cambio en la orientación de un cuerpo sometido a una serie de


rotaciones alrededor de sus ejes no sólo es función de las rotaciones individuales sino
también del orden en que estas son aplicadas. Matemáticamente esto se enuncia
diciendo que “el grupo de las rotaciones no es conmutativo.” Vista la asociación entre
rotaciones elementales y MCD este resultado puede verse como una consecuencia
natural de la no conmutatividad, en el caso general, del producto matricial.

Wertz, (1988, pp. 417) demuestra que cualquier rotación puede ser descompuesta en
una secuencia de, a lo sumo, 3 rotaciones elementales de Euler no colineales. Esto
equivale a afirmar que cualquier MCD puede expresarse como el producto de, a lo
sumo, tres rotaciones elementales no colineales. Dados 3 ángulos de Euler , ,  es
necesario aún especificar la secuencia i-j-k de los ejes alrededor de los cuales son
aplicadas las rotaciones. Una misma rotación resultante puede obtenerse usando
cualquier secuencia de ejes siempre que no haya dos ejes consecutivos iguales (Wertz,
1988, Ap. E). Esto da lugar a 6 permutaciones con 3 ejes distintos (o de tipo I, tal como
la secuencia 3-2-1 en el ejemplo (3.42)-(3.45)) más 6 secuencias con los ejes 1º y 3º
coincidentes (ó de tipo II). Así, 12 secuencias diferentes pueden dar lugar a una misma
rotación resultante (y por consiguiente a una misma MCD) por lo que esta
representación sólo resulta univoca una vez especificada la secuencia de ejes elegida.
Como el lector podrá advertir, las secuencias de tipo I conducirán siempre a
singularidades para un valor del ángulo intermedio    / 2 (ver Eqs. (3.45), (3.46) y
(3.47)). En cambio, para las secuencias del tipo II en que ik, la singularidad se
presentará cuando el ángulo intermedio adopte el valor    condición, en este caso,
para que  y  constituyan rotaciones superpuestas alrededor de un mismo eje de la
terna de referencia. Por otra parte, las ambigüedades de este caso son evitadas
imponiendo   (0, ] 

Una clara interpretación geométrica ha asegurado a esta parametrización una amplia


difusión en aplicaciones tanto aeronáuticas, marítimas como espaciales. Con el eje y
ángulo de Euler comparten la ventaja de no poseer parámetros redundantes aunque
también la desventaja de una compleja regla de composición.

53
3.1.6 Parámetros simétricos de Euler o cuaterniones
Para una dada rotación entre las ternas {a} y {b} definida por un ángulo vectorial θba

(eje-vector de Euler), como el expresado en la Fig. 3.8, establecemos:  x  cos
 
 z  cos   y  cos  y definimos el cuaternión qba (θba )   4 , asociado a la rotación
así como su conjugado qba (θba )* , según:

 1  
a  θba sin ba 
 qb   2
qba (θba )   a    ba 
 qb 4   cos ba 
  (3.48)
 2 
a
 q b 
qba (θba )*   a   qba (θ ab )
 qb 4 
   
Donde: qba  sin 2ba θba   3 , qba 4  cos 2ba   son, respectivamente, la “parte
vectorial” y la “parte escalar” del cuaternión. También es usual la siguiente notación

[vector, escalar]: qba (θba )   qba , qba 4  . Para simplificar la notación y mientras no surjan
   
ambigüedades de sentido denotamos además: qba  q   q1 q2 q3  ; [qba , qba 4 ]  [q, q4 ] .
T

Claramente, de la definición surge que el cuaternión no depende del sentido del eje-
vector de Euler, i.e.: qba (θba )  qba (θ ab ) y que el cuaternión tiene norma unitaria, i.e.:
2
qba  qbaT qba  q12 + q22 + q32 + q42 = 1 .

a3

 θba
z


  y a2

 
x
a1

Fig. 3.8: Representación del eje de Euler.

Relación entre cuaterniones y MCD:


Usando las definiciones anteriores y las siguientes relaciones trigonométricas:

sin (  2sin  cos  ; 1  cos   2sin 2  ;


  

54
de las expresiones (3.24) surgen las siguientes expresiones que permiten calcular la
MCD en función del cuaternión o su conjugado asociado a una misma rotación entre
ternas:
   
Cba (qba )  exp(S(θ ab ))  I  2q4 S(q)  2S 2 (q)  Cba  (qba )*   I  2q4 S(q)  2S 2 (q)
    (3.49)
Cba (qba )  exp(S(θba ))  I  2q4 S(q)  2S 2 (q)  Cba  (qba )*   I  2q4 S(q)  2S 2 (q)

Sustituyendo en las anteriores las definiciones (3.48) y desarrollando (o bien usando


directamente la (3.26)) se obtienen, respectivamente, las expresiones de la MCD en
función de las componentes del cuaternión o su conjugado:

 q42  q12 - q22 - q32 2(q1q2 - q3 q4 ) 2(q1q3  q2 q4 ) 


 
Cba (qba )   2(q1q2  q3 q4 ) q42  q22 - q12 - q32 2(q2 q3 - q1q4 )  (3.50)
 2(q1q3 - q2 q4 ) 2(q2 q3  q1q4 ) q42  q32 - q12 - q22 
 

 q42  q12 - q22 - q32 2(q1q2  q3 q4 ) 2(q1q3 - q2 q4 ) 


 
Cba  (qba )*    2(q1q2 - q3 q4 ) q42  q22 - q12 - q32 2(q2 q3  q1q4 )  (3.51)
 2(q1q3  q2 q4 ) 2(q2 q3 - q1q4 ) q42  q32 - q12 - q22 
 

Inversamente, los componentes del cuaternión: q , q4 pueden calcularse en función de
la MCD usando:

1
traza (Cba )  traza (Cba )  3q42  q12  q22  q32  4q42  1  q4   (traza (Cba )  1)1/ 2 (3.52)
2

  1
Cba  Cba  4q4S(q )  S(q )   Cba  Cba  (3.53)
2(1  trazaCba )1/ 2

La ambigüedad de signo en las Ec. (3.52) y (3.53) es sólo aparente ya que como es
posible ver de las (3.50) y (3.51) un cambio de signo en todas las componentes del
cuaternión produce la misma MCD y por tanto la misma rotación.

Representación hipercompleja y álgebra de cuaterniones


Algunas propiedades importantes de la representación de las rotaciones mediante
cuaterniones surgen de la formulación hipercompleja introducida originalmente por W.
Hamilton en 1866 y más tarde por Whittaker en 1944:

q  q1i  q2 j  q3k  q4 ; q*   q1i  q2 j  q3k  q4 (3.54)

Bajo las reglas de multiplicación:

ij  k (ciclicidad); ji  k (anticiclicidad) ; ii  1(antinormalidad ) (3.55)

Se define el producto o composición de dos cuaterniones r y q como:

55
s  rq  s1i  s2 j  s3k  s4
 (r1i  r2 j  r3 k  r4 )(q1i  q2 j  q3 k  q4 )
(3.56)
 i (r4 q1  r3 q2  r2 q3  r1q4 )  j (r3q1  r4 q2  r1q3  r2 q4 )
 k (r2 q1  r1q2  r4 q3  r3q4 )  (r1q1  r2 q2  r3 q3 )  r4 q4

Lo que en notación matricial resulta:

 r4  r3 r2 r1   q1 
r r4  r1 r2   q2 
rq  
3
(3.57)
  r2 r1 r4 r3   q3 
  
  r1  r2  r3 r4   q4 

Claramente, el producto (3.56) ó (3.57) no es conmutativo es decir: rq  qr . Por otra


parte, es fácil verificar que: (rq)*  q*r* y además, que: qq*  q 
0i  0 j  0k  q12  q22  q32  q42 . Por último es fácil comprobar que el elemento unitario
del producto (3.56) es: qo 0i+ 0j+ 0k+1. Utilizando la notación [vector, escalar]
introducida después de la Ec. (3.48), el producto (3.56) o (3.57) se reescribe a su vez
como:
  
   r4 I  S (r ) r   q       
rq  [r , r4 ][q, q4 ]   T     [r4q  q4r  r  q, r4 q4  r q] (3.58)
 r r4   q4 

Transformación de vectores de 3 mediante cuaterniones

Consideremos un vector va3 expresado en componentes de la terna {a} y el



cuaternión q ba (θba )  [q, q4 ] , definido en la Ec. (3.48) que caracteriza la rotación entre las
ternas {a} y {b}. Definimos la “cuaternización”: vaq  [ va , 0] y, aplicando las reglas
introducidas arriba, calculamos el producto:
  
 q4 I  S (q) q   v a  b *  q4 v a  S (q) v a  b *
q v (q )  
b a b *
T (q )     (q a )
a q
 q
a
q4   0  a q v a
 
 *    *
 b  q4 v a  S (q) v a     q4 I  S (q) q   q4 v a  S (q) v a  
  qa   a       a   (3.59)
   q  v     q T q4   q  v  
    
  
   (q4 ) 2 I  2q4 S (q)  S 2 (q)  qqT  v a 
*

   
 qT (q  v a ) 

  2 
Si en la anterior se usan la igualdad (que el lector podrá verificar): S 2 (q)  q I  qqT ,
2
junto con las relaciones qba  1 y (3.49), se obtiene finalmente la regla de
transformación de coordenadas mediante cuaterniones.

56
 
 vb   I  2q4 S (q)  2S 2 (q)  v a  Cba (qba ) v a 
v     q a v q (q a )  
b
q
b a b *
  (3.60)
 0   0   0 

Consideremos ahora las ternas {a}, {b} y {c}. Los ángulos vectoriales θ ab / θbc / θ ac se
corresponden, respectivamente, con las rotaciones “desde” las ternas {b}/{c}/{c}
“hacia” las ternas {a}/{b}/{a}. Usando la definición (3.48) establecemos los
respectivos cuaterniones:
  
 θ ab sin  ab / 2   θ bc sin bc / 2
  θ ac sin  ac / 2

qba (θ ab )    ; qb (θbc )  
c
; q ca (θ ac )    ; (3.61)
cos ab / 2  cos bc / 2  cos ac / 2 

Sean ahora v aq , v bq , v cq las cuaternizaciones de las representaciones en coordenadas de un


dado vector v según las ternas indicadas. Usando sucesivamente la regla (3.60), se tiene:

vbq  qba v aq (qba )* 


c *
 v cq  qbc qba v qa (qba )* (qbc )*  qbc qba v qa (qbc qba )*  q ca v qa (q ca )* (3.62)
v  q v (q )
c
q
c
b
b
q b 

Por lo que resulta que el producto obtenido a partir de la representación hipercompleja


(3.57) o (3.58) dá la regala de composición de cuaterniones compatible con la
transformación encadenada de coordenadas. Es decir:

q ca (θac )  qbc (θbc )qba (θab ) (3.63)

Es interesante destacar que la anterior define intrínsecamente una ley de composición


entre ángulos vectoriales (eje/ángulo de Euler), de donde además resulta, usando las
definiciones (3.50) o (3.51), que:

Cca (q ca )  Cbc (qbc )Cba (qba ) (3.64)

Relación entre cuaterniones y ángulos de Euler


Consideramos ahora los cuaterniones asociados a las rotaciones elementales de Euler:

 -   
q e (eei )  ei sin e , cos e   q ,q4  ; i  1, 2,3 (3.65)
 2 2

Donde los ángulos vectoriales eei ;i=1,2,3 representan, respectivamente, rotaciones


elementales alrededor de los ejes coordenados x, y, z. Si el pasaje de la terna {a} a la
{b} corresponde a una secuencia de rotaciones elementales de Euler tal que:
{b}{@x’’}{@y’}{@z}{a} como en la Ec. (3.42), de acuerdo con la regla de
composición (3.63).

qba  q x ()q y ()q z ( )

57
Una vez más la notación hipercompleja nos facilita el cálculo de estas composiciones
elementales. En efecto partiendo de la definición de productos hipercomplejos (3.56),
el cuaternión resultante en notación se obtiene según:

     
qba  q x ()q y ()q z ( )  (i sin  cos )( j sin  cos )(k sin  cos ) =
2 2 2 2 2 2

             
 i  - sin cos cos  sin sin cos   j   sin cos cos - sin cos sin  
 2 2 2 2 2 2  2 2 2 2 2 2

             
 k  - sin cos cos  cos sin sin    cos cos cos  sin sin sin 
 2 2 2 2 2 2  2 2 2 2 2 2
(3.66)

Los cuaterniones ofrecen una parametrización muy eficaz de la orientación debido que
sólo tienen un parámetro redundante comparado con 6 de las MCD lo que se refleja en
importantes ventajas computacionales mientras que comparten con las MCD una ley
sencilla de composición. Esta última propiedad los hace preferibles en ciertos casos a
otras parametrizaciones como los ángulos de Euler o el ángulo vectorial de rotación
(eje y ángulo de Euler) que, aunque sin parámetros redundantes no poseen una ley de
composición sencilla. Otra ventaja respecto de estas últimas parametrizaciones es la de
no presentar singularidades o ambigüedades para ningún valor de sus parámetros que
deba resolverse con información suplementaria. Cabe sin embargo señalar como
desventaja cierta dificultad para interpretar geométricamente el sentido de sus
parámetros.

Diferencial de cuaterniones
Tal como para las MCD dados dos cuaterniones cercanos qba (θ ab ) y qˆ ba (θˆ ab ) ,
conformamos las siguientes composiciones que definen respectivamente, los ángulos
vectoriales θa y θb :

q (θa )  qˆ ba (θˆ ab )* qba (θab )


(3.67)
q (θb )  qba (θab )qˆ ba (θˆ ab )*

Junto con las anteriores la diferencia entre cuaterniones se escribe:

ˆ ba = qˆ ba (q (θa )  q0 )
qba (θ a )  qba - q
, (3.68)
 (θb )  q0 )qˆ ba
qba (θb )  (q

Para pequeños ángulos θ a y θb ( θb , θ a  1 ) las (3.67) resultan en los


cuaterniones cuasi-identitarios (ver definición (3.48)):.

58
 1 θb 
  1 2 θ 
2 b
q (  θ b )   2    ;
 1  4  θ
1 b

 1 
 (3.69)
 1 θ a 
  1 2 θ 
2 a
q (  θ a )   2    
 1  4  θ
1 a

 1 


Usando las anteriores, la parte lineal de las diferencias (3.68) resultan:

θ a  θb  b
q(θ )  2 q
a 1 b
a (θ ab )   ; q(θ )  2 
b 1  q a (θ ab ) (3.70)
 0   0 

3.2 Ecuaciones cinemáticas de la orientación

En el subcapítulo anterior se introdujeron diversas parametrizaciones que caracterizan


numéricamente la orientación relativa entre 2 sistemas de referencia. Interesa ahora
conocer la propagación temporal de estos parámetros cuando entre ambas ternas existe
una velocidad angular relativa. La Fig. 3.9 indica esquemáticamente esta situación. En
un dado instante t, la terna {b(t)} se encuentra rotada del ángulo vectorial ba respecto
de la terna de referencia {a} (notar el sentido positivo del ángulo indicado en el
diagrama). Se supone a la terna {b} animada por la velocidad angular (vectorial)
instantánea ab relativa a la terna {a} (el vector ab considerado entrante en el plano del
dibujo es representado con una cruz en el centro de rotación u origen común de ambas
ternas) de tal modo que en el instante t+t la terna {b} se encuentra en la posición
{b’}={b(t+t)}, distante del ángulo vectorial b’b recorrido desde su posición en el
instante t.

{b(t)}
θba θb ' b
{a} {b’}={b(t+t)}

x
ab

Fig. 3.9: Rotación relativa entre dos ternas.

En este subcapítulo formulamos las ecuaciones diferenciales asociadas a la evolución


temporal de cada parametrización, llamadas ecuaciones cinemáticas de orientación, con
la velocidad angular relativa como función forzante de las mismas.

3.2.1 Ecuación cinemática de la MCD


Las ecuaciones cinemáticas de la orientación parametrizadas en términos de la MCD,
cuya notación fuera introducida en la Ec. (3.16), surge inmediatamente de la Ec.(3.7):

59
 a (t , t )  S(ω a (t ))Ca (t , t );
C Cba (to , to )  Cba (to ) (3.71)
b o ab b o

En la anterior destacamos que la condición inicial de la matriz de rotación entre ambas


ternas no tiene necesariamente que ser Cba (to , to )  I . Dado que Cba  (Cba )T , la ecuación
diferencial para Cba se obtiene trasponiendo al Ec. (3.71) y usando la propiedad de
antisimetría de la matriz definida en (3.4):

 b (t , t )  Cb (t , t )ST (ω a (t ))  Cb (t , t )S(ω a (t ))  Cb (t , t )S(ω a (t ));


C (3.72)
a o a o ab a o ab a o ba

A partir de las (3.71) y (3.72) es fácil ver, además, que según en que sistema de
coordenadas esté expresada la velocidad angular ω ab (t ) , la ecuación de propagación de
la MCD a partir de la condición inicial arbitraria: Cba (to , to )  Cba (to ) (o su transpuesta
según corresponda) se escribe:

 a (t , t )  S(ω a (t ))Ca (t , t )  C
C  b (t , t )  S(ωb (t ))Cb (t , t )
b o ab b o a o ba a o
(3.73)
 a (t , t )  Ca (t , t )S(ωb (t ))  C
C  b (t , t )  Cb (t , t )S(ω a (t ))
b o b o ab a o a o ba

3.2.2 Ecuación cinemática del cuaternión de orientación


De acuerdo con la notación introducida en la Ec. (3.48), la ley de composición de
rotaciones sucesivas indicada por la Ec. (3.63) y usando como referencia el diagrama de
la Fig. 3.9, escribimos:
 
a
θbba sin ba / 2  b
θbb '' b sin b ' b / 2 
q (θba )   ; q (θb ' b )   ;
cos ba / 2   cos b ' b / 2
b b'
 (3.74)
qba '  qba qbb '

Tomando incrementos y luego factorizando el término qba resulta:

qba  qba (t  t )  qba (t )  qba '  qba (t )  qba (qbb '  q 0 ) (3.75)

T
Recordando que q 0  0T 1 , calculamos la derivada temporal del cuaternión
mediante:
b '
q a
1   θ b ' b sin b ' b / 2
 0 
q ba  lim b
 qba lim     
t 0 t t 0 t  cos b ' b / 2  1  
(3.76)
 θbb '' b 
1 a  lim  1 a ωbab (t ) 
 qb t 0 t  qb 
2   2  0 
 0 

Donde, la anteúltima igualdad surge del desarrollo de 2º orden de las funciones seno y
coseno mientras que la última igualdad se obtiene usando la definición de velocidad

60
angular vectorial instantánea en coordenadas de {b} (nótese que el ángulo θbb ''b tiene el
mismo sentido positivo de rotación que ωbab (t ) ):

θbb ''b
ωbab (t )  lim (3.77)
t 0 t

La Ec. diferencial (3.76) describe la evolución temporal del cuaternión qba (θba ) función
de la rotación “acumulada” θba desde la terna {a} hacia la terna {b} en el instante t. La
función forzante es la velocidad angular ωbab (t ) de la terna {b} respecto de {a} en
coordenadas de {b}. Conjugando la Ec. (3.76) y usando la propiedad del conjugado de
una composición de cuaterniones introducida más arriba, se obtiene la ley de
propagación del cuaternión qba (θ ab ) :

*
1 ω b  1 ω b 
(q )  q (θ ab )   ab  qba   ba  qba
a *
b
b
a (3.78)
2 0  2 0 

Notar la inversión del signo de la velocidad angular consistente con el cambio de


sentido de la rotación de θba a θ ab .

Combinando las Ecs. (3.76) y (3.78) se obtienen las ecuaciones cinemáticas similares a
las Ecs. (3.73) para la MCD según el sistema de coordenadas al que esté referida la
velocidad angular entre las ternas. Intercambiando índices se obtienen las ecuaciones
para los cuaterniones conjugados.

1 ωbba  b 1 ω aab  a
q ba   q
 a  q a
b    qb
2 0  2 0 
(3.79)
1 b ωba a
 1 a ωbab 
q a  q a 
b
  q b  qb 
a

2  0  2  0 

3.2.3 Ecuación cinemática del ángulo vectorial de rotación: Ecuación del “coneo”
Como vimos, el ángulo vectorial instantáneo entre dos ternas que giran relativamente
queda asociado ya sea a la MCD mediante la Ec. (3.22) o al cuaternión definido por las
Ecs. (3.48) (o (3.74)). Esto ofrece al menos dos vías para formular una ecuación
diferencial para θba (t ) : a) el desarrollo empleado por Bortz (1971) que consiste en
reemplazar la (3.22) en cualquiera de las (3.73), o b) reemplazar la (3.48) en cualquiera
de las (3.79) siguiendo a Savage (1997, 3.3.1 parte I ). Los pasos algebraicos resultan
un poco más sencillos en el segundo caso por lo que elegiremos ese camino para nuestro
desarrollo. Para simplificar la notación denotamos:

ω  ωbab ; θ  θba ; q  qba ;   θ (3.80)

Tomamos por caso la última de las Ecs. (3.79) rescrita usando la expresión del producto
(3.58) según la notación [vector, escalar]:

61
1 θ   1  1  1 
q   sin , cos  ω, 0  [cos ω  sin θ  ω,  sin θω] (3.81)
2  2 2 2 2  2  2

Introducimos ahora las siguientes funciones y sus derivadas:

 1 
f1  cos ; f 2  sin (3.82)
2  2

1  1
f1    sin    f 2 ;
2 2 2
  (3.83)
1 cos 2  sin 2  f 2   f1 
f2      1
2   2
  2 f2 

Substituyendo las Ecs. (3.82) y (3.83) en la Ec. (3.81) se obtiene:

1 1
q   f 2θ, f1 ω, 0   f 2θ  ω  f1ω,  f 2θ  ω  (3.84)
2 2

Mientras que por otra parte derivando el cuaternión respecto del tiempo resulta:

d
q   f 2θ, f1    f2θ  f 2θ , f1  (3.85)
dt

Igualando las partes escalar y vectorial de las (3.84) y (3.85) surgen las igualdades:

1 1  1 f  f 
f1    f 2   f 2θ  ω    θ  ω   2 θ  ω  f2  22  1  1 θ  ω (3.86)
2 2     2 f2 

1 1 f1 1 1  f 
f2θ  f 2θ   f 2θ  ω  f1ω   θ  ω  θ  ω  2  1  1 (θ  ω)θ (3.87)
2 2 f2 2   2 f2 

De la Ec. (3.87) surge la ecuación de estado para el vector  después de sustituir las
definiciones de f1 y f3.. Finalmente, usando las identidades:

       1  cos( / 2)
 u • v  u  u   u  v   u 2v , tan( / 2)  (3.88)
sin( / 2)

A partir de la (3.87) se llega a la ecuación diferencial nolineal para el ángulo de rotación


θba .

1 1   sin ba 
θ ba  ω aab  θba  ω aab  2 1  ba  θba   θba  ω ab  ; θba (to )  θba
a 0
(3.89)
2 ba  2(1  cos ba ) 

62
Cuando se substituye la solución de (3.89) en la Ec. (3.22) y en las Ecs. (3.48) se
obtienen, respectivamente, las soluciones para tto de la ecuación cinemática de la
MCD (3.71) y la correspondiente del cuaternión (3.79), de este modo, usando las (3.22)
y (3.48) se tiene:

senba (t ) (1  cos ba (t )) 2


Cba (t )  exp(θba (t ))  I  S(θba (t ))  S (θba (t ))
ba (t ) ba (t ) 2
 θba (t )  (t ) 
 sin ba  (3.90)
 (t ) 2 
qba (t )   ba
 ba (t ) 
 cos 
 2 

De (3.89) se observa que sólo si θba (t ) se mantiene paralela a ω aab (t ) resulta ser
θ ba  ω aab . En este caso las rotaciones (alrededor de un eje invariante) son conmutativas,
es decir no dependen del orden en que son ejecutadas. La composición no conmutativa
de dos ángulos de rotación no paralelos, ej.: θ1 seguido de θ2 , puede obtenerse
mediante el artificio de hacer θ(t0 )  θ1 en la (3.89), expresar a θ 2  T como una
rotación uniforme con velocidad angular constante durante un tiempo T y hallar la
solución de la solución de la Ec. diferencial (3.89) en t=T. La no conmutatividad del
vector θba esta representada por los dos últimos términos de la (3.89):

1 1  ba sin ba 


 (t )  θba  ω ab  2 1   θba   θba  ω ab 
a a
(3.91)
2 ba  2(1  cos ba ) 

Véase que la “no conmutatividad” proviene de la interacción en el pasado entre el


ángulo de rotación y la velocidad angular. Notar que  es simultáneamente ortogonal a
2
ω a (t ) y θ (t ) por lo que θ θ  a θ y además θ a  a .
ab ba ba ba ab ba ba ab ab

La Ec. (3.89), introducida por Laning en 1949, recibe en la literatura el nombre de


ecuación de “coneo” motivado por el movimiento de precesión, por ejemplo de un
trompo, cuyo eje de rotación parece rotar alrededor de otro eje invariante generalmente
vertical del piso. Esta ecuación fue utilizada por primera vez en navegación por Bortz
(1971) en un algoritmo de alta velocidad para la integración de la orientación y, como
veremos en el Capítulo 7, constituye la base del cálculo de la orientación de los
algoritmos strapdown modernos.

3.2.4 Ecuación cinemática de los ángulos de Euler


Como vimos, la triada de ángulos de Euler son rotaciones aplicadas en una dada
secuencia alrededor de ejes preestablecidos de una terna {b} en rotación respecto de
otra terna {a}. A continuación ilustramos el procedimiento para formular las
ecuaciones cinemáticas para el caso desarrollado en el párrafo 1.1.5 es decir para la
secuencia: {@x”}{@y’}{@z}. El lector podrá extender el procedimiento a otras
secuencias de rotaciones. Si la rotación fuese solamente, por ejemplo, alrededor de los
ejes z ó x” la velocidad angular ab entre las ternas seria, respectivamente: ab   z ó

63
ab   x" . Cuando el cambio ocurre simultáneamente en los tres ángulos, la velocidad
angular entre ambas ternas es la composición vectorial de las velocidades angulares en
cada eje. A continuación se expresa dicha velocidad angular en coordenadas de {b}.

bab   y')b 


 x")b   z )b (3.92)

Teniendo en cuenta la composición expresada mediante las MCD de la Ec. (3.42) y la


Fig. 3.7, se determinan las coordenadas de bab del siguiente modo:

bab   y')b 


 x")b   zb  xb  Cbb' yb' 
 Cab za

1  0  0  1 0  sin        

   0  Cb ''Cb ' 1  
b b b ''
 Ca 0   0 cos  sin  cos       M321 (, )   
b  1
(3.93)
ab
 0  0  1  0  sin  cos  cos    
   

En la segunda de las (3.93) se usaron las definiciones (3.5) y las relaciones:


xb  e1 ; yb'  e2 ; za  e3 . La Matriz M321 convierte las derivadas de los ángulos de Euler
para la secuencia elegida (321) en la velocidad angular. Finalmente, la ecuación
cinemática de los ángulos de Euler se escribe a partir de la Ec. (3.93), mediante:

   1 sen tan  cos  tan   b


    M321 (, )bab   0 cos  sen  ab (3.94)
    0 sen / cos  cos  / cos 

Ese importante destacar que las ecuaciones anteriores resultan singulares en el pasaje de
 por  / 3 . Como se mostró en el párrafo 1.1.5 esta singularidad esta asociada la
abrupta indistinguibilidad entre los ángulos  y  y a la consiguiente indefinición de
sus valores. Este hecho constituye una seria limitación para el uso de esta
parametrización en la integración numérica de las ecuaciones cinemáticas de la
orientación.

64
Capítulo 4
Geometría de la Tierra,
Ternas de Referencia y Gravedad

El propósito de un sistema de navegación es proveer en todo instante la posición,


velocidad y orientación de un vehículo con referencia a uno o más sistemas de
coordenadas de interés para la aplicación específica. En las aplicaciones en un entorno
cercano a la Tierra, ésta resulta una referencia obligada para los sistemas de navegación.
Distinguimos dos tipos de ternas de referencia o ternas de navegación vinculadas a
nuestro planeta: a) Ternas centrales cuyo origen está en el centro de la Tierra y su
orientación es independiente de la posición del vehículo y b) Ternas locales cuya
orientación y/u origen dependen de la posición del vehículo. Para referir la posición y
orientación del vehículo respecto de la terna de navegación, conviene definir la terna
del cuerpo con origen a bordo del vehículo asociada a algún punto de interés del mismo,
por ejemplo: su centro de gravedad, la unidad de mediciones inerciales (UMI) o algún
otro instrumento transportado como, sensores remotos, antena GPS, etc.

Dado que las ecuaciones de la mecánica se enuncian de modo diferente según estén o no
referidas a un sistema inercial, resulta necesario, además, distinguir las ternas inerciales
de las que no lo son. Las primeras, idealmente “animadas de un movimiento lineal
uniforme” o bien “fijas respecto de las estrellas”, son aquellas que, al menos desde un
punto de vista práctico, verifican las leyes de Newton en su forma más simple.
Contrariamente, las ternas no inerciales son solidarias a un objeto en rotación o en
movimiento no uniforme (como la Tierra o el mismo vehículo).

En la mayoría de las aplicaciones (excepto en vehículos extraplanetarios) la Tierra es el


mayor objeto masivo cercano al vehículo y, por consiguiente, determina la componente
más importante del campo gravitacional que lo afecta (en general los efectos de la Luna
y del Sol pueden despreciarse en vehículos terrestres o aeroespaciales pero no siempre
en aplicaciones satelitales). Las fuerzas gravitacionales compuestas con las no
gravitacionales, que impulsan o sustentan al vehículo, determinan su aceleración
instantánea y, por consiguiente, su trayectoria. Por lo tanto, dado que no es posible
medir directamente la aceleración gravitacional a bordo de un vehículo (ver Capítulo 2),
los algoritmos de navegación incorporan un modelo matemático de ésta para poder
calcular la aceleración instantánea resultante.

Como veremos, la descripción gravitacional de la Tierra está íntimamente relacionada


con su forma, la cual, a su vez, resulta crucial tanto para la definición de las ternas de
referencia como para la determinación de las transformaciones de coordenadas que las
vinculan.

Son objeto de este capítulo, algunos principios básicos de geodesia y gravitación que
atañen a la navegación en la vecindad de la Tierra, así como la descripción de las
principales ternas de referencia utilizadas en la práctica.

65
4.1 Geometría de la Tierra

Siendo el objeto de la Geodesia el estudio de la forma terrestre, esta ciencia ofrece


principios y resultados fundamentales para los fines de este Capítulo. Tal vez el primer
concepto que es dado introducir para describir la forma terrestre es el de “superficie
equipotencial”, entendiéndose por tal a toda superficie sobre la cual un nivel de burbuja
hipotético mantendría su indicación invariante. Las superficies equipotenciales son
cerradas sobre sí mismas y encastradas como las capas de una cebolla, cada una
conteniendo al centro de masa de la Tierra. Estas superficies pueden estar parcialmente
(o aun totalmente) debajo de la superficie terrestre. En el último caso, su geometría
quedará determinada tanto por la fuerza gravitacional ejercida por la masa terrestre
encerrada por la superficie equipotencial como por la que ejerce la porción de masa
terrestre al exterior de la misma. De ser despreciables los efectos atmosféricos
(distribución no uniforme de la presión atmosférica, presión del viento sobre su
superficie, etc.) la superficie de un líquido en reposo sobre la Tierra constituye una
porción de superficie equipotencial. Deberá notarse que, aún en ausencia de efectos
atmosféricos, la superficie de un líquido en reposo no está determinada solamente por la
fuerza gravitacional (principalmente terrestre pero también solar y lunar) sino también
por la fuerza centrífuga originada por la rotación terrestre. Lo anterior justifica
distinguir entre aceleración gravitacional aparente, que llamaremos gravedad, y la
aceleración gravitacional a secas, que llamaremos gravitación. La primera corresponde
al vector gradiente del potencial gravitacional combinado con la centrífuga debida a la
rotación terrestre, mientras la segunda es, exclusivamente, el gradiente del potencial
gravitacional. Claramente, la gravedad es en todo punto ortogonal a las superficies
equipotenciales introducidas más arriba y co-lineal con la línea de la plomada local.

4.1.1 El Geoide y Otras Superficies de Referencia


Se define al Geoide terrestre como: La superficie equipotencial del campo de gravedad
terrestre que mejor aproxima al nivel medio de los océanos en el sentido de los mínimos
cuadrados. El Geoide es la superficie equipotencial usada tradicionalmente como
referencia para medir alturas.

Las perturbaciones gravitacionales debidas a la Luna y al Sol producen movimientos


periódicos sensibles tanto en la corteza terrestre (mareas sólidas) como en las masas
oceánicas a los que se suman los movimientos debidos a fuerzas tectónicas. En
consecuencia, tanto la gravedad local como las superficies equipotenciales y la
superficie del océano varían con el tiempo, de modo que, en rigor, la definición de
Geoide anterior sólo tiene sentido en un instante dado. Lo usual es entonces considerar
superficies equipotenciales promediadas en un período de tiempo. En particular el
Geoide es una superficie promediada sobre los ciclos de las mareas. Aún así, el Geoide
promedio varía con el tiempo en función de cambios lentos en la distribución de masas
en la Tierra producidos, entre otras, por las fuerzas tectónicas. Hechas estas salvedades,
cuando se habla de la forma de la Tierra en realidad se alude a la forma del Geoide,
principalmente debido a su casi superposición con la superficie oceánica que cubre gran
parte del planeta.

Lo irregular de la forma del Geoide y su compleja descripción matemática dificulta su


uso como superficie de referencia en problemas de navegación. Afortunadamente, el
Geoide se asemeja a un elipsoide achatado en los polos con una descripción matemática
relativamente sencilla. Esto motivó al Comité de Desarrollo del World Geodetic System

66
a adoptar en 1984 como superficie de referencia un elipsoide geocéntrico de revolución
alrededor del eje de los polos terrestres con su diámetro mayor en el plano ecuatorial y
su diámetro menor en el eje nominal. Sucesivas mejoras a este sistema introducidas
más tarde concluyeron finalmente en el actual Elipsoide WGS 84 definido por la
National Imagery and Mapping Agency (NIMA) que describimos más adelante y
llamaremos en lo sucesivo el elipsoide normal. La excelente aproximación del Geoide
por el elipsoide normal se traduce en diferencias de alturas entre ambos inferiores a los
100m. en todo el planeta. Cabe destacar que el sistema WGS84 sirve actualmente como
referencia para el sistema GPS y otros sistemas satelitales de navegación global (GNSS:
Global Navigation Satellite System) a los que nos referiremos en el Capítulo 9.

e1
P
e2

h Q0 Geoide e3

P0 N e4
S
Q
Elipsoide normal
Nivel Medio
del Océano

Figura 4.1: Superficies equipotenciales (e1, e2, e3 y e4) y alturas relativas.

En la Fig. 4.1 se indican: la proyección S sobre el elipsoide normal del punto genérico P
según la vertical geodésica; la altura geodésica h de P sobre el elipsoide normal; la
ondulación o altura del Geoide sobre el elipsoide en el punto Q y la altura ortométrica
de P sobre el Geoide dada por la longitud de la curva PP  , tangente en todo punto a la
0

dirección de la plomada.

Sup. terrestre
CTP
Sup. equipotencial
Geoide
P: Posición del vehículo
Elipsoide
normal
vg: Vertical geodésica
va: Vertical
Ejes del astronómica
elipsoide  (Gravedad)
Centro de a
masa de la c
Tierra 
O
Figura 4.2: Cuadrante de meridiano terrestre y definiciones de latitud.

67
En el cuadrante de meridiano representado en la Fig. 4.2 se comparan la superficie
terrestre (y sub-oceánica) con el Geoide y el elipsoide normal. Se indican la superficie
equipotencial que pasa por el punto P, la línea normal al elipsoide, o vertical geodésica
y la dirección del vector gravedad o dirección de la plomada. Los ángulos a  c y
 indicados en la figura, se denominan, respectivamente, latitud astronómica, latitud
geocéntrica y latitud geodésica.

4.1.2 Geometría del Elipsoide Normal


Como se mencionó anteriormente, el elipsoide normal es un elipsoide de revolución
geocéntrico con radio mayor a sobre el plano ecuatorial y radio menor b entre el centro
de masa de la Tierra O y el Polo Convencional Terrestre (CTP)*. El vector O-CTP fue
adoptado por el Bureau International de l’heure (BIH) como eje nominal inercial de
rotación terrestre fijo en el espacio inercial (respeto de las estrellas). El plano meridiano
de referencia del Elipsoide es el meridiano cero de la hora terrestre (meridiano BIH 0º)
y pasa a unos 100mts al Este del meridiano de Greenwich. El corte del elipsoide según
el meridiano BIH 0º corresponde a una elipse como la indicada en la parte inferior de la
Fig. 4.3. Las ecuaciones en coordenadas cartesianas del elipsoide y de la elipse para
y=0 son, respectivamente:

Elipsoide : S0   x, y, z; ( x 2  y 2 ) / a 2  z 2 / b 2  1
(4.1)
Elipse : E0  ( x, y, z )  S0 ; y  0  x 2 / a 2  z 2 / b 2  1

Ambos objetos geométricos son usualmente caracterizados mediante los valores de a y


del achatamiento: f  (a  b) / a . En ocasiones convendrá utilizar en lugar de f la
excentricidad:   (a 2  b 2 ) / a (ó  2  f (2  f ) ). La Tabla 4.1 del párrafo 4.4.1
consigna los valores normales para el elipsoide terrestre.

El punto P de la Fig. 4.3 representa la posición de un vehículo hipotético y el punto S su


proyección normal sobre el elipsoide. De la expresión de la tangente a la elipse (4.1) en
el punto S y de la definición de la latitud geodésica  surge la siguiente relación entre
esta última y las coordenadas del punto S:

  dx zS a 2
  ( , )     tan 
2 2 dz xS b 2
(4.2)

    xS  0, zS  b
2

Combinando la anterior con la ecuación (4.1) se obtiene la ecuación de la elipse con 


como parámetro:

*
Dirección astronómica media del polo terrestre entre 1900-1905, fija inercialmente.

68
a cos  
xS 
2 
1
(1   sen  ) 
2 2
 
2 12  ;   [ , ] (4.3)
b(1   ) sen  2 2
zS 
2 
1
(1   sen  ) 
2 2

Las ecuaciones paramétricas (4.3) permiten, a su vez, relacionar las latitudes  y c


sobre el elipsoide (ver Fig. 4.3) mediante la ecuación (notar el rol de la excentricidad 

  z
  ( , )  tan( c ( S ))  s  (1   2 ) tan( ( S ))
2 2 xs
(4.4)

c    
2

En los capítulos siguientes necesitaremos conocer los radios de curvatura según las
direcciones del paralelo y del meridiano locales en función de la latitud  de cada punto
del elipsoide de referencia. Introducimos primeramente el Radio normal Rn (ver Fig.
4.3):

xs a
Rn ( )   (4.5)
cos( ) (1   sin 2 ( ))1/ 2
2

El Radio de curvatura paralelo, Rp(h), corresponde a la distancia del punto P al eje z


y se determina en función de la altura geodésica h y la latitud  usando la definición
(4.5) y la primera de las Ecs. (4.3), según:

R p (, h)  xs ()  h cos()  ( Rn ()  h) cos() (4.6)

Del mismo modo, la coordenada zs del punto S se calcula a partir de la (4.3) y la


definición de Rn:

b 1
zS ( )  Rn ( ) (1   2 ) 2 sen( )  Rn ( )(1   2 )sen( ) (4.7)
a

Además, como surge de la Fig. 4.3, la coordenada zp del punto P resulta:

z p (, h)  zs ( )  hsen( )  ((1   2 ) Rn  h)sen( ) (4.8)

El Radio de curvatura meridiano en un punto S sobre la elipse, surge de evaluar la


conocida fórmula del radio de curvatura de una curva plana definida paramétricamente
según las Ecs. (4.3):

(1  ( dx
dz 2 3/ 2
) ) a (1   2 )
Rm ( )   (4.9)
d2z
dx 2
(1   2 sin 2 ( ))3/ 2

De las Ecs. (4.5) y (4.9) surge la siguiente relación entre los radios Rn y Rm sobre la
elipse normal:

69
z

y
a
a

x z P
Plano Meridiano 0º 90º-
r
b
h
S(xs,zs)
rs


c
O a x

Rn

Figura 4.3: Geometría del elipsoide normal


(1   2 sin 2 ( ))
Rn ( )  Rm ( )  Rm ( )(1  O( 2 ))  Rm ( ) (4.10)
(1   2 )

Para alturas moderadas el radio de curvatura meridiano en un punto P a una altura


geodésica h sobre el elipsoide normal se aproxima muy bien mediante la expresión:

Rm (, h)  Rm ( )  h (4.11)

70
4.2 Ternas de referencia

A continuación describimos los sistemas de coordenadas de referencia más usados en


navegación y las transformaciones de coordenadas que los vinculan.

4.2.1 Terna Centrada Terrestre (ECEF) y terna Inercial Centrada Terrestre (ECI)
Ambas ternas tienen su origen en el centro de masa nominal de la Tierra, su eje “z” es
paralelo al eje nominal terrestre y sus ejes “x” e “y” están contenidos en el plano
(ecuatorial) ortogonal a “z” (ver Fig. 4.4). La terna centrada terrestre {e} (ECEF: Earth
Centered-Earth Fixed) es solidaria a la Tierra, su eje “x” pasa por el meridiano 0º BHI y
su eje “y” completa la terna ortonormal positiva. La terna inercial centrada terrestre {i}
(ECI: Earth Centered Inertial) conserva su orientación invariante en el espacio inercial
y es considerada inercial mientras sean despreciables los efectos de la rotación de la
Tierra alrededor del Sol. Usualmente, sus ejes “x” e “y” se elijen coincidentes con los de
la terna ECEF en el instante inicial de la navegación. Por definición, la terna ECEF rota
(junto con la Tierra) a la velocidad angular terrestre Ωe  respecto de la ECI alrededor
del eje “z” común a ambas ternas (eje invariante de la rotación).

e i
z ºz Vector velocidad
Ωe angular de la Tierra
Meridiano de P
Greenwich

Plano
Ecuatorial

e
y
O
i
y
i
x
e t
e
x

Figura 4.4: Representación de las ternas ECEF y ECI.

De acuerdo con las definiciones anteriores, lo visto en el capítulo precedente y usando


Ωe  e , es fácil comprobar, que la matriz de cosenos directores (MCD)
correspondiente al cambio de coordenadas entre ambas ternas en un instante dado t
desde el inicio de la navegación es:
 cos( e t ) sin(e t ) 0 
Ci    sin(e t ) cos(e t ) 0 
e
(4.12)
 0 0 1 

71
Las coordenadas cartesianas de un punto genérico P según las ternas ECEF y ECI se
denotan respectivamente:

P e   x e y e z e  ; Pi   xi y i z i 
T T
(4.13)

4.2.2 Terna Vertical Geocéntrica Local (LGCV)

e N c
z z U

Meridiano de E Ternas “c”


P
Greenwich c
y ||N N
Plano
Ecuatorial E
c
x ||E

c y
e
O D

U N

e
x
E

Figura 4.5: Representación de las ternas ECEF y LGCV-ENU.

La terna LGCV (Local Geocentric Vertical), también llamada geocéntrica y que


denotamos con el superíndice “c”, está centrada en el centro de gravedad de la Tierra, su

eje zc es colineal a la vertical geocéntrica local que contiene al radio vector OP entre el
origen O y el punto representativo del vehículo P, usualmente el centro de masa de la
unidad de medidas inerciales (ver Fig. 4.5). Sus ejes xc e yc yacen sobre el plano
 
ortogonal a OP . Cuando el eje zc tiene el sentido OP es denotado U (up) y D (down)
cuando tiene el sentido contrario. Los ejes xc e yc suelen estar orientados según las
direcciones cardinales geocéntricas: N/S, intersección del plano meridano local con el
plano tangente geocéntrico o E/O, dirección simultáneamente ortogonal a las
direcciones N/S y U/D. Las ternas geocéntricas más utilizadas son las LGCV-ENU y
LGCV-NED, respectivamente, con los ejes (xcE, ycN, zcU) y (xcN, ycE, zcD). En
la Fig. 4.5 se ejemplifica una terna LGCV-ENU en el punto P de latitud geocéntrica c
y longitud . Como es fácil comprobar, la terna LGCV-ENU se obtiene a partir de la
terna ECEF mediante la secuencia de rotaciones elementales de Euler: ()@ze (que
ubica al eje xe en la dirección E) seguida de (c)@xc (que coloca al eje ze en la
dirección del eje U). En consecuencia, y de acuerdo con lo visto en párrafo 3.1.5 del
Capítulo 3, la matriz de cambio de base que vincula la LGCV-ENU con la ECEF se
determina según:

72
1 0 0   sen cos  0 
Cce ( ENU )  0 sen c cos  c    cos  sen 0  
0  cos  c sen c   0 0 1 
(4.14)
 sen cos  0 
  sen c cos  sen c sen cos  c 

 cos  c cos  cos  c sen sen c 

Las siguientes ecuaciones permiten relacionar las coordenadas ECEF con las
coordenadas curvilíneas esféricas (c, r) del punto P:

 x e   r cos  c cos 
 
P e   y e    r cos  c sen  (4.15)
 z e   r sen c 

r  P e  x e 2  y e 2  z e 2 ; sen( c )  z e / r ; tan( )  ( x e / y e ) (4.16)

Aplicando la transformación de coordenadas (4.14) a la expresión (4.15) se obtienen las


coordenadas LGCV del punto P:

0
P   0 
c
(4.17)
 r 

4.2.3 Terna Vertical Geodésica Local (LGV)

Las ternas LGV (Local Geodetic Vertical), que llamaremos geodésicas, están centradas
en el centro de gravedad de la Tierra, su eje z es paralelo a la vertical geodésica local
(con sentido U ó D) y sus ejes horizontales, x e y, son paralelos al plano tangente al
elipsoide WGS84 en el punto de la proyección del punto P (S en la Fig. 4.6). Cuando
los ejes x e y son paralelos a las direcciones cardinales (E/O ó N/S) la salida del sistema
de navegación queda automáticamente referida a estos ejes lo que resulta muy
conveniente en muchas aplicaciones (p.e.: el rumbo de un vehículo o la orientación de
un objeto a bordo del mismo).

La denominación de la terna depende de la orientación elegida para sus ejes


horizontales. Entre las ternas “cardinales” distinguimos la terna geográfica {g}: (xg ,yg,
zg)  (E, N, U) y la terna de nivel {l}: (xl ,yl, zl)  (N, E, D) esta última, usada
principalmente en aeronavegación, se obtiene de la primera invirtiendo el sentido del eje
z e intervirtiendo sus ejes x e y. En la Fig. 4.6 se ejemplifica la terna geográfica (LGV-
ENU) para un punto P caracterizado por su latitud geodésica , su longitud  y su
altura geodésica h, llamadas coordenadas curvilíneas geodésicas.

Para mantener en todo momento su orientación cardinal se requiere rotar la terna


geodésica en función del desplazamiento en longitud (E-O) del vehículo. Este

73
procedimiento es particularmente crítico en las vecindades de los polos donde pequeños
desplazamientos en la dirección E-O inducen grandes cambios en la dirección N-S.
Esto se traduce, como veremos en el próximo capítulo, en dificultades numéricas
importantes en los algoritmos de navegación inercial. Lo anterior motiva el uso de
ternas geodésicas “no-cardinales” obtenidas a partir de las cardinales mediante la
rotación de un ángulo positivo  alrededor de su eje z llamado ángulo de deriva o
“wander angle”. Por abuso de lenguaje, estas ternas son comúnmente llamadas ternas
de navegación y denotadas con “n”. Existen diversas estrategias para definir la rotación
(t)@z y algunas de ellas serán descritas en el Capítulo 5.

e
z N
N U
P E
E
g
y ||N g
h
z ||U
S D
g Terna “g”
x ||E
O  y
e

U N

e E
x
Terna “l”
Figura 4.6: Representación de las ternas ECEF y LGV-ENU.

Las siguientes MCD corresponden a las transformaciones de coordenadas entre las


ternas {n}, {l} y {g}:

 cos  sen 0 0 1 0 
C n
g ( ENU )  ( @ z )   sen cos  0  ; C l ( NED )
g ( ENU )  1 0 0  (4.18)
 0 0 1  0 0 1

Tal como la terna geocéntrica, la terna geodésica rota respecto de la terna ECEF a
medida que el vehículo se desplaza. La MCD del cambio de coordenadas entre la terna
geográfica y la ECEF se obtiene en función de  y  de modo similar a la Ec. (4.14):

 sen cos  0 
C   sen cos 
g
e sensen cos   (4.19)
 cos  cos  cos sen sen 

En virtud de la definición (4.5) y las Ecs. (4.6) y (4.8), las coordenadas cartesianas en
terna {e} del punto P se expresan en función de sus coordenadas geodésicas (,h)
según:

74
 x e  ( Rn ()  h) cos() cos() 
 
P e   y e    ( Rn ()  h) sin() cos()  (4.20)
 z e   ((1   2 ) Rn ( )  h) sin( ) 
 

Inversamente, a partir de las coordenadas cartesianas de Pe y usando las (4.5), (4.6),


(4.8) se obtienen las relaciones

tan()  ( x e / y e )  
rxye  R p (, h)  ( Rn ( )  h) cos( )  (4.21)
  , h
z e  ((1   2 ) Rn ( )  h)sen( ) 

Donde se usó la definición rxye  x e 2  y e 2 . Con la primera ecuación se determina la


latitud  mientras que el último par de ecuaciones no lineales permite calcular la latitud
 y la altura h sobre el elipsoide normal. Normalmente se recurre a un algoritmo
iterativo para resolver este último par de ecuaciones implícitas (véase también el
procedimiento expuesto en Chatfield, (1997), Cap. 8.I)

Aplicando la transformación de coordenadas (4.19) a la (4.20) se obtienen las


coordenadas geográficas del punto P en coordenadas geográficas:

 xg   0 
 g 
P   y     Rn sin() cos( ) 
g 2
(4.22)
 z g  ( Rn  h)   2 Rn sin 2 () 
 

Comparando la anterior con la Ec. (4.17), se advierte la componente en yg inducida por


Por otra parte, junto con la (4.5) se observa que: lim
 0
P g  Pc .

Ternas {n} y rumbos geográfico y de navegación


En el diagrama de la Fig. 4.7 se representan los ejes horizontales xn e yn de la terna {n}
definida a partir de una terna geográfica (ENU) y el eje xb del vehículo proyectado sobre
el plano tangente local. Se indican además el rumbo geográfico g y el rumbo de
navegación g del vehículo.

N
α
ψg
n
xb
y
ψ
xn
α
E
Figura 4.7: Rumbos geográficos y de navegación.

75
Las coordenadas en terna {n} de un punto P se determinan a partir de la (4.22) y la
primera de la (4.18), o bien, a partir de la (4.20) y usando además la (4.19) como:

P n  Cng P g  Cng Ceg P e  Cen P e (4.23)

De las Ecs. (4.19) y (4.18) resulta la MCD Cen en función de  y 

 C S   S S C  C C   S S S S C  
Cen  Cng Ceg   S S   C S C   S C   C S S  C C   (4.24)
 C C  C S  S  

4.2.4 Terna Vertical Astronómica Local (LAV)


La dirección vertical de la terna LAV es paralela a la vertical astronómica (dirección de
la plomada local). En la Fig. 4.8 a) se indican para el punto P las direcciones: vertical
astronómica (va), vertical geodésica (vg), N y O geodésicos locales y el módulo v de la
rotación vectorial v que vincula va con vg. El vector deflexión vertical v tiene por
componentes según los eje xg (E) y yg (N), respectivamente, -y indicados también
en la Fig. 4.8 a) (el primero es negativo en la dirección E y el segundo positivo según el
eje N). Consistente con esta convención, de las figuras 4.2 y 4.8, llamando,
respectivamente,  a y a a la latitud y longitud astronómicas* del punto P y usando:
  a   y    a   , se tienen las siguientes relaciones entre las coordenadas
angulares geodésicas y astronómicas:

  ;    cos  (4.25)

a) b) Δλ
O N N

P U

 
   cos() E

v vg
Terna
va LGV en P  sin( )
P
ξ
Figura 4.8: Componentes de la deflexión vertical.

Así mismo, se advertirá de la Fig. 4.8 b) que la componente de v en la dirección U (zg)


resulta ser  sin( ) . Combinando los resultados anteriores el ángulo vectorial δvg se
escribe:

*
Observadas respecto del vector gravedad local.

76
 - 
δvg     (4.26)
 tan  

Dado que δvg  50arcseg , la MCD que expresa el cambio de coordenadas entre la terna
LGV {g} y la LAV {a} puede obtenerse como la composición de pequeñas rotaciones
de Euler alrededor de los ejes de la terna {g} (ver Ec.
¡Error! No se encuentra el origen de la referencia. del Capítulo 2) donde resulta:

 1  tan( )  
Cag    tan( ) 1   (4.27)
   1 

Por otra parte, la MCD correspondiente al cambio de coordenadas entre la terna {e} y la
terna {a} resulta de un modo análogo a la (4.19):

 sena cos a 0 
C   sen a cos a sen a sena cos  a 
a
e
 (4.28)
 cos  a cos a cos  a sena sen a 

4.2.5 Ternas del cuerpo y de los instrumentos

Cuerpo (b) Cbm Om xm


ym
Ob Om
zm Mediciones
b
x (m) (IMU)
θ (pitch)
φ (roll)
ψ (yaw) giróscopo
b
y acelerómetro
zb

Cbl xl
yl
Nivel (l) g-NED
zl
Figura 4.9: Ternas del Cuerpo (b), de mediciones (m) y de “nivel” (l  g-NED).

La terna asociada al cuerpo del vehículo, que denotamos con el superíndice “b” (body),
permite describir la orientación de éste respecto de la terna de navegación. El origen de
la terna del cuerpo (P en las Figs. 4.1 a 4.6) es un punto característico del vehículo,
usualmente su centro de masa, cuya posición y velocidad respecto de la terna de
navegación de referencia interesa conocer en todo instante. Si bien los ejes de la terna
del cuerpo pueden ser arbitrarios, estos suelen ser elegidos conforme a los planos de

77
simetría del vehículo y/o a sus condiciones de desplazamiento nominal. Muy
frecuentemente (y regularmente en aeronavegación), el eje xb (de guiñada o roll) apunta
en la dirección de avance del vehículo (o su “nariz”), el eje zb (de rumbo o yaw) apunta
hacia “abajo” y el eje yb (de cabeceo o pitch) completa la terna positiva (ver Fig. 4.9).

Con la definición anterior de los ejes, la orientación del vehículo respecto de la terna
geodésica {l} queda determinada por los 3 ángulos de Euler: g(yaw o rumbo
geográfico según la Fig. 4.7), (pitch) y roll) (ver Fig. 4.9) aplicados en la secuencia
3-2-1. La MCD del cambio de coordenadas correspondiente resulta de acuerdo con la
Ec. (3.42) del Capítulo 3 y usando la notación empleada en la Fig. 3.7 *:

Clb  ( @ x b )( @ y b ' )( g @ z l )


 C C  g C S  g S  
  (4.29)
  C S   S S C  C C   S S S 
g g g g
S C  
 S S  g  C S C  g  S C  g  C S S  g C C 
 

En función de los mismos ángulos pero respecto de la terna geodésica {g} la orientación
del vehículo queda definida por la secuencia de rotaciones:

C gb  ((  ) @ x b )( @ y b ' )(( / 2   g ) @ z g )


 C S  g C C  g S 
  (4.30)
  C C   S S S  C S   S S C   S C  
g g g g

  S C  g  C S S  g S S  g  C S C  g C C 
 

Por último, la MCD que vincula la terna del cuerpo {b} con la terna {n} se obtiene
desarrollando la anterior después de sustituir  g por    g   y resulta:

Cbn  ((  ) @ x b )( @ y b ' )(( / 2  ) @ z n ) 


 C S  C C  S 
(4.31)
  C C   S S S  C S   S S C   S C  

  S C   C S S  S S   C S C  C C 

En los sistemas de navegación strapdown la unidad de mediciones inerciales (UMI) está


fijada a la estructura del vehículo en una posición y orientación no necesariamente
coincidentes con la terna del vehículo (esta libertad para posicionar la UMI es una de las
mayores ventajas de la tecnología strapdown respecto de la navegación con plataforma
inercial). En consecuencia, para referir los datos inerciales provistos por la UMI en la
terna {m} a la terna del cuerpo {b} se requerirá conocer el vector desplazamiento OmOb
(“brazo de palanca”) entre los centros de coordenadas de ambas ternas y la matriz de
transformación de coordenadas Cbm (ver Fig. 4.9). Ambas magnitudes están
determinadas por la implementación física del sistema de navegación a bordo.

*
Cuando convenga por razones de espacio se utilizará la notación: sen()=S, cos()=C

78
4.3 Modelos Globales de Gravitación y Gravedad

El potencial gravitacional V(P), resultado de la atracción de las masas terrestres sobre


un cuerpo en un punto P exterior al volumen terrestre, puede expresarse mediante un
desarrollo en serie de funciones armónicas esféricas de las coordenadas esféricas ( c,
r) del punto P con r  OP  a (ver apéndice A):

GM T   a
n

V (r ,  c , )  1     Cn ,0 Pn (sen( c ))
r  n  2  r  (4.32)
n

  Pn , m (sen c ) Cn ,m cos(m)  S n , m sen(m) 
m2

Donde a es el radio de una esfera que contiene al volumen terrestre* y GMT es la


constante gravitacional terrestre (producto de la constante de gravitación universal G y
la masa terrestre MT). Definimos el término armónico esférico genérico del desarrollo
anterior como:

H n , m ( ,  c )  Pn ,m (sen c )  Cn ,m cos m  S n , m senm  (4.33)

Los coeficientes armónicos esféricos normalizados (Spherical Harmonic Coefficients


(SHC)) o coeficientes gravitacionales, Cn,m , S n ,m (n=2,…; m= 2,…n) condensan toda la
información física del modelo. Las variaciones angulares (en latitud y longitud) están
expresadas por las funciones generalizadas normalizadas de Legendre Pn ,m de grado n y
orden m con argumento sen( c ) y por cos(m  ) y sen(m  ) (ver Apéndice A).
Destacamos que la serie no incluye los términos de grado n=1 y orden m=1 por lo que a
grandes distancias predomina el término esférico del desarrollo: GMT/r.

En la práctica, los modelos globales del potencial gravitacional terrestre son descritos
por truncamientos de la serie (4.32). Los mejores modelos disponibles actualmente son:
el GRIM 5 (colaboración entre: el Geodetic Research Institute de Munich y el Groupe
de Recherches de Geodesie Spatiale, Francia) y el EGM96 (colaboración entre: NASA-
GSFC, National Imaging and Mapping Agency (NIMA) y Ohio State Univ.) y utilizan
un orden máximo mayor o igual a n=360. Los coeficientes gravitacionales son
determinados combinando modelos analíticos de las perturbaciones (mareas, presión
atmosférica y otros) y observaciones que incluyen gravimetría superficial y satelital†,
monitoreo de órbitas satelitales, altimetría satelital por laser y radar, redes geodésicas
GPS, etc.

A continuación enunciamos algunas propiedades de los términos H n ,m que permiten


visualizar sus características geométricas:

*
En la practica, el semieje mayor del elipsoide normal cumple esta condición con un alto grado de
aproximación.

Los datos aportados por la misión satelital “Gravity Recovery and Climate Experinent (GRACE)” desde
2002 combinados con otras fuentes permitirán mejorar la estimación de los coeficientes gravitacionales y
seguir su evolución.

79
 Cada término se anula en 2m longitudes (planos meridianos).
 Cuando m=0, los H n,0 son independientes de la longitud. Sus coeficientes
asociados Cn ,0 , n  2,... son los dominantes de cada grupo n.
 Cuando m=0, las Pn ,0 (sen( c )) alcanzan su valor máximo (+1) o mínimo (-1)
en los polos.
 Las funciones Pn ,m (sen( c )) son simétricas respecto del Ecuador cuando n+m
es par y antisimétricas cuando n+m es impar.
 Cuando m≠0 las funciones Pn ,m (sen( c )) se anulan en los polos y en n-m
latitudes. Si n=m, sólo se anulan en los polos.

De las propiedades anteriores surge la siguiente clasificación de los términos armónicos


H nm del potencial gravitacional:

Armónicos zonales:{m=0}, son superficies de revolución alrededor del eje z, se anulan


en n latitudes pero no en los polos.
Armónicos sectoriales {m=n}, se cancelan en 2n meridianos correspondientes a los
ceros de Cn ,m cos m  S n ,m senm .
Armónicos “teserales”*:{m≠0}Ç{m≠n}, dividen la esfera en forma de “mosaico” con
protuberancias y depresiones alternadas tanto en latitud como en longitud.

Zonal H5 Sectorial H5,5 Teseral H5,3


Figura 4.10: Términos armónicos esféricos.

El potencial gravitatorio U(P) ejercido sobre una masa rotando con la Tierra resulta de
la superposición del potencial gravitacional V(P) y del “potencial centrífugo” W(P)
provocado por la fuerza centrífuga debida a la velocidad angular terrestre  :

1 2 1
W ( P)    P   2 r 2 cos 2  c
2 2 (4.34)
U ( P)  V ( P)+W ( P)

Las superficies equipotenciales mencionadas en el Párrafo 4.1.1, perpendiculares a la


línea de la plomada local, corresponden a valores constantes del potencial gravitatorio
U.

*
De tessera, en latín, mosaico.

80
Aceleraciones Gravitacional y Gravitatoria
A partir del potencial gravitacional expresado en armónicos esféricos (4.32) es posible
obtener el vector gravitación expresado en la Terna Vertical Geocéntrica Local (LGCV)
(E-N-U) mediante las relaciones:

T
g cg ( ,  c , r )   cV   g gc E g gc N g gUc

1 V 1 V V (4.35)
g gc E  ; g gc N  ; c
g gU  ,
r cos  c  r  c r

de las cuales surgen:

GM 1  n  a  n 
g c
gE  2
r cos  c
   m(Cn ,m sin m  S n ,m cos m ) Pn ,m (sin  c ) 
 r 
n  2 m0  
GM   a  n
n 
g gc N 
r2
   (Cn ,m cos m  S n ,m sin m ).( Pn ,m 1 (sin  c )  m tan  c Pn, m (sin  c ) 
 r 
n 2 m0  
GM  
 n
n
a
c
g gU   2 1   (n  1)    (Cn ,m cos m  S n ,m sin m ) Pn ,m (sin  c )  
r  n  2 m 0 r 
(4.36)

Aplicando las mismas expresiones (4.35) al potencial W(P), dado por la primera de las
(4.34), se obtiene la expresión para la gravedad centrifuga: g w  W en terna (LGCV)
(E-N-U), de donde, junto con la 2ª de las (4.34), resulta la gravedad actuando sobre una
masa solidaria a la Tierra:

 0 
g (,  c , r )  U  g  g  g   r cos  c  sen  c 
c c c
g
c
w
c
g
2
(4.37)
  cos  c 

Notar que g cw no tiene componente E (normal al meridiano). Tanto la gravedad como la


gravitación terrestres pueden expresarse en otros sistemas de coordenadas usando las
transformaciones introducidas previamente en este capítulo.

4.4 Aproximaciones del Potencial Gravitacional Terrestre

Dado que Pn ,m se anula en n-m latitudes mientras que cos(m  ) y sen(m  ) lo hacen en a
lo sumo 2n longitudes, el índice n define la resolución angular sobre la esfera (longitud
de onda espacial del armónico) es decir, la escala de la información que contiene. Por
otra parte, la simetría casi esférica de la Tierra hace que con alturas crecientes el factor
(a/r)n suavice rápidamente las altas frecuencias espaciales presentes en los armónicos
superiores. Esto adquiere particular relevancia en ciertas aplicaciones satelitales. Así,
sobre órbitas de alturas bajas (Low Earth Orbits 1000 Km de altura) y medias (Middle

81
Earth Orbits a 20.000 Km) resoluciones, respectivamente, de 10º (n=36) y de 30º (n=
12) se traducen en aproximaciones de una muy aceptable precisión. Más aún, para estas
órbitas, la fuerte simetría axial y el efecto de promediado del campo gravitatorio a lo
largo de la orbita permite descartar los términos no zonales del desarrollo (4.32) lo cual
conduce a la aproximación (Wertz-1978):

GM T  
a
n
 GM T  
a
n

V ( ,  c , r )  1     Cn ,0 Pn ,0 (sen c )   1     J n Pn (sen c ) 
r  n  2  r   r  n  2  r  
(4.38)

En la expresión anterior se usó la convención habitual consistente en definir los


coeficientes armónicos zonales según: J n Pn (sen c ) = Cn ,0 Pn ,0 (sen c ) donde Pn (.) es
el polinomio de Legendre no normalizado (ver normalizaciones en el Apéndice A). En
satélites geosincrónicos, a pesar de que el diámetro orbital es considerablemente mayor
que en los casos mencionados, la aproximación (4.38) no es aplicable, dado que en este
caso, por tratarse repuntos fijos respecto de la superficie terrestre, los armónicos no
zonales no resultan promediados a lo largo de la órbita induciéndose así efectos
longitudinales sensibles.

4.4.1 Gravedad Normal


Los modelos globales basados en el desarrollo (4.32) resultan inadecuados para la
navegación a alturas medias o bajas. En efecto, aún un desarrollo con nmax=360 (que
requiere usar 130.000 armónicos!) tendría una resolución de 1º equivalente a unos
110Km cerca de la superficie terrestre. Esto puede resultar insuficiente para captar los
componentes de alta frecuencia espacial del campo gravitacional debidos a la
distribución irregular de masas sub-superficiales o a la proximidad de cadenas de
montañas.

La complejidad del campo gravitatorio y la dificultad para describirlo a bajas alturas


condujo a descomponer los campos gravitacionales y gravitatorios según 2
componentes: a) una componente principal, llamada gravedad normal, descrita, como
veremos, por una expresión analítica cerrada (sin desarrollos en serie mediante) que
reproduce en forma global las bajas frecuencias del campo gravitatorio y b) una
componente residual de alta frecuencia espacial, llamada perturbación de la gravedad
de magnitud sensiblemente menor a la primera que representa los apartamientos locales
respecto del campo normal.

La excelente aproximación geométrica del Geoide por el elipsoide normal motiva el uso
de este último también como referencia gravitatoria. Así, por definición, el elipsoide
normal posee una masa igual a la masa terrestre total, rota a la velocidad angular
terrestre nominal e  y genera un hipotético potencial gravitatorio normal Un del cual
su propia superficie So es equipotencial. Un es la superposición del potencial
gravitacional normal Vn y el potencial centrífugo definido mediante la (4.34). De
acuerdo con el Teorema de Stokes-Poincaré (Torge 2001) Un queda unívocamente
definido sobre y al exterior de So, por la solución del siguiente problema laplaciano con
condiciones de contorno: 

82
P exterior a S0   2Vn ( P)  0;
P  S0  Vn ( P )  U 0  W ( P ); (4.39)
GM T
r  P   Vn ( P) 
r

Donde, la segunda de las (4.39) es la condición de que S0 sea una superficie de potencial
constante igual a U0 y la tercera, la condición de que para grandes distancias el potencial
gravitacional normal resulte indistinguible del potencial gravitacional terrestre lejano.

Constante Valor

a: Radio ecuatorial 6.378.137.0 m

GMT: Constante gravitacional 3,986004418x1014m3s-2

Velocidad angular 7,292115x10-5rad/seg

f : Achatamiento 298,257223563-1

Excentricidad 0,08181919084

0: Gravedad normal ecuatorial 9.7803253359 m/s2

p: Gravedad normal polar 9.8321849378 m/s2

Tabla 4.1 Constantes del sistema WGS 84

Hofmann & Moritz-2006 demuestran que el potencial con simetría axial solución de las
(4.39) es tal que: a) la solución Vn(  h) es un fórmula exacta cerrada función de las
coordenadas geodésicas  h del punto P sobre { [0, 2] }Ç{h0}
independientemente de la longitud  y, b) que el potencial gravitatorio sobre So adopta
el valor:

GM T 2 a 2
Uo  arctan( E / b)  (4.40)
E 3

Donde E  a 2  b 2 es la excentricidad lineal. La expresión general del potencial


gravitatorio normal en puntos no interiores al elipsoide de referencia se obtiene
reemplazando en las Ecs. (4.34) el potencial gravitacional normal Vn(  h) obtenido
mediante la (4.39):

U n (, h)  Vn (, h)  W (, h) (4.41)

La gravedad y la gravitación normales, γ ( P) y γ g ( P)  se calculan a partir de los


respectivos potenciales, mediante:

83
γ ( P)  U n ( P); γ g ( P)  Vn ( P) (4.42)

Destacamos que tanto el elipsoide como el potencial y la gravedad normales quedan


definidos por los 4 parámetros independientes: a, f, GMT y  cuyos valores, provistos
por NIMA (ver: WGS84 NIMA-Technical Report TR8350-2), son consignados en la
Tabla 4.1.

Vista la simetría axial del potencial normal y la condición de que el elipsoide normal es
una superficie equipotencial, la gravedad normal γ ( P) expresada en coordenadas
geodésicas (LGV-ENU) sobre y fuera del elipsoide normal adopta la forma:

h  0  γ g (, h)   0  N (, h) U (, h) 


T
(4.43)

Donde  N   h) y U (, h) son funciones cerradas (exactas) de sus argumentos cuyas
expresiones pueden consultarse en NIMA-TR8350-2, 2004 o en Hofmann/Moritz, 2006.
Cuando el punto P( , , h ) no pertenece al interior de S0, por definición, γ ( P) es
ortogonal al elipsoide geocéntrico equipotencial con-focal con S0 de potencial igual a
U n ( P) (Hofmann/Moritz, 2006), pero no necesariamente es ortogonal a S0, salvo, claro
está, si h=0. Esto, junto con la simetría axial del potencial normal explica la ausencia de
la componente E de γ g (, h) y la existencia de la componente residual N-S en la Ec.
(4.43) para h>0. Cuando h=0 resulta la Fórmula de Somigliana (Hofmann/Moritz,
2006):

h  0  γ g (, h)   0 0 U (, 0) 


T

1  k sin 2 
U (, 0)   ( )   o ; (4.44)
1   2 sin 2 
(1  f )  p
k  1  0,001931852
o

Donde: o=9.7803253359 m/s2 es la gravedad normal ecuatorial y p=9.8321849378


m/s2 es la gravedad normal polar. Para alturas geodésicas h20Km resulta
arctan(  N (, h) / U (, h) ) < 4arcseg, lo que equivale a  N (, h) <2  g. Esto
determina la cota de error de la aproximación usual para alturas atmosféricas:  N  0 y
U (, h) calculado mediante la siguiente expansión de Taylor de 2º orden en h:

  h h 
2

U (, h)  U (, h)   ( )  1  2 1  f  m  2 f sin ( )   3   


2
 a  a  
 (4.45)
 2 a 2b
m
GM T

84
El error de la aproximación (4.45) es inferior a 0.15g para h20Km (Hofmann/Moritz
2006). Los mismos autores proponen la siguiente aproximación de la componente Norte

(  N ) con un error inferior a 0.1g para h20Km:


 N (, h)   N (, h)  8.08 106 h[ Km]sen(2 ) m / seg 2 (4.46)

Hsu (1998) propone un modelo polinomial global para U (, h) con errores <0.01g
para h30Km.

Gravedad normal en coordenadas terrestres (ECEF)


A diferencia de su expresión en coordenadas geodésicas (geográficas), la solución del
problema (4.39) no tiene una expresión cerrada exacta en coordenadas geocéntricas o
cartesianas terrestres ECEF del punto P. Al respecto, Hofmann/Moritz, 2006 (pp 75 y
76) demuestran que el potencial gravitacional normal está dado por una expansión en
términos armónicos en función de P en coordenadas cartesianas de
T
P e   x e ye z e  de la forma:

GM T  ze 
 2n
a
Vn (P )  1     J 2 n P2 n ( ) 
e
(4.47)
r  n 1  r  r 

Donde, J2n son los coeficientes pares de la expansión (4.38), sen c  z e / r y


r  x e 2  y e 2  z e 2 . Usando la expresión anterior junto con la segunda de las Ecs.
(4.34) la gravedad normal en coordenadas cartesianas terrestres se obtiene diferenciando
la serie infinita (4.47) y el potencial centrífugo respecto de las componentes x e , y e , z e .
Wei y Schwarz, (1990) demuestran que el resultado es una serie que aproxima la
gravedad normal con un grado arbitrario de precisión con la forma general:

  c0  c1s2  c2 s4  c3 s6 ..  ck s2k .. xe   xe 


GM    
γe (Pe )  eUn (Pe ) = γeg (Pe )+γce (Pe )   3 T   c0  c1s2  c2 s4  c3 s6 ..  ck s2k .. ye   2  ye 
r 
  d  d s2  d s4  d s6 ..  d s2k .. ze  0
 
 0 1 2 3 k 
(4.48)

Con:
γ eg (P e )   eVn (P e ); γ ce (P e )   eW (P e ) (4.49)

Donde el operador  e denota el operador gradiente según las coordenadas ECEF,


s  z e / r los coeficientes ci, y di son funciones de los primeros coeficientes J2, J4, J6…
y de las primeras potencias pares de (a/r). Los mismos autores verifican numéricamente
que truncando las series en (4.48) en k=3 los errores respecto del valor exacto de γ e son
inferiores a 0,05g.

85
Aproximación J2
Dado que los coeficientes gravitacionales decrecen rápidamente con el índice n el
término dominante de la serie (4.47) (también de las (4.32) y (4.38)) corresponde al
coeficiente zonal J2 (@1.082x10-03). En efecto, J2 supera casi en 3 órdenes de magnitud a
cualquier otro coeficiente gravitacional y refleja el abultamiento ecuatorial y
consiguiente achatamiento en los polos del Geoide. Para ciertas aplicaciones, esto
justifica truncar la serie (4.47) en el primer término lo que conduce a la siguiente
aproximación del potencial gravitacional normal.

GM T   a  
2

Vn (P )  VJ 2 (P ) 
e e
1    J 2 P20 ( z / r ) 
e

r   r   (4.50)
GM T  J 2a2 2 
 1  2 1-3(z / r )  
e

r  2r 

La aproximación de la gravedad normal que surge de la Ec. (4.50) equivale a truncar la


(4.48) en el termino k=1. El resultado es la aproximación denominada “J2” de la
gravedad normal en coordenadas ECEF (ver también Hsu, 1998):

 3 J 2 a 2 15 J 2 a 2 2 e 
 (1  2r 2  2r 2 s ) x 
   xe 
GM  2 2
3J a 15 J 2 a 2 e   
 eJ 2  γ egJ 2 (P e )  γ ce (P e )   3 T (1  2 2  2
s ) y    2  y e  (4.51)
r 2r 2r
 2 2
  0 
 (1  3 J 2 a  15 J 2 a s 2 ) z e 
 2r 2 2r 2 
Con:

γ egJ 2 (P e )   eVJ 2 (P e ); (4.52)

Hsu (1998) compara γ eJ 2 con el valor exacto de la gravedad normal y demuestra


numéricamente que, hasta los 700Km de altura, las diferencias en la componente según
la vertical geodésica es inferior a 12g mientras que la diferencia en la dirección N-S se
mantiene inferior a 6,3g.

4.4.2 Perturbaciones de la Gravedad


El modelo normal aproxima globalmente la gravedad terrestre con errores promedio de
40 a 50g llegando a unos 100g cerca o sobre las grandes cadenas de montañas
(Jekeli 1997). Un tal modelo implementado en un sistema integrado INS/GPS de alta
gama permite obtener precisiones de actitud del orden de los 30 arc-seg. (Schwarz/Wei,
1995) y 10 a 20 cm. en posición en 3D (Hutton et al, 1997). Esta aproximación ha
resultado históricamente suficiente en muchas aplicaciones de interés. Sin embargo, la
mejora en la tecnología de los instrumentos inerciales ha motivado una demanda
creciente de precisión de la navegación para la cual la limitante principal resulta ser
cada vez más el modelo matemático de la gravedad (Jekeli et al 2007). Entre las
aplicaciones que requieren y requerirán cada vez más precisión están el relevamiento
geofísico aéreo, la georreferenciación automática de imágenes ópticas o de radar, los
vuelos prolongados en navegación inercial libre, etc. Como se demuestra en Jekeli,

86
(1997) la fuente más significativa de error del modelo de gravedad corresponde a la
estimación de la componente horizontal no tenida en cuenta por el modelo normal, de
allí la importancia del modelado de la deflexión vertical introducida en el párrafo 4.3.4.

Con referencia en las expresiones (4.41) y (4.42) se definen la perturbación del


potencial gravitatorio (escalar) y la perturbación de la gravedad (vector) en un punto
cualquiera P como:

T ( P)  U ( P)  U n ( P)
(4.53)
δg ( P )  g ( P)  γ ( P)  T ( P)

Teniendo en cuenta la transformación (4.27), es usual aproximar gg como:

0 -g 
δg  C  0  - γ   -g  
g 
g
a
g
(4.54)
 -g   -g 

Donde: g  g ,   γ  U y g  g   es la perturbación escalar de la gravedad. Se


advierte de la anterior, que las componentes  y  de la deflexión vertical determinan la
componente horizontal de la perturbación δg g . A partir de las Ecs. (4.43) y (4.54) se
obtiene la siguiente expresión de la gravedad normal corregida:

 (   g )  
g γ
g g
corr (, , h; , )    (   g )   N  (4.55)
 g  U 

Asociadas con las definiciones anteriores, en Geodesia se definen las anomalías


vectorial y escalar de gravedad sobre un punto PG sobre el Geoide como
(Hofmann/Moritz 2006):

g ( PG )  g ( PG )  γ (QE )
(4.56)
g ( PG )  g ( PG )   (QE )

Donde QE es un punto sobre el elipsoide normal en la vertical geodésica de PG ,


g ( PG )  g ( PG ) y  (QE )  γ (QE ) . Dado que g( PG ) es raramente accesible directamente
a la medida, su valor se obtiene a partir de datos gravimétricos superficiales que luego
son reducidos al geoide suprimiendo los efectos de la altura y de la topografía locales
mediante un procedimiento llamado “de continuación hacia abajo” (downward
continuation, Hofmann/Moritz, 2006)) en el que intervienen modelos de la densidad y
de la topografía locales. El interés de reducir g(P) al geoide es que esta superficie es
mucho más suave que la superficie terrestre y por lo tanto más tratable
matemáticamente. Los mapas digitales de las anomalías de gravedad (ya sea puntuales
o promediadas sobre áreas) es el formato usual en que es provista la información de la
gravedad local por parte de las instituciones nacionales o regionales encargadas de
gestionar los datos geofísicos y geodésicos. Por lo tanto estos mapas suelen ser la única

87
información de base con que se cuenta para la determinación de las perturbaciones de
gravedad ya sea en altura o sobre la superficie terrestre.

Casi todos los métodos, para obtener las perturbaciones de la gravedad g fuera del
Geoide a partir de las anomalías de gravedad se basan en la solución del problema de
valores en la frontera de un potencial newtoniano (o problema de Dirichlet). La mayoría
de ellos usan al Geoide como superficie equipotencial teórica de frontera y se inspiran
en el hecho de que U y Un tienen la misma componente centrífuga (comparar (4.34) con
(4.41)) por lo que T(P) en (4.53) es puramente “gravitacional” y por lo tanto armónico
(  2T  0 ) por encima de la topografía terrestre. El resultado surge de una
aproximación de la solución de  2T  0 con valores de T estimados sobre el Geoide en
base a datos digitalizados de las anomalías de gravedad. Un interesante estudio sobre
estos métodos, denominados de “continuación hacia arriba” (upward continuation
Hofmann/Moritz, 2006) publicado recientemente por Jekeli et al. (2007), concluye que
la principal fuente de error es la discretización espacial de los datos de anomalía y el
truncamiento de la integral de Stokes que resuelve el problema armónico. Grejner-
Brzezinska/Wang, (1998) reportan el diseño de un sistema de navegación integrado
INS/GPS de alta precisión (con errores <5 cm. en posición y <10 arc-seg. en
orientación), como componente de un sistema de mapeo mediante georreferenciación
automática de imágenes aéreas. El modelo de gravedad del sistema de navegación
incorpora una grilla de valores de la deflexión de la vertical en altura obtenida mediante
un método de alta fidelidad de la continuación hacia arriba de la anomalía de gravedad
como los descritos por Jekeli et al. (2007).

88
Capítulo 5
Ecuaciones Cinemáticas
y Ecuaciones de Navegación

Las ecuaciones cinemáticas son las ecuaciones diferenciales que describen los
movimientos traslacional y rotacional de un móvil respecto de un dado sistema de
coordenadas de referencia. Si P  es la posición de un vehículo en una dada terna de
referencia o de navegación {} y la orientación (posición angular) de la terna del cuerpo
del vehículo {b} respecto de {} está caracterizada, por ejemplo, por la MCD Cb , las
ecuaciones cinemáticas determinan la evolución temporal de P  y Cb . Las funciones
forzantes de las ecuaciones cinemáticas son: el vector de la aceleración lineal y el vector
de la velocidad angular del móvil, ambos relativos al sistema de referencia elegido. En
presencia de un campo gravitacional como el terrestre la aceleración lineal es la
composición de la aceleración gravitacional y la aceleración inercial o fuerza específica
provocada por fuerzas inerciales tales como la propulsión, la resistencia aerodinámica o
la sustentación.

En un sistema de navegación inercial, la distinción entre fuerza específica y aceleración


gravitacional es fundamental. En efecto, el principio de relatividad nos advierte que sin
mediciones relativas a algún objeto externo, es imposible determinar el estado de
movimiento de un vehículo moviéndose libremente en un campo gravitacional. Más
específicamente, en este caso, un acelerómetro a bordo del vehículo que mida
desplazamientos relativos de una masa de prueba respecto de su carcasa solidaria al
móvil, indicará aceleración nula dado que, tanto la masa de pruebas como la carcasa
están sometidas al mismo campo gravitacional. Así, sólo cuando exista aceleración
inercial un acelerómetro vectorial a bordo registrará su propia aceleración trasmitida a
través de la estructura mecánica del vehículo respecto de un sistema inercial. Del mismo
modo, los giróscopos a bordo del vehículo medirán su propia velocidad angular también
referida a un sistema inercial.

Los sistemas de navegación inercial son por definición aquellos que utilizan
exclusivamente acelerómetros y giróscopos como instrumentos de medida. Por lo
expuesto, dado que la aceleración gravitacional no puede ser medida por instrumentos
inerciales un sistema de navegación inercial requiere necesariamente de un modelo
matemático de la gravitación en función de las coordenadas del vehículo.

Cuando la terna de referencia es inercial, el modelo gravitacional junto con los


instrumentos inerciales proveen toda la información requerida para integrar las
ecuaciones cinemáticas. Sin embargo, para cualquier otra terna de referencia será
necesario transformar las mediciones inerciales (y la gravitación) según la formulación
elegida. Llamaremos ecuaciones de navegación a las ecuaciones cinemáticas
transformadas de modo tal que sus funciones de entrada sean las magnitudes
efectivamente medidas por los instrumentos inerciales.

89
En los primeros 3 párrafos de este capítulo se deducen las ecuaciones de navegación
para los tres sistemas de referencia mas utilizados, a saber: ECI, ECEF y LGV. El lector
podrá extender el procedimiento expuesto a otros sistemas de referencia que puedan ser
de su interés. En el párrafo 5.4 se analizan aspectos dinámicos de las ecuaciones de
navegación. En particular se describen dinámicas inestables inherentes a estas
ecuaciones y un método usado en aeronavegación para paliar estos efectos.

5.1 Ecuaciones de Navegación en Coordenadas ECI.

En este caso el sistema de referencia es inercial y las ecuaciones de Newton proveen


directamente las ecuaciones cinemáticas que determinan la evolución de las
coordenadas Pi de la posición de un móvil:

 i  mg i  F i
mP (5.1)
g

Siendo m la masa del móvil, mg ig la fuerza gravitacional en coordenadas inerciales y Fi


la fuerza no gravitacional o inercial resultante actuando sobre el vehículo.
Introduciendo en (5.1) la definición de la fuerza específica: fiFi/m, resulta la ecuación
fundamental de la navegación inercial en coordenadas inerciales:

 i  g i  Ci f b
P (5.2)
g b

Puesto que la fuerza específica efectivamente medida por los acelerómetros a bordo del
vehículo es fb y no fi, es necesario conocer en todo momento la MCD* Cib que
transforma las coordenadas referidas a la terna de la unidad de mediciones inerciales
(UMI)† a las coordenadas en la terna inercial. Agrupando la ecuación cinemática (5.2),
la Ec. (3.73) que describe la evolución de Cbi y la ecuación de la velocidad: V i  P i se
obtiene el sistema de ecuaciones de estado de navegación en coordenadas inerciales:

P i  V i ; P i (0)  P0i
V i  g i (P i )  Ci f b ; Vi (0)  V i (5.3)
g b 0

 i  Ci S(ωb );
C Cbi (0)  Cbi ,0
b b ib

Donde los vectores velocidad angular y fuerza específica respecto del sistema inercial
ωbib y f b medidos por la UMI son las funciones forzantes del sistema y P0i , V0i y Cib ,0
la posición, la velocidad y la orientación iniciales.

Cuando, como es usual en la práctica, la terna ECI se hace coincidir con la ECEF en el
instante inicial P i (0)  P e (0) . En caso de que la posición inicial del móvil esté
expresada en sus coordenadas geodésicas (  , , h ), de acuerdo con la (4.20) se usará:

*
Usamos la MCD con fines ilustrativos pero es válida cualquier otra representación de la orientación
vista en el Cap. 3.

Salvo indicación expresa, consideramos la UMI alineada con la terna del vehículo (b) o en su defecto
conocida la MCD que relaciona a ambas.

90
 x e  ( Rn  h) cos( ) cos( ) 
 
P i (0)  P e (0)   y e    ( Rn  h) sin() cos()  (5.4)
 z e   ( Rn (1   2 )  h) sin( ) 
 

Aunque la terna ECI es más frecuentemente utilizada en vehículos espaciales, cuando el


punto de partida de la navegación está sobre la superficie terrestre o referido a un punto
sobre ésta, la orientación inicial se calcula mediante la composición
Cib (0)  Cie (0)Ceg (0)Cbg (0) con Cie (0)  I , donde: Cbg (0)  Clg Clb (0) resulta de
componer la 2ª de las Ecs. (4.18) con la transpuesta de la (4.29) y se expresa en función
de los ángulos de Euler: (yaw) (azimut geográfico medido desde el Norte al Este),
(pitch)elevación) y rolido), según:

 C S  S SφS   CφC  CφS S   SφC  


C  C C S SφC  CφS  CφS C  SφS  
g
b (5.5)
 S   SφC  CφC  

Ceg (0) se obtiene a partir de la latitud y la longitud geodésicas locales ,  (ver Ec.
(4.19)):

 sen( ) sen( ) cos ( ) cos ( ) cos ( ) 


Ceg   cos( ) sen( )sen( ) cos ( )sen( )  (5.6)
 0 cos ( ) sen( ) 

Por otra parte, si la velocidad inicial está expresada en coordenadas geográficas,


entonces:

Vi (0)  Ve (0)  Ceg Vg (0) (5.7)

Dependiendo de las aplicaciones (ver discusión al respecto en el Cap. 3), el modelo de


gravitación requerido en las Ecs. (5.3) podrá basarse en: a) la expansión en armónicos
esféricos (4.36) para g cg (,  c , r ) calculada en función de las coordenadas esféricas del
vehículo o b) en la gravitación normal expresada en función de las coordenadas
cartesianas terrestres del vehículo. En ambos casos, los desarrollos son truncados a un
orden n=nmax compatible con la precisión requerida. En el primer caso, se usará la
siguiente secuencia de transformaciones para obtener las coordenadas esféricas del
punto P:

1) r  P i ; P e  Cie P i (5.8)
2)  c  arcsen( z e / r );   arctan( x e / y e ) (5.9)

Con Cie calculada mediante la (4.12). Para calcular luego g ig  Cic g cg (,  c , r ) se deberá
actualizar Cic  CieCec mediante las Ec. (4.12) y (4.14).

91
En el segundo caso, se podrá usar la siguiente expresión de la gravitación normal
expresada en coordenadas terrestres {e} y en función también de las coordenadas
terrestres del punto P (ver Ec. (4.48)):

  c0  c1s 2  c2 s 4  c3 s 6 ..  ck s 2 k .. x e 
GM  
γ eg (P e )   3 T   c0  c1s 2  c2 s 4  c3 s 6 ..  ck s 2 k .. y e  (5.10)
r 
  d 0  d1s  d 2 s  d3 s ..  d k s .. z 
2 4 6 2k e 

En caso de requerirse las coordenadas curvilíneas geodésicas de la posición del vehículo


se usarán las relaciones (4.21) para la transformación Pe→(,h).

En la Fig. 5.1 se resume la mecanización de las ecuaciones de navegación en


coordenadas ECI (Ecs. (5.3)) ejemplificadas para el modelo de gravitación normal en
coordenadas terrestres.

 ee  ee
Pe
Cie γ eg ( P e ) Cie
γ ig
V e (t0 ) P e (t0 )
fb fi   Pi
Aceleró-
C i
b  
metros Vi

Girós- ωbib C ib
 C S(ω Orientación
i b
copos b ib )

Figura 5.1: Mecanización de las ecuaciones de navegación en coordenadas ECI.

La orientación del vehículo respecto de la terna de navegación queda determinada por


Cib . En la práctica, en lugar de integrar la ecuación diferencial matricial no lineal (5.3)
que requeriría actualizar 9 parámetros redundantes (ver Capítulo 3), como se verá en el
Capítulo 7, se procede a integrar numéricamente la ecuación del coneo (3.89) de
dimensión 3 que da el ángulo vectorial de rotación instantáneo entre ambas ternas. Con
base en este ángulo la MCD y el cuaternión correspondiente pueden luego ser
calculados mediante las (3.22) y (3.48).

5.2 Ecuaciones de Navegación en Coordenadas ECEF.

Derivando dos veces respecto del tiempo la relación: P i  Cie P e y recordando que
ωiee  Ωee = constante, se obtienen sucesivamente:

 i P e  Ci P e  Ci S(ω e )P e + Ci P e
P i  C e e e ie e
(5.11)
  C S(Ω )S(Ω )P + C S(Ω )P  Ci S(Ωe )P e  Ci P
P i i e e e i e e  e
e e e e e e e e

92
Usando la notación producto vectorial y después de reordenar términos, se obtiene el
vector aceleración inercial en coordenadas terrestres:

 i ]e  Ce P
[P  i  Ωe  (Ωe  P e )  2(Ωe  P e )  P
 e (5.12)
i e e e

Substituyendo en la ecuación de Newton (5.2) re-expresada en coordenadas terrestres,


se obtiene:

 i ]e  Ωe  (Ωe  P e )  2(Ωe  P e )  P
[P  e  g e  f e (5.13)
e e e g

De la cual, después de introducir la velocidad del vehículo relativa a la Tierra definida


como: V e  P e y la expresión de la gravedad en coordenadas terrestres:

g e (Ωe , P e )  g eg ( P e )  Ωee  (Ωee  P e ) (5.14)

se obtiene la correspondiente ecuación fundamental de la navegación en coordenadas


ECEF:

 e  V
P  e  Ce f b  g e (Ωe , P e )  2(Ωe  V e ) (5.15)
b e

El último término de la (5.15) se denomina aceleración de Coriolis en honor a su


descubridor. Una vez más es necesario completar la Ec. (5.15) con la cinemática de la
orientación:

 e  Ce S(ωb )  Ce S(ωb  Ωb )  Ce S(ωb )  S (Ωe )Ce


C (5.16)
b b eb b ib e b ib e b

En la cual se usó: la igualdad: ωbeb  ωbib  Ωbe , la linealidad del operador S(.) y las
relaciones (3.73). Resumimos las anteriores en las siguientes ecuaciones de estado de
navegación en coordenadas ECEF.

P e  V e ; P e (0)  P0e
V  C f  g (Ω , P )  2(Ω  V ) ;
e e b e e e e e
Ve (0)  V0e (5.17)
b e e
  C S(ω )  S (Ω )C
C e e b e e
; C (0)  C
e e
b b ib e b b b ,0

Las condiciones iniciales de posición y velocidad son similares a las determinadas para
la terna ECI (ver Ecs. (5.4) y (5.7)), mientras que para el cálculo de la orientación inicial
son útiles las ecuaciones (5.5) y (5.6). Respecto del cálculo de la orientación, es válido
nuevamente el comentario al final del párrafo 5.1.

Como fuera señalado en el Capítulo 4, en la mayoría de las aplicaciones atmosféricas y


suborbitales, la gravedad normal γ es una aproximación suficientemente precisa de la
gravedad. Vista la formulación cartesiana terrestre de la (5.15) resulta muy conveniente
en este caso el uso de alguna de las aproximaciones de e(Pe) estudiadas en el capítulo
anterior representadas por las Ecs. (4.48) ó (4.51). En efecto, estas expresiones permiten
calcular directamente la gravedad en función de las coordenadas del vehículo en el
sistema de navegación elegido.

93
Para alturas orbitales, podrá usarse la expansión de la gravitación en armónicos
esféricos expresada en coordenadas geocéntricas mediante las Ecs. (4.36) y (4.37) o
bien la obtenida a partir de la aproximación del potencial gravitatorio con simetría axial

γ e (P e )

V e (t0 ) P e (t0 )

fb fe  Pe
Aceleró- Cbe

 
metros Ve
2(Ω ee  V e )
Girós- ωib  Cbe Orientación
b

 Cb (t )S(ωeb )
e b

copos ωbie 
Cbe Ω ee

Figura 5.2 Mecanización de las ecuaciones de navegación en coordenadas ECEF.

(4.38) hasta un orden máximo n=nmax. En este caso se deberá actualizar la MCD
Cec ( c ,  ) mediante las Ec. (4.12) y (4.14) previa conversión de coordenadas mediante
las (5.8) y (5.9).

En coordenadas LGV, el uso de la gravedad normal tiene el interés de que ésta pude
calcularse en forma cerrada en función de las coordenadas de la posición. En la práctica
se utilizan las siguientes aproximaciones de γ con grado decreciente de exactitud y
expresadas en función de las coordenadas geodésicas del punto P:

 0   0   0 
      
h  0  γ (, h)    N (, h)     N (, h)   
g
0  (5.18)
 
 U (, h)   U (, h)   U (, h) 

Donde  N (, h), U (, h) son expresiones exactas publicadas en el informe NIMA-
 
TR8350-2 (2004) mientras que  N (, h), U (, h) son las aproximaciones dadas por las
Ecs. (4.44), (4.45) y (4.46). La formulación (5.18) tiene particular interés para la
navegación de precisión en alturas atmosféricas ya que permite ser corregida usando la
Ec. (4.55) que reproducimos a continuación:

  
 (   g )    

γ corr
g
(, , h; , )    (   g )   N   (   g )    N  (5.19)
  
 g  U   
 1 

en función de la perturbación de la gravedad y de la deflexión vertical locales


expresadas en coordenadas geográficas, tal como se discutió al final del Capítulo 4. El
uso del modelo (5.19) de la gravedad normal requiere, por una parte, implementar la

94
transformación Pe→(,h) mediante las relaciones (4.21) y por otra actualizar la MCD
Ceg usando la expresión (5.6) para obtener:

g e (, , h)  Ceg g g (, , h)  Ceg γ g (, , h) (5.20)

El siguiente diagrama resume la mecanización de las ecuaciones de navegación en


coordenadas ECEF ejemplificado para el modelo de gravedad normal dado por las Ecs.
(4.48) ó (4.51).

5.3 Ecuaciones de Navegación en Coordenadas LGV.

La mayoría de las aplicaciones aeroespaciales o terrestres y aún ciertas satelitales,


utilizan necesariamente como referencia de posición alguna terna fija a la Tierra, en
particular la terna ECEF. Las ecuaciones de navegación en coordenadas LGV describen
la orientación del vehículo respecto de esta terna, mientras que la velocidad y la
posición son referidas a la terna ECEF aunque la primera queda expresada en
coordenadas LGV.

Partiendo de la relación entre las coordenadas terrestres y las coordenadas geodésicas de


un punto P para a≠0 en (4.23) y de la velocidad terrestre V e  P e y definimos:

V n  Cen V e  Cen P e ("Ground Speed") (5.21)

Derivando Vn respecto del tiempo se tiene:

 n  CnS(ωe )P e + Cn P
V  e  P
 e = Ce V
 n  S(ωe ) P e = Ce V
 n  S(ω e ) P e (5.22)
e ne e n ne n en

Sustituyendo en la (5.12) después de usar la relación: S(ωeen )  CenS(ωen


n
)Cen y pre-
multiplicar por Cen , se obtiene el vector aceleración inercial en coordenadas LGV:

 i ]n  V
[P  n  ωn  V n  Ω n  (Ω n  P n )  2(Ω n  V n ) (5.23)
en e e e

n
Nótese respecto de la (5.12) el término suplementario ωen  V n de tipo Coriolis
provocado por la traslación del vehículo “arrastrando” consigo la terna de referencia.
n
Como se verá en el párrafo siguiente la velocidad angular ω en , denominada rotación
por transporte (craft rate en inglés) y denotada de ahora en más n , cumple un rol
particular en la mecanización de las ecuaciones de navegación en coordenadas LGV.

Una vez más, introduciendo la anterior en la ecuación de Newton (5.2) reescrita en


geodésicas {n}: tal como:

 i ]n  g n  f n
[P (5.24)
g

 n obteniéndose la ecuación de traslación en coordenadas {n}:


es posible despejar V

95
 n  (2Ωn  ω n )  V n  Ω n  (Ωn  P n )  g n  f n
V e en e e g
(5.25)
 Cbn f b  g n  (2Cen Ωee  ωen
n
)  Vn

La actualización de la MCD Cen , requerida en la Ec. (5.25), se obtiene mediante la


ecuación:

 n  S(ω n )Cn
C (5.26)
e en e

Conocida Cen , de acuerdo con la Ec. (4.24), se calcula la longitud, la latitud y el ángulo
, del vehículo mediante:

  arcsen(Cen (3,3));
  arctan(Cen (3, 2) / Cen (3,1)); (5.27)
  arctan(C (1,3) / C (2,3))
n
e
n
e

Las dos primeras de las Ecs. (5.27), junto con la altura geodésica h, calculada mediante:

h  Vzn ; h(t0 )  h0 (5.28)

determinan la posición del vehículo en coordenadas geodésicas.

La proyección instantánea de la fuerza específica medida por los acelerómetros según la


terna {n} requiere actualizar la MCD Cbn mediante:

 n  Cn S(ωb )  Cn S(ωb )  S(ω n )Cn  Cn S(ωb )  S(n  Ω n )Cn


C (5.29)
b b nb b ib in b b ib e b

Donde, en la última igualdad se usó la relación:

n
ωin  ρ n  Cen Ωee  ρ n  Ωen (5.30)

Como se mencionó en los párrafos anteriores, la integración de Cbn y Cen es sustituida


en la práctica por la integración de las ecuaciones de coneo asociadas a los respectivos
ángulos vectoriales de rotación. Esto es en beneficio de la dimensionalidad del
problema a la vez que evita tener que verificar las condiciones de ortonormalidad de las
MCD.

A partir de Cbn y de acuerdo con la Ec. (4.31) se calculan los ángulos de Euler de la
orientación del vehículo mediante:

96
 g  arctan (Cbn (1,1) / Cbn (1, 2))  ;
  arcsen(Cbn (1,3)); (5.31)
  arctan (Cbn (2,3) / Cbn (3,3))

N
α ψg xb
n
y
ψ
xn
α
E

yb

Figura 5.3: Relación entre las ternas del cuerpo, de navegación y geográfica en
el plano horizontal.

Dado que las coordenadas LGV son predominantemente utilizadas en alturas


atmosféricas, la gravedad g n es usualmente aproximada por la gravedad normal γ n en
este caso. (ver discusión relativa en el Cap. 4). Más aún, en la mayoría de las
aplicaciones es suficiente la última de las aproximaciones (5.18) que resulta
particularmente adaptada a esta representación:

 0 
n 
g γ  g
0  (5.32)
 
 U (, h) 

En caso de que la aproximación resultare insuficiente podrá usarse alguna versión mas
precisa de las (5.18) o recurrir a las correcciones (5.19).

Las ecuaciones de navegación en coordenadas LGV se resumen en el siguiente sistema


no lineal en forma de ecuaciones de estado con ωbib y f b como funciones forzantes de
entrada:

 n  Cn f b  g n (P e )  (2Ω n  ρ n )  V n ; Vn (0)  V n
V b e 0

h  Vzn
; h(t0 )  h0
(5.33)
 n  Cn S(ωb )  S(ρ n  Ω n )Cn
C ; Cn (0)  Cn
b b ib e b b b ,0

 n  S(ρ n )Cn
C ; C (0)  C
n n
e e e e ,0

5.3.1 Rotación por transporte

Como ya se indicó, el vehículo “arrastra” consigo la terna LGV pudiendo alterar su


orientación relativa a la terna terrestre ECEF. Por definición, la orientación de la terna

97
LGV relativa a la ECEF permanece invariante frente a desplazamientos en la dirección
U-D. En cambio, los desplazamientos contenidos en el plano cardinal (N-S, E-O) varían
la orientación relativa entre ambas ternas a la velocidad angular ρ (rotación por
transporte) proporcional a la proyección de la velocidad del vehículo sobre dicho plano.
En efecto, los cambios en latitud  , longitud  y ángulo de deriva  producen una
rotación por transporte expresada en la terna geográfica {g} como (ver Fig. 5.4):

 x   cos( ) y  ( sen( )   )z


ρ g   E x g   N y g  U z g   (5.34)
g g g

 y  es consistente con las definiciones de ambas


El signo opuesto entre  E
magnitudes.

ze
(Rn+h)cos
N
  U


Meridiano de
Greenwich E

 ·
 P
Rn+h= radio
“normal”
 ye

xe 

Figura 5.4: Definición de la rotación por transporte.

Para un punto genérico expresado en coordenadas geodésicas según P(,h) y usando


el radio de curvatura paralelo, Ec. (4.6), y el de curvatura meridiano, Ec. (4.11), del
elipsoide normal definidos en el Capítulo 3, se obtiene:

  VN
 E  
Rm ( )  h
VE
 N   cos( )  (5.35)
Rn ( )  h
VE
U   sen( )    tan( )  
Rn ( )  h

Rescrita matricialmente, la Ec. (5.35) adquiere la forma:

98
 1 
 0  0
Rm ( )  h
 
 1 
ρ g  K g V g  z g ( sen( )   ); K g   0 0 (5.36)
R ( )  h
 n 
 0 0 0 

Donde Kg es el tensor de curvatura local del elipsoide expresado en coordenadas


geográficas. Re-expresando la anterior en coordenadas (no cardinales) {n} se tiene:

ρ n  Cng K g Cng Cng V g  z n nz  K n V n  z n nz ; nz   sen()   (5.37)

Notar que, bajo el cambio de coordenadas Cng , K se transforma como un tensor, i.e:
K n  Cng K g Cng y además que, dado que la transformación Cng (Ec. (4.18)) deja
invariante al eje z, se conserva la componente “U” o “z” del vector 

Como es fácil mostrar mediante las definiciones:

1  S2 C   1
2
 C 2 S   1
2
 C S  C S  
    ;    ;     (5.38)

R x  Rm  h Rn  h  R y  Rm  h Rn  h  T  Rn  h Rm  h 

resulta:

 1/ T 1/ R y 0 Vx / T  Vy / R y 
n    
K  1/ R x 1/ T 0   ρ n  Vx / R x  Vy / T  (5.39)
 0 0 0    sen( )   
 

De la última de las Ecs. (5.35), cuando   0 la componente Este de la velocidad


induce una componente vertical U cuya magnitud crece sin límites en altas latitudes
(→/2). Con el fin de asegurar la integrabilidad de la Ec. (5.26) cerca de los polos,
es necesario, entonces, introducir una derivada temporal   0 del ángulo de deriva lo
que se traduce en cambios en azimut respecto del Norte geográfico de la terna geodésica
no-cardinal {n} (ver inciso 4.3.3 del Capítulo anterior).

Las mecanizaciones que usan   0 son denominadas “de deriva de azimut” (o wander
azimuth en inglés). Para la selección    sen( ) resulta nz  0 y la mecanización
recibe el nombre de azimut libre aludiendo al hecho de que el sistema equivalente de
navegación con plataforma no es actualizado en azimut con los desplazamientos en
longitud. Notar que en este caso   0 en vehículos estacionarios o moviéndose sobre
un meridiano. Es fácil imaginar diversos caminos cerrados sobre la superficie terrestre
que produzcan distintos incrementos de  al final del circuito por lo que en general  no
dependerá de la posición sino del camino recorrido desde el inicio de la navegación. Si,
en cambio, se elije   (e   ) sin  , lo que equivale a nz   nz , la componente
vertical local de la velocidad angular de la terna de navegación respecto de la terna

99
n n n
inercial es tal que in , z   z   z  0 . A esta mecanización se la denomina de Foucault
ya que reproduce el comportamiento de una terna sobre el conocido péndulo que lleva
su nombre. También en este caso nz es finita en latitudes polares: nz (    )   e .
2

nz  Rot. inercial Rot. inercial


Mecanización n
vertical in vertical en los
,z
polos
Apuntamiento  sin      0 (e   ) sin   e    
al Norte
VE¹0
Azimut Libre =0    sin  e sin  e

Foucault e sin    ( e   ) sin  0 0

Unipolar  (sen  1)     (sin   1)   e (    )


2
Hemisferio e sin 
Norte
Unipolar  (sin   1)     (sin   1)   e (    )
2
Hemisferio Sur e sin 

Tabla: 5.1 Selecciones usuales de nz .

La tabla 5.1 resume las características de las selecciones de nz más utilizadas en la
práctica, mientras que la Fig. 5.5 muestra esquemáticamente la mecanización de las
ecuaciones de navegación en coordenadas LGV. El recuadro indicado en la figura
como plataforma analítica concentra el cálculo de la transformación de coordenadas
entre la terna del cuerpo y la terna {n}. Su nombre ese motivado por los sistemas
clásicos de navegación que utilizan como referencia una plataforma estabilizada
respecto de esta última terna.

γ n ( , , h )  , , h
Plataforma
analítica V n (t0 ) Vn

fb fn  V n Vn h(t0 )
Aceleró- Cbn
  Vz h
metros  Cbn   g , , 
ω b (2Ω  ρ ) 
n
e
n

Girós- ωib 
b nb

 C (t )S(ω
n b
)

b nb
copos nz Cálculo de S(n )Cen
ωbin  , , 
n
  Ω n
n

Cbn n
e Cen Ω e
ωin e

Figura 5.5 Mecanización de las ecuaciones de navegación en coordenadas LGV.

100
5.4 Dinámica Inestable de las Ecuaciones de Navegación

Las ecuaciones de navegación poseen como veremos dinámicas inestables que si no son
debidamente tenidas en cuentas se traducen en divergencias numéricas en los sistemas
de navegación “strap-down”. El sistema de coordenadas más apto para estudiar esta
dinámica es el LGV por lo que en lo que sigue adoptamos esta terna de referencia para
describirlas. Consideremos la componente z (vertical geodésica local) de la ecuación
diferencial (5.25), llamada del “canal vertical”, con condiciones iniciales respecto del
elipsoide normal: h(t0 ) y h(t0 )  Vz (t0 ) .

Vzn  h  czn (Vx ,Vy )   nz (, h)  f zn


(5.40)
czn (Vx ,Vy )   (ρn  2Ωen )  V n   Vx ( y  2 ny )  Vy ( x  2 nx )
z

junto con la aproximación lineal de la gravedad normal (ver Ec. (4.45)):

 h h 
2

 (, h)   ()  1  2 1  f  m  2 f sin ()   3   


n 2
z  a  a  
 (5.41)
 h
  () 1  2 A()   O( h) 2
 a

Denotando con ^ los valores correspondientes a las estimaciones de las magnitudes


reales, estudiamos ahora los efectos sobre la solución de las (5.40) y (5.41) de un error
en las condiciones iniciales:

h0  h(t0 )  h(t0 )  hˆ(t0 )


(5.42)
Vz0  h(t0 )  Vz (t0 )  Vˆz (t0 )

Como es fácil advertir, la componente czn del término aditivo de Coriolis es


independiente de h y Vz . Esto permite, en primera aproximación, aislar la dinámica del
canal vertical de la del canal horizontal (componentes sobre el plano horizontal local).
Suponiendo conocida la componente de la fuerza específica f zn , la parte lineal de la
propagación en el tiempo de los errores iniciales (5.42) queda descrita por la siguiente
ecuación diferencial lineal:

ˆ
h(t )  h(t )  h(t )   nz (, h)   nz (, hˆ)  22s h(t ) (5.43)

Donde s ()   () A() a 1 es la llamada “frecuencia de Schuller”. La ecuación


característica:  2  22s  0 tiene como raíces en latitudes medias:

1,2   2s ( )  0.0012 2 sec1 (5.44)

101
La raíz positiva origina una dinámica inestable resultando en un crecimiento
exponencial de h(t ) y Vz (t ) para cualquier error inicial distinto de cero. A modo de
ejemplo, un error inicial: h(t0 )  0; Vz (t0 )  1m / s producirá al cabo de 15min un
error en la posición vertical de 1300m! Este mecanismo es consecuencia de la doble
integración realimentada por el modelo de gravedad (ver las Figs. 5.1, 5.2 y 5.4) y, por
tanto, resulta inherente a las ecuaciones de navegación. Claramente, las consecuencias
negativas de la inestabilidad vertical serán más acentuadas mientras más prolongada sea
la navegación. Para evitar sus efectos se requiere poder actualizar periódicamente el
estado de la navegación utilizando alguna medición independiente de las medidas
inerciales. La introducción de filtros de fusión de datos que da lugar a la técnica de
navegación integrada desarrollada en el Capítulo 8 es la manera natural de subsanar
este problema. A continuación presentamos una solución ad hoc comúnmente utilizada
en la aeronavegación.

5.4.1 Filtro Estabilizador del Canal Vertical


En aeronavegación es común usar la medición independiente de la altura provista por un
baro-altímetro. Esta medición se caracteriza por ser estable en periodos prolongados
aunque adolece de ruido de medida y retardos propios de los fenómenos de transporte
aerodinámicos involucrados. El filtro estabilizador del canal vertical combina la
medición del baro-altímetro con las de la unidad inercial y permite medir en forma
estable tanto la altura como de la velocidad vertical sin alterar mayormente el ancho de
banda de la medición inercial. El resultado es también conocido en la literatura como
altímetro “baro-inercial” (Kayton/ Fried, 1997).

Supondremos la medición del baro-altímetro afectada por un error lo que conduce al


modelo:

hmed  h   h (5.45)

Denotando z1  h; z2  h  Vz reescribimos la Ec. (5.40) en forma de ecuación de


estado:

z1  z2 ; z1 (t0 )  h(t0 )


(5.46)
z2  c (Vx , Vy )   (, z1 )  f
n
z
n
z z
n
; z2 (t0 )  Vz (t0 )

Si bien las divergencias del modelo (5.46) respecto de la realidad pueden ser muy
variadas, para demostrar los efectos del filtro estabilizador sobre la inestabilidad del
canal vertical bastará suponer un desconocimiento en la posición y velocidad iniciales
y/o un error de medición de la fuerza específica. Se supondrá además que el canal
horizontal provee sin error los valores de Vx y Vy. Denotando con 1y 2
respectivamente a la altura y la velocidad vertical del sistema perturbado por los errores
y afectado por las señales de compensación u1 y u2 generadas por el filtro estabilizador,
las Ecs. (5.46) se reescriben:

 1   2  u1 ; 1 (t0 )  hˆ(t0 )
(5.47)
 2  czn (Vx ,Vy )   nz (, 1 )  fˆzn  u2 ;  2 (t0 )  Vˆz (t0 )

102
Donde fˆzn  f zn   nz es la mejor estimación disponible de la fuerza específica f zn (la
medición acelerométrica en caso de no disponerse de otra fuente de información) y  nz
el error de estimación (o de medida dado el caso) desconocido. Definimos además:
3  ˆ n a la estimación de  n y agregamos a las Ecs. (5.47) la ecuación:
z z

 3  u3 (5.48)

A continuación imponemos la ley de realimentación del filtro para ciertos k1, k2 y k3 a


determinar:

u1   k1 (1  hmed )
u2   k2 (1  hmed )   3 (5.49)
u3   k3 (1  hmed )

Definimos el vector error de estimación:

 1  z1   h 
e    2  z2    Vz  (5.50)
 3   z    z 
n n

Teniendo en cuenta (5.45) y restando la (5.47) de la (5.46) el error de estimación


satisface las ecuaciones de estado:

e1  e2  k1 (1  hmed )  e2  k1 (e1   h )


e2   nz (, 1 )   nz (, z1 )  k2 (1  hmed )  e3  22s e1  k2 (e1   h )  e3 (5.51)
e     k (  h )   k (e   )
3 3 3 1 med 3 1 h

Las cuales son rescritas matricialmente como

 k1 1 0   k1   h(t0 ) 
     
e    k2  22s 0 1 e   k2   h ; e(t0 )  Vz (t0 )  (5.52)
 k 0 0   k3    n 
 3  z 

con condiciones iniciales e(t0 ) desconocidas. Como es sabido (véase por ejemplo Kuo,
1995), el sistema (5.52) es exponencialmente estable para valores k1, k2, k3 tales que las
raíces del siguiente polinomio característico tienen parte real negativa

p( )   3   2 k1  (k2  2s 2 )  k3  0 (5.53)

Esta condición asegura que si  h  0  e(t )  0, t   y cuando  h   


e(t )  , t  t0 , por lo que los errores siempre permanecen acotados. Interesa
destacar que aún con sesgos en los acelerómetros los errores de estado estacionario en la
altura permanecen acotados. En particular, de la Ec. (5.52) en estado estacionario se

103
advierte que para  h constante, independientemente del valor desconocido del sesgo:
 nz , h()   h y el error en velocidad vertical es nulo ( Vz ()  0 ). Más aún, el filtro
provee una estimación de estado estacionario del sesgo  ˆ n () con error de estimación
z

(independiente del diseño de los ki) dado por (ver (5.44)):

 m 
 nz ()  22s  h  3 x106  h  2 
(5.54)
 seg 

Debe contrastarse este resultado con los errores linealmente creciente en velocidad y
cuadráticamente creciente en altura que producen los sesgos en los acelerómetros al
integrar las ecuaciones de navegación. Como consecuencia de lo anterior, para
velocidades uniformes el filtro estabilizador vertical permite omitir el término de
Coriolis en las Ecs. del filtro (5.47), (5.48), (5.49) y utilizar un modelo de gravedad
constante.

A continuación ilustramos un diseño posible del filtro estabilizador. Para una dada
constante de tiempo T>0 elegimos las raíces del polinomio (5.53) tales que

1   1 ,  2,3   1  j 1 (5.55)
T T T

Lo cual corresponde a un coeficiente de amortiguamiento de los polos complejos de


  cos(450 )  0.707.. De las condiciones anteriores y del polinomio (5.53) surgen los
siguientes valores de ki:

k1  3 ; k2  4 2  2s 2 ; k3  2 3 (5.56)
T T T

Para el diseño debe tenerse en cuenta que si se desea seguir cambios rápidos en la
aceleración se deberá aumentar el ancho de banda lo que aumentará del efecto del ruido
en la medición barométrica. Por otra parte, una dinámica lenta atenuará los efectos del
ruido de medida pero acentuará los efectos de los errores de los acelerómetros y de las
condiciones iniciales. Cuando las estadísticas del ruido  h y del error en los
acelerómetros son conocidas es posible estimar óptimamente tanto las variables 1, 2
y3 como el sesgo acelerométrico y el error del baro-altímetro mediante el Filtro de
Kalman. Esto será objeto de Capítulo 8.

 nz (, 1 )
z Vˆz
+ +
f zn +  2 2  1 1 ĥ
 
- - -
- ˆ hˆ(t0 )
 (2Ω n  ρ n )  V n  h(t0 )
z
k2 k1
h
ˆ )
 3 (  z +
- h
k3 
hmed
104
Figura 5.5: Mecanización del filtro estabilizador vertical.
Para el diseño determinista las constantes de tiempo usuales van entre 40seg a 400seg.
Adoptando un valor de T=100seg, las constantes resultan:

k1  3.0 x102 seg 1 ; k2  4.0 x104 seg 2 k3  2.0 x106 seg 3 (5.57)

Como se advierte, el filtro goza de múltiples ventajas: a) hereda la estabilidad propia del
baró-altímetro, b) tiene una respuesta en frecuencia mucho más alta que éste y definible
por diseño, c) permite medir la velocidad vertical y d) goza de cierta insensibilidad en
baja frecuencia a los errores acelerométricos y del modelo de gravedad.

105
Capítulo 6
Modelo y Dinámica de los Errores
de las Ecuaciones de Navegación

Los parámetros de navegación de un vehículo evolucionan según las soluciones de las


ecuaciones cinemáticas a partir de las condiciones iniciales reales y en función de las
magnitudes, también reales, de la fuerza específica y de la velocidad angular inercial.
Aunque pueda decirse que las ecuaciones cinemáticas sean las más exactas que se
conocen, el estado real x y el calculado x̂ difieren por 3 razones:
a) Diferencias entre las magnitudes inerciales reales (t) que impulsan al vehículo y
sus valores estimados μˆ (t ) a partir de la medición,
b) Diferencias entre la condición inicial real x (t0 ) y su estimación xˆ (t0 ) ,
c) Errores en el modelo de gravedad.

Como consecuencia de lo anterior, también se apartan de sus valores reales todas las
magnitudes de interés que denotamos en general con y(t). Los aspectos generales del
problema pueden describirse mediante el esquema de la Figura 6.1.

x(t0 )

Vehículo, real y
x=?  y
μ

 μ̂ Mecanización de ŷ 
navegación: x̂

ξ
xˆ (t0 )
Figura 6.1: Comportamiento diferencial entre el vehículo real y la
mecanización de navegación.

En este capítulo nos concentramos en la descripción matemática de la evolución de los


errores de las variables calculadas mediante las ecuaciones cinemáticas para los
diferentes tipos de mecanizaciones estudiadas en el Capítulo 5. El interés de tal
programa es múltiple. En primer lugar nos permitirá evaluar la sensibilidad de los
errores a las distintas fuentes de incertidumbre y así anticipar la performance del
sistema de navegación inercial en función de la calidad de la instrumentación, la
precisión del modelo de gravedad o la incerteza de las condiciones iniciales. En segundo
lugar, el modelo matemático que describe la dinámica del error puede ser usado junto
con medidas exteroceptivas o información a priori disponible de las trayectorias del
vehículo para corregir dichos errores. Este último enfoque fue utilizado previamente
para la estabilización del canal vertical en el Capítulo 5, será nuevamente utilizado en
éste Capítulo para un problema de alineación y constituye la idea central de los métodos
de navegación integrada desarrollados en el Capitulo 9 de este libro.

106
Dinámica de las pequeñas perturbaciones
El método que usaremos para describir la dinámica de los errores del algoritmo inercial
es el llamado de las pequeñas perturbaciones, para lo cual, dado vector o variable v̂ ,
definimos su error o desviación respecto de su valor real v (desconocido) como:

v  v  vˆ (6.1)

El procedimiento se ilustra para una ecuación de estado en n vector de estado x,


función forzante um y vector de las salidas del sistema ys a partir de t=to.:

x  f (x, u); x(t0 )  x0


(6.2)
y  h(x, u)

Denotamos con xˆ (t ), t  t0 a la solución de la ecuación (6.2) cuando las condiciones


iniciales y la función forzante se reemplazan por su valores estimados o medidos.

xˆ  f (xˆ , uˆ ); xˆ (t0 )  xˆ 0


(6.3)
yˆ  h(xˆ , uˆ )

En un sistema de navegación inercial, las ecuaciones (6.2) o (6.3) serian las ecuaciones
cinemáticas. Las soluciones de la primera deben asociarse a la evolución real del estado
cinemático mientras que las de la segunda corresponden a la evolución de dicho estado
calculada en base en valores errados ya sea de las magnitudes inerciales o de las
condiciones iniciales.

Suponiendo continuidad en la derivada primera de las funciones f y g respecto de sus


argumentos, después de sustraer (6.3) de (6.2) y junto con la definición (6.1) se tiene:

x  f (x, u)  f (xˆ , uˆ ); x(t0 )  x 0  xˆ 0


 f x (xˆ , uˆ )x  fu (xˆ , uˆ )u  o( x , u ) (6.4)
y  h x (xˆ , uˆ )x  hu (xˆ , uˆ )u  o( x , u )

Donde gv es la matriz jacobiana de la función vectorial g respecto de su argumento y


o( x , u ) es tal que:

o( x , u )
lim 2 2
0
x 0
u 0 ( x  u )1 / 2

El método de las pequeñas perturbaciones consiste en despreciar los términos no


lineales en la Ec. (6.4) y describir la evolución temporal de las desviaciones mediante
las ecuaciones de perturbación lineales:

x  f x (xˆ (t ), uˆ (t ))x  fu (xˆ (t ), uˆ (t ))u ; x(t0 )  x0


(6.5)
y  h x (xˆ (t ), uˆ (t ))x  hu (xˆ (t ), uˆ (t ))u

107
Las soluciones de estas ecuaciones lineales variantes con el tiempo (6.5) describen la
evolución temporal de la parte lineal del error de la solución de (6.3). Sus funciones
forzantes son los errores en las funciones forzantes respecto de las reales desconocidas y
sus condiciones iniciales el error en la estimación del estado inicial.

Por el principio de superposición (válido para los sistemas lineales) es posible calcular,
a partir de estas ecuaciones, los efectos individuales de las perturbaciones ya sea, sobre
las condiciones iniciales o sobre las funciones forzantes. Esto permite establecer el
presupuesto de errores que consiste en distribuir el error total según cada una de sus
causas. Volvemos ahora a las ecuaciones cinemáticas formuladas en Capítulo 5.

6.1 Dinámica del error angular de orientación de un vehículo

Como se mostró en el capítulo anterior, las ecuaciones de navegación requieren


proyectar la fuerza específica, medida en la terna del cuerpo {b}, sobre la terna de
navegación elegida que denotamos genéricamente como {}. Cuando {b} rota respecto
de {} a la velocidad angular ω b , dicha proyección se calcula mediante la MCD Cb ,
solución de la ecuación cinemática (ver párrafo 3.3.1 del Capítulo 3):

   C S(ωb )  C S(ωb )  C S(ω b )


C b b b b ib b i
(6.6)
 Cb S(ωbib )  S(ωi )Cb

En la cual se usó la relación: ωbb  ωbib  ωbi .

Con base en los resultados del párrafo anterior, el error Cb (definido como en la Ec.
(6.1)) satisface la siguiente ecuación derivada perturbando la Ec. (6.6):

   C S(ωb )  S(ω  )C  C S(ωb )  S(ω  )C


C (6.7)
b b ib i b b ib i b

Sustituyendo en (6.7) la diferencial matricial Cbv  Cbv S(θb ) (ver Ec. (3.37) del
Capítulo 3) y, por otra parte, derivando esta última expresión respecto del tiempo se
obtienen:

   Cv S(θb )S(ωb )  S(ω  )Cv S(θb )  C S(ωb )  S(ω  )C


C b b ib i b b ib i b
(6.8)
Cb  Cb S(θ )  Cb S(θ )  Cb S(ωib )S(θ )  S(ωi )Cb S(θ )  Cbv S(θ b )
 v  v b v  b  b b   b

Igualando ambas expresiones y después de pre-multiplicar por Cbv resulta la ecuación


para el error angular:

S(θ b )  S(θb )S(ωibb )  S(ωbib )S(θb )  S(ωbib )  Cbv S(ωi )Cb

 θ b  θb  ωbib  ωbib  Cb ωi (6.9)

108
Un procedimiento similar, pero partiendo de la diferencial Cbv  S(θ )Cbv ,
correspondiente a la segunda de las Ecs. (3.37), conduce a la ecuación alternativa de la
propagación del error angular:

θ   θ  ωib  ωi  Cb ωbib (6.10)

La que a su vez puede obtenerse transformado la Ec. (6.9) mediante el cambio de


coordenadas: θ  Cb θb (ver Ec. (3.38).

Los casos más usuales de propagación del error angular considerados a continuación
serán vistos como casos particulares de las Ecs. (6.9) y (6.10).

6.2 Dinámica del error de navegación en coordenadas ECI

Aplicando el método de las pequeñas perturbaciones a la Ec. (5.3) se obtienen las


ecuaciones del error de traslación:

P i  V i ; P i (0)  P0i


(6.11)
V i  g i (P i )  Ci f b  Ci f b ;  Vi (0)  V i
g b b 0

Para este caso {}º{}, por lo que ωi  ωi  0 . De las (6.9) y (6.10) se obtienen las
dos expresiones alternativas del error angular inercial y sus respectivas ecuaciones de
propagación:

Cib  CibS( ψb )  ψ
 b  ψb  ωibb  ωibb ; ψb (t0 )  ψ0b
(6.12)
Cib  S( ψi )Cib  ψ
 i  ψi  Cibωibb  Cib ωibb ; ψi (t0 )  ψi0

Las funciones forzantes de las ecuaciones dinámicas del error ((6.11) y (6.12)) son las
perturbaciones sobre las mediciones inerciales: f b , ωbib (a veces denotados como
b  f b ; b  ωbib ) que agrupamos en el vector:

 ξ   ωb 
ξ       bib  (6.13)
ξ f   f 

Definimos errores de navegación alternativos de 9 componentes:

 ψb   ψi 
   
xib  V i  ; xii   V i  (6.14)
 P i   P i 
   

Combinando las expresiones (6.11) y (6.12), las ecuaciones de estado lineal variante en
el tiempo que modelan la propagación de las dos versiones del error de navegación
(6.14) resultan:

109
 S(ωibb ) 0 0   ψb   I 0
 i 
x ib   Cˆ S(f b ) 0 g i / Pi   V i   0 I  ξ
b g P 
i   
   Pi  0 (6.15)
0 I3 0   0
  
 Fbi x ib  Bibξ 
ˆ i ωb ) 0
 S(C 0   ψ i  C ˆi 0
b ib b
  i  
x i   S(C
i ˆ f ) 0 g / P i
i b i
 V    0 ˆ i ξ
C
b g Pi  b 
   P i   0 (6.16)
0 I3 0 0 
     
 Fii xii  Bii ξ 

Donde, g ig / P i Pi
es el jacobiano de la gravitación en coordenadas inerciales evaluado
en Pˆ i cuya expresión depende del modelo de gravedad utilizado. Para una discusión de
las opciones y expresiones involucradas se remite al lector al párrafo 5.1 del capítulo
anterior, Ecs.(5.8) a (5.10).

6.3 Dinámica del error de navegación en coordenadas ECEF

Para este caso {}º{e}, y ωivv  Ωee . Aplicando pequeñas perturbaciones a las
ecuaciones de navegación (5.17), suponiendo Ωee conocida (i.e.: ωiee  0 ) y el modelo
de gravedad normal, las ecuaciones del error de traslación resultan:

P e  V e ; P e (0)  P0e


(6.17)
V e  Ce f b  Ce f b  2(Ωe  V e )  γ e (P e ) ;  Ve (0)  V e
b b e 0

De las Ecs. (6.9) y (6.10) surgen las dos expresiones alternativas del error angular y sus
respectivas ecuaciones de propagación:

Cbe  Cbe S(φb )  φ b  φb  ωibb  ωibb ; φb (t0 )  φb0


(6.18)
Cbe  S(φ e )Cbe  φ e  φ e  Cbe ωibb  Cbe ωibb ; φi (t0 )  φi0

Adviértase la coincidencia de la ecuaciones dinámicas de φb y ψ b . Definimos para este


caso los errores de navegación alternativos:

 φb   φe 
   
xbe  V e  ; x ee  V e  (6.19)
 P e   P e 
   

Combinando las ecuaciones (6.17) y (6.18) se obtienen las siguientes ecuaciones de


propagación de los errores de navegación en coordenadas ECEF:

110
 S(ωbib ) 0 0   φb   I 0
 e b 
x be   Cˆ S(f ) 2 S (Ωe ) γ e e  V e   0 ˆ e ξ
C
b e P P    b 
  (6.20)
0 I3 0   P  0
 e 
0 
 
 Fbe xbe  Bbe ξ 
 S(C ˆ e ωb ) 0 0   φ e  C ˆe 0
b ib b
  e  
x e    S (C
e ˆ f ) 2S (Ω ) γ e  V   0
e b e e ˆ e ξ
C
b e P P   b 
   P e   0 (6.21)
 0 I 0     0 
3

 Fe xe  B e ξ 
e e e

Donde γ eP Pe
es el jacobiano de la gravedad normal en terna “e” respecto de la posición.

6.4 Dinámica del error de navegación en coordenadas LGV

Siguiendo el procedimiento ilustrado en los casos anteriores, después de perturbar las


ecuaciones de navegación en coordenadas LGV (5.33) del Capítulo 5 y usando
Ωen  Cen Ωee dado que Ωee es conocida, se tiene:

 n  Cn f b  Cn f b  g n  (2Cn Ωe  ρ n )  V n  (2Cn Ωe  ρ n )  V n


V b b e e e

h  V n
z
 n  CnS(ωb )  Cn S(ωb )  S(ω n )Cn  S(ω n )Cn
C (6.22)
b b ib b ib in b in b

Ce  S(ρ )Ce  S(ρ )Ce
n n n n n

ωinn  ρ n  Ωen  ωinn  ρ n  Ωen  ρ n  Cen Ωee

Las (6.22) requieren las diferenciales Cbn y Cen cada una asociada a un error angular
propio. En el primer caso, se trata del error de orientación del vehículo respecto de la
terna de navegación y en el segundo del error de orientación de la terna de navegación
respecto de la terna terrestre (ECEF). Como se vio en el párrafo 5.3, éste último está
relacionado con el error en la posición del vehículo en coordenadas geodésicas, por lo
que lo llamaremos error angular de posición.

6.4.1 Error angular de posición en terna LGV.


La definición de la diferencial más utilizada en este caso es Cen  S(θ n )Cen la cual
puede considerarse como una definición del error de posición θ n . Derivando esta
expresión temporalmente se obtiene:

 n  S(θ n )Cn  S(θ n )C


C  n  S(θ n )Cn  S(θ n )S(ρ n )Cn (6.23)
e e e e e

Por otro lado, a partir de las Ecs. (6.22), escribimos:

 n  S(ρ n )Cn  S(ρ n )S(θ n )Cn


C (6.24)
e e e

111
Igualando las Ecs. (6.23) y (6.24) y después de pos-multiplicar por Cen y agrupar
términos, resulta la ecuación de propagación del error angular de posición:

S(θ n )  S(θ n )S(ρ n )  S(ρ n )S(θ n )  S(ρ n ) 


(6.25)
θ n  θ n  ρ n  ρ n

El lector podrá verificar que la definición alternativa: Cen  Cen S(θe ) conduce a la
ecuación del error angular de posición equivalente a la (6.25) bajo la transformación
θe  Cen θn :

θ e  Cen n (6.26)

Geometría del error angular de posición.


Consideramos las coordenadas curvilíneas de latitud y longitud de la posición del
vehículo sin contemplar, por el momento, su altura geodésica h. De este modo, será
suficiente considerar la proyección de la posición del vehículo sobre el elipsoide
normal.

En la Figura 6.2 se indican: la posición real (desconocida) P que ocupa el vehículo en


un dado instante, la posición P̂ estimada (calculada) por el sistema de navegación y las
ternas de navegación real y calculadas {n} y { n̂ }. El error de la posición se expresa
mediante los ángulos  y  cuyas representaciones vectoriales, también exhibidos
en la figura, apuntan, respectivamente, en la dirección positiva del eje terrestre y en la
dirección –E (O) local. La figura muestra también el error en el ángulo de deriva 
entre ambas ternas que dependerá de la mecanización elegida (ver Tabla 5.1).
Supondremos {n} y { n̂ } distantes de un pequeño ángulo vectorial θ n  θ nˆ, n .

ze
α
Pˆ , nˆ

Φ
λ P, n
ye



xe
Figura 6.2

De la geometría de la Fig. 6.2 resulta la siguiente relación entre (  ,  ,  ) y las


coordenadas {g-ENU} de θ g :

112
  E      0 1 0    
  
θ    N     cos    cos  0 0   
g   (6.27)
      
 U    sin      sin  0 1    

Como las ternas {g-ENU} y {n} difieren en el ángulo e z de la anterior resulta:

 cos  sen 0   0 1 0      cos sen  cos  0    


θ   sen cos  0 cos  0 0    cos  cos  sen 0   (6.28)
n   
 0 0 1   sin  0 1      sin  0 1    

Para un dado (o estimado) θ n se calculan las correcciones en las coordenadas


curvilíneas  y  y del ángulo de deriva  por simple inversión de la Ec. (6.28).

   sen / cos  cos  / cos  0  n


      cos  sen 0  θ (6.29)
    sentg     cos tg    1 

El diagrama de la Figura 6.3 muestra las 3 ternas en juego del problema: la ECEF o {e},
la LGV o {n} y la terna de navegación calculada (erróneamente) {nˆ}  {c} . Indica
además las MCD que vinculan estas ternas. La MCD estimada (calculada) Ĉen asociada
a los errores  ,  y  , la MCD real (desconocida) entre la ternas {e} y la {n}
local y la MCD que vincula las ternas {n} y {nˆ}  {c} . Esta última, consecuencia del
error angular θ n  θ nˆ, n , se expresa mediante:

 (θ n )  Cn C
ˆe
e n  C nˆ  Cc  exp(S (θ ) )
n n n
C (6.30)

 (θn )  Cn (θn )
C c
zc
yn yc
n zn n̂  c
θn  θc,n xc
xn

ye ˆ n (  ,   ,   )  Cc


C e e
Cen (, , ) ze

e
xe
Figura 6.3

113
6.4.2 Error de orientación o error angular de plataforma.
Sustituyendo la diferencial Cbn  S( n )Cbn que define el error angular de “plataforma”
n en la 3ª ecuación de las (6.22) se obtiene:

 n  S( n )Cn S(ωb )  Cn S(ωb )  S(ω n )Cn  S(ω n )S( n )Cn (6.31)
C b b ib b ib in b in b

Por otra parte, de la definición del error de plataforma, surge:

 n  S( n )Cn  S( n )C


C n (6.32)
b b b

Igualando (6.31) y (6.32) luego de agrupar términos y pos-multiplicar por Cbn resulta:

S( n )  S(n )S(ωin


n n
)  S(ωin )S(n )  S(ωin
n
)  CbnS(ωbib )Cbn
(6.33)
 S(n  ωin
n n
)  S(ωin n
)  S(ωib )

n
ωin se obtiene de la última de las (6.22) introduciendo Cen  S(θ n )Cen :

n
ωin  ρ n  Ωen  ρ n  S(θn )Cen Ωee  ρ n  Ωen  θn (6.34)

Sustituyendo (6.34) en (6.33) y reagrupando términos, esta última se reescribe como:

 n   n  ωin
n n
 ωin   n   n  ωin
n
 ρ n  Ωen  θn  ωib
n
(6.35)
  n  (Ωen  ρ n )  Ωen  θn  ρ n  Cbn ωbib

El lector podrá verificar que, el uso de la definición alternativa de la diferencial:


Cbn  CbnS(b ) conduce a la siguiente expresión equivalente a la (6.35) bajo la
transformación:  n  Cbn b

 b  b  ωbib  Cbn (Ωen  ρn )  ωbib (6.36)

Geometría del error angular de plataforma.


Como fuera mencionado en el Capítulo 5 (ver Fig. 5.5), la transformación de
coordenadas caracterizada por C ˆ n (o qˆ n ) calculada por el algoritmo de navegación
b b
“stap-down” refiere la terna del cuerpo a la plataforma analítica. Los errores de
cómputo hacen sin embargo que esta última difiera de la terna de navegación local en
coordenadas LGV. Por esta razón distinguimos la terna “de llegada” de la
transformación estimada C ˆ n  C p de la terna “de llegada” de la transformación
b b
Cˆ  C , denotando a la primera como terna {p}.
n c
e e

Dado que la orientación del vehículo es usualmente caracterizada por los ángulos de
Euler:  (rumbo), (pitch) y roll) (definidos en el párrafo 4.2.5 del Capítulo 4),
interesa relacionar al error de orientación  n con las desviaciones de estos ángulos. Para

114
esto partimos de la transpuesta de la Ec. (4.31) que reescribimos transponiendo cada
uno de sus términos, según:

Cn Cb'
 
b'
  b

Cb  (( / 2   ) @ z )( @ y ) ((  ) @ x b )  Cb'n Cb'b
n n b'
(6.37)

Con:
 cos sen  cos   sensen  1 0 0 
C  C C  cos  cos  sen  sen cos   0  cos  sen 
n
b
n
b'
b'
b
  

 sen 0 cos   0  sen  cos 


(6.38)
 cos sen cos  cos   sensensen  sen cos   cos sensen 
 cos  cos   cos sen  sensen cos  sensen  cos sen cos  
 sen  sen cos   cos  cos  

Por la propiedad de aditividad de las pequeñas rotaciones, las desviaciones angulares


diferenciales y, respectivamente alrededor de los ejes xb, yb’, zn, se traducen
en un error angular vectorial de plataforma:

 xb yb' zn (6.39)

Teniendo en cuenta que Cei es la i-esima columna de C, la anterior reescrita en


coordenadas {n} resulta:

  cos sen  cos  0    


n Cbn e1 Cbn 'e2 Ie3    cos  cos  sen 0    
  sen 0 1    
(6.40)
     sen /cos   cos  /cos  0  n
       cos  sen 0 
    sen tan   cos  tan  1 

 ( n )  C n
C zp
yn p yp
n zn n̂  p
 n  p,n
n

xn xp
yb
zb
Cn̂b (  ,   ,  )  Cpb
C (, , )
n
b b
xb

Figura 6.4

En el diagrama de la Figura 6.4 se indican las ternas {b}, {n} y {p} y las MCD que
vinculan las coordenadas entre cada una de ellas. El error angular n , correspondiente al
desalineamiento (“tilt”) entre la terna {n} y la plataforma analítica {p} determina la
MCD entre ambas:

115
 ( n )  C n C
ˆb
b n  C p  exp(S ( ))
n n
C (6.41)

ˆ n  Cp función de los errores  , 


Se indica además la MCD estimada (calculada) C b b

y  relacionados con n mediante la Ec. (6.40).

6.4.3 Relación entre los errores de posición y de plataforma: error angular inercial
Consideremos la diferencial de la siguiente composición de MCDs:

Cib  Cie Cen Cbn  Cbi  Cie Cen Cbn  Cie Cen Cbn  Cie Cen Cbn (6.42)

Suponiendo sin error la MCD Cie y substituyendo las diferenciales Cen  Cen S(θ n ) y
Cbn  Cbn S( b ) en la anterior calculamos:

Cib  Cie Cen S(θ n )Cbn  Cie Cen Cbn S( b )


 Cib S(b )  Cie Cen S(θ n )Cbn (6.43)
 Cib S(b  θb )  Cbi S(ψ b )

La última igualdad introduce la definición ψ b   b  θb cuya dinámica determinamos


a continuación. Para esto, en primer lugar transformamos la Ec. (6.25) mediante
θb  Cbn θ n , usando ωbn
n
 n  ωien  ωibn .

θ b  Cbn S(ωbn


n
)θ n  Cbn θ n  Cbn θ n  ωbn
n
 Cbn (θ n  ρ n  ρ n )
(6.44)
 Cbn θ n  (ωien  ωibn )  Cbn ρ n  θb  ωbib  Cbn (ωien  θ n  ρ n )

Restando la anterior de la (6.36) reencontramos la ecuación del error angular inercial


(6.12):

ψ b  ψ b  ωbib  ωbib (6.45)

Lo que resulta natural vista la definición dada en (6.43).

Cpn
y yp zp
z
p,n
x xp
θc,n
p,c

yc zc
c Ccp
C n

xc
Figura 6.5

116
Geometría del error angular inercial
El error angular inercial ψ n tiene un claro el sentido geométrico que se advierte al
calcular la MCD Ccp a partir de las definiciones (6.30) y (6.41):

Ccp  Ccn Cnp  exp(S(θ n )) exp(S( n ))  exp(S( n  θ n ))  exp(S(ψ n )) (6.46)

Donde la aproximación es justificad por la aditividad de lo spequeños angulos de


rotación. De la anterior resulta que ψ n corresponde al ángulo de desalineamiento
relativo ente la plataforma analítica {p} y la terna de navegación calculada {c}. La
figura 6.4 resume las relaciones geométricas entre las ternas {p},{c} y {n}.

6.4.4 Propagación del error de velocidad


Sustituyendo las diferenciales Cbn y Cen en la 1ª Ec. (6.22) se obtiene la ecuación de
propagación de la perturbación en la velocidad:

 n  f n  n  (ρ n  2Ω n )  V n  ρ n  V n  2(θ n  Ω n )  V n  Cn f b  g n (6.47)
V e e b

Salvo g n y ρ n el resto de los términos fueron explicitados con anterioridad.

Diferencial de la rotación por transporte


La diferencial de la rotación por transporte se calcula a partir de la Ec. (5.39) que
reproducimos por conveniencia:

Vx Vy n Vx Vy n
ρn  (  )x  (  )y  ( sin    )z n (6.48)
T Ry Rx T

1  cos  sen cos  sen 


  ;
T  Rn  h Rm  h 
1  cos 2  sen 2 
  ; (6.49)
R y  Rm  h Rn  h 
1  sen 2 cos 2  
  
R x  Rm  h Rn  h 

La siguiente aproximación se justifica para el uso que se hará de la diferencial ρ n y


para el valor nominal de la excentricidad del elipsoide normal 

1 1
Rn ( S )  Rm ( S )(1  O( 2 ))  
Rn  h Rm  h

Sustituyendo la anterior en las (6.49) y luego en la (6.48) resultan

117
1  cos  sen cos  sen  O ( 2 )
   0
T  Rn  h Rm  h  Rm  h
1  cos 2  sen 2  1  sen 2 cos 2   1
        
 
R y  Rm  h Rn  h  Rn  h  Rm  h Rn  h  R x

Vy Vx
ρn   xn  y n  ( sin    )z n (6.50)
Rn  h Rn  h
  
 x  y

De donde se obtienen las componentes según los ejes x e y de la terna {n}:

Vy Vy h Vy  x h
x    
Rn  h  R n  h 2 Rn  h
(6.51)
Vx Vx h Vx  y h
y    
R n  h  R n  h 2 Rn  h

La componente z depende de la mecanización adoptada para nz (ver Tabla 5.1).
Consideramos 3 casos:

1. Azimut libre:
z  0  z  0 (6.52)
2. Foucault:
z  e sen   z n Ωen   z n Cen Ωee 
(6.53)
z  z n  Cen Ωee  z n S( θn )Cen Ωee  z n S(Ωen ) θn

3. Apuntamiento al Norte ({n}={g}):

VE tan 
    0  U    tan   usando    E
Rn  h
 VN 
1 
g
ρ  VE   (6.54)
Rn  h 
VE tan  
 VN   0 
ρ  g 1 
V  
1 
0    h ρ g
Rn  h 
E  R h  E R h
n n
 tan VE   2 
VE sec  

Diferencial de la gravedad
La configuración: “terna LGV + gravedad normal” es la mas adaptada a vehículos sub-
atmosféricos tanto por su precisión como por su sencillez matemática. Como se mostró
en el Capítulo 4, en la gran mayoría de estas aplicaciones resulta suficiente la siguiente
aproximación de 2º orden (en la altura geodésica h) de la gravedad normal en terna g-
LGV (ver Ecs. (4.44) y (4.45)):

118
g g  γ g  0  N U    0 0  (h,  ) 
T T
(6.55)

 h 
2
 2 h
 (h,  )   s ( )  1  2 1  f  m  2 f sin ( )  3   
 a  a  


1  k sin 2  e2 a 2 b
k  0,001931852;  s ( )   e ; m
1  e 2 sin 2  GM

En las aplicaciones en que se requiera mayor precisión podrá adoptarse la gravedad


normal corregida mediante el uso de las anomalías g ,  y expresada por la Ec.
(4.55) que aquí reproducimos.

 (   g ) 
g γ
g g
corr (, , h; , )   (   g )   N  (6.56)
 g  U 

Siendo la (6.55) un caso particular de la (6.56) para g= establecemos la


diferencial de esta última:

 ˆ  ˆ    (hˆ, 
ˆ )ˆ 
   ˆ  

g g     (h,  )  g   ˆ    (hˆ, 
ˆ)  ˆ ˆ ˆ
       (h,  ) 
 
(6.57)
1  0
      g ) 

Con: h  h  hˆ;     
ˆ ; g  g  ˆ g ;     
ˆ     ˆ , y además:

 (hˆ, 
ˆ)  (hˆ, 
ˆ)
 (h,  )  h   (6.58)
h 

Finalmente, definiendo el error en el ángulo vectorial de deriva como:


α n   0 0   y     ˆ se obtiene g n mediante:
T

g n  Cng g g  Cng g g  S(α )Cng gˆ g  Cng g g  α  gˆ n  Cng g g (6.59)

6.4.5 Ecuaciones generales de la dinámica del error en terna LGV


A continuación resumimos las ecuaciones lineales del error en terna LGV ((6.25), (6.35)
y (6.47)). Para simplificar usamos: υn  ρn  2Ωen , f n  Cbn f b , Ωen  Cen Ωee .

119
 n  S(ωin
n
) n  S(Ωen )θn  ρ n  Cbn ωbib
V  n  S(f n )n  S(υn )V n  S(V n )[ρ n  2S(Ωn )θn ]  Cn f b  g n
e b
(6.60)
 n n
θ  S(ρ )θ  ρ n n

h  Vzn

Con:

 g y   Vy   x h 
  1  
g n   g x    Cng g g ; ρ n   Vx   y h  (6.61)
 0  Rn  h  
  z /( Rn  h) 

Definiendo al error de navegación en terna LGV como:

(V n )T (θn )T h   10 ;


T
x n  n )T
T
(6.62)
ξ  (ξ  )T (g n )T   9

mediante sustituciones adecuadas, las ecuaciones (6.60) adoptan la forma general de


ecuación de estado lineal variante con el tiempo:

x n  F n (t )x n  B n (t )ξ (6.63)

Donde F n (t )  10 x10 y B n (t )   9 x 9 son matrices con coeficientes dependientes del


tiempo.

6.5 Ejemplos de ecuaciones de errores y aplicaciones

Ejemplo 6.1: Ecuaciones del error en coordenadas geográficas {g}.


La condición de apuntamiento al Norte (       0 ) y la relación (6.27) imponen
restricciones sobre las coordenadas de θ g . En particular,  N y U quedan
vinculadas por la relación U   N tan  . Esto reduce a 2 los grados de libertad del
error θ g por lo cual en lo que sigue convendrá expresarlo como:

1 0 
   
g
θ  0 1   E  (6.64)
  N 
0 tan   

Por la misma razón, el error x definido en (6.62) queda reducido al siguiente vector de
dimensión 9.

T T
x g   g )T (V g )T  E  N h    g )T (V g )T (π g )T   9
(6.65)

120
Las últimas 3 componentes de x corresponden al error de posición que denotamos
π g   E  N h . Reescribimos la Ec. (6.54) en la forma:
T

ρ g  RV V g  R  π g (6.66)

Con:
 0 1 0   0 0  E 
1   1 
RV   1 0 0 ; R    0 0  N  (6.67)
Rn  h Rn  h
 tan  0 0   2
 VE sec  0 U 

Dado que en coordenadas {g} E y U=Ntan, usando la (6.64)determinamos el


producto:
 0 
S(Ωe )θ   U   E
g g
(6.68)
  N 

A partir de las (6.64) a (6.67) y usando además las definiciones:

 0 0  E /( Rn  h) 

Φ   U 0  N /( Rn  h)  ; ΦV  RV (6.69)
    sec2  0  /( R  h) 
 N N U n 

Se obtiene para el término:

S(Ωeg )θ g  ρ g  S(Ωeg )θ g  RV V g  R  π g  Φ  π g  ΦV V g (6.70)

Introduciendo la definición Φ  S(ωigg ) , a continuación reescribimos la 1ª de las


(6.60) como:

 g  Φ g  ΦV V g  Φ π g  Cbg ωbib (6.71)

Usando una vez más la (6.68) junto la (6.66) después de algunas manipulaciones
algebraicas determinamos el siguiente término de la 2ª de las Ecs. (6.60):

S(V n )[ρn  2S(Ωen )θ n ]  S(V g )RV V g  S(V g )  R  π g  2S(Ωeg )θ g 


(6.72)
 S(V g )RV V g  V π g

donde:
 0 0  E /( Rn  h) 

V  S(V ) g
2U 0  N /( Rn  h)  ; (6.73)
 2   sec 2  0  /( R  h) 
 N N U n 

121
Con las definiciones anteriores y las siguientes:

V  S(f n ); VV  S(υ g )  S(V g )RV ; (6.74)

la 2ª de las Ecs. (6.60) puede escribirse para este ejemplo como:

 g  V  g  V V g  V π g  C g f b  g g
V (6.75)
 V  b

evaluamos ahora:

 0   0 0  E /( Rn  h) 
g  g  g 
T π  S( )  U   E  R  π    N  E tan   N /( Rn  h)  π g
  N   2
U /( Rn  h) 
 N (1  sec  )  E
(6.76)

Mediante la cual, junto con la definición: TV-RV , la 3ª de las (6.60) resulta:

θ g  TV V g  T π g (6.77)

Reemplazando la última fila de la (6.77) por la ecuación h  VUg resulta:

π g  ΠV V g  Π  π g (6.78)

Con:

1  0 1 0  0 0  E /( Rn  h) 
ΠV   1 0 0  ; Π    N  E tan   N /( Rn  h)  (6.79)
Rn  h  0 0 1   0 0 0 

Agrupando las Ecs. (6.71), (6.75) y (6.78), la Ec.(6.63) del error de navegación resulta
para este ejemplo:

Φ  ΦV Φ  Cbg 0 0   ωbib 
   
x   V
g
VV V  x g   0 Cbg I   f b 
 0 ΠV Π   0
 0 0   g g  (6.80)
 ξ 
 F g x g  B g ξ; ξ g
g 

Ejemplo 6.2: Error de navegación en terna {g} para un vehículo en reposo sobre la
Tierra.
La condición de reposo sobre la Tierra impone:

122
 g  V g  ρ g  0; ω g  Ω g
V ig
(6.81)
g C
C g 0
b e

Para los fines del análisis de este ejemplo y el siguiente se usará la aproximación (6.55)
g
para la gravedad g . Bajo estas condiciones la fuerza específica y la velocidad angular
inerciales junto con sus respectivas mediciones provistas por los instrumentos inerciales
a bordo resultan:

f b   γ b  fˆ b   γ b  f b
(6.82)
ωbib b
 Ωe  Cbg Ω eg  ˆ bib
ω  Ω e  ω ib
b b

Las condiciones (6.81) imponen los siguientes valores para las matrices definidas en el
ejemplo 6.1:

 0 0 0
Φ  S(Ω ); Φ    U
g
0 0 
  N 0 0 
V  S( γ g ); VV  2S(Ωeg ); V  0 (6.83)
Π  0

De este modo, la matriz de la dinámica del error (6.80) para este ejemplo resulta:

 0 U  N 0 ( Rn  h) 1 0 0 0 0
 
 U 0
1
0 ( Rn  h) 0 0 U 0 0
 N 0 
0 ( Rn  h) tan 
1
0 0  N 0 0
 
 0  0 0 2U 2 N 0 0 0
g 
F   0 0 2U 0 0 0 0 0  ; (6.84)
 
 0 0 0 2 N 0 0 0 0 0
 0 0 0 0 ( Rn  h) 1
0 0 0 0
 
1
 0 0 0 ( Rn  h) 0 0 0 0 0
 
 0 0 0 0 0 1 0 0 0

Esta matriz permite extraer algunas conclusiones sobre la dinámica del error:

1. Las componentes θ N y h no afectan a las otras componentes de x .


2. Las ecuaciones del error son invariantes con el tiempo y dependen de los valores de
la latitud  la altura h sobre el elipsoide normal y su orientación Cbg .
3. Los valores propios de la matriz F g están sobre el eje imaginario. En particular,
para la latitud 35º y h=0 los valores propios de F g resultan:

1,2 =  i1,2910x10-3 , 3,4 =  i1,19x10-3 ; 5,6 =  i0,0729x10-3 ;  7,8,9 =0 (6.85)

123
De estos valores surgen los siguientes períodos de oscilaciones autosostenidas: dos
llamados de Shuller: T1,2  81seg; T3,4  88seg y dos llamados de Foucault: T5,6 23,93
hs. Los primeros corresponden aproximadamente al periodo de oscilación de un
péndulo de brazo igual al radio terrestre: T1234   a /   84 seg . El segundo período
corresponde al de la rotación sideral terrestre (período de rotación de la Tierra respecto
de las estrellas fijas).

Figura 6.6: Respuesta del vector de error a un error inicial N(0)=0,1º.

La Fig. 6.6 presenta las formas de onda de las componentes del vector de error
provocadas por un desconocimiento inicial en la componte N(0)=0,1º. Se destacan las
oscilaciones de Shuller moduladas por oscilaciones más lentas de Foucault. Tanto en la
velocidad como en el error de plataforma, se advierte una transferencia cíclica y
conservativa de la energía entre oscilaciones N-S y E-O. Dicha transferencia es
provocada por la rotación terrestre y tiene un período de 24hs. El gráfico inferior
derecho muestra los errores de desplazamiento en metros según las direcciones E,N,U y
evidencia el importante efecto que tienen sobre la posición los errores iniciales de
alineación de la plataforma analítica.

VelE

Figura 6.7: Respuesta del vector de error a un error inicial VU(0)= 0,01m/seg.

La figura 6.7 demuestra el efecto de un error inicial en la velocidad: VelU(0)=


0,01m/seg. Además de las oscilaciones propias del sistema no amortiguado se advierte

124
la respuesta en rampa de la posición en la dirección “arriba”. Esta dinámica está
asociada a uno de los polos en el origen del sistema (6.84).

Figura 6.8: Respuesta del vector de error a un error instrumental equivalente a


N=0,1gr/hr
La Figura 6.8 revela la influencia de los errores giroscópicos sobre los parámetros de
navegación. En ella se destaca la divergencia en la posición debida al error giroscópico
equivalente sobre la dirección Norte.

De este ejemplo se concluye que aún pequeños desconocimientos en las condiciones


iniciales o errores en las mediciones inerciales pueden inducir oscilaciones indeseadas y
divergencias no acotadas en los parámetros de navegación calculados mediante la
integración de las ecuaciones de navegación. El fenómeno guarda cierta similitud con
el de la inestabilidad del canal vertical abordado en el Capítulo 5 aunque en este caso el
problema no está asociado a la dependencia funcional de la gravedad respecto de la
altura sino que es inherente a la dinámica de los sistemas no amortiguados.

Ejemplo 6.3: Autoalineación de un vehículo estacionario sobre la Tierra


El ejemplo anterior demuestra la importancia de reducir el error inicial del estado
cinemático en un sistema de navegación inercial (SNI). Se denomina alineación al
procedimiento mediante el cual se intenta lograr este objetivo. Un caso particular es la
alineación de los ejes de la plataforma analítica respecto de la terna de navegación de un
vehiculo en reposo sobre la Tierra. El procedimiento consta usualmente de dos fases
(ver Titerton/Weston, (2004)). La primera, de alineación gruesa, utiliza normalmente
instrumentos ópticos, geométricos y magnéticos para obtener una primera aproximación
de la orientación inicial. A esta fase suele sucederle otra de autoalineación fina que
tiene por objetivo reducir dicho error inicial. En este ejemplo abordamos este problema
para el caso en que la posición del vehículo y la gravedad local son conocidas.

La Fig. 6.9 describe el modo de funcionamiento del sistema de navegación durante el


procedimiento de autoalineación. Éste consiste en sumar a la proyección de las
magnitudes inerciales sobre la terna geográfica local la señal calculada mediante la ley
lineal en la velocidad horizontal:

125
u  Vˆ 
ˆ ; K   62
u g      K  E   KV (6.86)
H
uV  ˆ
VN 

Mediciones b Software
Orientación
Girós. Cbg Navegador y posición
inercial
Velocidad
Acels. Cbg
VˆE , VˆN
 b
ug 0
K
Figura 6.9: Esquema de mecanización de la autoalineación en reposo.

Cabe señalar que siendo la velocidad del vehículo Vg=0 su valor calculado V̂ g es en sí
mismo el error de velocidad y de acuerdo con la definición (6.1):

V̂ g  V g (6.87)

La racionalidad de la ley (6.86) radica en que, como se vio en el ejemplo anterior, la


velocidad horizontal calculada es la consecuencia visible de los errores de alineación e
instrumentales (ver Fig. 6.6 a 6.8). Estando el vehículo en reposo, su estado cinemático
es constante en tanto que el estado calculado evoluciona alrededor de este valor fijo.
Siendo precisamente el objetivo de la autoalineación reducir estas diferencias, en lo que
sigue haremos uso del modelo (6.80) que describe la dinámica del error de navegación.

Dado que este esquema de autolineación no utiliza la velocidad vertical, se impone a


ésta el valor nulo de la condición de reposo durante la autoalineación. Asimismo, se fija
la posición del vehículo en su valor conocido. Lo anterior se traduce en las siguientes
condiciones sobre el vector de error (6.65) y su dinámica (6.80):

VˆU  VU  VU  0


(6.88)
π g  π g  0

Las condiciones anteriores implican suprimir las últimas 4 filas y columnas de la matriz
F g de la (6.84), de modo que el modelo lineal que describe los apartamientos de la
condición nominal de reposo del navegador realimentado de la Fig. 6.9 resulta:

x  F g x   g  u g ; (6.89)

Donde:

 g  VˆE 
   ; u  K    KHx;
g
x   5
(6.90)
VH  VˆN 

y además:

126
 0 U  N 0  R 1 h    Eg 
 n   
 U 0 0 1 0    gN 
Rn  h
0 0 0 1 0 g   ; ξg   g  ;
H  ; F    0 0 0 0   U  (6.91)
0 0 0 0 1  
N
  g
 0  0 0 2  U  E 
  0 0 2U 0   g 
 N

La matriz constante K se diseña de modo de que el siguiente sistema lineal realimentado


sea exponencialmente estable:

x  (F g  KH )x   g ; (6.92)

Condición que es posible lograr dado que, como es fácil demostrar, las matrices (Fg,H)
conforman un par observable (ver por ejemplo Goodwin et al., 2001 para una
exposición general sobre el tema). En efecto, bajo esta condición es posible asignar
valores propios con parte real negativa a la matriz del sistema en lazo cerrado:
Alc (K )  F g  KH . El resultado es que si los errores instrumentales son nulos (g=0) el
error x converge exponencialmente a cero asegurando la alinearon asintótica de la
plataforma analítica.

Figura 6.10: Alineación sin errores instrumentales

Para las unidades [rad] y V[m/s] con el valor de K:

T
4  0 -0.0178 0 80 0 
K  10 0.0178 0 -0.2 0 80  (6.93)
 

se obtienen los siguientes valores propios de Alc (K )

127
1,2,3,4,5 =-0.0010, -0.0030, -0.0040, -0.0040 + 0.0017i, -0.0040 - 0.0017i (6.94)

Para la determinación de K en función de los valores propios deseados de Alc (K )


consultar, por ejemplo Kautsky/Nichols, (1985) o Laub/Wette, (1984).

La Figura 6.10 muestra el resultado de la autoalineación para la ganancia K establecida


en (6.93) para un desalineamiento inicial g =[0.5,0.5,1]T[º]. También se grafican las
componentes de V ˆ con el fin de mostrar que todas las componentes del vector de
H
errores tienden asintóticamente a cero como esperado.

Cuando g¹0, la estabilidad asintótica del sistema realimentado (6.92) asegura que
x  0 , pero no que x  0 . Efectivamente, como es fácil comprobar en este caso,
x converge a:

x   Alc1 (K )ξ g (6.95)

Donde Alc1 (K ) es la matriz de sensibilidad del error de alineación a los errores


instrumentales. Despreciando el término de Coriolis, de las 2 últimas filas de la Ec.
(6.92) en estado estacionario ( x  0 ) se obtienen los errores de nivelación límites en
función de los sesgos acelerométricos:


VˆE  0   N   E / 
(6.96)

VˆN  0  E   N / 

Figura 6.11: Alineación con errores instrumentales.

De las Ecs. (6.96) resulta que, con resoluciones  £100g pueden obtenerse errores de
nivelación  N , E  104 [rad ] . Con estos valores y para las resoluciones giroscópicas
usuales resulta ser: U  N , VˆN / Rn   E por lo que, de la 1ª fila de la Ec. (6.92) se
obtiene una estimación del límite inferior en la precisión de la determinación del azimut

128
usando instrumentos inerciales (función de girocompás) en función de la resolución del
giróscopo  E :

U   E / e cos  (6.97)

Físicamente, la anterior debe interpretarse como el límite de la capacidad de medir con


giróscopos la componente E de la velocidad angular terrestre, la cual, sólo tendrá un
valor aparente diferente de cero si hay un error de azimut. Claramente, esta capacidad es
nula en los polos y máxima en el Ecuador.

Finalmente, la Figura 6.11 ilustra la evolución del error en los parámetros de


navegación durante el proceso de alineación para un desalineamiento inicial de la
plataforma analítica proyectado sobre la terna {gg =[0.5,0.5,1][º] y errores
instrumentales g=[1, 1, 1][gr/hr], g=[100, 100, 100][g]. Como se advierte, en
presencia de errores instrumentales el error de alineación estacionario no es nulo.

129
Capítulo 7
Algoritmos “Strapdown”
de Navegación Inercial

Para determinar la posición, velocidad y actitud de un vehículo a partir de mediciones


inerciales en configuración “strapdown” la computadora de navegación a bordo debe
integrar en tiempo real las ecuaciones cinemáticas de la mecanización correspondiente.
Los requerimientos en la capacidad de cómputo son impuestos tanto por la aplicación
específica como por la dinámica del vehículo en la misión estipulada. Mientras más
rápida sea la dinámica, más alta serán las tasas requeridas de actualización de los
parámetros de navegación, de adquisición de datos y. por ende, la velocidad de cómputo
del algoritmo de navegación inercial.

De los capítulos anteriores, resulta claro que el conocimiento de la orientación


instantánea del vehículo es crucial para proyectar adecuadamente las aceleraciones
registradas por los acelerómetros sobre la terna de referencia (de navegación) en la que
se describe la traslación. De otro modo, debido a la doble integración de las
aceleraciones, pequeños errores de orientación se traducen en errores de posición que
crecen polinomialmente con el tiempo. Esto confiere a la ecuación de Laning/Bortz (o
de coneo) que describe la evolución de la orientación, un rol central en los métodos de
navegación inercial. Este hecho y la complejidad inherente al carácter no lineal de dicha
ecuación han hecho que el cálculo de la orientación tenga en la literatura un lugar
preponderante.

Si bien es posible usar métodos de integración numérica generales estándar tales como
Runge-Kutta, predictor corrector etc., se aprovecha mejor la capacidad de cómputo
disponible con algoritmos adaptados a la estructura particular de las ecuaciones
cinemáticas. Esta idea está en la base de una línea de investigación muy activa durante
el pasado reciente, entre cuyos resultados mas significativos se destacan los trabajos
pioneros de Savage, (1966), Jordan, (1969) y Bortz, (1971) y más recientemente, los
trabajos de Savage (1998) partes I y II y Savage (2006) que consolidan la maduración
del tema.

Aunque dinámicamente acoplados, los movimientos de rotación y traslación de un


vehículo suelen desarrollarse en escalas de tiempo distintas. Una de las características
más significativas de los algoritmos mencionados arriba es que permiten diferenciar la
tasa de ejecución de los cálculos según las distintas dinámicas presentes reduciendo así
la carga computacional en tiempo real sin afectar la precisión.

La mayoría de estos algoritmos ha sido formulada en terna de navegción LGV. Esto


comporta especiales cuidados en el cálculo de la rotación por transporte ya que cuando
la terna geográfica varía rápidamente respecto de una terna inercial las aproximaciones
del algoritmo tienden a producir un crecimiento acelerado en el error de la posición.
Esta situación puede presentarse aún en vehículos estacionados sobre la Tierra (p.e. en
fase de alineación) y resulta crítica en vehículos “veloces”, como satélites, lanzadores
satelitales, cohetes, etc.

130
La primera parte del capítulo desarrolla el algoritmo en terna LGV mientras que la
segunda lo hace en terna ECEF. Gracias a una formulación matemática más simple, el
segundo enfoque permite una mejora significativa de la precisión en traslación
especialmente en vehículos rápidos a la vez que reduce considerablemente la
complejidad numérica del algoritmo de navegación.

La Figura 7.1 es un esquema de la estructura clásica de un algoritmo de navegación


inercial en tiempo real alojado en la computadora de navegación del vehículo. El
algoritmo toma como entradas los incrementos integrales vectoriales α l y vl
provistos por la electrónica asociada a los instrumentos inerciales: giróscopos y
acelerómetros. La salida del algoritmo son los parámetros de navegación en la terna
elegida y a la tasa requerida por la aplicación.

tl

 fˆ
b
vl  ()d  ; Parámetros de
tl 1 navegación
tl
Algoritmo de entregados a
integración intervalos Ts > Tl.:
 ωˆ ib ()d  ;
b
α l 
numérica.  Posición,
tl 1
 Velocidad,
Mediciones inerciales
Computadora de  Orientación
entregadas a intervalos Tl.
navegación.

Figura 7.1: Entradas y salidas de un algoritmo de navegación inercial.

7.1 Integración numérica de las ecuaciones de navegación en terna LGV

En este apartado usaremos las ecuaciones de navegación en la forma (5.33) que


rescribimos a continuación.

Ecuaciones de orientación:

 n  Cn S(ωb )  S(ω n )Cn


C b b ib in b

1 n ωbib  1 ωinn  n
 q bn  qb      qb (7.1)
2  0  2 0 
ωinn  ρ n  Ωen  ρ n  Cen Ωee

Ecuaciones de traslación:

V n  Cn f b  γ n  (2Ω n  n )  V n ; Vn (0)  V n
b e 0
(7.2)
h  Vzn ; h(t0 )  h0

 e  Ce S(ρ n )  q e  1 q e ρ 
n
C n n n n   (7.3)
2 0

131
Como se menciona en el párrafo 5.3, para trayectorias cercanas a la Tierra será
suficiente usar el modelo de gravedad que en terna LGV es (ver Ec. (5.32)):

 0 
n 
γ ( , h )   0  (7.4)
 
 U (, h) 


Donde U (, h) representa la aproximación de Hofmann/Moritz (ver Párrafo 4.41 y Ec.
(4.45)):

   2 a 2b h h 
2

U ( , h)   ( )  1  2  1  f   2 f sin ( )   3    (7.5)
2
  GM T a  a  

La relativa simplicidad de la expresión de γ n en esta terna constituye una de las


motivaciones más importantes del uso de la misma. En aplicaciones de precisión en
lugar de la (7.4) podrá utilizarse la expresión de la gravedad normal corregida usando
las anomalías locales dada por la Ec. (4.55).

Rotación por transporte:

ρ n  K n (, , h)V n  z n nz ; nz   sen( )   (7.6)

La anterior se corresponde con la expresión (5.37) y subsiguientes y depende de la


mecanización elegida para la deriva de azimut cuyas versiones más usuales están
reflejadas en la tabla 5.1. Por razones de claridad, en la mayor parte de lo que sigue
usaremos la descripción de la orientación en términos de MCD, sin embargo, tal como
fuera señalado en el Capítulo 3, deberá tenerse en cuenta que la representación más
adecuada es la de cuaterniones ya que requiere actualizar menos coeficientes y asegura
una mayor estabilidad numérica.

7.1.1 Notación
Siguiendo a Savage (1998), se subdividen los cálculos de la integración de las
ecuaciones de navegación según tres cadencias. Esto permite agregar flexibilidad y
aprovechar mejor la capacidad de cómputo instalada a bordo, especialmente cuando las
cinemáticas de orientación y de traslación poseen escalas de tiempo diversas. En las
cadencias más rápidas se ejecutan los cálculos más sencillos pero que requieren de
mayor precisión en el tiempo. Estos cálculos están relacionados con la actualización de
los parámetros de la orientación y de las componentes de alta frecuencia de la
velocidad.

De acuerdo con la Fig. 7.2, distinguimos 3 períodos encastrados: un período corto: Tl ,


otro medio: Tm y un tercero largo: Ts. Se supondrán estos períodos vinculados mediante
los números enteros L y M de tal modo que: Ts=MTm, Tm=LTl. Para distinguir los
distintos instantes e intervalos de tiempo se introduce la siguiente notación representada
en la Fig. 7.2, para j  0,..., M  1, i  0,..., L  1 y k=0,…,HN (horizonte de
navegación).

132
tk 1  tk  M Tm ; tk , j  tk  j Tm; tk , j ,i  tk  j Tm  iTl (7.7)

Notar en particular que: tk ,0  tk ; tk , j ,0  tk , j ; tk , j , L  tk , j 1 ; tk , M  tk 1 . Una variable


dependiente del tiempo v(t) evaluada en el instante tk , j ,i se denotará indistintamente
v(tk , j ,i ) ó vk , j ,i .

Ts

tk,1,2 tk,5,3

tk,1 tk,2 tk,5


tk tk+1
Tm
Tl
Figura 7.2: Períodos encastrados y notación de tiempos.

En lo que sigue se usarán las siguientes definiciones:

{b(tk , j ,i )}  {b(k , j , i )}: terna {b} en el instante tk , j .i


kb, j (t ) : ángulo entre las ternas {b(tk , j )} y {b(t )} para t  tk , j
kb, j (tk , j ,i )  kb, j:i : ángulo entre las ternas {b(tk , j )} y {b(tk , j ,i )}
kb, j ,i (t ) : ángulo entre las ternas {b(tk , j ,i )} y {b(t )} para t  tk , j ,i
(7.8)
kb, j (tk , j 1 )  kb, j: j 1 : ángulo entre las ternas {b(tk , j )} y {b(tk , j 1 )}
θnk (t ) : ángulo entre las ternas {n(tk )} y {n(t )} para t  tk
θnk (tk 1 )  θnk:k 1 : ángulo entre las ternas {n(tk )} y {n(tk 1 )}
θnk (tk , j )  θ nk: j : ángulo entre las ternas {n(tk )} y {n(tk , j )}

kb, j (t ) y θ nk (t ) son, respectivamente, las soluciones en el instante t de las ecuaciones de


Laning/Borz (ver Ec. (3.89) del apartado 3.3.3):

1 
1  sin() 
 (t )  ωbib    ωbib  2 b
1  2(1  cos())    (  ωib ); (tk , j )  0 (7.9)
2  
1 1   sin() 
θ (t )  ωin
n n
 θ  ωin  2 1  
n
θ  (θ  ωin ); θ(tk )  0 (7.10)
2   2(1  cos()) 

Como se advierte de la Ec. (7.9), kb, j (t ) depende de la velocidad angular del vehículo
respecto de la terna inercial ωbib medida por los giróscopos, mientras que θ nk (t ) depende

133
n
de la velocidad angular de la terna {n} respecto de la terna inercial: ωin  Ω n  ρ n . (ver
la expresión general (5.37) de ρ n en el apartado 5.3.1)

En general, la integral entre los instantes tk,j,i y t tk,j,i de una función integrable del
tiempo v(t ) se denotará:

t
vk , j ,i (t )   v()d 
tk , j , i
t k , j , i 1
(7.11)
vk , j ,i (tk , j ,i 1 )  vk , j ,i:i 1   v( )d 
tk , j , i

7.1.2 Integración de las ecuaciones de orientación.


En el instante tk 1 la MCD y el cuaternión que transforman las coordenadas de la terna
del cuerpo {b} a la terna de navegación {n} pueden factorizarse de la siguiente manera:

Cbn((kk 1)1)  Cnn (( kk )1)Cbn((kk ))Cbb (( kk )1)


(7.12)
qb k 1  q n  k  qb k qb  k 1
n k 1 n k 1 n k b k

Esto permite considerar en forma independiente la rotación inercial de la terna del


cuerpo y la rotación de la terna de navegación. Esto adquiere especial significación en el
cálculo que sigue dado que, usualmente, ambos movimientos se ejecutan en escalas de
tiempo distintas. En efecto, un vehículo atmosférico puede estar sometido a velocidades
angulares de varios rad/seg (un cohete con estabilización por espinado axial puede
llegar a varias decenas de rad/seg), mientras que, la rotación de transporte de un
vehículo aún de muy alta velocidad: V n  104 Km/hr sumada a la velocidad angular de
n
la Tierra, produce una velocidad angular de la terna de navegación ωin  0.01 rad/seg.

La actualización lenta de la MCD Cnn (( kk ) 1) se realiza a intervalos Ts y se calcula en


función del ángulo θnk:k 1 según:

Cnn (( kk ) 1)  exp(S(θ kn:k 1 ))  Cnn (( kk ) 1)  exp(S(θkn:k 1 ))


n
 θ sin(nk:k 1 / 2)  * (7.13)
q nn (( kk ) 1)   k:k 1   q nn (( kk ) 1)  q nn (( kk ) 1) 
n
 cos(k:k 1 / 2) 

Por otra parte, la siguiente descomposición:

Cbb (( kk ) 1)  Cbb kk ,1  Cbb kk ,2,1  Cbb kk , M11


b k 
(7.14)
qb k 1  qb k ,1  qb k ,2  qb k 1
b k b k ,1 b k , M 1

134
permite actualizar la MCD Cbb (( kk ) 1) en intervalos más cortos en función del ángulo
kb, j: j 1 (j=0 a M-1) rotado por la terna del vehículo respecto de la terna inercial en cada
intervalo Tm= Ts/M:

Cbb (( kk ,, jj ) 1)  exp (S(kb, j: j 1 ))  Cbb (( kk ,, jj ) 1)  exp (S(kb, j: j 1 ))



kb, j: j 1 sin(bk . j: j 1 / 2)  * (7.15)
qb ( k , j 1)  
b( k , j )
  qbb (( kk ,, jj ) 1)  qbb (( kk ,, jj ) 1) 
 cos(bk . j: j 1 / 2)   
 

Cálculo de Cnn (( kk ) 1) :
Para los valores usuales de Ts, el vector de rotación angular θ nk:k 1 de la terna {n} puede
considerarse colineal con ωinn ( k ) en cada intervalo Ts. Esto permite suprimir los términos
de orden superior de la Ec. (7.10) y justifica la primera aproximación de la siguiente
ecuación.
tk 1
ˆ inn ( k ) (tk 1 )  ωinn ( k ) (tk )
ω
 ω ()d  
n n(k )
θ k :k 1 in Ts (7.16)
tk
2

La segunda aproximación corresponde a la aplicación del método de integración de los


trapecios, justificado por la variación suave de ωinn ( k ) , donde se usan las predicciones:

ω ˆ inn ( k ) (tk 1 )  Ωne ( k )  ˆˆ n ( k ) (tk 1 )


(7.17)
ρˆˆ n ( k ) (tk 1 )  K n ( k ) ( k 1 ,  k  , hk  )) Vkn(1k )  z nnz ( k ) (tk )

función de los valores de  k 1 , a k  , hk  , determinados al final del procedimiento de


actualización de la posición (ver Ec. (7.40)), y de Vkn(1k ) calculada mediante el algoritmo
de actualización de la velocidad (ver Ec. (7.45) y subsiguientes) antes de actualizar
ρ n ( k ) mediante valores calculados o conocidos en el instante tk. Por último, Cnn (( kk ) 1 es
calculada mediante la siguiente expresión o su aproximación de primer orden justificada
por los pequeños valores en juego de θ nk:k 1 .

Cnn (( kk ) 1)  exp(S(θ nk :k 1 ))  I  S(θ nk :k 1 ) (7.18)

Cálculo del ángulo kb, j: j 1 :


Expandiendo en potencias de  el factor del último término de la Ec. (7.9) se encuentra
que:

1   sin()  1 1 1
2 
1   (1  2  ...)   O(2 ) (7.19)
  2(1  cos())  12 60 12

135
Dado que este factor pondera al término de 2° orden de la Ec. (7.9) se concluye que, a
menos de errores de orden O(4 ) en el 2º miembro, dicha ecuación diferencial resulta
aproximable mediante la siguiente:

1 1
 (t )  ωbib    ωbib    (  ωbib ); (tk , j )  0; tk , j  t  tk , j 1 ; (7.20)
2 12

Para Tm pequeños la 1ª integral de ωbib es el término que más contribuye a (t ) tanto en
la (7.9) como en la (7.20), por lo cual, cuando ωbib sea suficientemente suave en cada
intervalo Tm, podrá afirmarse que (t )  O( t  tk ) y, por tanto, que
2
O(2 )  O( t  tk ) . Por consiguiente, la diferencia entre los 2º miembros de las Ecs.
4
(7.9) y (7.20) resultan de orden O( t  tk ) , de lo cual resulta que la diferencia entre la
5
integral de la Ec. (7.20) y la solución de (7.9) es de orden O( t  tk ) . Tan buena
aproximación ha motivado que todos los algoritmos de cálculo digital de (t ) tomen
como referencia de precisión la integral de la Ec. (7.20):

t
 1 1 
 ωib  2   ωib  12   (  ωib )  d ;
b b b
k , j (t )  tk , j  t  tk , j 1 ; (7.21)
tk , j

El cálculo de la Ec. (7.21) presenta, no obstante, la complejidad inherente a una integral


implícita. Cuando ωbib no rota respecto de la terna {b(t)} ωbib se mantiene paralelo a 
en el intervalo Tl y los dos últimos térrminos de las (7.21) y (7.9) son nulos con lo cual
la solución exacta de k , j (t ) es la integral explícita de ωbib . Sin embargo, para
dinámicas más acentuadas que incluyan coneo de ωbib , esta condición no resulta realista.
Miller (1983) propone en estos casos usar la siguiente forma truncada de la (7.20):

1
 (t )  ωbib    ωbib ; (tk , j )  0; tk , j  t  tk , j 1 ; (7.22)
2

Por las razones comentadas más arriba, la falta del término de 2° orden de la Ec. (7.20)
3
produce errores del orden O( t  tk ) en las soluciones de la Ec. (7.22) respecto de la
(7.21). A pesar de que esto pueda representar en la práctica un grado aceptable de
aproximación en muchos casos, la simplificación de Miller no evita tener que calcular la
integral implícita (7.22).

Savage (1998, parte I) propone usar la siguiente aproximación de la (7.22) que


involucra funciones independientes de (t ) en el 2° miembro, lo cual redunda en una
notable simplificación del cálculo numérico.

136
1 
 (t )  ωbib  α  ωbib ;  (tk , j )  0
2  ; tk , j  t  tk , j 1 ;
b  α (tk , j )  0 (7.23)
α (t )  ωib 

Lo que hace aún más interesante el uso de la (7.23) es el resultado demostrado por
Savage (2006) usando la teoría de Picard de aproximaciones sucesivas de las soluciones
de ecuaciones diferenciales (ver, por ejemplo, Boyce/Diprima, 1997 para la teoría de
aproximaciones de Picard), según el cual los errores en las soluciones de la (7.23) son
de un orden inferior a los alcanzados por la aproximación de Miller (7.22) (ver los
excelentes análisis de los errores derivados de estas aproximaciones para la dinámica de
coneo en Ignagni, 1994 y para la combinación de las dinámicas de coneo y sculling
definida más abajo en Ignagni, 1998). Es decir, los errores en (t ) son ahora del orden
4
O( t  tk ) ! Visto este resultado y basándonos en Savage (1998, parte I), a
continuación presentamos el algoritmo digital de integración de la Ec. (7.23) para lo que
previamente introducimos la notación:

 ωib ()d 
b
 k , j (t )  (7.24)
tk , j
t
1
 (ωib ()  2 k , j ()  ωib ())d 
b b
k , j (t )    k , j (t )  β k , j (t ); (7.25)
tk , j
t
1
β k , j (t ) 
2t   k , j ()  ωbib ()d  ; (7.26)
k, j

Como se advertirá, el término (7.26) es una corrección de 2º orden respecto de la


primera aproximación dada por el ángulo integral  k , j (t ) , corrección que, como se
mencionó anteriormente, es nula cuando bib    es no-rotante en [tk,j,tk,j+1]. Por esta
última razón, el término β k , j (t ) es denominado corrección por coneo. Dadas las
aproximaciones que deberemos hacer para calcular β k , j (t ) conviene subdividir el
intervalo [tk,j,tk,j+1] en L subintervalos de longitud Tl con lo cual:


βk , j (t )  βk , j ,i  βk , j ,i (t ); 

1
t 
βk , j ,i (t )    k , j ( )  ωib b
( ) d   t
2t  k , j ,i  t  tk , j.i 1 (7.27)
k , j ,i

tk , j , i 
1 
βk , j ,i    k , j ( )  ωib b
( )d 
2t 
k, j 

Análogamente con respecto del ángulo integral establecemos:

137

 k , j (t )   k , j ,i   k , j ,i (t ); 
t 
 k , j ,i (t )   ωib ()d ;  t
b
 k , j ,i  t  tk , j.i 1 (7.28)
tk , j , i

tk , j , i 
 k , j ,i   ωib ()d b 

tk , j 

De las definiciones: β k , j ,i 1  β k , j ,i (tk , j ,i 1 ) ,  k , j ,i 1   k , j ,i (tk , j ,i 1 ) junto con las


(7.27) y (7.28) surge:

t k , j , i 1
1 1
β k , j ,i 1   k , j ,i   k , j ,i 1 
2 2   k , j ,i ()  ωbib ()d ; (7.29)
tk , j , i

Para evaluar el último término de la Ec. (7.29), supondremos una variación de bib
lineal respecto del tiempo a lo largo de dos intervalos consecutivos [tk , j ,i , tk , j ,i 1 ] . Esto
equivale a la existencia para cada i=1,.. L-2 de vectores constantes ai, bi tales que:

ωbib ()  ai  bi (  tk , j ,i ); tk , j ,i 1    tk , j ,i 1 (7.30)

A partir de la anterior evaluamos los ángulos integrales consecutivos:

tk , j ,i 1 tk , j ,i 1
1
α k , j ,i 1   ωbib   d    [ai  bi (  tk , j ,i )]d   aiTl  biTl 2
t k , j ,i t k , j ,i
2
(7.31)
t k , j ,i
1
α k , j ,i   ωbib   d   aiTl  biTl 2
tk , j ,i 1
2

En función de los cuales resultan;

α k , j ,i 1  α k , j ,i α k , j ,i 1  α k , j ,i
ai  ; bi  (7.32)
2Tl Tl 2

Que, junto con la (7.30), permiten calcular el 2º término de la (7.29)

138
t k , j , i 1 tk , j , i 1 
1 1
 α k , j ,i         d  
b
ib   [ bib    d ]  bib    d 
2 tk , j , i
2 tk , j , i tk , j , i

t k , j , i 1
1 1

2 
tk , j , i
[ai (  tk , j ,i )  bi (  tk , j ,i ) 2 ]  [ai  bi (  tk , j ,i )]d 
2
t k , j , i 1 (7.33)
1 1
  [ai  bi (  tk , j ,i )  bi  ai (  tk , j ,i ) 2 ]d 
2

2 tk , j , i
2

1 (  t k , j , i ) 3 1
 ai  b i  α bk , j ,i  α bk , j ,i 1
4 3 12
tk , j ,i 1

Con lo cual la (7.29) resulta:

1 1
β k , j ,i 1   k , j ,i   k , j ,i 1  α bk , j ,i  α bk , j ,i 1 (7.34)
2 12

Finalmente, de las (7.24) a la (7.34) surge el algoritmo de cálculo de kb, j: j 1 para


i=1,…,L:

kb, j:0  0; α k , j ,0  0; α k , j ,0  α k , j 1, L


for i= 1:L,
Medición de α k , j ,i
α k , j ,i  α k , j ,i 1  α k , j ,i
1 1 (7.35)
β k , j ,i  α k , j ,i 1  α k , j ,i  α bk , j ,i 1  α bk , j ,i
2 12
kb, j:i  kb, j:i 1  α k , j ,i  β k , j ,i
end
kb, j:L  kb, j: j 1

Este algoritmo es considerado de orden 2 dado que en la Ec. (7.34) aparecen productos
de los ángulos integrales presente y pasado: α k , j ,i 1 α k , j ,i , consecuencia de haber
supuesto una variación lineal bib    en dos intervalos consecutivos. El lector
comprobará que es posible obtener algoritmos de orden superior suponiendo para
bib    una variación polinomial de grado mayor a uno, lo que conduce a expresiones
de la corrección de coneo en función de ángulos integrales de dos o más períodos
consecutivos pasados (un análisis generalizado que incluye algoritmos de orden
superior dos puede consultarse en Ignagni, 1998). Finalmente, destacamos que los
ángulos integrales α k , j ,i i=1,…,L son provistos directamente por la electrónica de
adquisición de los giróscopos la cual integra la medición de la velocidad angular en
cada intervalo de adquisición Tl con el fin de promediar el ruido de medición.

139
7.1.3 Integración de las ecuaciones de traslación.

Algoritmo digital de la actualización de la posición:


La posición del vehículo en relación con la Tierra es parametrizada por sus coordenadas
curvilíneas  y  (dadas por Cen ó q en ) y su altura sobre el elipsoide normal cuyas
respectivas evoluciones temporales son descritas mediante las ecuaciones cinemáticas:

h  Vzn  z n V n
C e  Ce S(ρ n ) (7.36)
n n

ρ  K ( , , h)V n  z n nz ; nz   sen( )  


n n

En caso de utilizarse un filtro estabilizador del canal vertical, deberá agregarse a la


primera de las (7.36) el término correspondiente introducido en el párrafo 5.4.1. La
altura es actualizada posteriormente a la actualización de la velocidad (ver en el párrafo
siguiente la Ec. (7.45) y subsiguientes) mediante:

hk 1  hk  hk 1 ;
t k 1
Vzn (tk )  Vzn (tk 1 ) (7.37)
hk 1   Vzn ( ) d  
2
Ts
tk

Por su parte, la actualización de la matriz Cen requiere del ángulo vectorial de rotación
 de la terna {n} respecto de {e} entre dos instantes de tiempo sucesivos solución de la
ecuación de Laning/Bortz del tipo de las (7.9) y (7.10) con velocidad angular ρ n . Para
vehículos atmosféricos (terrestres o aéreos) y valores usuales de Ts, el vector de rotación
k 1 en el intervalo [tk, tk+1] es lo suficientemente pequeño* como para suponer no-
rotante a ρ n en el intervalo. Esto permite aproximar la ecuación de Laning/Bortz
mediante el primer término, con lo cual:

tk Ts
Ts
nk (k1)    n ( k ) ( ) d    nk (k1)   nk ( k )  (7.38)
tk
2

Donde, junto con el valor actualizado de la velocidad se utiliza:

ˆ k 1   nk ( k )Ts
ˆe e ˆ ˆ ˆ
C n ( k 1)  Cn ( k ) exp(S (k 1 ))   k 1 ,  k  , a
ˆ k  (7.39)
ˆ
 nk (k1)  K n ( k ) ( ˆ k  , hk  )Vkn(1k )  z n  kn (, zk )
k 1 , a

Las integraciones por trapecios† usadas en (7.37) y (7.38) se justifican para variaciones
suaves de la velocidad vertical y de la rotación por transporte, respectivamente.

*
Para la velocidad orbital terrestre (ground speed) 7Km/seg y Ts <0.1 seg,   0.01[rad].

Savage (1998 II, secc. IV-C) propone un método de mayor precisión y complejidad numérica para el

140
Con el valor de k 1 determinado mediante la (7.38), la siguiente regla permite
actualizar Cen y calcular las nuevas coordenadas curvilíneas.

Cen ( k 1)  Cen ( k ) exp(S(k 1 ))


(7.40)
Cen ( k 1)   k 1 ,  k 1 , a k 

De requerirse mayor precisión en el cálculo de la posición podrían iterarse las Ecs.


(7.39) y (7.40)

Algoritmo digital de la actualización de la velocidad:


Retomamos la ecuación (7.2) que reformulamos en su forma integral en terna n(k)
denotando con: Vkn ( k )  V n ( k ) (tk )

t
 n ( k ) ( )d   V n ( k )  V n ( k ) (t )
V n ( k ) (t )  Vkn ( k )   V (7.41)
k k
tk

Introducimos las siguientes definiciones de los términos de “gravedad” g u nk ( k ) (t ) ; de


“Coriolis” c u nk ( k ) (t ) y de “la fuerza específica” f u nk ( k ) (t ) :

g u n(k )
k (t )   γ n ( k ) d   g u kn (k1)  g u kn ( k ) (tk 1 ) (7.42)
tk

c u n(k )
k (t )    (2Ωen ( k )   n ( k ) ( )  V n ( k ) ( )d  c u nk (k1)  c u nk ( k ) (tk 1 ) (7.43)
tk

f u n(k )
k (t )   Cbn((k )) f b ( d ;  u nk (k1)  u nk ( k ) (tk 1 ) (7.44)
tk

mediante los cuales la actualización de la Ec. (7.41) se escribe como:

Vkn ( k ) (t )  f u nk ( k ) (t )  g u nk ( k ) (t )  c u nk ( k ) (t ); 
Vkn(1k )  f u nk (k1)  g u nk (k1)  c u nk (k1) (7.45)
Vkn(1k )  Vkn ( k )  Vkn(1k )

Una vez accesible el resultado de la Ec. (7.18), ésta junto con la (7.45) permiten
actualizar la velocidad según la terna n(k+1) al final de intervalo cada Ts como sigue.

Vkn(1k 1)  Cnn (( kk ) 1) Vkn(1k ) (7.46)

calculo de la posición.

141
Cálculo de los términos de gravedad y Coriolis
Por ser una función “suave” de la posición, especialmente cuando se trata de vehículos
de trayectorias atmosféricas con limitada variación vertical*, la gravedad puede ser
aproximada por su valor medio en el intervalo de integración. Del mismo modo, cuando
la velocidad y consiguiente rotación de transporte sean lo suficientemente lentas, es
posible aproximar el término de Coriolis por su valor medio en un intervalo Ts. Bajo las
hipótesis que justifican estas aproximaciones, el término de gravedad + Coriolis: gc u nk (k1)
se calcula utilizando la formula de los trapecios como sigue:

un( k )
gc k 1
  k 1 
ˆ n(k )   γn(k ) ( , h )  (2Ωn(k )  n(k ) )  Vn(k )   Ts
  γˆ nk(k1)  (2Ωen(k )  ˆ nk(k1) )  V k ¨k e k k
2
(7.47)

 n(k ) , n(k ) ,
En la que se utilizan los parámetros conocidos en el instante tk:  k , Vkn ( k ) , V k k

K n ( k ) , de acuerdo con.

ˆ n(k)  Vn(k)  V
V  n(k)T ;
k1 k k s

ˆ n(k)  Vn(k) z Ts


hˆ¨k1   Vk1 k
2 (7.48)
ˆ  K ( ,α , hˆ )V
n(k)
k1
n
k
ˆ n(k) z n(k) (t )
k ¨k1 k1 n z k

γˆn(k)
k1  γ (k , hˆ¨k1)
n(k)

Cálculo del término de la fuerza específica


El término (7.44) originado en la fuerza específica (propulsión/sustentación del
vehículo) contiene normalmente componentes de alta frecuencia y por lo tanto requiere
de una tasa de cálculo más rápida y de un método de integración más preciso. Para esto
introducimos primeramente las definiciones:

f u nk (, kj )  f u nk ( k ) (tk , j );
t
(7.49)
u nk (, kj ) (t )  C f (d  ;  u nk (, kj )1  u nk (, kj ) (tk , j 1 )
n(k ) b
b()
tk , j

Descomponiendo el intervalo de integración de la Ec. (7.44), escribimos:

f u nk ( k ) (t )  f u nk (, kj )  u nk ,( kj ) (t ) (7.50)

Ecuación que conduce a la siguiente iteración para calcular f u nk (k1) :

f u nk (,0k )  0

f u nk (, kj )1  f u nk ,( kj )  u nk ,( kj )1 ; j  1,...,.M  1 (7.51)

f u nk (, Mk )  f u nk (k1)

*
Este no es el caso de cohetes zonda o lanzadores satelitales por ejemplo.

142
Retomamos ahora el término u nk ,( kj ) (t ) de la Ec. (7.49) que rescribimos como:
t
u nk ,( kj ) (t )  Cbn((kk ,) j ) C f (d   Cbn((kk ,) j ) ubk (, kj , j ) (t )
b(k , j ) b
b() (7.52)
tk , j
t
ubk (, kj , j ) (t )  C f (d 
b(k , j) b
b( ) (7.53)
tk , j

Donde Cbn(( kk ,) j ) es actualizado como sigue en función del ángulo kb, j 1: j previamente
calculado mediante la iteración (7.35):

Cbn((kk ,0)
)
 Cbn(( kk ))
Cbb (( kk ,, jj ) 1)  exp(S(kb, j 1: j ));
(7.54)
Cbn((kk ,) j )  Cbn((kk ,) j 1) Cbb (( kk ,, jj ) 1) ; j  1,..., M
Cbn((kk ) 1)  Cbn((kk ,)M )

El resultado final de la iteración anterior: Cbn((kk ) 1) junto con la (7.12) permiten reiniciar el
ciclo del cálculo Cbn a partir Cbn((kk 1)1) .

Para calcular el término ubk (, kj , j ) (t ) (Ec. (7.53)), utilizamos la siguiente descomposición


del intervalo de integración:

ubk (, kj , j ) (t )  ubk (, kj , j ) (tk , j ,i )  Cbb (( kk ,, jj ,)i ) bk (, kj ,,ij ,i ) (t ) 



 t  tk , j ,i , tk , j ,i 1 
t
(7.55)
 k , j ,i (t )   Cb (  ) f (d 
b ( k , j ,i ) b ( k , j ,i ) b

tk , j , i 

En la que se usan las siguientes expresiones o sus respectivas aproximaciones de 1º


orden:

Cbb (( kk ,, jj ,)i )  exp(S(kb, j:i ))  I  S(kb, j:i )


(7.56)
Cbb (( k ,) j ,i )  exp(S(kb, j ,i ( ))  I  S(kb, j ,i ( ))

Cbb (( kk ,, jj ,)i ) puede ser calculado en cada paso de la iteración (7.35) (al final de cada
intervalo Tl). A continuación procedemos a evaluar el término que surge de la Ec.
(7.55):
tk , j , i 1

  (tk , j ,.i 1 )   Cbb (( k ,) j ,i ) f b (d ; i  1,..., L  1


b ( k , j ,i ) b ( k , j ,i )
k , j ,i 1 k , j ,i (7.57)
tk , j , i

para lo cual usaremos en primer lugar, la hipótesis de que bib es no rotante en cada
intervalo Tl, para escribir:

143
δkb, j ,i (t )  ωbib (t ) 
 t  [tk , j ,i , tk , j ,i 1 ] (7.58)
δkb, j ,i (t )  α k , j ,i (t );

y en segundo lugar, la 2ª de las aproximaciones (7.56) válida cuando δkb, j ,i (t ) sea


suficientemente pequeño en un intervalo Tl:

Cbb (( k ,) j ,i )  exp(S(δkb, j ,i ())  I  S( k , j ,i ( ));   [tk , j ,i , tk , j ,i 1 ] (7.59)

Introducimos ahora las definiciones:

t t k , j , i 1

v k , j ,i (t )   f (d   v k , j ,i (t )  f (t ); v k , j ,i 1   f b (d 


b b
(7.60)
tk , j , i tk , j , i

que sustituimos junto con la (7.59) en (7.57) para obtener:

tk , j , i 1

  v k , j ,i 1   α k , j ,i ( )  f b (d 
b ( k , j ,i )
k , j ,i 1
tk , j , i

tk , j , i 1
(7.61)
 v k , j ,i 1  
tk , j , i
α k , j ,i ( )  v k , j ,i (d 

Integrando por partes el último término de la Ec. (7.61) se llega a:

tk , j , i 1


tk , j , i
α k , j ,i ( )  v k , j ,i (d  

tk , j , i 1
(7.62)
1 1
 α k , j ,i 1  v k , j ,i 1    α ()  f (  v k , j ,i (  ω (  d 
b b
k , j ,i ib
2 2 tk , j , i

Lo que permite descomponer el aporte de la propulsión en la terna {b(k,j,i+1)}, dado


por la (7.61), según los siguientes términos:

bk (, kj ,,ij,1i )  v k , j ,i 1  v rt k , j ,i 1  v sc k , j ,i 1
1
v rt k , j ,i 1  α k , j ,i 1  v k , j ,i 1 (7.63)
2
tk , j , i 1
1
v sc k , j ,i 1 
2   α
tk , j , i
k , j ,i ( )  f b (  v k , j ,i (  ωbib (  d 

Pasamos ahora a analizar el significado de cada uno de estos términos. La variación


integral de la fuerza específica en un intervalo Tl: v k , j ,i 1 , variación de 1º orden
respecto de las medidas inerciales integrales, corresponde al incremento de la velocidad
del vehículo en ausencia de rotación de la terna del cuerpo. Los otros términos son

144
productos de variaciones integrales de ambas magnitudes inerciales y por lo tanto son
correcciones de 2º orden del primero. Cuando a lo largo de Tl ocurre una rotación de la
terna del vehículo respecto de la terna inercial, v rt k , j ,i 1 corrige la impulsión v k , j ,i 1
debido al cambio de orientación de la terna {b} (el producto vectorial proyecta v k , j ,i 1
sobre los ejes actuales de {b}). A esto debe su nombre este término: corrección por
rotación. El término v sc k , j ,i 1 merece un análisis más detallado. Cuando en el
intervalo Tl puedan despreciarse las variaciones tanto de la fuerza específica como de la
velocidad angular (i.e. f b  const. y ωbib  const. ) se tendrá (ver definiciones (7.28) y
(7.60)):

α k , j ,i ( )  ωbib (  tk , j ,i )
(7.64)
v k , j ,i ()  f b (  tk , j ,i )

de donde, sustituyendo en la última de las (7.63), surge claramente para este caso que el
integrando del término v sck , j ,i 1 resultará despreciable y por tanto:

1
bk (, kj ,,ij,1i )  v k , j ,i 1  α k , j ,i 1  v k , j ,i 1 (7.65)
2

De este resultado extraemos como primera conclusión que el término v rt k , j ,i 1


predomina en bajas frecuencias mientras que el término integral v sck , j ,i 1 constituye
una corrección de alta frecuencia del incremento de la velocidad debido a la propulsión.
Más aún, este último término refleja ciertos efectos dinámicos combinados de f b ( ) y
ωbib ( ) promediados a lo largo de Tl y proyectados sobre la terna {b(k,j,i)} que son de
interés destacar. Como es fácil constatar a partir de las definiciones (7.28), (7.60) y
(7.63), si f b ( ) y ωbib ( ) permanecen paralelas a lo largo de Tl , este término se anula.
Por otra parte, a magnitudes iguales, su contribución a la propulsión se maximiza
cuando ambos vectores permanecen ortogonales entre si en el mismo intervalo. Este
efecto es el que explica el impulso que imprime un remero a una embarcación con un
único remo (la góndola es el ejemplo clásico) mediante un movimiento ondulante del
mismo y es conocido por su nombre náutico en inglés “sculling”. Por esta razón, el
término v sck , j ,i 1 es denotado en la literatura inglesa como corrección por sculling
(Savage 1998 parte II) lo cual podría traducirse al Castellano como “corrección por
gondoleo”.

Para evaluar la corrección por gondoleo procedemos en forma similar al cálculo de la


integral (7.33) suponiendo, junto con la existencia de los vectores ai, bi que satisfacen la
Ec. (7.30), la existencia de los vectores constantes ci, di que satisfacen:

f b ()  ci  di (  tk , j ,i ); tk , j ,i 1    tk , j ,i 1 (7.66)

Lo que implica suponer una variación lineal con el tiempo de ambas magnitudes
inerciales en coordenadas del cuerpo. Sustituyendo las (7.30) y (7.66) respectivamente

145
en las (7.28) y (7.60) se obtienen, además de las (7.31), las siguientes relaciones con los
incrementos integrales de la fuerza específica:

1 1
v k , j ,i  ci Tl  di Tl 2 ; v k , j ,i 1  ci Tl  di Tl 2 (7.67)
2 2

Si a continuación se sustituyen las (7.30), (7.31), (7.66) y (7.67) en la expresión de


v sck , j ,i 1 (Ec. (7.63)) después de algunas manipulaciones similares a las que conducen
a la (7.33) resulta:

1
v sc k , j ,i 1  [α k , j ,i  v k , j ,i 1  v k , j ,i  α k , j ,i 1 ] (7.68)
12

A partir de las expresiones (7.55), (7.56), (7.63), (7.68) es posible calcular el término
u nk (, kj )1 requerido en cada paso de la iteración (7.51) (al final de cada intervalo Tm),
mediante el siguiente algoritmo que procesa las magnitudes integrales α k , j ,i y v k , j ,i
enviadas a la más alta frecuencia desde la electrónica de los sensores inerciales:

ubk (, kj , j ) (tk , j ,0 )  0; α k , j ,0  α k , j i , L ; v k , j ,0  v k , j 1, L


for i= 0 : L-1,
Mediciones de α k , j ,i 1 y v k , j ,i 1
1 1
bk (, kj ,,ij,1i )  v k , j ,i 1  α k , j ,i 1  v k , j ,i 1  [α k , j ,i  v k , j ,i 1  v k , j ,i  α k , j ,i 1 ]
2 12
Cb ( k , j ,i )  exp(S(k , j:i ))  I  S(k , j:i )
b(k , j ) b b
(7.69)
ubk (, kj , j ) (tk , j ,i 1 )  ubk (, kj , j ) (tk , j ,i )  Cbb (( kk ,, jj ,)i ) bk (, kj ,,ij,1i )
end
ubk (, kj , j ) (tk , j , L )  ubk (, kj , 1j )
u nk (, kj )1  Cbn((kk ,) j ) ubk (, kj , 1j )

7.2 Integración numérica de las ecuaciones de navegación en terna ECEF

Cuando en las ecuaciones (7.1) y (7.2) se impone nºe, ρe  0 y la ecuación de


orientación resulta:

 e  Ce S(ωb )  S(Ωe )Ce ; ω e  Ωe


C b b ib e b ie e

S(Ωee )   eeS(e z ); e z   0 0 1
T
(7.70)
1 ω b  1  Ω e  e
 q be  qbe  ib    e  qb
2  0  2 0 

y para las de traslación se tiene:

146
V e  Ce f b  γ e  2Ωe  V e ; Ve (0)  V e
b e 0
(7.71)
P e  V e

Como se advierte, la inexistencia de rotación de transporte conduce a ecuaciones


cinemáticas más simples que las ecuaciones (7.1) y (7.2). En particular, la ecuación de
orientación resulta desacoplada de la de traslación y el término de Coriolis en ésta
última es lineal respecto de la velocidad. Aunque en este caso, el modelo de la
gravedad normal no tiene una forma tan sencilla como la (7.4), es posible utilizar alguna
de sus expresiones explicitas en coordenadas ECEF dadas por las ecuaciones (4.48) o
(4.51).

7.2.1 Integración de las ecuaciones de orientación.


Con la notación definida en el párrafo 7.1.1, tal como en la (7.12), usamos la
descomposición:

Cbe((kk 1)1)  Cee (( kk ) 1) Cbe ((kk )) Cbb (( kk ) 1)


(7.72)
qbe((kk 1)1)  qee(( kk ) 1) qb k qb k 1
e k bk

Dado que ahora Ωee es constante, la rotación de la terna de referencia e respecto de la


ECI en un periodo Ts esta dada por θek :k 1  Ts Ωee (comparar con las (7.16) y (7.17)). Así,
la expresión (7.18) (y su versión en cuaternión) resulta para este caso en la matriz
constante:

 e sin(Ts ee / 2) 
Cee(( kk ) 1)  exp(S(Ts Ωee )) ; q ee(( kk ) 1)   z ; (7.73)
e
 cos(Ts e / 2) 

Notar que en esta formulación la rotación de la terna de referencia puede calcularse en


forma exacta evitando las aproximaciones (7.16) a (7.18) para determinar la orientación
del vehículo respecto de dicha terna. Por su parte, el factor Cbb (( kk )1)  exp (S(kb, j : j 1 )) ,
correspondiente a la rotación inercial del vehículo, se actualiza del mismo modo que
para la terna LGV, para lo cual se refiere al lector al párrafo anterior y en particular al
pseudocódigo resultante (7.35).

7.2.2 Integración de las ecuaciones de traslación.*


Introduciendo la notación:

 Pe   P e 
e 
X   ; X   ; e
(7.74)
e
 V   e 
 V
0 I3 
A e 
; w e (t )  γ e (P e (t ))  Cbe f b (t ) (7.75)
 0 2 S ( Ω ) 

*
La validación numérica de este enfoque, cuyo desarrollo no habia sido publicado previamente, es tratada
en Carrizo et al. 2007.

147
las ecuaciones de traslación (7.71) se agrupan en la siguiente ecuación de estado:

 e  AXe  
0  e e
X e  ; X (tk )  X k  dado (7.76)
 w (t ) 

cuya solución explicita para t= tk+1= tk+Ts es:

tk 1
 0 
Xek 1  e ATs Xek   e A (t  )  e  d ;
 w ( ) 
(7.77)
tk

Usando la definición de la exp(At) se obtiene:

1 1  I Q(t ) 
e At  I  At  ( At ) 2  ( At )3  ....    (7.78)
2! 3! 0 R (t ) 

Donde se usaron las definiciones:

t
R (t )  e 2S ( Ωe )t
; Q(t )   R () d ; (7.79)
0

En lo que sigue convendrá además introducir las siguientes:

t t
U(t )   Q( ) d ; W (t )   U( ) d  (7.80)
0 0

Integrando sucesivamente término a término la serie de potencias (7.78) y tendido en


cuenta la conmutatividad de una exponencial con su exponente resultan las relaciones:

R (t )  2Q(t )S(Ωe )  I  2S(Ωe )Q(t )  I


Q(t )  2U(t )S(Ωe )  It  2S(Ωe )U(t )  It (7.81)
U(t )  2 W (t )S(Ωe )  It 2 / 2  2S(Ωe ) W (t )  It 2 / 2

Nótese que la componente de la velocidad del término “autónomo” de la (7.77)


corresponde al término de Coriolis en la (7.47) que, a diferencia de la formulación en
LGV (ver también Ec. (7.48)), en este caso, se calcula en forma exacta como resultado
de una transformación lineal, invariante del estado anterior. La matriz constante R(Ts)
de esta transformación es calculada fuera del algoritmo de integración en función del
intervalo Ts reduciendo la complejidad del algoritmo en tiempo real.

Con las definiciones (7.79) el término de la convolución en (7.77) se escribe como:

 P 
t
k 1
 0 
 X k 1   k 1    e A (t k 1   )
 w e ( )  d    X k 1   X k 1
g f
(7.82)
  Vk 1  tk
 

148
Donde se introducen los términos de gravedad y de fuerza específica:

Q(tk 1   )  e e
tk  1

 X kg 1  
tk
 R (t   )  γ (P ( )) d  ;
 k 1 
(7.83)
Q(tk 1   )  e
tk  1

X   R (t   )  f ( ) d 
f
k 1 
tk  k 1 

Cálculo del término de la gravedad:


Introducimos la aproximación de primer orden para t  [tk , tk 1 ] :

γ e (P e (t ))  γ e  P e (tk )  V e (tk )  (t  tk )  
γ e
 γ e  P e (tk )   e V e (tk )  (t  tk )  γ ek  b k (t  tk ) (7.84)
 P Pe (tk )
γek   
bk

En la anterior pueden utilizase alguna de las expresiones explícitas de la gravedad en


función de P e presentadas en el Párrafo 4.4.1. En el Apéndice B se consignan las
expresiones analíticas de las entradas de la matriz jacobiana [γ e / P e ] para el caso
particular de la aproximación “J2” de la gravitación normal dada por la Ec. (4.51).
Introduciendo la (7.84) en la primera de las (7.83) luego de usar el cambio del variables
habitual e integrar por partes, resulta:

Q(tk 1   )  Q(tk 1   ) 
tk 1 tk 1

 Xkg1    R (t   )  d  γ k    R (t   )  (  tk ) d  b k
e

tk  k 1  tk  k 1 
Ts Ts
Q(  )   Q ( )   Q ( )   Q ( ) 
Ts s T

   R ( )  d  γ k    R ( )  (Ts   ) d  b k    R ( )  d  ( γ k  Ts b k )    R ( )   d  b k
e e

0   0   0   0   (7.85)
 dU( ) 
Ts
 U(Ts )  e  U(Ts )  e  W(Ts )   U(Ts ) 
  ( γ k  Ts b k )      b k  Q(T )  ( γ k  Ts b k )   U(T )  b k  Q(T )  Ts b k
 Q (T )
s  0  dQ (  )   s   s   s 

 U(Ts )  e  W(Ts ) 
  γ k   U(T )  b k
Q(Ts )   s 

Una vez más, las matrices constantes que intervienen en la expresión anterior pueden
calcularse a priori fuera del algoritmo en funcion del Ts elegido.

Cálculo del término de la fuerza específica


Descomponiendo el intervalo [tk, tk+1] según intervalos Tm la 2ª de las (7.83) se rescribe
como:
t
M 1 k , j 1
Q(tk 1   )  e
X kf 1     R (t   )  f ( ) d 
j 0 t
k. j  k 1 
tk , j 1
(7.86)
Q(tk 1  (tk . j  Tm / 2)) 
M 1
    Cbe f b ( ) d 
j 0  R (tk 1  (tk . j  Tm / 2))  tk . j

Donde se introdujo la aproximación para   tk , j , tk , j 1  :

149
Q(tk 1   )  Q(tk 1  (tk . j  Tm / 2))  Q(Ts  ( j  12 )Tm )  Q( j ) 
 R (t   )    R (t  (t  T / 2))    R (T  ( j  1 )T )    R ( j )  ; j  0,.., M  1 (7.87)
 k 1   k 1 k. j m   s 2 m   

Similarmente a las (7.52) definimos:


t
u (t )  C f (d  ;  u ek , j 1  u ek , j (tk , j 1 )
e e b
k, j b( ) (7.88)
tk , j

Con la cual la (7.86) resulta:

M 1
 Q( j ) 
 X kf 1   R( j)  u e
k, j (tk , j 1 ) (7.89)
j 0  

Donde las matrices constantes Q( j ) , R ( j ) ; j=0,..,M-1 se calculan de una vez para


siempre en función de Ts y Tm. Similarmente a la (7.52)
t
u (t )  C C f (d   Cbe ( k , j ) u bk (, kj , j ) (t )
e e b(k , j ) b
k, j b(k , j) b() (7.90)
tk , j

Donde, como en (7.54), Cbe ( k , j ) es actualizado mediante la siguiente iteración en función


del ángulo kb, j 1: j previamente calculado con el pseudo-código (7.35)

Cbe ( k ,0)  Cbe ( k )


Cbb (( kk ,, jj ) 1)  exp(S(kb, j 1: j ));
(7.91)
Cbe ( k , j )  Cbe ( k , j 1) Cbb (( kk ,, jj ) 1) ; j  1,..., M
Cbe ( k 1)  Cbe ( k , M )

El resultado final de la iteración anterior: Cbe ((kk )1) junto con la (7.72) y la (7.73) permiten
reiniciar el ciclo del cálculo Cbe a partir Cbe ((kk 1)1) . En cuanto al cálculo del término
ubk (, kj , j ) (t ) en (7.90) el desarrollo reproduce los mismos pasos que para la terna LGV
desde la (7.55) hasta el pseudo-código expresado por (7.69).

7.3 Comparación entre los algoritmos en ternas LGV y ECEF

Los algoritmos “strapdown” en coordenadas LGV son la continuación natural de los


sistemas de navegación con plataforma nivelada paralela al plano tangente local
terrestre. En gran parte es esta herencia histórica la que ha determinado su popularidad
durante el desarrollo de la tecnología “strapdown”. En defensa de esta opción cabe
destacar además que la terna de referencia geográfica y el posicionamiento en
coordenadas curvilíneas son muy usados en la navegación en vehículos sub-
atmosféricos y que muchos instrumentes exoceptivos clásicos de ayuda a la navegación
inercial (altímetros, radionavegación terrestre y radar) suelen estar adaptados a dicha

150
terna. Otro especto que motiva el uso de estas coordenadas es la forma sencilla que en
ellas adopta la expresión de la gravedad normal (fórmula de Somigliana en el capítulo
4). Sin embargo, como se demuestra en este capítulo la formulación en terna LGV no
resulta las más adecuada desde el punto de vista numérico.

Las ecuaciones cinemáticas según la terna terrestre (ECEF) son considerablemente más
sencillas que las expresadas en terna LGV. Como fuera señalado en Wei/Schwarz
(1990), esto permite suprimir aproximaciones mejorando la precisión y reduciendo la
complejidad e intensidad del cálculo en tiempo real. Más específicamente en ECEF: a)
La corrección por Corilolis se calcula en forma exacta en cada paso del algoritmo que
transforma el estado cinemático anterior mediante una matriz constante conocida a
priori; b) La rotación de la terna “e” en cada intervalo Ts es constante y conocida a
priori en forma exacta; c) La ausencia de la rotación de transporte reduce la complejidad
de las ecuaciones. Las ventajas numéricas señaladas se acentúan en alta velocidad (alta
rotación de transporte) como satélites o inyectores satelitales. En Carrizo et all. (2007)
se demuestra que en vehículos rápidos los errores inducidos por la aproximación del
término de Coriolis en terna LGV pueden dominar en varios ordenes de magnitud a los
provocados por las otras aproximaciones numéricas. En la misma referencia se compara
el desempeño de ambos algoritmos para idénticos valores de Tl, Tm y Ts, sobre una
trayectoria sintética (generada con el método expuesto en Giribet et al. 2007) de un
inyector satelital similar al vehículo DELTA-II de NASA. El resultado es una
divergencia en la posición en la versión LGV más de 3 órdenes de magnitud superior en
relación a la observada en terna ECEF.

Como la ECEF es la terna estándar de los sistemas GNSS, a las ventajas anteriores se
suma una mejor adecuación del algoritmo de propagación del estado cinemático a la
navegación integrada inercial-GPS (objeto del capítulo 9). En particular, los modelos
matemáticos de las medidas de pseudo-rango y Doppler (considerados en el próximo
capítulo) son los mismos que los adoptados por los receptores GPS. La mayor
simplicidad de los modelos de estas mediciones exteroceptivas se traducen además en
ventajas numéricas en la implementación del algoritmo de navegación integrada. Por
último cabe destacar que para ciertas aplicaciones como la geo-referenciación
automática de imágenes adquiridas mediante sensores remotos tanto aéreos como
satelitales la terna de preferencia es la ECEF.

151
Capítulo 8
Navegación Satelital Global

Los Sistemas Satelitales de Navegación Global (GNSS según sus siglas en inglés) son
sistemas de radionavegación pasiva con estaciones de referencias a bordo de satélites en
órbita alrededor de la Tierra. La constelación de satélites constituye un sistema de
referenciación absoluta que permite a un receptor alcanzado por las señales satelitales
medir su distancia respecto de cada satélite y determinar, por triangulación, su propia
posición en coordenadas ECEF, terna de referencia estándar adoptada por todos los
sistemas GNSS.
La posición de cada satélite visible es determinada en el propio receptor con base en sus
parámetros orbitales (efemérides) transmitidos junto con la señal recibida. La distancia a
cada trasmisor satelital se calcula escalando con la velocidad de propagación de la luz
en el vacío la medida del tiempo de propagación de la correspondiente señal.
Clásicamente, la medición precisa de intervalos de tiempos entre eventos no co-
localizados ha requerido relojes de alta precisión y una muy buena sincronía entre ellos.
Sin embargo, la introducción del concepto de pseudo-distancia o “pseudo-rango” hizo
posible reducir los requerimientos de alta calidad y sincronía en el reloj del receptor
permitiendo su miniaturización y masificación. El concepto utiliza un número
redundante de mediciones de tiempos de propagación (al menos 4 en 3 ó 3 en 2)
todos afectados por idénticas imprecisiones del reloj del receptor (de calidad comercial)
y a partir de ellas determina, simultáneamente, las coordenadas de la posición del
receptor y el sesgo horario de su reloj. De éste modo, el mismo concepto hace posible
posicionar un receptor y propagar el tiempo preciso medido a bordo de los satelites de
referencia.

Una gran ventaja de los GNSS es que permiten, en todo instante y casi
independientemente de las condiciones atmosféricas, posicionar un receptor ubicado en
casi cualquier punto del espacio circundante a la Tierra con un error acotado y una
precisión uniforme. El desplazamiento Doppler, medido al sintonizar la portadora,
permite calcular la velocidad radial del receptor respecto de cada satélite y,
consiguientemente, determinar el vector velocidad en las mismas coordenadas del
sistema de referencia satelital. Los receptores modernos pueden además rastrear la fase
de la portadora emitida por los satélites, lo cual, mediante técnicas interferométricas,
permite posicionamientos de muy alta precisión y aún medir directamente la orientación
de un receptor equipado con múltiples antenas. Los métodos interferométricos son la
base de los más modernos sistemas de navegación de alta precisión.

Los sistemas GNSS han sido tributarios del rápido desarrollo durante las últimas
décadas de un número considerable de tecnologías críticas tales como: vehículos
espaciales altamente confiables; relojes atómicos de alta precisión y estabilidad (<1 seg.
en 3x106 años); buena estabilidad a corto plazo de osciladores de cuarzo; técnicas
precisas de rastreo satelital y de cálculo de efemérides y métodos avanzados de
modulación de portadora.

152
Las aplicaciones actuales y potenciales de los GNSS son innumerables y abarcan todas
las ramas de la ingeniería, la arquitectura, la salud, el manejo territorial, de recursos
naturales y de catástrofes, los sensores remotos, entretenimientos y, por supuesto, todos
los medios de transporte que, junto con las aplicaciones militares, constituyen el motor
original de esta tecnología.

Los sistemas GNSS operativos o en curso de serlo son: el NAVSTAR-GPS desarrollado


y operado por la fuerza aérea estadounidense y operativo desde 1992, el sistema
GLONASS desarrollado y operado por el ministerio de defensa ruso, actualmente en
proceso de restauración con miras a su operatividad definitiva en 2012 y el sistema
GALILEO, único de origen civil, desarrollado por la Comunidad Europea, previsto para
iniciar su operación en 2014. Un aspecto destacable de esta última constelación es el
uso, a bordo de cada satélite, de un par de relojes atómicos redundantes de muy alta
precisión: un H-Maser (1nesg/día) y otro RAFS (Rubidium Atomic Frequency Standard,
10nseg/día). Asimismo, GALILEO constituirá un sistema de segunda generación capaz
de proveer por sí mismo una señal de integridad compatible con las requeridas por la
ICAO (International Civil Aviation Organization) para la mayor parte de las fases de
los vuelos comerciales. Actualmente esta función es provista por subsistemas ad-hoc de
aumentación regional GPS, tales como el WAAS (Enge et al., 1996) sobre
Norteamérica, el EGNOS (Toran/Traveset, 2004) sobre el continente europeo y el
MSAS sobre Japón. Paralelamente al desarrollo del sistema GALILEO, EEUU inició un
plan de modernización del GPS con miras a proveer también prestaciones de 2ª
generación durante la presente década. Es importante remarcar que en la próxima
década todos estos sistemas estarán accesibles simultáneamente para receptores multi-
constelación lo cual permitirá mejorar la confiabilidad, la precisión, la continuidad y la
integridad a niveles insospechados para los pioneros de la navegación satelital.

Siguiendo a una presentación general de los GNSS existentes, en este capítulo se


describen los modelos de las medidas de pseudo-rango, fase Doppler y desplazamiento
Doppler que realiza un receptor GPS a partir de las señales recibidas. Finalmente se
introducen los procedimientos de cálculo de la posición y de la velocidad a partir de
dichas medidas y se discuten los factores que afectan la precisión de las mismas.

8.1 Arquitectura de los sistemas GNSS

Es clásico describir la arquitectura de los sistemas GNSS según sus 3 componentes


principales, a saber: el segmento espacial, el segmento terreno y el receptor o segmento
del usuario.

8.1.1 El segmento espacial


Consiste en la constelación de satélites junto con las señales en el espacio que ellos
proveen. Los satélites se distribuyen según órbitas circulares cada una de las cuales
ocupa un plano fijo en coordenadas ECI conteniendo entre 4 y 6 satélites activos más
uno, o en ciertos casos dos, de repuesto. La distribución espacial de los satélites (y sus
órbitas) esta diseñada de modo que sea posible “ver” al menos 4 satélites desde
cualquier punto de la Tierra.

La Tabla 8.1 indica algunas características de las constelaciones GPS, GALILEO y


GLONASS. Por su parte, la Figura 8.1 muestra, a modo de ejemplo, los 6 planos
orbitales del sistema GPS con 4+1 satélites en cada órbita.

153
Las funciones del segmento espacial son: a) recibir y almacenar la información
preveniente del segmento de control, b) mantener el tiempo preciso a bordo, c) modular
y transmitir las portadoras con los respectivos códigos de cada satélite y los mensajes de
navegación y d) asegurar la localización espacio-temporal asignada por el segmento de
control de cada satélite dentro de su órbita.

GNSS Planos Satélites/ Inclinación Periodos Satélites Altura


orbitales orbita visibles
GPS 6 a 60º 4+1 55º 12hs 4 20200Km
GALILEO 3 a 120º 10+1 56º 14hs 6 23600Km
GLONASS 3 a 120º 7+1 64,8º 11,25hs  5 19100Km
Tabla 8.1: Características orbitales nominales de 1as principales constelaciones GNSS.

Plano del
Ecuador

60o

Figura 8.1: Órbitas del segmento espacial del sistema GPS proyectadas sobre
el plano del Ecuador.

La Figura 8.2 indica las portadoras de las señales en el espacio para las 3 constelaciones
consideradas, todas ubicadas en la región RNSS (Radionavigation Satellite Service) de
la banda L. Esta región incluye a la zona protegida de interferencias ARNS
(Aeronautical Radio Navigation Service) destinada a la aeronavegación comercial y
sometida a estrictas regulaciones internacionales.

El sistema GPS utiliza el método CDMA (Code Division Multiple Access) para emitir
sus señales según dos códigos con un canal de código independiente asignado a cada
satélite. Sobre su portadora L1 (1575.42 Mhz) en la zona ARNS trasmite, “en fase”, una
señal de precisión para aplicaciones militares con el código denominado P(Y) code (que
puede ser encriptado) y otra “en cuadratura” con código C/A (Coarse-Acquisition code)
de libre acceso. El código P(Y) también es trasmitido sobre la componente en fase de
una segunda portadora L2 (1227.60 MHz) ubicada fuera de la zona protegida ARNS. A
partir de los primeros satélites del plan de modernización: Block IIR-M
(Repelenishment and Modernized) lanzados en 2005, GPS también trasmite en

154
cuadratura sobre la portadora L2 la nueva señal civil L2C con código C/A. Los satélites
del bloque Block IIF (follow on), con inicio de lanzamientos en 2009, incluyen dos
nuevas señales de seguridad de vida (SOL: Safety of Life) sobre la portadora L5
(1176.45 MHz) con un código similar al P(Y)*. Culminado el proceso de
modernización, el sistema GPS ofrecerá señales en 3 bandas de frecuencias diferentes a
sus usuarios civiles, lo que implicará una significativa mejora en precisión y
confiabilidad respecto de la situación actual.

El sistema GLONASS utiliza como técnica de multiplexado la división por frecuencia


FDMA (Frequency Division Multiple Access) y trasmite un mismo código
simultáneamente en 15 canales de frecuencias sobre dos portadoras: L1: 1602,0 Mhz
(1598.0625 a 1605.375 MHz) y L2: 1245,8 MHz (1242.9375 a 1248.625 MHz). La no
coincidencia de bandas con GPS complica y encarece el diseño de receptores
combinados GLONASS/GPS, por lo que el programa de modernización de GLONASS,
anunciado en 2008 por el estado ruso, contempla la trasmisión de los mismos 15 canales
sobre una nueva señal FDMA localizada en la banda L3 (de 1197.648 a 1212.255 MHz)
situada entre las bandas L2 y L5 de GPS y coincidente con la banda E5b de GALILEO.
El uso de FDMA hace de GLONASS la excepción en el uso de CDMA adoptado por el
resto de los sistemas GNSS (incluido el sistema COMPASS chino en desarrollo).
Teniendo en cuenta esto, la federación rusa aprobó en 2008 la futura incorporación de
dos señales CDMA centradas, respectivamente, en las portadoras L1 y L5 de GPS.

Bandas ARNS Bandas ARNS


Bandas RNSS Bandas RNSS
E2 E1

Galileo (navegación) Galileo (SAR) GLONASS GPS


Figura 8.2: Portadoras en banda L de los 3 sistemas GNSS.

La constelación GALILEO utilizará 10 señales multiplexadas según el sistema CDMA


sobre portadoras en las bandas E5a, E5b, E6, en banda L inferior, y E2-L1-E1, en la
banda L superior (ver; Hein et al., 2002). La selección de estas bandas asegura
compatibilidad en la recepción con los sistemas GPS y GLONASS. En particular, como
se advierte en la Figura 8.2, GALILEO comparte con GLONASS y GPS las frecuencias
centrales E5a/L5 y L1 y con GLONASS la subanda E5b.

La Tabla 8.2 resume las principales características previstas para la señales de


GALILEO (no todas tienen ya definida la velocidad de trasmisión de datos) que

*
El satélite SVN49 del Bloque IIR-M lanzado en marzo de 2009 es el primero en trasmitir en la
frecuencia L5 en forma experimental. Se prevé una constelación operativa en L5 para 2018.

155
conllevarán 5 tipos de datos: a) de navegación, b) de integridad, c) comerciales, d)
señales reguladas por el poder público (PRS: Public Regulated Service) y e) del servicio
de búsqueda y rescate o SAR (Search And Rescue). Esta última banda es una novedad
del sistema GALILEO y está dedicada a la emisión de datos sobre situaciones de
emergencias a los operadores de este servicio. Las señales destinadas a los servicios
comerciales (CS) y PRS son de acceso restringido y estarán encriptadas, mientras que el
resto serán de acceso libre (OS: Open Service))). El sistema ofrecerá datos de
navegación OS y SOL en 6 señales, incluyendo 3 “portadoras piloto” sin datos*, sobre
las bandas E5a/L5 y L1.

Señal Banda Chip rate Encript. Usuario


1 E5a1 10Mcps No OS
2 E5a2 10Mcps Piloto OS
3 E5b1 10Mcps No OS/CS/SoL
4 E5b2 10Mcps Piloto OS
5 E6a 5Mcps Si PRS
6 E6b 5Mcps Si CS
7 E6c 5Mcps Piloto OS
8 L1a mMcps Si PRS
9 L1b 2Mcps No OS/CS/SoL
10 L1c 2Mcps No OS/CS/SoL
Tabla 8.2: Características y usuarios de las bandas de GALILEO.

8.1.2 El segmento terreno


El segmento terreno o segmento de control de un sistema GNSS es el conjunto de
estaciones, instalaciones y equipo destinado a monitorear la salud del segmento espacial
y asegurar el rastreo, la telemetría, el comando y control de cada satélite. También
queda bajo su autoridad la determinación del tiempo global del sistema, la
sincronización de los relojes de los segmentos espacial y terreno, el cálculo de las
correcciones de tiempo y de efemérides, la determinación de los parámetros de
propagación y el enlace de datos hacia el segmento espacial. Un conjunto de estaciones
de referencia de posiciones conocidas con alta precisión rastrea los satélites visibles y
reenvía sus señales a un centro de cómputo que calcula las efemérides y el error del
reloj atómico abordo de cada satélite. Estos datos son luego transmitidos a las
estaciones terrenas de enlace las que a su vez los suben a la constelación para luego ser
incorporados al mensaje de navegación modulado sobre la señal que recibe el usuario.

Posiblemente la principal fuente de errores en la determinación del tiempo de


propagación proviene de la capa ionosférica de la Tierra que introduce un retraso en la
velocidad de grupo de la señal (ver más adelante). Como la profundidad e intensidad de
la ionósfera varían con la hora del día, la latitud y la actividad solar†, una función del
segmento terreno es actualizar los parámetros de un modelo del contenido electrónico
de esta capa. El sistema GPS utiliza el modelo de Klobuchar (ver Parkinson/ Spilker,
1996, Vol. 1, ch.12, p.485-514) que corrige hasta un 60% del retraso ionosférico. Los

*
Las portadoras piloto facilitan el rastreo y la medición de la distancia al satélite emisor por parte del
receptor.

Como veremos en el próximo capitulo sus efectos pueden ser paliados si cada satélite emite en más de
una frecuencia y el receptor está capacitado para recibirlas.

156
parámetros del modelo ionosférico son subidos a la constelación y posteriormente
difundidos por vía del mensaje de navegación.

La precisión con la cual es posible corregir los errores del segmento espacial (incluido
el retraso ionosférico) depende de la densidad de estaciones de rastreo, de la cantidad de
estaciones de referencia que ve cada satélite en un dado instante y de la frecuencia de
renovación de estos datos por parte del segmento de control. Por este motivo, el nuevo
programa de modernización del segmento terreno del sistema GPS, acordado en
septiembre de 2007 elevó a 11 las estaciones de monitoreo MS (Monitor Station),
agregando a las 5 originales manejadas por la USAF, localizadas en Hawaii, Colorado
Springs, las islas Ascensión (Atlántico Sur), Diego García (Indico Sur) y Kwajalein
(Pacífico Norte), las recientes 6 administradas por la agencia NIMA (National Imagery
and Mapping Agency) y localizadas en: Washington, DC, Inglaterra, Argentina,
Ecuador, Arabia Saudita y Australia. También prevé a mediano plazo la incorporación
de 5 nuevas estaciones más. Asimismo, a la estación de control central MCS (Master
Control Station) en Colorado Springs se agregó la MCS en Gaithersburg, Maryland. La
actual red de estaciones MS de GPS asegura la visibilidad desde cada satélite de al
menos 2 MS el 100% del tiempo (Yinger, et.al., 2003). Las 3 antenas de subida de datos
(GA: Ground Antenna) ubicadas, respectivamente, en Ascensión, Diego García y
Kwajalein actualizan los parámetros orbitales de la efemérides de los satélites y sus
respectivos relojes atómicos (con precisión de nanosegundos) al menos una vez por día.
Estos datos son incorporados al mensaje de navegación incluido en la señal trasmitida
desde cada satélite. Con la sustitución de la actual constelación por las nuevas
generaciones de satélites: Block IIR/IIF, el segmento espacial dispondrá de la
funcionalidad de auto-navegación relativa, lo que permitirá actualizar con mayor
frecuencia los parámetros del mensaje prescindiendo del segmento terreno, que, de
todos modos, seguirá asegurando la supervisión a largo plazo de los parámetros del
mensaje de navegación.

El segmento terreno de GLONASS ocupa actualmente el interior del territorio de la


antigua URSS y consiste de 9 estaciones MS, 3 estaciones de enlace (GA), 4 de rastreo,
telemetría y control y su MCS cercana a Moscú. El programa de modernización
anunciado en 2008 prevé la instalación de nuevas estaciones MS fuera del territorio ruso
lo que permitirá mejorar la trazabilidad de la constelación y reducir el período de
actualización de las correcciones a bordo. Esto representará un avance significativo
teniendo en cuenta que actualmente un satélite podría emitir datos erróneos durante 6hs.
sin ser detectado. Mediante estas mejoras se espera que para 2012 GLONASS disponga
de una precisión de tiempo y de determinación orbital similares a las de GPS.

El segmento terreno del sistema GALILEO estará conformado por dos subsistemas: el
GCS (Ground Control Segment) y el GMS (Ground Mission Segment). El GCS
dispondrá de una red global de 5 estaciones TTC (Telemetry Tracking and Control) para
el mantenimiento, control orbital, supervisión paramétrica y salud de los satélites. El
GMS se apoyará en una red global de 30 estaciones GSS (Galileo Sensor Stations)
equipadas con receptores de referencia dedicadas al monitoreo continuo de las señales
en el espacio (SIS) emitidas por la constelación. Mediante esta red el GMS realiza la
determinación orbitográfica y la sincronía de tiempos (ODTS: Orbitography
Determination and Time Synchronization) incluyendo el cálculo de los desfasajes de los
relojes y la predicción de sus derivas, resultados que serán retransmitidos a la
constelación a intervalos de 100 minutos. Asimismo el GMS calculará la función de

157
integridad de la señal de cada satélite luego traducida en mensajes de alerta difundidos
por la constelación asegurando que el intervalo entre la detección de una falla y su
notificación al usuario TTA (Time to Alert) sea inferior a 6 segs. Cinco estaciones
globales de enlace ULS (Up-Link-Stations) permitirán la comunicación del segmento
terreno con el segmento espacial.

8.2 Características de la señal GPS

Como se mencionó más arriba, actualmente el sistema GPS trasmite en forma operativa
en dos portadoras. Las frecuencias de ambas portadoras son múltiplos enteros
coherentes de la frecuencia del reloj atómico estándar a bordo de cada satélite de
10,23Mhz de tal modo que:

f L1  154  10, 23MHz  1575,42MHz


(8.1)
f L 2  120  10, 23MHz  1227,60MHz

El sistema ofrece dos servicios básicos: el SPS (Standard Positioning Service) y el PPS
(Precise Positioning Service). Ambos utilizan multiplexado de tipo CDMA, el primero
con código C/A y el segundo con código P(Y). Ambos códigos se montan sobre las
portadoras usando modulación de tipo BPSK (Binary Phase Shift Keying) que consiste
en rotar en 180º la fase de la portadora cada vez que hay un cambio de estado en la señal
trasmitida lo que permite distinguir entre dos estados. Las tasas de cambio de estado
(chip-rate) están sincronizados con el reloj atómico de referencia que para el código
C/A es de 1,023MHz y para el código P(Y) es de 10,23MHz. Cada satélite tiene
asignada una secuencia de bits (+1 ó -1) única para ambos códigos de ambos servicios.
El código C/A del servicio SPS utiliza secuencias binarias pseudoaleatorias (PRBS)
lineales de longitud máxima N=1023 bits ancho de pulso Tc=1/1,023 nanoseg.y
duración total igual a 1ms. Estas secuencias son de tipo “Gold” caracterizadas por ser
estadísticamente cuasi ortogonales bajo la operación binaria de correlación cruzada
(Gold, 1967). Esto permite discriminar fácilmente entre dos secuencias distintas. Por su
parte, el PPS codifica la señal con secuencias PRBS no-lineales, llamadas P-code, de
gran longitud (N1014) y ancho de pulso Tp=1/10,23 nanoseg. reiniciadas al principio
de cada semana. Desde su inicio en 1994, este código es usado en su forma encriptada
Y-code con el fin de limitar su uso sólo a usuarios autorizados.

La Figura 8.3 demuestra la jerarquía en los procesos de modulación de las señales GPS.
El nivel del bit del dato de navegación es sumado modulo-2 al correspondiente nivel del
bit de la secuencia del código C/A ó P(Y) según el caso. Esta operación aprovecha el
hecho de que los chip rates de ambos códigos son múltiplos enteros del bit rate (tasa de
bits por unidad de tiempo) de los datos de 50Hz. De este modo, con una longitud
Td=20mseg. cada bit de datos recubre un numero entero de bits de cualquiera de los dos
códigos correspondiendo, respectivamente, a 20 secuencias PRBS completas del código
C/A y 2x105 bits del código P(Y). El nivel resultante de la primera operación binaria
modula en BPSK la componente en cuadratura de la portadora L1, mientras que el
resultado de la segunda operación modula las componentes en fase, tanto de la
portadora L1 como de la L2. Así, la portadora L1 es modulada por ambos códigos (en
fase y en cuadratura), mientras que la L2 está dedicada exclusivamente al código P(Y).

158
La administración del sistema puede decidir no modular con datos al código P(Y)
montado sobre una u otra portadora.

Portadora L1 1575.42 
90
Código C/A 1.023 MHz Señal L1

Datos nav. @ 50 Hz Suma


Módulo-2
Código P(Y) 10.23 MHz

Señal L2
Portadora L2 1227.6 MHz

Figura 8.3: Esquema de modulación de las señales en el espacio de GPS.

La modulación de la portadora con una PRBS distribuye la potencia de la señal,


originalmente contenida en una pequeña banda (50Hz en este caso), sobre una banda
mucho mayor centrada en la portadora que, en el caso del código C/A, es de 2Mhz y en
el caso de código P(Y) es de 20MHz (dos veces el ancho de banda del chip rate). Esta
tecnología es conocida con el nombre de expansión del espectro de la señal (spread
spectrum en inglés). La potencia de estas señales en un punto cercano a la superficie
terrestre es extremadamente baja. En promedio, para el código C/A unos: -160dBW,
para el código P(Y) en L1: -163dBW y -166dBW para el código P(Y) en L2.

Td Tc
Bits de datos
Código
modulado c/datos
Código PRBS
Portadora
Portadora
modulada
Figura 8.4: Modulación BPSK de la portadora GPS.

La señal de espectro expandido en la antena del satélite i de la constelación GPS se


describe matemáticamente como:

s i (t )  2Wc Di (t )CAi (t ) sen(2f1  1i )  2WP1 Di (t ) Pi (t )cos (2f1  1i ) 


(8.2)
 2WP2 Di (t ) P i (t )cos (2f 2  i2 )

Donde: Wc , WP1 y WP2 son, respectivamente, las potencias promedio de las señales
transportadas por el código C/A sobre la frecuencia f1 (L1) y por el código P(Y),
respectivamente, sobre f1 y f2 (L2); Di (t ) (=1) es la secuencia de bits de los datos del
mensaje trasmitido por el satélite i; CAi (t ) (=1) es la secuencia PRBS del código C/A

159
que además de expandir el espectro identifica al satélite i; Pi (t ) (=1) es la
correspondiente al código P(Y); 1i y i2 son las fases indeterminadas (ambiguas y no
coherentes entre sí) de las respectivas portadoras.

La Figura 8.4 muestra esquemáticamente en su parte inferior la forma de onda resultante


del esquema de modulación indicado en la Figura 8.3 con varios bits del código C/A de
longitud Tc y un bit de datos de longitud Td recubriendo un cierto número entero de bits
de código.

8.3 El receptor GPS

El receptor GPS recibe superpuestas las señales de espectro expandido (CDMA),


emitidas por los satélites con línea de vista, sumadas al ruido ambiental y a
interferencias de diverso origen, tales como: ruido electrónico, emisiones térmicas de
origen terrestre, atmosférico y astronómico, señales GPS reflejadas e interferencia
humana deliberada o accidental. En condiciones de recepción estándar, la potencia de
señal en el receptor comparada con la del ruido total, resulta, para la señal C/A, en una
relación señal ruido (S/NC) en la banda base (~2MHz.) de entre -18dB y -26dB
(dependiendo del ángulo de elevación de la línea de propagación). Para la señal P(Y)
esta relación se deteriora aproximadamente en la misma proporción en que aumenta el
ancho de la banda base, es decir en un factor 10.

Como se advierte, el desafío del diseño de un receptor GPS reside en extraer la


información desde el fondo de un ruido con niveles de potencia hasta 3 ordenes de
magnitud superior a la señal! Lo que hace posible abordar este desafío es el hecho de
que la señal emitida por un dado satélite es, en un cierto sentido que comentaremos,
incoherente con todas las perturbaciones, incluidas las señales emitidas por los otros
satélites de la constelación.

La portadora de cada satélite llega al receptor con un desplazamiento en frecuencia que


le es propio causado por su velocidad radial relativa al receptor (efecto Doppler). Para
un vehículo atmosférico este desplazamiento, sumado a la deriva del oscilador local
(común para todas las señales), puede alcanzar los ±10Khz. En vehículos espaciales
(cohetes o satélites) el desplazamiento total en frecuencia puede llegar hasta ±20Khz.
Con el fin de simplificar la exposición sólo consideramos la modulación con código
C/A. En este caso, la antena del receptor recibe la siguiente superposición de señales
provenientes de la constelación visible:

K
s (t )   s i (t )  n(t ); K  nº de satelites visibles.
i 1 (8.3)
s i (t )  2W i Di (t  i )CAi (t  i ) sen(2( f1  f Di )t  1i ); i  1,..., K

Donde: n(t) es el ruido aditivo en el receptor independiente de las señales involucradas,


i el tiempo de propagación desde el satélite i al receptor, f Di el desvío Doppler,
1i  [0, 2) la fase de la señal en la antena del receptor y Wi la potencia promedio de la
señal captada por la antena.

160
En la etapa de RF del receptor, la señal s(t) es amplificada por un amplificador de bajo
ruido, luego filtrada para eliminar el ruido fuera de banda base y, clásicamente, reducida
en frecuencia mezclándola con la señal de frecuencia intermedia fIF:

sIF (t )  2 sen(2( f1  f IF )t   IF ) (8.4)

La fase  IF es independiente (no es coherente con) de la fase de las señales que llegan a
la antena del receptor. A la salida del mezclador, la señal es nuevamente filtrada con un
filtro pasabanda de 20 a 30Mhz de ancho centrado en fIF. El resultado es una señal,
imagen de la señal (8.3), trasladada en frecuencia, tal como:

K
y (t )   y i (t )  n(t ); K  nº de satelites visibles.
i 1 (8.5)
y i (t )  W i Di (t  i )CAi (t  i ) sen(2( f Di  f IF )t  i ); i  1,..., K

En esta ecuación, n(t ) es la imagen del ruido de recepción en la banda pasante del
filtro. Dado que en esta banda la señal y el ruido son amplificados igualmente, esta
operación preserva la relación señal ruido en la banda base. La fase
i  1i   IF   PB , donde  PB incluye la fase que agrega el filtro pasa-banda y los
retardos de línea que, igual que  IF , no dependen del satélite.

Resta aún por extraer de y(t) la información crucial requerida por el receptor para
resolver la navegación, a saber: a) el código CAi (t ) que determina el único satélite que
lo usa, b) i : el tiempo de transito entre el satélite i y el receptor (medida de la distancia
radial), c) f Di : el desplazamiento Doppler (medida de su velocidad radial), d) Di(t): la
cadena de bits de datos que contiene el mensaje emitido por el satélite i, e) la fase
i que, cuando está disponible, permite el posicionamiento de alta precisión mediante
métodos de interferometría. Esta información se determina numéricamente a partir de la
señal digitalizada a la salida de la etapa de RF* (Ec.(8.5)) y que denotamos:

K
yk   yki  nk (8.6)
i 1

yki  W i Di (kTs  i )CAi (kTs  i ) sen(2( f Di  f IF )kTs  i ) (8.7)

Donde TS es el período de muestreo, yk  y (kTs ) , yki  y i (kTs ) . El procedimiento


numérico se resume en las etapas indicadas más abajo y cuyos detalles, así como los
principios de diseño de los receptores modernos, pueden consultase en Kaplan/Hegarty,
2006, Misra/Enge, 2006 ó Parkinson/Spilker, 1996:

*
Incluye la antena, amplificador de bajo ruido, supresión de portadora, rechazo de imagen y filtrado.

161
8.3.1 Adquisición de la señal
Consiste en una búsqueda en el espacio de todos los posibles valores de  y f D para
cada código CAi (t ) de los satélites visibles. Cuando el receptor no tiene ninguna
información de su tiempo y posición (y por tanto de la constelación visible) el proceso
de búsqueda puede tomar varios minutos y es denominado “arranque en frío”. La
búsqueda se efectúa correlacionando la secuencia {yk} con las señales complejas
generadas internamente por el receptor para cada código CAi de cada satélite
potencialmente visible:

xk (ˆ i , fˆDi )  CAi (kTs  ˆ i ) exp( j (2( fˆDi  f IF )kTs )); i  1,..., K (8.8)

xk (ˆ i , fˆDi ) ˆ i , fˆDi

yk 1 N
 ()  R(ˆ i , fˆDi )
N k 1
i f Di
R(ˆ , fˆDi ) exp( ji )
i

Figura 8.5: Esquema de lazo de búsqueda para la adquisición de la componente yki .

El método de búsqueda se fundamenta en varios resultados conocidos de la teoría de


señales (ver p.e.: Kaplan/Hegarty, 2006, Misra/Enge, 2006 ó Parkinson/Spilker, 1996),
a saber: a) la descorrelación (incoherencia) temporal entre secuencias Gold de máxima
longitud; b) la descorrelación temporal entre señales senoidales de distinta frecuencia y
entre cada una de ellas y el ruido aleatorio de fondo, y c) la cuasi-descorrelación
temporal entre versiones desplazadas en el tiempo de una misma secuencia Gold. De
este modo, para cada código CAi, el módulo R( , f D ) de la correlación compleja
evaluada sobre los puntos del plano ( , f D ) alcanza picos de amplitud precisamente
sobre cada par ( i , f Di ) de las señales proveniente de cada satélite i (ver Fig. 8.5). Este
principio es la base de todos los algoritmos de búsqueda de satélites visibles y de la
determinación de los parámetros i , f Di de la señal correspondiente a cada uno de ellos.
Dado que R(, f D ) no depende de la fase i , el proceso de adquisición no requiere
determinar este último parámetro.

8.3.2 Sintonía y rastreo de la señal


Luego de una adquisición global se inicia el proceso de sintonía canal por canal (código
por código), consistente en la determinación fina (con la mayor precisión posible) y
consiguiente rastreo en tiempo real del par ˆ i , fˆDi para cada satélite visible. Esto se
realiza vía sendos lazos de sincronía denominados Delay Lock Loop (DLL) y Phase
Lock Loop (PLL). El primero sincroniza el código del satélite con el generado por el
receptor y el segundo, permite el seguimiento de la fase i y de la frecuencia de la
portadora desplazada por el efecto Doppler. El inicio del seguimiento de la fase es
comúnmente denominado “enganche” o instante de phase lock.

162
8.3.3 Demodulación del tren de bit de datos
Una vez asegurados la sintonía y el rastreo de los valores instantáneos de los parámetros
i , f Di de la señal discreta yki de cada satélite, recién entonces es posible demodular el
tren de pulsos de datos y leer los parámetros del mensaje, para lo cual debe asegurarse
el rastreo de la señal durante la duración total del mismo.

Dada la señal compleja generada internamente con los valores i , f Di en función de la


fase estimada ˆ i :

i
sDk  2 exp( j (2( f Di  f IF )kTs  ˆ í )) 
(8.9)
 2 cos(2( f Di  f IF )kTs  ˆ í )  j 2sen(2( f Di  f IF )kTs  ˆ í )

consideramos el producto de señales (ver Fig. 8.6):

K
i
yk sDk CAi (kTs   )   sDk
i i
CAi (kTs  i ) ykj  sDk
i
CAi (kTs  i )nk (8.10)
j 1

Los términos complejos de la sumatoria tienen por componentes real e imaginaria,


respectivamente, los productos.

2W i D j (kTs   j )CAi (kTs  i )CA j (kTs   j )


cos(2( f Di  f IF )kTs  ˆ i ) sen(2( f Dj  f IF )kTs   j ) 
(8.11)
 W i / 2 D j (kTs   j )CAi (kTs  i )CA j (kTs   j )
 sen(2( f Di  f Dj )kTs  ij )  sen(2( f Di  f Dj  f IF )kTs   j  ˆ i ) 
 

2W i D j (kTs   j )CAi (kTs  i )CA j (kTs   j )


sen(2( f Di  f IF )kTs  ˆ i ) sen(2( f Di  f IF )kTs   j ) 
(8.12)
 W i / 2 D j (kTs   j )CAi (kTs  i )CA j ( kTs   j )
cos(2( f Di  f Dj )kTs  ij )  cos(2( f Di  f Dj  f IF )kTs   j  ˆ i ) 
 

Donde se introdujo: ij  ˆ i   j . Teniendo en cuenta que CAi (kTs  i ) 2  1, k ,


cuando la señal (8.10) es filtrada numéricamente para retener solamente la banda base
de los datos, los términos remanentes de los (8.11) y (8.12) son aquellos tales que i=j
(idéntico código y Doppler) más la fracción de ruido presente en esta banda.

De este modo se suprimen tanto el código como la portadora intermedia dando como
resultado las señales en fase y cuadratura:

S I (k )  Di (k ) cos(ii )
(8.13)
SQ (k )  Di (k ) sen(ii )

163
En un lazo de Costas (ver p.e. Parkinson/Spilker, 1996) como el mostrado
esquemáticamente en la Figura 8.6, la fase ˆ i es manipulada numéricamente para
reducir el ángulo ii a la salida del discriminador, concentrando así la energía de
salida sobre la señal en fase SI(k), de modo que esta última señal da el signo del bit de
datos actual.

CAi (kTs  i )
S I (k )  D i (k ) cos(ii )
Re(.)
yk
Filtro pasa
bajos
SQ (k )  Di (k ) sen(ii )
i
sDk (ˆ i ) Im(.)

Control de ii
ˆi
la fase 
tg1(SQ / SI )

Figura 8.6: Lazo de Costas y demodulación de los bits de datos del satélite i.

El lazo de la figura, denominado Phase Lock Loop (PLL), permite el seguimiento de la


fase i y es de gran importancia en la navegación de alta precisión. El tiempo de inicio
de esta etapa es denominado instante de “enganche”

La Figura 8.7 resume los procesos al interior de un receptor GPS. En ella se muestra en
forma esquemática el tratamiento en paralelo de cada canal de datos caracterizado por
su código CDMA específico.

H/W Correladores S/W de


s(t) analógico. y numéricos yk navegación
y(t
Etapa de ) Converc. Adquisi- Canal 1 Cálculo
RF A/D ción Canal 2 de Pos. y
Canal 3
Parámetro Canal … Vel
s  i , f Di Canal K

Figura 8.7: Esquema simplificado de un receptor GPS.

8.3.4 Contenido del mensaje GPS


Cada satélite GPS trasmite datos que le son propios y datos globales de la constelación.
El primer conjunto de datos contiene: a) los parámetros orbitales del satélite y sus
derivadas temporales para permitir localizarlo en el instante de trasmisión y b) una
estimación del desvío del reloj abordo respecto del tiempo global GPS y de su derivada
temporal. Estos datos, requeridos para el cálculo de la posición y de la velocidad, son
denominados de navegación y actualizados cada 30seg, siendo ésta la tasa más alta de
renovación de información en el mensaje. El segundo grupo de datos contiene
información relativa al estado de la constelación en su conjunto y a las condiciones de

164
propagación de las señales. Incluye los parámetros del modelo ionosférico*, la salud y
estado de cada satélite, el número de la semana y el “almanaque”. Este último es un
conjunto de datos de efemérides de baja precisión de toda la constelación actualizados
una vez por semana. El almanaque permite al receptor saber que satélites están visibles
o cuando aparecerán sobre el horizonte con sólo adquirir la señal de uno de ellos.

Estructura de la trama del mensaje GPS


La trama del mensaje esta organizada en grupos (frames) de 5 palabras (subframes) de
300 bits de longitud cada una. A 50bps la duración de cada palabra es de 6seg y la de un
frame de 30seg. El mensaje completo toma 25 frames lo que totaliza una duración de
12,5min. Los primeros 3 subframes de cada frame contienen la misma información
específica del satélite (corrección de tiempo y de efemérides, ver Figura 8.8) actualizada
en el receptor cada 30seg. Los subframes 4 y 5 de cada frame contienen información
que es común a todos los satélites y constituyen las páginas del mensaje que se
completará en 25 frames. Estas páginas contienen los parámetros del modelo
ionosférico, el almanaque y el estado de salud de la constelación. Los primeros dos
módulos de cada palabra tienen un significado especial. El módulo TLM (telemetry
word) contiene un patrón fijo de 8 bits de sincronía que indica el inicio de cada palabra.
Cada módulo HOW (hand-over word) contiene el tiempo de inicio de la palabra
siguiente en módulos de 6 seg según el reloj del satélite. Esta información es crucial
para la navegación, ya que constituye la base de tiempo que usa el receptor para calcular
el instante de emisión de la señal.

Tiempo en Correcciones del reloj + salud y precisión


minutos Parámetros orbitales/ efemérides

Correcciones del reloj + salud y precisión

Parámetros orbitales /efemérides


Tiempo Parámetros orbitales/ efemérides
en
segundo Almanaque, modelo ionosférico

Almanaque

Figura 8.8: Estructura del mensaje GPS.

8.3.5 Mediciones de un receptor GPS

Por cada satélite visible, un receptor GPS puede realizar tres mediciones directas. El
pseudo-rango, basado en el código PRBS específico para cada satélite, la fase de la

*
Modelo de Klobuchard (Parkinson/Spilker, 1996).

165
portadora y su velocidad radial relativa al satélite. El modelo matemático de estas
mediciones, llamadas observables, requiere tener en cuenta la existencia de 3 escalas de
tiempo simultáneas, cada una de ellas asociadas a un reloj independiente (ver Fig, 8.9).
Llamaremos: tg al tiempo global de la constelación que, por ser el más preciso, lo
equiparamos al tiempo absoluto t (ºtg); ts(t) al tiempo indicado por el reloj del satélite
en el instante t y tu(t) al tiempo indicado por el reloj del receptor (usuario) en el mismo
instante (ver Fig. 8.9 a). Los desvíos instantáneos respecto del “tiempo absoluto” de los
tiempos indicados por los relojes se definen como:

ts (t )  ts (t )  t
(8.14)
tu (t )  tu (t )  t

La señal que abandona la antena del satélite en el instante de trasmisión tt llega a la


antena del receptor en el instante de recepción tr. Sin embargo, según el reloj del
satélite, la trasmisión se efectúa en el instante ts (t t )  t t  ts y, según el reloj del
usuario, el instante de recepción es: tu (t r )  t r  tu (ver Fig. 8.9 b)).

a) 0
tg(t) t=tg
ts ts
tu ts(t)
tu
tu(t)
0 tt ts tu
tr t=tg
b)
ts(tt)=tt+ts ts

tu
tu(t )=tr+t
r

Figura 8.9: Escalas de tiempo del sistema GPS

De este modo, mientras que el tiempo “real” de propagación de la señal es us  t r  t t ,


según los relojes involucrados dicho intervalo es:

ˆ us  tu (t r )  ts (t t )  us  tu (t r )  ts (t t ) (8.15)

Efectos atmosféricos
En los más de 20.000Km de su trayectoria a la Tierra la señal GPS atraviesa medios
atmosféricos con diversos índices de refracción que afectan su fase y velocidad de
propagación instantáneas. En algún punto entre los 1000 y 600Km de altura entra en la
ionosfera y mucho más cerca, en los últimos 50Km, inicia su tránsito por la troposfera.
Estas dos capas de la atmósfera son las que más afectan la propagación e inciden de
modo tal en el tiempo total de propagación que resulta imprescindible tenerlas en cuenta
en un modelo de las mediciones GPS. El efecto de ambas capas es claramente diferente
tanto cuantitativa como cualitativamente y por ende convendrá distinguirlos.

166
La ionosfera, considerada como un plasma iónico anisotrópico e inhomogéneo de
densidad electrónica variante con el tiempo y el espacio, induce un efecto dispersivo
sobre la señal. En medios dispersivos el índice de refracción varía con la frecuencia de
la onda electromagnética. Así, al atravesar tal medio una portadora modulada por una
banda base de ancho no nulo ve afectada diferencialmente las velocidades y las fases de
sus componentes frecuenciales. El resultado es que la portadora viaja a una velocidad vf,
llamada velocidad de fase, distinta a la de la envolvente de modulación vg, llamada
velocidad de grupo, con la que se propaga la información montada sobre la portadora
que, en el caso de la señal GPS corresponde al código PRBS de cada satélite. La
relación teórica entre estas velocidades queda expresada mediante la siguiente fórmula
(Misra/Enge, 2006) que relaciona los correspondientes índices de refracción: nf=c/vf y
ng=c/vg.

dn f
ng  n f  f (8.16)
df

Para un plasma ideal, nf y ng admiten los siguientes modelos aproximados:

40.3e 40.3e
nf  1 2
 ng  1  (8.17)
f f2

Donde la segunda igualdad de las (8.17) se obtiene de la primera utilizando la (8.16) y


e es la densidad electrónica local del plasma. Claramente, de las (8.17) resulta un
índice de refracción de fase menor que la unidad lo que implica una velocidad de fase
superior a la velocidad de la luz en el vacío. Por otra parte, la velocidad de grupo es
inferior a c, por lo cual, la recepción del código montado sobre la portadora se verá
retrasada con respecto de una onda que viaje en el vacío, en el lapso de tiempo:
usuario usuario usuario
1 1 1 40.3 40.3
I us ( f )  
satelite
(  )dl 
vg c 
c satelite
(1  ng )dl  2  e dl  2 TECus
cf satelite cf
(8.18)

Donde TECus (total electron count) es el n° total de electrones dentro de un “tubo” de


1m2 de sección transversal que contiene la trayectoria de la onda en la ionosfera. El
retraso I us se corresponde con un aumento aparente de la distancia satélite usuario que,
en la dirección zenital, es del orden de los 2m a 10m. Un razonamiento análogo usando
la 1ª de las (8.17) demuestra que el frente de la portadora anticipa su llegada a la antena
respecto de su propagación en el vacío en el mismo lapso I us . Como veremos más
adelante, este aspecto deriva en una diferencia significativa entre los modelos de las
mediciones del pseudo-rango y de la fase. Como ya se dijo, el sistema GPS trasmite en
el mensaje los parámetros del modelo de Klobuchard. Esto permite corregir hasta un
60% del error ionosférico en el receptor (el sistema GALILEO prevé usar un modelo
más preciso).

Por su parte, la troposfera es un medio esencialmente neutro cuyo índice de refracción


es prácticamente invariante con la frecuencia, moderadamente estable con el tiempo y

167
ligeramente superior a la unidad*, lo que se traduce en una reducción de la velocidad de
propagación y por ende en un alargamiento aparente de la distancia satélite-usuario que
oscila entre los 2,5m y 25m dependiendo de la elevación del satélite. Existe una
variedad de modelos del retraso troposférico de la señal GPS que difieren en sus
hipótesis y suposiciones básicas acerca de los perfiles estándar en altura de la
temperatura y la humedad a la latitud del lugar. Sin embargo, el sistema GPS no provee
ninguna información sobre los parámetros de estos modelos por lo que, si fuera
requerido, el usuario debe implementar su propio modelo con base en datos de la
atmósfera local. Al igual que con el retraso/adelanto ionosférico, la oblicuidad de la
línea de vista al satélite determina la longitud del rayo dentro del medio y por tanto debe
ser tenida en cuenta en los modelos respectivos.

8.4 Medición del pseudo-rango con código

Utilizando el valor del instante de trasmisión (según el reloj del satélite) “estampado” en
la señal y el tiempo de recepción de ésta, establecido por el reloj del receptor, este
último determina su pseudo-rango us respecto del satélite definido como la medición
del tiempo de propagación ˆ us multiplicada por la velocidad de la luz en el vacío c.

us  c(tu (t r )  ts (t t ))  " errores de medición " (8.19)

En los errores de medición se incluyen, por un lado, los errores aleatorios s en la
determinación de los tiempos tu (t r ) y ts (t t ) y, por otro, los inducidos por perturbaciones
debidas a reflexiones espurias de la señal antes de llegar a la antena del receptor. Estas
reflexiones conocidas como efecto “multipasos”, dependen de la topología local y de la
dirección de propagación e interfieren la recepción sobre el camino directo de la señal.
En función del tiempo real de propagación y teniendo en cuenta el error s y el efecto
multipasos que denotamos cM us , la (8.19) se rescribe:

us  cus  c(tu (t r )  ts (t t ))  cM us  s (8.20)

El tiempo us se relaciona con la distancia geométrica en línea recta


Rus (P s , Pu )  P s  Pu entre el satélite ubicado en P s y el usuario en Pu † mediante:

us  Rus / c  I us  Tus  H ; (8.21)

En la cual se destacan las componentes ionosférica y troposférica del retraso


atmosférico y el retraso electrónico H. Con las definiciones anteriores, el modelo del
pseudo-rango se escribe:

us  Rus (P s , Pu )  c( I us  Tus )  c(tu (t r )  H  ts (t t ))  cM us  s (8.22)

*
Al nivel del mar el índice es n1.0003 y mucho más cercano a la unidad por encima de los 10Km.

Si no se indica otra cosa, las posiciones y velocidades en este capítulo están expresadas en terna ECEF,
estándar en los GNSS.

168
El retraso electrónico en el satélite es tenido en cuenta en el estampado del tiempo sobre
la señal por lo que su efecto residual es despreciable frente al retraso electrónico en el
receptor, así, en la práctica, H es asimilado totalmente a tu .

El receptor se posiciona respecto de la posición calculada de cada satélite cuyas


T
coordenadas a ECEF son: Pˆ s   Xˆ s Yˆ s Zˆ s  se determinan propagando hasta el instante
de trasmisión la última efemérides disponible. La diferencia entre Pˆ s y la posición real
P s induce un error Es en el pseudo-rango llamado error de efemérides definido
mediante:

Rus (P s , Pu )  Rus (Pˆ s , Pu )  E s (8.23)

Finalmente el modelo completo de la medición del pseudo-rango resulta:

us  Rus (Pˆ s , Pu )  E s  c( I us  Tus )  c(tu (t r )  ts (t t ))  cM us  s (8.24)

8.4.1 Posicionamiento estándar con un receptor GPS


En el sistema GPS se reconocen 3 métodos de posicionamiento:

 Estándard: usa 1 receptor, 1 portadora, 1 época, pseudo-rangos medidos con código.


 Diferencial: usa 2 receptores, 1 portadora, 1 época, pseudo-rangos medidos con
código.
 De alta precisión: incluye la medición de la fase de portadora.

La técnica estándar es la base de los servicios SPS y PPS (cada uno con una portadora y
un código propios) mencionados más arriba y es la que describimos en este capítulo
haciendo énfasis en su aplicación al servicio SPS sin restricciones de uso civil. Los
otros métodos pueden utilizar más de un receptor, más de una frecuencia, varias épocas
o instantes de medida y la medición de la fase de la portadora que como veremos resulta
mucho mas precisa. Para una descripción de estos métodos el lector puede consultar por
ejemplo Misra/Enge, 2006.

Se supondrá que en un instante t, el receptor dispone de s mediciones de pseudo rango


respecto de s satélites en vista dadas por:

iu (t )  Rui (Pˆ i , Pu )  ctu  spui  cM ui  i ; i  1,..., s (8.25)

Donde el término spui , llamado “error espacial y de propagación”, incluye términos de


error residuales no compensados provenientes del segmento espacial (desvío del reloj
del satélite y error de efemérides) y de la propagación en la atmósfera*.

spui  Eui  cTui  cI ui  cti (8.26)

*
El receptor puede compensar parcialmente los términos de spui usando los parámetros del modelo de
Klobuchard y las correcciones de efemérides y del reloj de cada satélite trasmitidas en el mensaje. Cabe
señalar que la precisión de estas correcciones se degradan con la antigüedad de dichos parámetros.

169
El método estándar define como error residual de medida al término ui  spui  cM ui   i
con lo cual las (8.25) se transforman en las siguientes s ecuaciones con 4 incógnitas: las
coordenadas de PuT   xu , yu , zu  en terna ECEF y el error del reloj del receptor tu .

iu (t )  Rui (Pˆ i , Pu )  ctu  ui  Pˆ i  Pu  ctu  ui 


1/ 2
(8.27)
  ( Xˆ i  xu ) 2  (Yˆ i  yu ) 2  ( Zˆ i  zu ) 2   ctu  ui ; i  1,..., s

Usando las medidas iu (t ) , el receptor calcula, mediante un método iterativo de tipo
Newton-Raphson, la solución que minimiza la suma de los cuadrados de los residuos de
las mediciones en cada instante t:

s 2
H (Pu , tu )   iu (t )  ( Rui (Pˆ s , Pu )  ctu )  (8.28)
i 1

Llamando  iu (Pu , tu )  Rui (Pˆ s , Pu )  ctu introducimos los siguientes vectores de s:

1u  1u   1u 


 2  2  2
 u   u  
ξu  ; ρu (t )  ; ρ u (Pu , tu )   u  (8.29)
     
 s  s  s
 u  u   u 

Con lo cual la (8.28) se rescribe:

2
H (Pu , tu )  ρu (t )  ρ u (Pu , tu ) (8.30)

Para estudiar la influencia de los errores residuales sobre el cálculo de Pu y tu ,


determinamos primeramente la matriz jacobiana del vector ρ u (Pu , tu ) respecto de las
incógnitas  xu , yu , zu , tu  . Usando:

 iu [( Xˆ i  xu ) 2  (Yˆ i  yu ) 2  ( Zˆ i  zu ) 2 ]1/ 2 ( Xˆ i  xu )


  s s ;
xu xu Ru (Pˆ , Pu )
 iu (Yˆ i  yu )
 ;
yu Rus (Pˆ s , Pu )
(8.31)
Rui ( Zˆ i  zu )
 ;
zu Rus (Pˆ s , Pu )
 iu
c
tu

170

Denotando con rui  (Pˆ i  Pu ) / Rus (Pˆ s , Pu ) al versor de línea de vista al satélite, es fácil
ver a partir de la (8.31) que dicho jacobiano resulta:

 (ru1 )T  c 
  
ρ u (Pu , tu ) (ru2 )T  c 
J    s 4 (8.32)
 ( xu yu zu tu )  ... 
 s T 
 (ru )  c 

Si (Pu* , tu* ) son los valores reales desconocidos buscados y (Pu , tu ) valores genéricos
suficientemente cercanos a dichos valores, entonces:

 P  2 2
ρ u (Pu , tu )  ρ u (Pu* , tu* )  J  u   o( Pu , tu ); (8.33)
tu 

Donde:
 xu 
Pu  Pu  Pu*  yu  ; tu  tu  tu* ; (8.34)
 zu 

Teniendo en cuenta que ρu (t ) = ρ u (Pu* , tu* ) + ξ u (t), sustituyendo (8.33) en (8.30) se


obtiene:

2
2  P  4
H (Pu , tu )  ρ u (Pu* , tu* )  ρ u (Pu , tu )  ξu (t)  J  u   ξu (t)  o( Pˆ i  Pu ) (8.35)
tu 

De este modo, despreciando términos de 4º orden en Pu y tu , la solución Pˆ u , tˆu


a la que idealmente convergerá el algoritmo de Newton Raphson y que minimiza
H (Pu , tu ) minimizará también el módulo al cuadrado:

2
 Pˆ u  Pu* 
J  *
  ξ u (t) (8.36)
tˆu  tu 

En el caso general para s4, la posición calculada se corresponderá con la solución de


mínimos cuadrados del problema lineal (8.36) dada por:

 Pˆ u  Pu*   Pˆ u   Pu* 
  =(J J ) J ξ u (t)    =  *  +(JT J ) 1 JT ξ u (t)
T 1 T
(8.37)
tˆu  tu 
ˆ *
 tu  tu 

En la solución anterior se pone de manifiesto la incidencia de los errores de medición


sobre el error de posicionamiento. Dicha incidencia queda determinada por la
pseudoinversa a la izquierda de J que, como se advierte de su definición, es función

171
exclusivamente de la geometría de la constelación visible (independiente de las
distancias). En particular, cuando las líneas de vista de los satélites se ubican próximos
a un único plano que pasa por el usuario, J tiende a ser deficiente en rango (con
columnas linealmente dependientes) y los errores de posicionamiento tienden a infinito.
Sin embargo, el diseño de las órbitas de la constelación es tal que esta posibilidad está
excluida para casi cualquier punto sobre la Tierra desde el cual resulten visibles 4 o más
satélites.

8.4.2 Precisión del posicionamiento estándar


Como ξ u (t) es un vector aleatorio, la solución (8.37) también lo es y su valor esperado
y matriz de covariancia resultan:

 Pˆ u   Pu* 
E{ }   *  + (J T J ) 1 J T E{ξ u } (8.38)
 tˆu   tu   
Sesgo de la estimación

P 
Q Pe ,t  cov(  u  )  (J T J ) 1 J T cov(ξ u )J (J T J ) 1   4 x 4 (8.39)
 tu 
u

De la (8.38) surge que si los errores de medida iu son segados la estimación de la
posición también lo será. Este es el caso en general, sin embargo, por convención, los
estándares de precisión se definen suponiendo esos errores insesgados además de
idénticamente distribuidos y de variancia constante u2 . Bajo estas suposiciones, el
estimador (8.38) resulta insesgado y su covariancia en coordenadas ECEF a partir de la
(8.39) es:

 g x 
 
1 2
Ge g y 
Q Pe , t  u ( J J )  u
2 T
; Q e  u2G e (8.40)
u  g z  P
 
 g x g y g z g  

Recordamos que en las ecuaciones (8.38) a (8.40) la posición está en coordenadas


ECEF. Usualmente, el receptor expresa la posición en coordenadas curvilíneas
geodésicas (,, h). Así mismo, resulta más intuitivo expresar los errores en
coordenadas LGV-ENU, para lo cual usando la MCD de rotación:

 C 0 S  
C    S S  C   S C  
g
e
 (8.41)
 C S  S  CC 

el error de posición y su matriz de covariancia son re-expresados según:

172
 E 
 N    P g  C g  P g 
  u e u

 U 
(8.42)
 g ee g en g eu 
2 
QPg  Ce Q Pe C g   u Ce G C g   u  g en g nn
g e 2 g e e
g nu 
 g eu g nu guu 

A partir de la covariancia Q P g se definen las distintas versiones de la llamada dilución


de la precisión (DOP) usadas para expresar la calidad del posicionamiento:

VDOP : Vertical Dilution of Precision  guu ;


TDOP : Time Dilution of Precision  g 
HDOP : Horizontal Dilution of Precision  g ee  g nn ;
PDOP : Position Dilution of Precision  g ee  g nn  guu ;
GDOP : Geometrical Dilution of Precision  g ee  g nn  guu  g  ;

Cada una de ellas representa el factor de incidencia de la geometría de la constelación


visible sobre el correspondiente DOP. Una buena distribución de los satélites en el
espacio se traduce en bajos valores de DOP, valores HDOP y VDOP <5 son
considerados aceptables.

Fuentes y presupuesto de errores en la medición de código:


Los errores residuales ui de la medición con código del pseudo rango tienen 3 orígenes
que conviene distinguir: a) el segmento espacial, b) el medio de propagación y c) el
receptor. Para un receptor de alta gama actual, los valores medios cuadráticos (rms) en
metros de los errores en la medición del pseudo-rango usando el código PRBS (ver
Figura 8.10) y la portadora L1 (1575,42Mhz) son:

 Segmento espacial: se


Error del reloj del satélite: cti  2m (rms)
Error de efemérides: Eui  2m (rms)

 Propagación: p
Retraso ionosférico del código cI ui :
Dirección zenital: 2-10m (rms), factor de oblicuidad: FO=1-390°-5°
Retraso troposférico del código cTui :
Dirección zenital: 2-3m (rms); factor de oblicuidad: FO=1-1090°-5°.

 Recepción: re
Ruido de medida c/código s  0.25-0.5m (rms).
Multi-pasos (ambiente libre) c/código cM ui  0.5-1m (rms).

173
Los valores rms de los errores de propagación son estimados sobre la vertical local. El
factor de oblicuidad (FO) es un multiplicador que tiene en cuenta el aumento de la
longitud del camino con el ángulo de incidencia en la capa atmosférica correspondiente.

Suponiendo independientes cada una de las fuentes, a partir de los valores indicados
arriba se obtiene la magnitud del error equivalente para el usuario URE (User
equivalent Range Error):

 se 2  4  2  8m;  p 2  8 a 100m ;  re 2  1, 25m 


(8.43)
 se     p    re   6 a 10m (rms )
2 2 2
 URE 

Suponiendo una distribución gaussiana de los errores, lo anterior significa un umbral


superior del error equivalente de entre 12 y 20m ( 2 URE ) en el 98% de los casos.

8.5 Modelo de la fase Doppler

Para la formulación del modelo de fase debe tenerse en cuenta que tanto en el satélite
como en el receptor, la potadora de frecuencia nominal fo es generada por un oscilador
que al mismo tiempo es el reloj que mide el tiempo. Así, si s y u son las fases en
ciclos, respectivamente, de la portadora del satélite y de su réplica en el receptor y si
[tuo , tu ] y [tso , ts ] son dos intervalos de tiempo medidos, respectivamente, por el reloj del
receptor y el del satélite, de la condición de oscilador-reloj para cada portadora resulta:

 u (tu )   u (tuo )  f o (tu  tuo )


(8.44)
 s (ts )   s (tso )  f o (ts  tso )

De donde se obtiene la identidad:

d s d u
  fo (8.45)
dts dtu

Dado que un evento ocurrido en el instante absoluto t ocurre, según cada reloj, en los
instantes ts (t )  t  ts (t ) y tu (t )  t  tu (t ) , (8.44) implica además:

 u (tu )   u (t  tu )   u (t )  f o tu


(8.46)
 s (ts )   s (t  ts )   s (t )  f o ts

Derivando las anteriores respecto del tiempo absoluto t, se tienen las frecuencias
“absolutas” de los respectivos osciladores-relojes:

174
d  u d  u dtu d tu
fu (t )    f o (1  )
dt dtu dt dt
(8.47)
d  s d  s dts d ts
f s (t )    f o (1  )
dt dts dt dt

De donde surgen las siguientes relaciones entre las frecuencias nominal y locales y las
derivadas respecto del tiempo absoluto (o derivas) de los desvíos temporales de los
relojes respectivos.

d tu f u  f o
Du (t )  
dt fo
(8.48)
d ts f  fo
Ds (t )   s
dt fo

Con base en las (8.44) definimos la fase total  us (tur ) [ciclos] a la diferencia entre la fase
de la portadora en el satélite en el instante de trasmisión tst (tiempo del satélite):
 s (tst ) [ciclos] y la fase de la portadora nominal replicada en el receptor en el instante
de recepción tur (tiempo del receptor):  u (tur ) [ciclos].

 us (tur )   u (tur )   s (tst ) [ciclos ] (8.49)

Introduciendo los desvíos temporales (8.14) de los respectivos relojes y el tiempo de


propagación us (t r )  t r  t t la anterior se rescribe como:

 us (tur )   u (t r  tu )   s (t r  us (t r )  tu ) [ciclos ] (8.50)

Y usando las condiciones de reloj-oscilador (8.46) la fase total en el instante de


recepción para el usuario resulta:

 us (tur )  us (t r )  f o us (t r )  f o (tu  ts ) [ciclos ] (8.51)

Donde además se introdujo la diferencia de fase sincrónica definida como:

us (t r )   u (t r )   s (t r ) (8.52)

A continuación se rescriben las condiciones (8.44) aplicadas el intervalo [t o , t r ] con t o


el tiempo absoluto de inicio del enganche:

f o (t r  t o )   u (t r )   u (t o )   s (t r )   s (t o ) (8.53)

Combinando las relaciones (8.52) y (8.53) se obtiene para la fase sincrónica:

us (t o )   u (t o )   s (t o )   u (t r )   s (t r )  us (t r ) (8.54)

175
Lo que demuestra que la diferencia de fase sincrónica se mantiene invariante en tanto se
verifique la condición de enganche de la portadora.

Los receptores diseñados para medir la fase total miden, en el instante de enganche tuo ,
solamente la fracción de ciclo (mantisa) de dicha fase que, junto con el modelo de
medición, se escriben:

us * (tuo )   us (tuo )  N us (tuo )  mantisa de la fase total


(8.55)
us (tuo )  us * (tuo )  [efectos no modelados]  us * (tuo )  f o mus  s

Donde N us (tuo ) es la parte entera de  us (tuo ) comúnmente llamada la ambigüedad entera


de la fase total. Los efectos no modelados de la medición incluyen el error de medición
 s y los errores asociados a las reflexiones espurias (efecto multipasos) que para el
observable de fase se denota como f o mus .

Fase de batido
us * (tur ); tur  tuo

Fracción de ciclo inicial

0
us * (tuo )   us (tuo )  N us (tuo ) tu
o
tu inicio del
u
“phase lock”
 us (tuo ) f
us *
“Ambigüedad” entera
Nus (tuo ) s

Diagrama de fasores
Figura 8.11: Evolución temporal de la fase de batido y diagrama de fasores.

A partir de tuo y en tanto el PLL mantenga enganchada la portadora con su réplica local,
el receptor mide continuamente la fase total  us (tur ) descontada de la ambigüedad entera
constante y desconocida N us (tuo ) . Esta magnitud, llamada comúnmente fase de batido,
fase Doppler o simplemente fase de portadora, representada pictóricamente en la Fig.
8.11, junto con su modelo de medida, se expresan matemáticamente como:

us * (tur )  us * (tuo )   us (tur )   us (tuo ); tur  tuo


  us (tur )  N us (tuo ) (8.56)
us (tur )  us * (tur )  f o mus (tur )   s (tur )

Claramente, de la definición de la fase total y la frecuencia de Doppler según el tiempo


de receptor se tiene:

176
d s r d s* r
f Ds   u (tu )  u (tu ) (8.57)
dtu dtu

Sin entrar en los detalles de diseño, diremos que para el seguimiento continuo de la fase
Doppler el receptor utiliza un contador interno que, según corresponda, se incrementa o
decrementa en una unidad cada vez que la fase pasa por “0” ó “1” (0 ó 2 en el
diagrama de fasores de la Fig. 8.11). Así, la medida us se compone de una parte entera,
almacenada en el contador, y una parte fraccionaria dada por la medición electrónica
instantánea de la diferencia de fases entre los fasores de ambas señales (ver figura). Al
momento de interrumpirse la condición de enganche, la cuenta de ciclos enteros deja de
tener validez. De reiniciarse el enganche, al nuevo período le corresponderá un nuevo
valor N us . Cuando una secuencia desenganche/re-enganche pasa inadvertida, el contador
de ciclos enteros contiene un valor erróneo para el nuevo período de phase-lock, en este
caso se habla de pérdida de ciclos o cycle slip.

Usando la (8.51) y teniendo en cuenta la invariancia de la fase sincrónica (ver (8.54)),


las (8.56) se rescriben en función del tiempo de propagación como:

us * (tur )  f o us (t r )  f o (tu  ts )  us (t o )  N us (tuo )


 f o us (t r )  f o (tu  ts )  Bus (t o ) (8.58)
us (tur )  us * (tur )  f o mus (tur )   s (tur )

La ambigüedad real o sesgo de fase Bus (t o )  us (t o )  N us (tuo ) es constante en tanto no


se interrumpa el enganche del receptor con la portadora del satélite. La diferencia de
fase sincrónica us (t o ) es también llamada ambigüedad fraccional.

8.5.1 Relación entre la medida de la fase Doppler y la distancia al satélite.


Escalando la fase Doppler con la longitud de onda de la portadora  y usando c=fo, de
las (8.58) resultan:

Lsu * (tur )  us * (tur )  cus (t r )  c(tu  ts )  Bus (t o )


(8.59)
Lsu (tur )  us (tur )  Lsu * (tur )  cmus   s

De acuerdo con lo señalado en el párrafo 8.4.2 (Ecs. (8.21)), junto con la (8.23), el
término del tiempo de propagación en (8.59) se escribe como:

cus  Rus (P s , Pu )  cAus  Rus (Pˆ s , Pu )  E s  c(Tus  I us ) (8.60)

Como se mencionó en el párrafo 8.3.5, el carácter dispersivo de la ionósfera induce un


adelanto en la fase de la portadora (viajando a la velocidad de fase) igual en magnitud
pero de signo opuesto al retraso inducido en el código (que viaja a la velocidad de
grupo). Por su parte la troposfera afecta de igual modo a ambas velocidades.
Introduciendo esta última en las (8.59), la fase Doppler en metros y su medición se
rescriben:

177
Lsu * (tur )  Rus (Pˆ s , Pu )  E s  c(Tus  I us )  c(tu  ts )   Bus (t o )
(8.61)
Lsu (tur )  Lsu * (tur )  cmus   s

Finalmente, el modelo de la medición de la fase Doppler en metros resulta:

Lsu (tur )  Rus (Pˆ s , Pu )  E s  c(Tus  I us )  c(tu  ts )   Bus (t o )  cmus  s (8.62)

Comparación entre las mediciones de pseudo-rango y fase


Como se advierte de comparar las (8.24) y (8.62) las mediciones de fase y de pseudo
rango con código tienen en común los términos E s , Tus , I us , tu y ts . En cambio
difieren en tres aspectos esenciales: el signo de I us , la ambigüedad Bus y la magnitud de
los errores de recepción.

Como surge de comparar los siguientes valores típicos para un receptor de alta gama.

Ruido de medida de fase: s  1-2mm (rms).


Efecto multipasos (ambiente libre) sobre la fase: cmus  1-5cm (rms).

los errores en la medición del código son hasta 2 órdenes de magnitud superiores a los
correspondientes a la medición de la fase. A pesar de su gran precisión el uso de la
medida de la fase como observable de la distancia satélite/receptor se ve limitado por la
presencia de la ambigüedad Bus que de ningún modo podría considerarse como un
residuo de medición dado que su valor puede ser arbitrariamente grande. Por esta razón,
los métodos que utilizan la medida de la fase para el posicionamiento del receptor
requieren determinar esta ambigüedad para lo cual utilizan información suplementaria
provista por otros receptores cercanos y/o en otras frecuencias de portadora. El más
popular de estos métodos, llamados interferométricos, es tal vez el lambda method
(least-squares ambiguity decorrelation adjustment) desarrollado inicialmente por
Teunissen. Dado que el abordaje de estos métodos de posicionamiento de alta precisión
excede el alcance de este libro, se recomienda al lector interesado consultar las
referencias: Teunissen, (1994), Teunissen, (1995), Teunissen et al. (1995) y también
una discusión sobre el tema en el Cap. 6 de Misra/Enge, (2006).

A pesar de su inferior precisión, la medida del pseudo rango con código tiene el interés
de ser no ambigua, lo que permite el posicionamiento con un sólo receptor y una sola
frecuencia.

8.6 Medida del Doppler y Estimación de la Velocidad

Como se vio en el párrafo 8.3.1, la medición del desvío Doppler es un subproducto


natural del proceso de adquisición de la señal de cada satélite por parte del receptor. A
continuación se muestra el modo en que esta medición es usada para estimar el vector
velocidad del vehículo en coordenadas ECEF.

Derivando respecto del tiempo la primera de las ecuaciones (8.61) y teniendo en cuenta
las (8.57) y (8.48) se tiene:

178
d s* r d ˆs
Lsu * (tur )   u (tu )  f Ds  P  Pu  E s  c(Tus  Ius )  c( Du  Ds )
dtu dt (8.63)
 
 (rus )T (Pˆ s  P u )  E s  c(Tus  Ius )  c( Du  Ds )


Donde, como en (8.32), rus es el versor de la línea de vista al satélite s. En general los
cambios en E s , Tus y Ius son muy lentos por lo cual sus derivadas temporales resultan
despreciables o al menos asimilables al error residual de la medida de f Ds . De este
modo, definiendo los vectores velocidad del satélite (calculado con datos de efemérides)
y del receptor como Vˆ s  Pˆ s y V  P , el modelo de la medición de la de la magnitud
u u

(8.63), a veces denominada “delta pseudo-rango” o  us se escribe:


  ˆ s  V )  cD   s
 us  f Ds  f Ds  s  (rus )T (V (8.64)
u u 

Donde, el residuo s  s incluye: los errores de medida de la frecuencia Doppler, las
derivadas temporales E s , T s y I s , el desconocimiento o inestabilidad de la deriva del
u u
*
reloj satelital y las variaciones del efecto de las reflexiones múltiples sobre la fase.
Cabe señalar que para vehículos en movimiento este último efecto tiene carácter
aleatorio. En la práctica los errores residuales  s pueden considerarse insesgados con un
valor rms para el término s del orden de 0,03 á 0,08m/seg para la portadora L1, lo que
da a esta medición una gran precisión cuando además de la velocidad v u se estima el
término cDu . Para esto reescribimos la (8.64) para cada satélite visible i=1,…,s como:
  ˆi 
i  f Di  (rui )T V  (rui )T Vu  cDu  i ; i  1,..., s (8.65)


Siendo las i funciones conocidas de las mediciones f Di y de los datos de efemérides
ˆ i y el versor r i . Este
de los satélites visibles con los que se calculan las velocidades V u

último es calculado usando la posición del usuario determinada con las medidas de

pseudo-rango. El efecto del error de posicionamiento sobre rui es considerado
despreciable para las distancias nominales de los satélites.

Usando la definición de J en (8.32) las ecuaciones (8.65) se rescriben matricialmente


como:

 1   (ru1 )T  c 
 2   2 T  V   Vu 
    (ru )  c  u
υ     ε  J    ε  (8.66)
     Du  Du 
 s   s T   
    (ru )  c 

En la cual se introdujo la notación:

*
Del orden de 10-12 actualmente con expectativas de rápida mejora a mediano plazo.

179
1 
 
ε       s (8.67)
s 
 

A partir de las (8.66) y (8.67) es posible estimar simultáneamente los valores de Vu y Du


que minimizan la suma del cuadrado de los residuos mediante:

V ˆ 
u
   (J T J ) 1 J T υ (8.68)
ˆ
 Du 

Donde el resultado queda expresado en las mismas coordenadas elegidas para J, es


decir, ECEF.

8.6.1 Precisión de la estimación de la velocidad


A diferencia del posicionamiento, la estimación de la velocidad surge de resolver un
problema de mínimos cuadrados lineal, cuyo resultado es la aplicación inmediata de la
ecuación (8.68) a las definiciones (8.67). Análogamente a las (8.38) y (8.39) el valor
esperado y la matriz de covariancia de la estimación de la velocidad junto con las (8.66)
y (8.68) resultan:

V ˆ   Vu 
u
E{ }  E{(J T J ) 1 J T υ}    + (J T J ) 1 JT E{ ε  } (8.69)
 Dˆ u   Du   
Sesgo de la estimación

 Vu 
Q v , Du  cov(   )  (J T J ) 1 JT cov( ε  )J (J T J ) 1   4 x 4
 Dˆ u  (8.70)
cov( ε  )     I;   0,03 - 0,08 m/seg,
2

Una diferencia significativa de las (8.69) respecto de las (8.38) es que en muchos casos
el error residual ε  puede considerarse insesgado al igual que la estimación de la
velocidad. La covariancia del error de estimación de la velocidad, dada por la (8.70),
depende de la geometría de la constelación visible del mismo modo que para la
posición, por lo que resultan válidos los mismos coeficientes de dilución de precisión
introducidos en el párrafo 8.4.2.

180
Capítulo 9
Navegación Integrada

Un sistema de navegación inercial constituido por una unidad de mediciones inerciales


(UMI) (ternas de giróscopos y acelerómetros) y un algoritmo de integración numérica
de las ecuaciones cinemáticas como los vistos en el capítulo 7 provee estimaciones de
posición, velocidad y actitud de un vehículo a una tasa de muestreo sólo limitada por la
velocidad de cómputo en tiempo real abordo. Sin embargo, como se demostró en ese
mismo capítulo, el desconocimiento en las condiciones iniciales, los errores de los
sensores inerciales y las aproximaciones del modelo de gravedad o del algoritmo de
integración numérica hacen que el navegador inercial puro adolezca de errores que
crecen indefinidamente con el tiempo. Para acotar y aun reducir los errores propios del
navegador inercial se requieren sensores externos suplementarios. Cuando los datos de
estos sensores son adecuadamente integrados a los de los sensores inerciales, es posible
lograr una navegación a la vez precisa, estable y con una alta tasa de información de
salida.

Las técnicas de fusión procesan datos provenientes de diversas fuentes para estimar las
variables deseadas. Su interés radica en que mientras más fuentes de información se
dispongan más se reduce la imprecisión de la estimación a la vez que aumenta su
confiabilidad y disponibilidad. La navegación integrada consiste en la aplicación de
estos métodos a la estimación del vector de los parámetros de navegación o estado
cinemático, visto como un proceso continuo modelado por las ecuaciones cinemáticas
(descritas en el capítulo 5) con las magnitudes inerciales como entradas. La información
sobre el proceso está representada por las medidas de las magnitudes inerciales,
usualmente disponibles a una alta tasa de muestreo (o en tiempo continuo), las
mediciones exteroceptivas adquiridas en instantes discretos (no necesariamente
equiespaciados) y la información a priori (antes de las medidas) sobre el estado
cinemático de partida. El carácter estocástico de este proceso se debe a: a) las
perturbaciones en las mediciones, b) la incertezas en las condiciones iniciales y c) las
incertezas y efectos no modelados de los sensores y la gravedad.

En la navegación integrada, la fusión de las medidas introceptivas (inerciales) y


exteroceptivas permite estimar, a la vez, los parámetros de navegación y las incertezas
en los modelos. El resultado es un sistema de navegación estable (sin las divergencias
de errores propias de la navegación inercial pura estudiadas en el capítulo 6) con buen
desempeño en altas y bajas frecuencias, alta tasa de información de salida y con
capacidad para autocalibrar su propia instrumentación.

En este capítulo se presentan los fundamentos de la fusión de datos aplicados al diseño


de sistemas de navegación integrada para una configuración instrumental arbitraria. El
problema es planteado inicialmente en su forma general con el fin de evidenciar sus
dificultades teóricas intrínsecas y valorar en su justa medida las soluciones aproximadas
implementadas en la práctica. Asimismo, creemos que el encuadre del problema en un
contexto mas riguroso permite al diseñador un mejor diagnostico del comportamiento
de las soluciones implementadas en la práctica.

181
La metodología expuesta se aplica a diversos casos: a) navegación con ayuda de radar,
b) sistema inercial con baro-altímetro, c) navegación con ayuda de GPS, d) alineación
con posición conocida. Para el caso c) se consideran dos ejemplos prácticos: el primero
usa datos reales adquiridos a bordo de un avión beachcraft B200 y el segundo un vuelo
simulado de un lanzador satelital de tipo Delta IV. En cada caso se estudia la incidencia
de los errores instrumentales y del desconocimiento de las condiciones iniciales.

9.1 Formulación del problema

La navegación integrada constituye una aplicación particular de la teoría de la


estimación del estado de un sistema dinámico sujeto a perturbaciones estocásticas con
incertidumbres en las condiciones iniciales y en los parámetros del modelo.

Con el fin de clarificar el vínculo entre la navegación y la teoría de la estimación de


procesos, introducimos la siguiente formulación general válida para cualquiera de las
representaciones de las ecuaciones cinemáticas descritas en el capítulo 5.

x  a(x, p g )  B(x)μ; t  tk ; x(tk )  v.a.{xˆ k , Px (tk )} (9.1)

Donde, el vector x representa al estado cinemático (parámetros de navegación) del


vehículo, el vector de las magnitudes inerciales (aceleración y velocidad angular) 
actúa como función forzante o “entrada” lineal a dichas ecuaciones, en tanto que el
vector p g es el conjunto de parámetros que condensan las incertidumbres en el modelo
de gravedad. El estado inicial en un instante arbitrario tk es un vector aleatorio x(tk )
con valor esperado y matriz de covariancia, respectivamente: xˆ k y Px (tk ) . Se supone

que el vector μ(t ) y su medición μ(t ) se vinculan mediante un modelo conocido de
calibración representado como:

μ  (μ; pi )  ξ  ; (9.2)

Donde, pi es el vector de parámetros que agrupa las incertidumbres del modelo de los
instrumentos inerciales y, como se vio en el capítulo 2, ξ  es un vector de
perturbaciones estocásticas. Las medidas inerciales se suponen disponibles en los

instantes de muestreo ts, y las medidas exteroceptivas yk en los instantes (no
necesariamente equi-espaciados) tk. Estas últimas se relacionan con el estado cinemático
x k mediante un modelo matemático supuesto conocido*:


y k  H k (x k ; p e )  k ; k  N (0, R k ) (9.3)


El vector p e agrupa los parámetros inciertos del modelo de la medición y k , la cual se
ve afectada por el vector estocástico, discreto, aditivo, supuesto centrado, gaussiano e
independiente k con matriz de covariancia Rk. El índice k en H k enfatiza el hecho de

*
De ahora en más, cuando convenga a la simplificación de la notación, las variables evaluadas en los
instantes discretos tk serán denotadas: v(tk)=vk.

182
que el sensor exteroceptivo no es necesariamente el mismo en cada instante de
adquisición. Para simplificar la notación se evita indexar al vector pe del instrumento.

9.1.1 Descripción del sistema de medida

  
y k 2 y k 1 yk
   Sistema de
μ (t s ) μ (t s ) μ (t s ) adquisición de
   
(t)
xk-2 xk-1 xk
x(t)
Proceso
Figura 9.1 Esquema de tiempos del sistema de medidas.

La figura 9.1 describe esquemáticamente la interrelación entre el proceso continuo


subyacente que determina la evolución del estado cinemático x (t ) (debajo de la línea de
trazos) y las medidas accesibles en tiempos discretos. (t) representa la evolución
continua de las magnitudes inerciales, cuyas medidas son entregadas por la unidad de
mediciones inerciales (UMI) en los instantes denotados como ts (a una tasa que oscila
entre los 50 y 300Hz). Por otra parte, en los instantes discretos tk, los sensores
exteroceptivos (magnetómetro, receptor GNSS, altímetro, star tracker, sensor de

distancia, etc.) proveen las mediciones y k de ciertas magnitudes relacionadas con
estado x k .

Para una dada terna de sensores, según se trate de acelerómetros o de giróscopos


( m b   3 con ; m  f , ), el modelo inverso al descrito en el párrafo 2.3 del capítulo 2

transforma la medición m en la correspondiente magnitud inercial vectorial m :
 
m b   I    σ m   m b  b m  ξ m  M (m b ; p m )  ξ m (9.4)

Donde:
 x  xy  xz 
 
  σ m     yx y  yz  ; σ m   9 (9.5)
  zx  zy  z 
 m

b 
p m   m   12 (9.6)
σ m 

De acuerdo con lo visto en el capítulo 2, la perturbación ξ m ( m  f ,  ) es un proceso


Markoviano que en su versión más general es modelado mediante la ecuación
diferencial estocástica*:

*
Formalmente, ecuación diferencial estocástica de Ito (ver Jazwinski, 1970)

183
ζ m   mζ m  ηm ; ηm  N ( ηm , (t )Q, m (t )); ζ m (0)  v.a.(0, P, m )
(9.7)
ξ m   mζ m  n m ; n m  N (0, Qm )

Donde (t ) es el "delta” de Dirac y (t )Qζ , m (t ) debe entenderse como una distribución
matricial definida bajo el signo integral que satisface:

t 

 (t  )Q ζ,m ()d    (t  )Qζ , m ()d  Qζ , m (t ) (9.8)


t 

Cuando los ruidos independientes puedan considerarse estacionarios Qζ , m  const.


corresponde a la densidad espectral matricial del proceso blanco conjunto en cuestión.
Con las definiciones anteriores, el modelo de calibración (9.2) de la UMI resulta:

  M (ωb ; p  )  ξ  
μ  (μ; pi )  ξ    b   (9.9)
 M (f ; p f )  ξ f 

Donde, de acuerdo con la (9.7), las perturbaciones ξ  responden al modelo:

ζ   ζ  η ; η  N ( η , (t )Qζ , ); ζ  (0)  v.a.(0, Pζ )


(9.10)
ξ   ζ  n ; n  N (0, (t )Qn, )

En tanto que el vector de parámetros asociado a la UMI en la Ec. (9.2) es:

b 
 p  σ  
p i  p   b    24 (9.11)
 f  f
σ f 

Con el fin de simplificar la exposición se supondrán conocidos los coeficientes del


modelo (9.10). De otro modo, estos coeficientes deben agregarse al vector de
parámetros inciertos p i .

9.1.2 Estado aumentado del sistema de navegación


Los parámetros instrumentales p i y p e pueden estar consignados en la hoja de
especificaciones del fabricante o bien, para una mayor precisión, ser medidos
específicamente por el usuario en laboratorios de ensayos mediante procedimientos de
calibración instrumental adecuados a ese fin. En todo caso, los valores medidos deben
considerarse como variables aleatorias susceptibles de cambios durante la operación. El
criterio más usual para captar la variabilidad de estos parámetros, así como las
componentes del vector p g , consiste en modelarlos como procesos brownianos
continuos, tales como:

184
 p i   i 
p   p e    e   ξ p (t ); t  tk ; p(tk )  p k  N {pˆ k , Pp (tk )}
(9.12)
p g   g 
ξ p (t )  N (0, (t )Q p ); Q p  diag (Qi , Q e , Q g )

Donde, la condición inicial en un instante arbitrario tk es el vector aleatorio supuesto


gaussiano de valor esperado pˆ k (estimación a priori) y matriz de covariancia Pp (tk ) .
Para el proceso vectorial continuo ξ p (t ) supuesto independiente, gaussiano y centrado
cabe la misma aclaración asociada a la Ec.(9.8) con Q p una matriz diagonal
conformada por los subloques diagonales Qi , Q e y Q g .

El objeto de la navegación integrada es estimar simultáneamente todas las componentes


del vector aumentado:

 x(t ) 
 
χ (t )   p(t )  (9.13)
ζ (t ) 
 

El estado aumentado χ (t ) resulta un proceso Markoviano modelable mediante la


siguiente ecuación diferencial estocástica (formalmente de Ito, ver Jazwinski, 1970)
que, junto con su observación en tiempo discreto surge de combinar las Ecs. (9.1), (9.2),
(9.3), (9.9) y (9.10):

 x  a(x, p g )  B(x)((μ; pi )  ζ )  B(x)n 
      
χ   p    0    ξ p    (χ , μ(t ))   (χ )ξ (t )
ζ    ζ    η 
     
T
ξ (t )  nT (t ) ξTp (t ) ηT (t )   N (0, (t )Q(t )) (9.14)

y k 1  H k 1 (x k 1 ; p e )  k  k 1 (χ k 1 )  ηk 1 ; ηk 1  N (0, R k 1 )

En las anteriores se supone ξ (t ) un ruido blanco de densidad espectral



Q(t )  diag (Q n ,  , Q p , Qζ ,  ) . Las mediciones inerciales μ son las funciones de entrada

del modelo anterior, en tanto que las mediciones y k constituyen la información
adquirida sobre el proceso χ (t ) en los instantes discretos tk vía los instrumentos
exteroceptivos. El ruido de medida aditivo ηk es supuesto descorrelacionado y además,
por simplicidad, independiente del proceso ξ (t ) .

9.2 Estimación óptima Bayesiana del estado aumentado

Definimos el conjunto de observaciones exteroceptivas adquiridas hasta un dado


instante tk como:

185
  
Yk  {y k , y k 1 , y k 2 ,....} (9.15)

Como es sabido (ver por ejemplo Papoulis, 1991), el estimador óptimo en el sentido
medio-cuadrático del estado aumentado χ (t ) , dadas todas las medias disponibles hasta
dicho instante, es valor esperado condicionado a las mediciones Yk que, en función de la
densidad de probabilidad condicional p (χ (t ) / Yk ) , se escribe:

 
E χ (t ) / Yk    ...  χ (t ) p(χ (t ) / Y )dχ k k ; t   t k , t k 1  (9.16)
 

El procedimiento para la determinación de este estimador a medida que se adquieren


nuevas observaciones es la solución del llamado problema de filtrado continuo-discreto
y se descompone en dos pasos.

Paso 1 -Predicción:
Dada la densidad de probabilidad condicional a posteriori en un instante tk: p (χ k / Yk ) ,
las ecuaciones a derivadas parciales de difusión hacia delante (o de Fokker-Plank, ver
Papoulis, 1991 o Åström, 1970) permiten, en teoría, determinar la densidad de
probabilidad de transición: p (χ (t ) / χ k ) t  tk del proceso estocástico Markoviano
representado por la primera de las Ecs. (9.14). Conocida ésta densidad de transición, se
obtiene, mediante un cálculo de la densidad marginal a priori, la siguiente densidad de
probabilidad condicional:

p(χ (t ) / Yk )   p (χ (t ), χ k /Yk )dχ (tk )   p(χ (t ) / χ k ) p(χ (tk ) / Yk )dχ k (9.17)

Sustituyendo la anterior en la (9.16) se obtiene la predicción óptima de χ (t ) dadas las


medidas disponibles Yk para t  [tk , tk 1 ) entre dos instantes de adquisición de medidas
exteroceptivas.

Paso 2 -Actualización:

Para asegurar el procedimiento recursivo, cuando la nueva medición y k 1 está
disponible, la densidad condicional p(χ k 1 / Yk 1 ) permite actualizar el estimador
óptimo a posteriori.
 
E χ k 1 / Yk 1    ...  χ k 1 p (χ k 1 / Yk 1 )dχ k 1 (9.18)
 

Para esto es útil la siguiente relación bayesiana (ver Papoulis, 1991):



 p(χ k 1 , y k 1 / Yk )
p(χ k 1 / Yk 1 )  p(χ k 1 / y k 1 , Yk )  
p(y k 1 / Yk )
  (9.19)
p(y k 1 / χ k 1 , Yk ) p(χ k 1 / Yk ) p (y k 1 / χ k 1 ) p (χ k 1 / Yk )
   
p (y k 1 / Yk ) p (y k 1 / Yk )

186
La última igualdad resulta de la condición de markovianidad de χ (t ) . Para el cálculo de

la densidad condicional p(y k 1 / χ k 1 ) se usa el modelo de observación dado por la 2ª de
las Ecs. (9.14) para escribir:
 
p(y k 1 , ηk 1 / χ k 1 )  p(y k 1 / ηk 1 , χ k 1 ) p ( ηk 1 / χ k 1 )
 (9.20)
 (y k 1  k 1 (χ k 1 )  ηk 1 ) p( ηk 1 )

En la 2ª igualdad se usó la independencia de k respecto de χ k y el hecho de que, de



acuerdo con el modelo (9.14), y k 1 resulta una variable “cierta” cuando ηk 1 , χ k 1 están
dados, por lo tanto, su densidad está concentrada en el único punto donde no se anula el
“delta” de Dirac  Marginalizando la expresión anterior respecto de ηk 1 y usando
la condición de markovianidad de χ (t ) y de independencia de k se obtiene:

 
p (y k 1 / χ k 1 )   (y k 1  k 1 (χ k 1 )  ηk 1 ) p ( ηk 1 )dηk 1
 (9.21)
 pk 1 (y k 1  k 1 (χ k 1 ))

Donde pk 1 denota la densidad de probabilidad de k+1. Resta la determinación de la



densidad p(y k 1 / Yk ) , para lo cual se parte la siguiente relación:

 
p(y k 1 , χ k 1 / Yk )  p (y k 1 / χ k 1 , Yk ) p (χ k 1 / Yk )
 (9.22)
 p(y k 1 / χ k 1 ) p(χ k 1 / Yk )

La segunda igualdad resulta una vez más de la markovianidad del proceso χ (t ) . La


densidad de probabilidad buscada se obtiene marginando la anterior respecto de χ k 1 y
usando la relación (9.21) mediante:
 
p(y k 1 / Yk )   pk 1 (y k 1  k 1 (χ (tk 1 )) p(χ k 1 / Yk )dχ k 1 (9.23)

Finalmente la densidad a posteriori p(χ k 1 / Yk 1 ) surge de sustituir en la (9.19), la


(9.23) y la (9.17) para t=tk+1.

El uso del procedimiento bayesiano de estimación óptima recursiva en navegación


requiere calcular en línea integrales como las (9.17) y (9.23) y, como si fuera poco,
determinar la solución de la ecuación diferencial no lineal a derivadas parciales de
Fokker-Plank para propagar la densidad de probabilidad de transición p (χ (t ) / χ k ) del
proceso (9.14) para t>tk. Como se advertirá, aunque exacto, este enfoque resulta
impracticable por lo cual, cualquier solución viable al problema de la estimación
recursiva de χ (t ) será necesariamente aproximada.

De las múltiples soluciones aproximadas propuestas en la literatura posiblemente las


mas difundidas sean: Extended Kalman Filter (EKF) propuesto inicialmente por
Jazwinski, (1970) y Sigma Point Kalman Filter (SPKF) propuesto por Van der Merwe,
(2004). Ambas soluciones de gran valor práctico son del tipo de 2° orden, es decir, sólo
hacen intervenir los primeros dos momentos de las distribuciones involucradas. Su

187
interés es doble, por un lado, en el caso en que pueda invocarse la gaussianidad de todas
las variables aleatorias, las distribuciones quedan caracterizadas exclusivamente por
estos dos momentos. En tal caso la solución es exacta y equivale al algoritmo óptimo
bayesiano. Por otro, bastan dichos momentos para obtener el mejor estimador lineal
bajo cualquier distribución, que coincide con el óptimo no lineal para el caso gaussiano
(ver Kailath, 1983 o Papuolis, 1991). Ambos métodos heredan lo pasos de predicción y
actualización mencionadas en este párrafo.

9.3 Filtro de Kalman extendido (FKE)

Dado el proceso estocástico vectorial contínuo con mediciones en tiempo discreto


modelado mediante las Ecs. (9.14) (reproducido a continuación) con condiciones
iniciales en el instante tk:

χ   (χ , μ(t ))   (χ )ξ ; χ (tk )  χ k  v.a.(χˆ k , Pk )
ξ (t )  N (0, (t )Q(t )) (9.24)

y k 1  k 1 (χ k 1 )  ηk 1 ; ηk 1  N (0, R k 1 )

Donde χ (tk ) es un vector aleatorio de momentos de 1º y 2º orden supuestos conocidos


χˆ k , Pk . La aproximación esencial que caracteriza al FKE (introducida por Jazwinski,
1970) consiste en suponer que el valor esperado del vector χ (t ), t  tk coincide con la
solución del sistema (9.24) considerado determinista y en el cual se sustituyen todas las
variables aleatorias por su valor esperado. En particular: ξ (t )  0, χ k  χˆ k . Esta
hipótesis central del método es denominada principio de equivalencia cierta (PEC) (ver
Åström/Wittenmark, (1995) y también Van Der Water/Willems, 1981 sobre una
discusión acerca del uso de este principio).

9.3.1 Predicción: Propagación del estimador a priori


En lo que sigue denotamos con χˆ  (t ) , yˆ k 1 a las predicciones (estimaciones a priori) de

χ (t ) t  tk , tk 1  y de la medición y k 1 que se obtiene a partir de la solución de la
versión determinista del sistema (9.24) para t  tk , tk 1  bajo la aplicación del PEC.


χˆ    (χˆ  , μ(t )); χˆ  (tk )  χˆ k  χˆ k
(9.25)
yˆ k 1  k 1 (χˆ k 1 ); χˆ k 1  χˆ  (tk 1 )

Deberá tenerse en cuenta que la Ec. (9.25) presupone usar, en lugar de la expresión para
μ dada por la (9.2) o la (9.9), su estimación basada en el PEC y el modelo de
calibración de los instrumentos inerciales:

μˆ  (μ; pˆ i ) (9.26)

Definimos las desviaciones de la solución de (9.24) respecto de las predicciones


(consideradas como trayectorias de referencia)

188
χ  (t )  χ (t )  χˆ  (t )
 (9.27)
y k 1  y k 1  yˆ k 1

Por razones que veremos mas adelante, la desviación y k 1 es denominada innovación.



Suponiendo las funciones  (., μ(t )) y k 1 (.) suficientemente diferenciables, a partir
de las Ecs. (9.24) y (9.25) se obtiene para las desviaciones (9.27) las ecuaciones:
 
χ    (χ (t ), μ(t ))   (χˆ  (t ), μ(t ))   (χ (t ))ξ ; χ  (tk )  χ k  χ k  χˆ k
 2
  (χˆ  (t ), μ(t ))χ    (χˆ  (t ))ξ  TOS ( χ )
y k 1  k 1 (χ k 1 )  k 1 (χˆ k 1 )  ηk 1 (9.28)
2
 k 1, (χˆ k 1 )χ k 1  ηk 1  TOS ( χ )
ηk 1  N (0, R k 1 ); ξ (t )  N (0, (t )Q(t ))


Donde, los jacobianos  y k 1,  son evaluados sobre las trayectorias χˆ  (t ); μ(t )
t  tk , tk 1  . Con el fin de simplificar la notación, de ahora en más se denotará:

k 1 = k 1, (χˆ k 1 )

 (t ) =  (χˆ  (t ), μ(t )) (9.29)
 (t )   (χˆ  (t ))

La aplicación del PEC en t  tk supone además que:

E χ k   E χ k   χˆ k  E χ k   0 
Pk  cov(χ k )  E (χ k  E χ k )(χ k  E χ k )T  (9.30)
 E χ k χ k T 

Cuando la trayectoria predicha usando (9.25) sea lo “suficientemente” cercana a la real


2
será posible despreciar los términos de orden superior TOS ( χ ) en las Ecs. (9.28). En
tal caso, las desviaciones (9.27) son aproximables por su parte lineal, solución de las
siguientes ecuaciones estocásticas lineales variantes en el tiempo para t  tk , tk 1  .

χ    (t )χ    (t )ξ (t ); χ  (tk )  χ k  χˆ k ; ξ (t )  N (0, (t )Q(t ))


(9.31)
y k 1  k 1χ k 1  ηk 1 ; ηk 1  N (0, R k 1 )

Como es fácil demostrar, la linealidad de estas ecuaciones junto con la primera de las
condiciones (9.30) asegura que las desviaciones son tales que E χ  (t )  0;
 t  tk , tk 1  con lo cual su covariancia coincide con la del predictor χˆ  (t ) , en efecto:

189

cov(χ  (t ))  P  (t )  E (χ  (t )  E χ  (t ))(χ  (t )  E χ  (t ))T  (9.32)
 E χ  (t )χ  (t )T   E (χ (t )  χˆ  (t ))(χ (t )  χˆ  (t ))T 

De este modo, la covariancia P  (t ) del predictor χˆ  (t ) es propagada en el tiempo por la


ecuación diferencial hacia adelante de la matriz de covariancia del proceso lineal
variante (9.31) que, de acuerdo con la Ec. (C.10) del Apéndice C, resulta:

P  (t )   (t )P  (t )  P  (t ) (t )T   (t )Q(t ) (t )T ; P  (tk )  Pk (9.33)

En el instante tk+1 de adquisición de la nueva medida, la matriz de covariancia del


predictor χˆ k 1 es:

Pk1  P  (tk 1 ) (9.34)


Del mismo modo, la covariancia de la predicción de la medida y k 1 se calcula usando:
el PEC; junto con la (9.31):

  
Py (k  1)  E y k 1y k 1T  E (k 1χ k 1  ηk 1 )(k 1χ k 1  ηk 1 )T  (9.35)
 
 k 1 E χ k 1χ k 1T kT1  R k 1  k 1S k 1  STk 1kT1

El resultado surge de usar la 2ª de las Ecs. (9.31) la hipótesis de independencia entre el



ruido de medida ηk 1 y χ k 1 junto con la definición: S k 1  E χ k 1 ηk 1T . Cuando es 
posible suponer independencia entre los procesos ηk y χ k de la (9.35) se obtiene:

 
Py (k  1)  k 1 E χ k 1χ k 1T kT1  R k 1 (9.36)

9.3.2 Actualización: Regresor lineal óptimo


Para el paso de la actualización, el FKE restringe la estimación condicionada a la nueva

medida y k 1 (determinada por la densidad (9.19) en el caso bayesiano) a la familia de
regresores lineales de la forma:

χˆ k 1  χˆ k 1  K k 1 (y k 1  yˆ k 1 )  χˆ k 1  K k 1y k 1 (9.37)

Donde el segundo término del segundo miembro debe ser visto como una corrección a
la estimación a priori χˆ k 1 proporcional a la innovación y k 1 . Como puede verse por
ejemplo en Kailath (1983) o tambien Jazwinski (1970), el mejor de los estimadores
lineales es único y satisface la condición de ortogonalidad:


E χ k 1 (y k 1 )T  0  (9.38)
χ k 1  χ k 1  χˆ k 1  χ k 1  K k 1y k 1

190
Sustituyendo en la condición anterior la expresión (9.37) se obtiene:

 
Py (k  1)  E χ k 1yTk 1  K k 1Py (k  1) (9.39)

De donde surge la ganancia del regresor lineal óptimo:

K k 1  Py (k  1)Py1 (k  1) (9.40)

De la expresión (9.40) se advierte que el estimador óptimo otorga a la innovación un


peso directamente proporcional a la correlación entre el estado y la medición e
inversamente proporcional a la incertidumbre en esta última dada por la covariancia
Py (k  1) . Teniendo en cuenta las (9.31) y (9.32)

 
Py (k  1)  E χ k 1yTk 1  Pk1kT1  S k 1 (9.41)

En términos de las Ecs. (9.35) y (9.41) cuando S k 1  0 la ganancia óptima resulta :

K k 1  Pk1kT1 (k 1Pk1kT1  R k 1 ) 1 (9.42)

La covariancia Pk 1 del regresor lineal óptimo se calcula usando la (9.38) mediante:

Pk 1  E χ k 1χ Tk 1  E (χ k 1  K k 1y k 1 )χ Tk 1


 E χ k 1χ Tk 1  Pk1  K k 1Pk1kT1 (9.43)
 Pk1  Pk1k 1 (k 1Pk1kT1  R k 1 ) 1 kT1Pk1

Donde el 2º renglón resulta de aplicar la condición de ortogonalidad (9.38), mientras


que la última igualdad surge de introducir la expresión (9.42).

Usando la identidad matricial:

( A + BCD) 1  A -1 - A -1B(C-1 + DA -1B)DA 1 , (9.44)

es posible probar que la Ec. (9.43) admite la forma alternativa:

Pk11  (Pk1 ) 1  k 1 R k11kT1 (9.45)

La inversa de la matriz de covariancia es usualmente denominada matriz de


información. Dado que el 2º término del 2º miembro de la Ec. (9.45) nunca es positivo,
esta ecuación refleja una consecuencia natural de la actualización y es que a posteriori
de la nueva medición la información siempre se ve incrementada o, equivalentemente,
que la covariancia siempre se reduce después de cada medida adquirida a menos que
R k 1   , en cuyo caso la innovación es desechada por el filtro dado que, como se
advierte de la (9.42) K k 1  0 .

191
9.3.2 Implementación numérica del FKE
Para el cálculo de la ganancia de Kalman (9.42) es necesario calcular previamente la
matriz de covariancia Pk1 solución de la ecuación diferencial matricial lineal (9.33) en
el instante tk+1. Como puede demostrarse por simple sustitución, esta última ecuación
tiene por solución (ver por ejemplo Zadeh/Desoer, 1963):

t
P  (t )   (t , tk ) Pk  (t , tk )T    (t , ) ()Q() ()T  (t , )T d  (9.46)
tk

 (t , )   (t ) (t , );  (, )  I ; t   y t ,   t , t 
 (9.47)
k k 1

Donde (t , ) es la matriz de transición de estado entre los instantes  y t   del


sistema lineal (9.31). Para el cálculo de P  (t ) subdividimos el intervalo tk , tk 1  en Mk
subintervalos de longitud Ts igual a la del ciclo exterior del algoritmo de integración de
las ecuaciones cinemáticas (INS) estudiado en el Capítulo 7 y representado por la
ecuación determinista (9.25). Denotamos:

tk ,n  tk  nTs ; n  0,..., M k
(9.48)
M k Ts  tk 1  tk

Nótese que Mk no será constante si las medidas exteroceptivas no están equiespaciadas


temporalmente.

A partir de la solución general (9.46) es posible demostrar que en un subintervalo


tk ,n , tk ,n 1  la matriz de covariancia a priori progresa como:

P  (tk ,n 1 )  Pk,n 1   k ,n 1 Pk, n Tk ,n 1  Q k ,n 1 ; Pk,0  Pk (9.49)

Donde  k , n 1   (tk , n 1 , tk , n ) es la solución de la Ec. matricial (9.47) para t=tk,n+1, =tk,n


junto con  (tk , n , tk , n )  I . Además.

tk ,n 1
Qk , n 1    (tk , n 1 , ) ()Q() ()T  (tk , n 1 , )T d  (9.50)
tk , n

Introduciendo la aproximación para t  tk , n , tk , n 1  :

 (t )   (tk , n )  k , n  const. (9.51)

escribimos   tk ,n , tk ,n 1  :

 (tk , n 1 , )  exp(k , n (tk , n 1  ))  I  k , n (tk , n 1  )  TOS (tk , n 1  ) 2


 k , n 1   (tk , n 1 , tk , n )  exp(k , nTs )  I  k , nTs  TOS (Ts ) 2 (9.52)
 ()   (tk , n )  k , n

192
Por su parte, introduciendo las (9.52) en la (9.50) resulta la aproximación:

Qk ,n 1  k , n Qk , n k,nTs  TOS (Ts2 ) (9.53)

Con los resultados (9.49) a (9.53) estamos en condiciones de resumir el algoritmo de


navegación integrada usando el FKE para la fusión de datos inerciales con medidas
externas que pueden provenir de diversos sensores tales como altímetros,
magnetómetros, receptor GPS u otros. El esquema general se representa en la Fig. 9.2
en la cual se distinguen los elementos de software y de los de hardware.

x(t) Sensores
Vehículo
exteroceptivos.
(t)
Sensores 
y (tk )
Inerciales

Hardware μ(t )
Software Modelo de μˆ (t ) +
INS Modelo de los -
calibración.  sensores exter.
 xˆ  a(xˆ , pˆ g )  B(xˆ )μˆ yˆ ( t k )
μˆ  (μ; pˆ i ) yˆ  H k ( xˆ , pˆ e ) xˆ k ,n
pˆ i (t k ) pˆ g (t k )
pˆ e (tk )
x (t k ), pˆ g (t k ) p e (tk )
p i (tk )
y (t k )
Algoritmo FKE Pk ,n

Figura 9.2: Esquema de la navegación integrada.

A continuación describimos el procedimiento de cálculo entre dos instantes


consecutivos de adquisición de medidas exeteroceptivas: tk y tk+1 con referencias a
figura 9.2.

1. Inicialización
Las condiciones iniciales del algoritmo en el instante tk corresponden a la mejor
estimación disponible del vector de estado extendido en dicho instante junto con su
matriz de covariancia.

 pˆ i (tk ) 
 xˆ k 
χˆ k    ; pˆ k   pˆ e (tk )  ; Pk (9.54)
pˆ k  pˆ g (tk ) 

Al inicio de la navegación (k=0) se usará el conocimiento disponible de dicho estado


posiblemente provisto por instrumentos como GPS, magnetómetros, inclinómetros, etc.

193
2. Propagación de la estimación a priori del estado cinemático
El estado cinemático xˆ k , n es propagado en los instantes tk,n, n=1,…,Mk, aplicando el
PEC y usando la versión determinista de la ecuación cinemática (9.1) integrada
numéricamente mediante alguno de los algoritmos descritos en el Capítulo 7.

xˆ   a(xˆ  , pˆ g (tk ))  B(xˆ  )μˆ ; t  tk ; xˆ  (tk )  xˆ k (9.55)

Esta operación esta representada por el bloque INS en la Fig. 9.2 cuya entrada es el
vector de medidas inerciales corregido con el modelo de calibración determinista (9.26):

μˆ (t )  (μ(t ); pˆ i (tk )); t  tk , tk 1  (9.56)

xˆ k , n , junto con su matriz de covariancia teórica Pk ,n , constituyen las salida del sistema
de navegación entregadas a la tasa 1/Ts.

3. Propagación de matriz de covariancia a priori


En cada instante tk,n se calculan:
a) El jacobiano k , n =  (χˆ k , n , μˆ (tk , n )) (Ec. (9.29));
b) La matriz k , n =  (χˆ k , n ) (Ec. (9.29));
c) La matriz de transición  k , n 1  exp(k , nTs ) (Ec. (9.52));
d) La covariancia del ruido discretizado Qk , n 1  k , nQk , n k , nT Ts (Ec. (9.53))

Con los valores anteriores, mediante la recursión (9.49) se determina la covariancia


teórica de los estimados Pk, n 1 al final de cada paso. Al final del ciclo se tendrá:
Pk1  Pk, M k

4. Cálculo de la innovación

a) En el instante tk,Mk= tk+Ts, se adquiere la nueva medida exteroceptiva y k 1 .
b) Con la estimación a priori del estado en tk+1 calculada en el punto 2), se evalúa
el modelo del sensor exteroceptivo activo en ese instante para obtener yˆ k 1 (2ª
de las Ecs. (9.25)).

c) Se calcula la innovación: y k 1  y k 1  yˆ k 1 .

5. Cálculo del jacobiano del modelo del sensor exteroceptivo


Usando la predicción xˆ k 1 calculada en 2) y pˆ e (tk ) se evalúa el jacobiano k 1 dado por
la 1ª de las Ec. (9.29).

6. Cálculo de la ganancia del FKE


Se determina introduciendo en la (9.42) los valores de Pk1 y k 1 calculados
previamente y R k 1 que caracteriza al ruido de medida.

194
7. Cálculo de la corrección del estado a posteriori de la medida
Usando la Ec. (9.37) se corrige la predicción para obtener la nueva estimación a
posteriori del estado ampliado: χˆ k 1 . Este valor deviene la condición inicial del nuevo
ciclo que se reinicia en 1). Debe destacarse que en este paso no sólo se actualiza el
estado cinemático sino también el vector de los parámetros de los instrumentos y del
modelo de gravedad (ver líneas punteadas en la Fig. 9.2).

8. Actualización de la matriz de covariancia a posteriori


Finalmente el ciclo se completa con la determinación de Pk 1 sustituyendo K k 1 , Pk1
y k 1 en la Ec. (9.43). Pk 1 “actualiza” Pk1 y constituye la estimación teórica de las
incertidumbres de todas las magnitudes estimadas: xˆ k 1 , pˆ i (tk 1 ) , pˆ e (tk 1 ) y pˆ g (tk 1 ) en
tk+1.

9.4 Ejemplos de aplicación de la Navegación Integrada

9.4.1 Instrumentación inercial integrada con datos de radar

Pv
d  dE 
d  d N 
a
 
 dU  dU 
N
Pa

E
dE   dN 
2 2
dH 
Fig. 9.3: Navegación integrada radar/inercial

La figura 9.3 muestra un vehículo cuyo punto de navegación (centro geométrico de la


UMI) está ubicado a la distancia vectorial d de una estación de radar fija en un punto de
coordenadas ECEF conocidas: Pae . La estación rastrea al vehículo y trasmite a éste su
posición instantánea en coordenadas polares respecto de una terna centrada en la antena
paralela a la terna LGV-G en el punto Pa:

distancia : d =[ (di ) 2 ]1/ 2 ;


elevación : =tg 1  dU / d H  ; (9.57)
azimut :  =tg 1  d E / d N 

La terna geográfica (LGV-ENU) asociada a la antena es denotada {a} para distinguirla


de la terna local geográfica {g} del vehículo. El vector de las coordenadas de la
distancia d a se escribe en función de las coordenadas del vehículo y de la antena como:

195
 dE 
d   d N   Cea (Pve  Pae )  Cea Ceg Pvg  Paa
a
(9.58)
 dU 

Modelo del sensor exteroceptivo


La estación de radar trasmite al vehículo en los instantes tk la siguiente terna de valores
perturbados por la secuencia independiente de ruido k.

 d (tk )   d (tk ) 
  
y k   (tk )    (tk )   ηk ; ηk  N (0, R k ) (9.59)

 (tk )   (tk ) 

El periodo de latencia de la trasmisión es considerado despreciable frente a la dinámica


del vehiculo.

Ecuación de las desviaciones.


El vehículo navega en coordenadas geográficas utilizando el algoritmo de navegación
strapdown descrito en el párrafo 7.1 del Capítulo 7 con un modelo de gravedad supuesto
sin error. De los modelos de calibración (9.4) a (9.6) se suponen conocidas las matrices
 m m  f ,  en tanto que el proceso ξ  es modelado como un ruido blanco de tal
modo que en la (9.10), ξ   n n  N (0, (t )Qn , ) . Como sólo se suponen inciertos los
sesgos de los instrumentos inerciales, el vector de parámetros en la (9.11) resulta:

p i  b  b     6
b
(9.60)
 f

Por consiguiente, el vector de desviaciones aumentado (9.27) resulta:

 g    E 
 x(t )   g
χ (t )      ; x  V    ; π   N  ;
15 9
(9.61)
b(t )   π   h 

Donde, se usó la definición de la desviación del estado cinemático dada por la Ec. (6.65)
del Ejemplo 6.1 del Capítulo 6.

Procedemos a expresar las matrices  (t ) y  (t ) definidas mediante las (9.29). Para


esto tenemos en cuenta la Ec. (6.80) del ejemplo 6.1 con , g e  0 en la cual,
introducimos el vector de las desviaciones de los sesgos (9.60) de la siguiente forma*:

*
Se recomienda al lector extender este ejemplo al caso en que se desconozcan otros paramentros de los
modelos de calibración, de la gravedad o de las mediciones externas.

196
x   F g (x  (t ))x   B g (t )(b  ξ b ) ;
Φ  ΦV Φ  Cbg 0 
  (9.62)
F (x (t ))   V
g 
VV V    99 ; B g (t )   0 Cbg    96
 0 ΠV Π    0 0 

De este modo, tenienedo en cuenta que en la ecuación general para el estado aumentado
(9.14): p  b ,  =0 y  =0 resulta finalmente:

F g (t ) B g (t )  1515
B g (t ) 0  1512
 (t )    ;  (t )    (9.63)
 0 0   0 I 

Modelo de la innovación.
El modelo no lineal del sensor externo (correspondiente a la Ec. (9.25)) lo constituyen
las Ecs. (9.57) y (9.59). A partir de esas ecuaciones procedemos a calcular el jacobiano
k , para cada instante tk, definido mediante las Ecs. (9.29) con lo cual se formula el
modelo de las innovaciones (9.31):

y k 1  k 1χ k 1  ηk 1 (9.64)

Donde, de acuerdo con la definición del estado aumentado (9.61), la matriz k tiene la
forma:

k  C Cv C Cb  k   315 (9.65)

Para esto, teniendo en cuenta la (9.58) evaluamos primeramente:

 d , ,  d , , 
y k  yˆ k  y k  d a  k  Cea (Ceg Pvg )  k (9.66)
d E d N dU ˆ k
d E d N dU ˆ k

N U
Pv
Elipsoide normal

  o ( 2 )
Rn  hv

Figura 9.4: Pv en coordenadas geográficas.

Usando los valores calculados por el sistema de navegación expresamos: Pˆ vg (Ceg Pvg )
(ver Fig. 9.4).

197
 0 
Pˆ vg  ( Rn  hˆ)  o( 2 )  (9.67)
1  o( 2 ) 

ˆ e P g
(Ceg Pvg )  Ceg Pˆ vg  C (9.68)
g v

Despreciando las variaciones del radio de curvatura normal Rn en la zona de vuelo se


tiene además:

 0  0
P  h  o( 2 )    0 
v
g
(9.69)
1  o( 2 )  h 

ˆ e S(θg ) , junto con las anteriores, la Ec. (9.68) se rescribe


Introduciendo Ceg  C g

como:

0
ˆe  0 C
(Ceg Pvg )  C ˆ e (θg  P g )
g   g v

h 
(9.70)
 ( Rn  h) N   0 ( Rn  h) 0 
ˆ e  ( R  h) E   C
C ˆe  ( R  h) 0 0  π
g  n  g  n
 h 
  0 0 1 

De la anterior junto con la (9.66) resulta que la matriz k es de la forma:

k   0 0 C 0k   315 (9.71)

Con
 0 ( Rn  h) 0 
d , ,  Aˆe 
C , k  A A A Ce C g ( Rn  h) 0 0  (9.72)
d E d N dU
 0 0 1 

A partir de las Ecs. (9.57) se determinan las filas del jacobiano en la Ec. (9.72):

d 1 1
  d EA d NA dUA     sen() sen( )  sen()cos () cos () 
d d N dU d
A
E
A A
d
 1
   sen()cos ( )  sen()cos () cos ( ) (9.73)
d d N dU d
A
E
A A


   sen( ) /(dcos()) cos( ) /(dcos ()) 0
d d NA dUA
A
E

198
Finalmente C,k en (9.72) resulta:

 cos() sen() cos()cos() sen()   0 ( Rn  hˆ) 0


 
C,k   sen() sen() / d sen()cos() / d cos() / d  CeAC
 ˆe
g ( Rn  hˆ) 0 0
 sen() /(dcos()) cos() /(dcos())   
0   0 0 1
(9.74)

9.4.2 Instrumentación inercial integrada con GPS


Se considera la integración de una unidad inercial (UMI) con las dos magnitudes
medidas por un receptor GPS para cada satélite de la constelación visible: el pseudo
rango y la frecuencia Doppler (o delta-pseudo-rango). Esta configuración es usualmente
denominada Navegación INS-GPS fuertemente acoplada por usar directamente las
mediciones del receptor y para distinguirla de la configuración débilmente acoplada que
procesa la posición y velocidad previamente calculadas en el receptor.

Satélite i
Pˆ i

R iu
Ri

rui Antena
GPS

 Pue
ri l
UMI
Pe Al centro de coordenadas

Figura 9.5.

Si bien su complejidad es mayor, la primera configuración tiene grandes ventajas


respecto de la 2ª en términos de calidad de navegación. En efecto la configuración
fuertemente acoplada utiliza todas las medidas disponibles en el receptor sobre la
constelación visible. Estas medidas proveen la información primaria de mayor calidad
posible dado que cada observación respecto de cada satélite puede considerarse un dato
independiente. En cambio, la opción débilmente integrada (llamada también INS-GPS-
PV) utiliza información precomprimida por el procesamiento interno del receptor sobre
el cual el diseñador no tiene ningún control. El resultado es una reducción de la calidad
y cantidad de información así como de la tasa a la cual esta es provista.

La Fig. 9.5 describe la geometría del problema en relación a un satélite de la


constelación visible. Como se advierte, se contempla el hecho usual en la práctica de
que entre la antena del receptor y el centro de navegación de la UMI existe un brazo de
palanca l que aquí se supondrá conocido. Se sugiere al lector extender la aplicación al
caso en que dicho vector no pueda considerarse como exactamente conocido.

199
Se elije como terna de referencia o de navegación la ECEF por ser la referencia estándar
en general de los sistemas GNSS.

Desviación del estado aumentado


El ejemplo contempla incertezas tanto en el modelo de los instrumentos inerciales como
en las mediciones GPS. De acuerdo con las Ecs. (9.13) y (6.19) definimos el siguiente
vector desviación del estado aumentado:

 x(t )   φe 
 
χ (t )   pi (t )  ; x e  V e  9 ; (9.75)
p e (t )   P e 
 
 
Expresamos el término bilineal en los vectores (σ m , m ) de la Ec. (9.4):   σ m  m según
la siguiente forma equivalente:
  
L(m)σ m    σ m  m; L(m)   39 ,   σ m    33 (9.76)

De este modo, a partir del modelo de calibración (9.4)/(9.9), se obtienen las siguientes
expresiones de los errores en las mediciones inerciales:

 ωbib   b    L(ω)σ   
 b   b    L(f )σ   ξ   B pi (μ)pi  ξ 
 f   f   f 
 (9.77)
  I L(ω) 0 0 
B pi (μ)    
 0 0 I L ( f )

Modelo de los sensores exteroceptivos


Reintroducimos los modelos de las mediciones de pseudo-rango y Doppler, establecidos
en el Capítulo 8 mediante las Ecs. (8.25) y (8.65)), para los s satélites de la constelación
visible:

iu  Rui  ctu  sp i  i ; i (tk )  N (0, R i ) 


 i  1,..., s (9.78)
 iu  Rui  cDu  i ; i (tk )  N (0, R  i ) 

Donde:
Rui  R ui  Pˆ i  Pue
(9.79)
   ˆi
Rui  rui (Pˆ i  P ue )  rui (V  Vue )

y además: sp i  E i  c( I ui  Tui  ti ) es el error debido a la propagación y al segmento


 
espacial; i  cM ui  i el error residual de medición del pseudo-rango; rui  R ui / Rui  r i
es el versor de apuntamiento al satélite i y i el error residual de la medida de la
frecuencia Doppler que incluye: a) las derivadas temporales E s , Tus , Ius , el

200
desconocimiento o inestabilidad de la deriva del reloj satelital y las variaciones en el
error sobre la fase de las reflexiones múltiples (ver párrafo 8.6).
Se supondrá que en los instantes tk se obtienen s pares de mediciones independientes
dados por la Ec. (9.78):

 i (t ) 
y i (tk )   ui k  ; i  1,..., s (9.80)
 u (tk ) 

Cabe destacar otras características de gran importancia práctica de la configuración


fuertemente acoplada tanto desde el punto de vista algorítmico como metodológico. En
primer lugar, como cada una de las 2s medidas dadas por las Ecs. (9.80) es
independiente de las demás, el FKE puede procesarlas una a una como si procediesen de
instrumentos independientes (de hecho lo son) aunque lleguen todas en el mismo
instante. Esto reduce significativamente la dimensionalidad del cálculo y por ende la
complejidad global del algoritmo. Más específicamente, véase la influencia de la
dimensionalidad de k 1 a) en la actualización de la co-variancia a posteriori dada por
las Ecs. (9.43) ó (9.45), b) en el cálculo de la ganancia K (Ec. (9.42)) y c) en la
actualización, a partir de la innovación, del estado aumentado (Ec. (9.37)). Otra ventaja
de gran interés práctico (sobre todo en ambientes donde la visibilidad de la constelación
puede ser variable o reducida ej. cañones urbanos, maniobras con cambios rápidos y de
gran amplitud en la orientación del vehículo, interferencia etc.) es que contrariamente a
la configuración débilmente acoplada, esta configuración no depende de que el receptor
tenga en todo momento 4 o mas satélites adquiridos (salvo posiblemente al inicio de la
navegación). En cambio, siempre mejorará su estimación a priori y proveerá su
covariancia teórica cada vez que reciba un pseudo-rango o un Doppler de algún satélite.

El modelo de las mediciones (9.80) es función del vector p e que agrupa el conjunto de
parámetros inciertos en las Ecs. (9.78):
T
p e  tu Du sp1  sp s    s  2 (9.81)

De los spi se disponen de estimaciones/correcciones iniciales extraídas del mensaje de


navegación del GPS. El desvío del reloj y su deriva temporal se suponen vinculados por
el modelo:

 tu  Du (9.82)

De acuerdo con la Fig. 9.5 la distancia de la antena al satélite i en coordenadas e resulta:

R iu  Pˆ i  (P e  Cbe l b ) (9.83)

Modelo de la innovación.
A partir de las Ecs. (9.78), establecemos las innovaciones para las mediciones GPS (ver
Ecs. (9.27),(9.28))

201

i  r iT R iu  sp i  ctu  i  
 y i (tk ) (9.84)
 i   i  ˆ i  Rui  cDu   i 

En lo que sigue, consistentemente con la aplicación del PEC, las magnitudes


desconocidas son sustituidas por sus estimaciones o sus medidas, según corresponda. A
ˆ e calculamos:
partir de la (9.83) y usando Cbe  S( e )C b

ˆ e l b  P e  S(C
R iu  P e  Cbe l b  P e  S( e )C ˆ e l b ) e (9.85)
b b

En la cual se tuvo en cuenta que l es conocido sin error y además Pˆ i  0 dado que los
errores de efemérides (o de posicionamiento) del satélite i ya fueron incluidos en el
término spi. Así, la desviación del pseudo rango resulta:
 ˆ e l b ) e )  ct  sp i  
i  riT (P e  S (C b u i
 (9.86)
ˆ e l b ) 0 rT  xe   0 p  c 0  1  p  
 riT S(C b i  i  (i )  e i

Por otra parte, a partir de la 2ª Ec. (9.79), establecemos:

 i r i  r i R
Rui  R i (9.87)
u u

A continuación derivamos la Ec (9.83) usando el mismo argumento empleado más



arriba que aquí justifica usar Pˆ i  0 :

 i  Pˆ i  V b b
ˆ e (ω
ˆ e C e ˆe b
R u b ib  l )  S (Ω )Cb l (9.88)

Perturbando la expresión anterior calculamos:

 i  V e  Ce (ω b b ˆe
R u b ib  l )  Cb (ω ib  l )  S (Ω )Cb l
b b e e b

ˆ e (ω b b e ˆe b ˆe b
 V e  S( e )C b ib  l )  S (Ω )S ( )Cb l  Cb S (l )ω ib
e b

b b e (9.89)
 V e  S(Cˆ e (ω ˆe b e ˆe b
ib  l ))  S (Ω )S (Cb l )  Cb S (l )ω ib
e b
b

ˆ e (ωb b ˆe b  e ˆe b
 V e  S(C b ib  l ))  S (Ω )S (Cb l )    Cb S (l )ω ib
e b


Por otra parte, de la definición del versor r i  R ui / Rui junto con la (9.85) resulta:

   ˆ e l b ) e 
r i  ( Rui ) 1 (1  r i r iT )R ui  ( Rui ) 1 (1  r i r iT )  P e  S(C b  (9.90)

Entre las (9.87), (9.89) y (9.90) se obtiene:

202
 iT (1  r i r iT )  P e  S(C
Rui  ( Rui ) 1 R ˆ e l b ) e  
u  b 
 b b
 r iT  V e  S(C ˆ e (ω ˆe b  e ˆe b
ib  l ))  S (Ω )S (Cb l )    Cb S (l )ω ib
e b 
 b
 (9.91)
 iT (1  r i r iT )S(C
 ( Rui ) 1 R ˆ e l b )  r iT S(C ˆ e (ωb b ˆ e b  e
ib  l ))  S (Ω )S (Cb l )  
e
 u b  b

 iT e  
 iT (1  r i r iT )P e  r iT C ˆ e S(l b )ωb
r V  ( R i ) 1 Ru u b ib

Con la cual, teniendo en cuenta la (9.77) y las definiciones (9.75) y (9.81), la


innovación de la medición Doppler se escribe de acuerdo con la 2ª Ec. (9.78) como:

  iT  i  iT ˆe  iT ˆe b b ˆe b 
   R u (1  r r )S (l ) / Ru  r [S (Cb (ω ib  l ))  S (Ω )S (Cb l )]
i i e
c
  i T (1  r i r iT ) / R i  x e  r T C b
ˆ e S(l b )  I L(ω
 i   c
i
 r iT R u u i b  
ib ) 0 0  p i (9.92)
  0 c  0  p e   i

b
Donde se usó: ω ˆ eω
ˆ eeb  C b ib  Ω
e
y lˆe  C
ˆ e l b . Nótese que, gracias a los términos
b
ˆ e e ˆ
S(l )  l   y S(l )ω  l  ω , el brazo de palanca hace que las magnitudes
e e b b b b
ib ib

 i sean sensibles a las componentes del error de actitud  e y del error giroscópico
ωbib ortogonales al vector l. Dicha sensibilidad se ve habilitada por las velocidades
lineal y angular: Ri y ωˆ eeb . Este hecho ofrece a esta configuración un gran potencial
u

tanto para la determinación de la orientación del vehículo como para la calibración de


los instrumentos inerciales. El lector comprobará fácilmente que, con más de una
antena, las innovaciones Doppler respecto de los satélites de la constelación pueden
aportar información directa de la actitud y de todos los parámetros giroscópicos en todas
sus dimensiones. Sin embargo, a través de bib , las ecuaciones cinemáticas y la
medición externa comparten el mismo ruido aditivo por lo que ya no podrán
considerarse independientes los procesos χ k ηk esto obliga a introducir los términos
correctivos en función de S k mencionados en las (9.35) y (9.41) (ver la solución del
problema de filtrado para ruidos de sistema y medidas correlacionados por ejemplo en
Jazwinski 1970).

El modelo de las innovaciones de ambas medidas del receptor GPS en relación a cada
satélite i y para cada instante tk, se resume en las siguientes ecuaciones:

 i (tk ) 
y i (tk )  ki χ k     Cix , k Cpi i ,k Cpi e, k  χ k  ηk ; i  1,..., s
  i (tk )  (9.93)
ηik  N (0, R ik );

Donde, con base en las Eqs. (9.86) y (9.92) las sub-matrices de ki son:

203
 
riT S( l e ) 0 riT 
C i
 i  iT  (1  r r ) / R 
 
x ,k
c r R i
u
T i iT i
u
0 0 0 0
Cpi i ,k   T ˆ e b  T ˆ e b b  (9.94)
ri Cb S(l ) ri Cb S(l ) L(ωib ) 0 0 
c 0 0 1(i ) 0 
Cpi e ,k  
0 c 0  0 

Ecuación de las desviaciones.


A partir de las Ecs. (9.77) y (6.21), escribimos:

a) La ecuación de la desviación de los parámetros de navegación:

 S(Ωe ) 0 0  C ˆe 0
b
  e  
ˆ e fˆ b ) 2 S (Ωe ) γ e / P e
x e    S (C x   0 ˆ e  (B p  ξ )
C (9.95)
b e P Pˆ e  b pi i 
 0 I 0  0 0 
 3
  

b) La ecuación para los parámetros del modelo de calibración de la UMI es:

p i  ξ i ; ξ i  N (0, (t )Qi ) (9.96)

c) Las desviaciones de los parámetros del GPS satisfacen:

 t  Du  tu 
  u
   
 Du    Du  tu  N (0, (t )Qtu )
p e   sp1     s1  ;  Du  N (0, (t )Q Du ) (9.97)
   
       si  N (0, (t )Q si )
 sp s    ss 
 

Es un sencillo ejercicio que se deja al lector demostrar que a partir de las (9.95) a (9.97)
se obtienen tanto la matriz de la dinámica del error del vector de estado aumentado
 (t ) como la matriz  (t ) de las Ecs. (9.29). Mismas que luego serán usadas para el
diseño del FKE.

9.5 Desarrollo y validación de un sistema de navegación para un avión

En este párrafo se describe el sistema INS/GPS fuertemente acoplado desarrollado en la


CONAE como unidad de navegación de un radar de apertura sintética aerotransportado
(SARAT). El avión que trasnporta el SARAT es un Beachcraft B200.

204
9.5.1 Arquitectura del sistema
El sistema está compuesto por una UMI Systron Donner/Motion Pack (SD) estabilizada
en temperatura, un magnetómetro vectorial True North Rev. 2X, un receptor de GPS y
una computadora de navegación del tipo PC-104 con sistema operativo RTLinux. Por el
momento el magnetómetro es usado solamente para estimar el rumbo (yaw) inicial del
avión, pero se prevé en un futuro próximo integrar sus medidas al sistema de
navegación lo cual redundará en una mejor estimación del azimut, principalmente
durante las fases de adquisición de imágenes durante las cuales el vuelo es recto y
nivelado. La computadora adquiere, valida y almacena la información que recibe de los
sensores. La aplicación no requiere de la navegación en tiempo real. Los datos son
simplemente almacenados en vuelo y “navegados” a posteriori para alimentar el
algoritmo de generación de las imágenes del SAR.

Una vez por segundo el receptor GPS envía a la PC el mensaje de navegación (a través
un puerto RS232) y el “pulso por segundo” (PPS) cuyo flanco ascendente indica el
inicio del segundo en el tiempo GPS. Del mensaje se extraen para cada satélite visible:
su efemérides y correcciones del tiempo, su pseudo rango y delta-pseudo-rango así
como el número del segundo asociado al próximo pulso PPS. Este número lo recibe el
módulo de tiempo real que maneja el sincronismo con una cola FIFO de tiempo real.
El flanco ascendente del PPS interrumpe al RTLinux para ejecutar la función de lectura
del tiempo de la PC y almacenarlo junto al valor del segundo GPS ya almacenado en la
FIFO previamente generando así un archivo de texto a dos columnas que permite la
sincronización de los datos de los distintos sensores.

Las 7 señales analógicas de la UMI-SD (temperatura más 3 aceleraciones y 3


velocidades angulares) son acondicionadas, filtradas (antialias) y muestreadas a
mediante una placa adquisidora Dyamond de 16bits a 2Ks/s. Con cada dato disponible
la placa envía una interrupción al RTLinux que procede a almacenar todos los datos
indexados con su tiempo en un archivo de texto. Los datos de aceleración y velocidad
angular son integrados numéricamente a intervalos de 10ms (100Hz) para calcular los
α k , j ,i y v k , j ,i que luego serán procesadas por el algoritmo strapdown (ver Capítulo
7). El sistema obtiene sus condiciones iniciales mediante el GPS (posición y velocidad)
y el magnetómetro (azimut e inclinación).

9.5.2 Resultados experimentales


A continuación se presentan y analizan los resultados de navegación obtenidos en un
vuelo del Beachcraft B200 realizado en agosto de 2005.

Las figuras 9.6 y 9.7 muestran la trayectoria del avión calculadas por el sistema de
navegación. Una ampliación de los datos representados en la figura 9.6 permitiría
observar que el avión luego de aterrizar en la misma pista de despegue se aparta de ella
en dirección hacia el hangar.

En el perfil de altura de la Fig. 9.7 se advierte el tiempo en pista desde el inicio de la


navegación, el ascenso al primer nivel de adquisición de 3700m, el ascenso a la altura
de 4000m a partir aproximadamente del minuto 14 y luego el descenso y aterrizaje.

La Fig. 9.8 muestra la evolución de la orientación del vehículo durante el vuelo según
sus ángulos yaw, pitch y roll. Las variaciones positivas y negativas del pitch coinciden

205
con los períodos de ascenso y descenso del avión en la Fig. 9.7 mientras que los
cambios en roll se traducen en giros o cambios en yaw. Este último parámetro se
representa entre +180º y -180º.

Fig. 9.6: Trayectoria sobre el plano tangente local, posición de partida en el origen.

Fig. 9.7: Evolución de la altura durante el vuelo.

Fig. 9.8: Evolución de la orientación del vehículo durante el vuelo.

206
Fig. 9.9: Desvío estándar del error de estimación en posición.

Las Figs. 9.9 y 9.10 muestran que los desvíos estándar del error en longitud, latitud y
altura calculados por el FKE decrecen rápidamente y en los primeros segundos alcanzan
valores asintóticos cercanos a los 2,5m. Este nivel de precisión es propio de la
navegación integrada fuertemente acoplada y no podría lograrse con posiciones y
velocidades obtenidas únicamente con el servicio de posicionamiento estándar (SPS)
del GPS. Los desvíos estándar en velocidad no son mostrados por razones de espacio
aunque exhiben un perfil similar al de la posición con un valor asintótico de 0.06 m/s.

Fig. 9.10: Desvío estándar del error de estimación en altura.

La Fig 9.11 muestra la evolución del desvío estándar del error de orientación del avión
desde el reposo hasta que inicia el ascenso. Se observa como los errores esperados en
pitch y roll decrecen rápidamente gracias a la información provista por los
acelerómetros horizontales aun con el avión casi en reposo. Sin embargo, dado que los
giróscopos utilizados no pueden medir la velocidad angular de la Tierra, el error en yaw
crece mientras el avión está en reposo sobre la pista (velocidad nula).

Cuando el avión empieza a moverse (a los 45seg) el GPS provee la información que
mejora la estimación del rumbo del avión. Por la misma razón, el error en yaw decrece
abruptamente a partir de los 175seg durante la aceleración del carreteo para terminar en
valores pequeños durante y después del despegue (ver FIg. 9.11). Esto efecto, debido a
la mejora notable en la observabilidad de los parámetros de navegación durante las
aceleraciones lineales es utilizado en lugar de los largos procedimientos de alineación
especialmente con giróscopos sin resolución suficiente como para medir la velocidad
angular de la Tierra.

207
Fig. 9.11: Desvíos del error de estimación de orientación
durante los primeros segundos de vuelo.

La Fig. 9.12 muestra, en una escala ampliada, los desvíos teóricos calculados por FKE
en vuelo. Se observa que en los tramos de vuelo rectilíneo, los desvíos en roll y pitch
alcanzan un piso de 0.01°. Sin embargo, justamente durante estos tramos tiende a crecer
el desvío en azimut aunque en todo momento se mantiene entre 0.05º-0.1°.

Fig. 9.12: Desvíos de los errores de estimación de orientación


luego del despegue.

En lo que sigue se ilustra un método para verificar que las estadísticas provistas por el
FKE son consistentes con valores calculados. Para esto se comparan las correcciones
x(tk) sobre el estado cinemático calculadas mediante la Ec. (9.37) (ver Fig. 9.2),
calculadas una vez por segundo a partir de mediciones de pseudo rango y delta pseudo

208
rango, con los intervalos de confianza teóricos del 95% (1,96) determinados con las
covariancias también calculadas por el FKE.

Los resultados se muestran en las Figs. 9.13 y 9.14, respectivamente, para las
correcciones en latitud, altura y ángulos pitch y yaw. No se incluyen los gráficos de
longitud y roll que se asemejan a los de latitud y pitch. En todos los casos se constata
que el intervalo de confianza es eficaz para las muestras medidas por lo que se pudo
concluir que tanto la parametrización de los sensores inerciales como el funcionamiento
del algoritmo son satisfactorios. Así mismo se observó que las estimaciones de pi y pe
convergen, lo que apoya la hipótesis de consistencia del modelo propuesto para los
instrumentos.

Fig. 9.13: Procesos de las correcciones en latitud y altura


comparadas con su intervalo de confianza de dos desvios estándar.

Fig. 9.14: Procesos de las correcciones en pitch y yaw comparadas


con su intervalo de confianza de dos desvíos estándar.

209
9.5.3 Conclusiones
Un análisis preliminar muestra que la estructura de los modelos elegidos tiene la
complejidad suficiente para la aplicación. Los resultados de navegación indicaron que la
precisión alcanzada satisface los requerimientos de navegación para la adquisición de
imágenes SAR y también de otros remotos aerotransportados (ver España et all., 2006).
En particular cumple con las máximas exigencias para posición y ángulos pitch y roll.

Se advierten apartamientos significativos en la velocidad y el azimut con desvíos


teóricos respectivamente, > 0.05° y >0.06m/s. En el primer caso, la causa es la
insuficiente información para compensar la deriva giroscópica en azimut durante vuelos
poco acelerados y en el segundo los errores propios del receptor GPS usado sin ayuda
diferencial. Para paliar estos efectos, sin recurrir a unidades inerciales más costosas, se
propusieron como alternativas mejorar la información utilizada mediante: a) integración
de la medición del vector geomagnético b), incremento de la proyección sobre el eje del
avión del brazo de palanca entre la antena GPS y la UMI con el fin de aumentar la
sensibilidad de la deriva giroscópica en azimut (ver Ec. (9.92)); c) Usar más de un
receptor/antena con brazos de palanca en direcciones independientes para mejorar la
estimación de la deriva giroscópica en todas direcciones; d) Incluir correcciones GPS
diferenciales usando una estación de referencia cercana a la trayectoria (<50Km.); e)
Incorporar un sensor de actitud como una brújula GPS para medir orientación usando
interferometría de la fase de la portadora GPS.

210
Apéndice A
Modelo del Potencial
Gravitacional Terrestre

El potencial gravitacional V(P) en un punto P del espacio 3 está descrito por la


ecuación de Poisson:

V ( P)  4G( P) (A.1)

donde  indica el operador laplaciano, G la constante de gravitación universal y  la


densidad de masa en el punto considerado. Cuando P es exterior a la corteza terrestre
(P) = 0 (despreciando la densidad de la atmósfera) y la ecuación de Poisson se reduce
a la ecuación de Laplace:

V ( P)  0 (A.2)

Consideremos la esfera Sa de radio a centrada en el centro de gravedad terrestre que


contiene al volumen que ocupa la Tierra. Cuando el potencial gravitacional sobre la
superficie de Sa es usado como condición de borde, las soluciones de la (A.2) describen
el potencial gravitacional terrestre exterior a dicha esfera. La condición de borde
constituye la única información física requerida por el modelo. Por razones que
apreciaremos más adelante convendrá introducir el potencial gravitacional terrestre
normalizado:

a
V ( P)  V ( P) (A.3)
GM T

siendo MT la masa nominal de la Tierra. Claramente, V ( P) también satisface (A.2) para


los puntos exteriores a la esfera de radio a.

Vista la simetría, lo más natural es adoptar coordenadas esféricas geocéntricas (ver


párrafo 4.2.2) para las cuales el laplaciano (A.2) se escribe como:

1   2 V  1   V  1  2V
r   cos  c  0 (A.4)
r 2 r  r  r 2 cos  c  c   c  r 2 cos 2  c  2

Ensayamos en la Ec. (A.4) una solución hipotética del tipo:

V (r ,  c ,  )  R(r )Y ( c ,  ); r  a , (A.5)

que permite separar en factores la dependencia radial de la dependencia angular de las


soluciones. Los factores de la (A.5) satisfacen, respectivamente, las siguientes
ecuaciones:

211
1   2 R 
r K (A.6)
R r  r 

1   Y  1  2Y
 cos  c  Y cos 2   2   K
 (A.7)
Y cos  c  c   c  c

siendo K una constante arbitraria llamada de separación. Como se comprueba


fácilmente por sustitución, las soluciones de (A.6) requieren que sea K= n(n+1) y
resultan de dos tipos:

r  ( n 1)
R (r )   n ; 0n (A.8)
 r

Veremos más adelante que n debe ser un entero positivo. Dado que las soluciones rn
contemplan efectos de masa a grandes distancias exteriores al volumen de cualquier
esfera de radio finito, el modelo gravitacional debido exclusivamente a la masa terrestre
sólo incluye soluciones del tipo r-(n+1).

Por otra parte, las soluciones Y(c, de (A.7) pueden obtenerse separando nuevamente
la solución en factores de tal modo que sustituyendo Y(c,=F(c)L() en (A.7) e
introduciendo una nueva constante de separación M se obtiene, por un lado, la ecuación
para la función de la longitud:

2 L
 ML  0 (A.9)
 2

y por otro la correspondiente a la latitud:

1   F   M 
 cos  c    n(n  1)  cos 2  F  0 (A.10)
cos  c  c   c   c 

La condición de continuidad de las soluciones en longitud de (A.9) sobre la esfera, i.e.:


L()=L(+2) impone que M  m entero, por lo que sus soluciones resultan:

cos(m ), sen(m); m entero (A.11)

Para M=m2, la ecuación de la latitud (A.10) es la llamada ecuación asociada de


Legendre en coordenadas polares. Introduciendo el cambio de variables x=sen(c), que
transforma: [-/2,2]→[-1,1] y usando la relación válida para toda función G ( c ) :

dG dG ( c ( x))
 cos( c )
d c dx

la Ec. (A.10) se rescribe según su forma clásica en función de la coordenada lineal x


como:

212
  2 F   m2 
 (1  x )    n(n  1)  F  0 (A.12)
x  x   1  x2 

Las únicas soluciones acotadas de la ecuación asociada (A.12) en el intervalo x  [-1,1]


(c  [-/2,2]) resultan ser para n y m enteros tales que n  m  0 . Estas soluciones
son llamadas funciones asociadas de Legendre y pueden generarse mediante la formula
de Rodrigues (Wahr, 1999; Arfken/Weber, 1995):

(1  x 2 ) m / 2 d n  m 2
F ( x)  Pn ,m ( x)  n nm
( x  1) n ; n  m  0 (A.13)
2 n ! dx

Donde los enteros n y m son respectivamente el orden y el grado de Pn ,m [-1,1] : [-1,1]

A.1 Propiedades de las funciones asociadas de Legendre (Arfken/Weber, 1995)

Las funciones asociadas de Legendre incluyen a los polinomios de Legendre de orden n


para m=0 generados mediante:

1 dn 2
Pn ,0 ( x)  Pn ( x)  n n
( x  1) n (A.14)
2 n ! dx

Paridad/imparidad respecto del origen:

Pn ,m ( x)  (1) n  m Pn ,m ( x) (A.15)

Cambio de signo del grado m:

(n  m)!
Pn ,(  m ) ( x)  (1) m Pn ,m ( x) (A.16)
(n  m)!

Condición de los extremos:

Pn , m (1)  0; m  0
(A.17)
Pn (1)  (1) n

Relaciones de recurrencia:

2(n  1) xPn ,m  (n  m) Pn 1,m  (n  m  1) Pn 1,m


(A.18)
2(n  1)(1  x 2 )1 / 2 Pn ,m  Pn 1,m 1  Pn 1,m 1

A continuación introducimos los polinomios y las funciones de Legendre normalizados,


(ambos soluciones de la Ec. (A.13)), respectivamente:

213
Pn ( x)  (2n  1) Pn ( x),
(A.19)
2(2n  1)(n  m)!
Pn ,m ( x)  Pn ,m ( x)
(n  m)!

Es posible demostrar que los polinomios de Legendre normalizados conforman una base
ortonormal del espacio de Hilbert L2[-1,1] y que las funciones generalizadas de
Legendre son ortonormales en [-1,1], es decir:
1
 Pn ,m , Pl ,m    Pn,m ( x) Pl ,m ( x)dx  n,l ; n, l  m
1
(A.20)

O en coordenadas polares sobre el círculo (x=sen(c)):


/2
 Pn ,m , Pl ,m   
 / 2
Pn,m (sen( c )) Pl ,m (sen( c )) cos( c )d  c   n ,l ; n, l  m (A.21)

De las definiciones (A.13), (A.14) y (A.19) resultan las primeras funciones de Legendre
normalizadas para x=sen():

P0,0 (sen())  1 ; P1,1 (sen())  3 cos ()


P1,0 (sen())  3sen() ; P2,1 (sen())  15 cos ()sen() (A.22)
5 15
P2,0 (sen())   3sen()2  1 ; P2,2 (sen())  cos () 2
4 4

A.2 Funciones Armónicas Esféricas

Con base en lo anterior definimos como funciones armónicas esféricas sobre


[- / 2,  / 2]  [0, 2] , n  m al siguiente conjunto de soluciones de la parte angular del
laplaciano (A.7):

n,m ( c , )  Pn,m (sen( c )) cos(m )


(A.23)
n,m ( c , )  Pn,m (sen( c ))sen(m)

A partir de las definiciones (A.23) y usando la propiedad (A.21) es posible comprobar


la ortogonalidad del conjunto de las funciones armónicas esféricas según el siguiente
producto escalar definido sobre la esfera unitaria:

214
n,m , k ,l    n , m (, )k ,l (, )ds
S1
2 /2
  d 
0  / 2
n ,m (, )k ,l (, )cos()d   4n,k  m,l

 n,m , k ,l    n , m (, )k ,l (, )ds (A.24)


S1
2 /2
  d
0

 / 2
n , m (, )k ,l (,  )cos()d   4n,k  m,l

 n,m , k ,l   0; n, m, k , l

En las cuales ds  cos()d d  constituye el diferencial de superficie de la esfera


unitaria S1 y  n,k es el “delta” de Kronecker. Pero, el aspecto de mayor importancia que
hereda el conjunto de estas funciones de las funciones de Legendre y de las funciones
trigonométricas es que constituye una base completa de las funciones definidas sobre S1
(Arfken/Weber, 1995). De este modo, toda función Y(c,):[- / 2,  / 2]  [0, 2]  
“suficientemente continua” (no necesariamente continua en todas partes) puede
expandirse mediante la siguiente doble sumatoria de funciones armónicas esféricas
llamada serie de Laplace:

 n
Y ( c ,  )   Cn , m n,m ( c ,  )  S n , m n,m ( c ,  )  (A.25)
n 0 m0

Donde, gracias a la ortogonalidad de las funciones armónicas esféricas, los coeficientes


Cn,m y Sn,m se calculan mediante:

1 1
4 
Cn , m  Y , n , m   Y (, )n , m (, )ds
4 S1
(A.26)
1 1
4 
Sn,m  Y , n , m   Y (, )n ,m (, )ds
4 S1

En particular para m=0 y según las Ecs. (A.19) se tiene " n0:

1
4 
Cn ,0  Y (, ) Pn ( sen())ds
S1 (A.27)
S n ,0  0

A.3 El Potencial Gravitacional

Cuando la función (A.25) describe el potencial normalizado sobre la esfera Sa


mencionada más arriba, i.e.: Y ( c , )  V (a,  c ,  ) , el potencial gravitacional en los
puntos situados a una distancia ra del centro de gravedad terrestre corresponde a la

215
solución del llamado problema de Dirichlet y resulta de las (A.25), (A.5) y la 1ª de las
(A.8):

 n 1 n
a
V (r ,  c , )      C 
n ,m n,m ( c , )  Sn ,m n,m ( c , )  (A.28)
n0  r  m0

En efecto: en primer lugar, la serie (A.28) es claramente convergente para ra dado que
su mayorante (A.25) lo es; en segundo lugar, V (r ,  c ,  ) cumple la condición de borde:
V (r ,  c ,  ) r  a  Y ( c ,  ) y en tercer lugar, de acuerdo con (A.5) y la primera de las
(A.8), cada término de la serie convergente (A.28) satisface la ecuación (A.4) la cual,
dada la linealidad del operador laplaciano, también es satisfecha por V (r ,  c ,  ) (y por
V (r ,  c , ) ).

Junto con la (A.3) y las (A.27), la expansión en armónicos esféricos de V (r ,  c ,  ) para


ra resulta en consecuencia:

GM T
V (r ,  c , )  V (r ,  c ,  ) 
a
GM T    a  n  n
 
      n ,0 n
C P (sen c )   Pn,m (sen c ) Cn , m cos(m )  S n , m sen(m )  
r  n 0  r   m 1  
(A.29)

Usando la integral volumétrica de Poisson es posible (ver Hofmann-Wellenhof/ Moritz,


2006) transformar las integrales de superficie (A.26) en las siguientes integrales
volumétricas:

n
1 r
Cn , m 
(2n  1) M T    n ,m (, )dm
Tierra 
a
n
(A.30)
1 r
Sn,m 
(2n  1) M T    n ,m (, )dm
Tierra 
a

En las cuales dm  (r , , )dv es el elemento de masa de la Tierra ubicado en el punto


de coordenadas esféricas (r , , ) y dv  r 2 cos drd d  el correspondiente elemento
de volumen con densidad (r , , ) .

Las Ecs. (A.30) permiten visualizar el significado geométrico de los primeros


coeficientes Cn,m y Sn,m. Usando las (A.23) y las (A.22) obtenemos las siguientes
expresiones en coordenadas cartesianas de los primeros integrandos de las Ecs. (A.30).

216
0,0  1; 0,0  0, r 1,0  0
r 1,0 (, )  3rsen()  3z
r 1,1 (, )  3r cos () cos()  3x
(A.31)
r 1,1 (, )  3r cos ()sen()  3 y
r 2 2,1 (, )  15r 2 cos ()sen() cos()  15 zx
r 2 2,1 (, )  15r 2 cos ()sen()sen()  15 zy

De las anteriores resulta en primer lugar que A0,0  1 y además que los siguientes
momentos de 1º orden son nulos cuando el centro de coordenadas coincide con el centro
de masa de la Tierra

1 1 1
C1,0 
3aM T
 zdm;
Tierra
C1,1 
3aM T
 xdm;
Tierra
S1,1 
3aM T
 ydm
Tierra
(A.32)

Por otra parte, dado que el eje z nominal de la Tierra coincide con el eje que maximiza
su momento de inercia respecto de él, los siguientes momentos cruzados también son
nulos.

3 1 3 1
C2,1 
5 MT  zxdm; S
Tierra
2,1 
5 MT  zydm
Tierra
(A.33)

El resultado es la siguiente expresión para la expansión (A.29):

V ( r ,  c , ) 
 
n
GM T 
a  n
      n,0 n
1  C P (sen( c ))   Pn,m (sen c ) Cn ,m cos(m)  Sn ,m sen(m)  
r  n2  r   m2 
(A.34)

217
Apéndice B
Matriz Jacobiana
de la Aproximación J2

A continuación se indican las expresiones analíticas de los coeficientes de la matriz


jacobiana para la aproximación J2 de la gravedad normal:

 3 J 2 a 2 15 J 2 a 2 
 (1  2
 2
( z / r )2 ) x 
 2r 2r   x
GM T  3J 2 a 15 J 2 a 2
2
 2  
 eJ 2  γ gJ 2 (P )  γ c (P )   3 (1 
e e e e
 (z / r) ) y    y
2
(B.1)
r 2r 2 2r 2
 2 2
  0 
 (1  3 J 2 a  15 J 2 a ( z / r ) 2 ) z 
 2r 2 2r 2 

Cuya matriz jacobiana se expresa según:

J J 2 (P e )  γ eJ 2 / P e  γ egJ 2 / P e  γ ce / P e  J g (P e )  J c (P e ) (B.2)

Con:
1 0 0 
J c ( x, y, z )    0 1 0 
2
(B.3)
 0 0 0 

Las entradas de la matriz J g (P e ) = J g ( x, y, z ) están dadas por:

1 3x 2 3J 2 a 2 5 x 2 15 J 2 a 2 z 2 7 x2 
J g (1,1)  1   (1  )  (1  )
r3 r2 2r 2 r2 2r 4 r 2 
1  3 y 2 3J a 2 5 y 2 15 J 2 a 2 z 2 7 y2 
J g (2, 2)  3 1  2  2 2 (1  2 )  (1  )
r  r 2r r 2r 4 r 2 
1  3z 2 9 J a 2 5 z 2 15 J 2 a 2 z 2 7z2 
J g (3,3)  3 1  2  2 2 (1  2 )  (3  )
r  r 2r r 2r 4 r 2 
1  3 xy 15 J 2 a 2 xy 105 J 2 a 2 xyz 2 
J g (1, 2)  3   2    (B.4)
r  r 2r 4 2r 6
1  3 xz 15 J 2 a 2 xz 15 J 2 a 2 xz 7z2 
J g (1,3)  3   2   (2  )
r  r 2r 4 2r 4 r 2 
1  3xy 15 J 2 a 2 xy 105 J 2 a 2 xyz 2 
J g (2,1)  3   2   
r  r 2r 4 2r 6
1  3 yz 15 J 2 a 2 yz 15 J 2 a 2 yz 7z2 
J g (2,3)  3   2   (2  )
r  r 2r 4 2r 4 r 2 

218
1  3xz 45 J 2 a 2 xz 105 J 2 a 2 xz 3 
J g (3,1)    r 2  2r 4  
r3 2r 6
(B.5)
1  3 yz 45 J 2 a 2 yz 105 J 2 a 2 yz 3 
J g (3, 2)  3   2   
r  r 2r 4 2r 6

219
Apéndice C
Momentos de 1º y 2º orden
de un Proceso Estocástico Continuo Lineal

Sea un proceso markoviano que responde al siguiente modelo de estado lineal variante
en el tiempo para tt0:

χ  F(t )χ  G (t )ξ; χ   n ; ξ   m (C.1)

Donde χ (t0 ) es un vector aleatorio de valor esperado χˆ (t0 ) y covariancia:

P0  E (χ (t0 )  χˆ (t0 ))(χ (t0 )  χˆ (t0 ))T  (C.2)

Por su parte el ruido continuo ξ (t ) es supuesto centrado e independiente con


covariancia (t )Q(t ) con (t ) el delta de Dirac que satisface:

t 

 (t )Q()d    (t )Q()d  Q(t )


 
(C.3)
t

De la Ec. (C.1) y las características de ξ (t ) surge que χˆ (t )  E  χ (t ) para tt0 es la


solución de la siguiente Ec. homogénea:

χˆ  F(t )χˆ ; χˆ (t0 )  E χ (t0 ) dado (C.4)

Entre las (C.1) y (C.4) escribimos el modelo del proceso incremental χ  χ  χˆ según:

χ  F(t )χ  G (t )ξ; E  χ (t0 )  0 (C.5)

Por su parte, para la matriz de covariancia del proceso (C.1) se expresa como:

P(t )  E (χ (t )  χˆ (t ))(χ (t )  χˆ (t ))T   E χ (t )χ (t ))T  (C.6)

Con base en la anterior calculamos usando el modelo (C.5):

P (t )  E χ (t )χ (t ))T   E χ (t )χ (t ))T 


 E (F (t )χ  G (t )ξ )χ (t ))T   E χ (t )(F(t )χ  G (t )ξ )T  (C.7)
 F(t )P (t )  P (t )F (t )T  2G (t ) E ξ (t )χ (t )T 

220
Para evaluar el último término de la ecuación anterior, partimos de la solución general
del sistema (C.5):
t
χ (t )  Φ(t , t0 )χ (t0 )   Φ(t , )G ()ξ ()d 
t0 (C.8)
 (t , t )  F (t )Φ(t , t ); Φ(t , t )  I
Φ 0 0 0 0

Dada la independencia entre ξ (t ) y χ (t0 ) y usando las (C.8) y la definición del delta de
Dirac tiene:

t
G (t ) E ξ (t )χ (t )T   G (t )  E ξ (t )ξ ()T G ()T Φ(t , )T d 
t0
t
 G (t )  (t )Q(t )G ()T Φ(t , )T d 
t0
(C.9)
t t
 G (t )  (t )Q(t )d G (t )T  G (t )  (t )Q(t )d G (t )T
t0 

1 1
 G (t )  (t )Q(t )d G (t )T  G (t )Q(t )G (t )T
2  2

Finalmente, sustituyendo el resultado anterior en la Ec. (C.7) se obtiene la ecuación


diferencial matricial que describe la propagación temporal de la matriz de covariancia
del proceso χ (t ) .

P (t )  F(t )P(t )  P(t )F(t )T  G (t )Q(t )G (t )T ; P(t0 ) dada (C.10)

221
Referencias

Anderson, S. R. & R.B. Flint, 1959; “The CAA Doppler omnirange”; Proceedings of the
IRE, 47, May.

Andrieu Ch., A. Doucet, S. Singh, V. B. Tadic, 2004; “Particle Methods for Change
Detection, System Identification and Control”; IEEE Proc., Vol. 92, No. 3, March.

Arfken G.B., H.J. Weber, (1995), Mathematical Methods for Physicists, Academic
Press, Ca., USA.

Argeseanu, V., 1995, Upward Continuation of Surface Gravity Anomaly Data,


Proceedings of IAG Symposium G4 Airborne Gravity Field Determination, XXI
General Assembly of the IUGG, Boulder Colorado, July 2-14, pp. 95-102 University of
Calgary.

Arulampalam M. S., S. Maskell, N. Gordon and T. Clapp, 2002; “A Tutorial on Particle


Filters for Online Nonlinear/Non-Gaussian Bayesian Tracking”; IEEE Trans. Sign.
Proc., Vol. 50, No. 2, February.

Åström K. J., B. Wittenmark, 1995, “Adaptive Control”, Addison-Wesley.

Åström K. J., 1970, Introduction to Stochastic Control Theory, Academic Press, 1970.

Ayazi F. and K. Najafi, 1998, “Design and fabrication of a highperformance polysilicon


vibrating ring gyroscope,” in Proc. IEEE Micro Electro Mechanical Systems Workshop
(MEMS’98), Heidelberg, Germany, Feb. pp. 621–626.

Barbour N.M., 2004, “Inertial Navigation Sensors”, NATO-RTO Advances in


Navigation Sensors and Integration Technology; Educational Notes SET-064; Feb.

Bar-Itzhack, I.Y., and N. Berman, 1988, “Control Theoretic Approach to Inertial


Navigation Systems”, J. of Guidance, Control, and Dynamics, Vol.11, pp.237-245.

Bergman N., L. Ljung, F. Gustafsson, 1999; “Terrain navigation using Bayesian


statistics.” IEEE Control System Magazine, 19(3):33-40.

Bernstein J., S. Cho, A. T. King, A. Kourepenis, P. Maciel, and M. Weinberg, 1993, “A


micromachined comb-drive tuning fork rate gyroscope,” in Proc. IEEE Micro Electro
Mechanical Systems Workshop (MEMS’93), Fort Lauderdale, FL, Feb. pp. 143–148.

Bortz J. E. , 1971, A New Mathematical Formulation for Strapdown Inertial Navigation,


IEEE Trans. On Space and Electronic Systems, Vol. 7 No. 12, Jan. 1971, pp 61-66.

Bortz, J. E., 1971, “A New Mathematical Formulation for Strapdown Inertial


Navigation” IEEE Transactions on Aerospace and Electronic Systems, Vol. AES-7, No.
1, pp. 61–66.

222
Boyce, W. E., R.C. Diprima, 1997, “Elementary Differential Equations and Boundary
Value Problems”, VI ed., John Wiley & Sons, Inc.

Bucy R., P. Joseph, 1987, Filtering for Stochastic Processes With Applications to
Guidance. Chalsea, Pub. Co. NY.

Butcher J. C., 2003, “Numerical methods for ordinary differential equation”, John
Wiley and Sons, 2ª Ed..

Carrizo, J. A., M. España y J. I. Giribet, 2007, “Algoritmo de navegación inercial para


vehículos de alta velocidad”; Reunión de Procesamiento de Información y Control,
RPIC, Rio Gallegos Arg. 16-18 Oct..

Chatfield A. , 1997, Fundamentals of High Accuracy Inertial Navigation, Vol 174,


Progress in Astronautics and Aeronautics (AIAA)

Chung D., Park C. G. & Lee J. G., 1996, “Observability Analysis of Strapdown Inertial
Navigation System Using Lyapunov Transformation”, Proceedings of the 35th
Conference on Decision and Control Kobe, Japan, December.

Enge P., T. Walter, S. Pullen, Ch. Kee, Yi-Ch. Chao, Y.-J. Tsai, 1996; “Wide Area
Augmentation of the Global Positioning System” Proc. IEEE, Vol. 84, No. 8, Aug.

España M., J. I. Giribet, C. Miranda, 2006; “Navegación Integrada y


Georreferenciación Directa de Sensores Remotos Aerotransportados”; XXº Congreso
Argentino de Control Automático, 28-30 Ago., Buenos Aires, Argentina.

Farrell, Jay; Barth, Matthew, “The global positioning system and inertial navigation”,
McGraw-Hill, New York. Gabrielson T.B., 1993, “Mechanical-thermal noise in
micromachined acoustic and vibration sensors” IEEE Tr. Electron Devices, Vol. 40,
May.

Geen J.A., S.J. Sherman, J.F. Chang and S.R. Lewi, 2002s, “Single-chip surface
micromachining integrated gyroscope with 50 deg/hour root Allan variance”, IEEE
Journal of Solid-State Circuits, Vol. 37, No. 12, December 2002.

Geiger W., B. Folkmer, J. Merz, H. Sandmaier, W. Lang, 1998, “A new silicon rate
gyroscope,” Proc. IEEE Micro Electro Mechanical Systems Workshop (MEMS’98),
Heidelberg, Germany, Feb.

Giribet J. I, España M., Miranda C. ,2007; “Synthetic Data for Validation of Navigation
Systems,” Acta Astronautica, Vol. 60, N. 2, pp 88-95.

Giribet J.I., M. España y C. Miranda, 2003, “Algoritmos de navegación inercial para


cinemáticas con escalas de tiempo disímiles”. Proceedings del Congreso Argentino de
Tecnología Espacial, Neuquén, Arg..

Gold, R. “Optimal Binary Sequences for Spread Spectrum Multiplexing”, 1967; IEEE
Trans. Inform. Theory, vol. IT-13, pp.619-621, Oct.

223
Goodwin, G. C., Stefan F. G. y Salgado M. E., 2001; Control System Design; Prentice
Hall.

Grejner-Brzezinska, D. y J. Wang, 1998; Gravity Modeling for High_Accuracy


GPS/INS Integration; Navigation, , Vol. 45, Nº 3, pp 209-220.

Grewal M. S., L. R. Weill, A. P., Andrews 2007. “Global Positioning Systems, Inertial
Navigation and Integration”, John Wiley & Sons. Inc., New Jersey, EEUU.

Hein G., J. Godet, J.-L. Issler, J. Martin, P. Erhard, R. Lucas-Rodriguez and T. Pratt,
2002; “Status of Galileo frequency and signal design”, Proc. of IONGPS, Portland,
USA.

Hofmann-Wellenhof, B. Moritz;H., 2006, Physical Geodesy, Springer-Wien,


NewYork,. Hurley, H.C., S. R. Anderson, & H.F. Keany; 1951, “The CAA VHF
Omnirange”; Proceedings of the IRE, 39, Dec.

Hutton J. J., T, Savina, E. Lithopoulos 1997; Photogrammetric Applications Of


Applanix’s Position And Orientation System (Pos), ASPRS/MAPPS Softcopy
Conference, Arlington, Virginia, July 27-30.

Hsu Y. D., “An Accurate and Efficient Approximation to Normal Gravity” 1998,
Position Location and Navigation Symposium, IEEE, 20-23 April.

Hyder A. K, Shahbazian E., Waltz E., 2003, “Multisensor Fusion” Proceedings of the
NATO Advanced Research Workshop on Multisensor Data Fusion, Springer.

IEEE Std. 1554, 2005, Recommended Practice for Inertial Sensor Test Equipment,
Instrumentation, Data Acquisition, and Analysis, Integrated Sensors, microactuators &
Microsystems (MEMS); 1998 Número especial de los Proceedings of the IEEE, Vol. 86,
nº 8, Aug.

Ignagni M. B. 1994, “On the Orientation Vector Differential Equation in Strapdown


Inertial Systems”; IEEE Trans. Aerospace & Electronic Systems Vol. 30, Nº 4, Oct.
Ignagni M. B. 1998, “Duality of Optimal Strapdown Sculling and Coning.

Compensation Algorithms”; Navigation of the Institute of Navigation, Vol. 45, No. 2.

Jazwinski, A.H., 1970, “Stochastic Processes and Filtering Theory”. Academic Press,
New York.

Jekeli, C.,· Lee J. K., Kwon, J. H., 2007, Modeling errors in upward continuation for
INS gravity compensation, J. Geod. Vol. 81, pp: 297–309,

Jekeli, C., 1997, The effect of Earth’s gravity on precise, short-term, 3-D free-inertial
navigation. Navigation Vol. 44 (3) pp:347–357.

Jiang Y and Lin Y , 1992, “Error estimation of INS ground alignment through
observability analysis”, IEEE Trans. Aerosp. Electron. Syst. 28 92–6.

224
Jordan, J. W., 1969, “An Accurate Strapdown Direction Cosine Algorithm” NASA
TND- 5384, Sept.

Juneau T., A. P. Pisano, and J. H. Smith, 1997 “Dual axis operation of a


micromachined rate gyroscope”; Conf. Solid-State Sensors and Actuators
(Transducers’97), Chicago, June.

Kailath T. , 1983, “Lectures on Winner and Kalman Filters”, Courses and Lectures No.
140, Spinger, NY, 2nd Ed.

Kaplan E. D. and Ch. J. Hegarty, 2006; “Understanding GPS: Principles and


Applications” Artech House, (2nd edition).

Kautsky, J. and N.K. Nichols, 1985, "Robust Pole Assignment in Linear State
Feedback," Int. J. Control, 41, pp. 1129-1155.

Kayton M., W. R. Fried, 1997; “Avionics Navigation Systems”, 2nd Ed., John Wiley &
Sons.

Kuo, B., 1995, “Automatic Control Systems, 7th edition, Prentice Hall

Kwok C., D. Fox, M. Meil,2004; “Real-Time Particle Filters”; IEEE Proc., Vol. 92,
No. 3, March.

Laning J. H.,1949, The vector analysis of finite rotations and angles”; MIT,
Cambridge, Special Report, 6398-S-3, 1949.

Laub, A.J. and M. Wette, 1984, Algorithms and Software for Pole Assignment and
Observers, UCRL-15646 Rev. 1, EE Dept., Univ. of Calif., Santa Barbara, CA, Sept..

Le Traon, O.; Janiaud, D.; Lecorre, B.; Pernice, M.; Muller, S.; Tridera, J.-Y., 2005;
“Monolithic Differential Vibrating Beam Accelerometer Within An Isolating System
Between The Two Resonators”; IEEE-Sensors, Oct..

Li B., D. Hullender & M Direnzo, 1998; “Nonlinear induced disturbance rejection in


inertial stabilized systems”, IEEE Trans. Cont. Syst. Techn., Vol 6, nº 3, May.

Luo R. C. ,Y. Ch. Chou, O. Chen; 2007; “Multisensor Fusion and Integration:
Algorithms, Applications, and Future Research Directions”, Proceedings of the 2007
IEEE International Conference on Mechatronics and Automation, Harbin, China, Aug.

Lutz M., W. Golderer, J. Gerstenmeier & D. Schubert, 1997; “A precision yaw rate
sensor in sillicon micromachining,” Tech Dig 9th Intl. Conf. Solid State Sensors and
Actuators (Transducers ’97), Chicago, IL:847-850; June.

Masson F., 2003; “Navegación Autónoma Robusta en Grandes Superficies” Tesis


PhD., Universidad Nacional del Sur, Bahía Blanca, Argentina, Sept..

Miller, R. 1983 “A new Strapdown Attitude Algorithm”, Journal of Guidance, Control

225
and Dynamics, Vol. 6, No. 4,. Misra, P., P. Enge, 2006; “Global Positioning System.
Signal Measurements and Performance”, Ganga-Jamuna Press, 2nd Edit.

Motamedi, M.E.; 1994; “Acoustic Sensor Technology”; Microwave Symposium Digest;


IEEE MTT-S International.

Papoulis A. ,1991; “Probability, Random Variables and Stochastic Processes”


McGraw Hill, 3rd. Ed., 1991.

Parkinson B. W. and J. J. Spilker, editors, 1996; “The global positioning system: theory
and applications”; American Institute of Aeronautics and Astronautics, Vols. I y II.

Pullen S. and P. Enge, 2004; “A Civil User Perspective on Near-Term and Long-Term
GPS Modernization”; Proceedings of GPS/GNSS Symp. 2004, Tokyo, Japan,
November 17-19.

Royalty J. M. B., 2005; “Method to decouple mechanically coupled gimbal control


systems”, Proc. SPIE, vol. 5810, pp 11-23.

Sanders, S., Strandjord, L. and Mead, D., 2002; “Fiber-Optic Gyro Technology Trends
– A Honeywell Perspective”, Invited Paper, 15th Optical Fiber Sensors Conference
Technical Digest, Vol. 1, pp. 5-8.

Savage P. G., 2006; “A Unified Mathematical Framework for Strapdown Algorithm


Design” ; Journal of Guidance, Control and Dynamics,Vol. 29, No. 2,.

Savage P. G., 1998; “Strapdown Inertial Navigation Integration Algorithm Design Part
1: Attitude Algorithms”;· Journal of Guidance, Control and Dynamics, Vol 21, No 1,
Jan.

Savage P. G., 1998 “Strapdown Inertial Navigation Integration Algorithm Design Part
2: Velocity and Position Algorithms”; Journal of Guidance, Control and Dynamics,Vol
21, No. 2, Mar.

Savage, P. G., 1996; “A New Second-Order Solution for Strapped-Down Attitude


Computation” AIAA/JACC Guidance and Control Conf., Aug. Schon T. B., R.
Karlsson & F. Gustafsson, 2006; “The Marginalized Particle Filter in Practice”; IEEE,
AC Conf. March.

Schwarz, K. P., Wei, M. , 1994, Aided Versus Embedded A Comparison of Two


Approaches to GPS/INS Integration, Proceedings of IEEE Position Location and
Navigation Symposium, April 11-15, Las Vegas, pp. 314-321.

Shtessel, Y. B., 1995; “Decentralized Sliding Mode Control in Inertial Navigation


Systems”, American Control Conference, Seattle, Washington, June.

Siegwart R., I. R. Nourbakhsh, 2004; “Introduction to Autonomous Mobile Robots”,


MIT Press.

Smith S. G., 1987; “Ring Laser Gyros” Phys. Techno1ogy, 18 UK.

226
Subramanian H. V. K. Varadan, V. V. Varadan and M. J. Vellekoop, 1997; “Design and
Fabrication of Wireless Remotely Readable MEMS Based Microaccelerometers”;
Smart Mater. Struct. 6 730-738.

Teunissen P.J.G., P.J. de Jonge and C.C.J.M. Tiberius, 1995; “The Lambda-Method For
Fast GPS Surveying” Proceedings of International Symposium “GPS technology
applications”, Bucharest, Romania, September 26-29, pp. 203-210.

Teunissen P.J.G., 1995; The least-squares ambiguity decorrelation adjustment: a


method for fast GPS integer ambiguity estimation”, Journal of Geodesy, 70:65-82.

Teunissen P.J.G., 1994; “A new method for fast carrier phase ambiguity estimation.”
Proceedings IEEE Position, Location and Navigation Symposium PLANS '94, Las
Vegas, NV, April 11-15, pp. 562-573.

Titterton D. H., and J. Weston, 2004, “Strapdown Inertial Navigation Technology”, IEE
& AIAA, 2nd Edition.

Titterton D.H. & J.L. Weston, 1997, “Strap Down Inertial Navigation Technology”,
Peter Peregrinus Ltd., IEE, Londres.

Toran-Marti F. and J. V. Traveset, 2004; “The ESA EGNOS Project: The First Step of
the European Contribution to the Global Navigation Satellite System (GNSS)”;
Navigare Conference, Winterthur (Switzerland), June.

Torge Wolfgang, 2001, Geodesy, De Gruyter, NY.

Van Der Merwe R. ,2004; “Sigma-Point Kalman Filters for Probabilistic Inference in
Dynamic State-Space Models” Ph.D Thesis, School of Science & Engineering at
Oregon Health & Science University, April.

Van Der Water, H. y J. C. Willems, 1981; “The Certainty Equivalence Property in


Stochastic Control Theory”; IEEE-TAC; Vol. 26, Iss. 5, Oct. 1981.

Wang H.G. y T. C. Williams, 2008; “Strategic Inertial Navigation Systems”; IEEE


Control Systems Mag., Vol. 28, nº 1, Feb.

Wahr, J., 1999, Geodesy and Gravity, Zamisdat Press (FTP: zamisdat.mines.edu).

Wei, M., & Schwarz, K. P. , 1990; “A strapdown inertial algorithm using an earth-fixed
cartesian frame”. Navigation: Journal of the Institute of Navigation, 37(2), 153–167.

Wertz James R., (Editor); 1978; “Spacecraft Attitude Determination and Control”;
Kluwer Academic Publishers, Holanda.

World Geodetic System 1984, 2004; National Imagery Agency (NIMA) Technical
Report Nº TR8350-2 actualizado en junio.

227
Yazdi N., F.Ayazi & K. Najafi; 1998; “Micromachined Inertial Sensors”; IEEE, Proc.,
Vol. 86, No. 8, Ag.

Yinger C. H., W. A. Feess, V. Nuth, R.N. Haddad, 2003; “GPS Accuracy vs. Number of
NIMA Stations”, Proceedings of ION GPS Sept. 9-12.

Zadeh, L. A.; Desoer, Ch. A., 1963; Linear System Theory-The State Space Approach;
McGraw-Hill Book Co., N. York.

228

Вам также может понравиться