Вы находитесь на странице: 1из 530

Mecanica Analtica: Notas de Clase

Rodolfo Alexander Diaz Sanchez


Universidad Nacional de Colombia
Departamento de Fsica
Bogota, Colombia
9 de julio de 2011

Indice general
Introduction

XIII

1. Elementos b
asicos de Mec
anica Newtoniana
1.1. Cinem
atica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2. Din
amica: Leyes de Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3. Trabajo y energa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.4. Torque y momento angular . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.5. Din
amica de un sistema de partculas . . . . . . . . . . . . . . . . . . . . . .
1.5.1. Definici
on de centro de masa . . . . . . . . . . . . . . . . . . . . . . .
1.5.2. Sistemas de partculas no aislados . . . . . . . . . . . . . . . . . . . .
1.5.3. Momento angular y torque de un sistema de partculas . . . . . . . . .
1.5.4. Trabajo y energa de un sistema de partculas . . . . . . . . . . . . . .
1.5.5. Conservaci
on de la energa de un sistema de partculas . . . . . . . . .
1.5.6. Transformaci
on de la energa cinetica al sistema-C a partir del sistema
1.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2. Principio de DAlembert y ecuaciones de Lagrange
2.1. Ligaduras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2. Principio de DAlembert . . . . . . . . . . . . . . . . . . . . . . . .
2.3. Coordenadas generalizadas y ecuaciones de Lagrange . . . . . . . .
2.3.1. Energas cinetica y potencial en coordenadas generalizadas
2.3.2. Una simetra gauge o de calibraci
on para el Lagrangiano . .
2.4. Ecuaciones de Lagrange para potenciales generalizados . . . . . . .
2.5. Ecuaciones de Lagrange con fuerzas disipativas . . . . . . . . . . .
2.6. Algunas caractersticas de las cantidades generalizadas . . . . . . .
2.7. Relaci
on entre sistemas coordenados y sistemas de referencia . . .
2.8. Ejemplos de uso de la formulaci
on Lagrangiana . . . . . . . . . . .
2.8.1. Partcula en el espacio . . . . . . . . . . . . . . . . . . . . .
2.8.2. M
aquina de Atwood . . . . . . . . . . . . . . . . . . . . . .
2.8.3. Cuenta sobre un alambre . . . . . . . . . . . . . . . . . . .
2.8.4. Gauge electromagnetico en la formulaci
on Lagrangiana . . .
2.8.5. Un sistema ligado de dos masas . . . . . . . . . . . . . . . .
2.8.6. Aro sobre plano inclinado deslizante . . . . . . . . . . . . .
2.8.7. Un potencial generalizado para una fuerza central . . . . .
2.8.8. Partcula inmersa en un fludo . . . . . . . . . . . . . . . .
2.9. Ventajas del formalismo Lagrangiano . . . . . . . . . . . . . . . . .
2.10. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
ii

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
de laboratorio
. . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

1
1
2
3
4
5
5
5
7
10
11
13
13

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

14
14
16
17
21
21
22
24
25
26
27
27
28
29
30
30
32
34
35
36
36

INDICE GENERAL

iii

3. C
alculo variacional y multiplicadores de Lagrange
3.1. Algunos problemas pr
acticos de naturaleza variacional . . . . . . . . . . . . .
3.1.1. Minimizaci
on del tiempo de cada de una partcula . . . . . . . . . . .
3.1.2. Minimizaci
on de una superficie de revoluci
on . . . . . . . . . . . . . .
3.2. Aspectos fundamentales del c
alculo de variaciones . . . . . . . . . . . . . . .
3.2.1. C
alculo variacional en una dimensi
on . . . . . . . . . . . . . . . . . . .
3.2.2. C
alculo de variaciones multidimensional . . . . . . . . . . . . . . . . .
3.3. Soluci
on de los problemas de aplicaci
on planteados . . . . . . . . . . . . . . .
3.3.1. Minimizaci
on de la longitud de arco . . . . . . . . . . . . . . . . . . .
3.3.2. Minimizaci
on del tiempo de cada de una partcula: la braquist
ocrona
3.3.3. Minimizaci
on de una superficie de revoluci
on . . . . . . . . . . . . . .
3.4. Ligaduras y multiplicadores de Lagrange (opcional) . . . . . . . . . . . . . . .
3.4.1. Generalizaci
on a un conjunto arbitrario de variables y de ligaduras . .
3.5. Problemas variacionales con ligaduras (opcional) . . . . . . . . . . . . . . . .
3.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.

38
38
38
39
40
40
43
43
44
44
45
46
48
49
52

.
.
.
.
.
.
.
.
.
.
.
.

53
54
54
56
57
58
59
59
61
62
64
64
66

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

4. Principio variacional de Hamilton y ecuaciones de Lagrange


4.1. Aplicacion del c
alculo de variaciones al principio de Hamilton . . . . . . . . . . .
4.2. Extension del principio de Hamilton a algunos sistemas no hol
onomos . . . . . .
4.2.1. Significado fsico de los multiplicadores de Lagrange: fuerzas de ligadura .
4.2.2. Formalismo de los multiplicadores para ligaduras hol
onomas . . . . . . . .
4.3. Relaci
on entre el principio diferencial de DAlembert y el Principio variacional de
4.4. Aplicacion del principio de Hamilton con coordenadas dependientes . . . . . . . .
4.4.1. Bloque deslizante sobre una semiesfera . . . . . . . . . . . . . . . . . . . .
4.4.2. Aro sobre plano inclinado con condici
on de rodadura . . . . . . . . . . . .
4.4.3. Esfera en un hueco cilndrico . . . . . . . . . . . . . . . . . . . . . . . . .
4.5. Caractersticas b
asicas de una formulaci
on variacional . . . . . . . . . . . . . . .
4.6. Principio variacional para Lagrangianos que contienen a q (opcional) . . . . . . .
4.7. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

. . . . . .
. . . . . .
. . . . . .
. . . . . .
Hamilton
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

5. Simetras y cantidades conservadas (Lagrange)


5.1. Teoremas de conservaci
on y propiedades de simetra . . . . . . . . . . . . . . . . . . . . . . . .
5.1.1. Momento lineal y coordenadas globales de traslaci
on . . . . . . . . . . . . . . . . . . . .
5.1.2. Momento angular y coordenadas globales de rotaci
on . . . . . . . . . . . . . . . . . . . .
5.1.3. Consideraciones generales sobre simetras asociadas a coordenadas cclicas y cantidades
conservadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2. Funci
on energa y conservaci
on de la energa . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2.1. Relaci
on entre energa y funci
on energa . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2.2. Funci
on energa con fuerzas disipativas . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3. Teorema de Noether para sistemas discretos (opcional) . . . . . . . . . . . . . . . . . . . . . . .
5.3.1. Comentarios sobre el teorema de Noether . . . . . . . . . . . . . . . . . . . . . . . . . .
5.4. Ejemplos de aplicaci
on del teorema de Noether . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.4.1. Invarianza ante traslaci
on temporal y conservaci
on de la energa . . . . . . . . . . . . .
5.4.2. Invarianza ante traslaci
on espacial y conservacion del momento lineal . . . . . . . . . . .
5.4.3. Invarianza ante rotaciones espaciales y la conservaci
on del momento angular . . . . . . .
5.4.4. Transformaciones de Galileo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

69
69
71
73
74
75
76
77
78
82
83
83
84
86
88
90

iv

INDICE GENERAL

6. Ecuaciones de Movimiento de Hamilton


6.1. Consideraciones generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.2. Transformaciones de Legendre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.3. Generaci
on del Hamiltoniano y Ecuaciones de Hamilton . . . . . . . . . . . . . . . . . . . .
6.4. Algoritmo matricial para la obtenci
on del Hamiltoniano . . . . . . . . . . . . . . . . . . . .
6.4.1. Hamiltoniano para un cuerpo sometido a una fuerza central en coordenadas esfericas
6.4.2. Hamiltoniano de una carga no relativista inmersa en un campo electromagnetico . .
6.5. Forma Simplectica de las Ecuaciones de Hamilton . . . . . . . . . . . . . . . . . . . . . . . .
6.6. Coordenadas cclicas y teoremas de conservaci
on . . . . . . . . . . . . . . . . . . . . . . . .
6.7. El Hamiltoniano en diferentes sistemas coordenados . . . . . . . . . . . . . . . . . . . . . .
6.7.1. Hamiltoniano de un sistema masa resorte en diferentes sistemas coordenados . . . .
6.8. Problemas de aplicaci
on de las ecuaciones de Hamilton . . . . . . . . . . . . . . . . . . . . .
6.8.1. Partcula sobre superficie cilndrica . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.8.2. Ejemplo de aplicaci
on del algoritmo matricial . . . . . . . . . . . . . . . . . . . . . .
6.8.3. Pendulo sujeto a una recorrido parab
olico . . . . . . . . . . . . . . . . . . . . . . . .
6.9. Procedimiento de Routh . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.9.1. Partcula sometida a un potencial central atractivo por el metodo de Routh . . . . .
6.10. Derivacion de las ecuaciones de Hamilton a partir del principio variacional de Hamilton . .
6.11. El principio de mnima acci
on (opcional) . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.11.1. Algunas aplicaciones del principio de mnima acci
on . . . . . . . . . . . . . . . . . .
6.12. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7. Transformaciones can
onicas
7.1. Caracterizaci
on de las transformaciones can
onicas a traves del principio de Hamilton
7.2. Funciones generadoras de una transformaci
on can
onica . . . . . . . . . . . . . . . . .
7.3. Ejemplos de transformaciones can
onicas . . . . . . . . . . . . . . . . . . . . . . . . .
7.4. Transformaciones can
onicas para el oscilador arm
onico . . . . . . . . . . . . . . . . .
7.5. Transf. Can
onicas con la forma simplectica de las Ecs. de Hamilton . . . . . . . . . .
7.5.1. Ejemplos de transformaciones can
onicas con metodo matricial . . . . . . . . .
7.6. Acercamiento simplectico para transformaciones can
onicas dependientes del tiempo .
7.7. Ejemplos de transformaciones can
onicas . . . . . . . . . . . . . . . . . . . . . . . . .
7.7.1. Transformaci
on can
onica por conjugaci
on compleja . . . . . . . . . . . . . . .
7.7.2. Transformaci
on can
onica de rotaci
on . . . . . . . . . . . . . . . . . . . . . . .
7.7.3. Un sistema con dos grados de libertad . . . . . . . . . . . . . . . . . . . . . .
7.8. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

92
92
93
94
95
96
98
99
100
101
102
103
103
106
107
110
111
113
115
118
119

120
modificado 121
. . . . . . 122
. . . . . . 125
. . . . . . 127
. . . . . . 129
. . . . . . 131
. . . . . . 132
. . . . . . 134
. . . . . . 134
. . . . . . 135
. . . . . . 137
. . . . . . 138

8. Corchetes de Poisson y otros invariantes can


onicos
8.1. Corchetes de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.2. Propiedades de los corchetes de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.3. Corchetes de Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4. Otros invariantes can
onicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.5. Relaci
on entre la condici
on simplectica y las funciones generatrices (opcional) . . . . . . . . . .
8.6. Ecuaciones de movimiento con corchetes de Poisson . . . . . . . . . . . . . . . . . . . . . . . . .
8.7. Constantes de movimiento con corchetes de Poisson . . . . . . . . . . . . . . . . . . . . . . . .
8.8. Ejemplo de constantes de movimiento evaluadas por corchetes de Poisson . . . . . . . . . . . .
8.8.1. Sistema con dos grados de libertad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.8.2. Otro sistema con dos grados de libertad . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.8.3. Constante de movimiento del oscilador arm
onico . . . . . . . . . . . . . . . . . . . . . .
8.9. Transf. Can
onicas infinitesimales y corchetes de Poisson . . . . . . . . . . . . . . . . . . . . . .
8.10. Cambio de una funci
on del sistema bajo una transformaci
on can
onica en los enfoques pasivo y
activo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

140
140
142
143
144
144
146
147
148
148
149
151
152
154

INDICE GENERAL
8.11. Cambio del Hamiltoniano bajo una transformaci
on can
onica . . . . . . . . . . . . . . . . . . .
8.12. Cantidades conservadas e invarianzas del Hamiltoniano . . . . . . . . . . . . . . . . . . . . . .
8.12.1. El momento lineal total como generador de TCIs que generan traslaciones . . . . . .
8.12.2. El momento angular total como generador de TCIs que generan rotaciones . . . . . .
8.13. Construcci
on de TCs finitas a partir de TCIs . . . . . . . . . . . . . . . . . . . . . . . . . .
8.13.1. Aplicaci
on del operador evoluci
on temporal en el movimiento uniformemente acelerado
8.13.2. Aplicaci
on del operador evoluci
on temporal en el movimiento arm
onico simple . . . .
8.13.3. Aplicaci
on del operador evoluci
on parametrica para la generaci
on de rotaciones . . . .
8.14. Propiedades de los corchetes de Poisson de los momentos angulares . . . . . . . . . . . . . . .
8.14.1. Ejemplos de aplicaci
on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.15. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

v
.
.
.
.
.
.
.
.
.
.
.

155
156
158
158
160
162
162
164
164
167
168

9. Teora de Hamilton-Jacobi y variables acci


on-
angulo
9.1. Ecuaci
on de Hamilton Jacobi para la funci
on principal de Hamilton . . . . . . . . . . . . . . .
9.1.1. Interpretaci
on fsica de las soluciones de Hamilton-Jacobi . . . . . . . . . . . . . . . . .
9.2. Soluci
on del oscilador arm
onico por el metodo de Hamilton-Jacobi . . . . . . . . . . . . . . . .
9.2.1. Oscilador arm
onico unidimensional con el metodo de Hamilton Jacobi . . . . . . . . . .
9.2.2. Oscilador arm
onico bidimensional anisotr
opico . . . . . . . . . . . . . . . . . . . . . . .
9.2.3. Oscilador arm
onico bidimensional isotr
opico . . . . . . . . . . . . . . . . . . . . . . . . .
9.3. Ecuaci
on de Hamilton Jacobi para la funci
on caracterstica de Hamilton . . . . . . . . . . . . .
9.4. Paralelismo entre el formalismo de Hamilton-Jacobi y el formalismo restringido de HamiltonJacobi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.5. Separacion de variables en la ecuaci
on de Hamilton-Jacobi . . . . . . . . . . . . . . . . . . . . .
9.5.1. Coordenadas ignorables y separabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.5.2. Condiciones m
as generales para la separabilidad . . . . . . . . . . . . . . . . . . . . . .
9.6. Fuerzas centrales en el formalismo de Hamilton-Jacobi . . . . . . . . . . . . . . . . . . . . . . .
9.6.1. Problema bidimensional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.6.2. La din
amica de las fuerzas centrales como problema tridimensional . . . . . . . . . . .
9.7. Otros problemas de aplicaci
on con el formalismo de HJ . . . . . . . . . . . . . . . . . . . . . .
9.7.1. Partcula sometida a potencial arm
onico y campo magnetico . . . . . . . . . . . . . . .
9.7.2. Partcula bajo potencial conservativo en coordenadas elipsoidales . . . . . . . . . . . . .
9.8. Variables acci
on-
angulo para sistemas con un grado de libertad . . . . . . . . . . . . . . . . . .
9.8.1. Formulaci
on general de la variables acci
on-
angulo en una dimensi
on . . . . . . . . . . .
9.9. Problemas de variables acci
on-
angulo con un grado de libertad . . . . . . . . . . . . . . . . . .
9.9.1. El oscilador arm
onico unidimensional en variables acci
on-
angulo . . . . . . . . . . . . .
9.9.2. Partcula en movimiento peri
odico en una dimension bajo un potencial V (x) = F |x| . .
9.10. Variables acci
on-
angulo para sistemas completamente separables1 . . . . . . . . . . . . . . . . .
9.10.1. Movimientos peri
odicos m
ultiples de libraci
on . . . . . . . . . . . . . . . . . . . . . . . .
9.10.2. Movimientos cuasi peri
odicos m
ultiples de rotaci
on . . . . . . . . . . . . . . . . . . . . .
9.10.3. Movimientos peri
odicos simples y m
ultiples tipo libraci
on . . . . . . . . . . . . . . . . .
9.10.4. Variables acci
on-
angulo para sistemas degenerados . . . . . . . . . . . . . . . . . . . . .
9.11. Comentarios finales sobre las variables acci
on-
angulo . . . . . . . . . . . . . . . . . . . . . . . .
9.12. El problema de Kepler en variables acci
on-
angulo . . . . . . . . . . . . . . . . . . . . . . . . . .
9.12.1. Variables acci
on-
angulo teniendo en cuenta la degeneraci
on . . . . . . . . . . . . . . . .
9.13. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

169
169
171
172
172
174
175
176

178
180
181
182
183
184
185
187
187
189
192
194
196
196
197
198
200
201
202
204
207
207
212
213

En lo que sigue del captulo no adoptaremos la convenci


on de suma de ndices repetidos a menos que se indique lo contrario.

vi
10.Fuerzas centrales
10.1. Reduccion al problema equivalente de una partcula . . . . . . . . . . . . . .
10.2. Ecuaciones de movimiento y primeras integrales . . . . . . . . . . . . . . . . .
10.3. El problema unidimensional equivalente y la clasificaci
on de orbitas . . . . . .
10.4. An
alisis de curvas de potencial efectivo . . . . . . . . . . . . . . . . . . . . . .
10.4.1. Potencial efectivo para interacci
on kepleriana . . . . . . . . . . . . . .
10.4.2. Potencial efectivo equivalente para dos cuerpos no interactuantes . . .
10.4.3. Potencial atractivo proporcional al inverso del cubo de la distancia . .
10.4.4. Potencial efectivo para fuerza restauradora lineal . . . . . . . . . . . .
10.4.5. Consideraciones generales sobre curvas de potencial efectivo . . . . .
10.5. El teorema del virial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.5.1. Otras aplicaciones del teorema del virial . . . . . . . . . . . . . . . . .
10.6. Ecuaci
on de la orbita y potenciales integrables . . . . . . . . . . . . . . . . .
10.7. Condicion para orbitas circulares estables e inestables . . . . . . . . . . . . .

10.8. Orbitas
circulares perturbadas a primer orden . . . . . . . . . . . . . . . . . .

10.9. Orbitas circulares perturbadas a orden superior al primero y condiciones para


(teorema de Bertrand) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

10.10.Orbitas
circulares perturbadas usando variables acci
on-
angulo (Opcional) . .
10.11.El problema de Kepler: Ley del inverso al cuadrado (atractiva) . . . . . . . .
10.12.Soluci
on para la orbita en el problema de Kepler . . . . . . . . . . . . . . . .
10.12.1.Clasificaci
on de las orbitas seg
un los valores de E y l . . . . . . . . . .
10.12.2.Condici
on de circularidad . . . . . . . . . . . . . . . . . . . . . . . . .

10.12.3.Orbitas
elpticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.13.Movimiento en el tiempo en el problema de Kepler . . . . . . . . . . . . . . .
10.13.1.Dependencia temporal en el caso parab
olico . . . . . . . . . . . . . . .
10.13.2.Dependencia temporal para el movimiento elptico . . . . . . . . . . .
10.13.3.Tercera ley de Kepler . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.14.Vector de Laplace-Runge-Lenz . . . . . . . . . . . . . . . . . . . . . . . . . .
10.15.Parametrizaci
on de las orbitas keplerianas en el espacio . . . . . . . . . . . .
10.16.Problema de Kepler en variables acci
on-
angulo revisado (opcional) . . . . . .
10.16.1.Determinaci
on del Hamiltoniano en terminos de variables de acci
on .
10.16.2.Relaci
on entre variables acci
on-
angulo y variables orbitales . . . . . .
10.17.Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

INDICE GENERAL

. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
orbitas cerradas
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .

11.Colisiones y dispersi
on
11.1. Colisiones y dispersiones generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.1.1. Caso especial 1: reacci
on de captura . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.1.2. Caso especial 2, blanco en reposo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.2. Dispersi
on en un campo de fuerzas centrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.2.1. Dispersi
on de Rutherford . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.2.2. Caractersticas generales de la secci
on eficaz . . . . . . . . . . . . . . . . . . . . . . . . .
11.3. Transformaci
on del problema de la dispersi
on entre coordenadas de laboratorio y centro de masa
para blanco en reposo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.3.1. Relaci
on entre el angulo de dispersi
on medido por el laboratorio y el medido por el centro
de masa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.3.2. Caracterizaci
on del factor de la colisi
on . . . . . . . . . . . . . . . . . . . . . . . . . .
11.3.3. Secci
on eficaz en terminos de los dos angulos de dispersi
on . . . . . . . . . . . . . . . .
11.4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

215
215
217
221
222
222
225
227
228
228
229
231
231
234
236
238
239
240
241
243
244
244
245
246
246
248
249
251
253
254
255
259
261
261
264
264
266
270
271
275
276
277
278
281

INDICE GENERAL

vii

12.Interludio matem
atico: Matrices, vectores y tensores cartesianos
12.1. Propiedades b
asicas de las matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.1.1. Determinantes y trazas de matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.1.2. Matrices rectangulares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.2. Interpretaci
on activa y pasiva de las transformaciones lineales: cambios de base . . . . . . . . .
12.2.1. Transformaciones de similaridad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.3. Problema de valores propios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.4. Propiedades b
asicas de las matrices ortogonales . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.4.1. Matrices ortogonales y norma de vectores complejos (opcional) . . . . . . . . . . . . . .
12.4.2. Transformaciones ortogonales propias e impropias . . . . . . . . . . . . . . . . . . . . .
12.5. Clasificaci
on de vectores y escalares por sus propiedades de paridad . . . . . . . . . . . . . . .
12.6. Transformaciones ortogonales propias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.6.1. Matrices ortogonales reales propias en tres dimensiones . . . . . . . . . . . . . . . . . .
12.7. Matriz adjunta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.8. Matrices unitarias y cambios de base (opcional) . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.9. Matrices Hermticas y simetricas reales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.9.1. Problema de valores propios de matrices hermticas en tres dimensiones . . . . . . . . .
12.9.2. Matrices simetricas reales en R3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.10.Matrices normales (opcional) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.11.Problema de valores propios modificado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.11.1.Diagonalizaci
on simult
anea de dos formas cuadr
aticas . . . . . . . . . . . . . . . . . . .
12.12.Interpretaci
on geometrica de la diagonalizaci
on simult
anea de una matriz positiva y otra definida
positiva (opcional)2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.12.1.Argumentaci
on por geometra analtica . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.12.2.Argumentaci
on por geometra de Riemann . . . . . . . . . . . . . . . . . . . . . . . . . .
12.13.Tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.14.Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

282
282
285
287
287
288
290
291
293
294
295
297
297
298
299
302
303
304
305
307
310

13.Cinem
atica del cuerpo rgido
13.1. Coordenadas independientes de un cuerpo rgido . . . . .
13.2. Asignacion de los grados de libertad de un cuerpo rgido .
13.3. Transformaciones ortogonales . . . . . . . . . . . . . . . .

13.4. Angulos
de Euler . . . . . . . . . . . . . . . . . . . . . . .
13.5. Par
ametros de Cayley-Klein . . . . . . . . . . . . . . . . .
13.6. Teorema de Euler para el movimiento del cuerpo rgido .
13.7. Rotaciones finitas . . . . . . . . . . . . . . . . . . . . . . .
13.7.1. Forma matricial de la f
ormula de rotaci
on . . . . .
13.7.2. Relaci
on entre n y y los angulos de Euler . . . .
13.8. Rotaciones infinitesimales . . . . . . . . . . . . . . . . . .
13.9. Raz
on de cambio de un vector visto por sistemas rotantes
13.9.1. Raz
on de cambio por argumentos vectoriales . . .
13.9.2. Raz
on de cambio por argumentos algebr
aicos . . .
13.9.3. Segunda derivada en el sistema rotante . . . . . .
13.10.Sistemas no inerciales rotantes . . . . . . . . . . . . . . .
13.11.Velocidad angular en terminos de los angulos de Euler . .

323
323
325
327
328
331
331
334
335
336
337
341
341
342
344
345
346

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

311
311
314
317
322

Esta secci
on no es muy u
til para c
alculos pr
acticos, pero aporta una gran claridad conceptual sobre la diagonalizaci
on simult
anea
de dos formas cuadr
aticas. Puede omitirse en una primera lectura.

INDICE GENERAL

viii

14.Ecuaciones de movimiento del cuerpo rgido


14.1. Momento angular y energa cinetica de movimiento alrededor de un punto . . . . . . . . . .
14.2. Tensor de inercia y momento de inercia . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14.3. Compendio de propiedades del tensor de inercia . . . . . . . . . . . . . . . . . . . . . . . . .
14.4. Ecuaciones de Euler para el movimiento de un cuerpo rgido . . . . . . . . . . . . . . . . . .
14.4.1. Ecuaciones de Euler con el formalismo de Lagrange . . . . . . . . . . . . . . . . . . .
14.5. Precesi
on libre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14.5.1. Construcci
on de Poinsot para la precesi
on libre . . . . . . . . . . . . . . . . . . . . .
14.5.2. Elipsoide de Binet y el momento angular . . . . . . . . . . . . . . . . . . . . . . . .
14.5.3. Elipsoide de Binet, rotaci
on estacionaria y condiciones para la rotaci
on estable . . .
14.5.4. Soluci
on algebraica para la precesi
on libre con simetra axial . . . . . . . . . . . . .
14.5.5. Estabilidad de s
olidos irregulares por metodos algebr
aicos . . . . . . . . . . . . . . .
14.6. La peonza simetrica pesada con un punto fijo . . . . . . . . . . . . . . . . . . . . . . . . . .
14.6.1. Reducci
on del problema a cuadraturas . . . . . . . . . . . . . . . . . . . . . . . . . .
14.6.2. An
alisis cualitativo del movimiento . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14.6.3. An
alisis cuantitativo aproximado de la peonza r
apida . . . . . . . . . . . . . . . . .
14.6.4. Peonza con precesi
on regular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14.6.5. Peonza inicialmente vertical . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14.6.6. Efectos de fricci
on, torques adicionales y aplicaciones de la peonza simetrica pesada
14.7. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15.Oscilaciones
15.1. Peque
nas oscilaciones y equilibrio estable . . . . . . . . . . . . . . . . . . .
15.2. Soluci
on de las ecuaciones de movimiento como problema de valores propios
15.2.1. Un ejemplo con dos grados de libertad . . . . . . . . . . . . . . . . .
15.3. Problema de valores propios con degeneraci
on . . . . . . . . . . . . . . . . .
15.3.1. Un ejemplo bidimensional con degeneraci
on . . . . . . . . . . . . . .
15.4. Frecuencias de vibraci
on libre y coordenadas normales . . . . . . . . . . . .
15.5. Vibraciones libres de una molecula triat
omica . . . . . . . . . . . . . . . . .
15.6. Vibraciones forzadas y amortiguadas . . . . . . . . . . . . . . . . . . . . . .
15.6.1. Vibraciones forzadas . . . . . . . . . . . . . . . . . . . . . . . . . . .
15.6.2. Vibraciones amortiguadas . . . . . . . . . . . . . . . . . . . . . . . .
15.6.3. Vibraciones amortiguadas forzadas . . . . . . . . . . . . . . . . . . .
15.7. Ejemplos de oscilaciones anarm
onicas . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

350
350
354
358
362
364
365
366
367
369
370
372
372
372
377
380
384
386
387
389

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

390
390
393
394
397
398
398
401
405
405
406
408
410

16.Relatividad especial
16.1. Propiedades de las transformaciones de Lorentz puras . . . . . . . . . . . . . . .
16.2. Transformaciones de Lorentz restringidas . . . . . . . . . . . . . . . . . . . . . .
16.3. Transformaciones de Lorentz usando espacios de Riemann de cuatro dimensiones
16.4. El concepto de formulaci
on covariante en Fsica . . . . . . . . . . . . . . . . . . .
16.5. Formulaciones covariantes en el espacio de Minkowski . . . . . . . . . . . . . . .
16.6. Fuerza y momento en relatividad especial . . . . . . . . . . . . . . . . . . . . . .
16.7. Energa y relaci
on momento-energa en relatividad especial . . . . . . . . . . . .
16.8. Formulaci
on Lagrangiana de la mec
anica relativista . . . . . . . . . . . . . . . . .
16.9. Formulaci
on no manifiestamente covariante . . . . . . . . . . . . . . . . . . . . .
16.9.1. Movimiento bajo una fuerza constante (hiperb
olico) . . . . . . . . . . . .
16.9.2. Oscilador arm
onico unidimensional relativista . . . . . . . . . . . . . . . .
16.9.3. Movimiento de partcula cargada en un campo magnetico . . . . . . . . .
16.10.Formulaciones lagrangianas covariantes . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

413
413
417
421
424
426
430
432
435
436
437
439
440
441

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

INDICE GENERAL

ix

17.Teora can
onica de perturbaciones
17.1. Metodo de variaci
on de constantes para perturbaciones dependientes del tiempo . . . . . . . .
17.2. Teora de perturbaci
on dependiente del tiempo en terminos de los par
ametros de movimiento .
17.3. Variaci
on peri
odica y variaci
on secular de una perturbaci
on . . . . . . . . . . . . . . . . . . . .
17.4. Ejemplos del uso de la teora de perturbaci
on dependiente del tiempo . . . . . . . . . . . . . .
17.4.1. Oscilador arm
onico como perturbaci
on de la partcula libre . . . . . . . . . . . . . . . .
17.4.2. Pendulo plano con amplitud finita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17.4.3. Perturbaciones en el problema de Kepler acotado . . . . . . . . . . . . . . . . . . . . . .
17.5. Teora de perturbaci
on independiente del tiempo a primer orden con un grado de libertad . . .
17.5.1. Pendulo plano con oscilaci
on finita usando metodo de perturbaci
on independiente del
tiempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17.6. Teora de perturbaci
on independiente del tiempo para orden superior al primero y varios grados
de libertad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17.6.1. Oscilador anarm
onico unidimensional . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17.7. Teora de perturbaciones independiente del tiempo en presencia de degeneraci
on . . . . . . . .
17.8. Algunos aspectos cualitativos generales de la teora cl
asica de perturbaciones . . . . . . . . . .
17.9. Invariantes adiab
aticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17.9.1. Invarianza adiab
atica del oscilador arm
onico . . . . . . . . . . . . . . . . . . . . . . . .
17.9.2. Variaci
on asint
otica de J para el oscilador arm
onico (opcional) . . . . . . . . . . . . . .
17.9.3. Un invariante exacto del oscilador arm
onico con frecuencia dependiente del tiempo (opcional) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17.9.4. Invariantes adiab
aticos de partculas cargadas en campos electromagneticos . . . . . . .

445
446
447
448
449
449
452
456
457

18.Formulaci
on Lagrangiana y Hamiltoniana para Sistemas Contnuos y Campos
18.1. Ecuaci
on de continuidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
18.2. Transicion de un sistema discreto a un sistema contnuo . . . . . . . . . . . . . . . . . . . . . .
18.3. Formulaci
on Lagrangiana en una dimensi
on para sistemas contnuos con una sola variable de
campo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
18.4. Formulaci
on Lagrangiana en tres dimensiones para sistemas contnuos con un n
umero arbitrario
de variables de campo (Teora cl
asica de campos) . . . . . . . . . . . . . . . . . . . . . . . . . .
18.5. El tensor esfuerzo energa y teoremas de conservaci
on asociados . . . . . . . . . . . . . . . . . .
18.5.1. Interpretaci
on fsica de T0 : densidad de energa y vector de Poynting . . . . . . . . . .
18.5.2. Interpretaci
on fsica de Ti j : densidad de momento lineal y tensor de esfuerzos . . . . . .
18.5.3. Energa y momento total del sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
18.5.4. Densidad de momento angular y momento angular total . . . . . . . . . . . . . . . . . .
18.6. Formulaci
on Hamiltoniana para medios contnuos . . . . . . . . . . . . . . . . . . . . . . . . . .
18.6.1. Propiedades b
asicas de H . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
18.6.2. Densidades generalizadas y corchetes de Poisson . . . . . . . . . . . . . . . . . . . . . .
18.6.3. Formulaci
on por corchetes de Poisson utilizando descomposici
on de Fourier . . . . . . .
18.7. Ejemplos de teoras de campos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
18.7.1. Un modelo juguete . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
18.8. Teora de campos relativista . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
18.9. Algunas teoras de campos relativistas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
18.9.1. Campo escalar complejo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
18.9.2. Ecuaci
on de seno Gordon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

478
478
482

460
461
464
466
467
468
469
472
473
475

485
486
489
490
491
495
496
497
499
500
501
504
504
506
510
511
514

Preface
Estas notas de clase tienen como objetivo ser una gua para un curso de mec
anica analtica, en donde los
principios de la mec
anica cl
asica se examinan a la luz de las formulaciones Lagrangiana y Hamiltoniana y
las variantes que de ellas se derivan. Estas formulaciones ubican a la energa en el papel fundamental que las
fuerzas tienen en la formulaci
on Newtoniana. Quiz
as el aspecto m
as atractivo de estas formulaciones consiste
en su poder para enlazar las simetras de un sistema con las constantes de movimiento, y en la riqueza de
estrategias para extraer informaci
on del sistema sin resolver explcitamente las ecuaciones de movimiento. Estos
aspectos se enfatizan fuertemente a lo largo del texto, aunque en algunos casos se estudia la solucion completa
de acuerdo con la conveniencia y la simplicidad de estas soluciones. Se ha pretendido enfatizar en aspectos que
en opini
on del autor, han presentado fuerte dificultad en el desarrollo de las clases. A manera de ejemplo, la
discusi
on del algebra matricial que precede al estudio de la cinem
atica del cuerpo rgido es considerablemente
extensa y detallada haciendo enfasis tanto en lo geometrico como en lo algebr
aico. Debe notarse sin embargo
que el contenido de esta secci
on de algebra matricial va m
as all
a de las necesidades del curso presente, lo cual
tiene como fin preparar al estudiante para trabajar no solo en los espacios euclidianos Rn sino tambien en los
espacios unitarios Cn que juegan un papel fundamental en mec
anica cu
antica. Los captulos que se incluyen
son en opini
on del autor de gran importancia para la formaci
on general del Fsico y constituyen el punto de
partida de muchas ramas de la Fsica.
Es muy claro a lo largo de la lectura de las notas, que estas u
ltimas se han generado con una influencia
considerable del cl
asico texto de Herbert Goldstein, especialmente de la segunda y tercera edici
on. No obstante,
existen cambios de enfoque y/o presentaci
on de numerosas unidades tem
aticas, debidos a la influencia de otros
autores (tales como Jose, Saletan, Cromer, Whittaker, Marion etc.), as como de algunos abordajes propios
del autor. A manera de ejemplo, los angulos de Euler se han introducido de manera que no solo quede claro
el algoritmo de rotaci
on, sino la necesidad de dicho algoritmo. Se ha realizado un considerable esfuerzo por
presentar de manera clara la filosofa e implementaci
on del metodo de Hamilton-Jacobi. La mayor parte de
herramientas matem
aticas necesarias se han aislado en captulos independientes a fin de dar m
as flexibilidad
al texto y con el fin de que el lector las capture en su esencia y no las asocie a problemas muy especficos
de la Fsica, lo cual dificulta en general la aplicaci
on de estas herramientas en otros escenarios de la Fsica
diferentes a los aprendidos. Algunas secciones se han indicado como opcionales, a fin de facilitar al lector una
primera lectura, y al mismo tiempo, darle al texto la riqueza necesaria para ir m
as all
a de lo estrictamente
b
asico, sugiriendo caminos que incentiven la curiosidad del lector.
Para una adecuada comprensi
on de estas notas, el lector debe tener conocimientos a nivel introductorio
sobre mec
anica newtoniana, as como de algebra lineal y c
alculo diferencial e integral. En algunos pasajes
aislados se asume un conocimiento b
asico de electricidad, magnetismo y ondas.
El captulo 1 es un repaso de la mec
anica cl
asica en la llamada formulaci
on Newtoniana en donde la
fuerza es la cantidad din
amica central. El captulo 2 nos presenta el principio de DAlembert y las ecuaciones de
Lagrange, enfatizando que estas formulaciones apuntan a resolver dos problemas importantes en la din
amica
de sistemas cl
asicos: (a) excluir a las ligaduras de la formulaci
on debido a la dificultad que usualmente se
presenta para obtenerlas y (b) trabajar solo con los grados de libertad independientes, evitando las coordenadas
redundantes. El captulo 3 es un suplemento matem
atico sobre el c
alculo variacional. A pesar de que este
suplemento ser
a aplicado mayormente en el llamado principio variacional de Hamilton, la exposici
on muestra
la posibilidad de aplicar esa herramienta matem
atica en otros ambitos de la Fsica. El captulo 4 trata sobre la
formulaci
on integral del formalismo de Lagrange, cuya formulaci
on diferencial fue presentada en el captulo 2.
x

PREFACE

xi

En el captulo 5, se presenta una de las ventajas notables de la formulaci


on de Lagrange, a saber la explotaci
on
sistem
atica de las simetras del sistema y su relaci
on con las cantidades conservadas.
En el captulo 6 se presenta la formulaci
on de Hamilton de la mec
anica cl
asica en la cual se sustituyen
las coordenadas y velocidades generalizadas por las coordenadas generalizadas y momentos conjugados, se
discutir
a la ventaja de trabajar con este nuevo sistema de variables (denominadas variables can
onicas), as como
las ventajas de pasar de un sistema de n ecuaciones diferenciales de segundo orden, a un sistema de 2n
ecuaciones diferenciales de primer orden. Puesto que la funci
on Hamiltoniana se puede expresar en cualquier
conjunto de variables can
onicas, es necesario estudiar la relaci
on que hay entre los diversos conjuntos de
variables can
onicas, as como las transformaciones que nos llevan de un conjunto de variables can
onicas a otro,
este ser
a el tema del captulo 7. Una forma alternativa de presentar las ecuaciones de Hamilton, es a traves
de diversos invariantes can
onicos, entre los cuales se destacan los llamados corchetes de Poisson, con los
cuales las simetras y constantes de movimiento se pueden identificar con gran facilidad, este ser
a el tema del
captulo 8. Por otra parte, una elecci
on adecuada de variables can
onicas puede conducirnos a trivializar las
ecuaciones de movimiento (ecuaciones de Hamilton), en cuyo caso la tarea principal consiste en encontrar la
transformaci
on del sistema can
onico original al sistema can
onico que trivializa dichas ecuaciones, esta es la
esencia de la teora de Hamilton-Jacobi, presentada en el captulo 9.
En este punto culmina la descripci
on de estas formulaciones alternativas de la mec
anica cl
asica. En los
captulos posteriores, se describen problemas cl
asicos especficos que se abordar
an con una formulaci
on Lagrangiana y/o Hamiltoniana. En el captulo 10 se aborda el problema de las fuerzas centrales, y el tipo de
orbitas que dichas fuerzas generan. Como caso particular importante, se estudia en detalle el problema de
Kepler. En el captulo 11, se estudia la teora de colisiones y dispersi
on, con especial enfasis en la teora de la
dispersi
on por potenciales centrales. Otro interludio matem
atico es presentado en el captulo 12 concerniente
a matrices, vectores y tensores cartesianos, en este captulo se desarrollan diversas herramientas matem
aticas
necesarias para captulos subsecuentes. En particular para el captulo 13 de cinem
atica del cuerpo rgido, en el
cual se analiza el movimiento general de un cuerpo rgido, utilizando la parametrizaci
on por angulos de Euler
y la parametrizaci
on eje-
angulo. En tal captulo se analiza adem
as la raz
on de cambio de un vector visto por
un sistema rotante, lo cual nos permitir
a estudiar con naturalidad a los sistemas no inerciales rotantes. En
el captulo 14 se estudia la din
amica del cuerpo rgido, privilegiando el estudio de la precesi
on libre y de la
peonza simetrica pesada con punto fijo. El captulo 15 sobre oscilaciones, estudia el problema de la obtenci
on
de los modos normales de oscilaci
on (desacople de las ecuaciones diferenciales), de un conjunto de osciladores
acoplados, como un problema de valores propios modificado que involucra matrices positivas. Este abordaje del
problema posee la ventaja (con respecto a la forma tradicional utilizada en los cursos de oscilaciones y ondas)
que es extendible a coordenadas generalizadas, incluso si estas no est
an asociadas a un sistema ortogonal de
vectores unitarios.
En el captulo 16 se introduce la formulaci
on Lagrangiana y Hamiltoniana de la relatividad especial. Se
ha utilizado el espacio con eje temporal imaginario ict, con metrica trivial. A pesar de que la mayor parte de
textos de relatividad modernos privilegian la metrica g con eje real, el uso de un eje temporal imaginario
nos permitir
a aprovechar la teora de matrices ortogonales desarrollada en los captulos 12 y 13. Por otra
parte, dado que no se abordar
a la relatividad general, ambas escogencias poseen aproximadamente las mismas
ventajas. En todo caso, la traducci
on entre las dos formulaciones se presenta en la secci
on 16.3.
En el captulo 17 se introduce la teora can
onica de perturbaciones dependiente e independiente del tiempo,
basada en el formalismo de Hamilton-Jacobi. Se analizar
a adem
as el fen
omeno de la invarianza adiab
atica,
para lo cual las variables acci
on-
angulo ser
an particularmente ventajosas.
Finalmente, el captulo 18 estudia la formulaci
on Lagrangiana y Hamiltoniana para la mec
anica de medios
contnuos (teora cl
asica de campos), tanto en el regimen no-relativista como en el relativista, estableciendo la
ecuaci
on de continuidad para el flujo de cualquier medio contnuo, y la conservaci
on de la carga generalizada.
Este formalismo es aplicable a todo tipo de medios contnuos tales como campos electromagneticos, campos
de presiones, de temperatura, fludos etc. No obstante, en el captulo 18 nos restringimos a describir modelos
suficientemente simples para ilustrar los principios fundamentales.
El material cubierto en estas notas est
a pensado para dos cursos cada uno de 16 semanas con una intensidad
de 4 horas semanales. Complementado quizas, con una introducci
on a la teora del caos cl
asico. Por supuesto,

PREFACE

xii

los captulos 3 y 12 relacionados con herramientas matem


aticas, podr
an tomarse a diferentes ritmos o grados
de detalle, dependiendo del nivel de preparaci
on de los lectores en estos temas. Varias distribuciones en la
presentaci
on de los temas son posibles. Si se toma el orden de captulos en estas notas, un primer curso puede
ser hasta el captulo 11, siendo los captulos remanentes para un segundo curso. Sin embargo, una vez estudiado
el captulo 6 es posible saltar directamente al captulo 10 y continuar la secuencia de captulos obviando algunas
secciones (por ejemplo, la secci
on 10.16 en la que se trata el problema de Kepler con variables acci
on-
angulo),
con excepci
on del captulo 17, el cual depende fuertemente de la formulaci
on de Hamilton-Jacobi.
Vale la pena resaltar que el material presente son notas de clase y no un libro de texto. Por esta raz
on
aparecen algunos desarrollos en excesivo detalle, ya que fueron producto del ejercicio directo de preparaci
on
para la clase. Espero que tales desarrollos no se conviertan en un distractor para el lector, quien puede obviar
estos detalles de ser necesario. No obstante, considero que las notas en su presente forma est
an autocontenidas
para ser usadas en una clase, o para autoaprendizaje.
Quiero expresar mis agradecimientos a los estudiantes del Departamento de Fsica de la Universidad Nacional de Colombia, sede Bogot
a, por sus contnuas contribuciones y observaciones sobre el texto y el curso en
general. Al profesor Eduardo Brieva, quien fuera mi instructor de mec
anica analtica en mis a
nos de estudiante,
y a quien debo mi comprensi
on de buena parte del material aqu presentado. A los profesores John Morales y
William Herrera por las discusiones sobre varios temas que contribuyeron a madurar el presente texto. A toda
mi familia por su constante apoyo cuando las vicisitudes parecan oscurecer el camino. A mis hijos Iris Soraya
y David Leandro, por ser siempre una fuerza motora de mi existencia.

Rodolfo Alexander Diaz


Facultad de Ciencias. Departamento de Fsica
Universidad Nacional de Colombia
Bogot
a, Octubre de 2011.

Introduction
En las formulaciones Lagrangiana y Hamiltoniana de la Mec
anica Cl
asica (as como en sus formulaciones
derivadas), existen varias estrategias que aportan un considerable valor agregado con respecto a la formulaci
on
Newtoniana. En las presentes notas se ha procurado enfatizar reiteradamente en aquellos puntos que en opini
on
del autor, constituyen los valores agregados m
as fuertes.
Discutiremos brevemente dos aspectos que constituyen la motivaci
on de una formulaci
on Lagrangiana: (a)
La eliminaci
on de las fuerzas de ligadura, de las ecuaciones de movimiento y (b) el uso del mnimo n
umero
posible de coordenadas. Para comprender la motivaci
on del incizo (a) bastar
a que el lector examine con cuidado
un problema como el de una partcula que desliza sobre una trayectoria hiperb
olica, e intente encontrar el valor
de la fuerza normal (fuerza de ligadura) que mantiene a la partcula sobre la trayectoria en cuesti
on. Para el
incizo (b) basta con decir que cuando un conjunto de N partculas est
an ligadas (por ejemplo si las distancias
entre ellas son constantes), el n
umero de coordenadas independientes es menor que 3N , pero en la formulaci
on
Newtoniana tendremos que plantear las ecuaciones para las 3N coordenadas, obteniendo as informaci
on
redundante, para posteriormente incorporar la ligadura. Hay entonces un considerable ahorro al elaborar una
formulaci
on en donde de entrada se trabaja solo sobre coordenadas independientes. Esta misma filosofa se
conserva en la formulaci
on Hamiltoniana.
Otra ventaja de estas formulaciones consiste en que permitir
a un uso m
as sistem
atico de las simetras del
sistema para extraer informaci
on total o parcial de este.
De otra parte, aunque a traves del texto se estudian problemas fsicos especficos, es tambien com
un abordar
temas introduciendo un pensamiento fsico abstracto, en el sentido de que ciertos aspectos estructurales nos
dar
an informaci
on parcial del sistema, independiente de los detalles de este. A manera de ejemplo: para muchos
sistemas fsicos se puede construr una cantidad denominada Lagrangiano, y que depende de un conjunto de
coordenadas generalizadas qi , velocidades generalizadas qi y el tiempo
L = L (q1 , . . . , qn , q1 , . . . , qn ; t)
supongamos que un Lagrangiano es tal que aparece la velocidad generalizada qk pero no aparece su coordenada
generalizada asociada qk , cuando esto ocurre existe una cantidad que es constante de movimiento, denominada
momento conjugado a qk
L
pk
= cte
qk
esta caracterstica solo depende de un aspecto estructural del Lagrangiano, no de los detalles del sistema, ni
siquiera importa si el sistema es mec
anico, electrico o de otra naturaleza.
Otro aspecto que nos introduce en el pensamiento fsico abstracto es la introducci
on constante de cantidades generalizadas. Las coordenadas generalizadas son simplemente las variables mnimas independientes
de un sistema y no tienen que ser necesariamente variables de posici
on. As mismo, q no es necesariamente
una velocidad lineal. Una densidad generalizada (x, t) es cantidad de carga generalizada por unidad de
volumen, donde la carga generalizada es cualquier cantidad fsica escalar tal como la carga electrica, la masa,
la energa, la probabilidad etc. A esta cantidad escalar se le puede asociar una propiedad de transporte a traves
de una densidad de corriente generalizada, no importa si se transporta energa, masa, carga electrica, probabilidad etc. La din
amica de estas densidades y densidades de corriente generalizada ser
an v
alidas para estos
y muchos otros escenarios al tiempo. En particular, la formulaci
on de la ecuaci
on de continuidad adquirir
a un
poder extraordinario con esta forma de pensamiento generalizado.
xiii

xiv

INTRODUCTION

Acorde con lo anterior, se ha procurado mantener un balance entre el pensamiento fsico especfico
y el pensamiento fsico abstracto, competencias ambas indispensables en la formaci
on del fsico y otros
profesionales afines.
Por otra parte, es muy com
un enfocar un curso de mec
anica analtica como un puente necesario para
abordar los cursos de mec
anica cu
antica. En opini
on del autor esta no debe constitur la u
nica motivaci
on
para dictar un curso de esta naturaleza. Ciertamente los postulados de la mec
anica cu
antica requieren del
conocimiento de la formulaci
on Hamiltoniana y tambien se puede abordar con el formalismo Lagrangiano. Sin
embargo, la mecanica cl
asica posee numerosos problemas abiertos puros y aplicados (caos, mec
anica de fludos,
teora de perturbaciones cl
asica etc.), que constituyen tambien un campo de acci
on plausible para el fsico, y
para los cuales el lenguaje que se aborda es usualmente el descrito en estos cursos. Basta con observar que
historicamente, los formalismos Lagrangiano y Hamiltoniano precedieron en varias decadas al nacimiento de
la mec
anica cu
antica.

Captulo 1

Elementos b
asicos de Mec
anica
Newtoniana
1.1.

Cinem
atica

La cinem
atica trata de la descripci
on del movimiento de los cuerpos sin referencia a las causas de dicho
movimiento. El tratamiento ser
a breve sin una discusi
on detallada de los conceptos. Para detalles, ver por
ejemplo las referencias. [2, 3]. Asumiremos que tenemos una idea intuitivamente clara de los conceptos de
espacio, tiempo y masa.
El primer concepto que se construye es el de vector posici
on. Una partcula puntual ocupa un punto
especfico en el espacio, si elegimos un sistema de referencia, podemos trazar un vector desde el origen de dicho
sistema hasta el punto donde se ubica la partcula, y lo denominamos vector posici
on. La posicion entendida
como un punto geometrico en el espacio, no es un vector como tal (no tiene direcci
on, magnitud, ni sentido),
lo cual se refleja en el hecho de que el vector posici
on depende del origen elegido para el sistema coordenado.
Cuando una partcula se desplaza desde un punto descrito por el vector posici
on r0 hasta otro descrito por rf ,
podemos describir el movimiento de esta partcula a traves del vector desplazamiento r, como un vector
que va desde r0 hacia rf . Este vector indica la direcci
on del desplazamiento y la distancia recorrida (magnitud
del vector).
r rf r0
vale la pena mencionar que r s es un vector como tal, lo cual se refleja en el hecho de que r es independiente
del origen elegido.
Ahora definimos el vector velocidad, como el cambio de posici
on (o desplazamiento) por unidad de tiempo
v=

rf r0
r

tf t0
t

si queremos conocer el valor de la velocidad del m


ovil en forma mas detallada, partimos el intervalo anterior
en intervalos mas finos, y definimos una velocidad para cada intervalo
v=

r (ti + ti ) r (ti )
ri

ti
ti

la velocidad instant
anea se define como un paso al lmite
lm

ti 0

ri
= vinst
ti

a partir de la definici
on de velocidad se obtiene
vi ti = xi
1

CAPITULO 1. ELEMENTOS BASICOS


DE MECANICA
NEWTONIANA

si sumamos sobre todos los intervalos

N
X

vi ti =

i=1

N
X

xi

i=1

tomando el lmite cuando N y haciendo el paso al contnuo


Z tf
Z rf
Z
v dt =
dr rf r0 =
t0

tf

v dt

t0

r0

tambien es u
til definir la raz
on de cambio de la velocidad, a traves del vector aceleraci
on en la forma
v
dv
; ainst =
t
dt

a=

on instant
anea, usualmente esta
donde
a denota la aceleraci
on promedio, en tanto que ainst es la aceleraci
u
ltima se denota simplemente como a. Un argumento similar al anterior nos lleva a la ecuaci
on
Z tf
Z rf
Z tf
a dt =
dv vf v0 =
a dt
t0

t0

r0

estas ecuaciones y algunas combinaciones especiales de ellas nos proveen el marco para la descripci
on del
movimiento de los cuerpos.

1.2.

Din
amica: Leyes de Newton

La din
amica de las partculas puntuales est
a dictaminada por las leyes de Newton, haremos una descripci
on
muy breve sin ninguna pretensi
on de discusi
on. Para una discusi
on detallada, ver por ejemplo la referencia [3].
Primera Ley: Existen un conjunto de sistemas de referencia llamados inerciales tales que toda partcula
aislada, posee velocidad constante con respecto a dichos sistemas. El reposo es naturalmente un caso particular
de velocidad constante nula.
Segunda Ley: Nos establece la forma de cuantificar la interacci
on de una partcula con el resto del universo,
se enfatiza que esta ley solo es v
alida para partculas puntuales que por definici
on tienen masa constante.
F = ma
esta ley tambien contiene el principio de superposici
on de las fuerzas, seg
un el cual la fuerza neta o resultante
sobre una partcula es la suma vectorial de cada fuerza aplicada como si cada una de ellas actuara sola. Esto
significa que no hay efectos de interferencia entre las distintas fuerzas aplicadas sobre la partcula.
Tercera Ley: Cuando una partcula A hace una fuerza FAB sobre una partcula B entonces la fuerza
sobre A debida a B (denotada como FBA ) est
a relacionada con FAB en la forma
FAB = FBA
esta ley tiene implcita la propagaci
on instant
anea de se
nales por lo cual su validez es muy limitada. En su
forma fuerte, la fuerza es de naturaleza central, sin embargo existen fuerzas que solo cumplen esta ley en su
forma debil, es decir los pares de fuerzas son opuestos pero no van a lo largo de la lnea que une a las partculas.
Finalmente, en otros casos la ley no se cumple en ninguna de sus versiones, lo cual ocurre cuando el tiempo
de propagaci
on de la interacci
on es significativo.
Por otro lado, las leyes anteriores se pueden sustituir por sus equivalentes en terminos del concepto de
momento lineal definido como el producto de la masa por la velocidad p mv. La primera ley nos dice que
en los sistemas inerciales el momento lineal de una partcula aislada es constante, la segunda ley se escribira
de la forma F = dP/dt y la tercera ley sera sustituda por el principio de conservaci
on del momento para un
sistema aislado de partculas. Estas leyes tienen una rango de validez m
as amplio que la formulaci
on original,
aunque hay que usar un concepto extendido de momento lineal.

1.3. TRABAJO Y ENERGIA

A pesar de que las leyes de Newton me dan en principio una descripci


on completa de la evoluci
on de
los sistemas, tienen el limitante de que requieren el conocimiento de las fuerzas en funci
on del tiempo, en
la pr
actica es mas usual que se conozca la fuerza en funci
on de la posici
on, lo cual nos lleva al concepto de
trabajo.

1.3.

Trabajo y energa

Si arrastramos un cuerpo con una fuerza aplicada F y queremos construr un concepto fsico que dependa
del desplazamiento del cuerpo, vemos que solo la componente de la fuerza paralela al desplazamiento contribuye
a este. Tal hecho nos induce a construr el concepto de trabajo instant
aneo de la forma
dW = F dr
la fuerza es 100 % efectiva cuando es paralela al desplazamiento, 0 % efectiva cuando es perpendicular, y su
contribuci
on es negativa cuando la proyecci
on de la fuerza sobre el desplazamiento tiene sentido opuesto a
tal desplazamiento. En una trayectoria arbitraria el trabajo que realiza una fuerza F sobre un partcula viene
dada por una integral de lnea con lmites en los extremos A y B de la trayectoria
Z B
W =
F dr
A

n
otese que F es una de las fuerzas aplicadas sobre la partcula, y no necesariamente corresponde a la fuerza
resultante. Sin embargo, cuando la fuerza en cuesti
on es la resultante sobre la partcula, la segunda ley de
Newton conduce autom
aticamente al teorema fundamental del trabajo y la energa
Z B
1
1
2
2
F dr = mvB
mvA
(1.1)
2
2
A
la cual nos indica que sin importar la trayectoria seguida por la partcula, el trabajo realizado por la fuerza
resultante sobre esta equivale al cambio en la cantidad (1/2) mv 2 que denominamos la energa cinetica de la
partcula. Es indispensable tener claro que el teorema fundamental del trabajo y la energa solo es aplicable
a la fuerza resultante sobre la partcula y no a una de las fuerzas aplicadas. A priori se podra pensar que
esta formulaci
on es esteril cuando la queremos aplicar a una fuerza sobre una partcula, dado que el c
alculo
del trabajo requiere conocer la trayectoria de esta, lo cual presupone que de alguna forma el problema ya
est
a resuelto. Sin embargo, hay tres razones por las cuales la formulaci
on es u
til a pesar de lo anterior
1. Con frecuencia, existen fuerzas de ligadura que obligan a la partcula a seguir una trayectoria dada (e.g.
pendulo, monta
na rusa), de modo que conocemos la trayectoria aunque no conozcamos el valor de la
fuerza de ligadura, ni otras variables din
amicas del sistema (velocidad o aceleraci
on en funci
on de la
posici
on o del tiempo).
2. Existen fuerzas para las cuales la evaluaci
on de la integral de lnea no requiere del conocimiento de la
trayectoria sino solo de los puntos inicial y final. Esto nos lleva al concepto de Fuerza conservativa
3. En el caso de la fuerza resultante el teorema fundamental del trabajo y la energa nos permite encontrar el
trabajo que dicha fuerza hace sobre la partcula, conociendo u
nicamente las velocidades en los extremos
de la trayectoria as como la masa de la partcula.
Definition 1 Una fuerza conservativa es aquella para la cual el trabajo asociado no depende de la trayectoria
seguida por la partcula sino solo de la posici
on final e inicial
Z

F dr = U (rA ) U (rB )

(1.2)

CAPITULO 1. ELEMENTOS BASICOS


DE MECANICA
NEWTONIANA

la funci
on escalar U (r) se conoce como energa potencial. Por otro lado, si la fuerza resultante es conservativa,
podemos combinar la definici
on de conservatividad con el teorema fundamental del trabajo y la energa y se
obtiene
1
1
mv 2 mv 2 = U (rA ) U (rB )
2 B 2 A
1
1
2
mvA
mv 2 + U (rB )
+ U (rA ) =
2
2 B
esto conduce al teorema de conservaci
on de la energa mec
anica. Es necesario enfatizar que la conservatividad requiere que la energa potencial definida en (1.2) dependa u
nicamente de la posici
on. Si la energa
potencial es funci
on explcita del tiempo, entonces la suma de Ek + U todava me define la energa total del
sistema, pero esta cantidad ya no se conserva en general. En otros casos la energa potencial puede depender
de la velocidad, aceleraci
on etc. Finalmente, en algunos casos no existe ninguna funci
on escalar que pueda dar
cuenta del trabajo realizado. En ninguno de estos casos se conserva la energa.
Retomando la definici
on (1.2), vemos que a la energa potencial se le puede agregar una constante arbitraria
sin alterar el contenido Fsico de esta, ya que lo que es relevante fsicamente es el cambio en la energa potencial
y no su valor en s. Es f
acil demostrar que para que una fuerza sea conservativa, cada una de estas afirmaciones
es condici
on necesaria y suficiente
F (r) = U (r) ; F (r) = 0 ;

B
A

F (r) dr = U (rA ) U (rB ) ;

F (r) dr = 0

donde todas estas expresiones deben cumplirse para todo r R3 o para toda trayectoria en R3 . Las dos primeras
son condiciones en todo el espacio y las dos siguientes para toda trayectoria (general y cerrada respectivamente).
En todas estas ecuaciones, se debe enfatizar que no debe haber dependencia temporal explcita. Las fuerzas
conservativas mas importantes son las fuerzas constantes y las fuerzas centrales. Dentro de las no conservativas
el rozamiento es la mas destacable.
En el tratamiento de fuerzas centrales existe una cantidad que se conserva y que resulta muy u
til en el
tratamiento de este tipo de fuerzas: el momento angular

1.4.

Torque y momento angular

Si para una fuerza central elegimos el origen en el punto de convergencia de la fuerza, tenemos claramente
que la cantidad r F es nula. Llamemos a esta cantidad el torque de la partcula relativo a el origen O,
ya que es con respecto a este origen que se construye el vector posici
on r. Esta cantidad denotada por ~ se
puede escribir como la derivada temporal total de otra cantidad: el llamado momento angular y definido por
L r p veamos
d
dr
dp
(r p) =
p+r
= mv v + r F
dt
dt
dt
dL
= ~
dt

(1.3)

para una fuerza central con origen en el punto de convergencia, el torque es cero y el momento angular es
una constante de movimiento. Aunque los conceptos de torque y momento angular de una partcula surgen de
manera natural en el caso de fuerzas centrales, son extensibles a cualquier tipo de fuerza y la relaci
on (1.3)
es v
alida en general. En particular si no hay torque sobre la partcula el momento angular se conserva, de la
misma forma que el momento lineal se conserva ante la ausencia o anulaci
on de las fuerzas.
Finalmente, es necesario insistir en la fuerte dependencia que el torque y el momento angular tienen con
respecto al origen coordenado elegido, lo cual se manifiesta a traves de su dependencia del vector posici
on r.
De esta forma hay tres cantidades cuya conservaci
on ser
a mas adelante extensible a sistemas de partculas,
la energa, el momento lineal y el momento angular


1.5. DINAMICA
DE UN SISTEMA DE PARTICULAS

1.5.
1.5.1.

Din
amica de un sistema de partculas
Definici
on de centro de masa

Sea un sistema de partculas con masas m1 , m2 , ..., mn y con velocidades v1 , v2 , ..., vn . Teniendo en cuenta
la definici
on de momento lineal para una partcula, es natural definir el momento lineal total del sistema de
partculas como la suma vectorial de los momentos de sus partculas, es decir:
P = p1 +p2 +... = m1 v1 + m2 v2 + ... + mn vn =

n
X

mi vi

i=1

definamos la velocidad del centro de masa vCM del sistema de manera que:
P M vCM

(1.4)

donde M es la masa total. Es decir, de manera que el momento del sistema sea el mismo que le correspondera
al caso en que toda la masa estuviera concentrada en el llamado centro de masa, cuya velocidad es vCM . Por
lo tanto:
Pn
P
m1 v1 + m2 v2 + ... + mn vn
mi vi
vCM =
=
= i=1
(1.5)
M
m1 + m2 + ... + mn
M
si suponemos que las masas son independientes de la velocidad, vCM corresponde a la velocidad asociada a la
posici
on:
Pn
mi ri
m1 r1 + m2 r2 + ... + mn rn
rCM =
= i=1
(1.6)
m1 + m2 + ... + mn
M
la cual define la posici
on del centro de masa del sistema relativa a alg
un observador O, que mide los vectores de
posici
on y velocidad ri , vi . Ahora bien, es uno de los principios m
as fundamentales de la naturaleza el llamado
principio de conservaci
on del momento el cual establece que si un sistema de partculas est
a aislado,
su momento total es constante, y como suponemos que la masa no depende de la velocidad, tenemos de la
ecuaci
on (1.4) que vCM = cte de modo que: El centro de masa de un sistema de partculas aislado se
mueve con velocidad constante con respecto a un sistema inercial.
Un sistema de referencia muy particular es aquel que no rota con respecto a un sistema inercial y cuyo origen
coincide con el propio centro de masa del sistema de partculas. Si colocamos nuestro sistema de referencia sobre
el centro de masa, obviamente vCM = 0 por tanto, el momento total P del sistema de partculas es cero. Por
brevedad designaremos de ahora en adelante al sistema de referencia del centro de masa como sistemaC de
referencia. De modo que podemos escribir:
PCM =

n
X
i=1

pi = 0 (en el sistema C de referencia)

(1.7)

Este sistema de referencia es muy importante dado que muchos fen


omenos fsicos pueden ser descritos m
as
f
acilmente en el sistema de referencia centro de masa que en el sistema del laboratorio.

1.5.2.

Sistemas de partculas no aislados

Supongamos que tenemos un sistema S de n partculas, que interact


ua con las m partculas de otro sistema
0
Ahora supondremos que los sistemas S y S juntos forman un sistema aislado. Como el sistema S + S 0 es
aislado, su momento se conserva, luego:

S 0.

P=

n
X
i=1

pi +

m
X
j=1

p0j = PS + PS 0 = cte

(1.8)

CAPITULO 1. ELEMENTOS BASICOS


DE MECANICA
NEWTONIANA

esto significa que cualquier cambio en el momento de S debe venir acompa


nado de un cambio en el momento
de S 0 , a fin de mantener la suma constante.
PS = PS 0

(1.9)

Luego, la interacci
on entre los sistemas S y S 0 se puede describir como un intercambio de momento. Al
tomar la derivada temporal de (1.8) obtenemos:
d
(PS + PS 0 ) = 0
dt
dPS
dPS 0
=
dt
dt

(1.10)

haciendo una extrapolaci


on, es natural llamar a la derivada temporal del momento total del sistema, como la
fuerza externa ejercida sobre S (en analoga al caso de una partcula), es decir:
P
d ( ni=1 pi )
dPS
= Fext o
= Fext
(1.11)
dt
dt
la denominaci
on de externa se debe al hecho de que es producida por su interacci
on con S 0 . Las fuerzas internas
que existen en S debidas a la interacci
on entre sus partculas no producen ning
un cambio en el momento total
en virtud del principio de conservaci
on del momento, pues si quitamos las interacciones externas, se tendra
S
que el momento total PS del sistema permanecera constante y por tanto dP
se
dt = 0 es decir Fext = 0. De all
concluye que las fuerzas internas de S no contribuyen a la cantidad dPS /dt. Utilizando las ecuaciones (1.10)
y (1.11) tenemos que
Fext = F0ext
(1.12)

on
donde F0ext es la fuerza externa sobre S 0 la cual es ejercida por las partculas del sistema S. Esta es la extensi
de la ley de accion y reacci
on para las interacciones entre S y S 0 .
Por otro lado como PS = M vCM (donde CM define el centro de masa del sistema S y no del sistema
compuesto S + S 0 ) tenemos:
dvCM
= Fext
dt
con lo cual podemos definir de manera natural la aceleraci
on del centro de masa:
M

aCM
M aCM

dvCM

dt
= Fext
=

(1.13)

(1.14)
(1.15)

Nuevamente an
alogo al caso de una partcula. Reuniendo las ecuaciones (1.4) (1.14) y (1.15) se puede concluir
que:
La din
amica del centro de masa de un sistema de partculas es equivalente al de una partcula de masa
igual a la masa total del sistema concentrada en dicho centro de masa, y sobre la cual se aplicara una fuerza
equivalente a la suma vectorial de las fuerzas externas sobre el sistema.
Adicionalmente, la interacci
on entre los sistemas S y S 0 puede ser descrita formalmente de manera an
aloga
al caso de dos partculas seg
un se ve en las Ecs. (1.8), (1.9), (1.10), (1.11) y (1.12). En este punto queda por
tanto, mas que justificada la introducci
on del concepto de centro de masa.
No obstante, vale la pena aclarar que la formulaci
on anterior no resuelve el problema din
amico completo
para el sistema S. Para resolver formalmente el problema din
amico de cada partcula, vamos a relacionar
Fext con las fuerzas que act
uan sobre cada partcula. De aqu en adelante nos olvidaremos del sistema S 0
cuya influencia sobre S estar
a representada por la fuerzas externas sobre S. Sea pi el momento lineal de la
(e)
partcula i de masa mi ; sea Fi la fuerza externa resultante sobre dicha partcula, y Fij la fuerza interna que


1.5. DINAMICA
DE UN SISTEMA DE PARTICULAS

la partcula j tambien del sistema S, ejerce sobre la partcula i. La fuerza total ejercida sobre la partcula
(e)
i es por tanto igual a la fuerza externa Fi m
as la suma de las fuerzas internas de todas las partculas j del
sistema S (excepto la propia partcula i) aplicando la segunda ley de Newton a esta partcula se tiene:
n

X
dpi
(e)
= Fi +
Fij
dt

(1.16)

j6=i

on para cada partcula i del sistema,


asumiremos de aqu en adelante que Fii = 0. Resolviendo esta ecuaci
se obtiene la soluci
on din
amica completa de este. Observese que aqu s aparecen explcitamente las fuerzas
internas. Ahora sumemos todas las ecuaciones de todas las partculas de la siguiente manera:
n
X
dpi
i=1

d(

dt

Pn

i=1 pi )

dt

pero

P P
i

n
X
i=1
n
X

(e)
Fi

(e)

Fi +

n X
n
X
i=1 j6=i
n X
n
X

Fij
Fij

(1.17)

1 XX
(Fij + Fji )
2

(1.18)

i=1

i=1 j6=i

Fij se puede escribir como:


n X
n
X

Fij =

i=1 j6=i

i=1 j>i

sustituyendo (1.18) en (1.17) y usando el principio de accion y reacci


on, la ecuaci
on (1.17) nos queda:
d(

Pn

i=1 pi )

dt

n
X

(e)

Fi

i=1

comparando con la ecuaci


on (1.11) se concluye que la fuerza externa sobre un sistema de partculas es la suma
de las fuerzas externas sobre cada una de las partculas del sistema.

1.5.3.

Momento angular y torque de un sistema de partculas

Para un sistema S de varias partculas definimos el torque y el momento angular de cada partcula i de S :
i ri Fi ; Li ri pi
y de manera completamente an
aloga al caso de una partcula se puede probar que
dLi
= i
dt
supongamos adem
as que la partcula est
a sujeta a las fuerzas internas que sobre ella realizan las otras partculas
(e) P
del sistema S m
as una fuerza externa resultante. Luego, la fuerza resultante sobre la partcula i es Fi + Fij y
j

su torque resultante es:

n
X
dLi
(e)
= i = ri Fi +
Fij
dt
j6=i

en analoga con la definici


on de momento lineal total, definimos el torque total como la suma vectorial de
los torques individuales de las partculas, similarmente definimos el momento angular total L. Escribimos
entonces:

CAPITULO 1. ELEMENTOS BASICOS


DE MECANICA
NEWTONIANA

n
X

i =

i=1

P
d ( ni=1 Li )
dL
=
=
dt
dt
dt

n
X
dLi
i=1

por otro lado:

n
X
i=1

ri F(e) +

n 
X
i=1

(e)

ri Fi

n
X
j6=i

n
X
i=1

Fij

ri

n
X
j6=i

Fij

por otra parte, utilizando la ley de acci


on y reacci
on, puede demostrarse por inducci
on que:
n
X
i=1

por tanto, el torque total queda:

ri

n 
X
i=1

n
X
j6=i

Fij =
(e)

ri Fi

n
n1
XX

[(ri rj ) Fij ]

n1
n
XX

[(ri rj ) Fij ]

i=1 j>i

i=1 j>i

(1.19)

Si suponemos especialmente que las fuerzas internas Fij act


uan a lo largo de los vectores relativos rij se
tiene que el segundo termino de la derecha se anula quedando
=

n 
X
i=1

(e)

donde ri Fi

(e)

ri Fi


(e)

representa el torque debido a las fuerzas externas Fi


=

n
X

sobre cada partcula i entonces:

i,ext = ext

i=1

de modo que
dL
= ext
dt

(1.20)

que constituye la relaci


on fundamental de la mec
anica rotacional, observese la analoga entre las Ecs. (1.20) y
(1.11). Si ext = 0, se encuentra que:
dL
= 0 L = L1 + L2 + ... + Ln = cte
dt

(1.21)

la ecuaci
on (1.21) constituye la ley de conservaci
on del momento angular. La cual nos indica que si en un
sistema las fuerzas externas sobre el son tales que su torque total es cero, su momento angular permanece
constante. En particular, el momento angular se conservar
a cuando el sistema este aislado.
Vale anotar que la ley de conservaci
on del momento angular ha mostrado ser universalmente v
alida a
pesar de nuestra suposici
on inicial de que las fuerzas vayan a lo largo de las lneas que unen a las partculas
(propiedad que no cumplen por ejemplo las fuerzas magneticas). De manera que a
un en los casos en que
nuestra suposicion inicial no es v
alida, la ley de conservaci
on del momento angular se ha cumplido en todos
los procesos observados hasta ahora, aunque con un concepto extendido de momento angular.


1.5. DINAMICA
DE UN SISTEMA DE PARTICULAS

Relaci
on entre el momento angular de un sistema de partculas relativo al sistema-C y el relativo
al laboratorio
Las posiciones de las partculas relativas al laboratorio (denotadas por ri ) y las asociadas al centro de masa
(denotadas por r0i ) se pueden relacionar f
acilmente, y se puede ver que:
ri = r0i + rCM

(1.22)

vi0

(1.23)

vi =

+ vCM

siendo rCM y vCM la posici


on y velocidad del centro de masa medidas por el laboratorio. Multiplicando (1.23)
por mi se obtiene
pi = p0i + mi vCM

(1.24)

utilizando estas relaciones, obtenemos:

L =
L =
L =

n
X
i=1
n
X
i=1
n
X
i=1

pero

(ri pi ) =

n
X

i=1



r0i + rCM p0i + mi vCM

n
X

r0i p0i + rCM
p0i +

r0i

p0i

+ rCM

i=1
n
X

p0i

i=1

n
X
i=1
n
X

mi r0i + rCM
mi ri

i=1

p0i = 0 de acuerdo con (1.7) y utilizando (1.6) se tiene que (

L =

n
X
i=1

vCM

vCM

i mi ri )


r0i p0i + M rCM vCM

L = LCM + rCM P

!


= M rCM de modo que:

(1.25)

el termino LCM es el momento angular relativo al centro de masa, o momento angular interno; esto u
ltimo
debido a que el momento angular as medido es una propiedad del sistema e independiente del observador. El
segundo termino a la derecha suele denominarse momento angular externo relativo al sistema-L (laboratorio),
y equivale al momento angular (medido desde el sistema laboratorio) correspondiente a una partcula de masa
M colocada en la posici
on del centro de masa y con la velocidad del CM. Por ejemplo, cuando un lanzador
arroja una pelota rotando, el momento angular debido a la rotaci
on est
a dado por LCM , mientras que el
momento angular debido a la traslaci
on de la pelota est
a dado por M rCM vCM con M la masa de la bola.
Para la Tierra LCM es debido a su rotaci
on y M rCM vCM es debido a su traslaci
on alrededor del Sol.
Relaci
on entre el torque externo alrededor del centro de masa y el torque alrededor del laboratorio
Con un argumento similar al anterior se puede calcular la relaci
on entre el torque externo medido por el
laboratorio y el medido por el centro de masa
ext = CM + rCM Fext

(1.26)

rCM Fext es el torque de translaci


on y es equivalente al torque medido en el sistema-L para una partcula
ubicada en el centro de masa sometida a la fuerza externa resultante de todo el sistema Fext .
Pero teniendo en cuenta el resultado (1.25) y derivando temporalmente se obtiene:

CAPITULO 1. ELEMENTOS BASICOS


DE MECANICA
NEWTONIANA

10

dL
dLCM
dvCM
=
+ rCM M
dt
dt
dt
y tomando las Ecs. (1.13) y (1.20):
ext =

dLCM
+ rCM Fext
dt

(1.27)

dLCM
= CM
dt

(1.28)

Y comparando (1.26) y (1.27) se obtiene:

esta relaci
on es funcionalmente identica a (1.20) pero con la diferencia de que (1.20) es v
alida s
olo cuando el
torque y el momento angular se miden a partir de un punto fijo (usualmente el origen) en un sistema inercial
de referencia, en tanto que la relaci
on (1.28) es v
alida incluso si el sistema de referencia-C no es inercial1 . Esta
ecuaci
on resultar
a muy u
til para estudiar el movimiento del cuerpo rgido.

1.5.4.

Trabajo y energa de un sistema de partculas

La fuerza resultante sobre la partcula i es:


Fi =

n
X

(e)
Fi +

Fij = mi ai

j6=i

(e)

donde Fi

es la resultante de las fuerzas externas. El diferencial de trabajo es:


dWi = mi ai dri =

(e)
Fi

dri +

n
X
j6=i

Fij dri

el diferencial de trabajo total realizado sobre el sistema, es entonces la suma de los diferenciales de trabajo de
partcula individual:
dW =

n
X
i=1

mi ai dri =

n
X

(e)
Fi

i=1

dri +

n X
n
X
i=1 j6=i

Fij dri

aplicando una identidad an


aloga a (1.19)
n X
n
X
i=1 j6=i

por otro lado ai dri =

dvi
dt

Fij dri =

dri = dvi
n
X

dW =

i=1

n1
n
XX
i=1 j>i

dri
dt

[(dri drj ) Fij ] =

n1
n
XX
i=1 j>i

(drij Fij )

= dvi vi con lo cual queda:

mi dvi vi =

n
X

(e)
Fi

i=1

dri +

n1
n
XX
i=1 j>i

(drij Fij )

integrando a ambos lados la ecuaci


on queda:
Z
1

dW =

n Z
X
i=1

vi

v0i

mi vi dvi =

n Z
X
i=1

Bi
Ai

(e)

Fi dri +

n1
n Z Bij
XX
i=1 j>i

Aij

(drij Fij )

Sin embargo, la relaci


on (1.28) no es v
alida si el sistema-C est
a rotando con respecto al sistema inercial [4].


1.5. DINAMICA
DE UN SISTEMA DE PARTICULAS

11

observese que estrictamente aqu se realizan n integrales dado que existen n trayectorias seguidas por cada
una de las n partculas. El primer termino de la derecha es el trabajo realizado por las fuerzas externas a S. El
segundo termino corresponde al trabajo hecho por las fuerzas internas.
Z

dW

n 
X
1

1
2
mi vi2 mi v0i
2
2

i=1

n
X
1
i=1

Pn

mi vi2

n
X
1
i=1

= Wext +Wint

2
mi v0i
= Wext +Wint

pero i=1 21 mi vi2 es la energa cinetica del sistema en un instante dado. Por tanto el trabajo total realizado por
las fuerzas externas e internas cuando el sistema de partculas se desplaza desde la configuraci
on de posiciones
on de posiciones (xf 1 , ..., xf n ) a traves de las trayectorias (x1 (t) , ..., xn (t)) es
(x01 , ..., x0n ) hasta la configuraci
igual al cambio de energa cinetica entre estas dos configuraciones de posici
on, sin importar la naturaleza de
las trayectorias. Hemos recuperado por tanto el teorema fundamental del trabajo y la energa para el caso de
un sistema de partculas, el cual enunciaremos de la manera siguiente:
El trabajo total efectuado por las fuerzas externas e internas sobre un sistema de partculas
es igual al cambio producido en su energa cin
etica.
Por tanto escribiremos:
Ek Ek,0 = Wext +Wint

1.5.5.

(1.29)

Conservaci
on de la energa de un sistema de partculas

Supongamos ahora que las fuerzas internas son conservativas, en tal caso se tiene que:
Z

Bij

Aij

(drij Fij ) = Ep0,int (rij ) Ep,int (rij )

pero como se trata de interacci


on de pares de partculas, la energa potencial depende u
nicamente del vector
relativo entre los pares de partculas i, j. Si suponemos especialmente que la fuerza Fij va a lo largo del vector
rij que une a las dos partculas, se tiene que la energa potencial depender
a s
olamente de la distancia entre las
dos partculas:
Z

Bij

Aij

ij
ij
(drij Fij ) = Ep0,int
(rij ) Ep,int
(rij )

rij krij k

en este caso, la energa potencial est


a definida por pares de partculas, a esto se refiere el suprandice i, j en la
ecuaci
on anterior. Por tanto, las fuerzas internas producen un trabajo equivalente a:
n1
n h
XX
i=1 j>i

i
ij
ij
Ep0,int
(rij ) Ep,int
(rij )

y como sabemos que la suma de fuerzas conservativas es tambien conservativa se tiene que:
Wint =

n1
n
XX
i=1 j>i

ij
Ep0,int
(rij )

n1
n
XX
i=1 j>i

ij
Ep,int
(rij ) = Ep0,int Ep,int

que al sustiturlo en (1.29) nos da:


Ek Ek,0 = Wext +Ep0,int Ep,int

[Ek + Ep,int ] [Ep0,int + Ek,0 ] = Wext

CAPITULO 1. ELEMENTOS BASICOS


DE MECANICA
NEWTONIANA

12

definamos ahora la energa propia del sistema como:


U Ek + Ep,int

(1.30)

el nombre de energa propia indica que esta es una propiedad del sistema (y no de agentes externos). Podemos
reescribir la ecuaci
on anterior como:
U U0 = Wext

(1.31)

es decir, el cambio en la energa propia del sistema es igual al trabajo realizado por las fuerzas externas sobre
el sistema de partculas.
Como la energa potencial Ep,int (rij ) solo depende de la distancia entre las dos partculas i, j se tiene
ij
ji
entonces que Ep,int
= Ep,int
por lo tanto:
n1
n
XX
i=1 j>i

ij
Ep,int
(rij ) =

1 X X ij
Ep,int (rij )
2
i=1 j6=i

regresando a la Ec. (1.31) se tiene que si Wext = 0, la energa propia es igual al principio y al final de cualquier
proceso, de modo que podemos enunciar el siguiente principio de conservaci
on:
Si las fuerzas externas no realizan ning
un trabajo, se tiene que la energa propia del sistema
se conserva (siendo las fuerzas internas conservativas).
Finalmente, supongamos que tambien las fuerzas externas son conservativas de manera que:
Wext = Ep,ext0 Ep,ext
la Ec. (1.31) queda:

U U0 = Ep,ext0 Ep,ext

(U + Ep,ext ) (U0 + Ep,ext0 ) = 0

es decir, la cantidad U + Ep,ext se conserva para cualquier proceso realizado por las fuerzas externas e internas.
Como en el c
alculo de U + Ep,ext intervienen todas las fuerzas sobre S, podemos denominar a esta cantidad
como la energa total del sistema
E = U + Ep,ext = Ek + Ep,int + Ep,ext
es decir la energa total del sistema es igual a la energa cinetica mas la energa potencial de las fuerzas internas
y externas, y se tiene que:
E E0 = 0
es decir la energa total se conserva para cualquier proceso realizado por las fuerzas internas y externas siempre
y cuando ambos tipos de fuerzas sean conservativos. Hemos deducido entonces el teorema de conservaci
on de
la energa para un sistema de partculas en donde las fuerzas involucradas son todas conservativas2 . En el caso
de una sola partcula, la energa total se reduce a la expresi
on correcta ya que cuando solo hay una partcula
Ep,int = 0 (puesto que la energa potencial interna se debe a la interacci
on por pares, de modo que debe
haber al menos dos partculas) y Ep,ext es la energa potencial correspondiente a la fuerza resultante sobre la
partcula.
2

En su forma m
as general, la conservaci
on de la energa adquiere el car
acter de principio y su validez es universal, mas all
a de
las suposiciones realizadas para demostrar el teorema.

1.6. EJERCICIOS

1.5.6.

13

Transformaci
on de la energa cin
etica al sistema-C a partir del sistema de laboratorio

La energa cinetica depende del observador. No obstante, dicha cantidad medida a partir del centro de
masa del sistema sera una cantidad independiente del observador. Puesto que la energa potencial interna
no depende del sistema de referencia, ya que s
olo es funci
on de las coordenadas relativas entre las partculas,
podemos definir una energa del sistema que sea independiente del observador a traves de la relaci
on:
Uint Ek,CM + Ep,int

que denominamos energa interna del sistema de partculas. Vemos pues que la energa interna es la energa
propia medida por el sistema de referencia del centro de masa. En general, por la energa del sistema S se
entiende que se refiere a su energa interna.
Pero como en la realidad las cantidades se miden desde el laboratorio, es necesario conocer la forma en
que la energa cinetica se transforma cuando pasamos del sistema del laboratorio al sistema centro de masa.
El procedimiento es similar al del caso del momento angular y se deja como ejercicio al lector demostrar que:
1
2
Ek = Ek,CM + M vCM
2
n
n
X
X
1
1
1
2
mi vi2 =
mi vi02 + M vCM
2
2
2
i=1

(1.32)

i=1

el primer termino de la derecha es el debido al movimiento de las partculas del sistema con respecto al centro
de masa, el segundo termino es el debido al movimiento del sistema como un todo (movimiento de su centro
de masa con respecto al laboratorio). La energa propia de S vendra dada entonces por:
1
2
U = Uint + M vCM
2
esta relaci
on muestra que la energa interna es el menor valor que puede tomar la energa propia, y este valor
lo toma cuando se mide en el sistema C de referencia.

1.6.

Ejercicios

1. Demuestre por argumentos puramente cinem


aticos, que la velocidad inicial v0 y la velocidad final vf de
una partcula, est
an relacionadas con su aceleraci
on a, por medio de la ecuaci
on
Z rf
vf2 v02 =
a dr
r0

donde r0 y rf son la posici


on inicial y final de la partcula respectivamente. N
otese que al multiplicar
esta ecuaci
on por la masa, se obtiene el teorema fundamental del trabajo y la energa, Ec. (1.1).

2. La velocidad de escape de una partcula en la tierra, es la velocidad inicial mnima que requiere una
partcula que est
a en la superficie de la tierra, para poder escapar del campo gravitatorio terrestre.
Ignorando la resistencia del aire, calcule esta velocidad de escape por argumentos de energa.
3. Demuestre la Ec. (1.19) por inducci
on matem
atica.
4. Demuestre que la relaci
on entre el torque externo medido por el laboratorio y el medido por el centro de
masa viene dado por la Ec. (1.26). (Para comentarios adicionales sobre algunas sutilezas de esta relaci
on,
ver la Ref. [4]).
5. Demuestre que la energa cinetica de un sistema de partculas vista por el laboratorio es la energa
cinetica vista por el centro de masa, mas la energa cinetica que tendra una partcula con la masa total
del sistema y la velocidad del centro de masa (ver Ec. 1.32).

Captulo 2

Principio de DAlembert y ecuaciones de


Lagrange
Las ecuaciones de Lagrange son un formalismo equivalente a la formulaci
on Newtoniana de la mec
anica
pero que tiene una serie de ventajas tanto operativas como formales que veremos en el transcurso de nuestros
desarrollos. Es usual en Fsica realizar una formulaci
on diferencial y una formulaci
on integral equivalente de
cierto formalismo. Por ejemplo, las ecuaciones de Maxwell se pueden escribir en forma integral en la cual
aparecen integrales de lnea, de superficie y de volumen, o alternativamente se pueden escribir en forma
diferencial por medio de divergencias, rotacionales y derivadas parciales del tiempo. Similarmente, la segunda
ley de Newton tiene una versi
on diferencial
dP
F=
dt
y una forma integral equivalente que se conoce como teorema del impulso I:
Fdt = dP

F dt = P P0 I

la experiencia muestra que las formulaciones integrales y diferenciales tienen cada una sus ventajas y desventajas y en general resultan un buen complemento para obtener un buen panorama de la teora subyacente.
En esta misma tonica queremos obtener el nuevo formalismo a partir de una formulaci
on diferencial y una
formulaci
on integral. La formulaci
on diferencial se cimenta en el llamado principio de DAlembert en tanto
que la formulacion integral se basa en el principio variacional de Hamilton.
Nos ocuparemos primero de la versi
on diferencial, pero antes de discutir el principio de DAlembert que la
genera, debemos estudiar el papel de las ligaduras en la Fsica.

2.1.

Ligaduras

Aunque las ecuaciones de movimiento (1.16) nos dictaminan formalmente toda la evoluci
on del sistema,
desde el punto de vista operativo es en general difcil conocer todas las fuerzas aplicadas sobre cada partcula.
Con frecuencia, los sistemas est
an sometidos a ligaduras que obligan a la partcula o sistema de partculas a
moverse en ciertas trayectorias o a restringir su movimiento a ciertas regiones especficas. Tal es el caso de
sistemas como la monta
na rusa o el pendulo en donde la trayectoria del m
ovil est
a determinada por la normal
y la tensi
on de la cuerda respectivamente, observese que en estos casos particulares no es f
acil encontrar a
priori el valor de las fuerzas de ligadura. Otro caso com
un es el de un gas en un contenedor, en tal caso la
ligadura se manifiesta como la exclusi
on de la regi
on exterior al contenedor como posible regi
on de movimiento
para las partculas.
Hay varias formas de clasificar las ligaduras. Una de las clasificaciones m
as u
tiles consiste en la caracterizaci
on de las ligaduras como hol
onomas y no hol
onomas. Las ligaduras hol
onomas son aquellas que se pueden
14

2.1. LIGADURAS

15

escribir como ecuaciones que conectan las coordenadas de las partculas y tal vez el tiempo, de la forma
f (r1 , r2 , . . . , rN , t) = 0

(2.1)

un ejemplo sencillo lo constituye el cuerpo rgido para el cual las ligaduras se expresan de la forma
(ri rj )2 c2ij = 0
siendo ri , rj posiciones de un par de partculas del cuerpo rgido y siendo cij sus distancias (constantes). La
monta
na rusa y el pendulo son tambien ejemplos de ligaduras hol
onomas, ya que el m
ovil esta obligado a
seguir una trayectoria especfica. La ecuaci
on de la trayectoria act
ua entonces como la ligadura.
Toda ligadura que no cumpla la condici
on (2.1), se denomina no hol
onoma. En el ejemplo del contenedor
de gas, asumiendo por simplicidad un contenedor esferico de radio a, tendramos una ligadura de la forma
r 2 a2 0
es decir una desigualdad. Naturalmente hay infinidad de ligaduras no hol
onomas ya que solo se requiere que
no se cumpla una ecuaci
on de la forma (2.1).
Otra clasificaci
on importante es en ligaduras re
onomas (que contienen el tiempo como variable explcita)
y escler
onomas (el tiempo no aparece explcitamente en la ligadura). Un bloque que se desliza por un plano
inclinado, donde este u
ltimo est
a fijo en el espacio, es una ligadura escler
onoma. Por otro lado, si el plano
inclinado se mueve de una manera prescrita1 , la ligadura es re
onoma. N
otese sin embargo, que si el movimiento
del plano inclinado es solo debido a la fuerza de reacci
on del bloque, la dependencia temporal entra a traves de
las coordenadas que describen a la curva que hace el bloque; en tal caso, la ligadura como tal es escler
onoma.
Como ya se mencion
o, en general es difcil hallar las fuerzas de ligadura. Adicionalmente, si tenemos N
partculas, las 3N coordenadas necesarias para determinar las posiciones de las N partculas no son en general
independientes, de modo que los grados de libertad son menores a 3N . En el caso mas general puede ser muy
difcil saber cu
antas coordenadas independientes hay, pero en el caso de las ligaduras hol
onomas, este conteo
es muy sencillo ya que si tenemos k ecuaciones hol
onomas, el n
umero de grados de libertad ser
a 3N k. Por
tanto, cuando las ligaduras son hol
onomas, se pueden encontrar un conjunto de coordenadas generalizadas
que consisten en un conjunto de 3N k grados de libertad independientes que denotaremos por q1 , . . . , q3N k
las cuales se pueden escribir en terminos de las antiguas coordenadas r1 , . . . , rN con ecuaciones de la forma
ri = ri (q1 , . . . , q3N k , t) ; i = 1, . . . , N

(2.2)

que contienen implcitamente las ligaduras. Si a este sistema le a


nadimos las ecuaciones de ligadura
fj (r1 , . . . , rN , t) = 0 ; j = 1, . . . , k

(2.3)

el conjunto de transformaciones debe ser invertible de modo que cada qi se puede escribir en terminos de
las antiguas coordenadas ri y el tiempo. Es importante notar que en el caso m
as general, las coordenadas
generalizadas no se pueden agrupar en triplas que formen un vector euclidiano.
Un ejemplo que ilustra todos estos detalles es el pendulo doble que se muestra en la figura 2.1. Por simplicidad asumamos que las lentejas se mueven en un plano. Las coordenadas cartesianas de las dos lentejas nos dan
seis escalares que especifican las posiciones de ambas. Sin embargo, es claro que no todas estas componentes
son independientes. Los angulos 1 y 2 representan un conjunto de grados de libertad (coordenadas independientes) que determinan completamente la posici
on de las dos lentejas bajo las ligaduras ya mencionadas.
Existen en efecto 4 ecuaciones de ligadura, dos de ellas asociadas al hecho de que las lentejas est
an en un plano
(e.g. z1 = 0 y z2 = 0) y otras dos que nos dicen que las longitudes de las cuerdas son constantes2 . Para este
sistema, el par (1 , 2 ) no forma un vector euclidiano en el plano de movimiento, tambien se ve otro aspecto
1

Usualmente debido a alguna fuerza externa que introduce la dependencia temporal en la ecuaci
on de ligadura.
En este caso, dos ligaduras est
an asociadas a condiciones iniciales (la ausencia de una componente z de las velocidades iniciales
de las lentejas), y otras dos est
an asociadas a fuerzas de ligadura (las tensiones de las cuerdas).
2

16

CAPITULO 2. PRINCIPIO DE DALEMBERT Y ECUACIONES DE LAGRANGE

Figura 2.1: Ilustraci


on de un pendulo doble. Un conjunto conveniente de coordenadas son los a
ngulos 1 y 2
medidos con respecto a la vertical, siempre que el movimiento se restrinja a un plano.
interesante: las coordenadas generalizadas no necesariamente tienen dimensiones de longitud (en este caso son
adimensionales), en general las coordenadas generalizadas pueden tener cualquier tipo de dimensi
on.
Dado que cuando las ligaduras son hol
onomas las coordenadas dependientes se pueden eliminar, estos
problemas son accesibles para solucionarse al menos formalmente. Las ligaduras no hol
onomas deben tratarse
cada una por aparte y no hay una estrategia general de soluci
on. Es importante enfatizar que para que
las ligaduras sean hol
onomas es necesario que las funciones f no contengan como argumento, derivadas u
operadores diferenciales de la posici
on3 .
De momento nos limitaremos a ligaduras hol
onomas para las cuales es m
as sencillo el conteo de grados de
libertad. Recordemos que una segunda dificultad cuando nos encontramos con ligaduras es el hecho de que las
fuerzas de ligadura son desconocidas y en general difciles de hallar. Para obviar este problema sera deseable
obtener un formalismo en el cual las fuerzas de ligadura no esten includas. Esta es la principal motivaci
on
para introducir el llamado principio de DAlembert.

2.2.

Principio de DAlembert

Introduciremos primero el concepto de desplazamiento virtual, concebido como el cambio de configuraci


on
de un sistema como resultado de un cambio infinitesimal de las coordenadas, denotado como ri , y consistente
con las fuerzas y ligaduras impuestas sobre el sistema en un instante dado t. A diferencia del desplazamiento
real, el cual ocurre en un intervalo de tiempo dt, el tiempo se considera fijo en los desplazamiento virtuales, de
modo que se ignoran los posibles cambios en las fuerzas y en las ligaduras que pueden provenir de la evoluci
on
temporal. Comencemos por escribir la segunda ley de Newton, y el trabajo virtual asociado a las fuerzas sobre
una partcula i
Fi p i = 0

N
X
i=1

(Fi p i ) ri = 0

3
Cuando hay operadores diferenciales es en algunos casos posible tener ligaduras integrables que permitan reducir las variables
dependientes con facilidad. Incluso cuando las ligaduras no son integrables, el metodo de multiplicadores de Lagrange puede hacer
esta funci
on, pero volveremos sobre eso m
as adelante.

2.3. COORDENADAS GENERALIZADAS Y ECUACIONES DE LAGRANGE

17

como la idea es eliminar a las fuerzas de ligadura de la formulaci


on, haremos la separaci
on de Fi entre las
(a)
fuerzas aplicadas Fi y las fuerzas de ligadura fi
Fi

(a)

Fi

N 
X

+ fi

i=1

(a)
Fi

p i ri +

N
X
i=1

fi ri = 0

a continuaci
on nos restringiremos a sistemas en los cuales los trabajos virtuales netos asociados a las fuerzas de
ligadura se anulan. Es f
acil ver que esta condici
on se cumple en gran n
umero de casos, por ejemplo la tensi
on
de la cuerda no realiza trabajo sobre la lenteja de un pendulo (ni virtual ni real). En una monta
na rusa sin
rozamiento, la normal no hace trabajo sobre el m
ovil. En un cuerpo rgido las fuerzas de ligadura son fuerzas
internas que obligan a las partculas a conservar sus distancias relativas, lo cual conduce a que no hayan cambios
en la energa interna, es decir que no hay trabajo realizado por estas fuerzas internas de ligadura. Cuando
intervienen fuerzas de fricci
on por deslizamiento no se cumple esta condici
on de tal manera que debemos excluir
4
esta situaci
on de nuestra formulaci
on actual . Sin embargo, el rozamiento est
atico de rodadura no viola esta
condici
on ya que no realiza trabajo real ni virtual. Vale la pena anotar que si una partcula esta restringida
a una superficie o curva que a su vez se desplaza en el tiempo, la fuerza de ligadura es instant
aneamente
perpendicular a la superficie o curva de modo que el trabajo virtual es cero, aunque el trabajo real en un
intervalo dt no es necesariamente cero (ver Refs. [5, 6] y problema 2.2). Esta u
ltima observaci
on justifica la
introducci
on de los desplazamientos virtuales, ya que eliminan muchas fuerzas de ligadura que no se eliminan
con los desplazamientos reales.
Asumiendo entonces que las fuerzas de ligadura no producen trabajos virtuales, se tiene que
N 

X
(a)
Fi p i ri = 0

(2.4)

i=1

a la expresi
on (2.4), se le conoce como principio de DAlembert. Hemos logrado nuestro objetivo en el
sentido de exclur las fuerzas de ligadura de la formulacion. De aqu en adelante omitiremos el suprandice
(a) sobreentendiendo que las fuerzas involucradas excluyen a las ligaduras. No obstante, los coeficientes de los
desplazamientos virtuales ri no son necesariamente cero, ya que los desplazamientos virtuales ri al ser compatibles con las ligaduras no son en general independientes, est
an conectados por las ecuaciones de ligadura. El
siguiente paso es entonces encontrar un conjunto de coordenadas generalizadas qj que sean independientes
y solo tengan en cuenta los verdaderos grados de libertad del sistema. En tal caso los desplazamientos virtuales
qj ser
an independientes y podremos aseverar que los coeficientes asociados a estos desplazamientos deben ser
nulos. La existencia de estas coordenadas independientes solo se puede garantizar cuando las ligaduras son
hol
onomas.

2.3.

Coordenadas generalizadas y ecuaciones de Lagrange

Supondremos entonces que las ligaduras son hol


onomas. En consecuencia, es posible encontrar un conjunto
q1 , q2 , . . . , qn de coordenadas generalizadas independientes que junto con el tiempo, me caracterizan completamente la configuraci
on y din
amica del sistema fsico, y que est
an conectadas con las coordenadas originales
en la forma
ri = ri (q1 , q2 , . . . , qn , t)
; i = 1, ..., N
(2.5)
usando la regla de la cadena en la Ec. (2.5), podemos escribir la velocidad de la partcula iesima como
n

vi =

dri X ri
ri
=
qk +
dt
qk
t

(2.6)

k=1

Estrictamente las fuerzas de fricci


on no son fuerzas de ligadura. Sin embargo, en el caso de la fricci
on deslizante, la magnitud
de dicha fuerza depende de la magnitud de la fuerza de ligadura (la normal), con lo cual, la fuerza aplicada (fricci
on) introduce una
dependencia de la fuerza de ligadura, que no puede ser desacoplada. En el caso de la fricci
on est
atica, este problema solo aparece
si dicha fuerza adquiere su valor m
aximo.

CAPITULO 2. PRINCIPIO DE DALEMBERT Y ECUACIONES DE LAGRANGE

18

donde hemos hecho la suposici


on de que t qk = dqk /dt qk m
as adelante discutiremos esta suposici
on. Teniendo en cuenta de nuevo la Ec. (2.5), los desplazamientos virtuales originales se conectan con los desplazamientos
virtuales en coordenadas generalizadas a traves de la relaci
on
ri =

n
X
ri
qj
qj

(2.7)

j=1

en donde no se incluye la variaci


on temporal por la definici
on de desplazamiento virtual. Como ya vimos antes,
cuando la ligadura cambia con el tiempo, es posible que solo el trabajo virtual se anule, pero no el trabajo
real. El trabajo virtual en terminos de las coordenadas generalizadas queda entonces
N
X
i=1

Fi ri =
Qj

N X
n
X

Fi

Fi

ri
qj

i=1 j=1

N
X
i=1

X
ri
qj =
Qj qj
qj

(2.8)

j=1

(2.9)

en analoga con la expresi


on original del trabajo virtual, al termino Qj se le llama la fuerza generalizada.
N
otese que Qj no necesariamente tiene dimensiones de fuerza al igual que las qj no tienen necesariamente
unidades de longitud, pero el producto Qj qj debe tener unidades de trabajo.
Nos ocuparemos ahora del segundo termino en (2.4)
N
X
i=1

p i ri =

N
X
i=1

m i
ri ri

utilizando (2.7) resulta


N
X
i=1

y usando la identidad
mi
ri
se obtiene

N
X
i=1

p i ri =

p i ri =

ri
d
=
qj
dt

dt

i=1 j=1

mi r i


N X
n 
X
d
i=1 j=1

N X
n
X

ri
qj

m i
ri

ri
mi r i
qj

ri
qj
qj

mi r i


d
dt

d
mi r i
dt

ri
qj


ri
qj



qj

(2.10)

examinemos el u
ltimo termino de esta ecuaci
on

 X




n 
d ri

ri
ri
=
qk +
dt qj
qk qj
t qj
k=1

intercambiando el orden de las derivadas parciales y usando (2.6), resulta


" n 








#
n 
X
d ri

ri

ri
X ri
ri
=
qk +
=
qk +
dt qj
qj qk
qj t
qj
qk
t
k=1
k=1


d ri
vi
=
dt qj
qj

(2.11)

en lo anterior se asumi
o que qk /qj = 0, suposici
on que discutiremos m
as adelante. Ahora usando la Ec.
(2.6), tenemos




 X





n 
n 
vi X

ri
ri
qk ri

ri
ri
ri
=
qk
+
+
=
qk
+ kj
+
qj
qj qk
qj qk
qj t
qk qj
qk
t qj
k=1

k=1

2.3. COORDENADAS GENERALIZADAS Y ECUACIONES DE LAGRANGE

19

y suponiendo que ri / qj = 0, se obtiene


r i
ri
vi

=
qj
qj
qj

(2.12)

sustituyendo (2.11) y (2.12) en (2.10) se obtiene


N
X
i=1

N
X
i=1

p i ri =
p i ri =


N X
n 
X
d
i=1 j=1

n
X
j=1

dt
"


vi
mi vi
qj
qj
!#
!)
N
N
X
X

1
1

qj
mi vi2
mi vi2
2
qj
2

vi
mi vi
qj

dt qj

i=1

y reemplazando (2.8) y (2.13) en (2.4) resulta


( "
!#
n
N
X
X

d
1

2
mi vi

dt qj
2
qj
j=1

i=1

(2.13)

i=1

N
X
1
i=1

mi vi2

Qj

qj = 0

denotaremos la energa cinetica del sistema con T de modo que el principio de DAlembert queda




n 
X
d T
T

Qj qj = 0
dt qj
qj

(2.14)

j=1

a lo largo de estos desarrollos hemos realizado las siguientes suposiciones


qk
dqk
=
;
t
dt

qk
=0 ;
qj

ri
=0
qj

(2.15)

para comprenderlas, observemos que cuando las ligaduras son hol


onomas, la tercera de estas condiciones es
una consecuencia directa del car
acter hol
onomo de las ligaduras como se ve en las Ecs. (2.5). Adicionalmente,
dichas ecuaciones nos muestran que siempre es posible obtener un conjunto de coordenadas independientes
que nos dan cuenta de los verdaderos grados de libertad del sistema. En tal caso cada una de las coordenadas
generalizadas puede depender a lo m
as del tiempo, de modo que
qi
dqi
=
t
dt
qi
= qi (t)
=0
qj

qi = qi (t)
qi

(2.16)

vemos entonces que las dos primeras suposiciones (2.15) provienen de las condiciones (2.16) que resultan cuando
las coordenadas son independientes, en tanto que la tercera de las suposiciones (2.15) proviene directamente
del car
acter hol
onomo de las ligaduras.
Por otra parte, el hecho de que las qk solo sean funciones del tiempo, implica adem
as que podemos realizar
5
un desplazamiento virtual para una sola coordenada qk sin violar las ligaduras . Al ser independientes todos los
desplazamientos virtuales, podemos hacer que todos los q 0 s sean nulos excepto un qj especfico, por tanto su
coeficiente asociado en la ecuaci
on (2.14) debe ser nulo. Procediendo de la misma forma con cada coordenada,
conclumos que


d T
T

= Qj ; j = 1, ..., n
(2.17)
dt qj
qj
hay un n
umero n de estas ecuaciones, donde n es el n
umero de grados de libertad (y de coordenadas generalizadas).
5

N
otese la importancia de que el desplazamiento sea virtual, pues si el desplazamiento es real, la dependencia temporal de las
coordenadas no permite que en general se mueva una sola coordenada en el sistema.

20

CAPITULO 2. PRINCIPIO DE DALEMBERT Y ECUACIONES DE LAGRANGE


Ahora veamos el caso en el cual cada una de las fuerzas Fi son derivables de una funci
on potencial escalar6

V
Fi = i V =

V V V
,
,
xi yi zi

; i = 1, . . . , N

(2.18)

en este caso las fuerzas generalizadas definidas en (2.9), se escriben como


Qj
Qj

N
X

N
X
ri
=
Fi
=
i V
qj
i=1
i=1
N 
X
V xi V yi
=
+
xi qj
yi qj
i=1

ri
qj

V zi
+
zi qj

(2.19)

por otro lado, impondremos como condici


on adicional, que dicho potencial sea funci
on solamente de las posiciones y el tiempo
V = V (r1 , . . . , rN , t) = V (x1 , . . . , xN , y1 , . . . , yN , z1 , . . . , zN ; t)
(2.20)
cuando los argumentos del potencial son los dados por la Ec. (2.20), el termino a la derecha de la Ec. (2.19)
coincide con la derivada parcial de V con respecto a qj con lo cual se obtiene7
Qj =

V
qj

(2.21)

reemplazando la expresi
on (2.21) en (2.17) y teniendo en cuenta que el potencial V no depende de las velocidades generalizadas qj 8 podemos escribir


(T V )
d (T V )

=0
dt
qj
qj

j = 1, ..., n

definimos entonces una nueva funci


on
LT V

(2.22)

conocida como el Lagrangiano L asociado al sistema. Con lo cual obtenemos finalmente




d L
L
=0

dt qj
qj

j = 1, ..., n

(2.23)

las n ecuaciones as obtenidas se conocen como ecuaciones de Lagrange. Observese que estas ecuaciones no
requieren que las fuerzas sean conservativas, ya que el potencial puede ser funci
on explcita del tiempo.
En la formulaci
on Lagrangiana ya vemos algunas ventajas operativas como son: (1) No aparecen las fuerzas
de ligadura, y las fuerzas aplicadas usualmente son par
ametros de entrada. Es decir, normalmente conocemos
la forma funcional de las fuerzas aplicadas. (2) Al no haber coordenadas dependientes, el n
umero de ecuaciones
es el menor posible. (3) Las ecuaciones son escalares ya que est
an basadas en la energa. (4) Las ecuaciones de
Lagrange son identicas en forma en cualquier sistema de coordenadas generalizadas9 .
6
Debemos tener presente que Fi incluye las fuerzas internas y externas sobre la partcula i. Adicionalmente, el potencial V
est
a asociado a todo el sistema de partculas y no a una sola partcula, raz
on por la cual las fuerzas sobre cada partcula se pueden
extraer de el como se observa en la Ec. (2.18).
P
x i
7
Si el potencial dependiera por ejemplo de los x i , entonces V /qj tambien tendra terminos de la forma i V
de manera
x i qj
que la igualdad (2.21) ya no se cumple.
8
Cuando las ligaduras son hol
onomas, la transformaci
on entre coordenadas me garantiza que si el potencial no depende de las
velocidades en las coordenadas originales, tampoco depende de las velocidades generalizadas en el nuevo sistema coordenado.
9
Por ejemplo, en coordenadas cartesianas las ecuaciones de Newton tienen la forma F = m
x. Sin embargo, al cambiar a
y la forma de las ecuaciones cambia con el cambio en el sistema coordenado.
coordenadas polares F 6= m,

2.3. COORDENADAS GENERALIZADAS Y ECUACIONES DE LAGRANGE

2.3.1.

21

Energas cin
etica y potencial en coordenadas generalizadas

En virtud de que las ecuaciones de Lagrange implican derivadas en las coordenadas generalizadas, es
necesario conocer el valor de la energa cinetica y potencial en terminos de dichas coordenadas. Utilizando
(2.6), la energa cinetica en terminos de coordenadas generalizadas queda

T =

N
X
1
i=1

mi vi2 =

2
n
X
ri
ri
mi
qj +
2
qj
t

N
X
1
i=1

j=1

al expandir el binomio obtenemos

!


N
n
n
n
X
X
1 X ri
ri
ri X ri
ri 2
qj
qk + 2
qj +
T =
mi

2
qj
qk
t
qj
t
i=1
j=1
j=1
k=1
"N
"N



#

 
#
N
n
n
n
X
ri 2 X X ri
ri
1 XX X
ri
ri
1
T =
mi
+
mi

qj +
mi

qj qk
2
t
t
qj
2
qj
qk
i=1

j=1

i=1

j=1 k=1

i=1

vemos que la energa cinetica contiene un termino independiente de las velocidades generalizadas, as como
otro lineal y otro cuadr
atico en dichas velocidades. Es entonces conveniente escribir la energa cinetica en la
forma
T

= T0 + T1 + T2 = M0 +

n
X
j=1

M0

N
X
1
i=1

mi

ri
t

2

1 XX
Mj qj +
Mjk qj qk
2

; Mj

(2.24)

j=1 k=1

N
X
i=1

X ri ri
ri ri
mi
; Mjk
mi

t qj
qj qk
i=1

si las ecuaciones de transformaci


on (2.5) no dependen explcitamente del tiempo (ligaduras hol
onomas y
escler
onomas), solo el termino cuadr
atico sobrevive.
En cuanto al potencial, su forma explcita en coordenadas generalizadas depende de cada sistema en
particular. En realidad, la forma del potencial es la que usualmente sugiere las coordenadas generalizadas a
usar.

2.3.2.

Una simetra gauge o de calibraci


on para el Lagrangiano

Hemos visto que cuando las fuerzas sobre el sistema (excepto quiz
as las de ligadura) se pueden escribir como
potenciales que dependen de la posici
on y el tiempo, el Lagrangiano contiene toda la informaci
on fsica del
sistema. No obstante, el Lagrangiano no se construy
o como un observable, sino como una funci
on generadora
de las ecuaciones din
amicas del sistema. De esto se concluye que si existe otra funci
on generadora L0 que
me lleve a las mismas ecuaciones de movimiento (para un conjunto dado de coordenadas generalizadas) esta
funci
on contiene la misma informaci
on fsica del Lagrangiano, por tanto L0 bien puede considerarse como otro
Lagrangiano igualmente v
alido para el mismo sistema Fsico y el mismo sistema coordenado. En realidad, la
funci
on Lagrangiana definida por (2.22) no es la u
nica que conduce a las ecuaciones de movimiento (2.23).
Efectivamente se puede demostrar que si (q1 , . . . , qn , t) es una funci
on diferenciable en todos sus argumentos,
la nueva funci
on Lagrangiana definida por
L0 (q, q,
t) = L (q, q,
t) +

d (q, t)
dt

(2.25)

conduce a las mismas ecuaciones de movimiento. En algunos casos particulares otras redefiniciones son posibles.
Las ecuaciones de Lagrange poseen entonces una simetra gauge o de calibraci
on para el Lagrangiano. Para
verificar que el Lagragiano L0 conduce a las mismas ecuaciones de movimiento que L, es suficiente demostrar

CAPITULO 2. PRINCIPIO DE DALEMBERT Y ECUACIONES DE LAGRANGE

22

que las ecuaciones de Lagrange para un Lagrangiano de la forma L = d [ (q, t)] /dt, son triviales, es decir dan
cero en ambos miembros.






d L
L
d
d (q, t)

d (q, t)

dt qi
qi
dt qi
dt
qi
dt
=

n
n
d X

X

qj +
qj +
dt qi
qj
t
qi
qj
t
j=1
j=1

n
n
2
d X X 2
ij
qj +
dt
qj
qi qj
qi t
j=1
j=1

 X





n 

qj +

dt qi
qj qi
t qi
j=1





 X



n 
n 
X

qj +

qj +

qj qi
t qi
qj qi
t qi
j=1

j=1

= 0

donde hemos usado el hecho de que no depende de qi . Adicionalmente, hemos tenido en cuenta que las
derivadas parciales se pueden intercambiar, siempre y cuando estas u
ltimas sean contnuas en todo el intervalo
10
espacio temporal en cuesti
on .

2.4.

Ecuaciones de Lagrange para potenciales generalizados

Las ecuaciones (2.17) se pueden escribir sinteticamente en terminos de un operador diferencial lineal



d
b
b
Oj T = Qj ; Oj

(2.26)
dt qj
qj

claramente, de esta ecuaci


on podemos llegar a la ecuaci
on de Lagrange (2.23) siempre y cuando la fuerza
generalizada Qj se pueda escribir como


d

b
b
Qj = Oj U ; Oj

(2.27)
dt qj
qj
siendo U una funci
on escalar de qk , qk , t. Cuando se cumple la condici
on (2.27) la podemos sustituir en (2.26)
y obtener
bj T
O

bj U O
bj (T U ) = 0
O
bj L = 0 ; L T U
O
=

(2.28)

bj Ec. (2.26) se ve que la Ec. (2.28) es identica en forma a la Ec. (2.23). Al escalar U se
Dada la definici
on de O
le denomina potencial generalizado. Este potencial puede depender de las velocidades generalizadas qk y el
caso Fi = i U (qk , t) est
a includo como caso particular.
El caso especial mas importante en la Fsica de estos potenciales generalizados lo constituye el potencial
generalizado asociado a la fuerza de Lorentz. Sea una carga puntual q de masa m y que viaja con velocidad v.
Asumamos que esta carga se propaga en el vaco en presencia de un campo electrico E y un campo magnetico
B, el valor de la fuerza instant
anea que experimenta dicha carga es
F = qE + qv B
10

(2.29)

De este procedimiento se ve que si dependiera de los qi , los Lagrangianos relacionados en (2.25), no seran equivalentes.

2.4. ECUACIONES DE LAGRANGE PARA POTENCIALES GENERALIZADOS

23

donde E (r, t) y B (r, t) son funciones contnuas en sus argumentos. Estos campos se pueden generar de un
potencial escalar (r, t) y uno vectorial A (r, t)
E =

A
t

B=A

(2.30)

verifiquemos que el potencial


U = q qA v

(2.31)

es un potencial generalizado adecuado para reproducir la fuerza generalizada de Lorentz. En nuestro caso,
dado que el problema no tiene ligaduras, lo m
as c
omodo es usar las coordenadas cartesianas como coordenadas
generalizadas, de modo que las coordenadas originales y las generalizadas coinciden. Las fuerzas generalizadas
son simplemente las componentes de la fuerza original (recordemos que las fuerzas generalizadas son cantidades
bj U , en lo que sigue asumimos convenci
on de suma sobre ndices repetidos
escalares). Calculemos la cantidad O
y tendremos en cuenta que xi y x i = vi son independientes entre s. Finalmente, asumiremos que A y solo
son funciones de xi , t pero no son funciones de x i .
U = q qA v = q qAi vi
U
vi

Ai

Ai
= q
q
vi qAi
=q
q
vi
xj
xj
xj
xj
xj
xj
U

Ai
vi
U
=
=q
q
vi qAi
= qAj
x j
vj
vj
vj
vj


d U
Aj
Aj
Aj
Aj
x i q
vi q
= q
= q
dt x j
xi
t
xi
t
usando las Ecs. (2.26, 2.27), tenemos
Qj



U
d U
b
= Oj U =
+
xj
dt x j
Aj
Aj

Ai
= q
+q
vi q
vi q
xj
xj
xi
t




Aj

Ai Aj
= q
+
+q

vi
xj
t
xj
xi

definiendo el tensor de Levi-Civit`


a ijk podemos escribir lo anterior en notaci
on mas compacta
Qj = q (j + t Aj ) + q (j Ai i Aj ) vi = q (j + t Aj ) + qjin nrs vi r As

Qj = q ( + t A)j + qjin vi ( A)n = q ( + t A)j + q [v ( A)]j


teniendo en cuenta (2.30) la fuerza generalizada Qj queda
Qj = qEj + q [v B]j
de modo que componente a componente, este potencial genera correctamente la fuerza de Lorentz Ec. (2.29).
El Lagrangiano se escribe
1
L T U = mx i x i q + qAi x i
(2.32)
2
tomemos la ecuaci
on de Lagrange asociada a la coordenada generalizada xk con k = 1, 2, 3


d L
L
d

=0
[mx k + qAk ] + qk q (k An ) x n = 0
dt x k
xk
dt

CAPITULO 2. PRINCIPIO DE DALEMBERT Y ECUACIONES DE LAGRANGE

24

la ecuaci
on de movimiento se puede escribir como


dAk
m
xk = q (vn k An ) q k +
dt

(2.33)

dado que A solo depende de la posici


on y el tiempo se tiene que
dAk
Ak
Ak xn
Ak
Ak dxn
=
+
=
+
= t Ak + vn n Ak
dt
t
xn t
t
xn dt
de modo que la derivada total de Ak se puede expresar en terminos de la denominada derivada convectiva
dAk
= t Ak + v Ak = t Ak + vn n Ak
dt
reemplazando en (2.33)
m
xk = qvn k An q (t Ak + vn n Ak ) qk

m
xk = qvn (k An n Ak ) q (t Ak + k )



A
m
xk = q [v ( A)]k q
+ ()k
t k
usando (2.30) la ecuaci
on queda
m
xk = q [v B]k + qEk
y se observa que las ecuaciones de Lagrange reproducen la expresi
on para la fuerza de Lorentz Ec. (2.29).

2.5.

Ecuaciones de Lagrange con fuerzas disipativas

En general las fuerzas generalizadas se pueden descomponer en dos terminos de la siguiente forma
0
Qj = QU
j + Qj

b
QU
j = Oj U

de tal manera que QU


un potencial generalizado en tanto que Q0j es un termino que no se puede
j proviene de alg
escribir en terminos de ning
un potencial generalizado. Si introducimos esta expresi
on en (2.26)
bj T
O

bj U + Q0j
= O

bj (T U ) = Q0j
O

(2.34)

podemos entonces definir un Lagrangiano L = T U y una fuerza generalizada Q0j que no proviene de ning
un
potencial, de tal manera que usando (2.26), la Ec. (2.34) queda


d L
L

= Q0j
(2.35)
dt qj
qj
esta ecuaci
on de Lagrange generalizada es u
til por ejemplo para el caso de fuerzas de fricci
on. Con frecuencia,
la fricci
on viscosa se modela como una interacci
on proporcional a la velocidad, de modo que su componente x
se escribe como
Ff x = kx vx
(2.36)
y similarmente para las otras componentes. Si el fludo es anisotr
opico, las constantes kx , ky , kz ser
an en general
diferentes. Supondremos sin embargo, que el medio es homogeneo y que por tanto kx , ky y kz no dependen de
la posici
on ni del tiempo. Las fuerzas de fricci
on de este tipo se pueden derivar de una expresi
on de la forma
N

z=


1X
2
2
2
kx vix
+ ky viy
+ kz viz
2
i=1

(2.37)

2.6. ALGUNAS CARACTERISTICAS DE LAS CANTIDADES GENERALIZADAS

25

donde la suma es sobre las partculas del sistema. Si el fludo en donde est
an inmersas las partculas es
homogeneo, entonces z ser
a funci
on de las velocidades u
nicamente. A esta expresi
on se le conoce como funci
on
de disipaci
on de Rayleigh. A partir de (2.37), la componente x de la fuerza de fricci
on sobre la iesima
partcula se escribe
z
Ffix =
vix
y an
alogamente para las otras componentes. Simb
olicamente se puede escribir
Fif = vi z = x i z
para ver el significado fsico de la funci
on de disipaci
on, calculemos el trabajo realizado por el fludo sobre el
sistema
dWf
dWf

N
X

Fif
i=1
N
X

dri =

N
X
i=1

Fif vi dt =

2
2
2
kx vix
+ ky viy
+ kz viz

i=1

N
X
i=1

(kx vix , ky viy , kz viz ) (vix , viy , viz ) dt

dt = 2z dt

de lo cual se ve que 2z corresponde a la rata de disipaci


on de energa debida a la fricci
on. La componente de
la fuerza generalizada resultante de la fuerza de fricci
on est
a dada por
Qj =

N
X
i=1

Ff i

X
ri
ri
=
vi z
qj
qj
i=1

usando (2.12), y teniendo en cuenta que la funci


on de disipaci
on solo depende de los r i y por tanto de los qi ,
obtenemos
N
X
r i
z
Qj =
x i z
=
qj
qj
i=1

Las ecuaciones de Lagrange con un termino de disipaci


on quedan


z
d L
L
+
=0

dt qj
qj
qj

(2.38)

Vemos que cuando existen fuerzas generalizadas que no provienen de un potencial generalizado (denotadas
por Q0j ), el Lagrangiano no contiene toda la informaci
on fsica del sistema, ya que solo la parte de Qj que
s proviene de potenciales generalizados es absorbida en el. Este hecho resulta claro de la Ec. (2.35), y para el
caso especfico de fuerzas disipativas esto se ve de la Ec. (2.38) en donde la funci
on de disipaci
on de Rayleigh
contiene informaci
on fsica que no posee el Lagrangiano.

2.6.

Algunos aspectos peculiares de las coordenadas y las fuerzas generalizadas

El concepto de fuerza generalizada, definida a traves de las coordenadas generalizadas qj result


o ser
Qj

X
i

Fi

ri
qj

(2.39)

observemos en primer lugar que las coordenadas qj no est


an necesariamente asociadas a una partcula. Por
ejemplo, si en el pendulo doble de la Fig. 2.1 tengo una lenteja adicional en la mitad de una de las varillas, la
coordenada generalizada digamos 1 me describe la posici
on de dos de las lentejas. Tampoco es necesario que la
coordenada generalizada determine la posicion de una o varias de las partculas en forma directa, por ejemplo

26

CAPITULO 2. PRINCIPIO DE DALEMBERT Y ECUACIONES DE LAGRANGE

una o m
as coordenadas del centro de masa del sistema puede ser u
til como coordenada generalizada, y es bien
sabido que no necesariamente debe haber presencia de masa en este punto. Es quiz
as m
as apropiado decir
que cada coordenada qj est
a asociada al sistema. De esto se desprende que una fuerza generalizada tampoco
est
a necesariamente asociada a una partcula o incluso a un subsistema, solo podemos decir en general que
est
a asociada a una coordenada generalizada qj . Recordemos adem
as que qj , Qj pueden tener en principio
cualquier dimensi
on siempre y cuando Qj qj tenga dimensiones de energa. En la Ec. (2.39), Fi corresponde
a la resultante de las fuerzas internas y externas sobre la partcula i, pero hay una suma sobre todas las
partculas (las posiciones y fuerzas iniciales ri , Fi s est
an asociadas a partculas), esto enfatiza el hecho de
que Qj no est
a necesariamente asociado a una partcula.
Con esta misma filosofa, debemos comprender que un desplazamiento compatible con las ligaduras (real
o virtual) de una sola coordenada independiente, no necesariamente implica el desplazamiento de una sola
partcula del sistema. Tomemos de nuevo el pendulo doble de la Fig. 2.1, los angulos 1 y 2 que cada lenteja
hace con la vertical son un conjunto posible de coordenadas generalizadas independientes. Un desplazamiento
virtual 2 compatible con las ligaduras y que mantenga fijo a 1 es claro que implica solo el movimiento de
la lenteja m2 permaneciendo m1 en su lugar. Sin embargo, un desplazamiento virtual 1 de la lenteja m1
compatible con las ligaduras y que deje fija la coordenada 2 claramente requiere el movimiento de la otra
lenteja, pues mover la lenteja 1 sin mover la lenteja 2 viola las ligaduras y modifica el valor de 2 . Es claro sin
embargo, que al menos virtualmente existe un movimiento simult
aneo de las dos lentejas que es compatible con
las ligaduras y que vara la coordenada 1 y deja fija la coordenada 2 . Tal movimiento consiste en desplazar
m1 de modo que l1 permanezca constante y que la lenteja m2 se mueva de tal forma que el vector relativo r12
que une a las dos masas, ejecute una translaci
on paralela. Nuevamente no hay una asociaci
on directa entre
coordenadas generalizadas y partculas del sistema.

2.7.

Relaci
on entre sistemas coordenados y sistemas de referencia

Un conjunto de tres ejes coordenados linealmente independientes que convergen en un punto (origen) forman
un sistema de referencia respecto al cual se pueden medir cantidades fsicas tales como velocidades, desplazamientos, aceleraciones, fuerzas, torques etc. Existen infinitos sistemas de referencia inerciales y no inerciales.
Una vez fijado el sistema de referencia (usualmente inercial), existen infinitos sistemas de coordenadas que se
pueden construr. En particular, para describir un sistema fsico particular es posible usar diversos sistemas
de coordenadas generalizadas para un mismo sistema de referencia. Por ejemplo, las transformaciones
(2.5) describen un cambio de sistema coordenado pero bajo el mismo sistema de referencia. En la mayor parte
del tratamiento de este texto se trabajar
a con transformaciones de coordenadas sin cambio en el sistema de
referencia, a menos que se indique lo contrario.
Notemos en particular que aunque el Lagrangiano puede tener un comportamiento funcional diferente
cuando se cambia de sistema coordenado (sin cambio en el sistema de referencia), su valor numerico debe
permanecer intacto ya que la energa cinetica y potencial no sufren ning
un cambio (en su valor numerico). En
contraste, si se cambia de sistema de referencia claramente pueden cambiar la energa cinetica y la potencial, e
incluso es posible que haya que agregar fuerzas ficticias, por tanto un cambio en el sistema de referencia puede
alterar tanto el valor numerico como el comportamiento funcional del Lagrangiano. Es necesario entonces
diferenciar muy bien entre un cambio de sistema coordenado y un cambio de sistema de referencia.

LAGRANGIANA
2.8. EJEMPLOS DE USO DE LA FORMULACION

2.8.
2.8.1.

27

Ejemplos de uso de la formulaci


on Lagrangiana
Partcula en el espacio

Una partcula de masa m, se mueve bajo la acci


on de una fuerza F. Dado que no hay ligaduras, usaremos
coordenadas cartesianas a manera de coordenadas generalizadas. La energa cinetica se escribe
T
T
x


1
T
T
T
m x 2 + y 2 + z 2
;
=
=
=0
2
x
y
z
T
T
= mx ;
= my ;
= mz
y
z
=

las fuerzas generalizadas Ec. (2.39) nos dan


Qj

1
X
i=1

Fi

ri
r
=F
; qj = x, y, z
qj
qj

Qx = (Fx , Fy , Fz )

(x, y, z) = Fx
x

similarmente Qy = Fy y Qz = Fz . Con lo cual las ecuaciones de movimiento (2.17) quedan


d
d
d
(mx)
= Fx ;
(my)
= Fy ;
(mz)
= Fz
dt
dt
dt
con lo cual llegamos a las ecuaciones de movimiento de Newton.
Veamos las ecuaciones de la misma partcula pero ahora en dos dimensiones y en coordenadas polares, la
transformaci
on a estas coordenadas generalizadas es
x = r cos ; y = r sin
las velocidades son
x = r cos r sin ; y = r sin + r cos
para calcular la energa cinetica calculamos v2
2 
2
 
x 2 + y 2 = r cos r sin + r sin + r cos


= r 2 cos2 + sin2 + r 2 2 sin2 + cos2 2r r cos sin + 2r r sin cos
= r 2 + r 2 2

v2 =
v2
v2
por tanto11


1 
T = m r 2 + r 2 2
2

(2.40)

ahora calculemos las fuerzas generalizadas, Ecs. (2.39)

r
(r ur )
ur
=F
= F ur + F r
= F ur = Fr
r
r
r
r
(r ur )
ur
= F
=F
=Fr
= F ru = rF

Qr = F

(2.41)

(2.42)

observese que no todas las fuerzas (y coordenadas) generalizadas tienen las mismas dimensiones. Qr tiene
dimensiones de fuerza en tanto que Q tiene dimensiones de torque (o trabajo), las coordenadas generalizadas
11

El lector puede tambien calcular la energa cinetica a partir de las Ecs. (2.24).

CAPITULO 2. PRINCIPIO DE DALEMBERT Y ECUACIONES DE LAGRANGE

28

respectivas tienen dimensiones de longitud y son adimensionales respectivamente, de modo que los productos
Qj qj siempre tienen dimensiones de trabajo. Escribamos las dos ecuaciones de Lagrange (2.17)12
T
d
T
= mr 2 ;
= mr ;
r
r
dt
m
r mr 2 = Fr

T
r

= m
r

el segundo termino es el de aceleraci


on centrpeta. Veamos la ecuaci
on asociada a
d
T
T
=0 ;
= mr 2 ;

dt

= mr 2 + 2mr r

la ecuaci
on resulta
mr 2 + 2mr r = rF
se puede demostrar que el termino de la izquierda es la derivada temporal del momento angular, en tanto que
el termino de la derecha es el torque aplicado. Hemos llegado entonces a la expresi
on en componentes de la
Ec. (1.3).

2.8.2.

M
aquina de Atwood

Figura 2.2: (a) M


aquina de Atwood. La longitud L = l1 +l2 +R de la cuerda es constante, y por tanto tambien
lo es l = l1 + l2 . (b) Vista aerea de una cuenta sobre un alambre que rota con velocidad angular constante ,
en ausencia de un campo gravitacional.
La m
aquina de Atwood mostrada en la Fig. 2.2a, consiste en una polea fija, por la cual pasa una cuerda
que se ata a dos masas m1 y m2 . Asumiremos que la cuerda no desliza sobre la polea y que la masa de la polea
y de la cuerda son despreciables. La ligadura (longitud constante de la cuerda) es hol
onoma y escler
onoma.
12

En este problema no podemos usar las ecuaciones de Lagrange dadas por (2.22, 2.23), puesto que no conocemos la forma
especfica de la fuerza y por tanto, no sabemos si esta posee un potencial asociado.

LAGRANGIANA
2.8. EJEMPLOS DE USO DE LA FORMULACION

29

Solo hay una coordenada independiente x, la otra es fijada por la ligadura de longitud constante de la cuerda.
Usando el origen en el centro de la polea, la energa potencial es
V = M1 gx M2 g (l x) ; T =

1
(M1 + M2 ) x 2
2

el Lagrangiano queda

1
(M1 + M2 ) x 2 + M1 gx + M2 g (l x)
2
solo hay una coordenada generalizada x, y por tanto una sola ecuaci
on de movimiento del tipo (2.23)
 
L
d L
= (M1 M2 ) g ;
= (M1 + M2 ) x

x
dt x
(M1 + M2 ) x
= (M1 M2 ) g
LT V =

de aqu sale el valor de la aceleraci


on el cual coincide con el ya obtenido por metodos tradicionales. Observese
que la fuerza de ligadura de tensi
on no aparece en el formalismo y no se puede obtener directamente de el.

2.8.3.

Cuenta sobre un alambre

Una cuenta se desliza sin rozamiento por un alambre que rota uniformemente alrededor de un eje fijo
perpendicular al alambre (ver Fig. 2.2b). Este es un ejemplo de ligadura hol
onoma re
onoma, ya que la posici
on
13
de la cuenta depende explcitamente del tiempo
x = r cos t ; y = r sin t

(2.43)

donde es la velocidad angular de rotaci


on del alambre y r la distancia entre la cuenta y el eje de rotaci
on.

Aqu estamos tomando un sistema coordenado polar con = t de modo que = . El potencial es nulo ya
que asumimos que el sistema no est
a en un campo gravitacional, de modo que el Lagrangiano es T . La energa
14
cinetica se puede tomar de (2.40)

1
(2.44)
T = m r 2 + r 2 2
2
vemos que en este problema hay una sola coordenada generalizada r, puesto que el tiempo es un par
ametro y
no se considera una coordenada. La ecuaci
on de movimiento es
m
r mr 2 = 0 r 2 r = 0
la soluci
on general es de la forma
r (t) = Aet + Bet ; r (t) = Aet Bet
si la cuenta est
a inicialmente en reposo sobre el alambre entonces r (0) = 0 y por tanto A = B. La soluci
on
queda entonces

r = A et et = C sinh t

y la cuenta se mueve exponencialmente hacia afuera para tiempos suficientemente largos, la constante C se
determina con la posici
on inicial. De nuevo el metodo no nos da directamente la fuerza de ligadura que act
ua
sobre la cuenta. Dicha ligadura (fuerza normal N ) se puede hallar con la expresi
on del momento angular
L = |r p| = rmv = rmr = mr 2 = mC 2 sinh2 t
dL
= = 2m 2 C 2 sinh t cosh t
dt
13

Como es usual, esta dependencia explcita con el tiempo se debe a alg


un agente externo, que mantiene el alambre a velocidad
angular constante.
14
La energa cinetica (2.44), contiene un termino independiente de r.
Esto se debe a que las ecuaciones de transformaci
on (2.43)
de coordenadas cartesianas a coordenadas generalizadas dependen explcitamente del tiempo (ver discusi
on en la secci
on 2.3.1).

30

CAPITULO 2. PRINCIPIO DE DALEMBERT Y ECUACIONES DE LAGRANGE

que produce la fuerza normal N = /r, de modo que la fuerza de ligadura es


N
N

2m 2 C 2 sinh t cosh t
=
r
C sinh t
2
= 2m C cosh t
=

la cual act
ua en direcci
on perpendicular al alambre y al eje de rotaci
on.

2.8.4.

Gauge electromagn
etico en la formulaci
on Lagrangiana

Los potenciales vectorial A (r, t) y escalar (r, t) en electrodin


amica, contienen toda la informaci
on fsica
de los campos electricos y magneticos. Por otro lado, es bien sabido que el campo electromagnetico es invariante
ante la transformaci
on gauge
A (r, t) A (r, t) + (r, t)

(r, t) (r, t)

(r, t)
t

(2.45)

donde (r,t) es una funci


on diferenciable en todos sus argumentos, pero por lo dem
as arbitraria. Por otro lado,
ya hemos escrito el Lagrangiano asociado a una partcula cargada q, inmersa en un campo electromagnetico
caracterizado por los potenciales A (r, t) y (r, t), Ec. (2.32) P
ag. 23
L = T q (r, t) + qA (r,t) v (t)

(2.46)

Queremos ver el efecto que las transformaciones (2.45) tienen sobre este Lagrangiano y sobre las ecuaciones
de Lagrange. Con las transformaciones (2.45), el Lagrangiano (2.46) se convierte en


(r, t)
0
0
0
L = T q (r,t) + qA (r, t) v (t) = T q (r, t)
+ q [A (r, t) + (r, t)] v (t)
t

L0 = (T q + qA v) + q
+ q v
t



L0 = L + q
+ v (r, t)
t
ahora bien, el termino en parentesis cuadrados corresponde a la llamada derivada convectiva que es igual a
la derivada total en el tiempo teniendo en cuenta que el campo depende solo de las coordenadas y el
tiempo, y no por ejemplo de r u otras derivadas de orden superior (esto se puede verificar f
acilmente con la
regla de la cadena). Podemos escribir entonces
L0 = L +

d
[q (r, t)]
dt

pero esta transformaci


on no afecta a las ecuaciones de movimiento como se discuti
o en la secci
on 2.3.2,
mostrando que las transformaciones (2.45) dejan invariante la Fsica como era de esperarse.

2.8.5.

Un sistema ligado de dos masas

Sean dos masas identicas m unidas por una barra rgida de peso despreciable y longitud l. El centro de
masa del sistema est
a restringido a moverse sobre un crculo de radio a como lo indica la Fig. 2.3a. El campo
gravitacional es perpendicular al plano del crculo. Calcularemos el Lagrangiano en un sistema adecuado de
coordenadas generalizadas.
Podemos suponer sin perdida de generalidad que el crculo yace sobre el plano XY , y el eje Z va en sentido


contrario al campo gravitacional. De la Fig. 2.3a, es claro que la rapidez del centro de masa es vC = a y
por tanto la energa cinetica del centro de masa es
TCM =

1
2
(m + m) vC
= ma2 2
2

LAGRANGIANA
2.8. EJEMPLOS DE USO DE LA FORMULACION

31

Figura 2.3: (a) Sistema de dos masas unidas por una barra sin masa. El crculo esta sobre el plano XY y
por tanto, tambien el centro de masa. Aunque cada masa puede tener una componente Z. (b) Sistema de
coordenadas esfericas para determinar la posici
on de una de las masas con respecto al centro de masa.
La energa cinetica del sistema vista por el laboratorio, es la suma de la energa cinetica del centro de
masa mas la energa cinetica con respecto al centro de masa, como se aprecia en la Ec. (1.32) P
ag 13. Para
encontrar la energa cinetica del sistema con respecto al CM, recurrimos a la Fig. 2.3b, en donde describimos
la posici
on de una de las partculas en un sistema coordenado con origen en el CM, tal que los ejes XC YC ZC
son instant
aneamente paralelos a los ejes XY Z. En el CM, los momentos de ambas partculas son opuestos y
como las masas son iguales, las velocidades son iguales y opuestas, la energa cinetica vista por el CM es
1
1
T 0 = mv 02 + mv 02 = mv 02
2
2
donde v 0 es la rapidez de cada partcula vista por el CM. Construyendo coordenadas esfericas r, , sobre
este nuevo sistema de referencia, es claro que r = l/2 de modo que para la partcula en cuesti
on, la posici
on
est
a dada por
l
l
l
x = sin cos ; y = sin sin ; z = cos
2
2
2
de modo que
l
l
l
x = ( cos cos sin sin ) ; y = ( sin cos + sin cos ) ; z = sin
2
2
2
la rapidez al cuadrado de cada partcula vista por el centro de masa es
v 02 = x 2 + y 2 + z 2
calculando cada termino al cuadrado tenemos

32

CAPITULO 2. PRINCIPIO DE DALEMBERT Y ECUACIONES DE LAGRANGE

x 2 =
y 2 =
z 2 =

i
l2 h 2
cos2 cos2 2 cos cos sin sin + 2 sin2 sin2
4
i
l2 h 2 2
sin cos2 + 2 sin cos sin cos + 2 sin2 cos2
4
l2 2 2
sin
4

adicion
andolos se obtiene

v 02 =
v 02 =
v 02 =

l2 2
[ cos2 (cos2 + sin2 ) + 2 sin2 (sin2 + cos2 ) + 2 sin2 ]
4
i

l2 h 2
cos2 + sin2 + 2 sin2
4
l2 2
( + 2 sin2 )
4

y la energa cinetica total queda


T
T

= TCM + T 0 = ma2 2 + mv 02

l2  2
= ma2 2 + m
+ 2 sin2
4

teniendo en cuenta que la componente Z de cada partcula es igual en XY Z que en XC YC ZC y que en el


sistema de referencia del CM las posiciones de las dos partculas son opuestas, tenemos V = mgz mgz = 0.
De modo que el Lagrangiano coincide con la energa cinetica.
Puede verse que , , son coordenadas generalizadas independientes ya que cada una se puede mover
en un desplazamiento virtual, sin modificar las otras coordenadas y sin violar las ligaduras. Podemos verlo
tambien por un conteo de grados de libertad: los seis grados de libertad originales para dos partculas, se
pueden traducir en tres grados de libertad de la posici
on del centro de masa, y tres m
as del vector posici
on
relativo entre las dos partculas. La ligadura de mover el CM en un crculo, nos lleva a un solo grado de libertad
para fijar el CM (el angulo ), los tres grados de libertad del vector relativo se reducen a dos por la ligadura
de distancia constante que impone la barra.

2.8.6.

Aro sobre plano inclinado deslizante

Un aro de masa m y radio R rueda sin deslizar sobre un plano inclinado o cu


na de masa M que hace un
angulo con la horizontal como se ve en la Fig. 2.4. Encuentre el Lagrangiano y las ecuaciones de Lagrange
si el plano inclinado puede deslizar sin fricci
on a lo largo del suelo.
Tomaremos como coordenadas generalizadas una coordenada que indica la posici
on del plano inclinado
(desde el origen hasta el vertice en angulo recto del plano inclinado), y una coordenada S medida desde el
vertice superior de la cu
na, hasta el punto de contacto del aro con la cu
na. La longitud total de la cu
na se
denota por l, y las coordenadas del centro del aro con respecto al origen ser
an x, y. La Fig. 2.4 nos muestra
que estas coordenadas vienen dadas por
x = + S cos + R sin

y = R cos + (l S) sin

usando estas coordenadas, teniendo en cuenta que el momento de inercia de un aro es I = mR2 y que S = R
por la condici
on de rodadura, la energa cinetica del aro quedar
a en la forma

2 
2  1
 1 2 1
 S 2
1
2
2

Thoop = m x + y + I = m + S cos + S sin


+
mR2
2
2
2
2
R2

LAGRANGIANA
2.8. EJEMPLOS DE USO DE LA FORMULACION

33

Figura 2.4: (a) Aro que rueda sin deslizar sobre un plano inclinado o cu
na que desliza sobre el suelo sin
rozamiento. (b) Ilustraci
on de las coordenadas generalizadas (, S) y de la geometra b
asica del problema.
de modo que
Thoop =
=

i 1
1 h 2
m + S 2 cos2 + 2S cos + S 2 sin2 + mS 2
2
2
i
1 h 2 2
m 2S + + 2S cos
2

pero la energa cinetica total debe inclur el movimiento translacional de la cu


na a lo largo de x
1
Tplane = M 2
2
la energa total es entonces
T = Thoop + Tplane = mS 2 +

1
(m + M ) 2 + mS cos
2

y la energa potencial nos da


V = mgy = mg [R cos + (l S) sin ]
no es necesario inclur la energa potencial asociada a la cu
na ya que esta no cambia. El Lagrangiano queda
entonces
1
L = mS 2 + (m + M ) 2 + mS cos mg [R cos + (l S) sin ]
(2.47)
2
De modo que
 

d L
d 
L
=
2mS + m cos = 2mS + m cos
;
= mg sin

dt S
dt
S
 
i
d L
d h
L
=
(m + M ) + mS cos = (m + M ) + mS cos ;
=0
dt
dt

con lo cual se obtienen las ecuaciones de Lagrange para S,

2mS + m cos mg sin = 0


(m + M ) + mS cos = 0

(2.48)
(2.49)

Es importante tener en cuenta que la energa cinetica traslacional del aro no se puede escribir en la forma 12 mS 2 ,
ya que S est
a medida con respecto al vertice superior de la cu
na, que no define un sistema inercial. Esto debido
al movimiento (en general acelerado) de la cu
na con respecto al origen fijo en el suelo (que s se supone inercial).

CAPITULO 2. PRINCIPIO DE DALEMBERT Y ECUACIONES DE LAGRANGE

34

2.8.7.

Un potencial generalizado para una fuerza central

Supongamos que una partcula se mueve en un plano bajo la influencia de una fuerza central dada por


r 2 2
1
rr
F= 2 1
ur
(2.50)
r
c2
donde r es la distancia de la partcula al centro de fuerzas y c la velocidad de la luz en el vaco. Esta expresi
on
representa la fuerza entre dos cargas en la electrodin
amica de Weber. Queremos plantear un Lagrangiano
asociado a este sistema.
La partcula se mueve en un plano, pero no tiene ligaduras dentro del plano. Lo natural es entonces utilizar
coordenadas generalizadas polares r y . Ya calculamos las expresiones para las fuerzas generalizadas de una
partcula no ligada en coordenadas polares Ecs. (2.41, 2.42) P
ag. 27. Puesto que esta fuerza es central tenemos
que Q = rF = 0 y Qr = Fr = F .
Se puede verificar que el potencial dado por
1
r 2
+ 2
(2.51)
r c r
es un potencial generalizado v
alido para reproducir el valor de la fuerza generalizada Qr = F , donde F es
dado en (2.50). Para verlo partimos de las expresiones (2.26, 2.27) para el potencial y la fuerza generalizados,
de modo que la fuerza generalizada asociada al potencial en (2.51) es


U
d U
+
(2.52)
Qr = Fr =
r
dt r






U
1
r 2
d U
d 2r
2r
2r 2
2
r
r
2
r
= 2 2 2 ;
=
=
=

+ 2

+
2
2
2
2
2
2
r
r
c r
dt r
dt c r
c
r
c r
c r
c r
U (r, r)
=

con lo cual
U
d

+
r
dt

U
r

1
r 2
2r 2
2
r
1
r 2
2
r
1
= 2+ 2 2 2 2+ 2 = 2 2 2+ 2 = 2
r
c r
c r
c r
r
c r
c r
r

r 2 2
rr
1
2
c

on (2.27) obteniendose
que reproduce la expresi
on (2.50) de la fuerza. Para qj , tambien se cumple la condici
cero en ambos miembros. Pues no debe perderse de vista que U debe reproducir todas las fuerzas generalizadas
asociadas al problema.
Hay dos puntos que vale la pena enfatizar: (a) Los potenciales generalizados deben reproducir la fuerza generalizada y no la fuerza real (aunque en este caso ambas coinciden en magnitud). (b) El potencial generalizado
no tiene porque ser u
nico, ya que solo se busca una soluci
on a la ecuaci
on diferencial (2.27), sin condiciones
iniciales ni de frontera. La no unicidad del potencial generalizado es de esperarse, puesto que incluso el potencial tradicional no es u
nico. Por supuesto, el potencial generalizado tiene un gauge m
as complejo, ya que si
redefinimos el potencial generalizado en la forma
U 0 (q, q,
t) = U (q, q,
t) + W (q, q,
t)
en donde W (q, q,
t) satisface la ecuaci
on


d W (q, q,
t)
W (q, q,
t)
=0

dt
qj
qj

qj del sistema

(2.53)

(2.54)

es claro que U 0 (q, q,


t) reproduce las mismas fuerzas generalizadas que U (q, q,
t). En particular W = cte es un
gauge posible.
Usando la energa cinetica (2.40) para una partcula en coordenadas polares y el potencial generalizado
(2.51) el Lagrangiano queda

 1
1 
r 2
L = T U = m r 2 + r 2 2
1+ 2
2
r
c
puede el lector encontrar una forma sistem
atica de encontrar un potencial generalizado, por medio de la
ecuaci
on (2.52) y la expresi
on (2.50) para la fuerza?.

LAGRANGIANA
2.8. EJEMPLOS DE USO DE LA FORMULACION

2.8.8.

35

Partcula inmersa en un fludo

Sea una partcula de masa m que cae verticalmente bajo la influencia de la gravedad y de una fuerza viscosa
de la forma F = kv, debida a su inmersi
on en un fludo (el aire), donde v es la velocidad instant
anea de la
partcula. Plantearemos las ecuaciones de movimiento para esta partcula a partir de su Lagrangiano y de la
funci
on de disipaci
on de Rayleigh. El problema es unidimensional no ligado, de modo que el Lagrangiano es
simplemente
1
L = mz 2 mgz
2
Pero debido a la presencia de una fuerza de fricci
on, el Lagrangiano no contiene toda la informaci
on Fsica
del sistema. Es necesario incorporar la funci
on de disipaci
on de Rayleigh. La ecuaci
on de movimiento viene
dada por (2.38)
 
d L
L z

+
= 0
dt z
z
z
m
z + mg + kz z = 0
(2.55)
donde hemos usado la funci
on de disipaci
on z de la Ec. (2.37), para una partcula. Puesto que la fuerza viscosa
aumenta con la rapidez, llega una momento en el cual la fuerza viscosa se anula con el peso (al menos si la
cada dura el suficiente tiempo). Esta condici
on de cancelaci
on nos llevar
a entonces a la velocidad terminal de
la partcula
mg
mg + kz zterm = 0 zterm =
(2.56)
kz
cuando la partcula alcanza esta velocidad, esta ya no experimenta una aceleraci
on y contin
ua con esta velocidad
hasta que haga contacto con el piso. Esto se aprecia combinando las Ecs. (2.55, 2.56) para obtener zterm = 0.
La Ec. (2.55) se puede resolver para todo tiempo haciendo el cambio de variable
Z = z +

mg
; Z = z
kz

con lo cual la Ec. (2.55) queda


z + g +

kz
kz
z = 0 Z + Z = 0
m
m

Z
kz
=
Z
m

cuya soluci
on es
kz
ln Z = t + B
m
kz
mg
z +
= Ce m t
kz

kz

Z = Ce m t
(2.57)

tomando la condici
on inicial z (t = 0) = v0 , en esta ecuaci
on se tiene que
v0 +

mg
=C
kz

con lo cual la ecuaci


on (2.57) queda
z =


kz
mg
mg
+ v0 e m t
kz
kz

(2.58)

la velocidad terminal se puede obtener haciendo t , con lo cual se reproduce adecuadamente el valor dado
en la Ec. (2.56). N
otese que por los dos caminos seguidos, es claro que la velocidad terminal es independiente
del valor (y del signo) de v0 . En particular, si |v0 | > |zterm | y la partcula va inicialmente hacia abajo (v0 < 0),
la fuerza viscosa disminuye la rapidez de la partcula hasta que alcanza el valor de la velocidad terminal, esto
debido a que inicialmente la fuerza viscosa supera en magnitud al peso. El lector puede obtener f
acilmente
z (t) integrando (2.58).

CAPITULO 2. PRINCIPIO DE DALEMBERT Y ECUACIONES DE LAGRANGE

36

2.9.

Ventajas del formalismo Lagrangiano

El Lagrangiano es invariante ante un cambio en las coordenadas generalizadas y es mucho mas conveniente
para definir la mec
anica o en general la Fsica de sistemas contnuos. Por otro lado, diferentes sistemas Fsicos
(incluso no necesariamente mec
anicos) pueden exhibir Lagrangianos semejantes15 . Tomemos el ejemplo del
siguiente Lagrangiano
X qj2
X
1X
1X
L=
Lj qj2 +
Mjk qj qk
+
Vj (t) qj
(2.59)
2
2
2Cj
j

j6=k

con la siguiente funci


on de disipaci
on
z=

1X
Rj qj2
2

(2.60)

Se puede demostrar que el Lagrangiano (2.59) y la funci


on de disipaci
on (2.60) junto con las ecuaciones
de Lagrange con termino disipativo Ecs. (2.38), reproducen las ecuaciones diferenciales que describen a un
conjunto de circuitos RLC con fuentes, y acoplados a traves de las inductancias mutuas Mjk . Los valores
Lj , Cj , Vj denotan inductancias, capacitancias y voltages de fuentes respectivamente. qj denota las cargas
electricas que en este caso han sido tomadas como las variables din
amicas (y por tanto, como las coordenadas
generalizadas), este no es un ejemplo mec
anico en el sentido de que las cargas no denotan de ning
un modo
posiciones de las partculas o subsistemas. No obstante, el sistema tiene un an
alogo mec
anico: la inductancia es
una medida de la resistencia al cambio en el flujo de carga, de modo que es un termino de inercia, caso similar
el de las inductancias mutuas16 . El capacitor act
ua como una fuente de energa potencial del tipo oscilador
17
arm
onico simple , la resistencia proporciona un termino disipativo tipo Stokes (proporcional a la velocidad
generalizada), y finalmente la fuerza electromotriz equivale a un forzamiento externo que se traduce en una
energa potencial de la forma qj Vj (siendo Vj el voltage en un instante).
Finalmente, cabe resaltar que en el caso de ligaduras hol
onomas, en el cual es posible encontrar un conjunto mnimo de coordenadas independientes, el sistema de ecuaciones Lagrangianas se reduce con respecto al
formalismo Newtoniano. Esto se debe a que cada ecuaci
on de movimiento est
a asociada a una coordenada y
no a una partcula, y claramente el n
umero de coordenadas independientes es menor o igual que 3N , siendo
N el n
umero de partculas.

2.10.

Ejercicios

1. Tres masas se acoplan por medio de cuerdas en serie, para formar un pendulo triple similar al de la Fig.
2.1. (a) Encuentre un conjunto apropiado de coordenadas generalizadas independientes. (b) Describa un
desplazamiento virtual para cada coordenada, de modo que las otras se mantengan fijas. (c) Plantee el
Lagrangiano asociado. Puede asumir que todas las masas se mueven en un plano.
2. Sea un sistema de referencia inercial S y un plano inclinado que est
a en reposo con respecto a S. Sobre el
plano inclinado desliza un bloque de masa m. Tomemos ahora otro sistema de referencia inercial S 0 que
se mueve a una velocidad constante v = vux con respecto a S. (a) Demuestre que la fuerza normal del
plano inclinado sobre el bloque realiza trabajo (real) sobre el bloque, visto por el sistema de referencia
S 0 . (b) Demuestre que el trabajo virtual de la normal sobre el bloque es cero, tanto en S como en S 0 .
(Para m
as comentarios ver Refs. [5, 6]).
15
Hay que aclarar sin embargo que esta caracterstica no solo la presenta la formulaci
on Lagrangiana, en realidad las ecuaciones
diferenciales en la mec
anica Newtoniana ya presentan estas analogas.
16
La suma de los terminos con autoinductancias e inductancias mutuas dan una energa cinetica que solo depende cuadr
aticamente de las coordenadas generalizadas. Lo cual equivale en el caso mec
anico a escenarios con ligaduras escler
onomas (ver secci
on
2.3.1, Ec. 2.24).
17
Efectivamente, se requiere una cierta energa para cargar el condensador, esta energa queda almacenada y se puede intercambiar
en otra forma de energa.

2.10. EJERCICIOS

37

3. Demuestre que las ecuaciones de Lagrange del tipo dado en (2.17) se pueden escribir equivalentemente
en la forma
T
T
2
= Qj
qj
qj
usualmente conocidas como ecuaciones de Nielsen.
4. Encuentre el Lagrangiano y las ecuaciones de Lagrange de un pendulo esferico. Esto es, una masa puntual
en un campo gravitacional, que se mueve de modo que su distancia a un punto fijo permanece constante
(debido por ejemplo, a una varilla rgida sin masa). Plantee un Lagrangiano para peque
nas oscilaciones
en las coordenadas generalizadas apropiadas.
5. Obtenga el Lagrangiano y las ecuaciones de movimiento del pendulo doble ilustrado en la Fig. 2.1 P
ag.
16, asumiendo que el movimiento se realiza en un plano. Plantee el Lagrangiano en una aproximaci
on de
peque
nas oscilaciones para ambas coordenadas generalizadas 1 y 2 .
6. Supongamos una masa m1 que se mueve con movimiento circular uniforme, debido a que est
a atada a
una cuerda de longitud constante. Por otro lado, una partcula sometida a una fuerza central atractiva
de la forma F = kr 2 ur , puede realizar un movimiento circular uniforme con las condiciones iniciales
apropiadas (ver captulo 10). No obstante, la fuerza que mantiene la distancia constante en el primer
problema (tensi
on de la cuerda) se considera una fuerza de ligadura. En contraste, aunque la fuerza F =
kr 2 ur mantenga constante la distancia de la partcula al centro de fuerzas, esta NO se trata como
fuerza de ligadura. En que consiste la diferencia?.
7. Encuentre un potencial generalizado U 0 que difiera de manera no trivial del potencial U en la Ec. (2.51)
y que genere las mismas fuerzas generalizadas.

Captulo 3

Suplemento matem
atico: c
alculo de
variaciones y multiplicadores de Lagrange
Existen muchos problemas de minimizaci
on o maximizaci
on que requieren de extender las herramientas
tradicionales del c
alculo. Es frecuente encontrar problemas en los cuales una trayectoria completa se mapea en
un n
umero real y queremos encontrar la trayectoria que minimiza o maximiza dicho n
umero. En el presente
captulo estudiaremos el c
alculo variacional, como herramienta para resolver esta clase de situaciones. Por otra
parte, cuando un proceso de optimizaci
on est
a sujeto a ligaduras, el metodo de multiplicadores de Lagrange
es una herramienta sistem
atica para encontrar los extremos de una funci
on sin violar las ligaduras impuestas.
Veremos m
as adelante que la combinaci
on de las dos herramientas nos generar
a una formulaci
on lagrangiana
con la capacidad de inclur y resolver las fuerzas de ligadura.

3.1.

Algunos problemas pr
acticos de naturaleza variacional

Vamos a enunciar algunos problemas de ndole pr


actica que no se pueden resolver con los metodos tradicionales del c
alculo. Aunque el principal objetivo del desarrollo del c
alculo variacional en este texto ser
a la
discusi
on del principio variacional de Hamilton enunciado en el captulo 4, esta herramienta matem
atica tiene
muchas otras aplicaciones de modo que lo desarrollaremos en forma independiente al tema central.

3.1.1.

Minimizaci
on del tiempo de cada de una partcula

Consideremos una partcula que se mueve en un campo gravitacional constante y que partiendo del reposo
viaja desde un punto (x1 , y1 ) hasta otro punto m
as bajo (x2 , y2 ) con la condici
on de que los puntos no se
encuentran sobre la misma vertical. Encuentre la curva que permita que la partcula haga este recorrido en el
menor tiempo posible.
Planteamiento: Tomemos a X como el eje vertical hacia abajo y a Y como el eje horizontal a la derecha.
Por simplicidad hacemos coincidir al punto (x1 , y1 ) con el origen. Tomando el cero de potencial en el origen,
y teniendo en cuenta que la partcula parte del reposo, se tiene que la energa mec
anica de la partcula viene
dada por
1
T + V = mv 2 mgx = 0
2

de modo que la rapidez est


a dada por v = 2gx, el tiempo de recorrido es

t=

dt =

(x2 ,y2 )

(x1 ,y1 )

ds
=
v

(x2 ,y2 )
(x1 ,y1 )

(dx) + (dy)

=
2gx
38

(x2 ,y2 )

(x1 ,y1 )

 2
dy
1 + dx

dx
2gx


3.1. ALGUNOS PROBLEMAS PRACTICOS
DE NATURALEZA VARIACIONAL
donde ds denota una longitud de arco infinitesimal de la trayectoria, la expresi
on queda finalmente
Z x2 s
1 + y 2
dy
t=
dx ; y (x)
2gx
dx
x1 =0

39

(3.1)

por tanto ser


a necesario encontrar el valor de y (x) que hace que la integral (3.1) nos de el menor valor posible.
En c
alculo ordinario los problemas de minimizaci
on usualmente consisten en encontrar el valor de un punto
(por ejemplo sobre la recta real) de modo que una cierta cantidad (funci
on) nos de un valor mnimo al evaluarla
en ese punto. En contraste, aqu requerimos encontrar una trayectoria completa que haga que cierta cantidad
sea mnima, puesto que lo que tenemos en este problema es una trayectoria completa que se mapea en un
n
umero (el tiempo).

3.1.2.

Minimizaci
on de una superficie de revoluci
on

Figura 3.1: S
olido de revoluci
on generado alrededor de Y . (x1 , y1 ) y (x2 , y2 ) son puntos fijos y se busca la curva
generadora que pase por estos puntos y que minimice la superficie lateral del s
olido.
Consideremos la superficie lateral generada por una curva que une dos puntos fijos (x1 , y1 ) y (x2 , y2 ) cuando
se revoluciona alrededor de un eje coplanar con los puntos y la curva (ver Fig 3.1). La idea es encontrar la
ecuaci
on de la curva en cuesti
on a fin de que el area lateral generada por este s
olido de revoluci
on sea mnima.
Planteamiento: Asumiremos que la curva con extremos fijos se revoluciona alrededor del eje Y . Para
calcular el area lateral total de revoluci
on, calculamos primero el diferencial de area dA sobre una peque
na
tira como se muestra en la figura 3.1. Dicho diferencial viene dado por
s
 2
q
dy
dA = 2x ds = 2x (dx)2 + (dy)2 = 2x 1 +
dx
dx
nuevamente ds es la longitud infinitesimal de arco asociada a la curva. La expresi
on final para el area queda
Z x2 p
dy
A = 2
x 1 + y 2 dx ; y
(3.2)
dx
x1
de nuevo la minimizaci
on del area consiste en encontrar una trayectoria completa que minimice tal cantidad.

40

3.2.

CAPITULO 3. CALCULO
VARIACIONAL Y MULTIPLICADORES DE LAGRANGE

Aspectos fundamentales del c


alculo de variaciones

Un rasgo general de los ejemplos hasta aqu propuestos es que es necesario resolver el problema de como hallar la trayectoria que hace que el valor de una cierta cantidad (tiempo de cada, superficie etc.) sea estacionario
(mnimo, m
aximo, punto de inflexi
on etc.). Este es uno de los problemas fundamentales del c
alculo variacional.
Si denotamos por J a la cantidad generica (tiempo de cada, superficie, etc.) que queremos minimizar podemos
ver que las Ecs. (3.1, 3.2) tienen la siguiente estructura generica
Z x2
dy
J=
f (y, y,
x) dx ; y = y (x) , y
(3.3)
dx
x1
a la cantidad y la llamaremos coordenada generalizada y la variable independiente x ser
a considerada un
par
ametro que modula la forma de la trayectoria y (x) y de su derivada y (x). Para prop
ositos futuros es u
til
considerar el caso en el cual tenemos m
as de una coordenada generalizada, de modo que la relaci
on (3.3) se
extiende en la forma
Z x2
J=
f (y1 (x) , . . . , yn (x) , y 1 (x) , . . . , y n (x) , x) dx
(3.4)
x1

donde las yi son coordenadas generalizadas independientes entre s y solo pueden depender del par
ametro x.
Definiremos ahora un espacio de configuraciones que se construye asignando un eje a cada coordenada
generalizada independiente yi de modo que tenemos un espacio cartesiano n dimensional, es necesario enfatizar que NO se asigna un eje asociado al par
ametro x. Para un valor fijo de x una configuraci
on completa de
coordenadas yi corresponde a una nupla y por tanto a un punto en el espacio de configuraciones. Cuando
se mueve el par
ametro x cambia la posici
on del punto en el espacio de configuraciones trazando una trayectoria en dicho espacio. Si queremos minimizar o maximizar J debemos encontrar el conjunto de trayectorias
unidimensionales yi (x) que hagan que la integral (3.4) sea mnima o m
axima. N
otese que en el lenguaje del
espacio de configuraciones, el problema de minimizar o maximizar J se convierte en el problema de encontrar
la trayectoria en el espacio de configuraciones que minimice tal cantidad. Esta visi
on del problema resulta u
til
en la medida que nos permite visualizar una u
nica trayectoria de minimizaci
on o maximizaci
on en lugar de
muchas trayectorias independientes.
Replanteando el problema de la minimizaci
on de J, tal minimizaci
on significa que entre todas las trayectorias posibles que el sistema puede seguir en el espacio de configuraciones al barrer el par
ametro entre los
a la trayectoria que haga que el valor de la integral (3.4) sea estacionario
extremos x1 y x2 , el sistema trazar
(estrictamente no sabemos a
un si es mnimo m
aximo o punto de inflexi
on). Para una integral de lnea, el
termino estacionario significa que el valor de la integral cuando se toma un cierto camino, tiene el mismo valor
dentro de infinitesimales de primer orden que cuando se toman caminos vecinos a este (caminos que difieren
del original por desplazamientos generalizados infinitesimales). Recordemos que las trayectorias de las que
hablamos aqu, son hipertrayectorias en el espacio n dimensional de configuraciones. Para integrales de lnea
este es el equivalente en funciones ordinarias a puntos con derivada cero. En este caso en lugar de un punto
tenemos una trayectoria entera.

3.2.1.

C
alculo variacional en una dimensi
on

Trabajaremos el problema inicialmente en una dimensi


on. Sea una funci
on f (y, y,
x) definida sobre un
camino y = y (x) donde x act
ua como un par
ametro, y y es una coordenada generalizada. y denota la derivada
respecto al par
ametro x. Queremos encontrar un camino particular y (x) de tal modo que la integral de lnea
J de la funci
on f entre x1 y x2
Z x2
dy
J=
f (y, y,
x) dx ; y = y (x) , y
(3.5)
dx
x1
adquiera un valor estacionario relativo a caminos vecinos que difieren infinitesimalmente del original. En nuestro
caso, consideraremos solo los caminos que cumplen la condici
on y (x1 ) = y1 , y (x2 ) = y2 , ya que esta condici
on
siempre se impone en el principio de Hamilton. Esto se denomina condici
on de extremos fijos. Si hacemos


3.2. ASPECTOS FUNDAMENTALES DEL CALCULO
DE VARIACIONES

41

una gr
afica de y vs x, para varias trayectorias posibles, encontramos que todas ellas deben converger en los
extremos de la gr
afica, a los puntos (x1 , y1 ) y (x2 , y2 ). N
otese que la gr
afica y vs x no representa el espacio
de configuraciones, ya que este u
ltimo no contiene ning
un eje que represente al par
ametro. En este caso, el
espacio de configuraciones es de una sola dimensi
on, todos los caminos posibles son lneas rectas que conectan
a y1 con y2 . En consecuencia, lo que distingue a los diferentes caminos es su dependencia con el par
ametro x.
Vale decir que la coordenada y es generalizada y por tanto no tiene necesariamente dimensiones de longitud.
Ahora parametrizaremos el problema de tal manera que se pueda hacer uso del c
alculo ordinario. Cuando
partimos del camino correcto, la variaci
on de J debe ser cero con respecto al cambio a una familia de caminos
vecinos que rotularemos con alguna variable infinitesimal . Denotaremos a las trayectorias vecinas como
y (x, ), donde y (x, 0) es el camino correcto. Por ejemplo, si seleccionamos una funci
on arbitraria (x) pero
que cumpla con la condici
on de que se anula en los extremos i.e. en x = x1 y x = x2 una posible familia de
caminos vecinos estara definida por
y (x, ) = y (x, 0) + (x)
(3.6)
claramente, esta familia de funciones converge en sus extremos gracias a la condici
on impuesta a (x) de
nulidad en los extremos. Asumiremos de aqu en adelante que el camino correcto y (x, 0) y la funci
on (x)
son de clase C 2 (contnuas y no singulares hasta la segunda derivada en todos sus argumentos) en el intervalo
[x1 , x2 ]. Con cualquier familia de curvas en la vecindad de y (x), el variacional J es funci
on de
Z x2
J () =
f (y (x, ) , y (x, ) , x) dx
(3.7)
x1

dado que hemos definido que la curva correcta se encuentre cuando = 0, la condici
on de punto estacionario
para J se puede ahora expresar en terminos de cantidades del c
alculo ordinario en la forma
 
dJ
=0
(3.8)
d =0
derivando la Ec. (3.7) bajo el signo integral de la forma usual, tenemos

Z x2 
dJ
f y
f y
=
+
dx
d
y y
x1

(3.9)

naturalmente se asume que x/ = 0 ya que es un par


ametro que me caracteriza cada curva en tanto que
x se mueve a lo largo de cada curva (con fijo) claramente los dos son independientes1 . Veamos la segunda
integral en el miembro derecho de la Ec. (3.9)

 

 
Z x2
Z x2
Z x2
f y
f
y
f
y
dx =
dx =
dx
(3.10)
x

x1 y
x1 y
x1 y x
para integrar por partes elegiremos

 
f

y
u=
; dv =
dx
y
x
  h  i
f
d
con lo cual du = d f
= dx
dx puesto que en la integral solo se hace variaci
on en el par
ametro x.
y
 y 
y
Por otro lado, v =
, y al integrar por partes queda
Z

x2

x1



 
Z x2   
f
y
f y x2
d f
y
dx =

dx
y x
y x1
dx

x1

(3.11)

donde la continuidad hasta segundas derivadas de y (x, ) asegura que el intercambio de las derivadas parciales
es posible. Teniendo en cuenta que todas las curvas deben pasar a traves de los puntos (x1 , y1 ) y (x2 , y2 ), se
1

En la Ec. (3.6) el termino (x) que determina la desviaci


on del camino variado con respecto al camino real, tiene toda su
dependencia de la variable x en la funci
on (x).

42

CAPITULO 3. CALCULO
VARIACIONAL Y MULTIPLICADORES DE LAGRANGE

llega a que la derivada parcial de y con respecto a deben ser cero en x1 y en x2 . En consecuencia, el primer
termino de la derecha en (3.11) se anula y por tanto, la integral (3.10) queda
Z x2   
Z x2
f y
d f
y
dx =
dx
(3.12)

dx

x1
x1
reemplazando (3.12) en (3.9) se obtiene
dJ
=
d

x2

x1

  
f
d f
y

dx
y
dx y

Combinando (3.8) con (3.13) se ve que la condici


on para que J adquiera un valor estacionario es
 
    
Z x2 
f
dJ
d f
y
=
dx = 0

d =0
y
dx y
=0
x1

(3.13)

(3.14)

por otro lado, la expresi


on (y/)=0 es una funci
on arbitraria de x excepto por exigencias de continuidad
hasta la segunda derivada y la condici
on de extremos fijos. Por ejemplo, para el conjunto particular de familias
definidas por (3.6) el factor (y/)=0 viene dado por la funci
on arbitraria (x). Aplicaremos ahora a la Ec.
(3.14) el lema fundamental del c
alculo de variaciones, seg
un el cual si se cumple
Z x2
M (x) (x) dx = 0
(3.15)
x1

para todas las funciones arbitrarias (x) contnuas hasta la segunda derivada, entonces M (x) debe ser identicamente cero en el intervalo (x1 , x2 ). La demostraci
on formal se puede encontrar en los textos de c
alculo
variacional pero se puede dar una visi
on eurstica de este lema: Imaginemos que construmos una funci
on (x)
que es positiva en una vecindad de un cierto punto y cero en las otras regiones, en consecuencia la integral
(3.15) solo ser
a v
alida si M es cero en este punto arbitrariamente escogido. Por tanto, M debe ser cero en todo
el intervalo de integraci
on. Usando este lema para la expresi
on (3.14) se obtiene
  
f
d f

=0
(3.16)
y
dx y
esta ecuaci
on diferencial nos da entonces como soluci
on la trayectoria y = y (x) que deja estacionaria la
cantidad J. Ahora bien, la desviaci
on infinitesimal de un camino dado con respecto al camino correcto y (x, 0)
en el punto x viene dado por


y (x, )
d y (x)
(3.17)

=0

como en esta variaci


on el par
ametro x es fijo, el desplazamiento anterior corresponde a los desplazamientos
virtuales de las coordenadas generalizadas discutidos en la formulaci
on de Lagrange (en la formulaci
on de
Lagrange, el par
ametro es el tiempo y permanece fijo cuando se hace un desplazamiento virtual de la coordenada
generalizada) por eso la notaci
on y. Por otro lado, la variaci
on de J con respecto a su valor cuando se toma
el camino correcto es
 
dJ
d J
(3.18)
d =0
la estacionaridad del variacional J cuando se eval
ua sobre el camino correcto se manifiesta entonces como
J = 0. Multiplicando la Ec. (3.14) por d y usando (3.17) y (3.18) resulta
  
Z x2 
f
d f
J =

y dx = 0
(3.19)
y
dx y
x1

requiriendo que y (x) satisfaga la ecuaci


on (3.16). La variaci
on de una integral de lnea usualmente se denota
como para diferenciarla de la variaci
on de una funci
on ordinaria. La Ec. (3.19) no contiene informaci
on
nueva con respecto a (3.14) pero resulta m
as adecuada para una extensi
on del formalismo cuando tenemos n
coordenadas generalizadas como veremos a continuaci
on.

DE LOS PROBLEMAS DE APLICACION


PLANTEADOS
3.3. SOLUCION

3.2.2.

43

C
alculo de variaciones multidimensional

Veamos la extensi
on al caso de n coordenadas generalizadas. El variacional lo escribimos como
Z 2
J=
f (y1 (x) , . . . , yn (x) , y 1 (x) , . . . , y n (x) , x) dx

(3.20)

donde todas las variables yi , y i son independientes entre s, y solo pueden depender del par
ametro x. En este
caso tenemos una hipertrayectoria correcta y una familia posible de hipertrayectorias vecinas se puede escribir
como
yi (x, ) = yi (x, 0) + i (x) ; i = 1, . . . , n
(3.21)
on (trayectoria correcta en el espacio de configuraciones).
donde yi (x, 0) con i = 1, . . . , n, denotan la soluci
Las i (x) son independientes entre s, pero deben anularse en los extremos y ser contnuas hasta la segunda
derivada, por lo dem
as son completamente arbitrarias. Un c
alculo semejante al anterior nos conduce a

Z 2X
n 
f yi
f y i
J
d =
d +
d dx

yi
y i
1
i=1

de nuevo el segundo termino se puede integrar por partes




Z 2
Z 2 
f 2 yi
f yi 2
d
f
yi

dx =
dx

y i 1
dx y i

1 y i x
1

(3.22)

y una vez m
as el primer termino a la derecha se anula cuando imponemos la condici
on de extremos fijos. La
variaci
on J con respecto a la trayectoria correcta del sistema, queda entonces
 
 

n Z 2
X
d
f
J
f
d = J =

(3.23)
yi dx
=0
yi
dx y i
1
i=1

donde an
alogamente al caso unidimensional
yi =

yi

(3.24)

=0

dado que las coordenadas generalizadas son independientes, sus variaciones yi tambien lo son2 . Por ejemplo,
para la familia de curvas vecinas definidas por la Ec. 3.21, equivale a que los i (x) sean independientes. En
virtud de la independencia de los yi , si la suma sobre i en la Ec. (3.23) es nula, debe ser nulo cada sumando.
Apelando entonces al lema fundamental del c
alculo variacional, se llega a que la condici
on de estacionaridad
J = 0 nos lleva a
 

d
f
f

= 0 , i = 1, . . . , n
(3.25)
yi
dx y i

las soluciones yi (x) forman entonces la trayectoria en el espacio de configuraciones que hace de J un valor
estacionario. Estas ecuaciones se conocen como las ecuaciones de Euler-Lagrange. Se pueden estudiar generalizaciones a variacionales en donde por ejemplo la funcion f dependa de derivadas superiores de y, existan
varios par
ametros xj o se relaje la condici
on de extremos fijos. Para el an
alisis del principio de Hamilton que
se ver
a en el captulo 4, las condiciones aqu trabajadas son lo suficientemente generales.

3.3.

Soluci
on de los problemas de aplicaci
on planteados

Las Ecs. (3.16, 3.25) son generales y aplicables a muchos sistemas incluso no mec
anicos. Estamos entonces
preparados para resolver los problemas propuestos al principio del captulo y otros de caractersticas similares.
2
Puesto que las coordenadas generalizadas yi son independientes, cada una se puede mover sin mover las otras y sin violar
posibles ligaduras. Y puesto que en el proceso x es fijo, los yi corresponden a los desplazamientos virtuales que vimos en el
principio de DAlembert.


CAPITULO 3. CALCULO
VARIACIONAL Y MULTIPLICADORES DE LAGRANGE

44

3.3.1.

Minimizaci
on de la longitud de arco

Antes de resolver los problemas planteados, veamos un problema de gran simplicidad y valor pedag
ogico.
Dados dos puntos fijos en un plano, encontrar la trayectoria que minimiza la longitud de arco. La longitud de
arco diferencial para una curva bidimensional se obtiene f
acilmente
(ds)2 = (dx)2 + (dy)2 ds =
la longitud de arco total se escribe entonces como
Z
S=

x2
x1

1 + y 2 dx ; y

dy
dx

1 + y 2 dx

(3.26)

comparando (3.5) con (3.26) es claro que


f (y, y,
x) =
de las expresiones
d
f
=0 ;
y
dx

f
y

d
=
dx

usando la Ec. (3.16) resulta


d
dx
el termino entre parentesis debe ser constante

p
p

1 + y 2

y
1 + y 2

y
1 + y 2

y
1 + y 2

=0

=c

ahora bien, para que se cumpla esta relaci


on es necesario que a su vez y sea una constante relacionada con c
(aunque esta relaci
on no es relevante), de lo cual se obtiene la ecuaci
on de la trayectoria
y = a y = ax + b
que corresponde a una lnea recta, las constantes de integraci
on a y b se determinan con los puntos fijos de la
trayectoria. Estrictamente, solo se ha demostrado que la trayectoria da un valor estacionario para la longitud
de arco pero sabemos por intuici
on que corresponde a un mnimo. En realidad se puede encontrar el tipo de
extremo a traves de la segunda derivada funcional.

3.3.2.

Minimizaci
on del tiempo de cada de una partcula: la braquist
ocrona

En la secci
on 3.1.1 plante
abamos el problema de una partcula que se mueve en un campo gravitacional
constante desde un punto fijo inicial a otro final y se peda encontrar la curva que minimice el tiempo de cada.
El planteamiento del problema nos llev
o a la Ec. (3.1)
Z x2 s
1 + y 2
t=
dx
2gx
0
dado que la constante

2g no afecta el problema, identificamos la funci


on f como
r
1 + y 2
f=
x

(3.27)

DE LOS PROBLEMAS DE APLICACION


PLANTEADOS
3.3. SOLUCION
como

f
y

45

= 0 la ecuaci
on de Euler Lagrange queda
d
dx

f
y

=0

f
1
= cte
y
2a

la parametrizacion de la constante de integraci


on se hace por comodidad. Realizando f / y en (3.27) resulta
p

y
x (1 + y 2 )

y 2 =

2a

y 2
1
=
2
x (1 + y )
2a

2ay 2 = x 1 + y 2

x
x2
=
(2a x)
(2ax x2 )

que se puede escribir en la forma


y=

haciendo el cambio de variable

x dx
2ax x2

x = a (1 cos ) ; dx = a sin d

(3.28)

la integral queda de la forma


Z
Z
a (1 cos ) (a sin d)
a (1 cos ) sin d
q
p
y =
=
(2 2 cos ) (1 2 cos + cos2 )
2a [a (1 cos )] [a (1 cos )]2
Z
Z
sin

a (1 cos ) d = a (1 cos ) d
y =
1 cos2
cuya soluci
on es
y = a ( sin ) + b

(3.29)

Con = 0, las Ecs. (3.28, 3.29) nos dan x = 0 y y = b. Si el punto inicial coincide con el origen entonces y = 0
cuando x = 0. Por tanto b = 0, y la constante a se ajusta para que la curva pase por el punto (x2 , y2 ). Las
ecuaciones (3.28, 3.29) para x e y quedan entonces
x = a (1 cos ) ; y = a ( sin )
que coinciden con las ecuaciones parametricas del cicloide, con par
ametro . Este perfil especfico del cicloide
se denomina una braquist
ocrona.

3.3.3.

Minimizaci
on de una superficie de revoluci
on

En la secci
on 3.1.2 tomamos una superficie generada por una trayectoria que une dos puntos fijos y que
se revoluciona alrededor de un eje coplanar con los puntos y la curva. La idea era encontrar la ecuaci
on de la
trayectoria en cuesti
on que minimizara el area generada. El planteamiento nos llev
o a la Ec. (3.2)
Z x2 p
A = 2
x 1 + y 2 dx
x1

La funci
on f vendr
a dada por
f =x

1 + y 2

y empleamos las ecuaciones de Euler Lagrange (3.16) para lo cual calculamos


f
=0
y

f
xy
=p
y
(1 + y 2 )


CAPITULO 3. CALCULO
VARIACIONAL Y MULTIPLICADORES DE LAGRANGE

46

con lo cual la Ec. (3.16) nos da


#
"
d
xy
p
dx
(1 + y 2 )

y 2

despejando y

esta integral nos da

y = p

xy

(1 + y 2 )

x2 a2 = a2
a

(x2 a2 )

= cte a x2 y 2 = a2 1 + y 2

; y=

y = a cosh1

x

a dx
p
(x2 a2 )

+b
a
donde a y b son constantes de integraci
on que se determinan requiriendo que la curva pase por los puntos
(x1 , y1 ) y (x2 , y2 ). Esta ecuaci
on se puede invertir para escribir


yb
x = a cosh
a
que se reconoce como la ecuaci
on de la catenaria, que es la curva que se forma cuando una cuerda flexible
cuelga libremente entre dos puntos fijos en un campo gravitacional uniforme.
N
otese que si definimos x0 = x/a y y 0 = y/a obtenemos

x0 = cosh y 0 b/a

obtenemos una ecuaci


on con un solo par
ametro b/a. Es decir, un reescalamiento de la curva nos deja un solo
par
ametro relevante.
Para algunos pares de puntos fijos se puede encontrar un conjunto u
nico de constantes de integraci
on a
y b. Para otros puntos es posible encontrar dos catenarias a traves de los puntos fijos en tanto que en otros
casos no hay soluci
on para los valores de a y b. Adicionalmente, solo hemos demostrado que la curva deja a
la superficie en un valor estacionario, de modo que la catenaria no siempre representa un valor mnimo, en
algunos casos representa un punto de inflexi
on. Para algunas combinaciones de pares de puntos fijos el mnimo
absoluto en la superficie de revoluci
on se genera a partir de una curva compuesta de segmentos de lnea recta.
Esta clase de soluci
on no se puede encontrar con el formalismo presentado aqu, ya que en nuestra formulaci
on
las f (, x) y las (x) se consideran contnuas hasta la segunda derivada, en tanto que la curva descrita arriba
no es derivable en los puntos de quiebre entre segmentos.
Las anteriores consideraciones muestran las restricciones que se derivan de nuestra formulaci
on sobre la
condici
on variacional estacionaria.

3.4.

Ligaduras y multiplicadores de Lagrange (opcional)

A continuaci
on estudiaremos un metodo sistem
atico para tratar problemas en los que se pretende encontrar
los extremos de una funci
on en donde sus argumentos est
an sujetos a ligaduras. La tecnica de los multiplicadores
de Lagrange que ilustraremos aqu, no est
a necesariamente asociada a problemas variacionales, pero se puede
combinar con estos u
ltimos, especialmente cuando tenemos ligaduras integrales.
Supongamos que queremos encontrar el extremo de una funci
on de tres variables independientes x1 , x2 , x3 ;
en tal caso la condici
on de extremo (o punto de silla) es
df = 0
es decir
df =

f
f
f
dx1 +
dx2 +
dx3 = 0
x1
x2
x3

(3.30)

(3.31)

3.4. LIGADURAS Y MULTIPLICADORES DE LAGRANGE (OPCIONAL)

47

dado que las variables son independientes, podemos variar por ejemplo x1 sin variar x2 y x3 de modo que
on
dx2 = dx3 = 0 con lo cual x1 f = 0. Procediendo identicamente con las otras variables vemos que la condici
necesaria y suficiente para tener un extremo es
f
f
f
=
=
=0
x1
x2
x3

(3.32)

sin embargo ocurre con frecuencia que las variables que se utilizan a priori para describir al sistema no son
independientes. En muchos casos la ligadura se puede escribir en forma de una ecuaci
on de la forma
(x1 , x2 , x3 ) = 0

(3.33)

en este caso la Ec. (3.32) no necesariamente se cumple ya que las variables no se pueden mover independientemente. Una forma de tratar el problema es despejar una variable de modo que nos quedamos con dos variables
independientes y hacemos el tratamiento normal con dos variables independientes. Sin embargo, este despeje
puede ser muy difcil en la pr
actica, por lo cual exploraremos un metodo alternativo conocido como el metodo
de los multiplicadores indeterminados de Lagrange.
De la Ec. (3.33), es claro que d = 0, de modo que se cumple una relaci
on similar a (3.31) que escribiremos
en la forma

dx3 =
dx1 +
dx2

x3
x1
x2
con lo cual tenemos
df

=
=

df

f
dx1 +
x1
f
dx1 +
x1
f
dx1 +
x1

f
x f
dx2 + 3
dx3
x2
x3 x3


f
x3 f

dx2
dx1 +
dx2
x2
x3 x1
x2


f

x f
dx2 +
dx1 +
dx2 ; 3
x2
x1
x2
x3

(3.34)

donde hemos supuesto que x3 6= 0. N


otese que con este procedimiento, hemos logrado que la expresi
on de
df quede en terminos solo de los diferenciales independientes dx1 y dx2 . Escribamos ahora


f
f
f

df + d =
dx1 +
dx2 +
dx3 +
dx1 +
dx2 +
dx3
x1
x2
x3
x1
x2
x3
puesto que df = d = 0 tenemos que df + d = 0. Teniendo en cuenta esto y redistribuyendo terminos, se
tiene






f

+
dx1 +
+
dx2 +
+
dx3 = 0
(3.35)
x1
x1
x2
x2
x3
x3
ahora tenemos en cuenta que dos de las variables son independientes, digamos x1 , x2 . N
otese que el multiplicador en la Eq. (3.34) ha sido definido de modo que
f

+
=0
x3
x3

(3.36)

siempre que x3 6= 0. La Eq. (3.35) queda de la forma






f

+
dx1 +
+
dx2 = 0
x1
x1
x2
x2
y dado que x1 y x2 se pueden variar independientemente, cada termino entre parentesis debe anularse




f

+
=0 ;
+
=0
(3.37)
x1
x1
x2
x2


CAPITULO 3. CALCULO
VARIACIONAL Y MULTIPLICADORES DE LAGRANGE

48

cuando se cumplen las Ecs. (3.36, 3.37) se tiene que df = 0 y f es un extremo (o punto de silla). Si a
nadimos la
ecuaci
on de ligadura (3.33) tendremos cuatro ecuaciones con cuatro inc
ognitas x1 , x2 , x3 , . N
otese sin embargo
que en general nuestro interes es calcular los xi , de modo que no necesita ser hallado. Por esta raz
on, a se
le denomina multiplicador indeterminado de Lagrange. Es claro que el metodo falla cuando todos los
coeficientes de se anulan en el extremo i.e. si


= 0 para i = 1, 2, 3;
xi
xi =xi,0

donde (x1,0 , x2,0 , x3,0 ) es el punto donde se ubica el extremo de f . En este caso resulta imposible despejar .
En lo anterior hemos identificado a f como la funci
on que toma un valor extremo y la ecuaci
on que
expresa la ligadura. Sin embargo, la forma de las Ecs. (3.36, 3.37) nos muestran que podemos intercambiar los
papeles de estas funciones.

3.4.1.

Generalizaci
on a un conjunto arbitrario de variables y de ligaduras

Supongamos que tenemos una funci


on con n variables f = f (x1 , . . . , xn ) y que dichas variables est
an
sujetas a m ligaduras de la forma
k (x1 , . . . , xn ) = 0 ; k = 1, . . . , m

(3.38)

con m n. Multipliquemos cada ecuaci


on de ligadura por un factor k
k k (x1 , ..., xn ) = 0 ; k = 1, . . . , m (no suma)
es claro que
df +
df +

m
X
k=1
m
X

" n
#
n
m
X
X
X k
f
=
dxi +
k
dxi
xi
xi
i=1
i=1
k=1
(
)
n
m
X
X
k
f
=
+
k
dxi
xi
xi

k dk
k dk

i=1

k=1

k=1

Pm

y dado que df = dk = 0 tenemos que df + k=1 k k = 0 de modo que


(
)
n
m
X
X
f
k
+
k
dxi = 0
xi
xi
i=1

(3.39)

k=1

como los xi no son independientes, los terminos entre parentesis no necesariamente son nulos. No obstante,
podemos ahora elegir las m n primeras variables como independientes, en tanto que las m u
ltimas est
an
determinadas por las ligaduras (3.38). Ahora aprovechamos el car
acter indeterminado de los k para eliminar
las coordenadas dependientes, lo cual haremos exigiendo que los k tomen valores tales que se satisfagan las
ecuaciones
m
X
f
k
+
k
= 0 ; i = n m + 1, ..., n
(3.40)
xi
xi
k=1

para las u
ltimas m variables. Al reemplazar (3.40) en (3.39) se obtiene
(
)
nm
m
X f
X
k
+
k
dxi = 0
xi
xi
i=1

k=1

y como las coordenadas involucradas en esta ecuaci


on son las independientes, podemos afirmar que cada
termino entre parentesis es cero de modo que
m

X k
f
+
k
= 0 ; i = 1, ..., m n
xi
xi
k=1

(3.41)

3.5. PROBLEMAS VARIACIONALES CON LIGADURAS (OPCIONAL)

49

y uniendo las Ecs. (3.40, 3.41) se obtiene simplemente


m

X k
f
+
k
= 0 ; i = 1, ..., n
xi
xi

(3.42)

k=1

siendo m el n
umero de ligaduras y n el n
umero de variables xi . Hay un multiplicador k por cada ligadura k .
Las Ecs. (3.42) junto con las ligaduras (3.38) nos dan un conjunto de n + m ecuaciones con n + m inc
ognitas
(las n variables y los m multiplicadores k ).
Minimizaci
on de la superficie de un cilindro con volumen constante
Encontraremos el radio R y la altura H de un cilindro circular recto, que minimice su area superficial total,
manteniendo constante el volumen V0 del cilindro.
La funci
on a minimizar es el area superficial total del cilindro que depende de las variables R y H
f (R, H) = 2R2 + 2RH

(3.43)

la ecuaci
on de ligadura (3.38) corresponde en este caso a la restricci
on de mantener el volumen constante, y
se puede escribir como
(R, H) = R2 H V0 = 0
(3.44)
puesto que solo hay una ecuaci
on de ligadura, hay un solo multiplicador indeterminado . Reemplazando (3.43,
3.44) en (3.42) las ecuaciones para f (R, H) con multiplicadores para las variables R y H son

f (R, H)

f (R, H)
+
= 0 ;
+
=0
H
H
R
R
2R + R2 = 0 ; R + 2RH = 0
2 + R = 0 ; 1 + 2H = 0
en la u
ltima lnea hemos tomado la soluci
on no trivial R 6= 0, con lo cual se obtiene
=

2
; R = 4H
R

reemplazando esto u
ltimo en la ecuaci
on de ligadura (3.44)
(4H)2 H = V0
r
r
V0
4V0
3
H =
; R=
16

3.5.

Problemas variacionales con ligaduras (opcional)

Tomemos de nuevo el problema variacional en el cual buscamos un camino que haga que la integral (3.20)
Z 2
J=
f (y1 (x) , . . . , yn (x) , y 1 (x) , . . . , y n (x) , x) dx
(3.45)
1

sea estacionaria. Siendo las yi coordenadas generalizadas que solo pueden depender del par
ametro x. La codici
on
de estacionaridad es
Z 2
J =
f (y1 (x) , . . . , yn (x) , y 1 (x) , . . . , y n (x) , x) dx = 0
(3.46)
1

asumamos sin embargo, que el problema debe respetar ciertas restricciones que se manifiestan en ecuaciones
de ligadura de la forma
k (y1 , y2 , . . . , yn ; x) = 0 ; k = 1, 2, . . . , m
(3.47)

50

CAPITULO 3. CALCULO
VARIACIONAL Y MULTIPLICADORES DE LAGRANGE

multiplicando cada una de las ecuaciones (3.47) por un multiplicador indeterminado que en general depende
del par
ametro, i.e. k = k (x), sumando sobre k e integrando en el mismo rango que en la ecuaci
on 3.45, se
obtiene
Z 2X
m
k (x) k (y1 , y2 , . . . , yn ; x) dx = 0
1 k=1

es claro por tanto que

m
2X

k (x) k (y1 , y2 , . . . , yn ; x) dx = 0

(3.48)

1 k=1

en algunas ocasiones, las ligaduras de por s adquieren forma integral i.e.


Z

k (y1 , y2 , . . . , yn ; x) dx = cte ; k = 1, 2, . . . , m
1

en este caso podemos multiplicar cada una de estas ecuaciones por un k (que en este caso no dependera del
par
ametro x), sumar sobre k y aplicar la variaci
on quedando

m
2X

k k (y1 , y2 , . . . , yn ; x) dx = 0

(3.49)

1 k=1

ametro x
n
otese que las Ecs. (3.48, 3.49) son esencialmente identicas excepto por la dependencia de k del par
en la Ec. (3.48). Sumando cualquiera de estas dos ecuaciones con la Ec. (3.46) resulta

"

f (yi , y i , x) +

m
X

k k (yi ; x)

k=1

redefiniendo
g (yi , y i , x) f (yi , y i , x) +
tenemos que

m
X

dx = 0

k k (yi ; x)

k=1

g (yi , y i , x) dx = 0
1

y con el mismo procedimiento que nos llev


o de la Ec. (3.20) a la Ec. (3.23), obtenemos

g (yi , y i , x) dx =
1

n Z
X
i=1

2

 

g
d
g

yi dx = 0
yi
dx y i

(3.50)

en esta caso no podemos decir que cada integrando es cero ya que los desplazamientos virtuales yi no son
independientes. De nuevo, usamos el car
acter indeterminado de los multiplicadores de Lagrange para exigir
que los terminos asociados a las coordenadas dependientes se anulen
 

g
d
g

= 0 , i = n m + 1, . . . , n
yi
dx y i
con lo cual la Ec. (3.50) queda
nm
X Z 2
i=1

 

g
d
g

yi dx = 0
yi
dx y i

(3.51)

3.5. PROBLEMAS VARIACIONALES CON LIGADURAS (OPCIONAL)

51

y dado que las coordenadas que quedan son independientes, podemos afirmar que cada integrando es cero, y
junto a las Ecs. (3.51) esto nos lleva a
 

g
d
g

= 0 , i = 1, . . . , n
(3.52)
yi
dx y i
m
X
g (yi , x) f (yi , y i , x) +
k k (yi ; x)
(3.53)
k=1

los multiplicadores de Lagrange tienen aplicaciones en m


ultiples escenarios de la Fsica m
as all
a de los que
utilizaremos en el presente texto (ver por ejemplo la Ref. [7]).
Minimizaci
on del area lateral de un s
olido de revoluci
on

Figura 3.2: S
olido de revoluci
on generado por la funci
on f (x) definida en el intervalo [x0 , xf ], cuando se rota
alrededor del eje X.
Sea una funci
on f (x) definida en un intervalo [x0 , xf ] de longitud L, de tal manera que genera un s
olido de
revoluci
on alrededor del eje X como el de la Fig. 3.2. Queremos encontrar una funci
on f (x) de tal manera que
el solido generado posea la mnima area lateral, pero de tal forma que el volumen V0 permanezca constante.
Un diferencial de area lateral, es el area lateral del cilindro de radio f (x) y altura dx como se ve en la Fig.
3.2, i.e. dA = 2f (x) dx. El area lateral es entonces
Z xf
2
f (x) dx = A
(3.54)
x0

Un diferencial de volumen del s


olido, es el volumen del cilindro de radio f (x) y altura dx de modo que
dV = f (x)2 dx. La ligadura de volumen constante queda entonces en la forma
Z xf

f (x)2 dx = V0
(3.55)
x0

en este caso la funci


on f (x) que se pretende optimizar es la coordenada generalizada y x es el par
ametro del
cual depende. Tenemos entonces las asignaciones
y (x) f (x)

, y

df (x)
f
dx


CAPITULO 3. CALCULO
VARIACIONAL Y MULTIPLICADORES DE LAGRANGE

52

Para evitar confusiones, conviene hacer un cambio de notaci


on en la Ecs. (3.52, 3.53)

 
m



 X
G
d G

= 0 ; G f, f, x F f, f, x +
k k (yi ; x)
f
dx f

(3.56)

k=1

dado que la cantidad a optimizar es el area lateral, y el volumen act


ua como la ligadura, podemos escribir
Z xf 
Z xf 


J A=
F f, f, x dx ;
f, f, x dx = V0
(3.57)
x0

x0

comparando las Ecs. (3.57) con las Ecs. (3.54, 3.55), tenemos que





F f, f , x = F (f ) = 2f ; f, f , x = (f ) = f 2

(3.58)

es decir F y solo dependen de la coordenada generalizada y no dependen explcitamente del par


ametro x ni
de f. Sustituyendo (3.58) en la segunda de las Ecs. (3.56), tenemos entonces


G f, f, x = G (f ) = 2f + f 2
que al reemplazar en la primera de las Ecs. (3.56) nos da

dado que es constante en el caso de ligaduras


integrales, tenemos que f (x) = 1 = cte y el s
olido de

1


revoluci
on es un cilindro cuyo radio es . N
otese que efectivamente f (x) y f (x) generan el mismo s
olido
de revoluci
on. Definiremos entonces f (x) R > 0. El radio del cilindro se puede determinar de la ligadura
(3.55)
r
Z xf
V0
2
2

R dx = R L = V0 f (x) R =
L
x0
2 + 2f = 0 ;

3.6.

f =

Ejercicios

1. Encuentre el radio R y la altura H de un cilindro circular recto, que minimice su area lateral, manteniendo
constante el volumen V0 del cilindro.
2. Sea una elipse descrita por la ecuaci
on
 x 2

 y 2

= 1.
a
b
Encuentre el rect
angulo inscrito de mayor area. Muestre que el cociente entre el area de este rect
angulo
y el area de la elipse es 2/.
3. Sea f (x) el generador de un s
olido de revoluci
on alrededor del eje X como en la Fig. 3.2. Encuentre la
funci
on f (x) que genere un s
olido de revoluci
on con el mnimo volumen, manteniendo fijo el valor del
area lateral.
4. Para un s
olido de revoluci
on como el de la Fig. 3.2, con densidad constante, los momentos de inercia
con respecto a los ejes X e Y vienen dados por (ver problema 1 p
ag 389, y Ref. [8])
Z xf
Z xf

IX
IX =
f (x)4 dx ; IY =
+
x2 f (x)2 dx
2 x0
2
x0
utilizando ligadura de masa constante para el s
olido encuentre (a) La funci
on f (x) que minimiza IX , (b)
la funci
on f (x) que minimiza a IY . (c) A que s
olidos de revoluci
on corresponden estas funciones?.
5. Encuentre la curva f (x) de longitud L, limitada por abajo por el eje X, que pasa por los puntos (a, 0)
y (a, 0), y que encierra la mayor area. Este tipo de problemas se conocen como problemas isoperimetricos
o problemas de Dido.

Captulo 4

Principio variacional de Hamilton y


ecuaciones de Lagrange
En el captulo 2, las ecuaciones de Lagrange se derivaron de un principio diferencial (principio de DAlembert),
puesto que se basaba en desplazamientos virtuales infinitesimales de cada coordenada generalizada del sistema,
a partir de cierta configuraci
on instant
anea. En el presente captulo, derivaremos las ecuaciones de Lagrange de
un principio integral en el cual a partir de cierta configuraci
on instant
anea, se considerar
an desplazamientos
finitos de cada coordenada generalizada en cierto intervalo de tiempo, y se realizar
an variaciones virtuales
infinitesimales de estos movimientos.
Dado que las coordenadas generalizadas dan en general todas las variables independientes del sistema para
determinar la configuraci
on de este, es u
til describir el movimiento del sistema a traves de dichas variables
usando el tiempo como par
ametro. Si tenemos n coordenadas generalizadas qi es u
til construir un hiperespacio
on instant
anea
cartesiano n dimensional donde cada eje coordenado representa a una de las qi . Una configuraci
del sistema estara representada por un punto en este hiperespacio, que llamaremos espacio de configuraciones. Ahora bien, la evoluci
on del sistema (el paso del tiempo) se representa a traves del movimiento de
este punto en el espacio de configuraciones, dibujando una curva en dicho espacio. En este espritu cuando
hablemos del movimiento del sistema entre los tiempos t1 y t2 estaremos hablando del movimiento del
punto en el espacio de configuraciones, y la trayectoria de movimiento del sistema ser
a la curva trazada
por este punto. Por supuesto el tiempo act
ua como par
ametro en esta hipercurva y a cada punto de la trayectoria puede estar asociado mas de un valor del tiempo1 . El espacio de configuraciones no tiene necesariamente
ninguna conexi
on con el espacio fsico tridimensional, sus coordenadas no necesariamente definen longitudes
y las nuplas, en este espacio no necesariamente definen vectores euclidianos. De la misma forma la hipercurva que define la trayectoria de movimiento del sistema no necesariamente est
a asociada a la trayectoria de
una partcula real, tengamos en cuenta que un punto en el hiperespacio de configuraciones y su movimiento,
describen la configuraci
on y movimiento de todo el sistema.
De las condiciones para derivar las ecuaciones de Lagrange, surge de manera natural la siguiente definici
on:
Un sistema monog
enico, es aquel para el cual todas las fuerzas (excepto tal vez las de ligadura) son
derivables de un potencial escalar generalizado que es funci
on de las coordenadas generalizadas, las velocidades
generalizadas y el tiempo, en el sentido de las Ecs. (2.26, 2.27). N
otese que esta definici
on se traduce en el
hecho de que para esta clase de sistemas, el Lagrangiano contiene toda la informaci
on Fsica del sistema. Por
ejemplo, un sistema con fuerzas disipativas no es monogenico ya que la fuerza de rozamiento viscosa descrita
por la ecuaci
on (2.36) no se puede escribir en terminos de un potencial generalizado, esto se traduce en el hecho
de que el Lagrangiano no contiene toda la din
amica del sistema y dicha informaci
on debe ser completada con
la funci
on de disipaci
on de Rayleigh como se puede ver en la Ec. (2.38).
Volviendo a los sistemas monogenicos, cuando el potencial generalizado solo es funci
on de las coordenadas generalizadas, tenemos un sistema conservativo. A continuaci
on enunciaremos un principio asociado al
1

Decimos que el tiempo es un par


ametro porque no construmos un eje asociado al tiempo en el espacio de configuraciones. El
movimiento del par
ametro tiempo regula el barrido del punto sobre la curva en el espacio de configuraciones.

53

54

CAPITULO 4. PRINCIPIO VARIACIONAL DE HAMILTON Y ECUACIONES DE LAGRANGE

movimiento del sistema, cuando este es monogenico


Principio de Hamilton: El movimiento en el espacio de configuraciones de un sistema monogenico desde
un punto P1 en el tiempo t1 hasta un punto P2 en el tiempo t2 , es tal que la integral de lnea
Z t2
L (q1 , . . . , qn , q1 , . . . , qn , t) dt
(4.1)
I
t1

tiene un valor estacionario para la trayectoria real del movimiento.


A la integral anterior se le llama la acci
on y el Lagrangiano se define en la forma usual L T U . Esto
significa que entre todas las trayectorias posibles que el sistema puede seguir en el espacio de configuraciones
entre los tiempos t1 y t2 , el sistema viajar
a a traves de la trayectoria que haga que el valor de la integral (4.1)
sea estacionario. Para una integral de lnea, el termino estacionario significa que el valor de la integral cuando
se toma un cierto camino, tiene el mismo valor dentro de infinitesimales de primer orden que cuando se toman
caminos vecinos a este (caminos que difieren del original por desplazamientos generalizados infinitesimales).
Insistimos en que todas las trayectorias de las que hablamos aqu, son realmente hipertrayectorias en el espacio
de configuraciones y no est
an asociadas en general a ninguna trayectoria real. Para integrales de lnea este es
el equivalente en funciones ordinarias a puntos con derivada cero. En este caso en lugar de un punto tenemos
una trayectoria entera.
De acuerdo con el principio de Hamilton, la trayectoria del sistema es tal que la variaci
on de la acci
on para
valores fijos de t1 y t2 es nula
Z t2
L (q1 , . . . , qn , q1 , . . . , qn , t) dt = 0
(4.2)
I =
t1

cuando las ligaduras son hol


onomas el principio de Hamilton es condici
on necesaria y suficiente para la validez de las ecuaciones de Lagrange. Una ventaja de esta formulaci
on es que la acci
on es invariante ante una
transformaci
on de un sistema de coordenadas generalizadas a otro. Adicionalmente, veremos que el formalismo variacional permitir
a inclur las ligaduras en el formalismo y tratar algunos problemas con ligaduras no
hol
onomas. Finalmente, una formulaci
on variacional es m
as adecuada en el tratamiento de campos y sistemas
contnuos.

4.1.

Aplicaci
on del c
alculo de variaciones al principio de Hamilton

En el principio de Hamilton el sistema debe ser monogenico de modo que el Lagrangiano no depende
on de extremos fijos
de derivadas temporales de q mas altas que la primera i.e. L = L (qi , qi , t). La condici
est
a implcita en su enunciado, y finalmente el u
nico par
ametro es el tiempo. De lo anterior es claro que el
problema de la estacionaridad de la acci
on es un problema variacional como el tratado en la secci
on 3.2 del
captulo 3. Comparando las ecuaciones (3.20) y (4.1), vemos que podemos utilizar las ecuaciones (3.25) con
las siguientes asignaciones
x t, yi qi , f (yi , y i , x) L (qi , qi , t)
con lo cual las Ecs. (3.25) conducen a las ecuaciones de Lagrange


d L
L

= 0 ; i = 1, . . . , n
dt qi
qi

(4.3)

al derivar estas ecuaciones debemos suponer que las coordenadas generalizadas son todas independientes, lo
cual siempre es posible cuando las ligaduras son hol
onomas.

4.2.

Extensi
on del principio de Hamilton a algunos sistemas no hol
onomos

Si recordamos el procedimiento hecho en las secciones (3.2.1) y (3.2.2) observaremos que en la deducci
on
de las ecuaciones de Lagrange a partir del principio de Hamilton, el hecho de que la ligadura sea hol
onoma

DEL PRINCIPIO DE HAMILTON A ALGUNOS SISTEMAS NO HOLONOMOS

4.2. EXTENSION

55

solo se usa en el u
ltimo paso cuando se considera que todas las coordenadas generalizadas (y sus desplazamientos virtuales) son independientes entre s. Sin embargo, cuando las ligaduras son no hol
onomas, las
coordenadas generalizadas ya no ser
an independientes y no es posible reducirlas por medio de ecuaciones de
la forma f (q1 , .., qn , t) = 0. De modo que en general tendremos que trabajar con un sistema coordenado no
independiente.
Desde el punto de vista del principio variacional, esto influye en la forma en que se construyen los caminos
variados. Un desplazamiento y (o q), nos lleva de un punto en el camino real a otro punto sobre un camino
variado, cuando las coordenadas son independientes es el camino variado final el que importa y no la forma
como se construye. Pero cuando tenemos coordenadas no independientes relacionadas entre s por ligaduras,
la forma en que se construye el camino influye ya que los desplazamientos virtuales en general no respetan las
ligaduras. Por tanto resulta importante si el camino variado fue construdo con desplazamientos que respetan
o no las ligaduras.
Un conjunto de ligaduras no hol
onomas para el cual es susceptible el tratamiento variacional, es el conjunto
de ligaduras de la forma
n
X
alk dqk + alt dt = 0 ; l = 1, . . . , m
(4.4)
k=1

es decir una relaci


on lineal entre los diferenciales de las coordenadas y el tiempo. El ndice l determina el
n
umero de ecuaciones l = 1, . . . , m. Los coeficientes alk , alt pueden ser funciones de las coordenadas y el
tiempo. Estas ligaduras son en general no integrables a menos que se cumplan las relaciones
alk =

f
f
; alt =
qk
t

(4.5)

para alguna funci


on f = f (qi , t). En tal caso la ligadura es realmente hol
onoma. Tomaremos el caso general
en donde las relaciones (4.5) no necesariamente se cumplen. En principio se podra pensar en construir un
camino variado a traves de desplazamientos virtuales infinitesimales del camino real que sean compatibles con
la ligadura (4.4). Sin embargo se ha demostrado que no se puede construir tal camino variado, a menos que
las ligaduras sean integrables en cuyo caso dichas ligaduras son realmente hol
onomas. Construiremos de todas
formas un principio variacional en el cual los desplazamientos virtuales generar
an los caminos variados aunque
no sea en forma compatible con las ligaduras. Como los desplazamientos virtuales son fijos en el tiempo, las
ligaduras para los desplazamientos virtuales se escriben
n
X

alk qk = 0 ;

l = 1, ..., m

(4.6)

k=1

el camino variado en general no satisface las ecuaciones (4.4). La idea es ahora reducir los desplazamientos
virtuales a los independientes. Para eliminar los desplazamientos virtuales sobrantes se utiliza el metodo de los
multiplicadores indeterminados de Lagrange. Para ello multiplicamos la ecuaci
on (4.6) por una cantidad
indeterminada l que puede ser funci
on de las coordenadas y del tiempo
l

n
X

alk qk = 0

(4.7)

k=1

por supuesto, hay m cantidades l una para cada ecuaci


on de ligadura. Si asumimos que el principio de
Hamilton es tambien v
alido para sistemas no hol
onomos2 , y usamos las Ecs. (3.23), entonces el principio de
Hamilton conduce a


Z 2 X
n 
L
d L

dt

qk = 0
(4.8)
qk
dt qk
1
k=1

La naturaleza de la ligadura no aparece en el principio de Hamilton. Solo se exige que el sistema sea monogenico.

56

CAPITULO 4. PRINCIPIO VARIACIONAL DE HAMILTON Y ECUACIONES DE LAGRANGE

con el fin de poder introducir los l dentro del principio de Hamilton, sumamos la Ec. (4.7) sobre los valores
de l e integramos en el tiempo entre t1 y t2
#
Z 2 "X
n X
m
dt
l alk qk = 0
(4.9)
1

k=1 l=1

ahora sumamos (4.8) y (4.9) obteniendose


" 
#

Z 2 X
n
m
d L
L X
dt

+
l alk qk = 0
dt qk
qk
1
k=1

(4.10)

l=1

las qk siguen siendo dependientes, ya que est


an ligadas por las m ecuaciones (4.6). De modo que las n m
primeras de ellas se pueden elegir en forma independiente, en tanto que las m u
ltimas est
an determinadas por
las Ecs. (4.6). Para eliminar los desplazamientos sobrantes, aprovechamos la arbitrariedad en las cantidades
l . Exigiremos entonces que estas cantidades satisfagan las ecuaciones


m
d L
L X

+
l alk = 0 ; k = n m + 1, . . . , n
(4.11)
dt qk
qk
l=1

es decir, para las u


ltimas m coordenadas generalizadas. Reemplazando (4.11) en (4.10) se obtiene
"
#
Z 2 nm
m
X d  L  L X
dt

+
l alk qk = 0
dt qk
qk
1
k=1

l=1

pero ahora las qk que intervienen son las independientes, de modo que se puede afirmar que


m
d L
L X

+
l alk = 0 ; k = 1, . . . , n m.
dt qk
qk

(4.12)

l=1

las Ecs. (4.11, 4.12) nos dan el sistema completo de ecuaciones de Lagrange para sistemas no hol
onomos


m
d L
L X

+
l alk = 0 ; k = 1, . . . , n.
(4.13)
dt qk
qk
l=1

este sistema tiene n ecuaciones con n + m inc


ognitas (n coordenadas y m multiplicadores). Las m ecuaciones
faltantes seran las ecuaciones de ligadura (reales) Ecs. (4.4), que enlazan las qk . No obstante, es m
as conveniente
para la soluci
on del sistema tener estas ligaduras en forma de ecuaciones diferenciales de primer orden
n
X

alk qk + alt = 0 ; l = 1, . . . , m

(4.14)

k=1

de modo que las ecuaciones (4.13, 4.14) definen el sistema completo de n + m ecuaciones e inc
ognitas.

4.2.1.

Significado fsico de los multiplicadores de Lagrange: fuerzas de ligadura

Ahora nos preguntamos por el significado de los multiplicadores de Lagrange. Para ello supongamos que
quitamos las ligaduras del sistema y las sustitumos por fuerzas aplicadas que mantienen intacta la din
amica
de este. Las ecuaciones de movimiento quedan entonces de la forma


d L
L

= QL
; k = 1, ..., n
(4.15)
k
dt qk
qk
donde QL
k son las fuerzas generalizadas asociadas a las fuerzas aplicadas que emulan a las de ligadura. Naturalmente, estas fuerzas aplicadas deben ser iguales a las de ligadura para mantener intacta la din
amica del

DEL PRINCIPIO DE HAMILTON A ALGUNOS SISTEMAS NO HOLONOMOS

4.2. EXTENSION

57

sistema3 . Por otro lado, la invarianza de la din


amica tambien requiere que las ecuaciones (4.13) y (4.15) sean
identicas. Esto conduce a
m
X
QL
=

l alk ; k = 1, ..., n
(4.16)
k
l=1

esto significa que esta formulaci


on tiene una informaci
on adicional que no habamos obtenido con las anteriores
formulaciones: las fuerzas de ligadura. Para ver con mayor claridad la relaci
on entre los l y las fuerzas reales
de ligadura, aplicamos la definici
on de fuerza generalizada a las Ecs. (4.16)
N
X
i=1

FL
i

X
ri
=
l alk
qk

k = 1, ..., n

(4.17)

l=1

donde FL
on interviene una suma sobre todas
i representa las fuerzas reales de ligadura. Vemos que en la relaci
las fuerzas reales de ligadura y otra suma sobre todos los multiplicadores, la relaci
on entre multiplicadores y
fuerzas reales de ligadura es entonces bastante indirecta.

4.2.2.

Formalismo de los multiplicadores para ligaduras hol


onomas

Por supuesto las ligaduras no hol


onomas descritas por (4.4) no son las m
as generales pero cubren una
gran cantidad de casos que se presentan en los sistemas reales. Por otro lado, las ligaduras (4.4) incluyen a las
ligaduras hol
onomas cuando las ecuaciones se vuelven integrables. Efectivamente, una ligadura de la forma
fl (q1 , . . . , qn , t) = 0

l = 1, . . . , m

(4.18)

es equivalente a la ecuaci
on diferencial
X fl
dqk
qk
k

fl
dt = 0 ;
t

l = 1, . . . , m

(4.19)

que es igual a (4.4) con las asignaciones4


alk =

fl
fl
; alt =
qk
t

reemplazando estas relaciones en (4.13) se obtiene




m
X
d L
fl
L
=
l
; k = 1, . . . , n.

dt qk
qk
qk

(4.20)

(4.21)

l=1

de modo que la Ec. (4.21) corresponde a las ecuaciones de Lagrange con multiplicadores indeterminados en
el caso de ligaduras hol
onomas. Las fuerzas generalizadas provenientes de ligaduras hol
onomas se escriben
entonces
m
X
fl
QL

l
(4.22)
k
qk
l=1

estas mismas ecuaciones se pueden obtener partiendo


onoma
P directamente de la forma de la ligadura hol
fl (q, t) = 0 e introduciendo un termino de la forma l l fl = 0 en el principio de Hamilton, con un procedimiento similar al realizado para ligaduras no hol
onomas.

3
Para llegar a la Ec. (4.15), podemos seguir el procedimiento de la secci
on 2.2, pero de modo que en la Ec. (2.4) no se excluyan
las fuerzas de ligadura de la formulaci
on. Seguimos entonces el procedimiento que nos lleva de (2.4) hasta (2.17), de tal modo que
(a)
(a)
Qj en esta u
ltima ecuaci
on de puede descomponer como Qj = Qj + QL
proviene de las fuerzas aplicadas originales,
j , donde Qj
(a)
(a)
bj U como en las Ecs.
y QL
a asociada a las nuevas fuerzas aplicadas que emulan a las de ligadura. Si Qj = qj V
o Qj = O
j est
(2.21, 2.27), podemos construr un lagrangiano L = T U donde el potencial incluye solo a las fuerzas aplicadas originales, con lo
cual se llega a la Ec. (4.15).
4
La ecuaci
on (4.19) es eqivalente a (4.18), siempre y cuando al integrar (4.19) exijamos que la constante de integraci
on sea nula.

58

CAPITULO 4. PRINCIPIO VARIACIONAL DE HAMILTON Y ECUACIONES DE LAGRANGE

La introducci
on de multiplicadores de Lagrange en ligaduras hol
onomas se justifica en uno de estos casos (1)
Comenzamos con coordenadas no independientes y queremos eliminar las dependientes5 (2) queremos hallar
las fuerzas de ligadura, es necesario tener en cuenta que los multiplicadores de Lagrange solo extraen el valor
de la magnitud de las fuerzas de ligadura, la direcci
on se debe determinar por consideraciones fsicas. Esto se
debe a la arbitrariedad para definir el signo del multiplicador, en realidad se puede hacer el cambio l l
(siempre y cuando sea para todos los l ), y la formulaci
on es igualmente consistente.

4.3.

Relaci
on entre el principio diferencial de DAlembert y el Principio
variacional de Hamilton

Aunque no es evidente, la version del principio de Hamilton tanto para sistemas hol
onomos como no
hol
onomos, tambien requiere que el trabajo virtual de las fuerzas de ligadura sea nulo. Para ver esto, escribamos
el principio de Hamilton en la forma
Z t2
Z t2
Z t2
L dt =
T dt
U dt = 0

t1

t1

t1

siguiendo los procedimientos variacionales ya descritos teniendo en cuenta que el potencial generalizado es
funci
on de las coordenadas generalizadas, las velocidades generalizadas y el tiempo, se tiene


Z t2
Z t2 X
n 
U
d U

T dt =

qk dt
qk dt qk
t1
t1
k=1

ahora teniendo en cuenta (2.26) y (2.27) resulta


Z t2
Z

T dt =
t1

t2

n
X

Qk qk dt

(4.23)

t1 k=1

en esta forma el principio de Hamilton dice que la diferencia de la integral temporal de la energa cinetica entre
dos caminos vecinos es igual a menos la integral temporal del trabajo realizado en los desplazamientos virtuales
entre los caminos. El trabajo calculado proviene solo de las fuerzas que derivan del potencial generalizado (ya
que implcitamente el potencial del Lagrangiano solo contiene fuerzas aplicadas y no de ligadura). Por tanto, se
requiere que las ligaduras no realicen trabajos virtuales a fin de que las fuerzas generalizadas asociadas a dichas
ligaduras no entren en el miembro derecho de la Ec. (4.23). En consecuencia, si queremos mantener el principio
de Hamilton tanto para el caso hol
onomo como el no hol
onomo, es necesario que las fuerzas adicionales de
ligadura no hol
onomas no trabajen en desplazamientos virtuales qk .
Otra manera de ver que las fuerzas de ligadura no entran en el principio variacional de Hamilton, se obtiene
partiendo de las ecuaciones (4.6) de ligadura para desplazamiento virtual
n
X

alk qk = 0 ,

l = 1, . . . , m

(4.24)

k=1

multiplicando estas ecuaciones por l y sumando sobre l, obtenemos


" m
#
m
n
n
X
X
X
X

l
alk qk = 0

l alk qk = 0
l=1

k=1

y sustituyendo (4.16) en (4.25) se obtiene

k=1

QL
k qk = 0

(4.25)

l=1

(4.26)

5
Cuando las ligaduras son hol
onomas, siempre es formalmente posible encontrar las coordenadas mnimas independientes. Sin
embargo, en algunos casos especficos la tarea puede ser muy difcil. Los multiplicadores de Lagrange son un metodo sistem
atico
alternativo para llegar a las coordenadas independientes mnimas.

DEL PRINCIPIO DE HAMILTON CON COORDENADAS DEPENDIENTES


4.4. APLICACION

59

que nos conduce a la nulidad de los trabajos virtuales de las fuerzas de ligadura.
Por supuesto esta demostraci
on se restringe a ligaduras hol
onomas o no hol
onomas que cumplan la condici
on
(4.24). En nuestro caso, la ligadura no-hol
onoma que m
as usaremos ser
a la correspondiente a la condici
on de
rodadura, que claramente cumple con la condici
on (4.24)6 y no realiza trabajo virtual.

4.4.
4.4.1.

Ejemplos de aplicaci
on del principio de Hamilton a sistemas con coordenadas dependientes
Bloque deslizante sobre una semiesfera

Comencemos con un ejemplo de ligadura hol


onoma. Sea una semiesfera de radio a, cuya base est
a montada
en la tierra. Una masa M est
a en el tope de la semiesfera y no sufre fricci
on. La masa desliza debido a un
ligero desplazamiento. Sea z el eje vertical y el plano xz ser
a el plano de movimiento. Si medimos el angulo a
partir del eje z, el Lagrangiano y las ligaduras los podemos escribir en coordenadas cartesianas o polares. Para
tener en cuenta las ligaduras es necesario introducir coordenadas generalizadas que no son independientes y
que esten relacionadas con las ligaduras, usemos entonces las coordenadas r y de las cuales solo una de ellas
es realmente independiente, la ligadura de que r es constante se debe a la fuerza normal. El Lagrangiano y las
ligaduras en coordenadas cartesianas es
p

1
M x 2 + z 2 M gz ; F1 (x, y) = a x2 + z 2 = 0
2
x = r sin ; x = r sin + r cos ; z = r cos ; z = r cos r sin

L =

en tanto que el Lagrangiano y las ligaduras en coordenadas polares resulta



1  2
L =
M r + r 2 2 M gr cos
2
f1 (r, ) = a r = 0

(4.27)

la ligadura nos muestra que la coordenada r no es independiente. As que podemos reducir a el conjunto de
coordenadas generalizadas independientes. No obstante, escribiremos las ecuaciones de Lagrange usando las
dos coordenadas r,. Calcularemos adem
as las fuerzas generalizadas asociadas a las ligaduras con base en la
Ec. (4.22)
 
d L
L
f1
= M r ;
= M r 2 M g cos ; QL
= 1
r = 1
dt r
r
r
 

d L
d 
L
f1
=
M r 2 = M r 2 + 2M r r ;
= M gr sin ; QL
= 1
=0

dt
dt

aplicando las Ecs. (4.21, 4.22) se tiene


M r M r 2 + M g cos = 1
M r 2 + 2M r r M gr sin = 0

(4.28)
(4.29)

las ecuaciones de Lagrange (4.28, 4.29) junto con la ecuacion de ligadura (4.27) forman un sistema de 3
ecuaciones y tres inc
ognitas (r, , 1 ), cuya soluci
on es u
nica bajo las condiciones iniciales adecuadas. Hay un
solo multiplicador 1 ya que solo tenemos una ligadura. Aplicando la ligadura llegamos a r = a y r = r = 0,
y sustituyendolo en la ecuaciones (4.28, 4.29) obtenemos
M a 2 + M g cos = 1 ; M a2 M ga sin = 0
g
1
g
2 cos =
; = sin
a
Ma
a
6

Ver ejercicios 1, 2, de la P
ag. 66.

(4.30)

CAPITULO 4. PRINCIPIO VARIACIONAL DE HAMILTON Y ECUACIONES DE LAGRANGE

60

este es un problema de dos ecuaciones con dos inc


ognitas que tiene soluci
on u
nica bajo las condiciones iniciales
adecuadas. Una soluci
on parcial se puede obtener con el ansatz7
2 = A B cos

(4.31)

Derivando (4.31) se obtiene


B
2 = B sin = sin
2
comparando esta expresi
on con la segunda de las Ecs. (4.30) resulta B = 2g/a con lo cual el ansatz (4.31) nos
da
2g
2 = A
cos
a
Usando condiciones iniciales de la forma = = 0 en t = 08 nos da A = 2g/a de modo que9
2g
2g
2 = cos +
a
a

(4.32)

ahora reemplazando (4.32) en la primera de las Ecs. (4.30) se tiene que

2g
2g g
1
cos +
cos =
a
a
a
Ma
g
1
(2 3 cos ) =
a
Ma

con lo cual queda finalmente


1 = M g (3 cos 2)
usando los metodos tradicionales de soluci
on se puede ver que el multiplicador corresponde numericamente al
valor de la fuerza de ligadura normal. Esto tambien se puede ver haciendo uso de las Ecs. (4.17, 4.20), teniendo
en cuenta que hay una sola fuerza de ligadura y un solo multiplicador
N

r
f1
= 1
qk
qk

aplicando esta ecuaci


on para qk = r y usando las Ecs. (4.27) resulta
N

(rur )
f1
= 1
(N ur ) ur = 1
r
r
1 = N

donde hemos usado el hecho de que la fuerza normal va a lo largo de ur . Se puede ver que estrictamente
el multiplicador solo nos puede proporcionar la magnitud de la normal ya que la fuerza de ligadura (vectorial) aparece en un producto punto que nos hace perder informaci
on sobre la direcci
on, a esto se le suma la
ambig
uedad del signo del multiplicador.
Este problema ilustra muchas caractersticas de la tecnica de multiplicadores de Lagrange
Este ansatz est
a inspirado en el hecho de que = (g/a) sin se asemeja a la ecuaci
on de un pendulo simple (con
2

y ) de oscilaciones no necesariamente peque


nas, en tal problema se puede obtener por conservaci
on de la energa
mec
anica de lo cual se obtendra una expresi
on similar a nuestro ansatz Ec. (4.31).
8
Naturalmente, debe ser ligeramente distinto de cero para que exista movimiento. Sin embargo, usamos estas condiciones
teniendo en cuenta que en ausencia de rozamiento, la velocidad angular se puede aproximar arbitrariamente a cero.

9
La Ec. (4.32) tambien se puede obtener as: = ddt = dd d
= dd . De la segunda de las Ecs. (4.30) y usando la expresi
on
dt
anterior tenemos que
Z
Z
Z

g
g

0 d0 =
sin 0 d0
0 d0 = cos 0
a 0
a
0
0
0
7

con lo cual se llega a la Ec. (4.32).

DEL PRINCIPIO DE HAMILTON CON COORDENADAS DEPENDIENTES


4.4. APLICACION

61

1. Las ecuaciones de Lagrange solo se pueden solucionar teniendo en cuenta las ecuaciones de ligadura, para
formar el sistema de n + m ecuaciones e inc
ognitas.
2. Observese que el metodo para calcular las fuerzas generalizadas de ligadura conduce autom
aticamente
a encontrar las coordenadas esp
ureas. En este caso existe un multiplicador que elimina la coordenada
sobrante r.
3. La fuerza de ligadura pudo ser hallada y est
a asociada a 1 . Debe tenerse en cuenta sin embargo, que no
hay una relaci
on uno a uno entre multiplicadores y fuerzas generalizadas de ligadura, en realidad cada
fuerza generalizada de ligadura es una combinaci
on lineal de todos los i como lo muestran las Ecs. (4.16,
4.22). La relaci
on entre fuerzas reales de ligadura y multiplicadores es m
as indirecta todava.

4.4.2.

Aro sobre plano inclinado con condici


on de rodadura

Veamos un ejemplo con la condici


on de rodadura, como es un aro de radio a que rueda sin deslizar sobre
un plano inclinado que est
a fijo en el suelo. La ligadura implcita en la rodadura es realmente hol
onoma10 pero
la tecnica de c
alculo ser
a identica al caso de ligaduras no hol
onomas de la forma (4.4). La otra ligadura de que
el aro est
a sobre el plano inclinado est
a implcita en la escogencia de las coordenadas generalizadas
Definimos el eje x paralelo a la superficie del plano inclinado hacia abajo y un angulo que barre el radio
vector del aro. Como coordenadas generalizadas se escoge x, . La condici
on de rodadura provee una ligadura
entre ambas
dx a d = 0
(4.33)
la energa cinetica tiene una parte traslacional y una rotacional

1
1
1 
T = M x 2 + I 2 = M x 2 + K 2 2
2
2
2

escribirlo en terminos del radio de giro K, permite resolver de una vez el mismo problema con figuras tales
como el aro, la esfera, el cilindro, el disco e incluso figuras como el elipsoide de revoluci
on (ver ejercicio 3, P
ag.
67). De momento haremos K = a (aro con densidad constante). La energa potencial es
V = M g (l x) sin 0
siendo l la longitud del plano inclinado y 0 su inclinaci
on. El Lagrangiano queda

1 
L = M x 2 + a2 2 M g (l x) sin 0
2

(4.34)

con lo cual tenemos

 
d L
L
= Mx
;
= M g sin 0
dt x
x
 
d L
L
= M a2 ;
=0
dt

dado que hay una ecuaci


on de ligadura, se requiere solo un multiplicador de Lagrange. Comparando (4.33) con
(4.4) los coeficientes que acompa
nan a la ligadura son
a1 = a ; a1x = 1 ; a1t = 0

(4.35)

las fuerzas generalizadas de ligadura se obtienen de (4.16) y (4.35)


L
QL
x = 1 a1x = 1 ; Q = 1 a1 = a1
10

Esto se debe a que esta es una condici


on de rodadura en donde el aro se restringe a moverse en un plano. Cuando esta
restricci
on deja de ser cierta, la ligadura es realmente no-hol
onoma, como se aprecia en los ejercicios 1, 2, P
ag. 66.

62

CAPITULO 4. PRINCIPIO VARIACIONAL DE HAMILTON Y ECUACIONES DE LAGRANGE

de modo que las ecuaciones de Lagrange junto con las ecuaciones de ligadura quedan
Mx
M g sin 0 = 1 ; M a2 = a1 ; a = x

(4.36)

constituye un conjunto de tres ecuaciones para x, ,1 . Diferenciando la ligadura respecto al tiempo se obtiene
a = x
, sustituyendo en la segunda de las Ecs. (4.36) se tiene que M x
= 1 al sustituir esto en la primera de
las Ecs. (4.36) queda
g sin 0
x
=
2
con lo cual
M g sin 0
g sin 0
=
; 1 =
(4.37)
2a
2
puesto que hay un solo multiplicador, podemos obtener la magnitud de la fuerza de ligadura usando una sola
fuerza generalizada de ligadura, digamos QL
a dada por FL = N + Fr siendo
x . La fuerza (real) de ligadura est
N la normal y Fr la fuerza de rozamiento est
atico. Utilizando las ecuaciones (4.16, 4.17) tenemos que
L
QL
x =F

r
r
= (N + Fr )
= 1 a1x
x
x

es f
acil ver que r = xux , por tanto x r = ux , utilizando esto y la Ec. (4.35) resulta11
(N + Fr ) ux = 1
ahora teniendo en cuenta que N = N uy y que Fr = kFr k ux se tiene que
kFr k = 1 Fr =

M g sin 0
2

donde hemos usado la Ec. (4.37). N


otese que hemos obtenido informaci
on sobre la fuerza de rozamiento pero
no sobre la normal. Esto era de esperarse, ya que la fuerza de rozamiento est
atico es la que genera la condici
on
de rodadura, que fue la ecuaci
on que usamos como ligadura.

4.4.3.

Esfera en un hueco cilndrico

Una esfera de radio est


a restringida a rodar sin deslizar en la mitad inferior de la superficie interna de
un hueco cilndrico de radio interior R (ver Fig. 4.1). Determine el Lagrangiano, la ecuaci
on de ligadura y las
ecuaciones de Lagrange con multiplicadores indeterminados.
Utilizaremos las coordenadas y indicadas en la figura 4.1. Estas coordenadas no son independientes ya
que la condici
on de rodadura establece una relaci
on entre ellas. El centro de masa de la esfera se mueve en
de modo que la velocidad al cuadrado del centro de
un arco circular con radio R y velocidad angular ,
h
i2
masa de la esfera es v 2 = (R ) . Las energas cinetica y potencial en estas coordenadas se escriben en

la forma

i2 1
1 h
T = m (R ) + I 2 ; V = mg [R (R ) cos ]
2
2

siendo m la masa de la esfera y tomamos V = 0 en el punto m


as bajo del cilindro hueco12 . I es el momento
de inercia de la esfera con respecto a su di
ametro, cuyo valor es (2/5) m2 , el Lagrangiano queda entonces en
la forma
1
1
L = T V = m (R )2 2 + m2 2 mg [R (R ) cos ]
2
5
11

A priori podemos pensar que la posici


on debe ser r = xux + auy que es la posici
on del centro de masa. Sin embargo, la fuerza
de rozamiento se aplica sobre el punto de contacto sobre la superficie de modo que r = xux es el punto de aplicaci
on de dicha
fuerza (y tambien de la normal). En todo caso, esta diferencia no altera las derivadas.
12
Podramos tomar el cero de potencial en el punto m
as bajo del centro de masa de la esfera, pero esto supone un corrimiento
del potencial en una constante, lo cual es Fsicamente irrelevante.

DEL PRINCIPIO DE HAMILTON CON COORDENADAS DEPENDIENTES


4.4. APLICACION

63

Figura 4.1: Esfera de radio , que rueda sin deslizar en la mitad inferior de una superficie cilndrica de radio
R.
la condici
on de rodadura nos da la ligadura
f (, ) = R = 0

(4.38)

existe entonces un solo multiplicador de Lagrange y las ecuaciones de Lagrange con multiplicadores quedan
 
 
f
f
d L
L
d L
L
=
=

dt

dt

que explcitamente nos da


mg (R ) sin m (R )2 = R
2
m2 =
5
de (4.40) se obtiene

2
= m
5

y usando (4.38), encontramos


2
= m
5


R
2
= mR

sustituyendo (4.42) en (4.39) se encuentra la ecuaci


on de movimiento con respecto a .


2
2

mg (R ) sin m (R ) =
mR R
5


2 2
2
g (R ) sin =
R + (R )
5
g (R ) sin
i
= h
2
2 2
R
+
(R

)
5
= 2 sin

(4.39)
(4.40)

(4.41)

(4.42)

64

CAPITULO 4. PRINCIPIO VARIACIONAL DE HAMILTON Y ECUACIONES DE LAGRANGE

es la frecuencia de peque
nas oscilaciones dada por
v
u
g (R )
u
i
= th
2
2 2
R
+
(R

)
5

la ecuaci
on para es la de un pendulo simple de amplias oscilaciones. Una vez resuelto (t), la ecuaci
on de
se obtiene directamente de (4.38), as mismo la soluci
on para el multiplicador se obtiene de (4.42). Cu
al es la
asociaci
on entre fuerzas de ligadura y el multiplicador en este problema?.

4.5.

Caractersticas b
asicas de una formulaci
on variacional

Una ventaja notable de la formulaci


on variacional es su independencia con respecto a un cambio en las
13
coordenadas generalizadas , ya que el Lagrangiano es independiente de esta escogencia. Por otro lado a
partir del principio de Hamilton se puede ver f
acilmente porque la adici
on de una derivada total de la forma
dF (q, t) /dt en el Lagrangiano no afecta la din
amica, cuando este termino se integra en el tiempo, el resultado
solo depende de los puntos inicial y final los cuales son fijos. Esto equivale a a
nadir una constante a la acci
on,
que claramente no afecta la condici
on de estacionaridad.
Muchas teoras de la Fsica mas all
a de la mec
anica subyacen en un principio variacional. Con frecuencia
ocurre que la necesidad de modificar el contenido Fsico de una teora sugiere la forma de hacer el mismo cambio
en otras teoras. Tal es el caso de la cuantizaci
on de partculas que indic
o como construr posteriormente el
proceso de quantizaci
on de los campos, basados en un principio variacional y una formulaci
on Lagrangiana.

4.6.

Principio variacional para Lagrangianos que contienen a q (opcional)

Ciertos problemas de la mec


anica cl
asica est
an descritos por Lagrangianos que contienen derivadas temporales de qi m
as altas que la primera, este es el caso en ciertas aplicaciones de la teora del caos. Es usual
denominar como mec
anica generalizada a este tipo de problemas. En particular cuando el Lagrangiano es de
la forma L (q, q,
q, t) se suele hablar de mec
anica de la sacudida. Asumiremos que para un Lagrangiano de la
forma L (q, q,
q, t), el principio de Hamilton se cumple con variaci
on cero en los extremos tanto en las qi como
en las qi , en cuyo caso hablaremos de un principio variacional de Hamilton extendido.
Veremos entonces como son las ecuaciones de movimiento para un Lagrangiano de la forma
L = L(qi , qi , qi , t)

(4.43)

bajo el postulado de que se cumple el principio variacional de Hamilton extendido. La acci


on queda entonces
de la forma
Z 2
I=
L(qi , qi , qi , t)dt
1

y se tiene que

I
d =

n 
2X
i=1


L qi
L qi
L qi
d +
d +
d dt
qi
qi
qi

(4.44)

Asumiremos suma sobre ndices repetidos cuando los ndices aparezcan. De momento omitiremos los ndices
para simplificar los c
alculos. En analoga con la Ec. (3.17, 3.18) tenemos
I
d = I

q =

q
d

con lo cual la Ec. (4.44) queda


13

Debe aclararse sin embargo, que el espacio de configuraciones y la trayectoria en dicho espacio, s dependen de las coordenadas
generalizadas empleadas.

(OPCIONAL)
4.6. PRINCIPIO VARIACIONAL PARA LAGRANGIANOS QUE CONTIENEN A Q

I =

2


L
L q
L q
q +
d +
d dt
q
q
q

65

(4.45)

Integrando por partes el termino de la mitad nos da en analoga con la Ec. (3.11)
Z

L q
dt =
q

2
1


 
Z 2
L 2 q
q d L
L q 2
dt =

dt
q t
q 1
q
1 dt

(4.46)

el primer termino a la derecha es cero debido a la condici


on de extremo fijo en las qi . sustituyendo (4.46) en
la expresi
on (4.45) resulta
 

Z 2
L
d L
L q
q
q +
d dt
(4.47)
I =
q
dt q
q
1
donde hemos usado de nuevo la definici
on q = (q/) d. El u
ltimo integrando requiere dos integraciones
por partes
Z

L q
dt =
q

2
1


 
Z 2
L q 2
L 2 q
q d L
dt =
dt

q t
q 1
q
1 dt

y usando la condici
on de extremo fijo en las qi , vemos que se elimina el primer termino a la derecha. Una
segunda integraci
on por partes nos da

2
1

  
Z 2 2   
q d L
q d L
dt =
dt
dt q
q
1 t dt

  
 
Z 2
d L
q 2
q d2 L
=

dt
dt q
1
dt2 q
1

el primer termino a la derecha se elimina por la condici


on de extremo fijo en los qi . Por tanto

 
Z 2
Z 2
L q
q d2 L
dt =
dt
2

q
1 q
1 dt

(4.48)

reemplazando (4.48) en (4.47) y usando la definici


on de q se tiene que
  
  
Z 2
d L
d2 L
L
I =
q
q + 2
q dt
q
dt q
dt
q
1

factorizando qs, y colocando los ndices de nuevo, resulta


I =

n 
2X
i=1

L
d

qi dt

L
qi


d2 L
+ 2
qi dt = 0
dt qi

puesto que las qi son independendientes, las variaciones qi son independientes y podemos aplicar el lema
fundamental del c
alculo variacional y ver que I = 0 requiere que tanto el integrando como los coeficientes de
qi se anulen separadamente, llegando entonces a las ecuaciones de movimiento:




d2 L
L
d L

+ 2
=0
;
i = 1, 2, ..., n.
(4.49)
qi dt qi
dt
qi

N
otese que para utilizar el principio variacional de Hamilton extendido, el espacio de configuraciones debe
ser de dimensi
on 2n, con qi y qi en los ejes, ya que la condici
on completa de variaci
on cero en los extremos
requiere esta extensi
on del espacio. Adem
as estas condiciones de variaci
on cero conducen a la invarianza de
las ecuaciones de movimiento, bajo el siguiente tipo de transformaciones gauge del Lagrangiano
L0 = L +

dF (q, q,
t)
dt

(4.50)

CAPITULO 4. PRINCIPIO VARIACIONAL DE HAMILTON Y ECUACIONES DE LAGRANGE

66

Tomemos como ejemplo sencillo de aplicaci


on el siguiente Lagrangiano
1
k
L = mq q q 2
2
2

(4.51)

para el cual tenemos


1
d
L
= m
q kq ;
q
2
dt

L
q

d2
=0 ;
dt2

L
q

d2
= 2
dt

1
mq
2

1
= m
q
2

al reemplazar estas relaciones en las ecuaciones de movimiento (4.49) tenemos


m
q kq = 0
Que corresponde a la ley de Hooke. N
otese que el Lagrangiano (4.51) a pesar de su apariencia extra
na,
nos da las ecuaciones del oscilador arm
onico cuando usamos este formalismo de sacudida de las ecuaciones
de Lagrange. Para entender porque, utilizaremos la invarianza gauge en (4.50), para obtener el Lagrangiano
(4.51) a partir del Lagrangiano usual para el oscilador armonico simple LSHO
d
L (q, q , q, t) = LSHO (q, q,
t) +
dt
1
k 2
L (q, q , q, t) = mq q q
2
2

mq q

mq2 kq 2 mq q mq2

2
2
2
2

es muy importante enfatizar que los Lagrangianos L y LSHO son equivalentes solo bajo el principio de Hamilton
extendido con variaci
on cero en q, q.
De otra forma el Gauge (4.50) ya no sera v
alido.
De lo anterior se ve que se requiere un principio variacional especfico o equivalentemente, un tipo especfico
de ecuaciones de movimiento, para que un Lagrangiano dado tenga toda la informaci
on fsica del sistema.
As mismo, las transformaciones gauge posibles para el Lagrangiano dependen del principio variacional que se
postule, o de las ecuaciones de movimiento que se asuman.

4.7.

Ejercicios

1. Supongamos un disco de radio R que rueda sobre un plano horizontal XY , de manera que permanece
siempre vertical. Sean (x, y) las coordenadas del centro del disco. Definimos tambien un angulo de rotaci
on
alrededor del eje del disco, y un angulo entre el eje X y el eje del disco (ver Fig. 4.2). Si el disco
rueda sin deslizar, demuestre que la condici
on de rodadura se manifiesta en una ligadura de la forma
dx R sin d = 0 ; dy + R cos d = 0

(4.52)

2. Supongamos que tenemos un conjunto de ecuaciones diferenciales lineales de ligadura del tipo
n
X

gk (x1 , . . . , xn ) dxk = 0

(4.53)

k=1

este tipo de ligaduras son hol


onomas solo si existe una funci
on integrante f (x1 , . . . , xn ) que convierta a
estas ecuaciones en diferenciales exactas i.e.
n
X
k=1

gk (x1 , . . . , xn ) dxk = df =

n
X
f
dxk
xk
k=1

gk =

f
xk

(4.54)

multiplicando la u
ltima ecuaci
on por f y derivando el producto parcialmente con respecto a xj se obtiene

f f
2f
(f gk ) =
+f
xj
xj xk
xj xk

(4.55)

4.7. EJERCICIOS

67

Figura 4.2: Disco vertical que rueda sin deslizar sobre el plano XY .
invirtiendo el rol de los ndices j, k, se obtiene una ecuaci
on similar, y el miembro derecho de tal ecuaci
on
es identico al miembro derecho de la Ec. (4.55) si las segundas derivadas parciales son contnuas. Por
tanto, la funci
on integrante debe cumplir la condici
on14
(f gj )
(f gk )
=
; j, k = 1, . . . , n
xj
xk

(4.56)

demuestre que no se puede encontrar una funci


on integrante para la ligadura de rodadura Ec. (4.52). Sin
embargo, tal funci
on integrante s existe cuando es constante en la Ec. (4.52), como ocurre por ejemplo
con un disco que rueda sobre un plano inclinado.
3. Resolver el ejercicio de la secci
on 4.4.2, sustituyendo el aro por una esfera, un cilindro, un disco y un
elipsoide de revoluci
on. Asuma constante la densidad de cada figura.
4. Demuestre que el gauge (4.50), deja invariantes las ecuaciones de movimiento (4.49), que se derivan del
principio de Hamilton extendido, asociado al formalismo de la sacudida. Demuestrelo (a) apelando
directamente a las ecuaciones diferenciales, (b) apelando al principio variacional de Hamilton extendido.
5. En la secci
on 2.8.6 P
ag. 32, se estudi
o la din
amica de un aro que rueda sin deslizar sobre una cu
na que
desliza sin rozamiento sobre el suelo. Trate la ligadura de rodadura utilizando el metodo de multiplicadores de Lagrange. Contraste los resultados con los obtenidos en la secci
on 4.4.2, P
ag. 61, en la cual la
cu
na est
a fija en el suelo.
14

En las condiciones (4.54, 4.56) podemos agregar la coordenada temporal digamos xn+1 t, y las Ecs. (4.54, 4.56) seran
v
alidas para j, k = 1, . . . , n + 1. N
otese que esta es la estructura de las Ecs. (4.4), P
ag. (55).

68

CAPITULO 4. PRINCIPIO VARIACIONAL DE HAMILTON Y ECUACIONES DE LAGRANGE

Figura 4.3: Esfera de masa m y radio r que rueda sin deslizar sobre un cilindro fijo de radio R.
6. Una esfera de masa m y radio r rueda sin deslizar sobre un cilindro fijo de radio R, como se indica en
la Fig. 4.3. Si la esfera comienza a rodar sin deslizar desde el punto m
as alto del cilindro y partiendo
del reposo. (a) Plantee las ecuaciones de Lagrange con multiplicadores que den cuenta de la fuerza de
ligadura del cilindro sobre la esfera. (b) Encuentre el punto donde la esfera se separa del cilindro. (c)
Resuelva el mismo problema reemplazando la esfera por un aro y por un cilindro, cada uno con masa m
y radio r.

Captulo 5

Simetras y cantidades conservadas en el


formalismo de Lagrange
5.1.

Teoremas de conservaci
on y propiedades de simetra

Las estrategias planteadas hasta el momento nos permiten encontrar las ecuaciones diferenciales que determinan la din
amica de un sistema con n grados de libertad. Como estas ecuaciones son de segundo orden en el
tiempo, se requieren 2n constantes de integraci
on que usualmente se determinan con las condiciones iniciales
en las coordenadas y velocidades generalizadas. Desafortunadamente, la mayora de problemas no son integrables completamente. No obstante, hemos aprendido del formalismo Newtoniano, que incluso para sistemas
no integrables es posible extraer mucha informaci
on valiosa del sistema aunque las ecuaciones de movimiento
no esten completamente resueltas. En general, esta informaci
on se traduce en principios de conservaci
on que
debemos reexaminar en este nuevo formalismo.
La soluci
on completa de una ecuaci
on de segundo orden requiere formalmente de dos procesos de integraci
on, con frecuencia ocurre que podemos hacer un primer proceso de integraci
on pero el u
ltimo proceso de
integraci
on no se puede llevar a cabo f
acilmente. En otras palabras, podemos obtener ecuaciones de la forma
f (q, q,
t) = cte
que son ecuaciones diferenciales de primer orden. Estas estructuras se conocen como primeras integrales de las
ecuaciones de movimiento. Mucha informaci
on se puede extraer de estas primeras integrales, en particular las
leyes de conservaci
on.
Consideremos un sistema de partculas puntuales bajo la influencia de fuerzas que se derivan de potenciales
que solo dependen de la posici
on. En este caso podemos escribir

L
T
V
T
X1

=
=
mk x 2k + y k2 + zk2
x i
x i x i
x i
x i
2
k

L
x i

= mi x i = pxi

que corresponde a la componente x del momento lineal de la partcula iesima. Esto sugiere la forma de elaborar el concepto de momento generalizado cuando usamos coordenadas generalizadas. El momento generalizado
pj asociado a la coordenada generalizada qj se define como
pj

L
qj

(5.1)

por razones que veremos posteriormente, a pj tambien se le conoce como momento can
onicamente conjugado
a qj . N
otese que pj no tiene necesariamente dimensiones de momento lineal1 . Cuando tenemos potenciales
1

Sin embargo, es claro de la definici


on (5.1), que pj qj tiene dimensiones de energa. Por tanto, pj qj tiene dimensiones de energa
por tiempo, es decir de momento angular.

69

CAPITULO 5. SIMETRIAS Y CANTIDADES CONSERVADAS (LAGRANGE)

70

dependientes de la velocidad incluso en coordenadas cartesianas el momento generalizado difiere del momento mec
anico. Un ejemplo notable es el de un conjunto de partculas en un campo electromagnetico, cuyo
Lagrangiano es2
N
N
N
X
X
X
1
2
L=
qi (ri ) +
qi A (ri ) r i
mi r i
2
i=1

i=1

i=1

qi en este caso denota carga electrica. El momento generalizado es


pxi =

L
= mi x i + qi Ax (ri )
x i

(5.2)

que es el momento mec


anico asociado a la partcula mas un termino adicional que depende del campo.
En algunas ocasiones el Lagrangiano no depende de una cierta coordenada qj , pero s depende de su
velocidad generalizada asociada qj . En este caso se dice que qj es una coordenada cclica o ignorable, y la
ecuaci
on de Lagrange asociada a esta coordenada se reduce a


d L
=0
(5.3)
dt qj
de la definici
on de momento generalizado se observa que
dpj
= 0 pj = cte
dt

(5.4)

de lo cual resulta un teorema de conservaci


on: el momento generalizado can
onicamente conjugado a
una coordenada cclica se conserva. Vale recalcar que la validez de este teorema depende de que las
coordenadas generalizadas sean independientes entre s, ya que de ello dependen las ecuaciones de Lagrange
(sin multiplicadores ). Por ejemplo, podemos apreciar en la Ec. (4.34), que en el ejemplo del aro que rueda
sin deslizar sobre un plano inclinado fijo en el suelo, el Lagrangiano no contiene a la coordenada , sin embargo
la cantidad p no es una constante de movimiento debido a que el angulo aparece en la ecuaci
on de ligadura
dx a d = 0.
N
otese otra diferencia importante entre el concepto de momento mec
anico y el de momento generalizado.
El primero se asocia a una partcula y el segundo se asocia a una coordenada generalizada. Por otro lado, ya se
ha mencionado que una coordenada generalizada no necesariamente est
a asociada a una partcula y por tanto
el momento conjugado tampoco lo estar
a.
Los momentos generalizados conservados constituyen primeras integrales de movimiento, pues al pasar de
(5.3) a (5.4) hemos pasado de una ecuaci
on diferencial de segundo orden a una de primer orden, lo cual equivale
a hacer una integraci
on. Formalmente, la velocidad generalizada de una coordenada cclica puede ser reemplazada por el momento conservado, de modo que la variable cclica desaparece completamente del Lagrangiano,
este procedimiento desarrollado por Routh, ser
a discutido en el captulo de formulaci
on Hamiltoniana secci
on
6.9.
Las condiciones de conservaci
on del momento generalizado son mas generales que las que se derivan en
mec
anica Newtoniana para el momento lineal y angular. Por ejemplo, un momento conservado aparece incluso
cuando la ley de acci
on y reacci
on no es v
alida. En particular, este es el caso cuando est
an presentes fuerzas
electromagneticas. Supongamos que tenemos una partcula inmersa en un campo electromagnetico, tal que los
potencial electrodin
amicos no dependen de x. De esta forma x no aparece en el Lagrangiano (aunque s aparece
x)
y el momento can
onico px viene dado por la Ec. (5.2)
px = mx + qAx = cte
De la teora electrodin
amica cl
asica, es bien conocido que cuando A y no dependen de x, la cantidad qAx
es la componente x del momento lineal del campo electromagnetico asociado con la carga q, el momento
2

N
otese que cuando al sistema de partculas le a
nadimos el campo, no es necesario diferenciar para una partcula entre la
contribuci
on debida a las fuerzas internas y las externas, ya que ambas contribuciones est
an contenidas en el campo.

Y PROPIEDADES DE SIMETRIA
5.1. TEOREMAS DE CONSERVACION

71

mec
anico mx esta asociado u
nicamente a la carga. Por tanto, el momento can
onico px es una cantidad mixta
que est
a asociada tanto a la carga como al campo, esto no supone ninguna contradicci
on ya que como dijimos,
el momento can
onico est
a realmente asociado a la coordenada y no a la partcula (ni al campo).
Example 2 Para el problema de la secci
on 2.8.6 del aro que rueda sin deslizar sobre un plano inclinado, que
a su vez se desliza sobre el suelo sin rozamiento, el Lagrangiano est
a dado por la Ec. (2.47) P
ag. 33
1
L = mS 2 + (m + M ) 2 + mS cos mg [R cos + (l S) sin ]
2

(5.5)

Se observa que en este Lagrangiano la coordenada es cclica, y por tanto su momento can
onicamente conjugado es constante. Esto nos conduce a una primera integral de movimiento (ecuaci
on diferencial de primer
orden)
L
p =
= (m + M ) + mS cos = K

esta expresi
on se puede encontrar tambien al integrar una de las ecuaciones de Lagrange que resultaron en el
problema, Ec. (2.49), P
ag. 33.
Para el anterior ejemplo, es importante mencionar que el Lagrangiano 5.5, est
a escrito en coordenadas realmente independientes y por esta raz
on el momento conjugado p es realmente una constante de movimiento.
Ya mencionamos que en un problema similar, obtuvimos un Lagrangiano Ec. (4.34), que contiene una coordenada cclica que no conduce a la conservaci
on de su momento can
onico, en virtud de que las coordenadas
generalizadas en tal problema no eran independientes. Por otro lado, el ejemplo anterior tambien muestra con
claridad que la invarianza de un momento conjugado equivale a un proceso de integraci
on que nos lleva a
una ecuaci
on diferencial de primer orden. Sin embargo, en este ejemplo particular este proceso de integraci
on
es trivial y se poda ejecutar sin mayores dificultades desde las ecuaciones de Lagrange mismas. Es necesario
decir no obstante, que el proceso que nos lleva de las ecuaciones de Lagrange (de segundo orden) a primeras
integrales de movimiento (ecuaciones de primer orden), puede ser muy complejo en general, y esto justifica la
introducci
on del concepto de coordenada cclica y de la conservaci
on de su momento conjugado asociado.
Veremos ahora que los teoremas usuales de conservaci
on est
an contenidos en la regla general sobre coordenadas cclicas.

5.1.1.

Momento lineal y coordenadas globales de traslaci


on

Pensemos primero en una coordenada generalizada qj cuyo cambio dqj represente una traslaci
on del sistema
como un todo en cierta direcci
on3 . Esto implica que el corrimiento del sistema como un todo debe ser compatible
con las ligaduras. En algunos casos las fuerzas externas podran imponer ligaduras sobre el sistema que impidan
esta clase de movimiento, con lo cual qj no sera una coordenada generalizada independiente.
Supondremos entonces que (a) qj es una coordenada generalizada independiente. Asumiremos adem
as
que (b) La coordenada qj no aparece en la energa cinetica, (c) el potencial no depende de las velocidades
generalizadas, esto excluye de la formulacion por ejemplo a las fuerzas electromagneticas. La ecuaci
on de
Lagrange asociada a esta coordenada queda




d (T V )
(T V )
d T
V
=
=0

+
dt
qj
qj
dt qj
qj
la derivada total en el tiempo del momento generalizado esta dada por




d L
d T
V
p j =
=
=
= Qj
dt qj
dt qj
qj
3

(5.6)

Por ejemplo, un conjunto de partculas colineales insertadas en una varilla sin masa. Una coordenada qj puede ser una
coordenada cartesiana cuyo eje va a lo largo de la varilla. Un desplazamiento dqj implica que el sistema se mueve como un todo
gracias a la ligadura de cuerpo rgido entre las partculas. El corrimiento de una coordenada cartesiana del centro de masa de un
sistema es otro ejemplo.

72

CAPITULO 5. SIMETRIAS Y CANTIDADES CONSERVADAS (LAGRANGE)

a continuaci
on veremos que esta es la ecuaci
on de movimiento para el momento lineal total a lo largo de qj .
on qj , en tanto que pj
Es decir que Qj es la componente de la fuerza (en el sentido Newtoniano) en la direcci
es la componente del momento lineal a lo largo de tal direcci
on. La fuerza generalizada Qj viene dada por
Qj =

N
X
i=1

Fi

ri
qj

(5.7)

n
otese que al ser qj una variable de traslaci
on, sus unidades s deben ser de longitud y se puede definir
unvocamente un vector unitario de traslaci
on n, a lo largo de dqj . Como dqj representa una traslaci
on del
sistema a lo largo de cierto eje, la diferencia entre los vectores ri (qj ) y ri (qj + dqj ) va a lo largo de n, y tiene
como magnitud dqj
dqj n
ri
ri (qj + qj ) ri (qj )
= lm
=
=n
(5.8)
q
0
qj
qj
dqj
j
on del sistema como un todo, cada partcula se
observese que se ha escrito n y no ni ya que al ser una traslaci
desplaza en la misma direcci
on que las otras. De aqu resulta
Qj =

N
X
i=1

Fi n = n F

on n de
por lo tanto, Qj representa la componente de la fuerza total sobre el sistema a lo largo de la direcci
traslaci
on. Para ver el significado del momento can
onico, calculemos pj
!
N
N
X
1X
L
T

r i
2
pj =
=
=
mi r i =
mi r i
qj
qj
qj 2
qj
i=1

pj =

N
X
i=1

mi vi

i=1

ri
qj

donde hemos usado (2.12). Teniendo en cuenta (5.8) llegamos a


X
pj = n
mi vi
i

que corresponde a la componente del momento mec


anico lineal total del sistema a lo largo de la direcci
on de
traslaci
on. Vemos que en este caso, el momento generalizado asociado a una sola coordenada qj result
o estar
asociado al momento lineal de todo el sistema, esto no es de extra
nar, ya que qj represent
o una traslaci
on
para el sistema como un todo. Esto enfatiza el hecho de que el momento generalizado est
a asociado a una
coordenada y no a una partcula. El mismo comentario vale para la fuerza generalizada. En realidad, todas las
variables generalizadas en la formulaci
on Lagrangiana est
an asociadas a coordenadas en lugar de partculas.
A este hecho se debe en parte la facilidad de extender este formalismo a campos y sistemas contnuos.
Vale la pena mencionar que en el presente tratamiento solo se asumi
o que el potencial no dependa de la
velocidad generalizada qj pero podra depender de las velocidades generalizadas de otras coordenadas. Por
otro lado, para sistemas aislados cuyo potencial no dependa de qj las dem
as condiciones se satisfacen (para
una direcci
on arbitraria de la traslaci
on), ya que al no existir fuerzas externas no hay ligaduras externas que
signifiquen una violaci
on de las ligaduras cuando el sistema se traslada como un todo. Adicionalmente, debido
a la homogeneidad del espacio, una traslaci
on del sistema como un todo es equivalente para un sistema aislado
a un corrimiento del origen, de lo cual es claro que la energa cinetica no puede depender de qj . N
otese que
si el sistema no es aislado, un corrimiento del origen no necesariamente es equivalente a un corrimiento del
sistema, ya que el corrimiento del sistema lo puede estar acercando o alejando de ciertos objetos externos,
en tanto que un corrimiento en el origen no. Si por ejemplo ubicamos un plano infinito de masa o de carga
uniformemente distribuda por ejemplo sobre el plano XY , es claro que una traslaci
on en x e y cumplir
a las
condiciones aqu expuestas, pero un corrimiento en z probablemente no.

Y PROPIEDADES DE SIMETRIA
5.1. TEOREMAS DE CONSERVACION

73

Si ahora suponemos (d) que la coordenada de traslaci


on qj es cclica, qj no podra aparecer en el potencial
de modo que
V

Qj = 0 = p j
qj
lo cual nos da la conservaci
on de la componente del momento lineal total del sistema a lo largo de la direcci
on
de traslaci
on. De modo que si cierta componente de la fuerza (Newtoniana) total del sistema es nula, la
correspondiente componente del momento lineal es constante. Esta condici
on tambien la cumplen los sistemas
aislados para una direcci
on arbitraria de la traslaci
on, en virtud de la homogeneidad del espacio, por tanto
vemos que el momento total del sistema se debe conservar para sistemas aislados cuyo potencial no dependa
de las velocidades generalizadas. En este caso hablamos del teorema de conservaci
on del momento lineal. Sin
embargo, es un hecho experimental que el momento lineal total de un sistema aislado se conserva incluso si no
se cumple dicha condici
on (aunque con un concepto extendido de momento), con lo cual la conservaci
on del
momento adquiere el car
acter de principio.

5.1.2.

Momento angular y coordenadas globales de rotaci


on

Figura 5.1: Rotaci


on infinitesimal del sistema como un todo, caracterizada por el desplazamiento angular dqj .
De manera similar al caso anterior, veremos que si dqj corresponde a una rotaci
on del sistema como un todo
alrededor de cierto eje, el momento generalizado corresponde al momento angular del sistema a lo largo del
eje de rotaci
on en tanto que Qj corresponde a la componente del torque en la direcci
on de dicho eje. Cuando
la variable qj se vuelve cclica se llega a la conservaci
on del momento angular.
Asumiremos las mismas condiciones del caso anterior pero para una coordenada qj que produce la rotaci
on
del sistema como un todo alrededor de un eje fijo. La Fig. 5.1 muestra la rotaci
on en una cantidad dqj de
la partcula iesima del sistema, donde por comodidad y sin perdida de generalidad se ha colocado el eje de

CAPITULO 5. SIMETRIAS Y CANTIDADES CONSERVADAS (LAGRANGE)

74

rotaci
on a lo largo del eje Z. ri (qj ) es la posici
on de esa partcula cuando la coordenada generalizada vale qj y
on de la partcula iesima cuando la rotaci
on dqj se ha realizado, es el angulo entre
ri (qj + dqj ) es la posici
ri y el eje de rotaci
on y Ri el radio del crculo descrito por la partcula i alrededor del eje de rotaci
on. Como
hemos asumido que T es independiente de qj y que V es independiente de qj llegamos de nuevo a (5.6), y la
fuerza generalizada Qj est
a dada de nuevo por (5.7) pero en este caso la derivada adquiere un sentido diferente


ri

= ri sin
kdri k = Ri dqj = ri sin dqj
qj

la direcci
on de dri y por lo tanto la de ri /qj es perpendicular a n (vector unitario a lo largo del eje de
rotaci
on). Adicionalmente dado que ri no cambia de magnitud, se tiene que dri (y por tanto ri /qj ) es tambien
perpendicular a ri . Por tanto, ri /qj es perpendicular a n y a ri y su magnitud es ri sin = knk kri k sin ,
de lo cual se deduce que
ri
= n ri
(5.9)
qj
la fuerza generalizada queda entonces
Qj =

N
X
i=1

Fi (n ri ) =

N
X
i=1

n (ri Fi )

donde hemos usado la identidad a (b c) = b (c a). Vemos que Ni ri Fi es el torque de la partcula


iesima, medido con respecto al origen definido en la Fig. 5.1. De modo que
Qj = n

N
X
i=1

Ni = n N

la fuerza generalizada corresponde entonces a la componente del torque total del sistema a lo largo del eje de
rotaci
on4 . Veamos el momento conjugado
pj =

i=1

i=1

i=1

i=1

X
X
X
X
L
T
r i
ri
=
=
mi vi
=
mi vi
=
mi vi (n ri ) =
n (ri mi vi )
qj
qj
qj
qj

pj = n

N
X
i=1

Li = n L

el momento can
onico es entonces la componente del momento angular total en la direcci
on del eje de rotaci
on.
Si la variable qj se vuelve ignorable, se llega a la conservaci
on de la componente del momento angular total en
la direcci
on del eje de rotaci
on. La variable qj es en este caso una variable angular y por tanto, adimensional.
Vemos que las condiciones anteriores se cumplen para un sistema aislado. La discusi
on es muy similar al
caso traslacional salvo que esta vez apelamos a la isotropa del espacio y no a la homogeneidad. Recordemos
que la homogeneidad nos dice que la estructura del espacio es la misma si cambiamos el origen del sistema
coordenado, en tanto que la isotropa nos menciona que la estructura del espacio se ve igual si hacemos una
reorientaci
on de los ejes coordenados (sin cambiar el origen).

5.1.3.

Consideraciones generales sobre simetras asociadas a coordenadas cclicas y cantidades conservadas

Es sencillo ver que el hecho de que una variable sea cclica est
a asociado con alg
un tipo de simetra del
sistema. Por ejemplo, si la traslaci
on del sistema como un todo no afecta al problema, lo que estamos diciendo
es que el sistema es invariante bajo traslaciones en cierta direcci
on, y por lo tanto dicha invarianza ante la
4

Es importante notar que esta afirmaci


on es v
alida siempre y cuando el origen con respecto al cual se mide el torque, sea tal
que el eje de rotaci
on pase por dicho origen, como se aprecia en la Fig. 5.1.

ENERGIA Y CONSERVACION
DE LA ENERGIA
5.2. FUNCION

75

operaci
on de traslaci
on conduce a la conservaci
on del momento lineal en la direcci
on de dicha traslaci
on. Por
otra parte si un sistema permanece invariante ante una rotaci
on alrededor de cierto eje, la componente del
momento angular a lo largo de dicho eje se conserva. Los teoremas de conservaci
on est
an fuertemente ligados a
las simetras del sistema. Si el sistema es esfericamente simetrico, el momento angular del sistema se conserva
en todas direcciones. Estas consideraciones de simetra para llegar a primeras integrales es aplicable incluso a
sistemas muy complejos en los cuales no es posible resolver la din
amica completa.
Veamos una aplicaci
on: supongamos que tenemos un sistema de partculas inmerso en un potencial generado
por una distribuci
on homogenea de masa, carga etc. que forma un plano infinito (el plano XY ). Claramente
la traslaci
on de este sistema (si es localizado) a lo largo de x e y no afecta la din
amica de este, pero una
traslaci
on en z puede posiblemente afectarlo. Por otro lado tambien hay una clara invarianza cuando rotamos
al sistema alrededor de z. Sin conocer los detalles del sistema, deducimos que px , py y Lz se conservan. Si en
vez del plano XY , la distribuci
on externa solo ocupa al semiplano infinito x 0, entonces solo permanece la
invarianza de py . La relaci
on estrecha entre las simetras y las constantes de movimiento, constituye uno de los
principios mas profundos y fructferos en la Fsica y adquiere una dimensi
on a
un mayor a la luz del Teorema
de Noether que discutiremos m
as adelante.

5.2.

Funci
on energa y conservaci
on de la energa

Por supuesto, tambien es de esperarse que el teorema de conservaci


on de la energa se pueda obtener del
formalismo Lagrangiano, cuando las fuerzas del sistema son derivables de un potencial que solo depende de la
posici
on. Por otro lado, hemos visto que la ausencia de una coordenada generalizada en el Lagrangiano conduce
a la conservaci
on de un momento generalizado, es natural entonces preguntarse si la ausencia explcita de la
variable tiempo conduce a alg
un teorema de conservaci
on. La analoga no es tan directa puesto que no hemos
en ese
asociado un momento generalizado relacionado con la variable tiempo ni tiene sentido una variable t,
sentido no podemos hablar del tiempo como una coordenada generalizada. M
as bien, el tiempo se considera
un par
ametro que adem
as de aparecer explcitamente, regula la evoluci
on de las coordenadas.
Al igual que en el caso de los momentos, veremos que del formalismo Lagrangiano sale un teorema de
conservaci
on m
as general que incluye a la conservaci
on de la energa como caso particular.
Consideremos un Lagrangiano que es funci
on de las coordenadas generalizadas, velocidades generalizadas
y el tiempo (la dependencia temporal explcita puede provenir de las variaciones de fuentes exteriores, o de
ligaduras dependientes del tiempo), con lo cual la derivada total respecto al tiempo es
n

j=1

j=1

L
dL X L dqj X L dqj
=
+
+
dt
qj dt
qj dt
t
a partir de las ecuaciones de Lagrange
L
d
=
qj
dt

L
qj

(5.10)

(5.11)

y reemplaz
andolo en (5.10)
dL
dt
dL
dt



n 
n
X
d L
dqj X L dqj
L
=
+
+

dt qj
dt
qj dt
t
j=1
j=1


n 
X
d
L
L
=
qj
+
dt
qj
t
j=1

lo cual se puede reescribir en la forma

n
d X L
L
qj
L +
=0
dt
qj
t
j=1

(5.12)

76

CAPITULO 5. SIMETRIAS Y CANTIDADES CONSERVADAS (LAGRANGE)

la cantidad entre parentesis se denomina funci


on energa, y se denota por h

n
n
X
X
L
L=
h (q, q,
t)
qj
qj pj L
qj
j=1

(5.13)

j=1

la funci
on energa es identica en valor al Hamiltoniano, cuya formulaci
on veremos m
as adelante. Sin embargo,
se denota con una letra diferente (el Hamiltoniano se denota como H) ya que las dos funciones difieren en
cuanto a los argumentos que utilizan, h es funci
on de qj , qj , t; en tanto que H es funci
on de qj , pj , t siendo
pj el momento conjugado a qj . Aplicando (5.13), la ecuaci
on (5.12) se escribe
dh
L
=
dt
t

(5.14)

de lo cual se ve en forma inmediata que si el Lagrangiano no es funci


on explcita del tiempo, es decir su
dependencia temporal aparece solo a traves de q (t), y q (t), la funci
on energa es una constante de movimiento.
h es en consecuencia, una primera integral de movimiento y se le denomina integral de Jacobi.
En este punto conviene clarificar que para que una cierta cantidad sea constante de movimiento, es necesario
y suficiente que su derivada total con respecto al tiempo (y no necesariamente la parcial) sea nula. Para ver
la raz
on de esto, recordemos el significado de cada una de estas derivadas, la derivada parcial corresponde a
dejar las coordenadas y velocidades generalizadas fijas y solo se mueve el par
ametro tiempo, el hecho de que
la derivada parcial se anule significa entonces que la cantidad en cuesti
on se mantiene constante en un proceso
virtual en el cual las coordenadas y velocidades generalizadas del sistema se mantuvieran fijas y solo variara el
par
ametro tiempo, es decir solo evolucionan las influencias exteriores al sistema5 . Una cantidad es constante
de movimiento cuando se mantiene constante su valor en un proceso real, y en un proceso real las coordenadas
y velocidades generalizadas tambien evolucionan a medida que transcurre el tiempo, en consecuencia es la
derivada total la que describe correctamente la evoluci
on de una cierta cantidad con el tiempo. En particular,
la cantidad ser
a constante de movimiento si y solo si su derivada total es cero.
M
as adelante veremos que para el Hamiltoniano (que coincide numericamente con la funci
on energa) las
derivadas temporales total y parcial coinciden (ver Ec. 6.38, P
ag. 101). Naturalmente esto tambien ser
a v
alido
para la funci
on energa, de modo que en este caso muy particular la anulaci
on de la derivada parcial nos
conduce a que h sea constante de movimiento. Debemos enfatizar sin embargo, que en general las derivadas
total y parcial con respecto al tiempo de una cantidad arbitraria pueden ser muy diferentes.

5.2.1.

Relaci
on entre energa y funci
on energa

Bajo ciertas circunstancias, la funci


on h es la energa total del sistema. Para determinar bajo que circunstancias, recordemos que la energa cinetica se puede escribir de la forma
T = T0 (q) + T1 (q, q)
+ T2 (q, q)

donde T0 es independiente de las velocidades generalizadas, T1 es lineal en las velocidades generalizadas, y


T2 es una funci
on cuadr
atica de estas (ver Ec. 2.24, P
ag. 2.24). Para un amplio n
umero de sistemas, una
descomposici
on similar es posible con el Lagrangiano completo
L (q, q,
t) = L0 (q, t) + L1 (q, q,
t) + L2 (q, q,
t)

(5.15)

donde L2 es una funci


on homogenea de segundo grado (no simplemente cuadr
atica) en q.
L1 es homogenea
de primer grado en q,
y L0 es independiente de q (i.e. homogenea de grado cero en q).
No hay ninguna raz
on
de primeros principios para asumir que el Lagrangiano tenga esta forma, pero esta estructura aparece en una
gran cantidad de problemas. Por ejemplo, el Lagrangiano adquiere esta forma cuando el potencial no depende
5
Vale decir que en este caso estamos hablando de un proceso virtual muy diferente al definido para el principio de DAlembert.
Pues en el escenario actual es el tiempo el que evoluciona y se fijan las coordenadas de las partculas, en tanto que para el principio
de DAlembert es todo lo contrario.

ENERGIA Y CONSERVACION
DE LA ENERGIA
5.2. FUNCION

77

en forma explcita de la velocidad. Sin embargo, a


un para ciertos potenciales dependientes de la velocidad,
esta separaci
on es posible como se puede ver para el caso mas caracterstico del potencial de una carga en un
campo electromagnetico.
Aplicaremos ahora el teorema de Euler, que nos dice que si f (x1 , . . . , xp ) es una funci
on homogenea de
grado n en las variables xi entonces
p
X
f
xi
= nf
(5.16)
xi
i=1

aplicando la definici
on de la funci
on h, Ec. (5.13), para Lagrangianos de la forma (5.15), resulta

h=

n
X
j=1

n
n
n
X
X
X
L
L0
L1
L2
qj
L=
qj
L0 +
qj
L1 +
qj
L2
qj
qj
qj
qj
j=1

j=1

j=1

y aplicando el teorema de Euler (5.16), para funciones homogeneas


h = 0 L0 + L1 L1 + 2L2 L2
h = L2 L0

(5.17)

Si las transformaciones de coordenadas descritas en (2.5) no dependen explcitamente del tiempo, la estructura
de la energa cinetica descrita en (2.24), resulta T = T2 . Si adicionalmente, el potencial no depende de las
velocidades generalizadas, se tendra que L2 = T , y L0 = V , de tal manera que
h=T +V =E
y la funci
on energa corresponde en este caso a la energa total del sistema. Esta energa no necesariamente se
conserva puesto que el potencial puede ser funci
on explcita del tiempo. Cuando se asume adicionalmente a
las condiciones anteriores, que el potencial no depende explcitamente del tiempo, la Ec. (5.14) nos conduce a
la conservaci
on de h y en este caso a la conservaci
on de la energa total del sistema. N
otese sin embargo, que
las condiciones de conservaci
on de h son en general, muy diferentes de las condiciones para la conservaci
on
de la energa. h no necesariamente corresponde a la energa, y cuando corresponde a la energa del sistema
no necesariamente se conserva. Es particularmente importante el hecho de que mientras el valor numerico del
Lagrangiano es independiente de las coordenadas generalizadas empleadas, la funci
on h depende en valor y en
forma funcional del sistema coordenado elegido. Mas a
un, esta cantidad puede ser conservada para una cierta
escogencia de coordenadas y no serlo para otra, o ser la energa total en un sistema coordenado y no serlo en
otro. En realidad, para un mismo sistema fsico, diferentes funciones h pueden ser generadas de acuerdo con
el sistema de coordenadas elegido, esto se puede ver de la definici
on (5.13) ya que qj y pj son muy diferentes
cuando cambiamos de sistema coordenado. Volveremos sobre este punto en la secci
on 6.7.1, en el lenguaje del
Hamiltoniano.
Uno de los casos m
as comunes en mec
anica cl
asica es aquel en el cual la energa cinetica es de la forma
T = mqi2 /2 o p2i /2m y la energa potencial depende solo de las coordenadas generalizadas. En este caso, h es
la energa total del sistema y se conserva.

5.2.2.

Funci
on energa con fuerzas disipativas

Un caso interesante ocurre cuando tenemos fuerzas disipativas que se pueden generar de una funci
on de
disipaci
on z. Tomando de nuevo como punto de partida la Ec. (5.10) y teniendo en cuenta que las ecuaciones
de Lagrange con fuerzas disipativas tipo Rayleigh vienen dadas por (2.38) vemos que la Ec. (5.11) debe ser
corregida para obtener


L
d L
z
=
+
qj
dt qj
qj

CAPITULO 5. SIMETRIAS Y CANTIDADES CONSERVADAS (LAGRANGE)

78

con esto la Ec. (5.12) queda en la forma

X
d
L
L X z
qj
qj = 0
L +
+
dt
qj
t
qj
j

y junto con (5.13) adquieren la forma

X z
dh L
qj
+
=
dt
t
qj
j

la definici
on de z dada por la Ec. (2.37), nos muestra que esta funci
on es homogenea de grado 2 en las qs.

Aplicando de nuevo el teorema de Euler, resulta


dh
L
= 2z
dt
t

(5.18)

Si L no es funci
on explcita del tiempo y el sistema es tal que h es la energa del sistema, la Ec. (5.18) nos dice
que 2z es la rata de disipaci
on de energa
dE
= 2z
(5.19)
dt
que concuerda con lo demostrado en la seccion 2.5, aunque all fue probado en circunstancias menos generales.

5.3.

Teorema de Noether para sistemas discretos (opcional)

Veremos a continuaci
on que la relaci
on entre simetras y leyes de conservaci
on se puede englobar de una
forma muy general en el celebrado teorema de Noether, que contiene a los casos ya estudiados como casos
particulares. En terminos simples este teorema asocia a cada simetra contnua del sistema una cantidad
conservada. Veamos su enunciado preciso.
Theorem 3 Teorema de Noether: Sea un Lagrangiano de la forma L = L (q, q,
t). Supongamos que las ecuaciones de movimiento de Lagrange Ecs. (4.3), son invariantes bajo una transformaci
on contnua de coordenadas
de la forma [t, q] [t0 (t) , q0 (q,t)]. Entonces existe una integral de movimiento i.e. una cantidad conservada
asociada a dicha invarianza.
Demostraci
on: Dado un Lagrangiano L (q, q,
t) que depende de las coordenadas qi (i = 1, ..., n), sus
derivadas temporales qi y el tiempo t, podemos introducir unas nuevas coordenadas con la transformaci
on
t0 t0 (t) ; qi0 qi0 (q,t)

(5.20)

esta transformaci
on debe ser invertible ya que de lo contrario, el nuevo conjunto coordenado no sera independiente. Parametrizaremos las nuevas coordenadas en la forma:
t0 t + t (t) , qi0 qi + qi (q,t)

(5.21)

inicialmente las transformaciones t y qi son arbitrarias, por notaci


on se tiene que:
qi

dqi
dq 0
; qi0 0i
dt
dt

podemos conectar estas cantidades a traves de las relaciones


qi0 =

dqi0
dqi0 dt
d (qi + qi ) dt
=
=
0
0
dt
dt dt
dt
dt0

(5.22)

y teniendo en cuenta que


dt
=
dt0

dt0
dt

1

d [t + t]
dt

1

1+

d
t
dt

1

1
d
1 + dt
t

(5.23)

5.3. TEOREMA DE NOETHER PARA SISTEMAS DISCRETOS (OPCIONAL)

79

podemos reemplazar (5.23) en (5.22) y se tiene que




d
1
0

qi = qi + qi
d
dt
1 + dt
t
de modo que:

qi

qi0

qi =

d
qi + qi
dt

1
 qi
d
1 + dt
t

Si consideramos transformaciones infinitesimales de modo que qi y t se convierten en cantidades diferenciales, se tiene que:




 


d
d
d
d
d
d
qi
qi + qi
1 t qi = qi qi t +
qi
qi
t qi
dt
dt
dt
dt
dt
dt
d
d
qi qi t
(5.24)
qi
dt
dt
donde hemos despreciado terminos de orden cuadr
atico en t, q.
Dado que la Fsica no puede cambiar con esta transformaci
on de coordenadas, la acci
on debe permanecer
invariante:
S (t1 , t2 )

t2
t1



L [q (t) , q (t) , t] dt = S 0 t0 (t1 ) , t0 (t2 )

para que esto se cumpla, se requiere de la siguiente igualdad

t0 (t2 )

t0 (t1 )



 
L0 q0 t0 , q 0 t0 , t0 dt0





 dt
L0 q0 , q 0 , t0 L q q0 , t0 , q q0 , q 0 , t0 , t t0
dt0

(5.25)

para verificarlo basta con hacer una transformaci


on de coordenadas y tiempo a la acci
on
Z t2
Z t0 (t2 )
Z t2


 
L [q (t) , q (t) , t] dt
L0 q0 t0 , q 0 t0 , t0 dt0 =
L [q, q,
t] dt
t0 (t1 )

t1

t1

donde en la u
ltima igualdad hemos aplicado justamente (5.25) y los lmites de integraci
on cambian por el
hecho de que cambia el diferencial del cual dependen estos.
Si la forma de las ecuaciones de movimiento es invariante ante esta transformaci
on de coordenadas, se dice
que dicha transformaci
on es simetrica. En el caso m
as simple, el lagrangiano como tal es invariante:


L0 q0 , q 0 , t0 = L q0 , q 0 , t0

esto sin embargo, no es necesario, ya hemos visto que es suficiente que se cumpla la relaci
on.



d
L0 q0 , q 0 , t0 = L q0 , q 0 , t0 + 0 q0 , t0
(5.26)
dt
es decir, que ambas funciones lagrangianas pueden diferir en una derivada total con respecto al nuevo par
ametro
de tiempo. Si insertamos la ecuaci
on (5.26) en (5.25), se tiene:



 dt


d
0
0 0
0 0
L q q0 , t0 , q q0 , q 0 , t0 , t t0
=
L
q
,
q

,
t
+

q
,
t
dt0
dt0

de lo cual queda:



 dt0
 dt0
d
0 0
L q q , t , q q , q , t , t t
= L q , q , t
+
q ,t
dt
dt0
dt
0


dt
d
L [q, q,
t] = L q0 , q 0 , t0
+ q0 , t0
dt
dt




(5.27)

CAPITULO 5. SIMETRIAS Y CANTIDADES CONSERVADAS (LAGRANGE)

80

que junto con (5.23) nos da la ecuaci


on:
 dt0
L [q, q,
t] L q0 , q 0 , t0
=
dt



d
L [q, q,
t] L q0 , q 0 , t0 1 + t
=
dt

de modo que


d
q0 , t0
dt

d
q0 , t0
dt


 d

d
L [q, q,
t] L q0 , q 0 , t0 = L q0 , q 0 , t0
t + q0 , t0
(5.28)
dt
dt
y dado que la transformaci
on es contnua, es posible considerar transformaciones infinitesimales en (5.21).
Definiendo

L q0 , q 0 , t0 L [q, q,
t] L

y tomando (5.21), la ecuaci


on (5.28) se convierte en:

L L [q, q,
t] L (q + q, q + q,
t + t) = L (q + q, q + q,
t + t)

d
d
t + (q + q, t + t)
dt
dt

pero por expansion de Taylor


L (q + q, q + q,
t + t)


d
d
t = L (q, q,
t) t + O 2
dt
dt

despreciando terminos cuadr


aticos en q, q y/o t, resulta
L = L (q, q,
t)

d
d
t + (q + q, t + t)
dt
dt

En particular, si escojemos q = t = 0, se tiene que q = q0 y t = t0 , adem


as usando (5.24) se obtiene q =
0
d
0, de modo que q = q . Con estas consideraciones y usando la Ec. (5.27) se tendra que dt
(q, t) = 0. Podemos
a
nadir este cero para reescribir L como
d
d
t + [ (q + q, t + t) (q, t)]
dt
dt
d
d
L = L (q, q,
t) t (q, t)
dt
dt

L = L (q, q,
t)

(5.29)

por otro lado, dado que estamos escribiendo L en funci


on de q, q,
t la regla de la cadena para L nos da

n 
X
L
L
L
L =
qi +
qi +
t
(5.30)
qi
qi
t
i=1

igualando (5.29) con (5.30) y usando (5.24) resulta:


n 
X
L


L
L
d
qi +
qi +
t + L t
qi
qi
t
dt
i=1

 

n 
X
L
L d
d
L
d
qi +
qi qi t +
+L
t
qi
qi dt
dt
t
dt
i=1




n 
n 
X
X
L
L d
L d
L
d
+
qi
qi
t +
+L
t
qi qi dt
qi dt
t
dt
i=1
i=1
"
#

n 
n
X
X
L
L d
L
L
d
+
qi +
t + L
qi
t
qi qi dt
t
qi
dt
i=1

i=1

d
(q, t)
dt

d
(q, t)
dt

d
(q, t)
dt

d
(q, t)
dt

(5.31)

5.3. TEOREMA DE NOETHER PARA SISTEMAS DISCRETOS (OPCIONAL)

81

la Ec. (5.31) describe la condici


on que un debe cumplir para un Lagrangiano dado, a fin de que las
ecuaciones de movimiento (4.3), permanezcan invariantes ante una transformaci
on infinitesimal dada por
6
(5.21) . El problema se reduce usualmente a la existencia (o no existencia) de una soluci
on para la funci
on
en la Ec. (5.31) para una transformaci
on especfica de la forma (5.21). En particular, si se cumplen las
condiciones
d ()
d (t)
=0 y
=0
(5.32)
dt
dt
entonces la Ec. (5.29) nos lleva a que L = 0. Por tanto, bajo estas condiciones la funci
on Lagrangiana misma
permanecera invariante bajo la transformaci
on de coordenadas. Si la Ec. (5.31) se satisface, entonces al usar
las ecuaciones de movimiento


d L
L
=
qi
dt qi
se obtiene:

"
#



n 
n
X
X
d L
L d
L
L
d
d
+
qi +
t + L
t = (q, t)
qi
dt qi
qi dt
t
qi
dt
dt
i=1

(5.33)

i=1

el primer y tercer terminos a la izquierda de (5.33) se pueden escribir en la forma


( n 



 ) X



n 
n 
n
X
X
d L
L d
d X L
L d
d L
+
qi =
2
qi
qi
qi
dt qi
qi dt
dt
qi
qi dt
dt qi
i=1
i=1
i=1
i=1
"
#
("
#
)
!
n
n
n
X
X
d
dL
L
d
L
d X L
L
qi
t =
L
qi t
t + t
qi
qi
dt
dt
qi
dt
dt
qi
i=1

i=1

(5.34)
(5.35)

i=1

reemplazando (5.34) y (5.35) en (5.33) se obtiene


( n 

 ) X


n 
n
X
d X L
d L
L d
L
qi
qi
t +
2
qi
+
dt
qi
qi dt
dt qi
t
i=1
i=1
i=1
("
# )
!
n
n
X
d
L
dL
d X L
d
+
L
qi t
t + t
qi + (q, t) = 0
dt
qi
dt
dt
qi
dt
i=1

i=1

organizando los terminos que aparecen bajo la derivada temporal total resulta
( n
X L
2
qi +
qi

!
)



n
n 
n
X
X
X
L
d L
L d
qi
L
qi t + (q, t)
qi
+
qi
qi dt
dt qi
i=1
i=1
i=1
i=1
!
n
X
L
dL
d
L
+ t
t + t
qi = 0
t
dt
dt
qi
d
dt

i=1

simplificando terminos
( n
!
)
( n 

)
n
X
d X L
L
d X
L
2
qi + L
qi t + (q, t)
qi
+
dt
qi
qi
dt
qi
i=1
i=1
i=1
"
!#
n
L dL
d X L
+

+
qi
t = 0
t
dt
dt
qi
i=1

Vale la pena mencionar que al Lagragiano lo podemos ver en este teorema, como una funci
on arbitraria que depende de un
par
ametro t, de unas coordenadas qi y de qi , de tal manera que las ecuaciones que rigen el comportamiento de las coordenadas
qi con respecto al par
ametro t, sean las Ecs. (4.3). El sistema no tiene que ser mec
anico y de hecho no tiene que ser un sistema
Fsico.

CAPITULO 5. SIMETRIAS Y CANTIDADES CONSERVADAS (LAGRANGE)

82

de nuevo agrupamos los terminos con derivada temporal total


( n
!
) "
n
X
d X L
L
L
d
qi + L
qi t + (q, t) +
+
dt
qi
qi
t
dt
i=1

i=1

n
X
L
qi
qi
i=1

#
dL
t = 0

dt

(5.36)

usando regla de la cadena para dL/dt y las ecuaciones de Lagrange, evaluamos el termino proporcional a t
!
!
n
n
n
n
X
X
L
L
d X L
dL
L
d X L
L
L
qi
qi
qi
qi
+
=
+
t
dt
qi
dt
t
dt
qi
qi
qi
t
i=1
i=1
i=1
i=1
 X

n
n
n
n
X
X
X
d L
L
L
L
=
+
qi
qi
qi
qi
dt qi
qi
qi
qi
i=1

n
X
i=1

por tanto la ecuaci


on (5.36) se reduce a:
( n
d X L
qi +
dt
qi
i=1

es decir que la cantidad

n
X
L
qi +
qi
i=1

i=1

i=1

i=1

n
n
n
X
X
L X L
L
L
qi
+
qi
qi
qi = 0
qi
qi
qi
qi
i=1

n
X
L
L
qi
qi
i=1

n
X
L
L
qi
qi
i=1

i=1

t + (q, t)

i=1

=0

t + (q, t) = cte

(5.37)

es una constante de movimiento o cantidad conservada (integral de movimiento). En sntesis, si para una
transformaci
on especfica de coordenadas de la forma (5.21), existe un valor de (q, t) que satisfaga la Ec.
(5.31), dicho valor de nos conducir
a a una constante de movimiento de la forma (5.37). Recordemos que la
condici
on (5.31) equivale a la invarianza de las ecuaciones de movimiento ante la transformaci
on (5.21).

5.3.1.

Comentarios sobre el teorema de Noether

1. Es importante enfatizar en que dicho teorema solo es v


alido para transformaciones contnuas del espacio
tiempo, ya que en la demostraci
on es fundamental el uso de transformaciones infinitesimales.
2. Aunque (q, t) es una funci
on arbitraria, esta debe ser derivable hasta segundo orden en todas sus variables y esta segunda derivada debe ser contnua. Ya que en una parte de la demostraci
on se intercambian
las segundas derivadas.
3. El teorema implica la invarianza de la acci
on (i.e. de las ecuaciones de movimiento). Sin embargo, no
implica la invarianza del lagrangiano mismo, esta solo se cumple si d () /dt = 0, d (t) /dt = 0.
4. En teora de campos (ver secci
on 18.3) se puede hacer una demostraci
on similar con las siguientes
correspondencias: q (q) , q (q) , L L donde (q) representa los campos (un arreglo
vectorial de ellos), (q) representa sus derivadas con respecto al espacio y el tiempo, y L representa
una densidad Lagrangiana con
Z
L

L d3 q,

5. A pesar de que la funci


on act
ua como un gauge para el Lagrangiano, vemos que la cantidad conservada depende del cambio de esta funci
on evaluado entre los dos sistemas coordenados. Esto es l
ogico
ya que surge de manera natural a partir de la transformaci
on de coordenadas que se hizo. En realidad
esta cantidad se debe fijar a traves de la Ec. (5.31) con el fin de que la transformaci
on en cuesti
on deje
invariantes a las ecuaciones de movimiento.

DEL TEOREMA DE NOETHER


5.4. EJEMPLOS DE APLICACION

83

6. N
otese que la soluci
on para en la Ec. (5.31), no tiene porque ser u
nica. Por otro lado, puede ocurrir que
no exista soluci
on, en este caso la transformaci
on de coordenadas no es una transformaci
on de simetra
del sistema y no tendramos una cantidad conservada.
7. Es necesario distinguir entre la transformaci
on de coordenadas [t, q] [t0 , q0 ] y la transformaci
on gauge
0
L = L + d/dt. N
otese que esta u
ltima solo es v
alida en un sistema coordenado fijo.
8. Una condici
on esencial para la validez del teorema, es que el nuevo par
ametro t0 , dependa u
nicamente
0
0
del antiguo par
ametro t = t (t), y no de las antiguas coordenadas, como se ve en las Ecs. (5.20).
Esto es importante para la consistencia de la teora, puesto que el par
ametro debe ser completamente
independiente de las coordenadas, de modo que solo el regule la evoluci
on de las coordenadas, conservando
la independencia entre estas.
9. En esta demostraci
on se ha supuesto que el Lagrangiano depende de q, q y t. No se habla sobre Lagrangianos con dependencia de las derivadas de orden superior. Por ejemplo, esta demostraci
on no es v
alida
para un Lagrangiano de la forma L (q, q,
q
, t) como el discutido en la secci
on 4.6.
10. El teorema implica que las simetras del sistema deben reflejarse en su acci
on S.
11. Una estrategia muy fructfera para el uso del teorema de Noether es la siguiente: para una transformaci
on
de coordenadas especfica, buscamos las condiciones requeridas para que la Ec. (5.31) tenga soluci
on,
con la soluci
on as obtenida vamos a la Ec. (5.37) para encontrar la constante de movimiento que se
genera. Las condiciones que se necesiten para que (5.31) tenga soluci
on, ser
an entonces las condiciones
fsicas que debe tener mi sistema para que la transformacion de coordenadas sea una transformaci
on de
simetra para mi sistema, y por ende para que la cantidad generada en (5.37) sea realmente conservada.

5.4.
5.4.1.

Ejemplos de aplicaci
on del teorema de Noether
Invarianza ante traslaci
on temporal y conservaci
on de la energa

Supongamos que las ecuaciones de movimiento de un sistema fsico son invariantes ante una translaci
on
temporal. Que condici
on debe satisfacer el Lagrangiano y cual es la cantidad conservada?.
Una traslaci
on temporal se puede escribir como: q = q = 0, t (t) = = cte. De la ecuaci
on (5.31)
resulta:
"
#
n
X
L
d
L
qi
+ L

t
qi
dt
i=1

d
(q, t)
dt

d
(q, t)
dt

(5.38)

si L no depende explcitamente del tiempo entonces es constante y adem


as la Ec. (5.29) nos indica que el
Lagrangiano mismo es invariante ante la transformaci
on en cuesti
on. Por tanto, la cantidad conservada dada
por la Ec. (5.37) sera
!
n
n
X
X
L
L
qi + L
qi + = ca
qi
qi
i=1

i=1

teniendo en cuenta que qi = 0 y como y son constantes resulta:


!
!
n
n
X
X
L
h (qi , qi , t)
qi L =
pi qi L H = cte
qi
i=1

i=1

es decir, la funcion energa del sistema (Funci


on Hamiltoniana), es la constante de movimiento. Cuando la
funci
on energa (el Hamiltoniano) corresponde a la energa del sistema llegamos a la conservaci
on de la energa.

84

CAPITULO 5. SIMETRIAS Y CANTIDADES CONSERVADAS (LAGRANGE)

Vale decir que de acuerdo con nuestras condiciones, la energa se conserva incluso para algunos sistemas no
aislados, pues si los campos externos son independientes del tiempo, el Lagrangiano no dependera del tiempo
que es la condicion requerida para llegar a la conservaci
on de esta cantidad (adem
as de las condiciones para
que la funci
on energa, sea la energa del sistema).
En la discusion anterior asumimos que el Lagrangiano no depende explcitamente del tiempo, con lo cual
el Lagrangiano mismo permanece invariante ante la traslaci
on temporal. Vale la pena preguntarse si podemos
encontrar una condici
on m
as general en la cual las ecuaciones de movimiento permanezcan invariantes ante
dicha transformaci
on, pero no necesariamente el Lagrangiano mismo. Asumamos en consecuencia que el Lagrangiano puede depender explcitamente del tiempo, dado que L = T V , usualmente la energa cinetica
no depende explcitamente del tiempo (a menos que la transformaci
on a coordenadas generalizadas dependa
explcitamente del tiempo), si asumimos que en cambio la energa potencial es dependiente del tiempo, la Ec.
(5.38) queda
V
1 d
=

t
dt
en general no es posible encontrar un que satisfaga esta ecuaci
on, ya que V
t no tiene que ser una derivada
total. Efectivamente en este caso la funci
on energa no es constante de movimiento y no hay garanta de que
se pueda encontrar alguna funci
on que s sea constante de movimiento.
En las tres secciones siguientes asumiremos que la funci
on Lagrangiana del sistema en coordenadas cartesianas est
a dada por
1
L = mr2 V (r)
(5.39)
2
y encontraremos las condiciones para que las traslaciones espaciales, las rotaciones y las transformaciones de
Galileo sean transformaciones de simetra del sistema. As mismo encontraremos las cantidades conservadas
asociadas a cada simetra y veremos que los resultados son consistentes con los ya obtenidos.

5.4.2.

Invarianza ante traslaci


on espacial y conservaci
on del momento lineal

En analoga con la secci


on anterior, la idea es exigir invarianza ante translaciones espaciales y ver a que
condiciones lleva esta exigencia. Tomaremos como punto de partida el Lagrangiano (5.39).
Por simplicidad asumamos que solo hay traslaci
on a lo largo del eje x3 . Las transformaciones correspondientes a traslaciones espaciales son:
x1 = x2 = 0 , x3 = cte , t = 0

(5.40)

Para t = 0 la Ec. (5.31) se reduce a:


n 
X
L
i=1


L d
d
+
xi = (x, t)
xi x i dt
dt

(5.41)

si existe un que cumpla esta condici


on se tiene de (5.37) que:
n
X
L
xi + (q, t) = ca
x i

(5.42)

i=1

para la forma de nuestro Lagrangiano Ec. (5.39) se tiene que


L
V
L
=
;
= mx i
xi
xi
x i

(5.43)

DEL TEOREMA DE NOETHER


5.4. EJEMPLOS DE APLICACION

85

esto es v
alido para la invarianza traslacional, rotacional y galileana ya que hasta ahora solo hemos usado
t = 0. En el caso de la invarianza traslacional, usando (5.41), (5.40) y (5.43), se tiene:
n
X

V
d
xi = (x, t)
xi
dt
i=1

n 
X
V

x3 =
(x, t) x i (x, t)
x3
xi
t
i=1

n 
X

(x, t) x i =
x3 (x, t)
xi
x3
t

(5.44)

i=1

claramente, la expresi
on de la derecha no contiene a los x i , por lo tanto los coeficientes de la izquierda tampoco
pueden contenerlos i.e.

(x, t) = 0 (x, t) = (t)


xi
de modo que la condici
on (5.44) se reduce a:
V
d
x3 = (t)
x3
dt
debido a la forma de nuestro Lagrangiano, el potencial V solo es funci
on de la posici
on de modo que a la
izquierda tenemos un termino que solo depende de la posicion y a la derecha otro que solo depende del tiempo,
V
de lo cual se sigue que x
debe ser independiente de (x,t), es decir es constante. Integrando7 :
3


V
x3 t =
(5.45)
x3
con este valor de las ecuaciones de movimiento son invariantes en forma ante una transformaci
on espacial
de x3 . Es decir, que cuando se cumple (5.45), la traslaci
on espacial es una transformaci
on de simetra, la
constante de movimiento se sigue de (5.42)
L
x3 + (t) = ca
x 3


V
ca
mx 3 +
t =
cb
x3
x3
V
recordando que la fuerza se escribe como Fi = x
. tendremos en general que
i

mx 3 F3 t = cb
ahora bien, si tenemos una invarianza similar asocida a x1 y x2 , la cantidad conservada es:
e = p Ft = mr Ft = cb
P

(5.46)

es decir que el momento lineal p, es una funci


on lineal del tiempo. Recordemos que bajo las condiciones
aqu establecidas, las componentes de la fuerza deben ser constantes de modo que F es un campo de fuerzas
constante y homogeneo.
Volviendo a la invarianza en solo x3 , vemos que la exigencia de dicha invarianza nos lleva a que 3 V = F3
sea constante. Es decir, a que la componente de la fuerza en esa direcci
on sea constante. Si en particular
suponemos que F3 = 0, se sigue que la cantidad conservada es justamente la componente del momento en esa
direcci
on.
L
= mx 3 = p3 = cb
(5.47)
x 3
7

Una posible constante de integraci


on se puede absorber en .

CAPITULO 5. SIMETRIAS Y CANTIDADES CONSERVADAS (LAGRANGE)

86

adicionalmente, se puede ver de (5.45) que cuando F3 = 0, = 0 y el Lagrangiano como tal es invariante.
Por supuesto, la invarianza del vector momento se seguir
a si cada componente de la fuerza se anula.
Por tanto, vemos que el principio de conservaci
on del momento se sigue de la invarianza del Lagrangiano
ante una traslacion espacial, pero no de la invarianza de las ecuaciones de movimiento. Cuando solo esta u
ltima
se cumple para todas las coordenadas, F es un campo de fuerzas constante y homogeneo.
La existencia de un campo constante y homogeneo ilustra la diferencia entre homogeneidad local y homogeneidad global del espacio. El espacio que ocupa el campo es localmente homogeneo, porque ning
un punto de
dicho espacio se puede distinguir de otro por una medici
on local (en nuestro caso, se obtendra el mismo valor
de la fuerza en cada punto). Sin embargo, esta fuerza tiene que ser generada por alguna fuente (las placas de
un condensador, una masa distante etc.) la existencia de dicha fuente destruye la homogeneidad global del
espacio. Por tanto, la homogeneidad local del espacio implica que el momento es una funci
on lineal del tiempo
en tanto que la homogeneidad global implica su conservaci
on8 .

5.4.3.

Invarianza ante rotaciones espaciales y la conservaci


on del momento angular

Al exigir invarianza ante rotaciones espaciales, supondremos por simplicidad que la rotaci
on se realiza en
el plano X Y , es decir alrededor del eje Z. Las transformaciones correspondientes son:
  0 


x1
cos sin
x1
=
x2
x02
sin cos
Si consideramos que la rotaci
on est
a descrita por un angulo infinitesimal constante, la transformaci
on a
primer orden en queda:


  0 
x1
1
x1
=

1
x2
x02
x01 = x1 () x2

x02 = x1 + x2
de modo que

x1 = x01 x1 = () x2

x2 = x02 x2 = () x1
x3 = t = 0

(5.48)

Recordemos que las ecuaciones (5.41, 5.42, 5.43), solo emplearon la condici
on t = 0, y la estructura (5.39) del
Lagrangiano, de modo que son aplicables en este contexto. A partir de (5.41) se obtiene:
n 
X
L
i=1


L d
d
+
xi = (x, t)
xi x i dt
dt

(5.49)

para la forma de nuestro Lagrangiano se aplican las Ecs. (5.43). Usando (5.43) y (5.48), los miembros de la
izquierda de (5.49) se escriben como


n
X
L
L
L
L
V
V
xi =
x1 +
x2 +
x3 =
x2
x1
xi
x1
x2
x3
x1
x2
i=1

n 
X
L d
L d
L d
xi =
x1 +
x2 = mx 1 () x 2 + mx 2 () x 1 = 0
x i dt
x 1 dt
x 2 dt
i=1

8
Por supuesto la homogeneidad global absoluta no existe, ya que toda fuerza debe tener sus fuentes en alguna parte. Sin
embargo, si las fuentes est
an a distancias mucho mayores que todas las distancias tpicas de mi problema, podemos pensar que las
fuentes est
an en el infinito, en cuyo caso adquiere sentido la homogeneidad global como una buena aproximaci
on.

DEL TEOREMA DE NOETHER


5.4. EJEMPLOS DE APLICACION
aplicando estas relaciones en (5.49)


V
V
d
x2
x1 = (x, t)
x1
x2
dt
d
(r V )3 =
(x, t)
dt

(r V )3 = x i
(x, t) + (x, t)
xi
t

(r V )3 (x, t) = x i
(x, t)
t
xi

87

(5.50)
(5.51)
(5.52)
(5.53)

pero dado que los terminos de la izquierda no dependen de x i los coeficientes de x i a la derecha deben anularse
con lo cual xi = 0 i.e. (x, t) = (t). Con lo cual la Ec. (5.53) queda
(r V )3 =

d
(t)
dt

(5.54)

Por tanto, el miembro de la izquierda depende de coordenadas espaciales y el de la derecha solo del tiempo,
de tal forma que cada miembro debe ser constante, lo cual nos lleva a:
(r V )3 = cte

(5.55)

La Ec. (5.55), es la condici


on que se requiere para que las ecuaciones de Lagrange sean invariantes bajo una
rotaci
on sobre el plano X Y , este termino corresponde a menos la tercera componente del torque. Es decir
que la invarianza de las ecuaciones de Lagrange ante las rotaciones espaciales alrededor de un eje, requiere que
la componente del torque a lo largo de dicho eje sea uniforme y constante. Esto es an
alogo a la condici
on de
que la fuerza sea constante y uniforme para que las ecuaciones de Lagrange sean invariantes ante traslaciones
espaciales. Integrando (5.54) obtenemos el valor de (t)
(t) = () (r F)3 t = () 3 t

(5.56)

reemplazando (5.43, 5.48, 5.56) en (5.37), la constante de movimiento queda


L
L
x1 +
x2 () 3 t = ca
x 1
x 2
mx 1 () x2 + mx 2 () x1 () 3 t = ca
mx 1 x2 + mx 2 x1 3 t = cb
(r p)3 3 t = cb

si asumimos que hay invarianza ante rotaciones en tres ejes mutuamente perpendiculares, la constante de
movimiento es
L ~ t = cb
(5.57)
que es el an
alogo de (5.46) en el caso de invarianza traslacional. En este caso el momento angular es funci
on
lineal del tiempo.
Volviendo a la invarianza ante rotaciones con respecto a x3 , vemos que si la tercera componente del torque
es cero la Ec. (5.54) nos dice que
d
(r V )3 = 0 (x, t) = 0
dt
y es una constante, esto nos lleva a la invarianza del Lagrangiano puesto que se cumplen las condiciones
(5.32). Reemplazando 3 = 0 en (5.57) la constante de movimiento es
L3 = cb

(5.58)

88

CAPITULO 5. SIMETRIAS Y CANTIDADES CONSERVADAS (LAGRANGE)

que es el an
alogo de (5.47) para traslaciones espaciales. Luego la conservaci
on del momento angular total se
sigue de la invarianza del Lagrangiano ante rotaciones en tres ejes independientes.
N
otese la analoga con las traslaciones espaciales, la invarianza de las ecuaciones de movimiento ante
traslaciones tena como condici
on que las fuerzas fueran constantes y la invarianza del Lagrangiano mismo
nos llevaba a la conservaci
on del momento lineal. En este caso la invarianza rotacional de las ecuaciones de
movimiento requiere torques constantes y uniformes, y la invarianza del Lagrangiano mismo nos lleva a la
conservaci
on del momento angular. Es de anotar que en ambos casos cuando las ecuaciones quedan invariantes
pero no el Lagrangiano, las cantidades conservadas no son el momento lineal o el momento angular sino las
cantidades definidas en (5.46, 5.57).

5.4.4.

Transformaciones de Galileo

Cuando los fen


omenos fsicos se ven desde dos sistemas de referencia inerciales S y S 0 , es necesario conciliar
las observaciones de cada uno, para lo cual es necesario conocer la forma en que se conectan las coordenadas
cartesianas de espacio y tiempo de los dos sistemas en cuesti
on. Las transformaciones de Galileo nos proveen
esa conexi
on.
Asumamos una partcula de masa m con coordenadas xi , t con respecto al sistema de referencia S, y
coordenadas x0i , t0 con respecto al sistema de referencia S 0 . Por simplicidad asumiremos que el sistema S 0 viaja
con velocidad constante v3 a lo largo del eje X3 del sistema S, con lo cual las transformaciones de Galileo se
escriben en la forma siguiente
x01 = x1 ;

x02 = x2 ;

x03 = x3 + v3 t

t0 = t

x1 = x2 = t = 0 ; x3 = x03 x3 = v3 t
para transformaciones infinitesimales (i.e. velocidades relativas infinitesimales) tenemos:
x03 = x3 + (v3 ) t ; (v3 ) = cte
x1 = x2 = t = 0 ; x3 = (v3 ) t
la condici
on para que esta sea una transformaci
on de
aplic
andole las Ecs. (5.59) y (5.43)

n 
X
L
L d
+
xi
xi x i dt
i=1


L
L d
+
(v3 ) t
x3 x 3 dt


V

t + mx 3 (v3 )
x3

(5.59)

simetra, se encuentra tomando de nuevo la Ec. (5.31) y

d
(q, t)
dt

d
(q, t)
dt
n
X

=
x i
xi
t

(5.60)
(5.61)

i=1

escribiendo explcitamente la sumatoria y reorganizando terminos





(v3 ) t + + m (v3 ) +
x 3 +
x 1 +
x 2 = 0
x3
t
x3
x1
x2

(5.62)

en virtud de la independencia de los x i , los coeficientes de x 1 , x 2 , x 3 y los terminos independientes de x i en


(5.62) deben ser nulos, por lo tanto.

=
=0 ;
x1
x2

= m (v3 )
x3

t (v3 ) =
x3
t

(5.63)

de modo que solo es funci


on de x3 y t. Integrando la segunda de las Ecs. (5.63) resulta

mx3 (v3 ) + f (t)

= f (t)
t
dt

(5.64)

DEL TEOREMA DE NOETHER


5.4. EJEMPLOS DE APLICACION

89

y la tercera de las Ecs. (5.63) queda entonces


V
d
t (v3 ) = f (t)
x3
dt
y como

1 d
t dt f

(t) solo depende del tiempo y

V
x3

V
1 d
f (t)
(v3 ) =
x3
t dt

(5.65)

(v3 ) solo del espacio, se tiene que


V
= cte
x3

ya que v3 es constante. La condici


on Fsica requerida para la existencia de es entonces que la componente
F3 de la fuerza sobre la partcula sea constante y uniforme. Con esta condici
on, podemos integrar f
acilmente
(5.65) y se obtiene
V t2
(v3 ) + C
f (t) =
(5.66)
x3 2
reemplazando (5.66) en (5.64)
=


1 V 2
t (v3 ) + C
mx3 +
2 x3

la constante se puede absorber en la cantidad conservada. Nuevamente usamos (5.37) para encontrar la cantidad
conservada y le aplicamos las Ecs. (5.43, 5.59)
n
X
L
xi + (q, t) = ca
x i
i=1

L
x3 + (q, t) = ca
x 3


1 V 2
mx 3 (v3 ) t + mx3 +
t (v3 ) = cb
2 x3
1 V 2
mx 3 t mx3 +
t = c1
2 x3
y la cantidad conservada queda finalmente
1
mx 3 t mx3 F3 t2 = c1
2

(5.67)

De nuevo enfatizamos que F3 debe ser constante. Si adicionalmente, el Lagrangiano L tambien tiene invarianza
traslacional a lo largo de X3 , tendremos que 3 V = F3 = 0, y la cantidad conservada se reduce a:
mx 3 t mx3 = c1

x3 x 3 t = c2 = x3

p3
t
m

el valor de la constante en la u
ltima ecuaci
on se determina f
acilmente haciendo t = 0 y se obtiene
c2 = x3 (0) = x3

p3
t
m

(5.68)

y como F3 = 0, la partcula se mueve con velocidad constante en la direcci


on x3 . Efectivamente, la Ec. (5.68)
describe un movimiento uniforme en la direcci
on de X3 , ya que p3 es constante en virtud de la invarianza
translacional del Lagrangiano a lo largo de X3 . Recordemos que x 3 se refiere a la velocidad de la partcula, en
tanto que v3 o v3 se refiere a la velocidad del sistema S 0 con respecto a S.

CAPITULO 5. SIMETRIAS Y CANTIDADES CONSERVADAS (LAGRANGE)

90

5.5.

Ejercicios

1. Sea L (qi , qi , qi ) un Lagrangiano asociado al formalismo de la sacudida (ver secci


on 4.6). Para este
Lagrangiano definamos una coordenada cclica qk como una coordenada que no aparece en el Lagrangiano,
pero aparece qk y/o qk . Defina una cantidad adecuada (un momento can
onico extendido conjugado a qk )
que sea constante de movimiento cuando qk es cclica. Sugerencia: Observe la ecuaci
on de movimiento
(4.49), cuando est
a asociada a una coordenada cclica.
2. Supongamos que el potencial U de un sistema fsico depende de las velocidades generalizadas. (a) Demuestre que el momento p can
onicamente conjugado a una coordenada global de rotaci
on del sistema
como un todo, viene dada por
N
X
n (ri vi U )
p = L
i=1

donde n es un vector unitario en la direcci


on del eje de rotaci
on y vi es el operador diferencial definido
como

vi ux
+ uy
+ uz
vix
viy
viz
siendo vix la componente x de la velocidad de la iesima partcula, y lo mismo para las otras componentes.
Finalmente, L es el momento angular mec
anico total a lo largo del eje de rotaci
on i.e.
L = n

N
X
i=1

(ri pi )

(b) Aplique estos resultados a un sistema de partculas inmerso en un campo electromagnetico.


3. Una partcula se mueve sobre un aro sin masa de radio R. El aro est
a siempre vertical y gira alrededor de
un eje vertical que pasa por su di
ametro, con velocidad angular constante . Supondremos que las u
nicas
fuerzas exteriores son las de gravedad. (a) Encuentre un Lagrangiano y las ecuaciones de movimiento. (b)
Encuentre posibles constantes de movimiento. (c) Demuestre que si > 0 para un cierto valor crtico
0 , existe una soluci
on tal que la partcula permanece fija en el aro en un punto que no es el m
as bajo.
Pero si < 0 , el u
nico punto estacionario para la partcula es el punto m
as bajo del aro. Encuentre el
valor de 0 .
4. Para el pendulo esferico del problema 4 P
ag. 4. (a) Encuentre los momentos can
onicamente conjugados a
las coordenadas generalizadas que utiliz
o. Alguno de ellos es constante de movimiento?. (b) Encuentre
la funci
on energa, se conserva?, es igual a la energa del sistema?. Recuerde que sus respuestas pueden
depender de las coordenadas generalizadas utilizadas.
5. Demuestre que si existe una funci
on Gi tal que
L
dGi
=
qi
dt

(5.69)

para una coordenada generalizada qi , entonces pi Gi es una constante de movimiento, siendo pi el


momento can
onicamente conjugado a qi . Si Gi existe, Es u
nica?.
6. Sea una carga puntual q no relativista de masa m inmersa en un campo electrico constante y homogeneo
E. Un campo electrico constante y homogeneo E, se puede describir por cualquiera de los siguientes
conjuntos de potenciales
= E r ; A = 0
0

= 0 ; A = Et

(5.70)
(5.71)

5.5. EJERCICIOS

91

correspondientes a diferentes gauges. (a) Tomando la convenci


on (5.70), demuestre que se conserva la
cantidad p qEt, donde p es el vector cuyas componentes son los momentos can
onicamente conjugados a
las coordenadas cartesianas. (b) Demuestre que si tomamos la convenci
on (5.71), la cantidad conservada
es el momento can
onicamente conjugado p. (c) Demuestre que en ambos casos la cantidad conservada se
reduce a mx qEt. Este ejercicio muestra que el momento can
onicamente conjugado a las coordenadas
de una partcula en un campo electromagnetico, as como su contenido fsico pueden depender del gauge.
7. Sea una carga puntual q no relativista de masa m inmersa en un campo magnetico constante y homogeneo
B. Un campo magnetico constante y homogeneo B, se puede describir con los potenciales
A=

1
Br ; =0
2

(5.72)

demuestre que se conserva la cantidad

q
p rB
(5.73)
2
siendo p las componentes de los momentos can
onicamente conjugados. Demuestre que en terminos de la
velocidad, esta cantidad conservada se puede escribir como
mx qr B

(5.74)

8. Una partcula de masa m, se mueve en una dimensi


on sometida a la fuerza
F (x, t) =

k t/
e
x2

donde k y son constantes positivas. Encuentre el Lagrangiano, los momentos conjugados y la funci
on energa. Compare la funci
on energa con la energa total del sistema y encuentre las cantidades
conservadas si las hay.
9. Obtenga el valor de la constante de movimiento asociada a la invarianza galileana Ec. (5.67), en terminos
de las condiciones iniciales de dos maneras: (a) haciendo t = 0 en la Ec. (5.67). (b) Teniendo en cuenta
que F3 es constante de modo que hay un movimiento uniformemente acelerado en X3 , y reemplazando
las expresiones de x3 (t) y x 3 (t) para un movimiento uniformememnte acelerado, en la Ec. (5.67).

Captulo 6

Ecuaciones de Movimiento de Hamilton


La formulaci
on Hamiltoniana no tiene un contentido Fsico nuevo, y no es particularmente ventajosa para
la soluci
on de problemas concretos en mec
anica. El poder de este formalismo consiste en que es f
acilmente
extendible a otras areas de la Fsica, en Mec
anica Cl
asica este formalismo permite desarrollos posteriores como
son la teora de Hamilton Jacobi, la teora de perturbaciones y el caos. Asumiremos ligaduras hol
onomas y
sistemas monogenicos.

6.1.

Consideraciones generales

Dado que las ecuaciones de Lagrange constituyen un conjunto de n ecuaciones diferenciales de segundo
orden, 2n constantes de movimiento se requieren para su completa soluci
on, ellas pueden ser por ejemplo los
valores de las coordenadas y velocidades generalizadas en un cierto tiempo, o el valor de las coordenadas en dos
tiempos distintos. La din
amica del sistema se puede describir con una trayectoria en el espacio n dimensional
de configuraciones, donde el tiempo act
ua como un par
ametro que traza la curva. En este formalismo, hay
una ecuaci
on asociada a cada una de las n coordenadas y su correspondiente velocidad generalizada. En su
forma m
as simple, las ecuaciones requieren que las n coordenadas sean independientes. Para el formalismo
Hamiltoniano, la independencia de las n coordenadas es esencial.
La idea fundamental detr
as del formalismo Hamiltoniano, es la de convertir las n ecuaciones de segundo
orden, en 2n ecuaciones de primer orden. Naturalmente, el n
umero de ecuaciones diferenciales debe duplicarse
puesto que las ecuaciones de primer orden solo requieren una condici
on inicial y el n
umero de condiciones
iniciales totales (2n) debe conservarse. Las 2n ecuaciones diferenciales parciales deben escribirse en terminos
de 2n variables independientes. De esta forma, la descripci
on de la din
amica del sistema se har
a ahora en un
sistema coordenado 2n dimensional (espacio de fase) cuyas coordenadas ser
an las 2n variables independientes.
Es natural aunque no obligatorio, pensar que las primeras n coordenadas sean las coordenadas generalizadas
qk , veremos adicionalmente que las ecuaciones de movimiento quedan altamente simetricas si se eligen como
las otras n coordenadas los momentos can
onicamente conjugados definidos a traves de la ecuaci
on (5.1).
pj

L (q, q,
t)
qj

(6.1)

a las cantidades (qj , pj ) se les conoce como variables can


onicas. La combinaci
on de ecuaciones de primer
orden y variables (q, p) resulta particularmente motivante, puesto que ya se discuti
o que muchas primeras
integrales de movimiento conducen a cantidades conservadas, esto implica que al ser las ecuaciones de Hamilton
de primer orden tales primeras integrales deben aparecer de manera m
as directa1 . Adem
as si una variable qi es
cclica, su momento can
onicamente conjugado es constante y dado que los momentos conjugados son parte del
conjunto de variables independientes, estas constantes aparecen de manera m
as directa en el formalismo.
1

Al ser las ecuaciones de Lagrange de segundo orden, se requiere realizar un proceso de integraci
on para llegar a primeras
integrales, las cuales son de primer orden.

92

6.2. TRANSFORMACIONES DE LEGENDRE

93

En las ecuaciones de Lagrange las variables q, q fueron tratadas todas como independientes, pero cada
ecuaci
on involucraba a q y q.
Dado que ahora queremos escribir un formalismo en terminos de las variables
qk , pk , t, debemos realizar un cambio de variables del conjunto (qk , qk , t) al conjunto (qk , pk , t). Por simplicidad
consideremos primero un Lagrangiano que depende de una sola coordenada generalizada y una sola velocidad
generalizada L (q, q).
Un diferencial de esta funci
on se escribe como
L
L
; v
q
q

dL = u dq + v dq ; u

donde u y v son funciones de q y q.


Para poder escribir con base en esto una funci
on H (q, p), requerimos
escribir un diferencial de esta funci
on en la forma
H
H
; v0
q
p

dH = u0 dq + v 0 dp ; u0

donde u0 , v 0 son funciones de q y p. El procedimiento matem


atico para realizar la transformaci
on de la funci
on
L (Lagrangiano) a la funci
on H (Hamiltoniano), se denomina una transformaci
on de Legendre.

6.2.

Transformaciones de Legendre

Escribiremos el problema en una notaci


on m
as general. Sea f (x, y) de modo que el diferencial de f se
escribe como
f
f
df = u dx + v dy ; u
; v
(6.2)
x
y
queremos cambiar la base de variables de (x, y) a (u, y). Por tanto un diferencial de una funci
on g (u, y) se
escribe en terminos de los diferenciales du y dy. Definamos g como una funci
on de u y de y definida por
g = f ux

(6.3)

escribamos el diferencial de g
dg = df u dx x du = u dx + v dy u dx x du

dg = v dy x du

este diferencial tiene entonces la forma deseada. Las variables x y v son ahora funciones de u y y de la forma
x=

g
g
; v=
u
y

que son los an


alogos de (6.2). Un ejemplo de uso frecuente de la transformaci
on de Legendre en Fsica aparece
en la termodin
amica. Para un gas experimentando un proceso reversible, se puede demostrar que el cambio
diferencial de energa dU se puede escribir como
dU = T dS P dV ; T =

U
U
; P =
S
V

siendo T, S, P, V la temperatura, la entropa, la presi


on y el volumen respectivamente. A partir de la funci
on
energa interna U (S, V ) se puede generar la entalpa H (S, P ), a traves de una transformaci
on de Legendre
H = U + P V dH = dU + P dV + V dP = T dS P dV + P dV + V dP
H
H
dH = T dS + V dP ; T =
; V =
S
P
las energas libres de Helmholtz y de Gibbs, est
an dadas por otras transformaciones de Legendre
F U TS ; G H TS

CAPITULO 6. ECUACIONES DE MOVIMIENTO DE HAMILTON

94

6.3.

Generaci
on del Hamiltoniano y Ecuaciones de Hamilton

La u
nica diferencia importante entre las transformaciones de Legendre arriba descritas y las requeridas
para generar una funci
on de (qk , pk , t), con base en una funci
on de (qk , qk , t), es que en el u
ltimo caso un
n
umero n de variables debe ser transformado. Comencemos por escribir el diferencial total de L
dL =

L
L
L
dqk +
dqk +
dt
qk
qk
t

(6.4)

donde emplearemos de aqu en adelante, convenci


on de suma sobre ndices repetidos. De las ecuaciones de
Lagrange y la definici
on de momento conjugado se tiene


d L
L
p k =
=
(6.5)
dt qk
qk
de modo que (6.4) se escribe como
L
dt
(6.6)
t
La funci
on Hamiltoniana o Hamiltoniano se genera por medio de la siguiente transformaci
on de Legendre
dL = p k dqk + pk dqk +

H (q, p, t) qk pk L (q, q,
t)

(6.7)

la forma diferencial de H se obtiene de su definici


on (6.7) y de la forma diferencial del Lagrangiano (6.6)
dH = pk dqk + qk dpk dL
dH = pk dqk + qk dpk p k dqk pk dqk
dH = qk dpk p k dqk

L
dt
t

L
dt
t
(6.8)

y el diferencial adquiere la forma deseada, puesto que los diferenciales dqk han sido removidos por la transformaci
on de Legendre, y en su lugar aparecen los diferenciales dpk . Puesto que exigiremos que H sea funci
on
exclusiva de las variables (qk , pk , t), el diferencial de H tambien se puede escribir de la forma
dH =

H
H
H
dt
dqk +
dpk +
qk
pk
t

(6.9)

comparando (6.8) con (6.9), y teniendo en cuenta que todas las variables qk , pk son todas independientes entre
s, se obtiene un conjunto de 2n + 1 ecuaciones
qk =
p k =

H
; k = 1, . . . , n
pk
H
; k = 1, . . . , n
qk

(6.10)

L
H
=
(6.11)
t
t
Las Ecs. (6.10), son conocidas como ecuaciones de movimiento de Hamilton, y constituyen el conjunto de
2n ecuaciones de primer orden que se buscaba. El primer conjunto de ecuaciones se puede considerar como el
inverso de las Ecs. (6.1) que definen al momento conjugado, con lo cual se puede pensar que no dan ninguna
informaci
on nueva. Esto es cierto desde el punto de vista de la resoluci
on de problemas, pero dentro del
formalismo ambos conjuntos de ecuaciones tienen gran significado si el Hamiltoniano puede ser conocido de
alguna manera.
Como se puede ver comparando (5.13) con (6.7), la funci
on energa h y el hamiltoniano H son numericamente identicos, pero se usa un smbolo diferente para cada una puesto que h es funci
on de q,q,t
en tanto que
el Hamiltoniano debe ser funci
on exclusiva de q,p,t. El procedimiento para utilizar las ecuaciones de Hamilton
se ve m
as bien laborioso ya que comprende las siguientes etapas

DEL HAMILTONIANO
6.4. ALGORITMO MATRICIAL PARA LA OBTENCION

95

1. Con un conjunto de coordenadas generalizadas independientes se construye el Lagrangiano L (q, q,


t) =
T V
2. Se definen los momentos conjugados a traves de (6.1) como funciones de q,q,t

3. Se usa (6.7) para construir el Hamiltoniano. Sin embargo, la Ec. (6.7) deja al Hamiltoniano como funci
on
mixta de q, q,
p, t
4. Las ecuaciones (6.1) se invierten para obtener q en funci
on de q, p, t. Este proceso de inversi
on presenta
varias dificultades que veremos m
as adelante.
5. Los resultados anteriores se aplican para eliminar las q de H con el fin de expresar esta funci
on u
nicamente
en terminos de q, p, t

6.4.

Algoritmo matricial para la obtenci


on del Hamiltoniano

Afortunadamente, en mucho casos reales es posible abreviar los pasos descritos en la secci
on anterior, gracias
a la caracterstica ya mencionada para muchos Lagrangianos de ser separables en tres terminos homogeneos
de orden cero, uno y dos en las q (ver Ec. 5.15). Recordando que h es numericamente igual a H, retomaremos
el an
alisis realizado en la secci
on 5.2.1, de modo que la Ec. (5.15) conduce a (5.17)
h = H = L2 L0

(6.12)

Tambien aprendimos en la secci


on 5.2.1, que si adem
as las transformaciones que llevan a las coordenadas
generalizadas no dependen explcitamente del tiempo, y las fuerzas derivan de un potencial que no depende
de las q,
la funcion energa (y por tanto el Hamiltoniano), ser
a la energa total
h= H = T +V

(6.13)

Ahora haremos una suposici


on un tanto mas restrictiva (pero suficientemente general) que la que se asume en
(5.15). Asumiremos que el Lagrangiano tiene la estructura
1
L = L0 (q, t) + qi ai (q, t) + qi qk Tik (q, t)
2

(6.14)

En tal caso y teniendo en cuenta la Ec. (6.7), el Hamiltoniano H viene dado por la siguiente prescripci
on
1
H = pn qn L0 (q, t) qi ai (q, t) qi qk Tik (q, t)
2

(6.15)

si se cumple cualquiera de las relaciones (6.12, 6.13, 6.15), los pasos 3 y 4 arriba indicados se abreviaran. En
particular, bajo la suposici
on (6.15), los pasos del 2 al 5 se pueden realizar de una vez al menos formalmente.
Para ello escribiremos (6.14) en forma matricial
e + 1 qT
e q
L (q, q,
t) = L0 (q, t) + qa
2

(6.16)

donde q,
a son matrices columna (no vectores Euclidianos!), T es una matriz n n, que sin perdida de
e es la traspuesta de q.
generalidad se puede tomar como simetrica2 y q
Los elementos de las matrices son en
2

Un termino cuadr
atico en q tpico del Lagrangiano es de la forma M12 q1 q2 . En la suma sobre ndices de qi Tij qj aparecen dos
terminos relacionados con este coeficiente de modo que M12 q1 q2 = (q1 T12 q2 + q2 T21 q1 ) /2 (teniendo en cuenta el factor 1/2 en la
Ec. 6.16). Esto implica que la u
nica restricci
on sobre T es que M12 = (T12 + T21 )/2 . En consecuencia, los elementos de la matriz
se pueden definir de muchas maneras, en particular podemos elegir T12 = T21 = M12 , y lo mismo para los otros coeficientes, en
cuyo caso la matriz ser
a simetrica.

CAPITULO 6. ECUACIONES DE MOVIMIENTO DE HAMILTON

96

general funciones de q y t. La transformaci


on de Legendre que define al Hamiltoniano Ec. (6.15), se puede
escribir matricialmente como


1e
e
e
e
H = qp
L = qp
L0 (q, t) + qa
+ qT
q
2
e q L0 (q, t)
e (p a) 1 qT
(6.17)
H = q
2

derivando (6.14) se obtienen los momentos conjugados




L

1
pn =
=
L0 (q, t) + qi ai (q, t) + qi qk Tik (q, t)
qn
qn
2
1
1
pn = an (q, t) + qk Tnk (q, t) + qi Tin (q, t)
2
2

teniendo en cuenta que la matriz T se eligi


o como simetrica y que los ndices k, i son mudos, se obtiene
pn = an (q, t) + Tnk qk
de modo que los momentos conjugados escritos en forma de matriz columna p est
an dados por
p = Tq + a p a = Tq
invirtiendo esta ecuaci
on
q = T1 (p a)

(6.18)

este paso presupone que existe el inverso de T, lo cual usualmente est


a garantizado por la positividad de la
3
energa cinetica . Transponiendo la ecuaci
on anterior se cumple
e (e
e) T1
q=
pa

(6.19)

donde hemos usado el hecho de que T1 tambien es simetrica. Observese que las expresiones (6.18, 6.19)
permiten reemplazar las q en terminos de los p, q, t ya que a y T solo son funciones de q, t. Es decir hemos
logrado el proceso descrito en el paso 4 de invertir las ecuaciones (6.1). Reemplazando (6.18, 6.19) en el
Hamiltoniano (6.17)

 

1
e) T1 (p a)
(e
pa
(e
pe
a) T1 T T1 (p a) L0 (q, t)
2
1
H = (e
pe
a) T1 (p a) (e
pe
a) T1 (p a) L0 (q, t)
2
1
H =
(e
pe
a) T1 (p a) L0 (q, t)
2
H =

(6.20)

Por lo tanto, si el Lagrangiano se puede escribir en la forma (6.16), el Hamiltoniano se escribe directamente
en la forma (6.20). En el caso m
as usual, la matriz T es diagonal, en cuyo caso el inverso es tambien diagonal
1
1
donde T ii = Tii .

6.4.1.

Hamiltoniano para un cuerpo sometido a una fuerza central en coordenadas esf


ericas

A manera de ejemplo, consideremos el movimiento de un cuerpo bajo una fuerza central en coordenadas
esfericas, calculemos primero la energa cinetica


1
T = m x 2 + y 2 + z 2
2

Tecnicamente, la matriz T es simetrica real y definida positiva. Esto implica que sus valores propios y su determinante son
estrictamente positivos con lo cual la matriz es invertible (ver secci
on 12.11).

DEL HAMILTONIANO
6.4. ALGORITMO MATRICIAL PARA LA OBTENCION

97

para las coordenadas esfericas tenemos


x = r sin cos ; y = r sin sin ; z = r cos
x = r sin cos + r cos cos r sin sin
y = r sin sin + r cos sin + r sin cos
z = r cos r sin


2
v 2 = x 2 + y 2 + z 2 = r sin cos + r cos cos r sin sin

2 
2
+ r sin sin + r cos sin + r sin cos + r cos r sin
v 2 = r 2 sin2 cos2 + r 2 2 cos2 cos2 + r 2 2 sin2 sin2
+2rr
sin cos cos cos 2rr
sin cos sin sin 2r 2 cos cos sin sin
+r 2 sin2 sin2 + r 2 2 cos2 sin2 + r 2 2 sin2 cos2
+2rr
sin sin cos sin + 2rr
sin sin sin cos + 2r 2 cos sin sin cos
+r 2 cos2 + r 2 2 sin2 2rr
cos sin
reorganizando los terminos cuadr
aticos y cruzados se obtiene
v 2 = r 2 sin2 cos2 + r 2 sin2 sin2 + r 2 cos2 + r 2 2 cos2 cos2 + r 2 2 cos2 sin2
+r 2 2 sin2 + r 2 2 sin2 sin2 + r 2 2 sin2 cos2
+2rr
sin cos cos cos + 2rr
sin sin cos sin 2rr
cos sin
2rr
sin cos sin sin + 2rr
sin sin sin cos
2r 2 cos cos sin sin + 2r 2 cos sin sin cos



v 2 = r 2 sin2 cos2 + sin2 + r 2 cos2 + r 2 2 cos2 cos2 + sin2 + r 2 2 sin2


+r 2 2 sin2 sin2 + cos2 + 2rr
sin cos cos2 + sin2 2rr
cos sin



sin cos 2rr
cos sin
v 2 = r 2 sin2 + cos2 + r 2 2 cos2 + sin2 + r 2 2 sin2 + 2rr
v 2 = r 2 + r 2 2 + r 2 2 sin2
y la energa cinetica final es

i
1
1 h
mv 2 = m r 2 + r 2 2 + r 2 2 sin2
2
2

(6.21)

la energa potencial se escribe V (r) de modo que el Lagrangiano tiene la forma


L=T V =


m 2
r + r 2 sin2 2 + r 2 2 V (r)
2

(6.22)

este Lagrangiano se puede descomponer en la forma L = L0 + L1 + L2 , adicionalmente la transformaci


on de
coordenadas cartesianas a esfericas no depende explcitamente del tiempo y el potencial no depende de las q
ni del tiempo, por tanto el Hamiltoniano es la energa total y adem
as se conserva. Claramente, el Lagrangiano
(6.22), posee la siguiente estructura


= T
L2 = T2 r,
,

; L1 = 0 ; L0 = V (r)

(6.23)

98

CAPITULO 6. ECUACIONES DE MOVIMIENTO DE HAMILTON

por lo tanto el Hamiltoniano tiene la forma (6.12). En arreglo matricial, el Lagrangiano (6.22) se escribe

r
m
0
0
 0

1
L = V (r) + r 0 +
0
r 0 mr 2 sin2
2
0
0
0
mr 2

comparando con (6.16) resulta


1
0
m
0
0
m
L0 = V ; a = 0 ; T = 0 mr 2 sin2
0 ; T1 = 0
0
0
mr 2
0
0

0
1
mr 2 sin2

0
0
1
mr 2

reemplazando estas expresiones en (6.20)


1
1
e T1 p + V (r) =
H= p
2
2

pr p p

1
m

0
0

0
1
mr 2 sin2

0
0
1
mr 2

(6.24)

pr
p + V (r)
p

Finalmente, el Hamiltoniano de una partcula sometida a una interacci


on central definida por el potencial
V (r), se escribe en coordenadas esfericas de la forma
!
2
2
p
p
1

H=
p2r + 2 2 + 2 + V (r)
(6.25)
2m
r sin r
si reescribimos el problema en coordenadas cartesianas, el Hamiltoniano tiene otra forma funcional

m
pi pi
T = x i x i H (xi , pi ) =
+ V ( xi xi )
2
2m
escribiendo los momentos conjugados pi en un arreglo en forma de matriz columna queda

pp
H (xi , pi ) =
+ V ( xi xi )
2m
las componentes de p se pueden tomar relativos a cualquier sistema coordenado que deseemos. Pero es importante no confundir pk con la componente kesima de p. Por ejemplo p 6= (p) , el primero tiene dimensiones
de momento angular y el segundo tiene dimensiones de momento lineal. De aqu en adelante, cuando se use
un vector para representar a un momento conjugado, se referir
a a momentos conjugados a coordenadas cartesianas de posici
on, a menos que se indique lo contrario (recordemos que en general las nuplas de pk no
forman vectores euclidianos al igual que en el caso de las qk ).

6.4.2.

Hamiltoniano de una carga no relativista inmersa en un campo electromagn


etico

Como un segundo ejemplo consideremos una carga no relativista inmersa en un campo electromagnetico,
el Lagrangiano se escribe

1
1
L =
mv 2 q + qA v = m x 2 + y 2 + z 2 + qAx x + qAy y + qAz z q
2
2


x
 Ax
 m 0 0
1
= q + q x y z Ay +
x y z 0 m 0 y
2
Az
0 0 m
z

de nuevo comparando con (6.16) resulta

qAx
m
L0 = q ; a = qAy ; T = 0
qAz
0

px qAx
1/m
0
p a = py qAy ; T1 = 0
1/m
pz qAz
0
0

0 0
m 0 = m1
0 m

0
1
0 =
m
1/m


6.5. FORMA SIMPLECTICA
DE LAS ECUACIONES DE HAMILTON

99

y reemplazando en (6.20)
H =
H =
H =

1
1
e) T1 (p a) L0 =
(e
pa
2
2

px qAx py qAy

1
(pi qAi ) (pi qAi ) + q
2m
1
(p qA)2 + q
2m

qA
x
x
 1
py qAy + q
pz qAz
m
pz qAz
(6.26)

donde el momento can


onicamente conjugado p ya haba sido calculado en la secci
on 5.1, Ec. (5.2), P
ag. 70
pi = mx i + qAi

(6.27)

de modo que el Hamiltoniano en terminos de la velocidad (o m


as bien la funci
on energa), queda
h=H=

mx 2
+ q = T + q
2

n
otese que en este caso el potencial tiene un termino lineal en las velocidades de modo que el Hamiltoniano no
corresponde a T + U . Sin embargo, en este caso particular el Hamiltoniano a
un corresponde a la energa total,
ya que el termino magnetico, que es el que rompe la condicion para que H = T + U , no produce trabajo4 y
la energa potencial (entendida como la capacidad para realizar trabajo) depende solo de . De lo anterior se
deduce que la condici
on H = T + U es suficiente pero no necesaria para que H sea la energa del sistema.

6.5.

Forma Simpl
ectica de las Ecuaciones de Hamilton

Las ecuaciones de Hamilton


qk =
p k =

H
; k = 1, . . . , n
pk
H
; k = 1, . . . , n
qk

(6.28)

son muy simetricas excepto por un cambio de signo al intercambiar el papel de las variables can
onicas qk pk .
Una estrategia muy fructfera para llegar a ecuaciones m
as simetricas es el uso de las ecuaciones de Hamilton
en notaci
on simplectica. Para un sistema con n grados de libertad, construmos una matriz columna con 2n
elementos y definida por
i = qi , i+n = pi ; i n
(6.29)
similarmente la matriz columna H
tiene elementos




H
H
H
H
=
;
=
; in
i
qi
i+n
pi

finalmente definamos una matriz J de dimension 2n 2n






0 1
0 1
e
J
; J
1 0
1 0

(6.30)

(6.31)

donde cada elemento representa una submatriz n n. Es f


acil verificar las siguientes propiedades para J
e = JJ
e =1 ; J
e = J = J1
JJ
J2 = 1 ; det J = +1

(6.32)

4
N
otese que la noci
on de potencial generalizado se cre
o como un artificio para poder absorber en el Lagrangiano la informaci
on
fsica contenida en ciertas fuerzas, pero no como artificio para calcular trabajo que es la forma en que surgen los potenciales que
solo dependen de la posici
on y est
an asociados a la energa de la partcula.

CAPITULO 6. ECUACIONES DE MOVIMIENTO DE HAMILTON

100

las ecuaciones de Hamilton (6.10) se pueden escribir entonces de forma compacta, as


= J

(6.33)

por ejemplo, para dos coordenadas las ecuaciones de Hamilton son


q1 =

H
H
H
H
, q2 =
; p 1 =
; p 2 =
p1
p2
q1
q2

la matriz columna , y la matriz J seran

q1
q2
=
p 1
p 2
es claro que

0
0
0
0
; J=
1 0
0 1


q1
0
0
q2 0
0


p 1 = 1 0
p 2
0 1

sustituyendo las Ecs. (6.34) en (6.35),

q1
q2

p 1
p 2

nos queda

0
0
0
0
=
1 0
0 1

1
0
0
0

1
0
0
0

1
0
0
0

(6.34)

0
1

0
0

0
p 1
p 2
1

0 q1
q2
0

H/q1
0
H/q2
1

0 H/p1
0
H/p2

(6.35)

(6.36)

y teniendo en cuenta la notaci


on definida en (6.30), es claro que las Ecs. (6.36), son la forma explcita de
las ecuaciones de Hamilton (6.33) en estructura simplectica, para dos coordenadas generalizadas. Esta forma
matricial simplectica de las ecuaciones de Hamilton, sera muy utilizada en lo que sigue. La palabra simplectico
significa entrelazado, efectivamente la ecuaciones de Hamilton entrelazan a q y p y tal entrelazamiento en
la parametrizaci
on (6.33) se produce gracias a los elementos fuera de la diagonal de la matriz J en la Ec.
(6.31). N
otese adem
as que la matriz J definida en la Ec. (6.31), absorbe el cambio de signo que se produce
en las ecuaciones de Hamilton al intercambiar qk pk . Esto lo hace gracias a la diferencia de signo entre las
submatrices de J. Esta absorci
on del cambio de signo es lo que le da una apariencia m
as simetrica a las
ecuaciones de Hamilton simplecticas, con respecto a las ecuaciones de Hamilton normales.

6.6.

Coordenadas cclicas y teoremas de conservaci


on

En el formalismo Lagrangiano hemos definido una coordenada cclica o ignorable como aquella coordenada
generalizada que no aparece en el Lagrangiano, pero s aparece su velocidad generalizada correspondiente. Vimos que para este tipo de coordenadas su momento can
onicamente conjugado es una constante de movimiento.
De la transformaci
on de Legendre que define a H, Ec. (6.7), tenemos que
H=

L
qk L (q, q,
t)
qk

y claramente una coordenada cclica no aparece al lado derecho de esta ecuaci


on, mostrando que una coordenada
cclica tampoco aparece en el Hamiltoniano5 . Por otro lado, a partir de las Ecs. (6.5) y (6.28) se encuentra que
p j =
5

L
H
=
qj
qj

(6.37)

Debe a
nadirse que al escribir el Hamiltoniano en sus argumentos finales q, p, t; una coordenada cclica tampoco aparece, ya
que al invertir las Ecs. (6.1), las qi tampoco depender
an de una variable cclica.

6.7. EL HAMILTONIANO EN DIFERENTES SISTEMAS COORDENADOS

101

de aqu se deduce que una coordenada generalizada est


a ausente en el Hamiltoniano si y solo si est
a ausente en el
Lagrangiano. En consecuencia, si cierta coordenada generalizada est
a ausente de H, su momento can
onicamente
conjugado ser
a constante de movimiento. Por tanto, las constantes de movimiento asociadas a variables cclicas
aparecen de inmediato como se anticip
o debido a que las ecuaciones son de primer orden y que los momentos
conjugados se tomaron como coordenadas independientes. Esto significa que los teoremas de conservaci
on que
se derivaron en la secci
on 5.1 se pueden derivar de la formulaci
on Hamiltoniana, as como la conecci
on entre
simetras del sistema y constantes de movimiento. En particular, la invarianza ante traslaciones del sistema
como un todo en cierta direcci
on conduce a la conservaci
on de la componente del momento lineal del sistema
en esa direcci
on, esta coordenada de traslaci
on no aparece en H. La invarianza ante una rotaci
on con respecto
a cierto eje hace que dicha coordenada generalizada de rotaci
on (
angulo), no aparezca en el Hamiltoniano y
lleva a la conservaci
on de la componente del momento angular total a lo largo del eje de rotaci
on.
Cuando trabajamos la funci
on energa en la secci
on 5.2, vimos que si L no es funci
on explcita del tiempo,
h es una constante de movimiento. Naturalmente, esto es tambien v
alido para H. Con el fin de probar la
consistencia de esta aseveraci
on llegaremos a la misma conclusi
on por otro camino: Tomando la derivada total
de H con respecto al tiempo
dH
H
H
H
=
qi +
p i +
dt
qi
pi
t
usando las Ecs. de Hamilton (6.10), se eliminan los dos primeros terminos de la derecha, y utilizando (6.11)
resulta
dH
H
L
=
=
dt
t
t

(6.38)

de aqu resulta que t no aparece explcitamente en el Lagrangiano (t L = 0) si y solo si, no aparece explcitamente en el Hamiltoniano (t H = 0). En consecuencia, cuando t no aparece explcitamente en el Hamiltoniano,
tenemos que H ser
a una constante de movimiento (dH/dt = 0)6 . Recordemos que la conservaci
on de h (y H)
no significa necesariamente que esta funci
on coincida con la energa total del sistema.
Por otro lado, tambien se vi
o en la secci
on 5.2 que la funci
on h (y por tanto H) es la energa total del sistema
si se cumplen las siguientes condiciones: (a) El Lagrangiano es expresable en la forma L = L0 + L1 + L2 siendo
cada sumando una funci
on homogenea de grado cero uno y dos en las qi (b) las transformaciones que definen las
coordenadas generalizadas Ecs. (2.5) no dependen explcitamente del tiempo, y (c) el potencial es independiente
de las velocidades generalizadas. Si el potencial depende explcitamente del tiempo, entonces la energa del
sistema (el Hamiltonino) no es una constante de movimiento, pero si adem
as de las anteriores condiciones
ocurre que el potencial no depende explcitamente del tiempo, la energa del sistema (el Hamiltoniano) es una
constante de movimiento.

6.7.

El Hamiltoniano en diferentes sistemas coordenados

La anterior discusi
on muestra que la identificaci
on de H como la energa del sistema o como constante
de movimiento son dos cosas aparte, aunque no necesariamente excluyentes. Otro aspecto discutido en la
secci
on 5.2 es la dependencia tanto funcional como numerica de h con respecto a la escogencia del sistema
de coordenadas generalizadas. Lo mismo ocurre para H. Es posible por ejemplo, que para una escogencia de
coordenadas H se conserve, en tanto que con otra escogencia el nuevo H 0 no se conserve. Por otro lado, es
plausible que el Hamiltoniano en cierto sistema coordenado corresponda a la energa del sistema, en tanto que
en otro sistema coordenado no lo sea. Esta es una de las diferencias mas fundamentales entre H y L, ya que
este u
ltimo cambia en forma funcional pero no en magnitud, cuando se hace un cambio a otras coordenadas
generalizadas. Ilustraremos las anteriores consideraciones con un ejemplo.

CAPITULO 6. ECUACIONES DE MOVIMIENTO DE HAMILTON

102

Figura 6.1: Sistema masa resorte donde el resorte se ata a un carro que viaja a velocidad constante.

6.7.1.

Hamiltoniano de un sistema masa resorte en diferentes sistemas coordenados

Veamos un ejemplo un tanto academico que muestra claramente la dependencia del Hamiltoniano con las
coordenadas generalizadas elegidas: Sea una partcula atada a un resorte cuyo extremo est
a sujeto a un carro
que se mueve con velocidad constante v0 como muestra la figura 6.1. La masa descansa sobre una superficie
sin rozamiento. Tomemos como coordenada generalizada la posici
on x de la partcula en cualquier instante.
Por simplicidad asumimos que en t = 0 el resorte tiene longitud cero y que la masa (y el punto O 0 de uni
on
del resorte con el carro) pasan por el origen en ese instante. El Lagrangiano se escribe
L (x, x,
t) = T V =

mx 2 k
(v0 t x)2 m
x = k (x v0 t)
2
2

una forma de resolver el problema es cambiar a una variable x0


x0

x v0 t
0

m
x = kx

(6.39)
0

(6.40)

donde x0 es el desplazamiento de la partcula medido desde el punto O 0 . La Ec. (6.40) nos dice que el sistema
de referencia asociado al carro m
ovil ve un movimiento arm
onico simple como se espera del principio de
equivalencia de Galileo7 .
Veamos ahora la formulaci
on Hamiltoniana. En terminos de la variable x vemos que la transformaci
on
(identidad) a coordenadas generalizadas no depende explcitamente del tiempo, el Lagrangiano se puede descomponer en la forma L = L0 + L1 + L2 y adem
as el potencial no dependen de la velocidad generalizada x.

Por tanto, el Hamiltoniano es la energa total del sistema y queda


H (x, p, t) = T + V =

p2
k
+ (x v0 t)2
2m 2

sin embargo H no es una cantidad conservada puesto que depende explcitamente del tiempo. Esto es fsicamente entendible ya que un agente externo debe proveer de energa al sistema para que el carro viaje a
velocidad constante en contra de la reacci
on de la partcula.
6
Esto se debe a su vez a la propiedad particular de H (o de h), de que su derivada parcial temporal coincide con su derivada
temporal total. En este caso, hemos probado esta aseveraci
on como una consecuencia de las ecuaciones de Hamilton.
7
De la Ec. (6.39) vemos que para el caso particular de la Fig. 6.1, la variable x0 es negativa, puesto que v0 t x 0.

DE LAS ECUACIONES DE HAMILTON


6.8. PROBLEMAS DE APLICACION

103

Ahora formulemos el Lagrangiano haciendo una transformaci


on de la coordenada x a la coordenada x0 Ec.
(6.39). El Lagrangiano queda
L =
L x0 , x 0 , t

2
d 0

2
(x + v0 t)
m dt
k
k 0
2
(x v0 t) =

x + v0 t v0 t
2
2
2
2
2
m [x 0 + v0 ]2 k 02 mx 02
mv
k
0
x =
+ mv0 x 0 +
x02
2
2
2
2
2
m


dx 2
dt

(6.41)

escribiendo el Lagrangiano de acuerdo con la estructura (6.16) en donde las matrices son 1 1 tenemos
L x0 , x 0 , t

L0 =

mv02 k 02
1
x + mv0 x 0 + x 0 mx 0
2
2
2
mv02 k 02
x ; a = mv0 ; T = m
2
2

(6.42)

el nuevo Hamiltoniano se obtiene reemplazando (6.42) en (6.20)


H 0 x0 , p 0 , t
H 0 x0 , p 0 , t




=
=



 1 0
 k
1 0
1 0
mv02
p a T 1 p0 a L0 =
p mv0
p mv0 + x02
2
2
m
2
2
(p0 mv0 )2 kx02 mv02
+

2m
2
2

La Ec. (6.41) nos indica que el Lagrangiano escrito en el nuevo sistema coordenado, posee un termino lineal
on a coordenadas generalizadas depende explcitamente del tiempo seg
un
en x 0 . Por otro lado, la transformaci
se ve en la Ec.(6.39). Esto indica que H 0 ya no es la energa total del sistema. En cambio, s es una constante
de movimiento ya que no depende explcitamente del tiempo y H 0 /t = dH 0 /dt = 0. Por otro lado, se
puede notar que el termino mv02 /2 es una constante que se puede remover tanto del Lagrangiano como del
Hamiltoniano, sin afectar las ecuaciones de movimiento. Finalmente, se puede ver que excepto por tal termino
constante, H 0 se puede identificar con la energa total de movimiento de la partcula relativa al carro m
ovil.
Ambos Hamiltonianos difieren en magnitud, forma funcional y dependencia temporal. Sin embargo, se puede
verificar que ambos conducen al mismo movimiento de la partcula.
Con lo anterior podra quedar la sensaci
on de que hemos cambiado de sistema de referencia en virtud de
0
que x es la coordenada que medira el sistema del carro m
ovil (lo llamaremos sistema S 0 ) y H 0 sera la energa
total relativa a dicho sistema tambien. No obstante, la coordenada x0 es medida por el sistema original fijo a
tierra (lo llamaremos S), esto se puede ver en la forma en que se construye el Lagrangiano Ec. (6.41), tanto la
energa cinetica como la potencial se siguen midiendo con respecto al sistema S aunque se escriban en terminos
de la coordenada x0 . Efectivamente, ante un cambio de sistema de coordenadas el Lagrangiano preserva su
magnitud (aunque no su forma funcional). En contraste, ante un cambio de sistema de referencia tanto la
magnitud como la forma funcional del Lagrangiano pueden cambiar. El Hamiltoniano H 0 se construy
o usando
el Lagrangiano (6.41) de modo que tambien est
a asociado al sistema S. Las interpretaciones como coordenada
relativa a S 0 y energa relativa a S 0 son una forma de ver a estas cantidades, pero no han sido construdas en
este sistema de referencia. Nuevamente se insiste en no confundir un cambio de sistema de referencia con un
cambio de sistema de coordenadas generalizadas.

6.8.
6.8.1.

Problemas de aplicaci
on de las ecuaciones de Hamilton
Partcula sobre superficie cilndrica

Una partcula est


a sujeta a moverse sobre una superficie cindrica definida por x2 + y 2 = R2 , y est
a sujeta
a una fuerza que siempre apunta hacia el origen y proporcional a la distancia de la partcula al origen, i.e.
F = kr.

CAPITULO 6. ECUACIONES DE MOVIMIENTO DE HAMILTON

104

Figura 6.2: Partcula restringida a moverse sobre una superficie cilndrica.


Tomaremos las coordenadas generalizadas z y indicadas en la figura 6.2. Su relaci
on con las coordenadas
cartesianas es
x = R cos
, y = R sin
sin , y = R
cos
x = R

z=z

(6.43)

z = z

(6.44)

La partcula est
a sometida a la fuerza restauradora y la fuerza de ligadura que la mantiene sobre la superficie
cilndrica. Por supuesto, solo la fuerza restauradora contribuye a la energa potencial, la cual viene dada por
V0 =
V

 1

1 2 1
kr = k x2 + y 2 + z 2 = k R2 + z 2
2
2
2
1 2
kz
2

donde hemos suprimido el termino constante (1/2) kR2 obteniendo una energa potencial equivalente. La

DE LAS ECUACIONES DE HAMILTON


6.8. PROBLEMAS DE APLICACION

105

energa cinetica es
T


 1 
1
m x 2 + y 2 + z 2 = m 2 R2 sin2 + 2 R2 cos2 + z 2
2
2

1  2 2
m R + z 2
2

el Lagrangiano queda en la forma

 1
1  2 2
m R + z 2 kz 2 = L0 + L1 + L2
2
2

1  2 2
, L1 = 0 , L2 = m R + z 2
2

L = T V =

1
L0 = kz 2
2

la transformaci
on de coordenadas (6.43) no depende explcitamente del tiempo, el Lagrangiano se puede
descomponer en la forma L0 + L1 + L2 , y el potencial no depende de las velocidades generalizadas. Por tanto
la funci
on energa es la energa del sistema
 1
1 
h = T + V = m R2 2 + z 2 + kz 2
2
2

para encontrar el Hamiltoniano en los argumentos adecuados, podemos en este caso invertir directamente las
ecuaciones (6.1), ya que
p =
=

L
L
= mz
= mR2 , pz =

p
pz
; z =
2
mR
m

(6.45)

sustituyendo estas expresiones en la funci


on energa, obtenemos el Hamiltoniano
 

p 2  pz 2
1
1
m R2
+
+ kz 2
H =
2
mR2
m
2
"
#
p2
1
1
H =
+ p2z + kz 2
2
2m R
2
el Hamiltoniano no depende explcitamente del tiempo y por tanto la energa de la partcula se conserva. Las
ecuaciones de Hamilton nos dan
p
H
H
= 0 , =
=

p
mR2
H
H
pz
=
= kz , z =
=
z
pz
m

p =

(6.46)

p z

(6.47)

N
otese que las ecuaciones de Hamilton para y z son las mismas ecuaciones (6.45) de definici
on de los

momentos conjugados. Las dos ecuaciones (6.46) asociadas a p y tienen soluci


on inmediata, debido al
caracter cclico de la coordenada
p = mR2 = c0
(6.48)
de modo que el momento angular con respecto al eje Z se conserva, esto a su vez proviene del hecho de que el
problema es invariante ante una rotaci
on alrededor de dicho eje, puesto que es un eje de simetra del sistema.
Equivalentemente, la velocidad angular de giro alrededor del eje z es constante. Integrando la ecuaci
on (6.48)
se obtiene (t)

c0
t
+

;
c
=
p
=
(6.49)
(t) =
0
0

mR2
mR2

CAPITULO 6. ECUACIONES DE MOVIMIENTO DE HAMILTON

106

Derivando la segunda de las Ecs. (6.47) obtenemos p z = m


z , y reemplzando esto en la primera de las Ecs.
(6.47) queda
k
z + 02 z = 0 ; 02
(6.50)
m
la proyecci
on del movimiento sobre Z es entonces arm
onica simple con frecuencia angular 0 . Es claro de
las ecuaciones (6.49, 6.50) que las constantes de integraci
on se obtienen conociendo condiciones iniciales tales

como (0) , (0) , z (0) , z (0). Equivalentemente puede ser el conjunto (0) , p , z (0) , pz etc.

6.8.2.

Ejemplo de aplicaci
on del algoritmo matricial

Supongamos que cierto sistema fsico viene descrito por el Lagrangiano


L = kq12 +

q22
+ k1 q12 + k2 q1 q2
a + bq12

(6.51)

donde a, b, k1 , k2 y k son constantes. Encontraremos el Hamiltoniano asociado. Para ello, emplearemos el


algoritmo matricial descrito en la secci
on 6.4, observando primero que el Lagrangiano tiene la estructura
matricial dada por la Ec. (6.16)
e + 1 qT
e q
L (q, q,
t) = L0 (q, t) + qa
(6.52)
2
como se puede ver al escribir el Lagrangiano (6.51) en la forma
L=

k1 q12

1
+
2

q1 q2

2k
k2

k2

2
a+bq12

!

q1
q2

(6.53)

comparando las ecuaciones (6.52, 6.53) se tiene que8


L0 = k1 q12

; a=0 ;

2k
k2

T=

k2

2
a+bq12

(6.54)

para un Lagrangiano con la estructura (6.52), el Hamiltoniano viene dado por (6.20)
H (q, p, t) =
por tanto, debemos calcular T1

T1 =

1
(e
pe
a) T1 (p a) L0 (q, t)
2
2

4kbk22 q12 ak22


bk2 q12 +ak2
bk22 q12 +ak22 4k

bk2 q12 +ak2


bk22 q12 +ak22 4k
2k (bq12 +a)
4kbk22 q12 ak22

(6.55)

(6.56)

sustituyendo (6.54, 6.56) en la Ec. (6.55), el Hamiltoniano queda

H (q, p, t) =

H (q, p, t) =

1
1
e T1 p k1 q12 =
p
2
2

p1 p2

bk2 q12 +ak2


bk22 q12 +ak22 4k
2k (bq12 +a)
4kbk22 q12 ak22

ak2 + bk2 q12 p1 p2

ak22 + bk22 q12 4k

4kbk22 q12 ak22


bk2 q12 +ak2
bk22 q12 +ak22 4k


k a + bq12 p22
p21
+
+
4k ak22 bk22 q12 4k ak22 bk22 q12

se deja como ejercicio al lector escribir las ecuaciones de Hamilton.

k1 q12

p1
p2

k1 q12
(6.57)

DE LAS ECUACIONES DE HAMILTON


6.8. PROBLEMAS DE APLICACION

107

Figura 6.3: Pendulo simple cuyo punto de suspensi


on est
a restringido a moverse sobre una par
abola z = ax2 .
La posici
on del punto de suspensi
on del pendulo est
a dada por las coordenadas (x, z) , en tanto que la posici
on
de la lenteja est
a dada por las coordenadas (x0 , z 0 ).

6.8.3.

P
endulo sujeto a una recorrido parab
olico

El punto de suspensi
on de un pendulo simple de longitud l y masa m est
a restringido a moverse sobre una
par
abola z = ax2 en el plano vertical, como lo indica la figura 6.3. Encontraremos el Hamiltoniano de dicho
pendulo y las ecuaciones de movimiento de Hamilton asociadas.
El punto de suspensi
on del pendulo se denota por las coordenadas (x, z), y la posici
on de la lenteja por las
coordenadas (x0 , z 0 ). De la Figura 6.3 es claro que

con lo cual

x0 = x + l sin ; z 0 = z l cos = ax2 l cos

(6.58)

x 0 = x + l cos ; z 0 = 2axx + l sin

(6.59)

las Ecs. (6.58) nos sugieren utilizar a x y , como coordenadas generalizadas9 . La energa cinetica y potencial
de la lenteja est
an dadas por

T
V


2 
2 
1
1
02
02
=
m(x + z ) = m x + l cos + 2axx + l sin
2
2

0
2
= mgz = mg ax l cos

donde hemos usado las Ecs. (6.59, 6.58). El Lagrangiano queda


8

N
otese que la elecci
on
T=

2k
0

2k2
2
2
a+bq1

en las Ecs. (6.54, 6.53), hubiese conducido al mismo Lagrangiano. Sin embargo, en tal caso la matriz T no sera simetrica, lo cual
fue una hip
otesis fundamental en los desarrollos de la secci
on 6.4.
9
De la Figura 6.3, se observa que se puede mover sin mover x y sin violar las ligaduras (moviendo con el punto de suspensi
on
fijo). As mismo, se puede mover la coordenada x manteniendo fijo y respetando las ligaduras. Esto se logra moviendo el punto
de suspensi
on a lo largo de la par
abola manteniendo fijo, es decir con una traslaci
on paralela de la cuerda.

CAPITULO 6. ECUACIONES DE MOVIMIENTO DE HAMILTON

108


1  2
m x + 2lx cos + 4a2 x2 x 2 + 4alxx sin + l2 2 mg(ax2 l cos )
2
i

1 h
(cos + 2ax sin ) + l2 2
L = mg(ax2 l cos ) + m x 2 1 + 4a2 x2 + 2x l
2
L =

este Lagrangiano se puede escribir en estructura matricial de la forma


 


1
x
m(1 + 4a2 x2 )
ml(cos + 2ax sin )
2

L = mg(ax l cos ) +
x
2
ml(cos + 2ax sin )
ml

que al comparar con (6.52) nos da


2

L0 = mg(ax l cos ) ; a = 0 ; T =

m(1 + 4a2 x2 )
ml(cos + 2ax sin )
ml(cos + 2ax sin )
ml2

(6.60)

ahora debemos calcular T1 para lo cual usamos



1


1
a b
d b
1
T =
=
c d
ad bc c a
tenemos que
ad bc = m2 l2 (1 + 4a2 x2 ) m2 l2 (cos + 2ax sin )2 = m2 l2 (sin2 + 4a2 x2 4ax cos sin 4a2 x2 sin2 )
ad bc = m2 l2 (sin2 4ax sin cos + 4a2 x2 cos2 ) = m2 l2 (sin 2ax cos )2 m2 l2 Y

con lo cual la inversa de T queda


T1 =
T1 =



1
ml2
ml(cos + 2ax sin )
ml(cos + 2ax sin )
m(1 + 4a2 x2 )
m2 l 2 Y


1
1
(cos + 2ax sin )/l
(cos + 2ax sin )/l
(1 + 4a2 x2 )/l2
mY

escribiremos T1 como
T

1
mY

1
J

J
(1 + 4a2 x2 )/l2

(cos + 2ax sin )/l

Y (sin 2ax cos )2

(6.61)

reemplazando (6.60, 6.61) en (6.55) obtenemos el Hamiltoniano






1
1
1
J
px
e T1 p L0 (q, t) =
H (q, p, t) =
p
px p
+ mg(ax2 l cos )
J (1 + 4a2 x2 )/l2
p
2
2mY
!
px Jp

1
=
px p
+ mg(ax2 l cos )
(1+4a2 x2 )p
2mY
Jpx +
l2


 
2
2
1
1 + 4a x
=
p2x 2Jp px +
p2 + mg(ax2 l cos )
2mY
l2
reemplazando las definiciones de J y Y el Hamiltoniano queda




 
cos + 2ax sin
1 + 4a2 x2
1
2
H (x, , px , p ) =
px 2
p px +
p2 +mg(ax2 l cos )
l
l2
2m (sin 2ax cos )2
(6.62)

DE LAS ECUACIONES DE HAMILTON


6.8. PROBLEMAS DE APLICACION

109

Es f
acil ver que este Hamiltoniano es la energa del sistema y se conserva. Este Hamiltonainao no tiene
coordenadas cclicas para el sistema coordenado elegido. Escribiremos ahora las ecuaciones de Hamilton dadas
por
H
H
H
H
x =
; p =
; =
; p x =
px
p
x

las dos primeras nos dan


x =
=



1
cos + 2ax sin
p
px
m(sin 2ax cos )2
l


 
1 + 4a2 x2
1
p

(cos

+
2ax
sin
)
p
+
x
ml(sin 2ax cos )2
l

(6.63)
(6.64)

las otras son son un poco m


as extensas de calcular comencemos con


H
8a2 x 2
1
4a sin
p x =
p
+
p
=
p
x
x
2m(sin 2ax cos )2
l
l2




 
cos + 2ax sin
1 + 4a2 x2
2(2a cos )
2
p 2
p px +
p2 + 2mgax
+
2m(sin 2ax cos )3 x
l
l2
agrupando los terminos de p2x , p2 y px p nos queda
p x

p x


2a cos 1 + 4a2 x2
4a2 x
2a cos
2
=
p +
p2 +
p2
2
2
2
3
ml (sin 2ax cos )
ml (sin 2ax cos )
m(sin 2ax cos )3 x
2a sin
4a cos (cos + 2ax sin )

p px
p px + 2mgax
2
ml(sin 2ax cos )
ml(sin 2ax cos )3
"
#
4a2 x(sin 2ax cos ) + 2a cos 1 + 4a2 x2
2a cos
=
p2 +
p2
ml2 (sin 2ax cos )3
m(sin 2ax cos )3 x


2a sin (sin 2ax cos ) + 4a cos (cos + 2ax sin )

p px + 2mgax
ml(sin 2ax cos )3
2a(cos + 2ax sin ) 2
2a cos
2
=
3 p +
3 px
2
ml (sin 2ax cos )
m (sin 2ax cos )

2
2a sin 2 2ax cos sin
+
p px + 2mgax
ml (sin 2ax cos )3

resultando finalmente



2a l2 cos p2x + (cos + 2ax sin ) p2 + l sin2 2 2ax sin cos px p
p x =
2mgax
ml2 (2ax cos sin )3

(6.65)

de una manera similar obtenemos la cuarta ecuaci


on de Hamilton


H
1
2 sin 4ax cos
p =
=
p px

l
2m (sin 2ax cos )2




 

cos + 2ax sin
1 + 4a2 x2
2(cos + 2ax sin )
2
2
+ px 2
p px +
p
+ mgl sin
l
l2
2m (sin 2ax cos )3
p




(cos + 2ax sin ) 2
1 + 4a2 x2
(cos + 2ax sin )
=
px +
p2
l2
m (sin 2ax cos )3
m (sin 2ax cos )3




sin 2ax cos
cos + 2ax sin
(cos + 2ax sin )
+
+2
p px + mgl sin
l
ml (sin 2ax cos )2
m (sin 2ax cos )3

CAPITULO 6. ECUACIONES DE MOVIMIENTO DE HAMILTON

110
p =

2
 2
1
2
2 2
3 l (cos + 2ax sin ) px + (cos + 2ax sin ) 1 + 4a x p
2ax cos )
h
i
o
l (sin 2ax cos )2 + 2 (cos + 2ax sin )2 p px mgl sin
ml2 (sin

y se obtiene finalmente
p =

2
 2
1
2
2 2
3 l (cos + 2ax sin ) px + (cos + 2ax sin ) 1 + 4a x p
2ax cos )
h
i
o
l (2ax sin + cos )2 + 1 + 4a2 x2 p px mgl sin
ml2 (sin

(6.66)

reuniendo las ecuaciones (6.63, 6.64, 6.65, 6.66) obtenemos las ecuaciones de Hamilton para el pendulo cuyo
punto de suspensi
on se mueve a lo largo de la par
abola z = ax2


1
cos + 2ax sin
p
x =
px
(6.67)
m(sin 2ax cos )2
l


 
1 + 4a2 x2
1

(cos

+
2ax
sin
)
p
+
p
(6.68)
=
x
ml(sin 2ax cos )2
l



2a l2 cos p2x + (cos + 2ax sin ) p2 + l sin2 2 2ax sin cos px p
2mgax (6.69)
p x =
ml2 (2ax cos sin )3
2
 2
1
2
2 2
p =
3 l (cos + 2ax sin ) px + (cos + 2ax sin ) 1 + 4a x p
2
ml (sin 2ax cos )
h
i
o
l (2ax sin + cos )2 + 1 + 4a2 x2 p px mgl sin
(6.70)

6.9.

Procedimiento de Routh

Hemos mencionado que la formulaci


on Hamiltoniana no es en general adecuada para la soluci
on directa de
problemas mec
anicos. Sin embargo, hay una importante excepci
on a este hecho: la formulaci
on Hamiltoniana
es muy adecuada para el tratamiento de problemas que involucran variables cclicas.
Pensemos en un sistema cuyo Lagrangiano se puede escribir como
L (q1 , . . . , qs ; q1 , . . . , qn ; t)
es decir las u
ltimas ns coordenadas son cclicas (naturalmente s < n). Dado que en el formalismo Lagrangiano
todas las velocidades generalizadas aparecen y pueden ser en general funciones del tiempo, el problema tiene
a
un n grados de libertad a pesar de la existencia de las coordenadas cclicas. En contraste, en el formalismo
Hamiltoniano las coordenadas cclicas se vuelven realmente ignorables, ya que los correspondientes momentos
conjugados se vuelven constantes de movimiento que denotaremos por k . El Hamiltoniano se puede escribir
en la forma
H = H (q1 , . . . , qs ; p1 , . . . , ps ; s+1 , . . . , n ; t)
el Hamiltoniano describe un problema de solo s grados de libertad, y las coordenadas cclicas han sido completamente ignoradas, excepto que se manifiestan como constantes de integraci
on k que se determinan con las
condiciones iniciales. El comportamiento de la coordenada cclica como tal se encuentra integrando la siguiente
ecuaci
on de movimiento
H
qn =
n
esto sugiere utilizar un metodo que permita aprovechar las ventajas del formalismo Hamiltoniano con las
coordenadas cclicas junto con el formalismo Lagrangiano para las coordenadas no cclicas. Esto se logra usando
una transformacion matem
atica que convierta la base de las q,q en la base q, p solo para las coordenadas cclicas.
De esta forma se obtienen s ecuaciones de Lagrange para las coordenadas no cclicas, y 2 (n s) ecuaciones de

6.9. PROCEDIMIENTO DE ROUTH

111

Hamilton para las coordenadas cclicas. Asumiendo que las coordenadas qs+1 , . . . , qn son cclicas, se propone
una nueva funci
on R (conocida como el Routhiano) que defina una transformaci
on de Legendre parcial en
donde solo se transformen los terminos asociados a las variables cclicas, por tanto R est
a definida por
R (q1 , . . . , qs ; q1 , . . . , qs ; ps+1 , . . . , pn ; t)

n
X

i=s+1

pi qi L

(6.71)

esto equivale a escribir


R (q1 , . . . , qs ; q1 , . . . , qs ; ps+1 , . . . , pn ; t) Hcicl (ps+1 , . . . , pn ; t) Lno

cicl

(q1 , . . . , qs ; q1 , . . . , qs ; t)

para las s coordenadas no ignorables i.e. k = 1, . . . , s podemos calcular


"
!
#




n
X
d R
d

L
d L
=
pi qi
=
dt qk
dt qk
qk
dt qk
i=s+1
!
n
X

L
R
L
=
pi qi
=
qk
qk
qk
qk
i=s+1

y teniendo en cuenta las ecuaciones de Lagrange resulta




d R
R
= 0, k = 1, . . . , s

dt qk
qk

(6.72)

en tanto que para las n s coordenadas ignorables i.e. k = s + 1, . . . , n tenemos que


!


n
X
R

L
L
d L
=
pi qi
=
=
qk
qk
qk
qk
dt qk
i=s+1

R
qk

= p k = 0

donde hemos tenido en cuenta las ecuaciones de Lagrange (2.23), la definici


on de momento conjugado (5.1),
y el hecho de que los momentos conjugados a variables cclicas son constantes. Por otro lado para k = s +
1, . . . , n tambien tenemos
!
n
X
R

L
=
pi qi
= qk
pk
pk
pk
i=s+1

con lo que queda finalmente


R
R
= p k = 0 ;
= qk ; k = s + 1, . . . , n
qk
pk

(6.73)

de modo que se logra el objetivo de tener ecuaciones tipo Lagrange para las variables no cclicas, Ecs. (6.72)
y tipo Hamilton para las variables cclicas Ecs. (6.73). Este metodo se conoce como procedimiento de Routh.
Es necesario escribir el Routhiano con los argumentos dados en la Ec. (6.71).

6.9.1.

Partcula sometida a un potencial central atractivo por el m


etodo de Routh

Para ilustrar el metodo tomemos como ejemplo el problema de una partcula sujeta a un potencial central
bajo la influencia de una fuerza atractiva proporcional a r n1 . Este movimiento siempre se realiza en un
plano en virtud de la conservaci
on del momento angular. El Lagrangiano en coordenadas polares se escribe
L=


m 2
k
r + r 2 2 + n
2
r

112

CAPITULO 6. ECUACIONES DE MOVIMIENTO DE HAMILTON

la coordenada ignorable es y su momento conjugado se denotar


a por p . El Routhiano en coordenadas polares
se escribe

k
m 2
r + r 2 2 n
R = p L = p
(6.74)
2
r

este es el valor del Routhiano que se obtiene por reemplazo directo en (6.71). No obstante, esta expresi
on no
est
a escrita con los argumentos adecuados, ya que seg
un (6.71) el Routhiano se debe escribir en terminos de
las coordenadas no cclicas (en este caso r), las velocidades generalizadas de las coordenadas no cclicas (r),

los momentos conjugados asociados a las variables cclicas (p ) y el tiempo (que aqu
es decir
 no aparece),


a escrito en terminos de R = R r, r,
p , , por tanto es
R = R (r, r,
p ). Ahora bien en (6.74) el Routhiano est

necesario encontrar a = (r, r,


p ) para que el Routhiano quede con los argumentos adecuados. Esta relaci
on
la sacamos a partir del momento conjugado p
p =

L
= mr 2

p
=
mr 2

reemplazando esta expresi


on en el Routhiano queda
 p  m
 p 2 
k

2
2
R (r, r,
p ) = p

r + r
n
2
2
mr
2
mr
r
 2 
2
p
p
1
1
k
R (r, r,
p ) =
mr 2
n
2
2
mr
2
2 mr
r
R (r, r,
p ) =

p2
1
k
mr 2 n
2
2mr
2
r

debemos aplicar las ecuaciones (6.72) tipo Lagrange para la coordenada no cclica r, para lo cual calculamos
R
d
= mr ;
r
dt

R
r

= m
r ;

p2
nk
n+1
3
mr
r
p2
nk
r 2 3 +
m r
mr n+1

m
r+

p2
R
nk
= 3 + n+1
r
mr
r

= 0
= 0

(6.75)

ahora debemos aplicar las ecuaciones (6.73) tipo Hamilton, a la coordenada cclica y su momento conjugado
p
R

R
p
=
p
mr 2
p
= 0 ;
=
mr 2
= 0 ;

(6.76)

cuya soluci
on es
p = mr 2 l = cte

(6.77)

Las Ecs. (6.75, 6.77), junto con las condiciones iniciales, nos dan la soluci
on a la din
amica de la partcula. Un
conjunto de condiciones iniciales puede ser r (0) , r (0) , (0) y l.
El formalismo de Routh es frecuentemente u
til para problemas pr
acticos en Fsica y en Ingeniera. Sin embargo, como instrumento formal para posteriores construcciones en mec
anica cl
asica, el formalismo puramente
Hamiltoniano es mucho mas fructfero.

DE LAS ECUACIONES DE HAMILTON A PARTIR DEL PRINCIPIO VARIACIONAL DE HA


6.10. DERIVACION

6.10.

Derivaci
on de las ecuaciones de Hamilton a partir del principio variacional de Hamilton

La derivaci
on hasta aqu desarrollada de las ecuaciones de Hamilton est
a basada en un principio diferencial
que hace uso directo de las Ecuaciones de Lagrange combinado con una transformaci
on de Legendre. La
pregunta natural es entonces de que manera pueden surgir estas ecuaciones a partir de un formalismo integral.
Vimos que el formalismo Lagrangiano puede extraerse de una formulaci
on integral via principio variacional de
Hamilton. Estos principios variacionales ser
an u
tiles en contextos mas all
a de la mec
anica. Es natural entonces
tratar de derivar las ecuaciones de Hamilton partiendo del principio variacional de Hamilton como fuente de
una formulaci
on integral de estas ecuaciones
Z t2
I
L dt = 0
(6.78)
t1

En la formulaci
on Lagrangiana las integrales se eval
uan con base en las trayectorias en el espacio de configuraciones (adaptado para la formulaci
on Lagrangiana). La filosofa del formalismo Hamiltoniano requiere tratar
a las coordenadas q, p como independientes entre s. Por tanto, el espacio adecuado para trabajar trayectorias
en este formalismo consiste en tener 2n ejes coordenados uno para cada qi y uno para cada pi , un punto en este
espacio (espacio de fase) traza una curva a traves del par
ametro tiempo. En consecuencia, las integrales deben
ser evaluadas con base en las trayectorias en el espacio de fase. Dado que el conjunto q, p se considera independiente, el integrando ser
a, en general funci
on de q, q,
p, p.
Usando la Ec. (6.7) que define al Hamiltoniano,
en la Ec. (6.78) resulta
Z t2
I =
[pi qi H (q, p, t)] dt = 0
(6.79)
t1

A la Ec. (6.79) se le suele denominar principio modificado de Hamilton en virtud de que la integral de lnea se
esta realizando en un espacio diferente (el espacio de fase). Teniendo en cuenta que las tecnicas desarrolladas
en la secci
on 3.2 son v
alidas para cualquier conjunto de variables y sus derivadas con respecto a un par
ametro
10
(en nuestro caso el tiempo) , tenemos que genericamente nuestro principio variacional se escribe
Z t2
I =
f (q, q,
p, p)
dt = 0
t1

de lo cual resultan 2n ecuaciones de Euler-Lagrange




d f
f
= 0 ; j = 1, . . . , n

dt qj
qj


d f
f

= 0 ; j = 1, . . . , n
dt pj
pj

(6.80)

por tanto, las ecuaciones que se derivan del principio de Hamilton modificado, se obtienen aplicando las
relaciones (6.80) al integrando de la Ec. (6.79)
f (q, q,
p) = pi qi H (q, p, t)
resultando
p j +

(6.81)

H
H
= 0 ; qj +
=0
qj
pj

De modo que hemos llegado a las ecuaciones de Hamilton a traves del principio variacional modificado de
Hamilton. Se puede argumentar que los momentos no pueden considerarse independientes en virtud de su
definici
on (5.1) que nos muestra que p es en general funci
on de q y q,
con lo cual no se puede variar q
10

Desde el punto de vista matem


atico el espacio de fase es simplemente un espacio de configuraci
on de dimensi
on 2n, ya que lo
que se hace es cartesianizar las variables independientes q y p colocando un eje para cada variable independiente.

114

CAPITULO 6. ECUACIONES DE MOVIMIENTO DE HAMILTON

o q,
sin variar p. Recordemos sin embargo, que la filosofa misma del formalismo Hamiltoniano requiere de
considerar a q y p independientes, es decir que una vez establecido el formalismo Hamiltoniano la definici
on
(5.1) no constituye parte del formalismo. Los momentos conjugados son elevados a la categora de variables
independientes, con un papel an
alogo a las coordenadas y conectados con ellas y con el tiempo solo a traves
de las ecuaciones de movimiento y no a traves de definiciones. Visto desde el punto de vista de un conteo de
grados de libertad, al introducir los momentos olvidando su definici
on, estamos aumentando el n
umero de
grados de libertad, pero tambien estamos aumentando el n
umero de ecuaciones de modo que el n
umero de
grados de libertad real se conserva.
Un aspecto similar ocurre en la formulaci
on Lagrangiana, estrictamente q y q no son independientes en
virtud de la definici
on q = dq/dt, pero cuando escribimos las ecuaciones de Lagrange olvidamos la definici
on
de q y la elevamos al estatus de independiente, la dependencia original se recupera a traves de las n ecuaciones
de movimiento.
Podemos preguntarnos si el principio modificado de Hamilton contiene nueva Fsica respecto al original,
sin embargo este principio fue establecido con el fin de obtener las ecuaciones de Hamilton, al igual que el
principio variacional original fue construdo con el fin de reproducir las ecuaciones de Lagrange. Una vez que
el Hamiltoniano es construdo, la transformaci
on de Legendre muestra que las formulaciones de Lagrange y
Hamilton as como los respectivos principios variacionales de donde vienen, contienen todos la misma Fsica.
Vale la pena mirar si las restricciones de punto fijo en el principio de Hamilton sufren alg
un cambio en
el principio de Hamilton modificado. Por ejemplo en el espacio de configuraciones, la condici
on de extremo
fijo significa qi = 0, en tanto que en el espacio de fase significa qi = pi = 0. Para esto nos debemos
preguntar si es necesaria la condici
on de extremo fijo en el espacio de fase para llegar a las ecuaciones de Euler
Lagrange dadas por (6.80). Si volvemos a la demostraci
on de las ecuaciones de Euler Lagrange en la secci
on
3.2, vemos que la condici
on de extremo fijo se requiere para eliminar el primer termino de la derecha en la
Ec. (3.22). No obstante, teniendo en cuenta que nuestro integrando definido por (6.81) no es funci
on explcita
de p j se observa que la eliminaci
on del termino ya descrito, es autom
atica para las variables pj y no requiere
de condici
on de punto fijo en estas variables. Por tanto, el principio de Hamilton modificado conduce a las
ecuaciones de Hamilton bajo las mismas condiciones variacionales que el principio de Hamilton original, es
decir bajo la condici
on de extremo fijo solo en las qi .
La anterior discusi
on muestra que la condici
on pj = 0 no es una condici
on necesaria pero s sera una
condici
on suficiente para llegar a las ecuaciones de Hamilton. Existen en realidad grandes ventajas al imponer
extremos fijos en el espacio de fase, ya que en este caso obtenemos una simetra Gauge para el Hamiltoniano
similar a la que posee el Lagrangiano, es decir se puede adicionar al integrando una funci
on de la forma
dF (q, p, t) /dt, siendo F dos veces diferenciable, sin afectar la validez del principio variacional. Como ejemplo
d
(qi pi ) el principio modificado
sencillo si adicionamos al integrando en la Ec. (6.79) un termino de la forma dt
de Hamilton quedara
Z t2

[p i qi H (q, p, t)] dt = 0
(6.82)
t1

n
otese que ahora el integrando s depende de p j . Por tanto, si queremos que esta nueva expresi
on a
un nos
conduzca a las ecuaciones de Hamilton, es necesario imponer pj = 0 (con esta nueva expresi
on no necesitamos
que qj = 0, pero al hacer la transformaci
on inversa y volver al integrando original, se ve que dicha condici
on
s es necesaria). De modo que si requerimos una simetra gauge que permita adicionar un termino de la forma
dF (q,p,t)
se requiere de condici
on de extremo fijo en el espacio de fase11 . El integrando en (6.82) no es el
dt
Lagrangiano ni se puede relacionar f
acilmente con el Lagrangiano a traves de una transformaci
on puntual. La
condici
on de extremo fijo en el espacio de fase provee un metodo para llegar a la formulaci
on Hamiltoniana sin
pasar por una formulaci
on Lagrangiana. Esto elimina la necesidad de ligar las q, q de un Lagrangiano, con las
q, p de un Hamiltoniano. Esto ser
a importante cuando estudiemos transformaciones de variables en el espacio
de fase que preservan la forma de las ecuaciones de Hamilton.
La independencia entre q y p en la formulaci
on Hamiltoniana es una de las grandes diferencias con las
11

N
otese que en ausencia de la condici
on pj = 0, a
un tenemos un gauge aunque m
as debil, ya que podramos adicionar un
(q,t)
factor de la forma dFdt
. Esto no es lo deseable ya que la idea es que F contenga todas las variables independientes.

(OPCIONAL)
6.11. EL PRINCIPIO DE MINIMA ACCION

115

formulaci
on Lagrangiana en la cual los momentos aparecen como una definici
on Ec. (5.1). Podemos pensar
como si tuvieramos 2n coordenadas generalizadas y sus derivadas temporales. Solo ampliando el n
umero de
grados de libertad de n a 2n se pueden obtener ecuaciones de primer orden.

6.11.

El principio de mnima acci


on (opcional)

Figura 6.4: Ilustraci


on de la 0 variaci
on y de la variaci
on en el espacio de configuraciones. La curva
correcta corresponde a ( = 0), en tanto que la curva variada corresponde a un valor no nulo de .
Existe otro principio variacional muy u
til asociado con el formalismo Hamiltoniano conocido como principio
de mnima acci
on. Para esto planteamos otro tipo de variacional . Recordemos que teniendo la curva correcta
definida entre los tiempos t1 y t2 ; el variacional define la familia de curvas que poseen extremo fijo tanto en
el tiempo como en el espacio de configuraciones, es decir todas las curvas est
an definidas en este intervalo de
tiempo y de modo que qi (t1 ) = qi (t2 ) = 0. La nueva variaci
on relaja ambas condiciones, las curvas vecinas
pueden estar definidas en un intervalo temporal diferente [t1 + t1 , t2 + t2 ], y sus coordenadas generalizadas
no tienen que coincidir con las del camino correcto en los extremos. Es posible por ejemplo, que una curva
vecina no se intersecte con la curva correcta en ning
un punto. La Fig. 6.4 ilustra la variaci
on en el espacio
de configuraciones.
Usaremos no obstante la misma parametrizaci
on que se us
o para la variaci
on (ver Ec. 3.21)
qi (t, ) = qi (t, 0) + i (t)

(6.83)

donde es el par
ametro infinitesimal que conduce al camino correcto cuando se anula. Naturalmente, ya no es
necesaria la condici
on de que las i (t) se anulen en los extremos t1 y t2 (ni en los extremos t1 + t1 y t2 + t2
de un camino variado). Solo requerimos que sean funciones contnuas y diferenciables en cualquier intervalo
real o variado.
Evaluemos la variaci
on de la integral de acci
on.
Z t2
Z t2 +t2
Z t2

L dt
L () dt
L (0) dt
(6.84)
t1

t1 +t1

t1

CAPITULO 6. ECUACIONES DE MOVIMIENTO DE HAMILTON

116

donde L () representa el valor de L cuando tomamos el camino variado siendo L (0) el camino correcto.
La variaci
on se descompone en dos partes, una surge del cambio en los lmites de integraci
on y la otra del
par
ametro i.e. la variaci
on de la curva como tal. Escribiremos la primera integral como
Z

t2 +t2

=
t1 +t1

t2
t1

t1 +t1

t1

t2 +t2

t2

con lo cual (6.84) queda

t2

L dt =
t1

t2

L () dt

t1

t2
t1

L (0) dt

t1 +t1

L () dt +
t1

t2 +t2

L () dt

(6.85)

t2

es u
til parametrizar L () como
L () L (0) + F ()
donde F () nos da cuenta de la desviaci
on en el Lagrangiano debida a la evaluaci
on en la curva vecina, con
respecto a su valor en la curva real. Claramente F () es una cantidad infinitesimal. Definiremos ahora la
0 variaci
on, la cual mantiene fijo el intervalo temporal, pero no tiene extremos fijos en las qi (ver Fig. 6.4).
Con estas consideraciones (6.85) queda de la forma

t2

L dt =

t1
Z t2

L dt =

0
0

t1

t2

t1
Z t2

L dt
L dt

t1
Z t1 +t1

t1 +t1

[L (0) + F ()] dt +

t1
Z t1 +t1
t1

F () dt +

t1

L (0) dt +
Z

t2 +t2

t2 +t2

t2 +t2

[L (0) + F ()] dt
t2

L (0) dt
t2

F () dt
t2

y dado que las cantidades t1 , t2 y F () son infinitesimales, las dos u


ltimas integrales nos dan diferenciales
de segundo orden y por tanto se desprecian. Similarmente, L (0) se puede considerar constante dentro de los
intervalos de integraci
on [ti , ti + ti ] , puesto que una variaci
on L (infinitesimal) del Lagrangiano dentro de
uno de estos intervalos, dara una contribucion del orden de Lti . Con estas consideraciones, la variaci
on
a primer orden queda finalmente

t2

t1

L dt = L (t2 , = 0) t2 L (t1 , = 0) t1 +

t2

L dt

(6.86)

t1

Los dos primeros terminos en el miembro derecho de la Ec. (6.86), se deben a la variaci
on en los lmites
de integraci
on, tomados sobre el camino correcto. El tercer termino a la derecha de (6.86), se origina en la
variaci
on de la curva como tal a traves del par
ametro , tomando los mismos lmites de integracion que en la
curva original.
La variaci
on 0 en la integral de la derecha puede realizarse a traves de una parametrizaci
on del camino
variado, como en la secci
on 3.2, pero la variaci
on de qi no se anula en los extremos. Retomando la ecuaci
on
(3.22), el primer termino de la derecha en dicha ecuaci
on ya no se anula, con lo cual la Ec. (3.23) se modifica
en la forma



Z t2
Z t2 
L
d L
L 0 2
0
0

L dt =

qi dt +
qi
qi dt qi
qi
t1
t1
1
donde 0 qi se define en forma an
aloga a la Ec. (3.24). Usando las ecuaciones de Lagrange12 , esta nueva variaci
on
se escribe

Z t2
L 0 2
0

L dt =
qi
qi
t1

12

Al tomar ecuaciones de Lagrange, estamos asumiendo la validez del principio de Hamilton.

(OPCIONAL)
6.11. EL PRINCIPIO DE MINIMA ACCION
y la variaci
on queda

t2

t1


 2
L dt = L (t) t + pi 0 qi 1

117

(6.87)

0 qi (1) es la variaci
on en qi con respecto a la coordenada en la curva correcta tomada en el tiempo t1 , otro
0
tanto ocurre con qi (2). La idea es escribir la variaci
on de la acci
on en terminos de las variaciones de
las coordenadas, calculemos entonces qi (2)
qi (2) = qi (t2 + t2 , ) qi (t2 , 0) = qi (t2 + t2 , 0) qi (t2 , 0) + i (t2 + t2 )


qi (t2 + t2 , 0) qi (t2 , 0)
qi (2) =
t2 + i (t2 )
t2
donde hemos usado la parametrizaci
on (6.83) y eliminado contribuciones de segundo orden. A primer orden
en las cantidades infinitesimales y t2
qi (2) = qi (2) t2 + 0 qi (2)
n
otese que i (t2 ) nos da una 0 variaci
on solo si no se impone que i se anule en los extremos con t1 y t2 fijos.
De manera similar se calcula para el otro extremo quedando
qi = 0 qi + qi t
y reemplazando (6.88) en (6.87) resulta
Z t2

L dt =
t1
t2

L dt =

t1

(6.88)

(L t pi qi t + pi qi )|21
(pi qi H t)|21

(6.89)

para obtener el principio de mnima acci


on, realizaremos algunas suposiciones adicionales
1. Consideraremos sistemas en donde L, y por tanto H no dependan explcitamente del tiempo, de modo
que H es una cantidad conservada.
2. Restringiremos las variaciones de tal manera que para los caminos vecinos H tambien sea conservada al
igual que en el camino correcto.
3. Exigiremos adem
as que los caminos variados cumplan el requerimiento de que qi se anule en los extremos
(pero no t). Esto implica entonces que qi (t1 , 0) para el camino real debe coincidir con qi (t1 + t1 , )
para el camino variado, y similarmente para t2 .
Un ejemplo particular de trayectoria vecina que podra satisfacer los tres requisitos, es un camino en donde
la lnea que describe la trayectoria variada en el espacio de configuraciones coincida con la lnea de la
trayectoria real, la diferencia consiste en la rapidez con que se desplaza el punto que describe la trayectoria en
ambos casos, es decir que las funciones qi (t) est
an alteradas en el camino variado. En este caso es necesario
cambiar los tiempos en los extremos de la curva variada a fin de que H se mantenga constante en todos los
puntos de la trayectoria variada.
Teniendo en cuenta las condiciones adicionales impuestas, la variaci
on de la acci
on dada por la Ec.
(6.89), queda
Z t2

L dt = H (t2 t1 )
(6.90)
t1

por otro lado, bajo las mismas condiciones, la acci


on como tal queda
Z t2
Z t2
L dt =
pi qi dt H (t2 t1 )
t1

t1

CAPITULO 6. ECUACIONES DE MOVIMIENTO DE HAMILTON

118

escribiendo la variaci
on de esta acci
on, resulta

t2

L dt =

t1

t2

pi qi dt H (t2 t1 )

t1

(6.91)

comparando (6.90) con (6.91) se obtiene el principio de mnima acci


on

t2

pi qi dt = 0

(6.92)

t1

el nombre de este principio proviene del hecho de que la integral en (6.92), se conoca antiguamente como la
acci
on. La literatura moderna utiliza el termino acci
on para la integral involucrada en el principio variacional
de Hamilton. Para la integral en (6.92) se utiliza con frecuencia el termino acci
on abreviada.

6.11.1.

Algunas aplicaciones del principio de mnima acci


on

El principio de mnima acci


on se puede escribir de diversas maneras. Por ejemplo, si la ecuaci
on que define a
las coordenadas generalizadas no depende explcitamente del tiempo, la energa cinetica solo contiene factores
homogeneos de segundo grado en q.

1
T = Mjk (q) qj qk
2
si adicionalmente, el potencial no depende de las velocidades generalizadas (es decir el Hamiltoniano es la
energa del sistema), los momentos can
onicos se derivan solo de T
pi =
pi qi =

T
1
= (Mik qk + Mji qj )
qi
2
1
(Mik qk qi + Mji qj qi ) = 2T
2

empleando esta u
ltima igualdad en (6.92) resulta

t2

T dt = 0

(6.93)

t1

si adem
as T se conserva al igual que H (por ejemplo es el caso de un cuerpo rgido aislado puesto que en tal
caso la energa potencial es solo interna y no cambia con el tiempo). El principio de mnima accion adquiere
entonces la forma
(t2 t1 ) = 0
esta ecuaci
on nos dice que de todos los caminos posibles entre dos puntos en el espacio de configuraciones,
consistente con la conservaci
on de H y T , el sistema se mover
a a lo largo de un camino particular para el
cual el tiempo de transito es el mnimo posible (mas estrictamente estacionario). En esta forma el principio de
mnima acci
on nos recuerda al principio de Fermat en optica geometrica, en donde una rayo de luz atraviesa el
camino que minimiza el tiempo de viaje. N
otese que para llegar a esta conclusi
on por este camino, fue necesario
que el intervalo temporal de integraci
on no fuera fijo, como efectivamente ocurre en la variacion.
Pensemos ahora el caso especial de una partcula asumiendo que T no es necesariamente constante, la
energa cinetica se escribe
 
m ds 2
T =
2 dt
donde s denota la longitud de arco. De esta ecuaci
on se puede despejar dt
dt = p

ds
2T /m

(6.94)

6.12. EJERCICIOS

119

de modo que podemos reemplazar el dt de la acci


on abreviada (6.93)
Z t2
Z p2
Z p2
ds

T dt = 0
T
=0
T ds = 0
2T
t1
p1
p1
finalmente se puede escribir

p2

p1

H V (q) ds = 0

(6.95)

la Ec. (6.95) se conoce usualmente como la forma de Jacobi para el principio de mnima acci
on. Este resultado
es extendible a caminos en espacios de configuraciones con curvatura que describen a un sistema de partculas
(ver Ref. [1]).
pLa Ec. (6.94) nos muestra que el punto atraviesa el camino en el espacio de configuraciones a
una rapidez 2T /m. Si T es constante (e.g. en un sistema aislado), la forma de Jacobi del principio de mnima
acci
on nos dice que el punto del sistema viaja por el camino mas corto en el espacio de configuraciones (es
decir una geodesica). Tal resultado tiene muchas aplicaciones en optica geometrica y en optica electr
onica. Es
importante mencionar que en la forma de Jacobi del principio de mnima acci
on, nos referimos al camino (y no
a la curva) que describe el punto figurativo del sistema. Es decir, no es relevante la dependencia de este camino
con el par
ametro tiempo, ya que en la integral (6.95) H es constante, V solo depende de las coordenadas, y
solo interviene el elemento de camino ds.
Existen una gran variedad de principios variacionales. Por ejemplo, un principio variacional derivable del
principio de mnima acci
on abreviada es el principio de mnima curvatura de Hertz, seg
un el cual, una partcula
libre se mueve a lo largo del camino de mnima curvatura, lo cual conduce a su vez al movimiento a lo largo
de geodesicas.
Los principios variacionales no contienen fsica nueva y son en general poco ventajosos para resolver problemas pr
acticos, su utilidad yace en la facilidad para desarrollar nuevas formulaciones de la estructura te
orica
de la mec
anica y otros campos de la Fsica mas all
a de la mec
anica.

6.12.

Ejercicios

1. Demuestre explcitamente que dado un Hamiltoniano H, el nuevo Hamiltoniano dado por


H0 = H +

dF (q, p, t)
dt

conduce a las mismas ecuaciones de Hamilton que H. Que condiciones se necesitan sobre F para
garantizar la equivalencia de ambos Hamiltonianos?.
2. Use las ecuaciones de Hamilton para encontrar las ecuaciones de movimiento de un pendulo esferico,
usando coordenadas generalizadas apropiadas.
3. En el problema de la secci
on 6.8.1, de una partcula restringida a moverse en una superficie cilndrica,
encuentre la energa del sistema en terminos de las condiciones iniciales.
4. Encuentre las ecuaciones de Hamilton asociadas al Hamiltoniano de la Ec. (6.54), P
ag. 106.
5. Un Hamiltoniano de un solo grado de libertad tiene la forma
H (q, p) =

 kq 2
p2
ba
bqpet + q 2 et + bet +
2
2
2

(6.96)

donde a, b, , y k son constantes (a) Encuentre el Lagrangiano asociado a este Hamiltoniano, (b) Encuentre un Lagrangiano equivalente que no dependa explcitamente del tiempo. (c) Encuentre el Hamiltoniano
asociado al nuevo Lagrangiano, as como su relaci
on con el Hamiltoniano (6.96).
6. Encuentre el Hamiltoniano y las ecuaciones de Hamilton para el pendulo doble descrito por la Fig. 2.1,
P
ag. 16.

Captulo 7

Transformaciones can
onicas
Hay un tipo de problema que sera de muy f
acil soluci
on con el formalismo Hamiltoniano, el caso en el cual
H es una constante de movimiento y todas las coordenadas generalizadas son cclicas, de modo que todos los
momentos conjugados son constantes
pi = i ;
i = 1, . . . , n
y dado que el Hamiltoniano no puede ser funci
on ni del tiempo ni de las coordenadas cclicas, este se escribe
como
H = H (1 , . . . , n )
y las ecuaciones de Hamilton para qi son simplemente
qi =

H
= i
i

i = 1, . . . , n

(7.1)

dado que las i son funciones de las i u


nicamente, son tambien constantes en el tiempo. Las Ecs. (7.1) tienen
soluci
on inmediata
qi = i t + i ;
i = 1, . . . , n
donde las i as como las i se determinan con las 2n condiciones iniciales. Podra pensarse que esta clase de
problemas son de interes solo academico. No obstante, cabe recordar que existe en general mas de un sistema
coordenado generalizado para un sistema fsico dado. Por ejemplo, para fuerzas centrales el uso de coordenadas
cartesianas no conduce a variables cclicas en tanto que las coordenadas polares producen autom
aticamente una
variable cclica. El n
umero de variables cclicas depende en general del sistema de coordenadas generalizadas
utilizado. Es posible entonces que encontremos un conjunto de coordenadas en las que todas las coordenadas
sean cclicas, una vez encontrado el resto del problema es muy sencillo. Dado que en general el sistema
coordenado mas obvio no va a ser normalmente cclico, debemos desarrollar un metodo para transformar este
conjunto coordenado en otro que sea m
as adecuado. Las transformaciones de este tipo que hemos usado hasta
el momento, son de un conjunto {qi } de coordenadas generalizadas a otro conjunto {Qi }
Qi = Qi (qi , t)

i = 1, . . . , n

(7.2)

por ejemplo, la transformaci


on de coordenadas cartesianas a polares tiene esta forma1 . Estas transformaciones
se conocen como transformaciones puntuales.
En el formalismo Hamiltoniano, los momentos conjugados est
an al mismo nivel que las coordenadas de tal
modo que las transformaciones puntuales deben realizarse en el espacio de fase y no en el de configuraciones,
por tanto debemos estudiar transformaciones del tipo
Qi = Qi (q, p, t) ; Pi = Pi (q, p, t)
1

(7.3)

No toda transformaci
on de coordenadas cartesianas a otro conjunto de coordenadas es del tipo (7.2), ya que estas u
ltimas
se refieren a transformaciones entre dos conjuntos de coordenadas independientes. Por ejemplo, las transformaciones descritas
por (2.2), relacionan en general a un conjunto de coordenadas dependientes (las cartesianas) con otro conjunto de coordenadas
independientes (las qi ).

120

DE LAS TRANSFORMACIONES CANONICAS

DEL PRINCIPIO DE HAM


7.1. CARACTERIZACION
A TRAVES
En el formalismo Hamiltoniano, solo interesan aquellas transformaciones para las cuales exista una funci
on
K (Q, P, t) tal que las ecuaciones de movimiento en el nuevo sistema de coordenadas Q, P , tengan la estructura
de las ecuaciones de Hamilton, es decir
K
K
Q i =
; Pi =
Pi
Qi

(7.4)

Esta clase de transformaciones se denominan transformaciones can


onicas. La funci
on K (Q, P, t) juega
el papel del Hamiltoniano en el nuevo sistema coordenado Q, P . Esta funci
on se denomina Hamiltoniano
transformado o Kamiltoniano. Dado que estas transformaciones deben ser invertibles, resulta arbitrario decir
cual es el nuevo Hamiltoniano o Kamiltoniano y el antiguo Hamiltoniano.
Es importante mencionar que la transformaci
on de coordenadas debe ser independiente del problema, lo
cual significa que dadas las ecuaciones de transformaci
on (7.3) entonces las expresiones (7.4) deben ser las
ecuaciones de movimiento sin importar la forma del Hamiltoniano original. Aunque la transformaci
on pudo ser
inspirada en un problema especfico, las mismas transformaciones deben conducir a las ecuaciones de Kamilton,
cuando se aplican a otro problema con el mismo n
umero de grados de libertad, aunque naturalmente el valor
especfico numerico y funcional de H y K s sera especfico para cada problema.

7.1.

Caracterizaci
on de las transformaciones can
onicas a trav
es del principio de Hamilton modificado

Si Qi , Pi son coordenadas can


onicas, ellas deben satisfacer el principio variacional modificado de Hamilton
en la forma
Z t2 h
i

Pi Q i K (Q, P, t) dt = 0
(7.5)
t1

al mismo tiempo, las antiguas variables canonicas deben satisfacer el mismo principio
Z t2

(pi qi H (q, p, t)) dt = 0

(7.6)

t1

teniendo en cuenta que el principio modificado de Hamilton tiene variaci


on cero en los extremos2 , la validez
simult
anea de (7.5) y (7.6) conduce a que los dos integrandos esten relacionados de la siguiente forma
dF
[pi qi H (q, p, t)] = Pi Q i K (Q, P, t) +
dt

(7.7)

donde F es una funci


on de las coordenadas del espacio de fase y del tiempo con derivadas contnuas hasta segundo orden. es una constante independiente de las coordenadas y el tiempo, que produce una transformaci
on
de escala.
Example 4 Veamos un caso de transformaci
on de escala. Pasemos de {q, p} a otro conjunto {Q0 , P 0 } con una
transformaci
on de la forma
Q0i = qi ; Pi0 = pi
(7.8)
las ecuaciones de Hamilton (7.4) ser
an satisfechas si elegimos el kamiltoniano

K 0 Q0 , P 0 H (q, p)

(7.9)

Los integrandos correspondientes al principio de Hamilton modificado est


an relacionados por
(pi qi H) = Pi0 Q 0i K 0
2

(7.10)

Recordemos que para llegar a las ecuaciones de Hamilton solo requerimos que qi = 0, pero tambien podemos imponer pi = 0,
con el fin de enriquecer el gauge del Hamiltoniano.


CAPITULO 7. TRANSFORMACIONES CANONICAS

122

que es de la forma (7.7) con = , y dF/dt = 0. Sin embargo, si tenemos una transformaci
on {q, p}
{Q0 , P 0 } con factor de escala 6= 1
 dF 0
[pi qi H (q, p, t)] = Pi0 Q 0i K 0 Q0 , P 0 , t +
dt

(7.11)

siempre podemos encontrar un conjunto intermedio de coordenadas {Q, P } relacionadas con {Q0 , P 0 } por una
transformaci
on de escala de la forma (7.8, 7.10)
Q0i = Qi ; Pi0 = Pi


Pi Q i K
= Pi0 Q 0i K 0

(7.12)

sustituyendo (7.12) en (7.11) y ajustando , obtenemos



 dF 0
[pi qi H (q, p, t)] = Pi Q i K +
dt

y definiendo F F 0 / vemos que la transformaci


on entre los dos conjuntos {q, p} y {Q, P } satisface entonces
la Ec. (7.7) pero con = 1
dF
(7.13)
pi qi H (q, p, t) = Pi Q i K (Q, P, t) +
dt
El ejemplo anterior nos muestra que la transformaci
on de escala es b
asicamente trivial y no aporta significativamente al formalismo de las transformaciones can
onicas, de modo que trabajaremos las transformaciones
dadas por (7.13). Cuando 6= 1 se habla de transformaciones can
onicas extendidas. Cuando = 1 hablamos simplemente de una transformaci
on can
onica. Lo que hemos visto es que una transformaci
on can
onica
extendida siempre se puede separar en una transformaci
on can
onica seguida de una transformacion de escala.
Cuando la transformaci
on can
onica no depende explcitamente del tiempo se habla de transformaci
on can
onica
restringida. De aqu en adelante se trabaja con transformaciones can
onicas (no extendidas) a menos que se
indique lo contrario.
El u
ltimo termino a la derecha de (7.13) solo contribuye a la variaci
on de la acci
on en los extremos y por
lo tanto se anula si F es una funci
on de (q, p, t) o de (Q, P, t) o cualquier mezcla de las coordenadas de los dos
espacios de fase {q, p} y {Q, P }, dado que todas ellas tienen variaci
on cero en los extremos. Adem
as, por medio
de las ecuaciones de transformaci
on (7.3) y sus inversas, es posible expresar a F en terminos de coordenadas
nuevas y viejas. En realidad estas funciones adquieren mayor utilidad cuando se expresan con un n
umero igual
de variables viejas y nuevas (adem
as del tiempo). En ese sentido F act
ua como puente entre los dos sistemas
de coordenadas y se denomina la funci
on generadora de la transformaci
on.

7.2.

Caracterizaci
on de las funciones generadoras de una transformaci
on
can
onica

Veamos de que manera F puede generar la transformaci


on. Asumamos que F es funci
on de las n primeras
coordenadas generalizadas, nuevas y viejas i.e. de q, Q
F F1 (q, Q, t)

(7.14)

la ecuaci
on (7.13) toma la forma
dF1
pi qi H = Pi Q i K +
dt
F
F1
F1
1
pi qi H = Pi Q i K +
+
qi +
Qi
t
qi
Qi

(7.15)

CANONICA

7.2. FUNCIONES GENERADORAS DE UNA TRANSFORMACION

123

pasando todo a un solo lado


0=H+




F1
F1
F1
Qi K +
pi qi + Pi +
qi
Qi
t

y dado que las coordenadas nuevas y viejas son separadamente independientes y H,K, F1 no son funciones de
qi ni de Q i , se llega a que los coeficientes que acompa
nan a qi , Q i deben anularse
pi =

F1
F1
; Pi =
; i = 1, . . . , n
qi
Qi

(7.16)

quedando finalmente
F1
(7.17)
t
las primeras n de las Ecs. (7.16) definen a pi como funciones de qj , Qj y t. Asumiendo que son invertibles, se
pueden despejar las Qi en terminos de qj , pj , t, lo cual nos dara la primera mitad de las transformaciones
(7.3). Una vez establecidas, las Qi (qj , pj , t) se pueden sustituir en la segunda serie de Ecs. (7.16) de tal manera
que se obtienen las Pi como funciones de qj , pj , t; y por tanto la segunda mitad de las transformaciones
(7.3). Finalmente, la relaci
on (7.17) nos da la conecci
on entre el nuevo Hamiltoniano K y el antiguo H, de
esta relaci
on se ve que K difiere numericamente de H si y solo si F1 depende explcitamente del tiempo. Es
necesario tener en cuenta que K debe ser funci
on de Q, P, t, para lo cual los argumentos de H es decir q, p, t
deben ser convertidos en Q, P, t a traves de la inversa de las relaciones (7.3), de la misma forma, los argumentos
qi , t de la funci
on t F1 deben expresarse en terminos de Q, P, t; con lo cual la funci
on K ya queda en terminos
de los argumentos correctos.
El procedimiento anterior describe formalmente como se pueden obtener las transformaciones can
onicas
partiendo de una funci
on generatriz F1 . Este proceso puede ser revertido para obtener la funci
on generatriz
comenzando con las transformaciones can
onicas (7.3). Se comienza por invertir el primer conjunto de transformaciones (7.3) con el fin de expresar los pi como funciones de q, Q, t, tal expresi
on se reemplaza entonces en el
segundo conjunto de transformaciones (7.3) con lo cual se obtienen los Pi tambien como funciones de q, Q, t.
Se obtienen entonces dos funciones especficas
K=H+

pi = pi (q, Q, t)

Pi = Pi (q, Q, t)

reemplazando estas funciones especficas en las ecuaciones (7.16), se obtiene un conjunto de 2n ecuaciones
diferenciales con 2n coordenadas (qi , Qi ), para F1 (q, Q, t). Estas ecuaciones permiten en principio encontrar
a F1 siempre que las transformaciones sean realmente can
onicas. Se puede ver que existe una arbitrariedad en
la soluci
on para F1 . En particular, se le puede adicionar una funci
on arbitraria cuyo argumento es el tiempo
solamente3
F10 (q, Q, t) = F1 (q, Q, t) + g (t)
Esta funci
on aditiva claramente no afecta las ecuaciones de transformaci
on. Por otro lado, se aprecia en la Ec.
(7.17), que el Kamiltoniano con F10 s cambia con respecto al Kamiltoniano con F1 , pero en una derivada total
con respecto al tiempo, que no afecta a las ecuaciones de Hamilton. En algunas ocasiones F1 puede tener otras
ambig
uedades.
En ocasiones no es adecuado escribir la funci
on generatriz en terminos de los argumentos q, Q, t. Por
ejemplo, la transformaci
on puede ser tal que los pi no se puedan escribir como funciones de q, Q, t, sino
m
as bien como funciones de q, P, t. En este caso se debe buscar una funci
on generatriz que sea funci
on de las
antiguas coordenadas q y los nuevos momentos P . Claramente la Ec. (7.15) debe reemplazarse por una relaci
on
similar pero que involucre a P i en lugar de Q i . Esto se logra escribiendo a F en (7.13) como
F F2 (q, P, t) Qi Pi
3

(7.18)

Este es un conjunto de ecuaciones diferenciales sin condiciones iniciales ni de frontera. Por esta raz
on no se espera unicidad
en su soluci
on. Adem
as, F1 no corresponde a un observable fsico, de modo que tampoco es necesaria dicha unicidad.


CAPITULO 7. TRANSFORMACIONES CANONICAS

124

Funci
on generatriz

Derivadas de las Fi

F = F1 (q, Q, t)

pi =

F = F2 (q, P, t) Qi Pi

pi =

F = F3 (p, Q, t) + qi pi

qi =

F = F4 (p, P, t) + qi pi Qi Pi

qi =

F1
qi ;
F2
qi ;
3
F
pi
4
F
pi

F1
Pi = Q
i
2
Qi = F
Pi
F3
; Pi = Q
i
4
; Qi = F
Pi

Caso especial trivial


F1 = qi Qi , Qi = pi , Pi = qi
F2 = qi Pi , Qi = qi , Pi = pi

F3 = pi Qi , Qi = qi , Pi = pi
F4 = pi Pi , Qi = pi , Pi = qi

Cuadro 7.1: Funciones generatrices de los 4 tipos, sus ecuaciones diferenciales asociadas y algunos ejemplos
simples.
sustituyendo (7.18) en (7.13) y usando regla de la cadena se tiene que
dF2
d
(Qi Pi )
pi qi H (q, p, t) = Pi Q i K (Q, P, t) +
dt
dt
F
F2
F2
2
pi qi H (q, p, t) = Pi Q i K (Q, P, t) +
+
qi +
Pi Q i Pi Qi P i
t
qi
Pi
F2 F2
F2
pi qi H (q, p, t) = K (Q, P, t) +
qi +
+
Pi Qi Pi
t
qi
Pi
pasando todo a un extremo





F2
F2
F2
=0
pi qi +
Qi P i + H K +
qi
Pi
t

por razones similares al caso de F1 , los terminos proporcionales a qi y Pi deben anularse y por lo tanto
los tres u
ltimos terminos de la izquierda deben cancelarse. De estas cancelaciones se obtienen las ecuaciones
fundamentales para F2 y para K
F2
F2
; Qi =
qi
Pi
F2
K = H+
t
pi =

(7.19)
(7.20)

al igual que con el caso anterior, el primer conjunto de ecuaciones (7.19) debe resolverse para Pi en funci
on
de qj , pj , t, con lo cual se tiene la segunda mitad de las transformaciones (7.3). La primera mitad de las
transformaciones (7.3) se obtiene sustituyendo P (q, p, t) en la segunda mitad de las Ecs. (7.19).
Obviamente, existen otros dos tipos b
asicos de funciones generatrices F3 (p, Q, t) y F4 (p, P, t), para las
cuales el procedimiento es an
alogo y se sintetiza en la tabla 7.1. Se puede observar que los cuatro tipos b
asicos
de funciones generatrices est
an conectados a traves de transformaciones de Legendre. Por ejemplo, la transici
on
entre F1 y F2 equivale a ir de las variables q, Q a las variables q, P con el segundo conjunto de relaciones (7.16)
Pi =

F1 (q, Q, t)
Qi

ya que de esta relaci


on se puede obtener Pi en terminos de q, Q, t la cual formalmente se puede despejar para
obtener Qi (q, P, t), que permitira reemplazar el conjunto q, Q por el conjunto q, P . Esta es precisamente la
forma requerida para una transformaci
on de Legendre de la base de variables (q, Q) a la base de variables
(q, P ), como se discuti
o en la secci
on 6.2. En analoga con la Ec. (6.3), escribimos
F2 (q, P, t) = F1 (q, Q, t) + Pi Qi

(7.21)

lo cual es equivalente a igualar (7.14) con (7.18). De manera similar a partir de (7.14), y las definiciones de las
otras funciones generatrices dadas en la tabla 7.1, se puede ver que todas las otras funciones generatrices se


7.3. EJEMPLOS DE TRANSFORMACIONES CANONICAS

125

pueden ver como transformaciones de Legendre de F1 . En particular, F4 se obtiene con dos transformaciones
de Legendre de F1 dado que requiere el cambio de los dos conjuntos de argumentos. Sin embargo, no toda
transformaci
on can
onica puede ser generada por medio de alguna de las cuatro funciones generatrices b
asicas.
De modo que en algunos casos, estas transformaciones de Legendre pueden conducir a funciones generatrices
nulas o indeterminadas. Por esta raz
on es preferible definir cada tipo de funci
on generadora relativa a la funci
on
F de la Ec. (7.13), la cual es una funci
on de 2n coordenadas y/o momentos independientes, pero que no tiene
sus argumentos bien definidos.
En particular, la funci
on generatriz apropiada no necesariamente es del tipo 1,2,3 o 4 para todas sus
coordenadas y/o momentos. Es posible y en algunos casos necesario para ciertas transformaciones can
onicas,
usar una funci
on generatriz que sea mezcla de los cuatro tipos. A manera de ejemplo, podra ser conveniente
que para cierta transformaci
on can
onica con dos grados de libertad, definamos una funci
on generatriz de la
forma
F 0 (q1 , p2 , P1 , Q2 , t)
esta funci
on generatriz estara relacionada con F de (7.13) a traves de
F = F 0 (q1 , p2 , P1 , Q2 , t) Q1 P1 + q2 p2
esto define una transformaci
on de Legendre adecuada para cambiar Q1 por P1 y para cambiar q2 por p2 . Las
ecuaciones de transformaci
on se obtienen a traves de las relaciones
F 0
F 0
; Q1 =
q1
P1
F 0
F 0
q2 =
; P2 =
p2
Q2
0
F
K = H+
t

p1 =

Se puede ver que F 0 es una mezcla entre funciones del tipo F2 y F3 .

7.3.

Ejemplos de transformaciones can


onicas

Consideremos primero una funci


on del segundo tipo de la forma
F2 = qi Pi

(7.22)

a partir de las Ecs. (7.19, 7.20), las ecuaciones de transformaci


on ser
an
pi =

F2
F2
= Pi ; Qi =
= qi ; K = H
qi
Pi

las coordenadas nuevas coinciden con las antiguas, de modo que F2 es una funci
on generatriz de la transformaci
on identidad. Tomemos ahora F3 = pi Qi , usando las ecuaciones de la tabla 7.1, vemos que esta funcion
genera la transformaci
on can
onica I, i.e. Qi = qi , Pi = pi .
Un tipo m
as general de transformaci
on del tipo F2 que incluye a (7.22) como caso particular, se define por
F2 = fi (q1 , . . . , qn ; t) Pi + g (q1 , . . . , qn ; t)

(7.23)

donde las fi son un conjunto de funciones independientes, y g es una funci


on diferenciable en q, t, ambas tienen
como argumentos las coordenadas antiguas y el tiempo. Usando el segundo conjunto de Ecs. (7.19) las nuevas
coordenadas Qi vienen dadas por
F2
Qk =
= fk (q1 , . . . , qn ; t)
(7.24)
Pk
de modo que con esta transformaci
on las coordenadas nuevas solo dependen de las coordenadas antiguas y
el tiempo pero no de los antiguos momentos. Esto define una transformaci
on puntual como la expresada en


CAPITULO 7. TRANSFORMACIONES CANONICAS

126

(7.2). Para definir una transformaci


on puntual las funciones fi deben ser independientes e invertibles, de
as arbitrarias, se
modo que las qj se puedan expresar en terminos de las Qk . Dado que las fi son por lo dem
concluye que toda transformaci
on puntual puede ser parte de una transformaci
on can
onica (recuerdese que
una transformaci
on can
onica requiere conocer tambien las transformaciones en los pi ). Las Ecs. (7.20, 7.23)
nos dan el nuevo Hamiltoniano
g
fi
K=H+
Pi +
t
t
Veamos ahora las ecuaciones de transformaci
on para el momento conjugado que induce (7.23), el primer
conjunto de Ecs. (7.19) lleva a
F2
fi
g
pj =
=
Pi +
(7.25)
qj
qj
qj
estas ecuaciones se pueden invertir para dar P en funci
on de (q, p). Este procedimiento es m
as sencillo si se
usa una formulaci
on matricial, definiremos entonces arreglos matriciales de la forma
 
 
f
fi
g
g
(p)j pj ; (P)i Pi ;

q ji qj
q j
qj
con lo cual la transformaci
on (7.25) se escribe

de aqu se puede despejar P


P=

p=

f
g
P+
q
q

1 

f
q

(7.26)

g
q

(7.27)

observese que a diferencia de las Qi que solo dependan de las qj y el tiempo, las Pi dependen de qj , pj , t.
Otra funci
on generadora interesante es la siguiente
F1 = qk Qk

(7.28)

las ecuaciones de transformaci


on (7.16) en este caso quedan
pi =

F1
F1
= Qi ; Pi =
= qi
qi
Qi

esta funci
on generatriz intercambia los momentos y las coordenadas excepto por un signo. La funci
on F4 = pi Pi
produce la misma transformaci
on. Este hecho enfatiza el estatus independiente otorgado a los momentos, ya
que tanto los momentos como las coordenadas se necesitan para describir el movimiento en la formulaci
on
Hamiltoniana y la distinci
on entre ambos es asunto de nomenclatura, puesto que podemos intercambiar los
nombres con un costo no mayor a un cambio de signo. No hay ning
un remanente en la teora de q como
coordenada espacial o de p como masa por velocidad. En realidad, de las propias ecuaciones de Hamilton
p i =

H
qi

qi =

H
pi

se puede ver que este intercambio es can


onico, con el cambio de signo apropiado. Si qi se sustituye por pi , las
ecuaciones permanecen en la forma can
onica solo si pi es sustitudo por qi .
Podemos ver adicionalmente que la transformaci
on de permutaci
on no se puede generar a partir de una
funci
on generatriz del tipo F2 (q, P, t), ya que el sistema de ecuaciones parciales que se deriva de (7.19) nos
dice que
F2 (q, P, t)
pi =
qi
esto implica que pi debe escribirse como funci
on de q, P, t pero en la transformaci
on de permutaci
on pi no es
funci
on de ninguna de estas variables, en realidad solo es funci
on de las nuevas coordenadas Q. Por tanto, F2
no es una funci
on generatriz adecuada para la transformaci
on de permutaci
on.

7.4. TRANSFORMACIONES CANONICAS


PARA EL OSCILADOR ARMONICO

127

Similarmente, una funci


on tipo F1 (q, Q, t) no puede generar la transformaci
on identidad, ya que las Ecs.
(7.16) nos llevan a
F1 (q, Q, t)
pi =
qi
y definen a pi en funci
on de q, Q, t, pero en la transformaci
on identidad, pi solo es funci
on de Pi . Adicionalmente,
no es posible obviar esta dificultad definiendo una funci
on F1 mediante una transformada de Legendre del tipo
(7.21), aplicada a la generadora F2 de la identidad.
F1 (q, Q, t) = F2 (q, P, t) Pi Qi = qi Pi Pi Qi
pero en la transformaci
on identidad es obvio que q = Q de modo que
F1 (q, Q, t) = Qi Pi Pi Qi = 0
que no es una funci
on generatriz. Similar resultado se obtiene si se intenta generar la transformaci
on de
permutaci
on a partir de una funci
on F2 que provenga de la transformaci
on de Legendre del generador F1 de
permutaci
on. No obstante, se puede demostrar que una funci
on F3 puede generar la transformacion identidad
on.
y que una funci
on tipo F4 puede generar la permutaci
Finalmente, una transformaci
on que deja algunas parejas (q, p) inalteradas, e intercambia el resto (con un
cambio de signo), es una transformaci
on can
onica de tipo mixto. En un sistema de dos grados de libertad, la
transformaci
on
Q1 = q1 , P1 = p1
Q2 = p 2 ,

P2 = q2

(7.29)

es generada por la funci


on
F = q1 P1 + q2 Q2

(7.30)

que es una mezcla entre funciones de tipo F1 y F2 . El termino tipo F1 produce permutaci
on y el termino tipo
F2 es del tipo identidad.

7.4.

Transformaciones can
onicas para el oscilador arm
onico

El Hamiltoniano para el oscilador arm


onico se escribe como
H=


1
k
p 2 + m2 2 q 2 ; 2
2m
m

esta forma en suma de cuadrados en q y p sugiere que para que la nueva coordenada sea cclica, podemos
hallar una transformaci
on de la forma
p = f (P ) cos Q ; q =

f (P )
sin Q
m

(7.31)

Dado que la transformaci


on (7.31) no depende explcitamente del tiempo, el Hamiltoniano no cambia numericamente y en las nuevas coordenadas queda
K=H=

 f 2 (P )
f 2 (P )
cos2 Q + sin2 Q =
2m
2m

(7.32)

de modo que Q resulta cclica. Solo nos queda hallar la forma de f (P ) tal que la transformaci
on (7.31) sea
canonica. El cociente entre la Ecs. (7.31) nos lleva a
p = mq cot Q

(7.33)


CAPITULO 7. TRANSFORMACIONES CANONICAS

128

que es independiente de f (P ). Esta transformaci


on es de la forma p = p (q, Q) lo cual sugiere buscar una
funci
on generatriz tipo F1 , pues el primer conjunto de Ecs. (7.16) nos da pi = pi (q, Q, t) en la forma
p=

F1 (q, Q, t)
q

(7.34)

y la soluci
on m
as sencilla de F1 para la Ec. (7.33) es
F1 (q, Q, t) =

mq 2
cot Q
2

(7.35)

naturalmente, F1 debe satisfacer la otra mitad de las ecuaciones de transformaci


on (7.16)
P =
despejando q se obtiene
q=

F1
mq 2
=
Q
2 sin2 Q

(7.36)

(7.37)

2P
sin Q
m

que al compararla con la segunda de las Ecs. (7.31) nos da


f (P ) =

2mP

(7.38)

al reemplazar este factor en el nuevo Hamiltoniano (7.32) queda


K = H = P
que claramente es cclico en Q, con lo cual P es una constante de movimiento. Como H es constante y es la
energa del sistema, el nuevo momento can
onico viene dado por
P =

(7.39)

y la ecuaci
on de Hamilton para Q se reduce a
K
Q =
=
P
cuya soluci
on es
Q = t +

(7.40)

siendo una constante de integraci


on fijada por las condiciones iniciales. Sustituyendo (7.39) y (7.40) en (7.37)
resulta
r
2E
q=
sin (t + )
m 2
que es la soluci
on conocida para el oscilador arm
onico.
Cabe ahora la pregunta, que nos asegura que la transformaci
on definida por (7.31) y por (7.38) es can
onica?. Lo asegura el hecho de que tal transformaci
on es generada por una funci
on generatriz tipo 1 Ec. (7.35)
que cumple con sus ecuaciones diferenciales Ecs. (7.34) y (7.36).

7.5. TRANSF. CANONICAS


CON LA FORMA SIMPLECTICA
DE LAS ECS. DE HAMILTON

7.5.

129

Transformaciones can
onicas usando la forma simpl
ectica de las ecuaciones de Hamilton

El metodo de las funciones generatrices es formalmente completo para tratar el problema de caracterizar
todas las transformaciones can
onicas, puesto que el principio de Hamilton modificado me garantiza la existencia
de una funci
on generatriz para cualquier transformaci
on que deje invariante la forma de las ecuaciones de
Hamilton. Sin embargo, en la pr
actica puede ser muy difcil encontrar una funci
on generatriz4 y si no estamos
seguros de si la transformaci
on es can
onica puede ser muy difcil demostrar la existencia o no existencia de
la funci
on generatriz. Por esta raz
on, se hace necesario encontrar metodos que sean m
as sistem
aticos para
verificar si una transformaci
on es o no es can
onica.
Otro metodo para tratar las transformaciones can
onicas, consiste en la utilizaci
on de las ecuaciones de
Hamilton simplecticas descritas en la secci
on 6.5 a traves de las Ecs. (6.33). Consideraremos primero el caso
de transformaciones can
onicas restringidas, es decir que no dependen explcitamente del tiempo
Qi = Qi (q, p) ; Pi = Pi (q, p)

(7.41)

la primera caracterstica notable es que el Hamiltoniano no cambia ante una transformaci


on can
onica restringida, como se ve de (7.14, 7.17). Su forma funcional puede ser diferente pero se conserva su valor numerico.
La idea es que la transformaci
on sea can
onica, lo cual es equivalente a exigir que las nuevas coordenadas Q, P
cumplan ecuaciones de Hamilton para el nuevo Hamiltoniano K = H
H
H
Q i =
; P i =
Pi
Qi

(7.42)

Estudiaremos el primer conjunto de Ecs. (7.42), evaluemos primero Q i el cual se calcula con base en
(7.41), y en las ecuaciones de Hamilton para las coordenadas antiguas (es decir asumiendo que las coordenadas
originales tambien son can
onicas)
Qi
Qi
Qi H
Qi H
Q i =
qj +
p j =

qj
pj
qj pj
pj qj

(7.43)

ahora calculamos el termino de la derecha en el primer conjunto de Ecs. (7.42), para lo cual se requieren las
inversas de (7.41)
qj = qj (Q, P ) ; pj = pj (Q, P )
(7.44)
las cuales nos permiten calcular H (q, p, t) en terminos de Q, P, t, as como el termino en cuesti
on
H
H pj
H qj
=
+
Pi
pj Pi
qj Pi

(7.45)

El primer conjunto de Ecs. (7.42), nos conduce a igualar los terminos de la derecha en (7.43) y (7.45) con lo
cual resulta








pj
qj
Qi
Qi
=
;
=
(7.46)
qj q,p
Pi Q,P
pj q,p
Pi Q,P
donde los subndices enfatizan los argumentos en los cuales queda evaluada cada expresi
on. Con un procedimiento similar, el segundo conjunto de Ecs. (7.42) nos lleva a las siguientes condiciones








pj
qj
Pi
Pi
=
;
=
(7.47)
qj q,p
Qi Q,P
pj q,p
Qi Q,P
el conjunto de condiciones (7.46) y (7.47) se conoce usualmente como condiciones directas para una transformaci
on can
onica restringida.
4

Vale la pena mencionar que los cuatro tipos b


asicos de funciones generatrices que se han estudiado no cubren el espectro de
todas las transformaciones can
onicas.


CAPITULO 7. TRANSFORMACIONES CANONICAS

130

El procedimiento anterior se puede realizar en forma matricial usando las ecuaciones de Hamilton simplecticas descritas en la secci
on 6.5. Partimos de la formulaci
on simplectica descrita en las Ecs. (6.33).
= J

(7.48)

con J y definidos por (6.29, 6.31). Similarmente, el nuevo conjunto coordenado Qi , Pi define una matriz
columna de dimensi
on 2n an
aloga a , denotamos esta matriz por , y para una transformacion can
onica
restringida, las Ecs. (7.41) se pueden escribir como
= ()

(7.49)

ahora bien, la condici


on can
onica exige que se cumplan las Ecs. (7.42), que matricialmente se escriben en la
forma
H
= J
(7.50)

donde hemos tenido en cuenta que una transformaci


on can
onica restringida no cambia el valor numerico del
Hamiltoniano como se vi
o en el formalismo de la funci
on generatriz. Evaluemos primero el termino de la
izquierda en (7.50) teniendo en cuenta (7.49)
i
i =
j
j

i, j = 1, . . . , 2n

definimos entonces la matriz jacobiana de la transformaci


on
Mij

i
j

i = Mij j

(7.51)

matricialmente queda
= M

(7.52)

H
= MJ

(7.53)

reemplazando (7.48) en (7.52) resulta

por otro lado, a traves de la relaci


on inversa de (7.49), H se puede escribir como funci
on de , y podemos
evaluar tambien el termino de la derecha en (7.50)
H
H j
=
i
j i
matricialmente esto se escribe

reemplazando (7.54) en (7.53)

H
H
fij H
= Mji
=M
i
j
j

H
f H
=M

f H
= MJM

(7.54)

(7.55)

y teniendo en cuenta la condici


on (7.50), en comparaci
on con (7.55), se concluye que la transformaci
on (7.49)
es can
onica si M satisface la condici
on
f=J
MJM
(7.56)

esta condici
on tambien es necesaria para una transformaci
on can
onica restringida, como se puede ver invirtiendo los pasos anteriores. La condici
on (7.56), se puede escribir de varias maneras. Por ejemplo, multiplicando
f 1 a la derecha en ambos miembros
por M
f 1
MJ = JM
(7.57)

7.5. TRANSF. CANONICAS


CON LA FORMA SIMPLECTICA
DE LAS ECS. DE HAMILTON

131

la transposici
on y la inversi
on se pueden tomar en cualquier orden. Si se comparan explcitamente las condiciones que se derivan de (7.57), se observa que coinciden con las expresadas en las Ecs. (7.46) y (7.47).
Adicionalmente, usando (6.32) vemos que la Ec. (7.57) se puede transformar en

o equivalentemente

f 1 (J)
JMJ (J) = J2 M
f 1 J
JM = M
f
MJM
=J

(7.58)

f = J
MJM

(7.59)

La ecuaci
on (7.56), o la versi
on equivalente (7.58) se conocen como condiciones simpl
ecticas para una
transformaci
on can
onica y la matriz M que satisface esta condici
on, se denomina matriz simpl
ectica.
Para una transformaci
on can
onica extendida restringida (independiente del tiempo e incluyendo una transformaci
on de escala), donde K = H, la condici
on (7.56) resulta

7.5.1.

Ejemplos de transformaciones can


onicas con m
etodo matricial

Veamos un ejemplo explcito. Tomemos la funci


on mixta definida en la Ec.
F1 (q2 , Q2 ). Las matrices , y J son

q1
Q1
0
0 1 0
q2
Q2
0
0 0 1

=
p1 ; = P1 ; J = 1 0 0 0
p2
P2
0 1 0 0

(7.30) F = F2 (q1 , P1 ) +

(7.60)

tomando las ecuaciones de transformaci


on (7.29) y deriv
andolas con respecto al tiempo, se pueden comparar

estas transformaciones con las descritas por = M (Ec. 7.52) con el fin de obtener la matriz M

Q1
1 0 0 0
q1
q1
Q 2 0 0 0 1 q2 p 2

P1 = 0 0 1 0 p 1 = p 1
p 2
q2
0 1 0 0
P2
por lo tanto

1 0
0 0
M=
0 0
0 1

0
0
1
0

0
1

0
0

(7.61)

Naturalmente, el hecho de que esta transformaci


on haya sido obtenida con una funci
on generatriz y sus
ecuaciones diferenciales asociadas, garantiza el car
acter can
onico de la transformaci
on. No obstante, el lector
puede verificar el car
acter can
onico de la transformaci
on observando que las matrices J y M de las Ecs. (7.60,
7.61), cumplen con la condici
on simplectica (7.58).
Por otro lado, las ecuaciones de Hamilton para las nuevas variables i.e. = J (H/) (Ec. 7.50), se
expresan sin dependencia con la funci
on generatriz

Q1
0
0 1 0
H/Q1
Q 2
0

0 0 1

H/Q2
P1 = 1 0 0 0 H/P1
0 1 0 0
H/P2
P2

Q1
P1
0
0 1 0

Q 2
0

0 0 1

P2
P1 = 1 0 0 0 Q 1
0 1 0 0
P2
Q 2


CAPITULO 7. TRANSFORMACIONES CANONICAS

132

M es funci
on de F (ya que depende de la transformaci
on can
onica especfica), pero no as J la cual es una
matriz constante (ver Ec. 6.31). Este formalismo no se puede aplicar en todos los casos. En particular, no se
puede construir una matriz simple M para generar la transformaci
on can
onica usada para el oscilador arm
onico
en la secci
on 7.4.

7.6.

Acercamiento simpl
ectico para transformaciones can
onicas dependientes del tiempo

Cuando la transformaci
on a las nuevas coordenadas depende explcitamente del tiempo, ya no son v
alidos los
argumentos anteriores. Sin embargo, se sigue cumpliendo que la condici
on simplectica es necesaria y suficiente
para que la transformaci
on sea can
onica. Esto se puede probar por argumentos similares a los arriba expuestos,
pero es mas f
acil a traves de otro camino que explota el hecho de que el tiempo act
ua como un par
ametro en
la transformaci
on can
onica. Una transformaci
on can
onica de la forma
= (, t)
evoluciona contnuamente con el tiempo a partir de un cierto t0 . Es una transformaci
on contnua uniparametrica. Si la transformaci
on
(t)
(7.62)
es can
onica, se tiene que en particular la transformaci
on
(t0 )

(7.63)

on de transformaci
on can
onica, que la
es can
onica siendo t0 un tiempo fijo, se sigue entonces de la definici
transformaci
on caracterizada por
(t0 ) (t)
(7.64)
es tambien can
onica. Puesto que en (7.63) el tiempo es fijo, esta transformaci
on can
onica debe satisfacer la
condici
on simplectica (7.58). Si podemos probar que (7.64) cumple la condici
on simplectica, es f
acil mostrar
que la transformaci
on general (7.62) tambien la cumple.
Para demostrar que la condici
on simplectica es a
un necesaria y suficiente para transformaciones de la forma
(7.64) usaremos la noci
on de transformaci
on can
onica infinitesimal (TCI) en la cual todas las coordenadas
nuevas difieren de las antiguas por cantidades infinitesimales
Qi = qi + qi

(7.65)

Pi = pi + pi

(7.66)

= +

(7.67)

que matricialmente se puede escribir como


la notaci
on qi , pi no se refiere a desplazamientos virtuales, simplemente cambios infinitesimales en las coordenadas (cambio en coordenadas no implica movimiento del sistema ni real ni virtual). Como una transformaci
on
canonica infinitesimal difiere solo infinitesimalmente del operador identidad, es natural comenzar con una funci
on generatriz de la identidad coloc
andole una desviaci
on infinitesimal
F2 = qi Pi + G (q, P, t)

(7.68)

es una par
ametro infinitesimal y G es una funci
on con segundas derivadas contnuas en sus 2n+1 argumentos.
Dado que esta funci
on generatriz es de tipo 2, podemos emplear las Ecs. (7.19) de transformaci
on para los
momentos
F2
G
pj =
= Pj +
qj
qj

7.6. ACERCAMIENTO SIMPLECTICO


PARA TRANSFORMACIONES CANONICAS
DEPENDIENTES DEL TI
con lo cual
pj Pj pj =

G
qj

(7.69)

adicionalmente, usando las Ecs. (7.19) para transformacion de coordenadas


Qj =

F2
G
= qj +
Pj
Pj

dado que el segundo termino a la derecha es lineal en , y que Pj solo difiere de pj infinitesimalmente, entonces
es consistente a primer orden cambiar la variable de derivaci
on Pj por pj . De esta forma G se escribe en
terminos de q, p, t u
nicamente. El cambio infinitesimal qj se puede escribir a primer orden como
qj Qj qj =

G
pj

(7.70)

las ecuaciones de transformaci


on (7.69, 7.70), se pueden sintetizar en una ecuaci
on matricial
= J

(7.71)

una transformacion infinitesimal que nos interesa directamente, es la transformaci


on (7.64) cuando t difiere de
t0 en una cantidad infinitesimal
(t0 ) (t0 + dt)

(7.72)

dt hace las veces del . Dado que entre (, t0 ) y (, t) con t0 y t arbitrarios, la transformaci
on es contnua, se
puede construir como una sucesi
on de transformaciones infinitesimales en pasos de dt. Por lo tanto, bastar
a con
probar que la transformaci
on infinitesimal (7.72) satisface la condici
on simplectica (7.58). La TCI (7.71), tiene
asociada una matriz jacobiana, y se puede ver f
acilmente que esta u
ltima es simplectica. Tomando la definici
on
de matriz jacobiana (7.51) para una transformaci
on infinitesimal como (7.67) se obtiene
M

=1+

y usando (7.71), resulta



G
J

 2 
G
M = 1 + J

M = 1+

definimos la matriz

2G

ij

2G
i j

(7.73)

(7.74)

la cual es claramente simetrica, en virtud de la continuidad de las segundas derivadas de G. Teniendo adem
as
en cuenta que J es antisimetrico, y trasponiendo M en (7.73) resulta
^

2G

f = 1+
e
M
J

 2 
G
f
M = 1
J


CAPITULO 7. TRANSFORMACIONES CANONICAS

134

f
para chequear la condici
on simplectica (7.58) debemos hacer el producto MJM

 2   
 2 
G
G
f
MJM = 1
J J 1 + J

 2 
 2 

G
G
= J+J2

J2 + O 2

 2 
 2 

G
G
f
MJM
= J
+
+ O 2


f
MJM
= J + O 2

on simplectica
donde hemos usado la propiedad J2 = 1, de modo que a primer orden en , se cumple la condici
para la transformaci
on infinitesimal (7.72). Por tanto cualquier transformaci
on can
onica obedece la condici
on
simplectica a
un cuando sea explcitamente dependiente del tiempo. N
otese que es esencial que no haya contribuciones a primer orden en , ya que una transformaci
on can
onica finita, se obtiene con un proceso de
integraci
on sobre el par
ametro infinitesimal de las TCI. En consecuencia, los terminos de primer orden daran
una contribuci
on finita para una transformaci
on can
onica finita, y solo los terminos de segundo orden en
adelante tienden a cero despues de llevar a cabo la integraci
on.
A pesar de que en este acercamiento poco se ha usado el formalismo de la funci
on generatriz, tanto el
formalismo simplectico como el de la funci
on generatriz est
an conectados (ver secci
on 8.5). Se puede demostrar
por ejemplo que la condici
on simplectica implica la existencia de una funci
on generatriz. Cualquiera de los
dos formalismos se puede usar indistintamente de acuerdo con las necesidades y conveniencias. En particular,
cualquiera de los dos formalismos sirve para demostrar que las transformaciones can
onicas forman un grupo
matem
atico.

7.7.

Ejemplos de transformaciones can


onicas

En esta seccion estudiaremos el paso de un conjunto can


onico de coordenadas {qi , pi } a otro conjunto de
coordenadas {Qi , Pi }. A menos que se indique lo contrario, se considerar
a que el conjunto de coordenadas
{qi , pi } es de hecho can
onico, y se asumir
a adem
as como el conjunto can
onico original (ya hemos dicho que
esto es cuesti
on de convenci
on), y en algunos casos se procurar
a averig
uar si el conjunto final {Qi , Pi } es
canonico o no.

7.7.1.

Transformaci
on can
onica por conjugaci
on compleja

Una forma natural de intentar combinar los dos conjuntos de ecuaciones de Hamilton en uno solo, es
formar una cantidad compleja con las coordenadas {q, p}, y convertir los dos conjuntos de ecuaciones en un
solo conjunto de ecuaciones complejas. Para un solo grado de libertad, definiremos una transformaci
on de la
forma
Q = (q + ip) ; P = (q ip)
(7.75)
y veremos si esta transformaci
on es can
onica, o bajo que condiciones lo es. La transformaci
on inversa es




1 1
1
1 1
1
q=
Q+ P
; p=
Q P
(7.76)
2

2i

En este caso utilizaremos las condiciones directas para transformaciones can


onicas restringidas (independientes del tiempo) dadas por las ecuaciones (7.46) y (7.47)
Q
p
=
q
P

Q
q
P
p
=
;
=
p
P
q
Q

P
q
=
p
Q

al aplicar (7.77) a las transformaciones (7.75) y sus inversas (7.76), tenemos que
=

1
1
1
1
; i =
; =
; i =
2i
2
2i
2

(7.77)


7.7. EJEMPLOS DE TRANSFORMACIONES CANONICAS

135

las cuatro ecuaciones son equivalentes y nos dan


=

1
2i

(7.78)

en particular las transformaciones con = = 1, no cumplen la condici


on (7.78) y por tanto no son can
onicas.
De hecho, la condici
on (7.78), indica que || =
6 ||, y nos muestra que las transformaciones (7.75) solo son
canonicas si incluyen una transformaci
on de escala no trivial. El lector puede comprobar de una forma similar
al ejemplo 4 P
ag. 121, que esta transformaci
on altera el valor del Hamiltoniano aunque sea independiente del
tiempo. Esto se debe a la inclusi
on de la transformaci
on de escala. Vemos entonces que una transformaci
on
canonica induce un cambio en el valor del Hamiltoniano si depende explcitamente del tiempo, o si incluye una
transformaci
on de escala.

7.7.2.

Transformaci
on can
onica de rotaci
on

Para un sistema de un grado de libertad, es natural pensar en una transformaci


on de rotaci
on para el
sistema {q, p} en un cierto angulo . Tendremos entonces la transformaci
on
Q = q cos p sin
P

= q sin + p cos

(7.79)

para averig
uar si esta transformaci
on es can
onica, utilizaremos la condici
on simplectica Ec. (7.56)

Podemos hallar M a traves de la ecuaci


on (7.52)

f=J
MJM

(7.80)

= M

(7.81)

para lo cual derivamos las Ecs. (7.79) con el tiempo, teniendo en cuenta que es fijo


Q
P

cos sin
sin cos



q
p

=M

q
p

evaluando explcitamente la condici


on (7.80) tenemos

 



cos sin
0 1
cos sin
f
M JM
=
sin cos
1 0
sin cos


 

cos sin
sin cos
0 1
f
MJM =
=
=J
sin cos
cos sin
1 0


vemos que la transformaci


on es can
onica para cada valor de .
Vamos a intentar encontrar una funci
on generadora de esta transformaci
on can
onica. Primero intentaremos
encontrar una funci
on del tipo F1 (q, Q), que obedece las ecuaciones diferenciales (7.16)
p=

F1 (q, Q)
q

P =

F1 (q, Q)
Q

(7.82)

La primera de las ecuaciones (7.82), requiere conocer p como funci


on de q, Q. Podemos lograr este despeje en
la primera de las Ecs. (7.79)
Q
+ q cot
sin
con lo cual la primera de las ecuaciones diferenciales (7.82) queda
p (q, Q) =

(7.83)


CAPITULO 7. TRANSFORMACIONES CANONICAS

136

F1 (q, Q)
Q
=
+ q cot
q
sin
que al integrar nos da
Qq
q2
+
cot + g(Q)
(7.84)
sin
2
para poder emplear la segunda de las ecuaciones diferenciales (7.82), debemos escribir P = P (q, Q), lo cual se
logra insertando (7.83) en la segunda de las ecuaciones de transformaci
on (7.79)


Q
q cos
+
P = q sin + p cos = q sin +
cos
sin
sin
q cos2 Q cos
P (q, Q) = q sin +

(7.85)
sin
sin
q
Q cos

(7.86)
P (q, Q) =
sin
sin
F1 (q, Q) =

utilizando (7.86) en la segunda de las Ecs. (7.82) resulta


F1 (q, Q)
q
Q cos
=
+
Q
sin
sin
que se puede integrar para obtener
qQ
Q2
+
cot + h(q)
sin
2
comparando las F1 de las ecuaciones (7.84, 7.87) encontramos una soluci
on haciendo
F1 =

h (q) =

q2
cot
2

; g (Q) =

(7.87)

Q2
cot
2

quedando finalmente
Qq
1
+ (q 2 + Q2 ) cot ; 6= n
(7.88)
sin 2
esta soluci
on es v
alida para todo , excepto para = n siendo n un entero, puntos en los cuales esta funci
on
diverge. Veremos ahora si existe una soluci
on tipo F2 (q, P ) que pueda cubrir los huecos dejados por la
soluci
on de F1 (q, Q). Las ecuaciones diferenciales (7.19), se escriben
F1 =

p=

F2 (q, P )
q

Q=

F2 (q, P )
P

(7.89)

la primera requiere conocer p = p (q, P ), y este despeje es directo de la segunda de las ecuaciones (7.79)
p=

P q sin
cos

F2
q

(7.90)

qP
q2

tan + f (P )
cos
2

(7.91)

p=

la soluci
on para F2 (q, P ) es de la forma
F2 =

para resolver la segunda ecuaci


on (7.89) necesitamos Q = Q (q, P ), lo cual se obtiene insertando (7.90) en la
primera de las ecuaciones (7.79)
Q = q cos (P q sin ) tan ;

Q=

F2
P


7.7. EJEMPLOS DE TRANSFORMACIONES CANONICAS

137

la soluci
on para F2 (q, P ) en este caso es
F2 = qP cos
F2 =

P2
sin2
tan + qP
+ g(q)
2
cos

qP
P2

tan + g(q)
cos
2

(7.92)

y comparando (7.91, 7.92), encontramos una soluci


on para F2 (q, P )
1
qP
F2 (q, P ) = (q 2 + P 2 ) tan +
2
cos

6=

1
n+
2

(7.93)

esta funci
on converge para = n, de modo que llena los huecos dejados por la funci
on F1 (q, Q) de la Ec.
(7.88). La funci
on (7.93) diverge para = (n + 1/2) , pero estos huecos son llenados por F1 .
La interpretaci
on de la transformaci
on (7.79) como una rotaci
on bidimensional nos hace intuir que = 0
corresponde a la identidad, como se observa al hacer = 0 en (7.79). Similarmente, haciendo = 0 en (7.93)
obtenemos F2 (q, P ) = qP , en concordancia con el generador de la identidad dado por la Ec. (7.22).
Ahora aplicando = /2 en las ecuaciones (7.79) tenemos
Q = p ; P = q
as mismo haciendo = /2 en (7.88), encontramos F1 = qQ, y coincide con la funci
on generadora de la
transformaci
on can
onica de permutaci
on o intercambio dada por la Ec. (7.28). Geometricamente, es claro que
una rotaci
on positiva de /2 convierte el eje Y en el eje X y el eje X en el eje Y negativo. Finalmente, las
ecuaciones (7.88, 7.93) muestran que la transformaci
on de intercambio no se puede generar con una funci
on
del tipo F1 y la identidad no se puede generar con una funci
on tipo F2 , como ya se mencion
o.

7.7.3.

Un sistema con dos grados de libertad

Para un sistema con dos grados de libertad, determinaremos si la transformaci


on
Q1 = q 1 q 2
Q2 = q 1 + q 2

p1 p2
+1
q2 q1
q 2 p2 q 1 p1
P2 =
(q2 + q1 )
q2 q1
P1 =

es can
onica. Para ello recurriremos a la condici
on simplectica. La matriz jacobiana de transformacion est
a dada
por la Ec. (7.51)
M11 =
M21 =
M31 =
M33 =

Q1
Q1
Q1
Q1
= q2 ; M12 =
= q1 ; M13 =
= 0 ; M14 =
=0
q1
q2
p1
p2
Q2
Q2
Q2
Q2
= 1 ; M22 =
= 1 ; M23 =
= 0 ; M24 =
=0
q1
q2
p1
p2
P1
p1 p2
P1
p1 p2
=
; M32 =
=
2
q1
q2
(q2 q1 )
(q2 q1 )2
P1
1
P1
1
=
; M34 =
=
p1
(q2 q1 )
p2
(q2 q1 )


CAPITULO 7. TRANSFORMACIONES CANONICAS

138

M41 =
=
M42 =
=
M43 =

P2
p2 q 2 p1 q 1
p1
p2 q2 p1 q1 (q2 q1 ) p1 (q2 q1 )2
=

1
=
q1
q2 q1
(q2 q1 )2
(q2 q1 )2
p2 q2 p1 q2 + 2q1 q2 q12 q22
(q2 q1 )2
P2
p2
p1 q 1 p2 q 2
=
+
1
q2
q2 q1
(q2 q1 )2

(q2 q1 ) p2 + p1 q1 p2 q2 (q2 q1 )2
p1 q1 p2 q1 + 2q1 q2 q12 q22
=
(q2 q1 )2
(q2 q1 )2
P2
q1
P2
q2
=
; M44 =
=
p1
q2 q1
p2
q2 q1

la matriz jacobaina y su transpuesta quedan entonces

q2
q1

1
1

(p1 p2 )
(p1 p2 )
M =
(q q )2

(q2 q1 )2
2
1

2
2

p2 q2 p1 q2 +2q1 q2 q1 q2
(q2 q1 )2

q2 1

f =
M
q1 1

0 0
0 0

p1 p2
(q1 q2 )2
p2
(qp1q
2
1
2)
1
q1 q2
1
q1 q2

p1 q1 p2 q1 +2q1 q2 q12 q22


(q2 q1 )2

(q12 +q22 +p1 q2 p2 q2 2q1 q2 )


2

0
0

0
0

1
(q2 q1 )
1
(q2qq
1)

1
(q2 q
1)

q2
(q2 q1 )

(q1 q2 )

(q12 +q22 p1 q1 +p2 q1 2q1 q2 )

(q1 q2 )2

q1

q1 q2
2
q1qq
2

y la matriz J en cuatro dimensiones est


a dada por

J=

022 122
122 022

0
0

0
0
=
1 0
0 1

1
0
0
0

0
1

0
0

f y verificar si coincide con J. Con una dosis de paciencia y una buena


ahora debemos realizar el producto MJM
taza de cafe, el lector puede comprobar que se cumple la condici
on simplectica. Por tanto, esta transformaci
on
es can
onica.

7.8.

Ejercicios

1. Demostrar que una funci


on del tipo F3 (p, Q, t) puede generar la transformaci
on can
onica identidad, y
una funci
on del tipo F4 (p, P, t) puede generar la transformaci
on can
onica de intercambio o permutaci
on.
2. Sea q, p un conjunto can
onico para un grado de libertad. Demuestre que el conjunto Q, P dado por
Q = log (1 +

q cos p) ; P = 2 (1 +

q cos p) q sin p

(7.94)

es tambien un conjunto can


onico y que una funci
on generadora para esta transformaci
on est
a dada por
2
F3 (p, Q) = eQ 1 tan p

3. Para un sistema con dos grados de libertad, sean {qi , pi } variables can
onicas, y una transformaci
on
puntual de la forma
Q1 = q12 , Q2 = q1 + q2

7.8. EJERCICIOS

139

encuentre la transformaci
on m
as general para P1 y P2 que genere una transformaci
on can
onica. Ahora
sea el Hamiltoniano


p1 p2 2
+ p2 + (q1 + q2 )2
H=
2q1
Encuentre una transformaci
on particular para P1 y P2 de tal forma que Q1 y Q2 sean ambas cclicas.
Resuelva las ecuaciones de Hamilton y obtenga la soluci
on para q1 , q2 , p1 y p2 en funci
on del tiempo, y
en terminos de las condiciones iniciales.
4. La Ec. (2.45) define una transformacion gauge para los campos electromagneticos. Dicha transformaci
on
cambia al Hamiltoniano (6.26) y al momento can
onico (6.27). (a) Muestre que este cambio se puede
ver como una transformaci
on can
onica en donde q permanece inalterada. (b) Encuentre una funci
on
generadora del tipo 2, que genera dicha transformaci
on can
onica. Una transformaci
on canonica para n
grados de libertad que deja invariantes los qi se denomina una transformaci
on can
onica gauge.
5. Demuestre que la transformaci
on
p2
p1
sin ; Q2 = q2 cos
sin

= q2 sin + p1 cos ; P2 = q1 sin + p2 cos

Q1 = q1 cos
P1

(7.95)

es can
onica.
6. Una partcula de masa
 m ycarga q se mueve en un plano bajo la influencia combinada de un potencial
arm
onico (m/2) 02 q12 + q22 y un campo magnetico descrito por el potencial vectorial A = (0, hq1 , 0),
siendo h una constante. Use la transformaci
on can
onica (7.95) con tan 2 = m0 (qh)1 y escoja
adecuadamente, para encontrar el movimiento general as como el movimiento en los lmites h = 0 y
h .
7. (a) Demuestre que la transformaci
on
Q = p + iaq , P =

p iaq
2ia

es can
onica. (b) Encuentre una funci
on generadora. (c) Use esta transformaci
on para resolver el oscilador
arm
onico lineal.
8. Utilizando el procedimiento de la seccion 7.2, complete la tabla 7.1 de la P
ag. 124, para las funciones del
tipo F3 (p, Q, t) y F4 (p, P, t).

Captulo 8

Corchetes de Poisson y otros invariantes


can
onicos
Hemos visto que las transformaciones can
onicas son aquellas que preservan la forma de las ecuaciones de
Hamilton. Esto nos motiva a buscar estructuras que sean invariantes can
onicas, ya que si una cierta cantidad
preserva su forma ante transformaciones can
onicas, entonces es posible que dicha cantidad pueda enlazarse
f
acilmente con las ecuaciones de movimiento en cualquier base can
onica. Por otro lado, los invariantes can
onicos
tienen el potencial de expresar ecuaciones de movimiento equivalentes a las de Hamilton. Teniendo esto en
mente estudiaremos un invariante can
onico muy importante: los corchetes de Poisson. Adicionalmente, veremos
como las ecuaciones de movimiento y las cantidades conservadas se pueden escribir en el lenguaje de los
corchetes de Poisson. Haremos adem
as una breve menci
on de otros invariantes can
onicos.

8.1.

Corchetes de Poisson

Los corchetes de Poisson de dos funciones u, v con respecto a las variables can
onicas q, p se definen por
[u, v]q,p

u v
u v

qi pi pi qi

(8.1)

vemos que esta forma bilineal tiene la misma estructura simplectica de las ecuaciones de Hamilton en donde
q se acopla con p, y p con q. Por esta raz
on, esta definici
on se puede escribir en una estructura matricial
tambien simplectica
^
v
u
[u, v] =
J
; i qi , i+n pi with i n
(8.2)

en particular podemos tomar como funciones u, v elementos del conjunto de variables can
onicas (q, p). A partir
de la definici
on (8.1) o (8.2) estos corchetes tienen los valores
[qj , qk ]q,p = 0 = [pj , pk ]q,p
[qj , pk ]q,p = jk = [pk , qj ]q,p
en notaci
on matricial

(8.3)



[i , j ]q,p [, ]q,p
[, ]
ij

todas estas propiedades se pueden escribir en una sola ecuaci


on
[, ] = J

(8.4)

otro conjunto de funciones u, v interesantes seran los elementos del conjunto de nuevas variables can
onicas
(Q, P ) o , con respecto a las antiguas variables (q, p) o . Escribiendo estos corchetes en notaci
on matricial
140

8.1. CORCHETES DE POISSON

141

usando (8.2), resulta



^

J
[, ] =

pero las derivadas parciales definen precisamente el Jacobiano de la transformaci


on, con lo cual tenemos
f
[, ] = MJM

(8.5)

[, ] = J

(8.6)

y dado que la transformaci


on es canonica, la condici
on simplectica (7.58) nos lleva a escribir
se pueden revertir los pasos para mostrar que si (8.6) es v
alida, la transformaci
on es can
onica.
Los corchetes de Poisson de variables can
onicas en s tales como (8.4, 8.6), se denominan corchetes
fundamentales de Poisson. Las Ecs. (8.4) escritas en las nuevas variables can
onicas, dan
[, ] = J

(8.7)

y comparando (8.6) con (8.7) vemos que ambos tienen el mismo valor cuando se eval
uan con respecto a
cualquier conjunto de coordenadas can
onicas. En otras palabras, los corchetes fundamentales de Poisson son
invariantes bajo transformaciones can
onicas. La ecuaci
on (8.5), muestra que la invarianza es una condici
on
necesaria y suficiente para que la matriz de transformaci
on sea simplectica. La invarianza de los corchetes
fundamentales de Poisson ante el cambio de base can
onica, es entonces equivalente en todos los sentidos a la
condici
on simplectica.
Veremos ahora que todos los corchetes de Poisson son invariantes ante transformaciones can
onicas. Retomemos el corchete de Poisson para funciones arbitrarias u, v Ec. (8.2), la derivada de v con respecto a se
puede escribir en analoga con la Ec. (7.54)
v
k
v

similarmente

v i
v
fki v
=
Mik = M
i k
i
i
v
f
= M

^  ^  ^
u
f u = u M
= M

reemplazando estas expresiones en (8.2)

^
^
u
v
u
f v
[u, v] =
J
=
MJM

si la transformaci
on es can
onica, la condici
on simplectica (7.56) nos lleva a
^
u
v
[u, v] =
J
[u, v]

(8.8)

por tanto todos los corchetes de Poisson son invariantes can


onicos. Este resultado nos permite omitir
el subndice que denota el conjunto de variables que se usan para evaluar el corchete, siempre y cuando las
variables que se usen sean can
onicas. Vale la pena anotar sin embargo, que las transformaciones de escala,
as como las transformaciones can
onicas extendidas, en donde la condici
on simplectica toma la forma (7.59),
NO dejan invariantes a los corchetes de Poisson.
Recordemos que la definici
on original de transformaciones can
onicas surge de la necesidad de conservar la
forma de las ecuaciones de Hamilton ante un cambio de coordenadas generalizadas y momentos conjugados.
Esto sugiere que, dado que los corchetes de Poisson son invariantes can
onicos, podemos construr ecuaciones de
movimiento en terminos de corchetes de Poisson que sean invariantes en forma ante transformaciones can
onicas.
Desarrollaremos entonces un formalismo paralelo al formalismo de Hamilton basado en los corchetes de Poisson.

142

8.2.

CAPITULO 8. CORCHETES DE POISSON Y OTROS INVARIANTES CANONICOS

Propiedades de los corchetes de Poisson

Los corchetes de Poisson poseen una serie de propiedades algebraicas de fundamental importancia, las
cuales resumimos en la siguiente forma
[u, u] = 0 ; [u, v] = [v, u] (antisimetra)

[au + bv, w] = a [u, w] + b [v, w]

(linealidad)

[uv, w] = [u, w] v + u [v, w]

(8.9)
(8.10)
(8.11)

0 = [u, [v, w]] + [v, [w, u]] + [w, [u, v]] (no asociatividad)

(8.12)

donde u, v, w son funciones arbitrarias de las variables can


onicas y del tiempo en tanto que a y b son constantes.
Todas estas propiedades son directas a partir de la definicion (8.1), excepto quiz
as (8.12) conocida como la
identidad de Jacobi. A manera de ejemplo demostremos la propiedad (8.11) directamente con la definici
on




(uv) w
(uv) w
v
u
w
v
u
w
[uv, w] =

= u
+
v
u
+
v
qi pi
pi qi
qi qi pi
pi pi qi




v w
u w
u w
v w
v+u
[uv, w] =

qi pi pi qi
qi pi pi qi
[uv, w] = [u, w] v + u [v, w]
Veamos ahora la demostraci
on de la identidad de Jacobi (8.12). Esta propiedad muestra que la suma de
corchetes de Poisson dobles construdos con permutaciones cclicas de tres funciones es cero. Estrictamente,
esta propiedad se puede demostrar con un reemplazo explcito a partir de la definici
on, sin embargo, un cambio
de nomenclatura puede abreviar notablemente la demostraci
on, las derivadas parciales las escribiremos como
ui

u
i

vij

2v
= vji
i j

(8.13)

con esta notaci


on el corchete de Poisson (8.2), se escribe
[u, v] = ui Jij vj
esta notaci
on resulta particularmente pr
actica para expresar los corchetes dobles de Poisson. Escribamos el
primer corchete doble de (8.12) en esta notaci
on
[u, [v, w]] = ui Jij [v, w]j = ui Jij (vk Jkl wl )j
ahora calculamos la derivada parcial con respecto a j usando regla del producto, teniendo en cuenta que las
Jkl son constantes,
[u, [v, w]] = ui Jij (vk Jkl wlj + vkj Jkl wl )
y el mismo procedimiento se realiza para los otros dos corchetes dobles en (8.12), con lo cual se obtiene otros
cuatro terminos, para un total de 6 terminos. Los otros terminos se pueden obtener por permutaci
on circular
de u, v, w
[w, [u, v]] = wi Jij (uk Jkl vlj + ukj Jkl vl )
[v, [w, u]] = vi Jij (wk Jkl ulj + wkj Jkl ul )
Todos los 6 terminos tienen una segunda derivada en alguna de las funciones u, v, w. Tomemos los dos terminos
que contienen segunda derivada en w
W1 ui Jij vk Jkl wlj

W2 vi Jij wkj Jkl ul

8.3. CORCHETES DE LAGRANGE

143

el primero proviene de [u, [v, w]] y el segundo de [v, [w, u]]. Reescribamos estos terminos teniendo en cuenta
que las segundas derivadas parciales se pueden intercambiar y que la matriz J es antisimetrica
W1 ui Jij vk Jkl wlj = vk Jkl wlj Jij ui = vk Jkl wlj Jji ui

W2 = vi Jij wkj Jkl ul = vi Jij wjk Jkl ul = W1

donde hemos tenido en cuenta que todos los ndices se suman y por tanto son mudos. Es claro entonces que
W1 + W2 = 0, de modo que los dos pares de terminos que contienen segundas derivadas en w se anulan. Por
argumentos identicos, los otros dos pares que contienen segundas derivadas en u y v se anulan, con lo cual se
demuestra la identidad de Jacobi Ec. (8.12). N
otese que la u
nica propiedad que se us
o de J fue su antisimetra.
Corchetes de Poisson como estructuras algebraicas
De aqu en adelante abandonamos la notaci
on definida por (8.13). Si imaginamos al corchete de Poisson
como una ley de combinaci
on u operaci
on producto entre los elementos u, v, la identidad de Jacobi nos dice
que este producto o ley de combinaci
on no es asociativo, y nos dice cual es el efecto cuando cambia la secuencia
de multiplicaciones. Con frecuencia ocurre que tenemos una ley de combinaci
on o producto entre elementos
ui y uj que satisface las propiedades (8.9-8.12) adem
as de la propiedad
[ui , uj ] = ckij uk

(8.14)

siendo ckij cantidades denominadas constantes de estructura1 . En este caso, el conjunto de todos los elementos
u, v junto con la operaci
on producto, forman un algebra no conmutativa conocida como algebra de Lie. N
otese
que en este contexto la notaci
on [ui , uj ] se refiere a una ley de combinaci
on cualquiera y no a los corchetes
de Poisson. En el espacio tridimensional, los corchetes de Poisson cumplen la propiedad (8.14) de una manera
bien particular. O bien, todas las constantes de estructura son cero, o bien solo hay un termino en el lado
derecho de la ecuaci
on (8.14), para cada par de ndices i, j.
Un comentario final sobre algebras de Lie, nombraremos dos conjuntos de algebras de Lie particularmente
u
tiles en Fsica, la primera es el algebra definida sobre los vectores Euclidianos en R3 con la ley de combinaci
on
V

[A, B] A B

la segunda es el algebra definida sobre el conjunto de matrices n n con la operaci


on producto definida por
el conmutador entre ellas
M [A, B] AB BA
lo interesante es que muchos resultados solo dependen de la estructura de algebra y no de la forma explcita
de la ley de combinaci
on. Profundizar en estos t
opicos va m
as all
a de los prop
ositos de este texto, el lector
interesado puede consultar las Refs. [9, 10, 11].

8.3.

Corchetes de Lagrange

Sean u, v dos funciones pertenecientes a un conjunto de 2n funciones de las variables can


onicas, y que son
independientes entre s. Invirtiendo las ecuaciones se pueden escribir las variables can
onicas en funci
on de este
conjunto de 2n funciones. El corchete de Lagrange de u y v con respecto a las variables (q, p) se define como
qi pi pi qi

u v
u v
^

=
J
u
v

{u, v}q,p =
{u, v}
1

Nuevamente insistimos en que los ndices i, j, k en la Ec. (8.14) son r


otulos para un conjunto dado de elementos, y no denota
derivadas como en la Ec. (8.13).

144

CAPITULO 8. CORCHETES DE POISSON Y OTROS INVARIANTES CANONICOS

la prueba de su invarianza can


onica es muy similar a la de los corchetes de Poisson. Hay una especie de
relaci
on inversa entre los corchetes de Poisson y Lagrange, que se manifiesta en la siguiente propiedad: Sea ui
un conjunto de 2n funciones de las variables can
onicas e independientes entre s. Con este conjunto se puede
formar el vector u de dimensi
on 2n, y la matriz 2n 2n definida por {u, u}ij {ui , uj }. Similarmente se
define la matriz [u, u] para corchetes de Poisson, se deja como ejercicio verificar que
{u, u} [u, u] = 1

(8.15)

sin embargo, los corchetes de Lagrange no son de tan amplio uso como los de Poisson. La raz
on estriba en el
hecho de que esta nueva ley de combinaci
on posee las mismas propiedades fundamentales de los corchetes de
Poisson, pero con una importante excepci
on: los corchetes de Lagrange no obedecen la identidad de Jacobi y
por tanto no forman un algebra de Lie.

8.4.

Otros invariantes can


onicos

Un invariante can
onico muy importante es la magnitud de un elemento de volumen en el espacio de fase.
Una transformaci
on can
onica transforma el espacio de fase 2n dimensional con coordenadas i en otro
espacio de fase con coordenadas i . El elemento de volumen
(d) = dq1 . . . dqn dp1 . . . dpn
se transforma a un nuevo elemento de volumen (d)
(d) = dQ1 . . . dQn dP1 . . . dPn
como es bien sabido, las magnitudes de los dos elementos de volumen est
an enlazadas a traves del valor absoluto
del determinante de la matriz jacobiana
(d) = kMk (d)
Pero tomando el determinante en la condici
on simplectica (7.56), se obtiene



2
f
MJM
= kJk kMk kJk = kJk kMk = 1

de modo que el valor absoluto del determinante de M es uno (si la transformaci


on can
onica es real, el determinante es 1). Esto muestra entonces que el elemento diferencial de volumen en el espacio de fase es un
invariante can
onico. Como corolario resulta que el volumen de una regi
on arbitraria en el espacio de fase
Z
Z
Jn = . . . (d)

es un invariante can
onico. Esta integral de volumen es el miembro final de una secuencia de invariantes can
onicos que constan de integrales sobre subespacios del espacio de fase de diferentes dimensiones. Tal secuencia
es conocida como integrales invariantes de Poincar
e. Una vez m
as, remitimos al lector interesado en
profundizar en estos temas a las Refs. [9, 10, 11].

8.5.

Relaci
on entre la condici
on simpl
ectica y las funciones generatrices
(opcional)

La relaci
on entre los corchetes de Poisson y el formalismo de las funciones generatrices se puede sintetizar
en el teorema de Caratheodory, el cual enuncia que la condici
on simplectica implica la existencia de funciones
generatrices.
Por simplicidad examinaremos un sistema con espacio de fase dos dimensional. La extensi
on a espacios de
fase de dimensi
on arbitraria es directa. Comenzamos con el conjunto de transformaciones de la forma
Q = Q (q, p) ; P = P (q, p)

(8.16)

ENTRE LA CONDICION
SIMPLECTICA

8.5. RELACION
Y LAS FUNCIONES GENERATRICES (OPCIONAL)
si suponemos que la primera de estas transformaciones es invertible de modo que p se puede escribir como
funci
on de q, Q entonces
p (q, Q)
(8.17)
y si a su vez sustitumos esta expresi
on en la segunda ecuaci
on de transformaci
on, obtenemos P tambien en
funci
on de q, Q
P = P (q, (q, Q)) (q, Q)
(8.18)
queremos ahora enlazar estas transformaciones con las funciones generatrices. Dado que las Ecs. (8.17, 8.18)
tienen como argumentos a q, Q es natural que estas transformaciones se construyan con funciones generatrices
de tipo 1. En algunos casos, cuando la primera de las Ecs. (8.16) no es invertible (como en la transformaci
on
identidad) podemos comenzar invirtiendo la segunda de las Ecs. (8.16) y reemplazando en la primera, con lo
cual llegamos a funciones generatrices del tipo 2.
Volviendo a nuestro caso, asumiendo que existen funciones generatrices del tipo 1 que pueden generar a
las Ecs. (8.17, 8.18), estas se escriben seg
un la prescripci
on dada por (7.16)
p=

F1 (q, Q)
F1 (q, Q)
; P =
q
Q

(8.19)

si las ecuaciones (8.19) se cumplen (es decir, si es consistente nuestra suposici


on de que existe una funci
on
generatriz del tipo 1) entonces se debe cumplir que




F1
F1

[p (q, Q)] =
[P (q, Q)]
Q q
q Q
Q
q

=
(8.20)
Q
q
donde hemos usado (8.19), (8.17), y (8.18). Recprocamente, si se cumple (8.20) debe existir una funci
on de
tipo 1 que satisfaga (8.19).
Para demostrar la validez de (8.20), escribiremos todas las cantidades en terminos de q, Q. Comenzamos
con la identidad
Q
=1
Q
sustituyendo la Ec. (8.17) en la primera de las Ecs. (8.16)
Q = Q (q, (q, Q))
la derivada parcial anterior se puede escribir como
Q
Q
=
=1
Q
p Q

(8.21)

ahora evaluamos el corchete de Poisson


[Q, P ]

Q P
P Q

=1
q p
q p

(8.22)

donde hemos usado las propiedades (8.3).


Las derivadas de P son derivadas de (ver Ec. 8.18) consideradas como funciones de q y Q (q, p) con lo
cual se tiene
P
(q, Q (q, p))

Q
=
=
+
q
q
q
Q q
Por lo tanto, el corchete de Poisson (8.22) se escribe
Q Q Q
[Q, P ] =

q Q p
p

Q
+
q
Q q

=1

146

CAPITULO 8. CORCHETES DE POISSON Y OTROS INVARIANTES CANONICOS

reorganizando terminos


Q Q Q Q
Q
[Q, P ] =

=1
Q q p
p q
p q
Q
=1
[Q, P ] =
p q

(8.23)

Combinando (8.23) con (8.21) resulta


Q
Q
=
p Q
p q

(8.24)

dado que la derivada parcial Q


a evaluada a ambos lados para los mismos argumentos (variando Q y
p est
manteniendo fijo q), se tiene que su valor a ambos lados de la igualdad es el mismo. Por otro lado esta derivada
es diferente de cero si asumimos que la primera de las Ecs. (8.16) es invertible. Por tanto la ecuaci
on (8.24) nos
lleva a la Ec. (8.20) que nos lleva a la existencia de una funci
on generatriz para la transformaci
on (8.16). Para
llegar a (8.20) hemos partido de la Ec. (8.22), que nos dice que [Q, P ] = 1, pero recordemos que esta propiedad
es equivalente a la condici
on simplectica. Por tanto, la condici
on simplectica nos lleva a la existencia de una
funci
on generatriz y viceversa. Los dos formalismos son entonces equivalentes.

8.6.

Ecuaciones de movimiento con corchetes de Poisson

Dado que los corchetes de Poisson son invariantes can


onicos, las ecuaciones de movimiento que involucren
a estas cantidades van a conservar su forma ante transformaciones can
onicas. Por ejemplo, veamos la ecuaci
on
de movimiento asociada a una funci
on u de las variables can
onicas q, p, t. Usando las ecuaciones de Hamilton,
la derivada temporal total de esta funci
on se puede escribir como
du
u
u
u
u H
u H
u
=
qi +
p i +
=

+
dt
qi
pi
t
qi pi
pi qi
t
lo cual se escribe como

du
u
= [u, H] +
dt
t

(8.25)

la derivaci
on de (8.25), tambien se puede realizar en notaci
on simplectica, la regla de la cadena la escribimos
como
^
du
u
u
=
+
dt

t
y usando las Ecs. de Hamilton y la definici
on de los corchetes de Poisson en forma simplectica Ecs. (6.33) y
(8.2) se tiene
^
du
u
H
u
u
=
J
+
= [u, H] +
dt

t
t
La expresi
on (8.25) se puede ver como una ecuaci
on de movimiento generalizada para una funcion arbitraria
u (q, p, t) en la formulaci
on de los corchetes de Poisson. Una escogencia muy natural es u = qi o u = pi con lo
cual resulta
qi = [qi , H]
= [, H]

; p i = [pi , H]
(8.26)

n
otese que estas ecuaciones dependen de que q/t = 0. Esto se puede ver del hecho de que u (q, p, t) /t
consiste en evaluar la raz
on de cambio de u manteniendo fijo q y p moviendo solo el tiempo, y esto es v
alido
en particular cuando u = q. Se observa que esto es diferente al caso en el cual se toma q = q (t) en cuyo caso

8.7. CONSTANTES DE MOVIMIENTO CON CORCHETES DE POISSON

147

q/t = dq/dt = q.
Argumento similar se sigue para ver que p/t = 0. Usando la definici
on simplectica de
los corchetes de Poisson (8.2) queda
^

u
u
u
[, u] =
J
=IJ
=J

(8.27)

tomando u = H y reemplazando en (8.26), resulta


= J

que son las ecuaciones de Hamilton en forma simplectica. Vemos entonces que tomando la expresi
on general
(8.25), con u = q, p resultan las ecuaciones de movimiento para q, p que coinciden con las ecuaciones de
Hamilton como era de esperarse. Otra propiedad familiar resulta cuando se toma u = H en (8.25), lo cual nos
arroja
H
dH
=
dt
t
que coincide con (6.38). N
otese que la ecuaci
on de movimiento (8.25) es invariante en forma ante una transformaci
on can
onica. La ecuaci
on es v
alida cualquiera que sea el conjunto de coordenadas can
onicas que se use
para expresar a u y para evaluar el corchete de Poisson. No obstante, debe tenerse en cuenta que el Hamiltoniano que se use debe ser apropiado para el conjunto de variables can
onicas elegido, cuando se pasa a otro
conjunto de variables can
onica debemos cambiar al Hamiltoniano transformado o Kamiltoniano.
Un comentario final, la ecuaci
on de movimiento (8.25) solo ser
a v
alida si u solo es funci
on explcita de las
coordenadas q, p del sistema y del tiempo, es decir u no puede ser funci
on explcita de una variable externa
(por ejemplo no podra ser funci
on explcita de un campo electrico externo) toda la dependencia de u con
respecto al exterior debe estar en el par
ametro tiempo.

8.7.

Constantes de movimiento con corchetes de Poisson

Otro caso de gran interes surge cuando u es una constante de movimiento i.e. du/dt = 0, con lo cual (8.25)
se reduce a
u
[H, u] =
(8.28)
t
e inversamente, todas las funciones que obedezcan la ecuaci
on de movimiento (8.28), son constantes de movimiento. Esta ecuaci
on nos provee de un metodo sistem
atico para encontrar constantes de movimiento. Adicionalmente, si la constante de movimiento no involucra al tiempo explcitamente, la condici
on sobre u se reduce
a
[H, u] = 0
(8.29)
Si conocemos dos constantes de movimiento, la identidad de Jacobi nos da la posibilidad de obtener m
as
constantes de movimiento. Si u, v son constantes de movimiento que no dependen explcitamente del tiempo,
podemos usar la identidad de Jacobi (8.12) para escribir
[u, [v, H]] + [v, [H, u]] + [H, [u, v]] = 0

(8.30)

los dos primeros miembros de la izquierda son cero y queda


[H, [u, v]] = 0
lo cual nos dice que [u, v] es una constante de movimiento. Cuando u, v dependen explcitamente del tiempo,
el corchete de Poisson entre ellos sigue siendo constante de movimiento, aunque la demostraci
on es un tanto


CAPITULO 8. CORCHETES DE POISSON Y OTROS INVARIANTES CANONICOS

148

m
as elaborada. Al ser u y v constantes de movimiento se cumple para ambos la Ec. (8.28), al reemplazar dicha
ecuaci
on en la identidad de Jacobi (8.30) se obtiene
 
   
v
u
u,
+ v,
+ [H, [u, v]] = 0
t
t
     
v
u
, u + v,
= [H, [u, v]]
t
t
usando la definici
on de los corchetes de Poisson obtenemos

 

 
 

 

 

v
v
u
u
u
u
v

= [H, [v, u]]


qi t
pi
pi t
qi
qi pi t
pi qi t

 

 

 

 
u

v
u
v u
v u
v

= [H, [v, u]]


t qi
pi
t pi
qi qi t pi
pi t qi
 

 

 
  

v
u
v u
v u

v
u
+

= [H, [v, u]]


t qi
pi qi t pi
pi t qi
t pi
qi
reagrupando terminos




u v
v u

= [H, [v, u]]


t qi pi
t qi pi


v u
u v

= [H, [v, u]]


t qi pi qi pi

[v, u] = [H, [v, u]]


t
al comparar con (8.28) se obtiene que [v, u] = [u, v] es una constante de movimiento. Llegamos entonces al
Theorem 5 Teorema de Poisson: El corchete de Poisson de dos constantes de movimiento es tambien una
constante de movimiento.
En consecuencia, la aplicaci
on reiterada del teorema de Poisson nos puede proveer de un conjunto de constantes de movimiento. Desafortunadamente, este algoritmo nos lleva con frecuencia a constantes de movimiento
triviales o claramente dependientes de las anteriores. Sin embargo, el metodo debe ser tenido en cuenta para
m
ultiples aplicaciones.
Vale la pena mencionar que la condici
on (8.28) es necesaria y suficiente para que una cierta funci
on de las
variables q, p del sistema y el tiempo sea constante de movimiento. Sin embargo, tal expresi
on no nos da un
algoritmo para encontrar constantes de movimiento, m
as bien es un metodo para chequear si una cantidad dada
es o no es una constante de movimiento del sistema. Esta forma de evaluaci
on posee no obstante la ventaja
de que podemos verificar si una cantidad es o no es constante de movimiento sin resolver completamente la
evoluci
on del sistema. Finalmente, enfatizamos de nuevo que para que esta formulaci
on sea v
alida, u no puede
ser funci
on explcita de ninguna variable externa al sistema.

8.8.
8.8.1.

Ejemplo de constantes de movimiento evaluadas por corchetes de


Poisson
Sistema con dos grados de libertad

Sea un sistema de dos grados de libertad descrito por el Hamiltoniano


H = q1 p1 q2 p2 aq12 + bq22
mostraremos que
F1 =

p1 aq1
q2

F2 = q1 q2

8.8. EJEMPLO DE CONSTANTES DE MOVIMIENTO EVALUADAS POR CORCHETES DE POISSON149


son constantes de movimiento. Puesto que F1 y F2 no dependen explcitamente del tiempo, solo debemos
chequear que los corchetes de Poisson de estas cantidades con el Hamiltoniano se anulen

 

H F1
F1 H
H F1 F1 H

[H, F1 ] =
+
q1 p1
q1 p1
q2 p2
q2 p2


  



1
a
(p1 aq1 )
[H, F1 ] = (p1 2aq1 )
q1 + (p2 + 2bq2 ) 0
(q2 )
q2
q2
q22
(p1 2aq1 ) aq1 (p1 aq1 )
+

=0
[H, F1 ] =
q2
q2
q2
por tanto F1 es constante de movimiento, veamos a F2
[H, F2 ] = [(p1 2aq1 ) 0 (q2 ) q1 ] + [(p2 + 2bq2 ) 0 (q1 ) (q2 )]
[H, F2 ] = q2 q1 + q1 q2 = 0

luego F2 tambien es constante de movimiento. Dado que tenemos dos constantes de movimiento, es inmediato
pensar que el teorema de Poisson podra proveernos de otras constantes de movimiento independientes. Para
ello debemos evaluar el corchete de Poisson entre estas constantes

 

F2 F1 F1 F2
F2 F1
F1 F2
[F2 , F1 ] =

+
q1 p1
q1 p1
q2 p2
q2 p2

  

 



1
a
(p1 aq1 )

(0) + (q1 ) (0)
0
[F2 , F1 ] = (q2 )
q2
q2
q22
[F2 , F1 ] = 1
se concluye que la unidad es una constante de movimiento, lo cual es cierto pero trivial. En este caso el
teorema de Poisson no es u
til para generar constantes de movimiento independientes. N
otese que en general
lo u
nico que afirma el teorema es que el corchete entre dos constantes de movimiento es otra constante de
movimiento, pero no nos dice si esa constante es no trivial o si es independiente de las dos anteriores. M
as
adelante veremos algunos ejemplos en donde el teorema de Poisson nos genera constantes de movimiento no
triviales e independientes de las anteriores.

8.8.2.

Otro sistema con dos grados de libertad

Un sistema fsico que se mueve en un plano, est


a descrito por el Hamiltoniano
|p|n
(8.31)
ar n
b
donde p es el vector de los momentos conjugados a las coordenadas cartesianas. Usaremos los corchetes de
Poisson para demostrar que la cantidad
pr
D=
Ht
(8.32)
n
es una constante de movimiento. Comenzaremos escribiendo el Hamiltoniano (8.31) en componentes
H=

(pk pk )n/2
a (xk xk )n/2
b
H
n
= anxi (xk xk )1n/2 ;
= pi (pk pk )1+n/2
pi
b

H =
H
xi

evaluaremos el siguiente corchete de Poisson


n
n
(pk xk ) H
(pk xk ) H
n

= (pi pi ) (pk pk )1+ 2 an (xi xi ) (xk xk )1 2


xi pi
pi xi
b
n/2
n
n 2 n/2
[p r, H] =
(pk pk )n/2 an (xk xk )n/2 =
p
an r2
b
b

|p|n
[p r, H] = n
a |r|n = nH
(8.33)
b

[p r, H] = [pk xk , H] =


CAPITULO 8. CORCHETES DE POISSON Y OTROS INVARIANTES CANONICOS

150

la ecuaci
on de movimiento para la cantidad D definida en (8.32), ser
a entonces
dD
dt
dD
dt

= [D, H] +
= 0

i
 [p r, H]
D h p r
p r
nH
=
Ht, H +
Ht =
[H, H] t H =
0H
t
n
t
n
n
n

donde hemos usado (8.33), y el hecho de que H no depende explcitamente del tiempo. Hemos tenido en cuenta
adem
as que t (p r) = 0 (porque?). Conclumos entonces que D es una cantidad conservada.
Podemos aplicar este ejemplo al caso particular de un solo grado de libertad en el cual n = a1 = b = 2,
el Hamiltoniano y la cantidad conservada quedan
H=

1
p2
2
2
2q

D=

pq
Ht
2

(8.34)

para este Hamiltoniano la transformaci


on Q = q, p = P es una transformaci
on can
onica de escala. Consideremos adicionalmente, una transformaci
on de escala en el tiempo
Q = q, p = P, t0 = 2 t

(8.35)

las nuevas ecuaciones de Hamilton las expresaremos en terminos de Q (t0 ) y P (t0 )


0

Q t = q (t) = q

t0
2

1
1
; P t = p (t) = p

t0
2

(8.36)

puesto que q y p son can


onicas, ellas satisfacen las ecuaciones de Hamilton con el Hamiltoniano (8.34)2
dq (t)
dt
dq (t)
dt

H
dp (t)
H
1
= p (t) ;
=
= 3
p
dt
q
q (t)
dp (t)
1
= p (t) ;
= 3
dt
q (t)
=

(8.37)
(8.38)

Por otro lado, teniendo en cuenta las ecuaciones (8.35, 8.36, 8.38) tenemos
dQ (t0 )
dt0
dP (t0 )
dt0

=
=


1 dQ (t0 )
dq (t)
1
0
=
=
p
(t)
=
P
t
2 dt
2 dt

0
1 dP (t )
1 dp (t)
1 1
1
1
= 3
= 3 3
=
3 = Q3 (t0 )
2 dt
dt
q (t)
[q (t)]

hemos llegado entonces a las ecuaciones



dQ (t0 )
dP (t0 )
1
0
=
P
t
;
= 3 0
0
0
dt
dt
Q (t )

(8.39)

las cuales son identicas en forma a las ecuaciones (8.38). Es notable que las ecuaciones de movimiento para q y
p con el Hamiltoniano (8.34) son invariantes bajo la transformaci
on (8.35), a pesar de que dicha transformaci
on
no es can
onica. Esto se puede ver del hecho de que las transformaciones can
onicas son las transformaciones de
q, p m
as generales que dejan invariantes las ecuaciones de movimiento, pero no contemplan transformaciones
en el par
ametro tiempo. La constante de movimiento D, en la ecuaci
on (8.34) est
a asociada a esta invarianza3 .
2

en este caso escribimos dq/dt y dp/dt en lugar de q y p,


ya que debemos diferenciar bien los dos par
ametros temporales.
M
as adelante veremos que la relaci
on entre H y t, es muy similar a la relaci
on entre q y p, a pesar de que H y t no son
variables can
onicamente conjugadas. En la cantidad conservada D de la Ec. (8.34), podemos apreciar un producto qp asociado a
la transformaci
on de escala de las variables can
onicas y un producto Ht asociado a la transformaci
on de escala del Hamiltoniano
y el tiempo.
3

8.8. EJEMPLO DE CONSTANTES DE MOVIMIENTO EVALUADAS POR CORCHETES DE POISSON151

8.8.3.

Constante de movimiento del oscilador arm


onico

Los problemas considerados hasta aqu son un tanto academicos. Consideremos el problema mas Fsico del
oscilador arm
onico unidimensional con Hamiltoniano
H(q, p) =

p2
kq 2
+
2m
2

(8.40)

Demostraremos que para este sistema la cantidad Fsica definida por


u(q, p, t) = ln(p + imq) it

k
m

(8.41)

es una constante de movimiento y le daremos una interpretaci


on Fsica. En primer lugar, evaluamos la ecuaci
on
de movimiento para u (q, p, t)
du
u
u H
u H
u
= [u, H] +
=

+
dt
t
q p
p q
t
y utilizando el Hamiltoniano (8.40), resulta
du
dt
du
dt
du
dt

=
=

im  p 
1
ip kq

(kq) i =
i
p + imq m
p + imq
p + imq
ip m 2 q
p + imq
i = i
i = i i
p + imq
p + imq

= 0

para ver el significado Fsico de esta constante de movimiento exponenciamos las ecuaci
on (8.41)


q
mq
2 i it
u
it
2
e = (p + imq) e
= p + (mq) e e
; = arctan
p



mq
2mHei(t)
; = arctan
eu =
p

(8.42)

las soluciones para q y p = mq est


an dadas por

el cociente nos da



q = A cos (t + ) = A sin t + +
2


p = mA cos t + +
2

mq

= tan t + +

p
2


mq

arctan
= t + +
p
2

sustituyendo (8.43) en (8.42) y teniendo en cuenta que H es la energa del oscilador arm
onico, tenemos
h
i



eu =
2mEei(+ 2 ) u = ln 2mEei(+ 2 ) = ln (2mE)1/2 + i +
2

1

u =
ln (2mE) + i +
2
2
por tanto la parte real de u est
a relacionada con la energa y la parte imaginaria con la fase inicial.

(8.43)

152

8.9.

CAPITULO 8. CORCHETES DE POISSON Y OTROS INVARIANTES CANONICOS

Transformaciones can
onicas infinitesimales en el formalismo de los
corchetes de Poisson

Las transformaciones can


onicas infinitesimales (TCI) forman parte de un tipo especial de transformaciones
que son una funci
on contnua de un par
ametro y que comienzan con la transformaci
on identidad para alg
un
valor inicial del par
ametro. Estas transformaciones adquieren particular interes ya que una transformaci
on
canonica arbitraria se puede construr como una sucesi
on de transformaciones infinitesimales. De nuevo el
caracter de invariante can
onico de los corchetes de Poisson, hace que exista un especial interes en escribir las
TCI en este formalismo.
En las transformaciones can
onicas infinitesimales, las nuevas variables difieren de las antiguas en cantidades
infinitesimales
= +
esta ecuaci
on solo me caracteriza una transformaci
on infinitesimal arbitraria (no necesariamente can
onica).
Cuando esta transformaci
on es can
onica, el cambio se especifica con el par
ametro infinitesimal y la funci
on
generatriz de las transformaciones infinitesimales G (ver Ec. 7.71)4
= J

G ()

(8.44)

tomando la Ec. (8.27)


[, u] = J

(8.45)

esta expresi
on es v
alida independientemente del conjunto de variables can
onicas usadas para evaluar el corchete.
Haciendo u = G y reemplazando (8.45) en (8.44)
= [, G]

(8.46)

con lo cual hemos logrado el prop


osito de escribir la TCI en terminos de corchetes de Poisson, en donde
el corchete involucra a las variables can
onicas en cuestion, la funci
on generatriz de la TCI y el par
ametro
infinitesimal de evoluci
on. Consideremos el caso en el cual el par
ametro contnuo es el tiempo de modo que
on para las TCI
= dt. Tomemos como funci
on generadora el Hamiltoniano5 . Las ecuaciones de transformaci
se obtienen de (8.46)
= [, H] dt = dt = d
(8.47)
donde hemos usado las Ecs. de Hamilton en corchetes de Poisson Ecs. (8.26). Para ver el significado de (8.47)
recordemos el significado de y de d. La cantidad se refiere al cambio infinitesimal en las coordenadas
debido a una transformaci
on can
onica, recordemos que un cambio de coordenadas no se refiere a la evoluci
on del
sistema. En contraste d se refiere al cambio de las coordenadas desde el tiempo t a sus valores en el tiempo
t + dt como producto de la evoluci
on del sistema. En consecuencia, la igualdad entre estas dos cantidades
infinitesimales nos muestra que la TCI generada por el Hamiltoniano y usando el tiempo como par
ametro
contnuo, cambia las coordenadas y momentos en la misma forma que lo hara la evoluci
on del sistema. En
otras palabras, el movimiento del sistema Fsico en un intervalo de tiempo dt se puede describir a traves de
una transformaci
on can
onica infinitesimal generada por el Hamiltoniano, siendo dt el par
ametro infinitesimal
que modula la TCI. Por otro lado, una transformaci
on can
onica arbitraria se puede obtener por medio de
TCIs sucesivas (esto es formalmente un proceso de integraci
on en el par
ametro infinitesimal). Es decir, que el
4

Estrictamente la funci
on generatriz de las transformaciones infinitesimales es la funci
on F2 dada por la Ec. (7.68), P
ag. 132.
Sin embargo, dado que el termino qi Pi de esta funci
on es el generador de la identidad, la funci
on G en esta ecuaci
on es la parte no
trivial de esta transformaci
on. Por tanto, nos referiremos a G de aqu en adelante como la funci
on generadora de una transformaci
on
infinitesimal modulada por el par
ametro .
5
N
otese que en el paso desde la Ec. (7.68) hasta la Ec. (7.71), solo hemos exigido que las segundas derivadas de G sean contnuas
en sus 2n+1 argumentos. Esto con el fin de garantizar que la matriz (7.74) sea simetrica, lo cual a su vez conduce a que la condici
on
simplectica sea necesaria y suficiente para llegar a la condici
on can
onica en la transformaci
on. Por lo dem
as, G y su par
ametro
infinitesimal de modulaci
on son arbitrarios.


8.9. TRANSF. CANONICAS
INFINITESIMALES Y CORCHETES DE POISSON

153

movimiento del sistema en un intervalo finito de tiempo se obtiene con sucesivos corrimientos dt. Los valores
de q, p en cierto tiempo se pueden obtener a partir de sus valores iniciales por una transformacion can
onica
que es funci
on contnua del tiempo. De acuerdo a este punto de vista, el movimiento de un sistema mec
anico
corresponde a una evoluci
on contnua de las transformaciones can
onicas. Todo este razonamiento nos lleva a
concluir que el Hamiltoniano es el generador del movimiento del sistema con el tiempo.
Inversamente, debe existir una transformaci
on can
onica que a partir de los valores de las variables q, p en un
tiempo t, nos lleve a sus valores iniciales. Encontrar esta transformaci
on can
onica es equivalente a resolver la
ecuaci
on de movimiento. Habamos sugerido previamente la posibilidad de obtener un Hamiltoniano con todas
las coordenadas cclicas que conduca a que todos los momentos eran constantes de movimiento. La presente
estrategia, si es posible, nos llevara a una transformaci
on can
onica en donde qi y pi seran todas constantes de
movimiento. Volveremos sobre estas consideraciones en el siguiente captulo para obtener soluciones formales
para sistemas mec
anicos.
Lo anterior nos lleva a contemplar la posibilidad de ver a las transformaciones can
onicas desde otro punto
de vista, as como a los efectos que esta produce. La noci
on de transformaci
on can
onica se introdujo como un
cambio en las coordenadas (pero no en la configuraci
on del sistema) para describir el mismo sistema usando
otro espacio de fase. En esta visi
on, cambiamos de las coordenadas (q, p) de un espacio de fase , a otro espacio
de fase con coordenadas (Q, P ). Si el estado de un sistema en un cierto tiempo est
a descrito por un punto
A en el espacio de fase , tambien puede describirse equivalentemente a traves del punto transformado A0 del
espacio de fase (en el mismo instante de tiempo). Cualquier funci
on del sistema de variables tendr
a el mismo
valor para una configuraci
on dada del sistema, bien sea que la describamos con el conjunto (q, p) o con (Q, P ).
Es decir, la funcion tendr
a el mismo valor en A que en A0 (aunque diferente forma funcional). Este se llama
un punto de vista pasivo de la TC. Desde el punto de vista matem
atico, esto corresponde a un mapeo desde
el espacio al espacio (con inversa). La Fig. 8.1a ilustra el concepto de TC desde el punto de vista pasivo.
N
otese que con este enfoque, la transformaci
on de coordenadas est
a totalmente desligada de la evoluci
on del
sistema.
La TC que genera el Hamiltoniano usando al tiempo como par
ametro, sugiere otra interpretacion para esta
TC. Cuando movemos el par
ametro tiempo desde t hasta t, esta TC cambia las coordenadas y momentos
desde sus valores en el tiempo t hasta los valores que estas tendran en el tiempo t + t. Esta transformaci
on
canonica se puede interpretar consistentemente de la siguiente manera: Dicha TC nos relaciona las coordenadas
(q, p) de un punto en el espacio de fase (definido con las coordenadas q, p) con las coordenadas (Q, P ) de otro
punto en el mismo espacio de fase. Esto corresponde a un mapeo del espacio de fase en s mismo. Lo anterior
nos conduce a una interpretaci
on activa de la TC como la generadora de movimiento del punto en el
espacio de fase de una posici
on (q, p) a otra posici
on (Q, P ), como se ilustra en la Fig. 8.1b. Por supuesto, la
transformaci
on can
onica como tal no puede mover o cambiar la configuraci
on del sistema. Lo que ocurre es que
el cambio de coordenadas producido por la TC emula el cambio din
amico de las coordenadas producido por la
evoluci
on del sistema. En otras palabras, el paso de (q, p) a (Q, P ) bajo una TC significa que estoy cambiando
el sistema coordenado que uso para describir al sistema, el mismo cambio interpretado en forma din
amica se
refiere al cambio que el mismo sistema coordenado sufre por efecto de la evoluci
on del sistema. El punto es
que cuando las dos transformaciones coinciden numericamente, puedo atribur la din
amica del sistema (desde
un punto de vista pr
actico) a la transformaci
on can
onica.
La interpretaci
on activa no es siempre u
til. Por ejemplo, la TC que nos lleva de las coordenadas cartesianas
a las coordenadas polares esfericas, es una TC de tipo pasivo, y una interpretaci
on activa sera absurda.
Por ejemplo, los ejes de ambos espacios de fase no poseen las mismas unidades fsicas pues en coordenadas
cartesianas ambos ejes de coordenadas tienen unidades de longitud y los ejes de momentos tienen unidades
de masa por velocidad, en contraste se tiene que en coordenadas polares hay un eje angular adimensional
en la coordenada y el eje de p tiene unidades de momento angular (aunque s son iguales las dimensiones
en cuanto al n
umero de coordenadas i.e. ejes independientes, es decir son iguales las dimensiones de los dos
espacios de fase como espacios vectoriales).
El punto de vista activo es particularmente u
til en TCs que dependen en forma contnua de un solo

154

CAPITULO 8. CORCHETES DE POISSON Y OTROS INVARIANTES CANONICOS

Figura 8.1: Descripci


on de una transformaci
on can
onica (a) desde el punto de vista pasivo y (b) desde el punto
de vista activo.
par
ametro6 . En la interpretaci
on activa, el efecto de la TC es el de mover el punto del sistema de manera
contnua trazando as una curva en el espacio de fase, a medida que el par
ametro cambia en forma contnua.
Cuando la TC es la generada por el Hamiltoniano usando al tiempo como el par
ametro contnuo, la curva
sobre la cual se mueve el punto del sistema coincide con la trayectoria del sistema en el espacio de fase.

8.10.

Cambio de una funci


on del sistema bajo una transformaci
on can
onica en los enfoques pasivo y activo

Nos preguntamos ahora por el cambio de una funci


on del sistema u = u (q, p, t) bajo una TC. Veremos que
el cambio en esta funci
on depende de si tomamos el punto de vista activo o pasivo.
Bajo el punto de vista pasivo, debemos tener en cuenta que si en un instante dado t0 la transformaci
on
canonica se describe por Q0 = Q (q0 , p0 , t0 ) , P0 = P (q0 , p0 , t0 ) entonces el conjunto (q0 , p0 ) describe la misma
configuraci
on del sistema que el conjunto (Q0 , P0 ). Ahora bien, el valor de una funci
on del sistema solo puede
6
N
otese que en transformaciones can
onicas contnuas uniparametricas no es de esperarse que las unidades de las coordenadas y
momentos cambien con la transformaci
on. A manera de ejemplo, asumamos por un momento que para un sistema unidimensional
partimos de variables (q, p) donde q tiene unidades de longitud y p de momento lineal, y terminamos con un sistema (Q, P ) donde
Q es adimensional y P tiene unidades de momento angular. Es claro que el cambio de unidades es discreto y no es de esperarse
que una TC que se puede generar por TCIs sucesivas me lleve a un cambio en las unidades de las coordenadas, a menos que se
presente el caso bastante atpico de una TC que vare de manera contnua las unidades de las variables. Por tanto las TC contnuas
uniparametricas permiten interpretar consistentemente el hecho de que la transformaci
on siempre este en el mismo espacio de fase.

CANONICA

8.11. CAMBIO DEL HAMILTONIANO BAJO UNA TRANSFORMACION

155

depender de la configuraci
on de este. Por lo tanto, el cambio del conjunto coordenado (q0 , p0 ) al conjunto
on del sistema, aunque la funci
on puede cambiar de forma
(Q0 , P0 ) debe dejar inalterado el valor de una funci
o dependencia funcional con las nuevas variables. Podemos escribir entonces que u (q0 , p0 , t0 ) = u0 (Q0 , P0 , t0 ).
En otras palabras, el valor numerico de una funci
on del sistema no puede depender del espacio de fase que
utilice para describir a dicha funci
on.
En contraste, una visi
on activa de la TC nos habla de una traslaci
on del sistema del punto A al punto
B, de la posici
on (qA , pA ) a la posici
on (qB , pB ) en el mismo espacio de fase. Desde este punto de vista, la
funci
on u (q, p) no cambia su dependencia funcional con respecto a q, p ya que no estamos cambiando de espacio
de fase. En cambio, la funci
on s cambia su valor como resultado del cambio en el valor de los argumentos
on activa A y B me est
an describiendo
u (qA , pA ) 6= u (qB , pB ). Esto tiene que ver con el hecho de que en la visi
diferentes configuraciones del sistema.
Usaremos el smbolo para denotar el cambio en el valor de una funci
on bajo una TCI activa
u u (B) u (A)

(8.48)

donde A y B est
an infinitesimalmente cerca, de nuevo usando notaci
on matricial escribimos
u = u ( + ) u ()
expandiendo en serie de Taylor hasta primer orden en infinitesimales y usando (8.44) se obtiene
"

#
^
u
u =
u () +
+ . . . u ()

^
^
u
G
u
=
J
u =

recordemos que el uso de la Ec. (8.44) es lo que nos garantiza que la transformaci
on sea can
onica. Ahora
utilizamos la definici
on de corchetes de Poisson (8.2) para obtener:
u = [u, G]

(8.49)

de nuevo la aplicaci
on mas inmediata consiste en usar (8.49) cuando u es una coordenada del espacio de fase,
teniendo en cuenta adem
as la Ec. (8.46), resulta
= [, G] =

(8.50)

Este resultado es obvio a partir de la definici


on del punto B con respecto al punto A, el cambio en las
coordenadas desde A hasta B es precisamente la diferencia infinitesimal entre las coordenadas viejas y nuevas.

8.11.

Cambio del Hamiltoniano bajo una transformaci


on can
onica

Las consideraciones anteriores son mucho m


as delicadas cuando estudiamos el cambio en el Hamiltoniano.
La raz
on estriba en el hecho de que el Hamiltoniano no es una funci
on del sistema. Para ver la raz
on,
recordemos que el Hamiltoniano puede diferir tanto funcional como numericamente cuando pasamos de un
conjunto can
onico a otro, la expresi
on
H (q, p, t) 6= K (Q, P, t)
nos indica que el Hamiltoniano puede cambiar tanto funcional como numericamente, incluso si los dos sistemas
canonicos describen la misma configuraci
on del sistema. Esto viola claramente nuestra definici
on de funci
on
del sistema. El Hamiltoniano se refiere mas bien a la funci
on que en un determinado espacio de fase define las
ecuaciones can
onicas de movimiento. Cuando la transformaci
on can
onica depende del tiempo, el significado

156

CAPITULO 8. CORCHETES DE POISSON Y OTROS INVARIANTES CANONICOS

mismo de Hamiltoniano se transforma. De esta forma H (A) no se transforma en H 0 (A0 ) 7 sino en K (A0 ), y
H (A) no tendr
a necesariamente el mismo valor que K (A0 ). A manera de ejemplo, en cierto espacio de fase
el Hamiltoniano puede ser la energa del sistema y en otro espacio de face puede no serlo. En virtud de lo
anterior, designaremos por H a la diferencia en el valor final del Hamiltoniano bajo las dos interpretaciones.

(8.51)
H = H (B) K A0

en los casos en que la funci


on misma no cambia con la transformaci
on can
onica, las dos formas de cambio
descritas por (8.48) y (8.51) son identicas puesto que u (A) = u0 (A0 ) (recordemos que el valor numerico de las
funciones coincide en A y A0 en una interpretaci
on pasiva). En general, K est
a relacionado con H a traves de
la ecuaci
on
F
(8.52)
K=H+
t
Una vez que definimos la relaci
on entre los Hamiltonianos en ambos espacios de fase a traves de la relaci
on
(8.52), las funciones K y H ya se pueden tomar como funciones del sistema, es decir como funciones bien
definidas para una configuraci
on dada del sistema. Por ejemplo H (A) = H 0 (A0 ) ya que se trata de la misma
funci
on del sistema definida en puntos A y A0 de diferentes espacios de fase pero que describen la misma
configuraci
on del sistema. Para una TCI, la funci
on generatriz est
a dada por (7.68) en terminos de G. Dado
que en (7.68) solo G puede ser funci
on explcita del tiempo, el valor del nuevo Hamiltoniano es


G
G
K A0 = H 0 A0 +
= H (A) +
t
t

y el cambio en el Hamiltoniano definido en (8.51) es

H = H (B) H (A)

G
t

(8.53)

siguiendo un camino similar al que nos llevo desde (8.48) hasta (8.49), vemos que H est
a dado por
H = [H, G]

G
t

tomando la ecuaci
on generalizada de movimiento (8.25) con u = G, resulta


G dG
G
H =

t
dt
t
dG
H =
dt

8.12.

(8.54)

Cantidades conservadas e invarianzas del Hamiltoniano

Nos retringiremos al caso en el cual G no es funci


on explcita del tiempo. En este caso, la Ec. (8.53) nos
lleva a
H = H (B) H (A) si G = G (qi , Pi )
de modo que el cambio H que hemos definido para el Hamiltoniano, corresponde en este caso al cambio en el
valor de este cuando el sistema se mueve de la configuraci
on A a la configuraci
on B. Si adicionalmente G es una
constante de movimiento, la Ec. (8.54) nos dice que G genera una TCI que no cambia el valor del Hamiltoniano.
De esta forma, podemos ver que muchas constantes de movimiento son funciones generadoras de
aquellas TCI que dejan el Hamiltoniano invariante. Recprocamente, si el Hamiltoniano es invariante
ante una TCI inducida por una funci
on G (qi , Pi ), la Ec. (8.54) nos indica que G es una constante de movimiento.
7

Usaremos la convenci
on de que u0 es la forma funcional que hace que u (A) = u0 (A0 ), es decir es la forma en que debe
transformar la forma funcional de u ante un cambio de espacio de fase a fin de que dicha cantidad defina una funci
on del sistema.

8.12. CANTIDADES CONSERVADAS E INVARIANZAS DEL HAMILTONIANO

157

Nuevamente, la aseveraci
on anterior nos muestra una conexi
on entre propiedades de simetra y cantidades
conservadas8 . Si una cierta funci
on del sistema G (qi , Pi ), es constante de movimiento, entonces la TCI que
dicha funci
on induce es tal que el Hamiltoniano permanece invariante ante dicha TCI. Es esencial insistir en
que estas conclusiones solo son v
alidas si G no es funci
on explcita del tiempo.
Veremos enseguida que un momento pi can
onicamente conjugado a una variable qi , se conserva si y solo si la
coordenada qi es cclica. No obstante, este escenario abarca muchas constantes de movimiento independientes
y no solo los momentos generalizados conservados. Sin embargo, el presente formalismo no abarca todas las
constantes de movimiento (recordemos que la Ec. 8.25 abarca formalmente todas las constantes de movimiento).
Esto por dos razones (1) Estas simetras est
an restringidas solo a TCIs y no a transformaciones arbitrarias. (2)
Las transformaciones de simetra m
as generales son las que dejan invariantes las ecuaciones de movimiento,
incluso si no dejan invariante al Hamiltoniano9 . Ya hemos visto en la secci
on 5.3 que con el formalismo
Lagrangiano la invarianza de las ecuaciones de movimiento nos lleva a constantes de movimiento que no
est
an includas en escenarios donde el Lagrangiano mismo es invariante. Lo esencial es tener en cuenta que
ni el Lagrangiano ni el Hamiltoniano son observables del sistema, y por tanto pueden ser modificados de
una manera especial sin cambiar el contenido fsico de estos. En todo caso, la relaci
on entre la constante de
movimiento G y la invarianza del Hamiltoniano nos muestra una vez m
as el fuerte nexo entre simetras y
cantidades conservadas.
Veremos a continuaci
on que los teoremas de conservaci
on de los momentos generalizados son casos especiales de lo anterior. Si una coordenada qj es cclica, es obvio que el Hamiltoniano es invariante ante una
transformaci
on infinitesimal que involucre un desplazamiento de qj u
nicamente. Por supuesto, es necesario asegurarse que dicha transformaci
on infinitesimal es de naturaleza can
onica, de ser as, debe existir una funci
on
generatriz G que me genere la hipotetica TCI a traves de las ecuaciones (7.69, 7.70), puede verificarse que la
funci
on10
G (q, p) = pi
(8.55)
genera una transformaci
on can
onica infinitesimal a traves de (7.69, 7.70) descrita por
qj = ij ;

pi = 0

(8.56)

on generatriz de una transformaci


on can
onica infinitesimal que desplaza a qi u
nicamente.
es decir pi es una funci
Dado que solo qi se desplaza, es obvio que si dicha coordenada es cclica el Hamiltoniano queda invariante, lo
cual nos lleva a la conservaci
on de G seg
un la Ec. (8.54), pero G en nuestro caso es precisamente pi como se ve en
on de su momento conjugado como se
(8.55). Por tanto, se observa que si qi es cclica llegamos a la conservaci
esperaba. Recprocamente si pi es constante entonces la funci
on G (q, P ) en (8.55) es constante de movimiento
y esto nos lleva a la invarianza del Hamiltoniano ante la TCI (8.56), que desplaza solo a qj dejando todas las
dem
as coordenadas y momentos fijos, esto implica entonces que H/qi = 0 y por tanto que la coordenada es
cclica.
En virtud de la simetra entre q y p en la formulaci
on Hamiltoniana, es natural pensar que G (q, P ) = qi
genere una TCI en donde solo se mueva pi (tal vez con un cambio de signo debido a la estructura simplectica).
Ambas consideraciones se pueden escribir en un contexto mas general. Tomemos como generador de una TCI
a la funci
on
Gl = (J)l = Jlr r
(8.57)
la ecuaciones de transformaci
on (7.71) aplicadas a (8.57) dan
k = Jks

Gl
r
= Jks Jlr
= Jks Jlr rs = Jks Jls = Jks Jesl
s
s

8
Debe tenerse en cuenta sin embargo, que aqu estamos hablando de simetras del Hamiltoniano ante TCIs y no ante transformaciones arbitrarias.
9
N
otese que una transformaci
on que cambie al Hamiltoniano en la forma H = H + dF (q,p,t)
, deja invariantes las ecuaciones de
dt
movimiento pero no al Hamiltoniano.
10
Estrictamente G es de tipo 2, de modo que sus argumentos son G (qi , Pi ). Sin embargo, en la interpretaci
on activa Pi est
a en el
mismo espacio de fase que el momento original, raz
on por la cual escribiremos simplemente G (qi , pi ), al menos cuando se trabaje
con la interpretaci
on activa de la TC.


CAPITULO 8. CORCHETES DE POISSON Y OTROS INVARIANTES CANONICOS

158

lo cual en virtud de la ortogonalidad de J (ver Ec. 6.32, P


ag. 99), resulta
k = kl
esto muestra claramente que una transformaci
on que cambie solo a l es generada por su variable conjugada.
Si l es qi entonces G es pi . Si l es pi , G es entonces qi .

8.12.1.

El momento lineal total como generador de TCIs que generan traslaciones

Examinemos una vez m


as el caso en el cual realizamos la traslaci
on de un sistema como un todo pero
ahora en el marco del formalismo de las TCIs. En primer lugar, es importante enfatizar que el significado
fsico de la funcion generatriz G no puede depender del conjunto can
onico empleado para describirla. Para ver
esto, observemos que en la Ec. (8.46) el cambio de una cierta variable can
onica i es el mismo independiente
del sistema can
onico que usemos para expresar G, ello en virtud de la invarianza can
onica de los corchetes
de Poisson. Por lo anterior, podemos utilizar en particular las coordenadas cartesianas de las partculas del
sistema. Definamos la funci
on generatriz
G=

N
X
k=1

pkx ; dx

(8.58)

onico de la kesima partcula. Utilizando las Ecs. (7.69,


en donde pkx es la componente x del momento can
7.70) vemos que la TCI inducida por esta funci
on es
!
N
X
G

G
xi = dx
= dx
pkx = dx , pix = dx
=0
pix
pix
qix
k=1

yi

G
= dx
=0
piy

, piy = dx

G
=0
qix

zi = piz = 0

de modo que
xi = dx

yi = zi = pix = piy = piz = 0

es decir la funcion G definida en (8.58) genera una traslaci


on del sistema como un todo en una cantidad
infinitesimal dx en la direcci
on x, sin traslaci
on en las otras cooordenadas ni momentos. Vemos pues que las
traslaci
on del sistema como un todo a lo largo de cierto eje, corresponde efectivamente a una transformaci
on
canonica.
Puesto que G no depende explcitamente del tiempo, es constante de movimiento si y solo si la TCI que
genera deja invariante el Hamiltoniano. Es decir, el momento lineal total en la direcci
on x (que corresponde a
G en este caso), se conserva si y solo si la traslaci
on del sistema como un todo en la direcci
on x, deja invariante
al Hamiltoniano. N
otese que la direcci
on x se puede escoger arbitrariamente. Si denotamos n como el vector
unitario en la direcci
on de la traslaci
on y P como el momento lineal total del sistema, podemos decir que
G=Pn
se conserva si y solo si el Hamiltoniano es invariante ante una TCI que genera una traslaci
on del sistema como
un todo en la direcci
on n. Recordemos que si las fuerzas que act
uan sobre el sistema se derivan de potenciales
que dependen de la velocidad, el momento can
onico asociado a las coordenadas cartesianas no es el momento
lineal de la forma mx.
Por tanto nuestros resultados son m
as generales que los obtenidos en la secci
on 5.1.1
en donde se supuso explcitamente que los potenciales son independientes de la velocidad.

8.12.2.

El momento angular total como generador de TCIs que generan rotaciones

Ahora analizaremos la rotaci


on de un sistema Fsico como un todo en el marco de las TCIs. Por los
mismos argumentos de la secci
on anterior, podemos emplear las coordenadas cartesianas. Adicionalmente, y

8.12. CANTIDADES CONSERVADAS E INVARIANZAS DEL HAMILTONIANO

159

sin perdida de generalidad elegiremos al eje de rotaci


on como nuestro eje z. Para una rotaci
on infinitesimal
antihoraria en un angulo d la matriz de rotaci
on a primer orden se escribe

 

cos d sin d
1 d
'
sin d cos d
d
1
ahora tendremos en cuenta que en coordenadas cartesianas tanto las coordenadas (xi , yi , zi ) como los momentos
conjugados (pix , piy , piz ) forman vectores euclidianos, de modo que se comportan de la misma forma ante
rotaciones11 con lo cual



 0 
1 d
xi
xi
=
x0i = xi yi d ; yi0 = yi + xi d
yi0
d
1
yi
x0i xi = yi d ; yi0 yi = xi d

dado que los momentos poseen las mismas transformaciones, basta con hacer un reemplazo de la forma xi pix
para obtener la transformaci
on de los momentos, las transformaciones infinitesimales quedan entonces
xi = yi d

; yi = xi d

; zi = 0

pix = piy d ; piy = pix d ; piz = 0

(8.59)

estrictamente, a
un no hemos demostrado que esta transformaci
on es can
onica. Esto equivale a demostrar que
existe una funci
on generatriz G, tal que las Ecs. (7.69, 7.70) reproducen adecuadamente a las ecuaciones (8.59).
Podemos ver que una funci
on generatriz adecuada para esta TCI es
G = xk pky yk pkx

(8.60)

Esto se puede ver explcitamente reemplazando (8.60) en las Ecs. (7.69, 7.70)
G
G
G
= yi d ; yi = d
= xi d
; zi = d
=0
pix
piy
piz
G
G
G
= d
= piy d ; piy = d
= pix d ; piz = d
=0
xi
yi
zi

xi = d
pix

que reproduce correctamente las Ecs. (8.59). Es inmediato ver que la funci
on G dada por (8.60) corresponde
a la componente z del momento angular can
onico total
G = Lz (ri pi )z

(8.61)

y dado que el eje z se eligi


o en la direcci
on del eje de rotaci
on cuya orientaci
on es arbitraria, se concluye que
la funci
on generatriz G corresponde a la componente del momento angular can
onico total a lo largo del eje de
rotaci
on. Denotando n al vector unitario a lo largo del eje de rotaci
on se tiene que
G=Ln

(8.62)

es importante notar que el momento angular can


onico que hemos definido puede diferir del momento angular
mec
anico, ya que si las fuerzas que act
uan sobre el sistema se derivan de potenciales que dependen de la
velocidad, las cantidades pi no necesariamente corresponden con el momento lineal (aunque siguen siendo
vectores Euclidianos que fue nuestra u
nica suposici
on). En consecuencia, la expresi
on (8.61) no corresponde
necesariamente al momento angular mec
anico. Por lo tanto, nuestros resultados son m
as generales que los
obtenidos en la secci
on 5.1.2 en donde se supuso explcitamente que los potenciales eran independientes de
la velocidad. Podemos ver entonces que el momento conjugado asociado a una coordenada generalizada de
rotaci
on del sistema como un todo alrededor de un eje n, es la componente del momento angular can
onico
11

Para m
as detalles ver secci
on 12.5

160

CAPITULO 8. CORCHETES DE POISSON Y OTROS INVARIANTES CANONICOS

total seg
un este eje, incluso si el potencial depende de la velocidad. Este resultado se puede derivar tambien
de las Ecs. (8.55, 8.56).
Conclumos que el Hamiltoniano es invariante bajo la rotaci
on del sistema como un todo alrededor de la
direcci
on n, si y solo si se conserva la funcion generatriz G definida en la Ec. (8.62), es decir si se conserva el
momento angular can
onico total en la direcci
on n. Una vez m
as vemos como la invarianza del Hamiltoniano
ante rotaciones alrededor de un eje conduce a la conservacion del momento angular can
onico total alrededor
de dicho eje.
En sntesis, as como el Hamiltoniano es un generador de desplazamiento del sistema en el tiempo, el
momento lineal es un generador de desplazamiento lineal espacial (traslaci
on) del sistema, y el momento
angular es un generador de desplazamiento angular espacial (rotaci
on) del sistema. Recordemos que aqu la
palabra generador indica que este induce una TCI que nos lleva a la transformaci
on en cuesti
on.

8.13.

Construcci
on de transformaciones can
onicas finitas a partir de transformaciones can
onicas infinitesimales

Ya se ha dicho que en una interpretaci


on activa, una transformaci
on can
onica que depende de un par
ametro,
mueve el punto que describe la configuraci
on del sistema formando una trayectoria en el espacio de fase. Una
transformaci
on can
onica finita que depende de una par
ametro contnuo , puede construrse como una sucesi
on
de TCIs a lo largo de la curva. Formalmente, la TC finita se obtiene integrando las TCIs. Como a cada punto
en la trayectoria le corresponde un valor particular del par
ametro, comenzamos con la configuracion inicial del
sistema a la cual por convenci
on le asignamos el par
ametro = 0. Si u es alguna funci
on de la configuraci
on
del sistema, u ser
a una funci
on contnua de a lo largo de la trayectoria, con valor inicial u0 u (0). Por
simplicidad, asumiremos que u no es funci
on explcita del tiempo. La TCI en una interpretaci
on activa viene
dada por (8.49), donde viene dado por d
u = d [u, G]

(8.63)

o a manera de ecuaci
on diferencial

du
= [u, G]
(8.64)
d
Para entender porque aparece una derivada total (a pesar de la notaci
on enga
nosa u en 8.63) recordemos
que u es el cambio en u asociado a una variaci
on de todas las coordenadas y momentos como se ve en (8.48)
y naturalmente, tambien hay variaci
on en ya que es justamente la variaci
on en esta cantidad la que genera
el cambio de coordenadas y momentos. En principio, la integraci
on de esta ecuaci
on diferencial nos conduce
a u (), es decir al efecto que la TC finita tiene sobre u. Una soluci
on formal se puede obtener haciendo una
expansi
on de Taylor de u () alrededor de las condiciones iniciales



du
2 d2 u
3 d3 u
u () = u (0) +
+
+
+ ...
d 0
2! d2 0
3! d3 0
la Ec. (8.64) conduce a


du
= [u, G]0
d 0

donde el subndice nos indica que el corchete de Poisson debe ser evaluado en el punto inicial = 0. Ahora
tomando [u, G] u0 como una funci
on de la configuraci
on del sistema, se tiene


d2 u
d du
d
du0
=
=
[u,
G]
=
d2
d d
d
d
y usando la Ec. (8.64) para la funci
on u0
d2 u
du0  0 
=
= u , G = [[u, G] , G]
d2
d

DE TCS FINITAS A PARTIR DE TCIS


8.13. CONSTRUCCION

161

el proceso se repite para las sucesivas derivadas con lo cual la expansi


on de Taylor queda
u () = u0 + [u, G]0 +

2
3
[[u, G] , G]0 +
[[[u, G] , G] , G]0 + . . .
2!
3!

(8.65)

en particular, si u representa una variable can


onica i , con u0 representando el valor inicial de la variable
i , la ecuaci
on (8.65) nos da la prescripci
on para calcular la transformaci
on can
onica finita generada por G.
b
Definimos el operador G como
b [(. . .) , G]
G
(8.66)
b act
donde G
ua sobre las funciones u de la configuraci
on del sistema. Es decir
claramente

b [u, G]
Gu

(8.67)

 
b2 u = G
b Gu
b =G
b ([u, G]) [[u, G] , G]
G

b la expansi
y generalizando a todas las potencias de G,
on (8.65) se escribe

 2
 3
1
1

b +
b u +
b u + . . .
u () = 1u0 + Gu
G
G


2!
3!
0
0

0

 2
 3
1
1
b+
b +
b + ... u
G
G
u () =
1 + G
2!
3!
0

(8.68)

teniendo en cuenta que la sumatoria entre llaves tiene la estructura de la serie correspondiente a la funci
on
exponencial, podemos escribir simb
olicamente esta transformaci
on de la forma

b
u () = eG u
(8.69)
0

Otra forma interesante de obtener la Ec. (8.69) se basa en la funci


on generatriz para ex

x n
ex = lm 1 +
n
n

si extrapolamos esta expresi


on para la funci
on de operadores tendremos que
!n
b

G
b
eG = lm b
1+
n
n
y la ecuaci
on (8.69) se puede reescribir como

u () = lm

b
G
b
1+
n

!n


u

(8.70)
0

en (8.70) se puede ver que el valor final para la funci


on u () se puede obtener a partir de su valor inicial,
b
b
aplicando sucesivamente (n veces) el operador 1 + G/n con n . En tal lmite, este operador solo difiere
infinitesimalmente de la identidad. Es decir la TC completa se est
a generando como una aplicaci
on sucesiva
de TCIs.
Un caso muy importante surge cuando en la Ec. (8.69) tomamos el caso particular en el cual G = H y el
par
ametro contnuo es el tiempo, se obtiene

b
u (t) = etH u
(8.71)
0

donde el operador Hamiltoniano se define en analoga con (8.66, 8.67)


b [(. . .) , H] ; Hu
b [u, H]
H

(8.72)


CAPITULO 8. CORCHETES DE POISSON Y OTROS INVARIANTES CANONICOS

162

la ecuaci
on (8.71) nos dice que la evoluci
on temporal de u se obtiene aplicando el operador etH sobre u (qi , pi )
b
y evaluando en t = 0. Por esta raz
on, a etH se le denomina operador evoluci
on temporal.
b = 0), las
N
otese que si el corchete de Poisson de u con el generador G de la transformaci
on se anula (i.e. Gu
Ecs. (8.65, 8.68) nos muestran que la transformaci
on generada por G dejar
a invariante a la funci
on u. Cuando
G es el Hamiltoniano y el par
ametro es el tiempo, esto es consistente con la Ec. (8.25), si recordamos que
hemos asumido que u (qi , pi ) no es funci
on explcita del tiempo.

8.13.1.

Aplicaci
on del operador evoluci
on temporal en el movimiento uniformemente
acelerado

Un ejemplo sencillo de aplicaci


on del operador evoluci
on temporal definido en (8.71), se obtiene cuando
estudiamos el problema del movimiento unidimensional con aceleraci
on constante a, cuyo Hamiltoniano se
escribe en la forma
p2
H=
max
2m
sea u = x la funci
on que queremos conocer, los corchetes de Poisson nos dan
[x, H] =

p
m

; [[x, H] , H] =

1
[p, H] = a
m

(8.73)

y dado que este u


ltimo corchete es constante, los corchetes de mayor orden se anulan, de modo que la serie
definida en (8.65) se trunca y solo posee tres terminos. Usando entonces G H, t, y u x en (8.65)
as como los corchetes (8.73) se obtiene
x (t) = x0 +

8.13.2.

at2
p0
t+
m
2

Aplicaci
on del operador evoluci
on temporal en el movimiento arm
onico simple

Escribiendo explcitamente el operador evoluci


on temporal definido por las Ecs. (8.71, 8.72) tenemos

 

2

3
b+ 1 tH
b + 1 tH
b + ... u
1+t H
2!
3!
t=0
b
b
H [(. . .) , H] ; H u [u, H]

u (t) =

(8.74)
(8.75)

El Hamiltoniano del oscilador arm


onico lineal est
a dado por
H=

p2
1
+ kx2
2m 2

H
p
=
p
m

H
= kx
x

vamos a evaluar la evoluci


on temporal de x (t), de modo que haremos u x. Evaluemos las sucesivas potencias
b nx
de la forma H
x H
x H
1
b
Hx
= [x, H] =

= p
x p
p x
m
 
 
b
b
p
p
Hx

Hx

H
H
H
H
2
m
m
b x = [[x, H] , H] =
H

x
p
p
x
x p
p x
b 2x = k x
H
m

(8.76)

DE TCS FINITAS A PARTIR DE TCIS


8.13. CONSTRUCCION

b3

H x =
b 4x =
H
b 5x =
H

b 6x =
H



b 2x
H
H

163



b 2x
H
H



 
k
k
m
x H
m
x H
1 k

=
p
x
p
p
x
x
p
p
x
m m


 2
mk2 p H
mk2 p H
k
k

= 2 kx =
x
x
p
p
x
m
m
h 2 i
h 2 i
k
k
 2
 
x H
m
x H
m
k
p
1 k 2

=
=
p
x
p
p
x
m
m
m m
h
h
 i
 i
1
k 2
1
k 2
 
 3

m
p
p H
m
m m
H
1 k 2
k

=
kx =
x
x
p
p
x
m m
m

b 0 1, tenemos
al colocarlas juntas teniendo en cuenta que H





2

3
k 0
b 4x = k
b 0x =
b 2x = k x ; H
b 6x = k
H

x ; H
x ; H
x
m
m
m
m





2
1
k 0
b
b 3x = 1 k p ; H
b 5x = 1 k
Hx
=

p ; H
p
m
m
m
m
m
m

b n x de la forma
lo cual sugiere un patr
on para potencias pares y otro para potencias impares en H




k n
1
k n
2n
2n+1
b
b
x , H
x=
p ; n = 0, 1, 2, . . .
H x=

m
m
m

(8.77)

las Ecs. (8.77) pueden demostrarse rigurosamente por inducci


on usando la Ec. (8.76). Hag
amoslo para la
primera identidad en (8.77)

  

 






k n
k
k n+1
k n  b2 
k n
2n+2
2 b 2n
2
b
b
b
H

H x =

x=
x = H H x =H
x =
x
m
m
m
m
m


k n+1
2(n+1)
b
x=
x

H
m

y similarmente para la segunda de las Ecs. (8.77). Haciendo u x en (8.74), y separando potencias pares e
impares, resulta
 

 

1  b 2
1  b 4
1  b 3
1  b 5
b
x (t) =
1+
tH +
tH + . . . x + tH +
tH +
tH + . . . x
2!
4!
3!
5!
0
0



 2n+1 
X
X
1  b 2n
1
b
x (t) =
tH
x +
tH
x
(8.78)
2n!
(2n
+
1)!
0
0
n=0
n=0
e insertando (8.77) en (8.78) y definiendo k/m 2 se obtiene
 

 
 2n 

X
X
t
k n
t2n+1 1
k n
x (t) =

x +

p
2n!
m
(2n + 1)! m
m
0
0
n=0
n=0

!
r
r !2n+1
2n

n
n r
X
X
k
1
m
k
(1)
(1)
x (t) =
t
x +
t
p
2n!
m
m
(2n + 1)! k
m
n=0

x (t) = x0

n=0

(1)
p0
(1)
(t)2n +
(t)2n+1
2n!
m n=0 (2n + 1)!
n=0

las series corresponden a las funciones coseno y el seno de modo que


p0
x (t) = x0 cos t +
sin t
m

(8.79)

164

8.13.3.

CAPITULO 8. CORCHETES DE POISSON Y OTROS INVARIANTES CANONICOS

Aplicaci
on del operador evoluci
on param
etrica para la generaci
on de rotaciones

Es importante tener presente que la ecuaci


on general (8.69) nos da la evoluci
on del sistema para un
par
ametro arbitrario que no es necesariamente el tiempo. Para ilustrar este hecho hagamos la asignaci
on
G Lz que corresponde a una transformaci
on can
onica que produce una rotaci
on alrededor de Z. Es natural
entonces tomar el par
ametro en la forma siendo un angulo de rotaci
on. La funci
on u ser
a la coordenada
x de la partcula iesima. La evoluci
on de la coordenada xi con se obtiene haciendo los reemplazos en (8.69)
o en (8.65)
2
3
xi () = xi0 + [xi , Lz ]0 +
[[xi , Lz ] , Lz ]0 +
[[[xi , Lz ] , Lz ] , Lz ]0 + . . .
(8.80)
2!
3!
Los corchetes de Poisson se pueden evaluar en forma directa o por sus propiedades, usando la expresi
on (8.60)
para G = Lz , as como los corchetes fundamentales (8.3) para obtener
[xi , Lz ] = yi ; [yi , Lz ] = xi
y los corchetes sucesivos dan
[xi , Lz ] = yi ; [[xi , Lz ] , Lz ] = [yi , Lz ] = xi ;

[[[xi , Lz ] , Lz ] , Lz ] = [xi , Lz ] = yi

(8.81)

etc. Ahora los corchetes de Poisson se eval


uan en el valor inicial = 0 del par
ametro de evoluci
on. Reemplazando (8.81) en (8.80) evaluado en = 0 obtenemos
2
3
4
xi () = xi0 yi0 xi0 + yi0 + xi0 ...
2!

 3!
 4! 3

2
4

xi () = xi0 1
+
... yi0
+ ...
2!
4!
3!
xi () = xi0 cos yi0 sin
que corresponde justo a la transformaci
on que genera una rotaci
on alrededor de Z, se puede ver que las
transformaciones de yi y zi tambien son las adecuadas (la u
ltima no se transforma). Esto corresponde a una
prueba alternativa de que Lz es un generador de rotaciones alrededor de z y como z es arbitrario esto indica
que el generador L n produce una rotaci
on alrededor de n. Este hecho nos inspira a encontrar las propiedades
de los corchetes de Poisson de los momentos angulares en forma m
as sistem
atica.

8.14.

Propiedades de los corchetes de Poisson de los momentos angulares

Las Ecs. (8.55) y (8.57) nos llevan a ver que los momentos pi conjugados a una coordenada qi pueden actuar
como generadores de traslaciones generalizadas en donde solo hay variaci
on de la coordenada qi en el espacio
de fase. Con base en ello, podemos ver que el momento angular al estar asociado a una variable angular, podra
ser el generador de una traslaci
on angular i.e. una rotaci
on. Lo cual est
a respaldado por los resultados de
las secciones 5.1 y 8.12.2. El hecho de que el momento angular can
onico sea el generador de rotaciones rgidas
del sistema conduce a una serie de importantes propiedades de los corchetes de Poisson que involucran a estas
cantidades. La Ec. (8.49) que nos determina el cambio de una funci
on del sistema u, ante una transformaci
on
canonica en una visi
on activa, es tambien v
alida si dicha funci
on es la componente de un vector a lo largo de
un eje fijo en el espacio ordinario. Por lo tanto si F es una funci
on vectorial de la configuraci
on del sistema,
se tiene que
Fi = d [Fi , G]
es importante que la direcci
on a lo largo de la cual se calcula la componente sea fija en el sentido de que no
debe cambiar con la TC. Si la direcci
on como tal es funci
on de las variables del sistema, la TC no solo cambia
el valor de la funci
on sino tambien su naturaleza, tal como ocurre con el Hamiltoniano. Con esta aclaraci
on el
cambio de un vector F bajo una rotaci
on del sistema alrededor de un eje fijo n, generada por L n se escribe
vectorialmente como
F = d [F, L n]
(8.82)

8.14. PROPIEDADES DE LOS CORCHETES DE POISSON DE LOS MOMENTOS ANGULARES

165

la Ec. (8.82) es v
alida solo si los vectores unitarios ux , uy , uz que forman la base para escribir F, no son rotadas
por el generador L n.
Otra aclaraci
on muy importante sobre el significado de la Ec. (8.82), el generador L n produce una
rotaci
on del sistema bajo la TCI, pero no necesariamente produce una rotaci
on del vector F. Dicho generador
induce una rotaci
on espacial de las variables del sistema pero no por ejemplo de alg
un vector externo tal como
un campo magnetico externo o el vector que describe la aceleraci
on de la gravedad. Surge naturalmente la
pregunta de cuales son las condiciones bajo las cuales L n genera una rotaci
on espacial de F. Claramente,
este vector es rotado por el generador en cuesti
on cuando F es una funci
on de las variables del sistema (q, p)
u
nicamente y no involucra ninguna cantidad externa o vector que no sea afectado por la TCI. Bajo estas
condiciones una rotaci
on espacial del sistema implica una rotaci
on de F. Los vectores que cumplen estas
condiciones ser
an denominados vectores del sistema. El cambio en un vector Euclidiano bajo rotaciones
infinitesimales alrededor de n, fue discutido en la secci
on 5.1, Ec. (5.9)
dF = n d F
de tal modo que para un vector del sistema, una TCI generada por L n induce un cambio en dicho vector de
la forma12
F = d [F, L n] = n d F
(8.83)
la Ec. (8.83) conduce a una importante identidad concerniente al corchete de Poisson entre L n y un vector
del sistema
[F, L n] = n F
(8.84)
La condici
on (8.84) ya no hace ninguna referencia a una TC o incluso a una rotaci
on espacial. Es simplemente
una propiedad del corchete de Poisson entre un cierto tipo de vectores (del sistema) y una componente del
momento angular can
onico en cierta direcci
on.
La relaci
on (8.84) se puede expresar en componentes usando el tensor de Levi Civit
a.
[Fi , Lj nj ] = ijk nj Fk
y dado que n es arbitrario, podemos elegir en particular que nj = 1 para un j especfico y cero para las otras
componentes, lo cual nos conduce a
[Fi , Lj ] = ijk Fk
(8.85)
lo cual se puede escribir tambien de la forma
[Fl , Lm ] = Fn

l, m, n en orden cclico

(8.86)

otra relaci
on interesante es ver lo que ocurre con el producto F G entre dos vectores del sistema. Siendo
un escalar, este producto punto debe ser invariante bajo rotaciones13 . La identidad (8.84) nos muestra que
efectivamente, el corchete de Poisson entre este producto y L n se anula.
[F G, L n] = F [G, L n] + [F, L n] G = F (n G) + (n F) G
= F (n G) + F (G n)

[F G, L n] = 0

(8.87)

recordemos que la anulaci


on del corchete de Poisson de cierta funci
on del sistema con el generador de una
transformaci
on, nos conduce a la invarianza de esta funci
on bajo la transformaci
on producida por el generador
12

Un vector podra ser mixto i.e. funci


on de q y p del sistema pero tambien funci
on de variables externas. En tal caso es de
esperarse que dicho vector se transforme bajo la rotaci
on generada por la TCI pero no transformar
a de la forma prescrita por la
Ec. (8.83).
13
Esto se puede ver de F G = F G cos . F y G son invariantes ya que una rotaci
on no cambia la magnitud de los vectores,
adem
as el
angulo relativo entre dos vectores tambien se conserva en una rotaci
on de modo que la invarianza es clara.

166

CAPITULO 8. CORCHETES DE POISSON Y OTROS INVARIANTES CANONICOS

como se ve en la Ec. (8.65)14 . Haciendo F = G, se obtiene la propiedad esperada de que la magnitud de un


vector se conserva bajo rotaciones, ya que el corchete de Poisson de F2 se anulara para cualquier componente
de L.
Naturalmente, todas las relaciones anteriores son v
alidas en particular cuando F = L en (8.84). En tal caso
resulta
[L, L n] = n L [Li , Lj ] = ijk Lk

(8.88)

adicionalmente, haciendo F = G = L en (8.87) resulta





L2 , L n = 0

(8.89)

de las relaciones (8.88) y el teorema de Poisson vemos que si Lx y Ly son constantes de movimiento entonces
Lz tambien es una constante de movimiento. Por tanto, la invarianza de dos componentes del momento angular
canonico cartesiano nos lleva a la invarianza del vector L completo. Adicionalmente, aplicando las relaciones
(8.84) y (8.85) con F = p, es decir el momento can
onico cartesiano, tenemos que
[p, L n] = n p

[pi , Lj ] = ijk pk

si ahora asumimos que adem


as de Lx , Ly la componente pz es tambien una constante de movimiento, entonces
adem
as de Lz obtenemos otras dos constantes de movimiento via teorema de Poisson
[pz , Lx ] = py , [pz , Ly ] = px
de modo que tanto L como p se conservan. En general si Li , Lj y pk son constantes de movimiento con i, j, k
diferentes entre s, obtenemos la invarianza de L y p. Este es un caso en el cual el teorema de Poisson es u
til
para encontrar nuevas constantes de movimiento.
En contraste, examinemos un escenario en el cual asumimos que px , py , Lz son constantes de movimiento,
la aplicaci
on del teorema de Poisson nos da
[px , py ] = 0 ; [px , Lz ] = py ; [py , Lz ] = px
y el teorema de Poisson no nos genera en este caso nuevas constantes de movimiento.
Por otro lado, las propiedades (8.3), nos dicen que para cualquier par de momentos can
onicos, el corchete
de Poisson entre ellos se anula. Pero de las relaciones (8.88) se observa que para ning
un par de componentes de
L, se anula el corchete entre ellas. Por tanto, a pesar de que describimos a L como el momento angular can
onico
total en virtud de su definici
on como ri pi (suma sobre ndices), no es posible escoger simultaneamente a
dos componentes de L como momentos can
onicos. N
otese que tampoco es posible por ejemplo que Lx sea una
coordenada qi y Ly un momento can
onico pk ya que en este caso tenemos que
[qi , pk ] = [Lx , Ly ] = Lz 6= ik
que de nuevo contradice las Ecs. (8.3). Similarmente no es posible que por ejemplo Lx y Ly sean ambas
coordenadas qi y qk . En sntesis, no podemos escoger simult
aneamente dos componentes de L como variables
canonicas. Sin embargo, la Ec. (8.89) muestra que es posible escoger simult
aneamente a la magnitud al cuadrado
de L, y a cualquiera de las componentes de L (pero solo una), como variables can
onicas.
14

Recordemos que esto solo vale si la funci


on del sistema no depende explcitamente del tiempo. En realidad, si tal funci
on depende
explcitamente del tiempo, significa que esta puede cambiar con el tiempo incluso si la configuraci
on del sistema permanece sin
alterar. Esto solo es posible si existe alg
un agente externo que produzca dicho cambio. En conclusi
on, una funci
on u (qi , pi , t) no sera
una funci
on solo del sistema, sino m
as bien una funci
on mixta que depende del sistema y de alg
un agente externo. Razonamiento
identico se da para vectores F, del sistema o mixtos.

8.14. PROPIEDADES DE LOS CORCHETES DE POISSON DE LOS MOMENTOS ANGULARES

8.14.1.

167

Ejemplos de aplicaci
on

Corchetes de momentos angulares para partcula libre


La relaci
on (8.84) se puede verificar explcitamente para el caso particular de una partcula libre descrita por
coordenadas y momentos cartesianos. El vector momento cartesiano p, es claramente un vector del sistema.
Tomemos n = uz , evaluemos directamente el corchete de la izquierda en (8.84), lo haremos componente a
componente
[px , Lz ]

[px , xpy ypx ] = [px , xpy ] [px , ypx ] = x [px , py ] + [px , x] py y [px , px ] [px , y] px

[px , Lz ] = py

donde hemos usado las propiedades (8.10, 8.11) y las identidades (8.3). Similarmente
[py , xpy ypx ] = px ; [pz , xpy ypx ] = 0
de modo que al evaluar la expresi
on de la izquierda en (8.84) para este caso resulta
[p, L uz ] = py ux + px uy
este corchete nos da las componentes de uz p, lo cual confirma la validez de la Ec. (8.84) para este caso particular. Adicionalmente, para este problema el lector puede verificar explcitamente la validez de las siguientes
expresiones

 

[p L, L n] = p2 , L n = L2 , L n = 0

que nos confirman que estas cantidades son escalares, es decir que no son afectadas por una rotaci
on, en
concordancia con (8.87).
Corchetes de momentos angulares para partcula en campo externo

Supongamos que una partcula se somete a un campo magnetico externo uniforme. Tomemos el vector
F = A siendo A 12 (r B) donde B = Bux describe al campo magnetico. A representa fsicamente un
potencial vectorial asociado al campo magnetico B. El vector A depende de un vector interno y otro externo
al sistema, por tanto es de esperarse que en general se transforme bajo la TCI generada por L uz pero no
necesariamente de la forma prescrita por (8.84). La evaluaci
on explcita de los corchetes nos da
1
1
1
1
(r B) = (xux + yuy + zuz ) Bux = yBuz + zBuy
2
2
2
2

1
[Fx , Lz ] = [Ax , Lz ] = [0, Lz ] = 0 ; [Fy , Lz ] = [Ay , Lz ] =
zB, xpy ypx = 0
2


1
1
[Fz , Lz ] = [Az , Lz ] = yB, xpy ypx = Bx
2
2
A =

por tanto el miembro izquierdo de la Ec. (8.84) nos da


1
[A, L uz ] = Bxuz
2

(8.90)

en cuanto al miembro derecho de (8.84), el vector uz A nos da 12 Bzux . Efectivamente, vemos que el vector
A se transforma bajo una rotaci
on del sistema (ya que el corchete de la Ec. 8.90 no es nulo), pero no se
transforma con la prescripci
on dada por (8.84).

168

8.15.

CAPITULO 8. CORCHETES DE POISSON Y OTROS INVARIANTES CANONICOS

Ejercicios

1. Demostrar que las transformaciones de escala, as como las transformaciones can


onicas extendidas, no
dejan invariantes a los corchetes de Poisson.
2. Demostrar las propiedades (8.9, 8.10) de los corchetes de Poisson.
3. Verifique que se cumple la relaci
on (8.15) entre los corchetes de Poisson y los corchetes de Lagrange.
4. Utilizando corchetes de Poisson, demuestre que las transformaciones definidas en la Ec. (7.94), P
ag. 138,
son can
onicas.
5. Utilizando corchetes de Poisson, demuestre que las transformaciones definidas en la Ec. (7.95), P
ag. 139,
son can
onicas.
6. Demuestre en detalle que la Ec. (8.79) es la soluci
on conocida del movimiento arm
onico simple en terminos
de las condiciones iniciales.

Captulo 9

Teora de Hamilton-Jacobi y variables


acci
on-
angulo
Ya hemos mencionado que las transformaciones can
onicas pueden ser usadas como un procedimiento para
resolver las ecuaciones de movimiento, para lo cual se sugirieron dos estrategias, (a) Cuando el Hamiltoniano
se conserva, se puede obtener la soluci
on transformando a un nuevo conjunto de variables can
onicas en donde
todas las coordenadas son cclicas, en cuyo caso las nuevas ecuaciones de movimiento de Hamilton resultan
triviales, y (b) encontrar una transformaci
on can
onica que partiendo de las coordenadas q, p que describen la
configuraci
on del sistema en un tiempo t, nos lleve a un nuevo sistema coordenado constitudo u
nicamente por
cantidades constantes. En particular, las constantes que constituyen el nuevo sistema de variables can
onicas
se puede elegir como el conjunto q0 , p0 que coincide con los valores iniciales de las variables can
onicas. Si
encontramos esta TC, la correspondiente transformaci
on entre las antiguas y las nuevas coordenadas se puede
invertir para obtener
q = q (q0 , p0 , t) ; p = p (q0 , p0 , t)
lo cual nos da el valor de las coordenadas y momentos en funcion de los valores iniciales de estos y el tiempo.
Este procedimiento es el m
as general y es aplicable (al menos formalmente) incluso si el Hamiltoniano es funci
on
del tiempo. La teora de Hamilton Jacobi es un procedimiento sistem
atico para encontrar la transformaci
on
can
onica que lleva de los valores q, p en un tiempo t, a los valores iniciales o a otros valores constantes que son
funciones de las condiciones iniciales.

9.1.

Ecuaci
on de Hamilton Jacobi para la funci
on principal de Hamilton

Podemos asegurar que las nuevas variables can


onicas son todas constantes si el Hamiltoniano transformado
K es identicamente nulo, ya que en tal caso las ecuaciones de Hamilton quedan
K=0

K
K
= Q i = 0 ;
= P i = 0
Pi
Qi

(9.1)

como ya se ha visto, el antiguo y el nuevo Hamiltoniano est


an relacionados a traves de la funci
on generatriz
F
t
por tanto el nuevo Hamiltoniano ser
a nulo si F satisface la ecuaci
on
K=H+

H (q, p, t) +

F
=0
t

(9.2)

(9.3)

tomaremos a F como una funci


on de tipo 2 de acuerdo con la clasificaci
on hecha en el captulo 71 . Por tanto,
F es funci
on de qi , Pi y el tiempo. Con el fin de escribir el Hamiltoniano como funci
on de las mismas variables
1

Recordemos que con una funci


on tipo F2 es f
acil contruir una T.C. contnua, dado que una T.C. que difiere infinitesimalmente
de la identidad es inmediata para este tipo de funci
on generatriz.

169

170

ANGULO

CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-

que F , debemos usar las ecuaciones de transformaci


on (7.19)
pi =

F2
qi

(9.4)

de modo que la Ec. (9.3) se escribe




F2
F2
F2
H q1 . . . qn ;
=0
,...,
;t +
q1
qn
t

(9.5)

la ecuaci
on (9.5) conocida como ecuaci
on de Hamilton Jacobi, es una ecuaci
on diferencial parcial en n + 1
variables (n coordenadas y el tiempo), para la funci
on generatriz que buscamos. Es costumbre denotar las
soluciones de F2 como S por razones que veremos m
as adelante, y dicha funci
on S se denomina funci
on
principal de Hamilton.
La integraci
on de la Ecuaci
on de Hamilton-Jacobi Ec. (9.5) solo nos provee la dependencia con las coordenadas q y el tiempo; no aparece ninguna informaci
on sobre los nuevos momentos. En realidad, lo u
nico que
sabemos es que todos los nuevos momentos deben ser constantes pero no hemos especificado que valores deben
tener. Volveremos sobre la determinaci
on de los nuevos momentos m
as adelante. Matem
aticamente, la Ec.
(9.5) es una ecuaci
on diferencial parcial de primer orden en n + 1 variables (q, t). Un tipo de soluci
on posible
de esta ecuaci
on es
(9.6)
F2 S = S (q1 . . . qn ; 1 , . . . , n+1 ; t)
donde i son n + 1 constantes de integraci
on independientes. Estas soluciones se conocen como soluciones
completas de la ecuaci
on diferencial parcial 2 . No obstante, una de las constantes de movimiento es irrelevante
debido a que en todas las ecuaciones en donde aparece F2 , solo aparece su derivada parcial con respecto a
alguna variable (y en particular en la Ec. 9.5). Por tanto si F2 es una soluci
on, F2 + tambien es soluci
on
de modo que una de las constantes de integraci
on debe ser aditiva en S. Por tanto, la soluci
on puede remover
una constante sin ninguna perdida de generalidad de modo que podemos escribir
S = S (q1 . . . qn ; 1 , . . . , n ; t)

(9.7)

donde ninguna de las constantes independientes n es solamente aditiva. Observese que (9.7) debe ser de la
estructura de una funci
on F2 i.e. S = S (q, P, t). La manera m
as natural de llegar a esta estructura con (9.7),
es asumiendo que
(9.8)
Pi = i
veremos enseguida que esta suposici
on no contradice la aseveraci
on original de que los nuevos momentos est
an
conectados con los valores iniciales q (t0 ) y p (t0 ).
Describiremos ahora como se obtiene la soluci
on din
amica del problema con base en el metodo de HamiltonJacobi. Una vez que se obtiene una soluci
on F2 S, de la ecuaci
on de Hamilton-Jacobi (9.5), llevamos esta
soluci
on a las n primeras ecuaciones de transformaci
on (7.19) de la forma
pi =

S (q, , t)
qi

(9.9)

cuando evaluamos estas n ecuaciones en t = t0 , las u


nicas inc
ognitas son las 0 s ya que las cantidades q, p
adquieren sus valores iniciales. Por tanto las Ecs. (9.9) evaluadas en t = t0 , son n ecuaciones con n inc
ognitas
, que nos permiten al menos formalmente, encontrar las en funci
on de los valores iniciales de q, p. Las otras
n ecuaciones asociadas a F2 (ver Ecs. 7.19) se escriben
Qi i =
2

S (q, , t)
i

(9.10)

Este no es el u
nico tipo de soluci
on posible, la soluci
on mas general incluye una o m
as funciones arbitrarias en lugar de
constantes. Incluso exigiendo que dichas funciones sean constantes hay en general mas de una soluci
on del tipo (9.6). Sin embargo,
lo importante es que exista al menos una soluci
on, pues la unicidad de la misma no es necesaria ya que la funci
on principal de
Hamilton no representa un observable. De hecho, la falta de unicidad de la soluci
on se debe a la ausencia de condiciones iniciales
y/o de frontera sobre las funciones F2 S.

DE HAMILTON JACOBI PARA LA FUNCION


PRINCIPAL DE HAMILTON
9.1. ECUACION

171

donde hemos tenido en cuenta que los nuevos momentos los hemos elegido como las 0 s y que las nuevas
coordenadas tambien deben ser constantes que denotamos por i . Una vez conocidos los valores de las i a
traves de las Ecs. (9.9), podemos reemplazar estos valores en (9.10) para obtener las i haciendo t = t0 en
dichas ecuaciones y apelando a las condiciones iniciales en q. Ahora bien, en las ecuaciones (9.10) podemos
despejar qj para obtener las coordenadas en funci
on de , , t
qj = qj (, , t)

(9.11)

lo cual resuelve la din


amica de las coordenadas generalizadas qj en funci
on del tiempo y de las condiciones
iniciales. Despues de derivar en la Ec. (9.9) se pueden tomar las qi encontradas en (9.11) para sustiturlas en
(9.9), con lo cual se encuentra el valor de cada pi en funci
on de , , t
pi = pi (, , t)

(9.12)

por tanto, las Ecs. (9.11, 9.12) constituyen las soluciones completas a las ecuaciones de Hamilton.
La funci
on principal de Hamilton es en consecuencia generadora de una transformaci
on can
onica que nos
lleva a valores constantes de las nuevas coordenadas y los nuevos momentos. Cuando se resuelve la ecuaci
on
de Hamilton-Jacobi (9.5), obtenemos al mismo tiempo una soluci
on al problema mec
anico. Matem
aticamente
hemos establecido una equivalencia entre las 2n ecuaciones can
onicas de movimiento que son 2n ecuaciones
diferenciales ordinarias de primer orden, con la ecuaci
on diferencial parcial de primer orden de Hamilton Jacobi.
Esta clase de equivalencia es muy com
un en la teora de ecuaciones diferenciales de primer orden. Esencialmente
la conexi
on proviene del hecho de que ambas formulaciones provienen del principio variacional de Hamilton
modificado (recordemos que la Ec. 9.2 proviene del principio de Hamilton modificado). Hasta cierto punto, la
asignaci
on de las i como los nuevos momentos es arbitraria. Podramos haber elegido como momentos otro
conjunto de constantes i , que son a su vez funciones independientes de las constantes de integraci
on i
i = i (1 , . . . , n )

(9.13)

por medio de estas relaciones, la funci


on principal de Hamilton se puede escribir en funci
on de q, , t, el resto
de la derivaci
on es an
aloga teniendo cuidado de reemplazar i i en (9.9) y (9.10). Es a veces conveniente
definir ciertos i como los nuevos momentos en lugar de las i que aparecen como constantes de integraci
on
en (9.5).
Un caso interesante se da cuando el Hamiltoniano no depende explcitamente del tiempo y por tanto se
conserva. En este caso la Ec. (9.5) muestra que S/t no puede ser funci
on explcita del tiempo con lo cual la
forma mas general de S se escribe como
S (q, , t) = W (q, ) kt

(9.14)

donde W (q, ) es llamada la funci


on caracterstica de Hamilton. Insertando (9.14) en (9.5) se observa
que la constante k debe coincidir con el valor del Hamiltoniano (que es precisamente constante). Recuerdese
que a
un cuando el Hamiltoniano sea constante, no necesariamente corresponde a la energa del sistema.

9.1.1.

Interpretaci
on fsica de las soluciones de Hamilton-Jacobi

Podemos obtener cierta informaci


on fsica adicional sobre la funci
on principal de Hamilton S (q, , t), tomando
su derivada total con el tiempo
S
dS (q, , t)
S
=
qi +
dt
qi
t
dado que = 0. Usando las ecuaciones (9.9) y (9.5) se obtiene
dS
= pi qi H = L
dt
con lo cual se puede escribir
S=

L dt + cte

(9.15)

ANGULO

CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-

172

recordando que el principio de Hamilton es una aseveraci


on sobre la integral definida de L en el tiempo, y que
a partir de el se obtiene la soluci
on del problema mec
anico via ecuaciones de Lagrange, vemos que en este caso
la misma integral de acci
on pero esta vez en forma indefinida, nos provee de otro metodo de soluci
on. N
otese
que la Ec. (9.15) no posee utilidad pr
actica puesto que para evaluar la integral en el tiempo se debe conocer
L en funci
on de t lo cual equivale a conocer q (t) y q (t) es decir hay que saber la soluci
on.
En forma similar, el significado fsico de la funci
on caracterstica de Hamilton W , se puede revelar a traves
de su derivada total
dW
W
=
qi
dt
qi
Usando (9.9) y (9.14) se obtiene
dW
= pi qi W =
dt

pi qi dt =

pi dqi

(9.16)

que es precisamente la acci


on abreviada definida en (6.92) aunque en forma de integral indefinida.

9.2.

Soluci
on del oscilador arm
onico por el m
etodo de Hamilton-Jacobi

Una vez m
as, usaremos el oscilador arm
onico para ejemplificar la nueva tecnica, que en este caso corresponde
al metodo de Hamilton-Jacobi.

9.2.1.

Oscilador arm
onico unidimensional con el m
etodo de Hamilton Jacobi

Partimos del Hamiltoniano para el oscilador arm


onico lineal unidimensional

1
H=
p 2 + m2 2 q 2 E ; =
2m

k
m

(9.17)

de acuerdo con la ecuaci


on fundamental de Hamilton Jacobi Ec. (9.5), debemos sustitur a p por S/q en el
Hamiltoniano (recordando que F2 se redefine como S) y plantear la ecuaci
on diferencial (9.5)
1
2m

"

S
q

2

2 2 2

+m q

S
=0
t

como este Hamiltoniano no depende explcitamente del tiempo, podemos escribir a S como (9.14) (donde
usaremos en vez de k). De esta forma se elimina la dependencia temporal de la ecuaci
on de Hamilton Jacobi
1
2m

"

W
q

2

+ m2 2 q 2 =

(9.18)

la constante corresponde a la energa del sistema lo cual se puede ver reemplazando (9.14) en (9.3)
H+

S
=0 H =0
t

la ecuaci
on (9.18) se puede integrar con lo cual se obtiene
W

2m

S = t +

dq

2m

dq

m 2 q 2
2
r
1

(9.19)
m 2 q 2
2

(9.20)

DEL OSCILADOR ARMONICO

9.2. SOLUCION
POR EL METODO
DE HAMILTON-JACOBI

173

aunque la integral se puede resolver explcitamente, debemos recordar que S no aparece en las ecuaciones de
movimiento sino solo sus derivadas parciales. Resulta m
as u
til en este caso, hacer primero las derivaciones
antes de integrar. La soluci
on para q se obtiene de las ecuaciones (9.10)
r
Z
S
dq
m
q
= t +
=
2 2

2
1 m2q
que al ser integrado nos da

" r
#
1
m 2
t + = arcsin q

la coordenada q se puede despejar de aqu para obtener a q en funci


on del tiempo y de las dos constantes y

r
2
q=
sin (t + ) ; = H,
(9.21)
m 2
que es la soluci
on que conocemos para el oscilador arm
onico. La soluci
on para el momento conjugado se obtiene
formalmente de las Ecs. (9.9) teniendo en cuenta (9.19) y (9.20)
p=

p
W
S
=
= 2m m2 2 q 2
q
q

(9.22)

y sustituyendo (9.21) en (9.22) se obtiene

p =
p =



2m 1 sin2 (t + )

2m cos (t + )

(9.23)

este resultado nos dice que p = mq como se esperaba. Finalmente, debemos determinar las constantes y a
traves de las condiciones iniciales q0 , p0 . El valor de se puede despejar f
acilmente evaluando las Ecs. (9.21)
y (9.23) en t = 0 y sumando sus cuadrados
2m = p20 + m2 2 q02
esta misma ecuaci
on se puede encontrar recordando que = H = E es constante, y usando la Ec. (9.17) en
t = t0 . La fase se obtiene de nuevo evaluando (9.21) y (9.23) en t = 0 y haciendo el cociente
tan = m

q0
p0

En este caso vemos que la funci


on principal de Hamilton S asumi
o el papel de generador de una transformaci
on
canonica a una nueva coordenada que mide el angulo de fase inicial, y a un nuevo momento que se puede
identificar como la energa total del sistema.
Ahora bien, si sustitumos la soluci
on (9.21) para q en la Ec. (9.20) obtenemos

Z
Z 
1
2
2
S = t + 2 cos (t + ) dt = 2
cos (t + )
dt
2
se puede verificar que el integrando coincide con el Lagrangiano
L




 2

1
1
2
2 2 2
2
2
p m q = cos (t + ) sin (t + ) = 2 cos (t + )
2m
2
Z
S = L dt

y vemos que S efectivamente coincide con la integral indefinida del Lagrangiano con el tiempo, como lo prescribe
la Ec. (9.15). N
otese que tal identidad solo se pudo comprobar una vez que se encontr
o la soluci
on.

174

9.2.2.

ANGULO

CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-

Oscilador arm
onico bidimensional anisotr
opico

Para ilustrar problemas de m


as de un grado de libertad, tomemos un oscilador arm
onico bidimensional con
constante de restituci
on diferente en x y en y es decir kx 6= ky , el Hamiltoniano se escribe en la forma

1
p2x + p2y + m2 x2 x2 + m2 y2 y 2
H=E=
2m

x =

kx
; y =
m

ky
m

(9.24)

como el Hamiltoniano no depende del tiempo la funci


on principal de Hamilton queda
S (x, y, , y , t) = W (x, y, , y ) t
dado que las coordenadas y momentos en x e y se separan en forma de suma en el Hamiltoniano, es razonable
suponer que la funci
on caracterstica de Hamilton W se separa de forma similar
S (x, y, , y , t) = Wx (x, , y ) + Wy (y, , y ) t

(9.25)

usando (9.24, 9.25) en la Ec. (9.5), obtenemos la ecuaci


on de Hamilton-Jacobi para el oscilador bidimensional
anisotr
opico
"
#


2
Wx 2
W
1
y
+ m2 x2 x2 +
+ m2 y2 y 2 =
2m
x
y
1
2m

"

Wy
y

2

+ m2 y2 y 2

1
=
2m

"

Wx
x

2

+ m2 x2 x2

(9.26)

el termino de la izquierda solo depende de y, y el de la derecha solo depende de x, de modo que ambos deben
ser constantes. Igualemos cada termino a una constante que denotamos y
1
2m
1

2m

"

"

Wy
y
Wx
x

2

2

m2 y2 y 2

m2 x2 x2

#
#

= y

(9.27)

= y

(9.28)

la segunda ecuaci
on se puede reescribir como
1
2m

"

Wx
x

2

+ m2 x2 x2 = x ; x y

(9.29)

con lo cual las ecuaciones (9.27, 9.29) quedan m


as simetricas. Comparando las Ecs. (9.27, 9.29) con la Ec.
(9.18), vemos que las soluciones son de la forma dada en las Ecs. (9.21, 9.23)
x =
y =

2x
sin
(
t
+

)
;
p
=
2mx cos (x t + x )
x
x
x
mx2
p
2y
sin
(
t
+

)
;
p
=
2my cos (y t + y )
y
y
y
my2

vemos que de nuevo las 0 s son las fases constantes y la energa es


E = = x + y

(9.30)

DEL OSCILADOR ARMONICO

9.2. SOLUCION
POR EL METODO
DE HAMILTON-JACOBI

9.2.3.

175

Oscilador arm
onico bidimensional isotr
opico

Si tomamos el oscilador bidimensional isotr


opico es decir con kx = ky podemos usar el resultado anterior
y resolverlo como caso particular. No obstante, cuando kx = ky surge una simetra que est
a ausente en el caso
general, ya que la interacci
on se vuelve central como se puede observar del potencial con x = y
V (x, y) =

 m 2 r 2
mx2 2 my2 2 m 2 2
x +
y =
x + y2 =
V (r)
2
2
2
2

en consecuencia, resulta interesante resolver el problema utilizando coordenadas polares, ya que en estas
coordenadas el oscilador isotr
opico tiene una coordenada cclica


p2
1
H=E=
p2r + 2 + m2 2 r 2
2m
r
vemos que el Hamiltoniano es cclico en . Emulando el procedimiento en el caso anisotr
opico, asumimos que
la funci
on caracterstica W es separable
S (r, , , ) = Wr (r, , ) + W (, , ) t
con lo que la ecuaci
on de Hamilton-Jacobi queda
"
#



1
Wr 2
1 W 2
+ 2
+ m2 2 r 2 =
2m
r
r




W 2
Wr 2
r
+
+ m2 2 r 4 = 2mr 2
r




2
W 2
2
2 Wr
= 2mr r
m2 2 r 4

r
2

el termino de la izquierda depende solo de y el de la derecha solo de r. Ambos deben ser iguales a una
constante 2 luego


W
= W =

de las ecuaciones b
asicas para los generadores se tiene que
p =

S
W
=
=

es decir es justamente el momento conjugado (constante) asociado a la variable cclica. La ecuaci


on para
Wr queda


2

2
Wr 2
2
2 Wr
2 2 4
2
2mr r
m r =
= 2m m2 2 r 2 2
r
r
r
s
Z
p2
Wr =
2mE m2 2 r 2 2 dr
(9.31)
r
as c
omodo usar la soluci
on en coordenadas cartesianas
aunque se puede resolver directamente para Wr , es m
dada en las Ecs. (9.30) para la condici
on kx = ky
r

2
x =
sin
(t
+
)
;
p
=
2m cos (t + )
x
m 2
r

2
y =
sin t
; py = 2m cos t
2
m

176

ANGULO

CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-

y las utilizamos para encontrar las contrapartes polares usando


p
y
r = x2 + y 2 ;
= arctan
x
con lo cual la soluci
on polar resulta
r
q
2
r =
sin2 t + sin2 (t + ) ;
pr = mr
m 2


sin t
; p = mr 2
= arctan
sin (t + )
La conservaci
on de p (asociado a la variable cclica ), nos habla de la conservaci
on del momento angular
debido al car
acter central que adquiere la interacci
on con la isotropa. Hay algunos casos lmites de interes, el
primero cuando = 0, en cuyo caso
r

4
r=
sin t ; pr = 2m cos t ; =
; p = 0
2
m
4
el movimiento en el plano x y ser
a una oscilaci
on a lo largo de una lnea diagonal que pasa por el origen.
Otro caso lmite ocurre cuando = /2, en tal caso
r
2
r = r0 =
; pr = 0 ; = t ; p = mr02
m 2
el movimiento en el plano x y trazar
a un crculo centrado en el origen de radio r0 . Para valores de en el
intervalo (0, /2), la orbita en el plano x y es una elipse centrada en el origen, aunque los semiejes mayor y
menor no van en general a lo largo de los ejes x e y. Estos son ejemplos de figuras de Lissajous.

9.3.

Ecuaci
on de Hamilton Jacobi para la funci
on caracterstica de Hamilton

La raz
on principal que permite la f
acil integraci
on del oscilador arm
onico con el metodo de Hamilton-Jacobi,
es el hecho de que la funci
on principal de Hamilton se puede separar de la forma prescrita en (9.14), lo cual a
su vez es posible siempre que el Hamiltoniano original no dependa explcitamente del tiempo, es decir cuando
este se conserva. Insertando (9.14) en (9.5) y haciendo k 1 se obtiene la ecuaci
on de Hamilton-Jacobi
restringida


W
H qi ,
= 1
(9.32)
qi

esta ecuaci
on ya no depende del tiempo, adem
as se observa que una de las constantes de integraci
on (por
convenci
on la elegimos como 1 ) corresponde al valor (constante) del Hamiltoniano. En este caso la funci
on
caracterstica de Hamilton aparece como parte de la funci
on generatriz S cuando H es constante. Sin embargo,
veremos que W puede ser por s sola una funci
on generatriz de una transformaci
on can
onica con propiedades
diferentes a las generadas por S. Consideremos una transformaci
on can
onica en la cual todos los nuevos
momentos son constantes de movimiento i , donde en particular 1 corresponde al valor del Hamiltoniano. Si
la funci
on generatriz de esta transformaci
on la postulamos como W = W (q, P ), entonces esta funci
on es de
tipo 2 de tal forma que las ecuaciones de transformaci
on vienen dadas por (7.19)
pi =

W (q, )
qi

Qi =

W (q, )
W (q, )
=
Pi
i

(9.33)

estas ecuaciones se asemejan a sus an


alogos para S, Ecs. (9.9, 9.10), pero ahora la condici
on que determina a
W es que H sea uno de los momentos can
onicos nuevos, que por convenci
on denotamos como 1 3
H (pi , qi ) = 1 .
3

(9.34)

N
otese que en (9.14) k es una constante de integraci
on pero no necesariamente es un momento conjugado. Cuando dicha
constante se convierte en un momento conjugado, la expresi
on para Qi definida en (9.33) diferir
a de la definida en (9.10).

DE HAMILTON JACOBI PARA LA FUNCION


CARACTERISTICA DE HAMILTON177
9.3. ECUACION
Adicionalmente, aqu solo pedimos que las coordenadas nuevas Qi sean cclicas pero no necesariamente que
sean constantes, pues solo exigimos que sean constantes los momentos conjugados Pi . Usando (9.33) en (9.34)
resulta


W
H qi ,
= 1
(9.35)
qi
que coincide con la Ec. (9.32). De aqu tambien se ve que puesto que W no involucra al tiempo, el antiguo y el
nuevo Hamiltoniano coinciden numericamente i.e. K = 1 . Esto es una diferencia con respecto al formalismo
de la funci
on generatriz S, la cual cambia el valor del Hamiltoniano y lo vuelve nulo.
La funci
on caracterstica de Hamilton genera una TC que nos lleva a otro conjunto de variables en donde
todos los momentos son constantes, usando las Ecs. de Hamilton esto se traduce en
K
P i =
= 0, Pi = i
Qi

(9.36)

es decir todas las coordenadas Qi son cclicas, de modo que la soluci


on del problema ya es trivial. Ahora
bien, dado que el nuevo Hamiltoniano solo depende de uno de los i puesto que K = 1 , y como las i son
independientes, tenemos entonces que de las otras ecuaciones de Hamilton
K
1
=
= i1
Q i =
i
i

(9.37)

se obtienen entonces las soluciones

W (q, )
(9.38)
i
de modo que la u
nica coordenada que no es una constante de movimiento es Q1 . Dado que 1 = K es el
momento conjugado a Q1 y Q1 es la u
nica coordenada que depende del tiempo, vemos de nuevo un escenario
en el cual el Hamiltoniano y el tiempo act
uan como si fueran variables can
onicamente conjugadas.
La dependencia de W con las antiguas coordenadas q se determina con la Ec. Diferencial Parcial (9.32),
conocida como ecuaci
on de Hamilton-Jacobi restringida. En este caso hay n constantes de movimiento (con
respecto al caso anterior, no hay constante de integraci
on para el tiempo), pero de nuevo una de ellas es una
constante meramente aditiva la cual se identifica de inmediato con 1 4 . De nuevo es natural asumir que las
n constantes de integraci
on (incluyendo a 1 ) sean los nuevos momentos conjugados.
Veamos ahora como se obtiene la soluci
on din
amica en el formalismo de Hamilton-Jacobi restringido (HJR).
Una vez que se encuentra una soluci
on para W (q, ) de la Ec. (9.32), introducimos este W en la primera mitad
de las ecuaciones (9.33) y lo evaluamos en t = t0 , esto nos relaciona las constantes con las condiciones iniciales.
Reemplazando i = i (q0 , p0 ) en las Ecs. (9.38), y evaluando en t = t0 obtenemos i = i (q0 , p0 ). Una vez
conocidos i , i en terminos de las condiciones iniciales, se eval
uan de nuevo las Ecs. (9.38) pero esta vez para
tiempo arbitrario, lo cual nos permite despejar qi = qi (j , j , t) y por tanto cada qi en terminos del tiempo y
de las condiciones iniciales. Finalmente, estas qi (q0 , p0 , t) se reemplazan junto con los i (q0 , p0 ) en el primer
conjunto de ecuaciones (9.33) para obtener pi como funci
on del tiempo y las condiciones iniciales, con lo cual
ya tenemos la soluci
on din
amica completa5 .
Vale la pena enfatizar que solo una de las n ecuaciones (9.38) involucra al tiempo. Teniendo en cuenta que
W es funci
on de qj y j resulta de (9.38) que
Qi = i1 t + i

t + 1 = f1 (q1 , . . . , qn ; 1 , . . . , n )
i = fi (q1 , . . . , qn ; 1 , . . . , n )

i = 2, 3, . . . , n

vemos que solo la ecuaci


on con i = 1 nos conecta explcitamente al tiempo. Por otro lado, las ecuaciones con
i > 1 solo relacionan a las qi0 s entre s, es decir son ecuaciones de trayectoria. Una de las qi s se puede
tomar como independiente y las otras coordenadas se pueden expresar en terminos de ella resolviendo solo las
4
Sin embargo, a diferencia de la constante aditiva que apareca en (9.14), en este caso la constante tiene un significado fsico
pues es el valor numerico del Hamiltoniano.
5
N
otese que la segunda mitad de Ecs. (9.33) no se us
o directamente, en virtud de que son equivalentes a las Ecs. (9.38).

178

ANGULO

CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-

ecuaciones que son independientes del tiempo. En consecuencia, el formalismo nos conduce directamente a las
ecuaciones de movimiento de la trayectoria (ya que no involucran al tiempo explcitamente). Por ejemplo en
el caso de fuerzas centrales veremos que este procedimiento nos genera la ecuaci
on de r en funci
on de sin
pasar primero por las soluciones de r (t) y (t).
Como ya se mencion
o, no es en general necesario elegir las i s como los nuevos momentos can
onicos.
En ocasiones puede ser m
as conveniente elegir otras constantes i que son funciones de las constantes de
integraci
on i
Pi i (1 , . . . , n ) ; i = 1, . . . , n
(9.39)

naturalmente las i deben ser independientes entre s. En tal caso, la funci


on caracterstica de Hamilton
W tendr
a como argumentos a las qi , i . El nuevo Hamiltoniano K = 1 (numericamente igual a H pero
a funci
on exclusivamente de las i . Las
funcionalmente diferente) se obtiene despejando 1 de (9.39) y ser
ecuaciones de Hamilton son entonces
K
K
1 (i )
Pk =
= 0 ; Q k =
=
vk
(9.40)
Qk
k
k
es obvio que las vk son constantes que dependen exclusivamente de las k . Las soluciones para las nuevas
variables can
onicas son
(9.41)
Pk = k ; Qk = vk t + k
la forma de W no se puede encontrar hasta tener una soluci
on completa de la ecuaci
on de Hamilton Jacobi
restringida.
Un comentario final, a priori la expresi
on K = cte conduce a las mismas ecuaciones de movimiento que
K = 0. Sin embargo, las ecuaciones (9.1) con K = 0 claramente conducen a soluciones diferentes que las Ecs.
(9.36, 9.37) con K = 1 = cte. Para comprender la diferencia debemos tener en cuenta que aunque las i
son constantes, ellas son tratadas como variables para efectos de obtener las ecuaciones de Hamilton como se
ve en las Ecs. (9.37), es decir que aunque K es constante, dicha constante 1 es una propiedad del sistema
(en muchos casos la energa del sistema), si en cambio K es igual a una constante independiente del sistema,
entonces para todos los efectos ser
a equivalente a escoger K = 0.
En otros terminos, supongamos que un sistema Fsico tiene condiciones iniciales (q0 , p0 ), si para el mismo
sistema cambiamos las condiciones iniciales a (q00 , p00 ), entonces cambiar
a en general el valor numerico del
Hamiltoniano

1 q00 , p00 6= 1 (q0 , p0 )
En tal caso, al usar el formalismo en el cual W es la funci
on generatriz, el valor numerico del nuevo Hamiltoniano
K = 1 debe cambiar con respecto al caso en el cual usamos las condiciones iniciales (q0 , p0 ). En contraste, en
el formalismo en el cual S es la funci
on generatriz, dicha funci
on se ajusta de modo que el nuevo Hamiltoniano
sea siempre nulo, por tanto en este formalismo K = 0 sin importar las condiciones iniciales.
Esto nos deja una lecci
on muy importante, dos Hamiltonianos que difieren en una constante solo son
equivalentes si la constante en cuesti
on no es una funci
on del sistema, es decir si no depende de las condiciones
iniciales de este. No obstante, en este escenario muy particular (siempre que el Hamiltoniano sea independiente
del tiempo) los Hamiltonianos K = 1 y K = 0 corresponden a la misma Fsica, ya que ambos est
an escritos
6
en bases can
onicas distintas, y pretenden por metodos diferentes resolver el mismo problema . Pero si dos
Hamiltonianos escritos en la misma base can
onica difieren en una constante que es funci
on del sistema, las
ecuaciones de Hamilton son diferentes y la Fsica que describen es diferente.

9.4.

Paralelismo entre el formalismo de Hamilton-Jacobi y el formalismo


restringido de Hamilton-Jacobi

Es u
til hacer un esquema que nos muestre la estrategia de soluci
on de las ecuaciones de movimiento basados
en la funci
on principal de Hamilton S o en la funci
on caracterstica de Hamilton W .
6

Las ecuaciones de Hamilton para los dos Hamiltonianos son diferentes pero no porque esten asociados a Fsica diferente, sino
a bases can
onicas distintas.

9.4. PARALELISMO ENTRE EL FORMALISMO DE HAMILTON-JACOBI Y EL FORMALISMO RESTRINGIDO


Estos metodos son aplicables cuando el Hamiltoniano
es una funcion general de q, p, t
se conserva
H (q, p, t)
H (q, p) = cte 1
La idea del metodo es encontrar una transformaci
on can
onica que nos lleve a nuevas cooordenadas de modo
que
todas las nuevas coordenadas y momentos Todos los momentos Pi sean constantes
Qi , Pi , sean constantes de movimiento
para satisfacer estos requerimientos es condici
on suficiente que el nuevo Hamiltoniano K
sea identicamente zero Sea cclico en todas las nuevas coordenadas Qi
K=0
H = K (Pi ) = 1
bajo estas condiciones, las ecuaciones de Hamilton para Qi , Pi son
K
K
Q i = P
=0
Q i = P
= vi
i
i
K
K
Pi = Qi = 0 Pi = Qi = 0
las soluciones son inmediatas
Q i = i Q i = vi t + i
Pi = i
Pi = i
Que satisface los requerimientos inicialmente propuestos. En ambos metodos se han trivializado las ecuaciones de Hamilton de modo que la dificultad para resolver las ecuaciones de movimiento se ha trasladado a
la b
usqueda de la TC. Para ello se plantea la existencia de una funci
on generatriz de tipo 2 que genera dicha
TC, en cada caso la funci
on generatriz es
on caracterstica de Hamilton
La funci
on principal de Hamilton Funci
F2 (q, P ) W (q, P )
F2 (q, P, t) S (q, P, t)
que satisface la ecuaci
on diferencial
parcial


S
W
H q, S
,
t
+
=
0
H
q,
1 = 0
q
t
q
una soluci
on completa de cada ecuaci
on parcial contiene
n constantes de integraci
on no triviales n 1 constantes de integraci
on no triviales que junto con 1
1 , . . . , n
forman un conjunto de n constantes independientes
Como los Pi deben ser constantes, es natural escoger los Pi como n funciones independientes de las constantes de integraci
on
Pi = i (1 , . . . , n ) Pi = i (1 , . . . , n )
las soluciones de la ecuaci
on de Hamilton Jacobi tendr
an como argumentos
S = S (qi , i , t) W = W (qi , i )
En particular podemos escoger i = i . Recordando que S y W son funciones generatrices tipo 2, sus
ecuaciones parciales asociadas son
(qi ,i )
pi = S(qqi ,i i ,t)
pi = Wq
i

(qi ,i )
Qi = S(qi ,i i ,t) = i Qi = W
= vi (j ) t + i
i
La primera mitad de estas ecuaciones se satisface autom
aticamante ya que han sido empleadas para construir la ecuaci
on de Hamilton Jacobi. La segunda mitad se puede resolver para qi en terminos de t y las 2n
constantes i ,i . Para terminar, se deben encontrar los valores especficos de las 2n constantes para lo cual se
requieren los dos conjuntos de ecuaciones evaluados en t = t0 y empleando las condiciones iniciales q0 , p0 .
Finalmente, cuando el Hamiltoniano no es funci
on explcita del tiempo, i.e. H = 1 = cte, ambos metodos
son adecuados y nos llevan a una misma ecuaci
on de movimiento Ec. (9.32)


W
H qi ,
= 1
(9.42)
qi

sin embargo, la interpretaci


on de la soluci
on W (qi , i ) es muy distinta para el formalismo de Hamilton-Jacobi
(HJ) con respecto a la interpretaci
on en el formalismo de Hamilton-Jacobi restringido (HJR). En el formalismo
de HJ, W (qi , i ) es solo una parte de la funci
on generatriz de la TC, la funci
on generatriz completa est
a dada
por
S (q, , t) = W (q, ) 1 t
(9.43)

180

ANGULO

CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-

y S genera una TC que cambia el valor numerico del Hamiltoniano a una valor identicamente nulo, trayendo
como consecuencia que todos los nuevos momentos y coordenadas son constantes de movimiento.
En contraste, para el formalismo HJR, la soluci
on W (qi , i ) representa la funci
on generatriz completa, la
cual al ser independiente del tiempo no genera un cambio en el valor numerico del Hamiltoniano de modo
que K = 1 , la TC generada por W es tal que todas las nuevas coordenadas son cclicas. Como consecuencia,
los nuevos momentos son constantes de movimiento y las nuevas coordenadas son o bien constantes o bien
funciones lineales del tiempo.
Debe decirse sin embargo, que aunque W se interpreta de modo diferente en HJ y en HJR, ambas est
an
resolviendo el mismo problema Fsico.

9.5.

Separaci
on de variables en la ecuaci
on de Hamilton-Jacobi

En esta seccion no utilizaremos convenci


on de suma sobre ndices repetidos a menos que se especifique lo
contrario. Cabe preguntarse en que casos la ecuaci
on de Hamilton Jacobi es de utilidad pr
actica teniendo en
cuenta que en general las ecuaciones diferenciales parciales con m
ultiples inc
ognitas son de difcil soluci
on.
Veremos que bajo ciertas condiciones, es posible hacer una separaci
on de variables en la ecuaci
on de Hamilton
Jacobi en cuyo caso es posible siempre reducir el problema a cuadraturas. En realidad, salvo casos excepcionales,
el formalismo de Hamilton Jacobi solo es efectivo cuando dicha separaci
on es realizable.
on de Hamilton Jacobi cuando la funci
on principal de
Una coordenada qj se dice separable en la ecuaci
Hamilton (o la funci
on caracterstica), se pueden separar en dos partes aditivas, una que solo depende de la
coordenada qj (y de los i ) y otra que es totalmente independiente de qj . Por simplicidad pensemos que la
on principal de Hamilton se escribe como
variable separable es q1 , la funci
S (q1 , . . . , qn ; 1 , . . . , n ; t) = S1 (q1 ; 1 , . . . , n ; t) + S 0 (q2 , . . . , qn ; 1 , . . . , n ; t)
y la ecuaci
on de Hamilton Jacobi se puede separar en dos ecuaciones, una separadamente para S1 y otra para S 0 .
N
otese que la condici
on de separabilidad ha sido impuesta a la soluci
on de la ecuaci
on y no al Hamiltoniano.
Adicionalmente decimos que la ecuaci
on de Hamilton Jacobi (HJ) es totalmente separable (o simplemente
separable) cuando todas las coordenadas en el problema son separables, de modo que la funci
on principal se
escribe como
n
X
S=
Si (qi ; 1 , . . . , n ; t)
(9.44)
i=1

esta hip
otesis de separaci
on es consistente siempre que la introducir (9.44) en (9.5), se obtengan n ecuaciones
de la forma


Sj
Sj
Hj qj ;
; 1 , . . . , n ; t +
=0
(9.45)
qj
t

es notable que si el Hamiltoniano no depende explcitamente del tiempo, podemos tratar al tiempo como
variable separable y el paso de la funci
on principal a la funci
on caracterstica de Hamilton constituye entonces
un ejemplo de la forma en que trabaja la separaci
on de variables. En este caso podemos parametrizar la funci
on
principal de Hamilton en la forma
S (q, , t) = S0 (, t) + W (q, )
al introducir esta soluci
on en la ecuaci
on de HJ, teniendo en cuenta que el Hamiltoniano no depende explcitamente del tiempo resulta


W
S0
H q,
+
=0
q
t

el primer termino solo depende de las qi en tanto que el segundo depende solamente de t. Por tanto, ambos
terminos deben ser constantes con valores opuestos


W
S0
H q,
= 1 ;
= 1 S0 = 1 t
q
t
S (q, , t) = 1 t + W (q, )
(9.46)

DE VARIABLES EN LA ECUACION
DE HAMILTON-JACOBI
9.5. SEPARACION

181

donde claramente 1 coincide con el valor numerico del Hamiltoniano. La Ec. (9.46) est
a en concordancia con
(9.43). Naturalmente podemos sumar una constante al valor de S0 pero esto no tiene ninguna relevancia. Lo
importante es encontrar una soluci
on para S, pues recordemos que la unicidad no se requiere para la funci
on
generatriz.
Si adem
as de que el Hamiltoniano es independiente del tiempo ocurre que todas las variables son separables,
podemos parametrizar cada Si de la forma
Si (qi ; 1 , . . . , n ; t) = Wi (qi ; 1 , . . . , n ) i t

(9.47)

ahora bien, si la ecuaci


on de HJ es realmente separable, la suposici
on de separabilidad de S debe conducirnos
a ecuaciones de la forma (9.45), que junto con la forma especfica de la hip
otesis de separaci
on (9.47) nos
dar
a un conjunto de n ecuaciones restringidas de HJ.


Wj
Hj qj ;
; 1 , . . . , n = j
(9.48)
qj
Es de anotar que las funciones Hi pueden ser o no Hamiltonianos, esto est
a relacionado con el hecho de
que el concepto de separabilidad no involucra al Hamiltoniano sino a las soluciones de la ecuaci
on de HJ.
Similarmente, las constantes de separaci
on i puede ser o no ser una energa, (aunque sus dimensiones son
siempre de energa), o alguna otra cantidad dependiendo de la naturaleza de qi .
Las constantes i se denominan constantes de separaci
on. Cada una de las ecuaciones (9.48) involucra
solo una coordenada qj y la correspondiente derivada parcial de Wj con respecto a qj . En consecuencia, resultan
un conjunto de ecuaciones diferenciales ordinarias de primer orden. Dado que en principio podemos resolver
a reducido a cuadraturas.
para despejar Wj /qj para luego integrar sobre qj , se deduce que el problema est
En la pr
actica ocurre con frecuencia que cada Hi solo contiene uno o unos pocos 0 s. Adicionalmente,
existen escenarios en donde solo r variables son separables y las restantes n r variables no pueden separarse.
En tal caso, solo podemos reducir a cuadraturas la ecuaci
on de movimiento de las r variables separables como
veremos m
as adelante.
Finalmente salvo casos excepcionales, casi todas las aplicaciones u
tiles del formalismo de HJ involucran
Hamiltonianos independientes del tiempo en donde t es una coordenada separable para S (y cclica para
W ). En consecuencia, la discusi
on subsecuente sobre separabilidad se limitar
a a Hamiltonianos constantes y
se utilizar
a solamente la funci
on caracterstica W .

9.5.1.

Coordenadas ignorables y separabilidad

Podemos demostrar f
acilmente que una coordenada cclica es separable. Por simplicidad, tomemos a q1
como la coordenada cclica, su momento conjugado es una constante de movimiento que denotaremos como
1 . La ecuaci
on de Hamilton Jacobi restringida queda


W
W
H q 2 , . . . , q n ; 1 ;
,...,
= 1
(9.49)
q2
qn
si proponemos una soluci
on de la forma
W = W1 (q1 , ) + W 0 (q2 , . . . , qn ; )

(9.50)

introduciendo (9.50) en (9.49) queda claro que en la Ec. (9.49) solo queda la parte aditiva W 0 , en tanto que
W1 es la soluci
on de la ecuaci
on (9.33) con i = 1
p1 = 1 =

W
W1
=
q1
q1

(9.51)

1 es por tanto la constante de separaci


on, la soluci
on obvia para W1 (excepto por una constante aditiva) es
W1 = 1 q1

(9.52)

182

ANGULO

CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-

con lo cual W estar


a dado por
W = W 0 + 1 q1

(9.53)

hay una gran semejanza entre la Ec. (9.53) y la forma que S asume cuando el Hamiltoniano es independiente del
tiempo Ec. (9.43). Esto no es sorprendente ya que nuevamente, es como suponer que la variable cclica tiempo
asociada al momento conjugado constante H conduzca a una ecuaci
on del tipo (9.53) con 1 H = 1
y con q1 t. Sin embargo, es importante insistir en que esta es solo una analoga ya que t no es una coordenada
generalizada sino un par
ametro. Es cierto que H = 1 puede ser elegido como un momento conjugado, pero a
una coordenada generalizada y no al tiempo.
Si un n
umero s de las n coordenadas son no cclicas y adem
as suponemos que S es totalmente separable,
podemos extender el resultado anterior. El Hamiltoniano viene dado por
H = H (q1 , . . . , qs ; 1 , . . . , n )

(9.54)

y la funci
on caracterstica se escribe como
W (q1 , . . . , qs ; 1 , . . . , n ) =

s
X

Wi (qi ; 1 , . . . , n ) +

i=1

n
X

qi i

(9.55)

i=s+1

y hay s ecuaciones de HJ para solucionar




Wi
Hi qi ;
; 1 , . . . , n = i
qi

i = 1, ..., s

y dado que estas son ecuaciones diferenciales ordinarias de primer orden en la variable independiente qi , se
pueden reducir inmediatamente a cuadraturas, y la soluci
on completa para W se puede obtener.

9.5.2.

Condiciones m
as generales para la separabilidad

En general, una coordenada qj se puede separar si qj y su momento conjugado pj se pueden aislar en el


Hamiltoniano en alguna funci
on f (qj , pj ) que no contiene a ninguna otra variable. Postulemos una soluci
on
de ensayo de la forma
W = Wj (qj , ) + W 0 (qi , )

i = 1, . . . , j 1, j + 1, . . . , n

(9.56)

donde qi representa el conjunto de todos los qs excepto qj . Supongamos que el ansatz de separaci
on (9.56) nos
conduce a que la ecuaci
on restringida de HJ tenga la forma



Wj
W 0
H qi ;
; f qj ,
= 1 ; i = 1, . . . , j 1, j + 1, . . . , n
(9.57)
qi
qj
esta ecuaci
on se puede invertir (al menos formalmente) para despejar a f




Wj
W 0
f qj ,
= g qi ,
, 1
; i = 1, . . . , j 1, j + 1, . . . , n
qj
qi

(9.58)

ahora bien, el lado izquierdo depende exclusivamente de qj en tanto que el lado derecho solo depende de las
otras variables q. Por tanto la Ec. (9.58) solo puede ser cierta si ambos lados son iguales a la misma constante
por lo tanto




Wj
W 0
f qj ,
= j ; g qi ,
= j ; i = 1, . . . , j 1, j + 1, . . . , n
qj
qi
con lo cual se ha logrado la separaci
on de la variable qj .
Vale la pena resaltar que la separabilidad depende no solo del problema fsico sino tambien del sistema de
coordenadas generalizadas usado. Por ejemplo el problema de un cuerpo bajo una fuerza central es separable
en coordenadas polares pero no en cartesianas. En algunos casos la ecuaci
on de HJ no se puede separar

9.6. FUERZAS CENTRALES EN EL FORMALISMO DE HAMILTON-JACOBI

183

completamente como es el caso en el problema de los tres cuerpos. En contraste, para algunos problemas
fsicos es posible separar la ecuaci
on de HJ en m
as de un sistema coordenado. En general solo es posible
encontrar una soluci
on cerrada para la ecuaci
on de HJ cuando las variables son completamente separables.
En consecuencia, se han estudiado con profundidad diversos metodos para encontrar los sistemas coordenados
apropiados para cada problema.
En general no hay un criterio simple para indicar que sistemas coordenados conducen a soluciones de
Hamilton Jacobi separables para un problema especfico. Sin embargo, en el caso de sistemas ortogonales de
coordenadas, las llamadas condiciones de Staeckel resultan muy u
tiles. Estas son condiciones necesarias y
suficientes para la separabilidad bajo ciertas circunstancias. Dichas condiciones son las siguientes:
1. El Hamiltoniano se conserva.
2. El Lagrangiano es solo una funci
on cuadr
atica de las velocidades generalizadas de tal forma que el
Hamiltoniano tiene la estructura dada por la Ec. (6.20) con L0 (q, t) = V (q)
H=

1
(e
pe
a) T1 (p a) V (q)
2

3. El sistema coordenado es un sistema ortogonal, esto trae como consecuencia que la matriz T sea diagonal
y por lo tanto tambien lo es su inversa
T1

ij

1
ij (no suma)
Tii

4. El vector a tiene elementos ai que solo dependen de su coordenada correspondiente i.e. ai = ai (qi )
5. La funci
on potencial V (q) es separable en la forma
V (q) =

Vi (qi )
Tii

(9.59)

6. Existe una matriz de dimensi


on n n con elementos ij = ij (qi ) de tal forma que
1

1j

1
(no suma)
Tjj

Si se cumplen las condiciones de Staeckel, la funci


on caracterstica de Hamilton ser
a completamente separable.
X
W (q) =
Wi (qi )
i

y cada Wi satisface las ecuaciones

Wi
ai
qi

2

= 2Vi (qi ) + 2ij j

siendo las j constantes de integraci


on y solo hay suma sobre j. La u
ltima condici
on resulta a priori muy
complicada. Sin embargo veremos m
as adelante que en la pr
actica ocurre a menudo que solo es necesario probar
la existencia de la matriz , sin que sea necesario encontrar su forma explcita. Esto facilita enormemente
aplicar las condiciones de Staeckel. Para m
as informaci
on sobre las condiciones de Staeckel, remitimos al lector
al apendice D de la segunda edici
on de la Ref. [1].

9.6.

Fuerzas centrales en el formalismo de Hamilton-Jacobi

En esta seccion nos limitaremos a plantear el problema de una partcula sometida a una fuerza central y
reducirlo a cuadraturas empleando el metodo de HJ. El proposito es solo ilustrar el metodo ya que los detalles
sobre este problema se discutir
an en el captulo 10.

184

9.6.1.

ANGULO

CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-

Problema bidimensional

Consideremos el problema de una partcula sometida a una fuerza central descrita por el potencial V (r).
En virtud de la conservaci
on del momento angular, se puede observar que el movimiento debe realizarse en un
plano. El Hamiltoniano para este sistema bidimensional se escribe como


p2
1
2
(9.60)
H=
pr + 2 + V (r)
2m
r
dado que es cclica, podemos escribir W en la forma (9.55)
W = W1 (r) +

(9.61)

= p l

(9.62)

donde
es el momento conjugado a i.e. la magnitud del momento angular. Para el Hamiltoniano (9.60), la ecuaci
on
de Hamilton Jacobi restringida (9.32) queda de la forma
"
#

1
W 2 (W/)2
+
+ V (r) = 1
2m
r
r2


dW1 2 2
+ 2 + 2mV (r) = 2m1
(9.63)
dr
r
recordemos que 1 se identifica con el valor numerico del Hamiltoniano y en este caso, de la energa total
del sistema. La Ec. (9.63) es una ecuaci
on diferencial ordinaria para W1 (r) que se puede reducir en forma
inmediata a cuadraturas
s


2
dW1
= 2m [1 V (r)] 2
dr
r
y la funci
on W dada por (9.61) queda en la forma
s

Z
2

W = + 2m [1 V (r)] 2 dr
r

con esta expresi


on las Ecs. (9.38) toman la forma
Z
W
m dr
q
t + 1 =
=
1
2
2m [1 V (r)] r2
Z
W
W
dr
q
2 =
=
=
2

r 2 2m [1 V (r)]

(9.64)

2
r2

(9.65)

La ecuaci
on (9.64) nos da r = r (t) y en general, las constantes 1 y se pueden relacionar con las cantidades
conservadas energa y momento angular (en el problema de una partcula sometida a una fuerza central, es
m
as com
un conocer la energa y el momento angular como condiciones iniciales, en lugar de las tradicionales
condiciones iniciales de posici
on y momento). Como ya se mencion
o, las restantes ecuaciones de Qi que no
involucran explcitamente al tiempo, proporcionan la ecuaci
on de la orbita. En este caso solo hay una ecuaci
on
remanente para la orbita Ec. (9.65). En general resulta u
til realizar el cambio de variable u = 1/r en (9.65)
con lo que la ecuaci
on de la orbita queda en la forma
Z
du
= 2 q
(9.66)
2m
2
(

V
)

u
1
2

2 estar
a relacionado con el angulo inicial medido en un sistema de ejes apropiado.

9.6. FUERZAS CENTRALES EN EL FORMALISMO DE HAMILTON-JACOBI

9.6.2.

185

La din
amica de las fuerzas centrales como problema tridimensional

En la anterior secci
on asumimos desde el principio que el movimiento se ejecutaba en un plano en virtud de
la conservaci
on del momento angular. Resulta ilustrativo trabajar el mismo problema pero asumiendo que el
movimiento es en general en tres dimensiones para llegar posteriormente a la conclusi
on de que el movimiento
es bidimensional. Comencemos entonces con el Hamiltoniano asociado a una partcula sometida a un potencial
central en coordenadas esfericas, Ec. (6.25)
!
p2
p2
1
2
H=
+ V (r)
(9.67)
pr + 2 + 2 2
2m
r
r sin
asumiendo separaci
on de variables, la funci
on caracterstica de Hamilton Jacobi queda de la forma
W = Wr (r) + W () + W ()

(9.68)

y dado que la coordenada es cclica en el Hamiltoniano (9.67) tenemos que


W =

(9.69)

donde es una constante de integraci


on y coincide con el momento conjugado a como se puede ver teniendo
en cuenta las Ecs. (9.51) y (9.52). Usando la forma de W dada por las Ecs. (9.68, 9.69) la ecuaci
on de Hamilton
Jacobi queda de la forma
"
#



2
W 2
Wr 2
1
+ 2mV (r) = 2mE
(9.70)
+ 2
+
r
r

sin2
donde hemos escrito la constante de integraci
on 1 como la energa que es el valor numerico de nuestro
Hamiltoniano. Notese que toda dependencia de ha sido separada en el termino entre parentesis cuadrados,
es decir cumple con la estructura de la Ec. (9.57). Esto nos implica que esta funci
on de se puede igualar a
una constante seg
un el razonamiento hecho en la secci
on 9.5.2, por ejemplo despejando el termino mencionado
queda
"
#


2
2
W 2
2
2 Wr
+
= 2mr [E V (r)] r

r
sin2
el miembro izquierdo depende solo de y el derecho solo de r luego ambos deben igualarse a la misma constante


2

= 2
sin2

2
2
2 Wr
= 2
2mr [E V (r)] r
r
+

(9.71)
(9.72)

y obtenemos dos ecuaciones diferenciales ordinarias para y r que ya me reducen el problema a cuadraturas.
N
otese que la ecuaci
on diferencial para r tambien se puede encontrar reemplazando (9.71) en (9.70) quedando


Wr
r

2

2
= 2m [E V (r)]
r2

(9.73)

esta ecuaci
on es claramente equivalente a (9.72). El u
nico aspecto que falta determinar es la asociaci
on de las
constantes E, , con cantidades fsicas. La cantidad E es la energa del sistema. Por otro lado, es el
momento conjugado a la variable , y sabemos que el momento conjugado a una variable angular corresponde
a la componente del momento angular del sistema a lo largo del eje de rotaci
on que rotara al sistema como
un todo en una cantidad d, este eje sera claramente el eje z y por tanto corresponde a la componente
polar del momento angular Lz .

186

ANGULO

CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-

No es tan sencillo identificar el significado Fsico de por m


ultiples razones. En primer lugar, esta cantidad
aparece como una constante de separaci
on y no como el momento conjugado a (de por s veremos m
as adelante
que no lo es), por otro lado una variaci
on en no define un u
nico eje de rotaci
on, ya que a diferencia de
cuya variaci
on ocurre siempre sobre el plano XY , la variaci
on en se da en el plano definido por el eje Z y
el vector instantaneo de posici
on, este plano claramente cambia cuando vara la direcci
on del vector posici
on.
Finalmente, no puede tomar cualquier valor (0 ) con lo cual se dificulta su interpretaci
on como angulo
de rotaci
on. Para encontrar el significado fsico de , calculemos primero los momentos conjugados a cada
variable angular recurriendo al correspondiente Lagrangiano en tres dimensiones para coordenadas esfericas
de la partcula sometida al potencial V (r) i.e.
L (r, , ) =


1  2
m r + r 2 2 + r 2 2 sin2 V (r)
2

los momentos conjugados a las variables angulares quedan


p =
p =

L (r, , )
= mr 2

L (r, , )
= mr 2 sin2

(9.74)
(9.75)

ahora veremos la relaci


on entre , y los momentos p , p 7 . Ya hemos mencionado que es el momento
conjugado a la variable
= p =

(9.76)

Para relacionar con los momentos conjugados, podemos reescribir (9.71) en la forma
p2 +

p2
sin2

= 2

de tal manera que el Hamiltoniano (9.67), se puede reescribir como




2
1
2
H=
pr + 2 + V (r)
2m
r

(9.77)

(9.78)

y comparando (9.78) con el Hamiltoniano (9.60) y usando (9.62) resulta8


= p (asociado a dos dimensiones) l

(9.79)

lo cual ya nos da el significado fsico de como el m


odulo del momento angular del sistema. Notese que en
tres dimensiones la conservaci
on del m
odulo del momento angular no est
a asociado a una variable cclica como
9
s ocurre en dos dimensiones , pues no es variable cclica en tres dimensiones y por tanto p no es constante
de movimiento como se puede apreciar de (9.77), de esta ecuaci
on tambien se observa que l se escribe en
terminos de los momentos asociados a ambos angulos.
Vemos entonces que la conservaci
on de las constantes E, , representan fsicamente la conservaci
on de
la energa, de la componente polar del momento angular y del m
odulo del momento angular respectivamente.
En este ejemplo, vemos que el metodo de Hamilton Jacobi resulta particularmente poderoso para extraer las
constantes de movimiento as como las ecuaciones de r = r (t) y de la orbita. Adicionalmente, el formalismo
7
A priori estaramos tentados a interpretar a p = mr 2 como el m
odulo del momento angular total, pero en tres dimensiones
no es la velocidad angular con que la partcula se mueve sobre el plano. En particular, n
otese que no es cclica y por tanto p
no es constante de movimiento.
8
Los Hamiltonianos (9.78) y (9.60) se pueden comparar apropiadamente, ya que tanto en coordenadas polares planas como en
coordenadas esfericas, la coordenada r se refiere a la distancia al origen.
9
El modulo del momento angular en tres dimensiones aparece como una constante de separaci
on .

CON EL FORMALISMO DE HJ
9.7. OTROS PROBLEMAS DE APLICACION

187

de Hamilton Jacobi para este problema es separable en otras coordenadas como las parab
olicas y elpticas, y
las constantes aparecen en forma apropiada para cada sistema coordenado.
Este problema tambien provee un escenario natural para emplear las condiciones de Staeckel de modo que
encontremos el potencial m
as general V para una partcula que haga que las soluciones de la ecuacion sean
totalmente separables en coordenadas esfericas. La matriz de las condiciones de Staeckel solo depende del
sistema coordenado y no del potencial. Como acabamos de demostrar que la ecuaci
on de Hamilton Jacobi
es separable para al menos un potencial en coordenadas esfericas, las condiciones de Staeckel me dicen que
dicha matriz tiene que existir, y observamos por otro lado que no requerimos de la forma especfica de
para encontrar las condiciones de separabilidad, solo requerimos de su existencia. Adicionalmente, el arreglo
rectangular columna a es nulo y sabemos que el sistema de coordenadas esfericas es ortogonal, de modo que
las condiciones de Staeckel se reducen a aplicar (9.59), para encontrar la forma separable m
as general del
potencial. Para ello encontramos primero los elementos (diagonales) de la matriz de energa cinetica (ver Ec.
6.24, P
ag. 98)
Trr = m ; T = mr 2 ; T = mr 2 sin2
(9.80)
aplicando (9.59) la estructura m
as general del potencial separable es de la forma
V (q) =

0
V ()
Vr0 (r) V0 () V ()
V ()
+
+
= Vr (r) +
+ 2 2
2
Trr
T
T
r
r sin

Vq (q)

Vq0 (q)
m

se puede comprobar la separabilidad de este potencial por sustituci


on directa en la ecuaci
on de HJ.

9.7.
9.7.1.

Otros problemas de aplicaci


on con el formalismo de HJ
Partcula sometida a potencial arm
onico y campo magn
etico

Sea una partcula restringida a moverse en un plano, bajo la influencia de un potencial central (no electromagnetico) V (r) = (k/2) r 2 y un campo magnetico constante B, perpendicular al plano. Reduciremos este
problema a cuadraturas utilizando HJ. Supondremos que el plano de movimiento pasa por el origen (el foco
del potencial central) de modo que las fuerzas arm
onica y magnetica est
an en dicho plano.
Si bien puede existir una fuerza extra de ligadura que mantenga a la partcula en el plano10 , esta no
produce trabajo virtual y no contribuye al potencial y por tanto, tampoco contribuye al Lagrangiano ni al
Hamiltoniano. Tomando XY como el plano de movimiento, el Lagrangiano en coordenadas cartesianas se
escribe


m 2
k 2
L=
x + y 2 + q (r A)
x + y2
2
2
un potencial vectorial v
alido para campo magnetico homogeneo y constante es el dado por la Ec. (5.72), P
ag.
(91)
1
1
1
B r = Buz (xux + yuy + zuz ) = (xBuy yBux )
2
2
2
1
B
r A = (xu
x + yu
y + zu
z ) (yBux + xBuy ) = (xy y x)

2
2
A =

y el Lagrangiano queda
L=
introduciendo coordenadas polares

 qB

m 2
k 2
x + y 2 +
(xy y x)

x + y2
2
2
2

x = r cos , x = r cos r sin


10

y = r sin , y = r sin + r cos

Aunque las fuerzas aplicadas est


an en el plano, una componente de la velocidad inicial perpendicular al plano, sacara a la
partcula de este.

ANGULO

CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-

188

el Lagrangiano queda
L =
L =


m 2
r + r 2 2 +
2

m 2
r + r 2 2 +
2




i k
qB h
(r cos ) r sin + r cos (r sin ) r cos r sin r 2
2
2  





qB 2 k 2
k
1
0
r
m
0
r r = r 2 + r
+
r
qB 2
2

0
mr

r
2
2
2
2
2

comparando con (6.16), tenemos


k
L0 (q, t) = r 2 ; a =
2

0
qB 2
2 r

; T=

m
0
0 mr 2

; T

1
m

0
1
mr 2

y usando (6.20) podemos escribir el Hamiltoniano


H =
H =

1
1
(e
pe
a) T1 (p a) L0 (q, t) =
pr p
2
2


1 2
1
qB 2 2 1 2
pr +
r
p

+ kr

2m
2mr 2
2
2

qB 2
2 r

1
m

0
1
mr 2



pr
2
p qB
2 r

k
+ r2
2
(9.81)

aplicando la ecuaci
on de Hamilton-Jacobi (9.5) al Hamiltoniano (9.81), se obtiene
1
2m

S
r

2

1
+
2mr 2

S qB 2

2

1
S
=0
+ kr 2 +
2
t

(9.82)

puesto que el Hamiltoniano no depende explcitamente del tiempo y es cclica, proponemos una soluci
on de
la forma
S (r, , E, , t) = Wr (r, E, ) + p Et
(9.83)
con lo cual la ecuaci
on de HJ (9.82) queda
1
2m

dWr
dr

2

1
+
2mr 2

cuya soluci
on formal es
Wr (r) =

dr

qB 2
p
r
2

2mE mkr 2

2

1
r2

1
+ kr 2 = E
2

qB 2
r
2

2

(9.84)

on se puede reescribir como


definiendo k = m02 , la soluci
Wr (r) =

v
"
u



2 #
u
p2
qBp
qB

dr t2m E +
m2 02 +
r 2 2
2m
2m
r

(9.85)

Si comparamos esta soluci


on con la soluci
on (9.31) para el oscilador arm
onico bidimensional isotropico, vemos
que la Ec. (9.85) equivaldra a un oscilador arm
onico bidimensional isotr
opico con energa E 0 y frecuencia
angular dadas por
r
q
k
qB
0
2
2
E = E + c p , = 0 + c ; 0
, c
m
2m
n
otese que c es la mitad de la frecuencia de ciclotr
on de la partcula en el campo magnetico B. Cuando B = 0,
0
se obtiene E = E y = 0 como era de esperarse. Naturalmente, el problema puede formularse directamente
con la funci
on caracterstica W en lugar de la funci
on principal S.

CON EL FORMALISMO DE HJ
9.7. OTROS PROBLEMAS DE APLICACION

9.7.2.

189

Partcula bajo potencial conservativo en coordenadas elipsoidales

Una partcula en el espacio est


a sometida a un potencial conservativo V (r). Escribiremos las ecuaciones de
HJR en coordenadas elipsoidales u, v, , las cuales se pueden definir con respecto a las coordenadas cilndricas
(r, z, ) de la siguiente manera
r = a sinh v sin u

z = a cosh v cos u

(9.86)

donde a es una distancia arbitraria pero fija (a > 0). Encontraremos la ecuaci
on de HJR asociada al problema.
Comenzamos por plantear la energa cinetica T en coordenadas elipsoidales. Para ello partimos de la
expresi
on de T en coordenadas cilndricas
 1
1
T = m r 2 + z 2 + mr 2 2
2
2
y usando las relaciones (9.86) obtenemos

(9.87)

r = av cosh v sin u + au sinh v cos u ; z = av sinh v cos u au cosh v sin u

r + z 2 = a2 (cosh2 v sin2 u + sinh2 v cos2 u)(v 2 + u 2 )





= a2 1 + sinh2 v sin2 u + sinh2 v 1 sin2 u (v 2 + u 2 )

r 2 + z 2 = a2 (sin2 u + sinh2 v)(v 2 + u 2 )

de modo que la energa cinetica (9.87) y el Lagrangiano en coordenadas elipsoidales queda



1
1
ma2 (sin2 u + sinh2 v)(v 2 + u 2 ) + ma2 sinh2 v sin2 u 2
2
2

1
1
2
2
2
2
2
L =
ma (sin u + sinh v)(v + u ) + ma2 sinh2 v sin2 u 2 V (u, v, )
2
2
L = V (u, v, ) +

2 (sin2 u + sinh2 v)
u

ma
0
0

1
v
+
0
0
ma2 (sin2 u + sinh2 v)
u v

2
2
2
2
0
0
ma sinh v sin u

comparando con (6.16) tenemos

sin2 u + sinh2 v
0
0

L0 = V (u, v, ) ; T = ma2
0
sin2 u + sinh2 v
0
2
2
0
0
sinh v sin u

1
0
0
2
2
1 sin u+sinh v

1
1
0
0
a = 0 ; T =

sin2 u+sinh2 v
ma2
1
0
0
sinh2 v sin2 u

con lo cual el Hamiltoniano (6.20) queda


e T1 p L0 =
H = p
H =

1
2ma2

pu pv


p

sin2

1
u+sinh2 v

0
0

0
1
sin2 u+sinh2 v

0
0
1
sinh2 v sin2 u

p2
p2u + p2v
+
+ V (u, v, )
2ma2 (sin2 u + sinh2 v) 2ma2 sinh2 v sin2 u

para este Hamiltoniano, la ecuaci


on de Hamilton-Jacobi restringida (9.32) nos da
2
h


 i
W 2
W 2
W
+
u
v

+
+ V (u, v, ) = E
2
2
2
2
2ma sin u + sinh v
2ma sinh2 v sin2 u

v + V (u, v, )

(9.88)

ANGULO

CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-

190

asumiendo separabilidad aditiva de la funci


on caracterstica de Hamilton, tenemos
W = Wu + Wv + W
con lo cual la ecuaci
on de HJR queda
h


Wu 2
+
u
2
2

2ma


Wv 2
v
2

sin u + sinh v

+


W 2

2ma2 sinh2 v sin2 u

+ V (u, v, ) = E

(9.89)

Simplificaremos un poco el problema asumiendo que el potencial tiene simetra azimutal, de modo que
V = V (u, v). En tal caso, ser
a cclica en el Hamiltoniano (9.88), con lo cual W = p , siendo
p =

L
= m a2 sinh2 v sin2 u = mr 2 = cte

y la ecuaci
on de HJR se simplifica en la forma
h

 i

Wu 2
Wv 2
+
sin2 u + sinh2 v p2

u
v
+
+ sin2 u + sinh2 v V (u, v) =
2
2
2
2
2ma i
2ma sinh v sin u
h


Wu 2
Wv 2


+ v
p2

u
1
1
+ sin2 u + sinh2 v V (u, v) =
+
+
2
2
2
2
2ma
2ma
sinh v sin u

esta ecuaci
on se puede reescribir en la forma
"


Wu 2
u
2ma2

p2

2ma2 sin2 u

E sin u + sin u + sinh v V (u, v) = E sinh v


Wv 2
v
2ma2


sin2 u + sinh2 v E

sin2 u + sinh2 v E

p2
2ma2 sinh2 v

(9.90)

que estructuralmente se escribe como



F (u) + sin2 u + sinh2 v V (u, v) = G (v)

es claro que esta ecuaci


on admitir
a separaci
on de variables si el termino sin2 u + sinh2 v
separar, es decir si se cumple
sin2 u + sinh2 v

V (u, v) se puede

V (u, v) = Vu (u) + Vv (v)


Vu (u) + Vv (v)
V (u, v) =
sin2 u + sinh2 v

(9.91)

si el potencial tiene la estructura dada en (9.91), la Ec. (9.90) queda



Wu 2
u
2ma2

p2
2ma2 sin2 u

E sin u + Vu (u) = E sinh v


Wv 2
v
2ma2

p2
2ma2 sinh2 v

Vv (v)

(9.92)

y dado que el miembro izquierdo solo depende de u y el derecho solo de v, ambos deben ser iguales a una constante A, con lo cual obtenemos dos ecuaciones diferenciales ordinarias que reducen el problema a cuadraturas


p2
1
dWu 2
+
E sin2 u + Vu (u) = A
2ma2
du
2ma2 sin2 u


p2
1
dWv 2
2
+
2 E sinh v + Vv (v) = A
2
2ma2
dv
2ma sinh v

(9.93)
(9.94)

CON EL FORMALISMO DE HJ
9.7. OTROS PROBLEMAS DE APLICACION

191

Partcula puntual bajo el campo gravitacional de dos masas desiguales por HJR
Vamos a ilustrar la separaci
on de variables en la Ec. (9.92), reduciendo a cuadraturas el problema de una
masa puntual m, que se mueve en el campo gravitacional generado por dos masas desiguales fijas M1 y M2 .
Dado que a en las Ecs. (9.86) es una cantidad positiva arbitraria pero fija, la definiremos de modo que sea la
mitad de la distancia entre M1 y M2 . Sin perdida de generalidad, podemos asumir que M1 y M2 yacen en el
eje Z en las posiciones r1 = auz , r2 = auz . Si r es la posici
on de la masa m, el potencial generado por M1 y
M2 en la posici
on r de m ser
a
V (r) =

GmM1
GmM2
GmM1
GmM2

|r r1 | |r r2 |
|r auz | |r + auz |

(9.95)

una ventaja de poner a M1 y M2 sobre el eje Z, es que el potencial tendr


a autom
aticamente simetra azimutal.
Resta entonces demostrar que el potencial (9.95) posee en coordenadas elipsoidales la estructura dada en la
Ec. (9.91), para reducir este problema a cuadraturas.
Denotaremos a la posici
on de la masa m como r = xux + yuy + zuz de modo que
|r auz |2 = |xux + yuy + (z a) uz |2 = x2 + y 2 + (z a)2
|r auz |2 = r 2 + (z a)2

(9.96)

donde r, z y son las coordenadas cilndricas de r. Ahora escribimos la expresi


on (9.96) en coordenadas
elipsoidales, haciendo uso de las Ecs. (9.86)
|r auz |2 = a2 sinh2 v sin2 u + (a cosh v cos u a)2

= a2 sinh2 v sin2 u + cosh2 v cos2 u + 1 2 cosh v cos u

n
otese que esta factorizaci
on fue posible, debido a que la constante a de la Ec. (9.86) se hizo coincidir con la
mitad de la distancia entre M1 y M2 de modo que r1,2 = auz . Usando cosh2 v = 1 + sinh2 v, tenemos



|r auz |2 = a2 sinh2 v sin2 u + 1 + sinh2 v cos2 u + 1 2 cosh v cos u
= a2 (sinh2 v + cos2 u + 1 2 cosh v cos u)

= a2 (cosh2 v + cos2 u 2 cosh v cos u)

de lo cual se obtiene finalmente


|r auz |2 = a2 (cosh v cos u)2
que al reemplazar en el potencial (9.95) nos da

V =

GmM2
1 GmM1 (cosh v + cos u) + GmM2 (cosh v cos u)
GmM1

=
a (cosh v cos u) a (cosh v + cos u)
a
cosh2 v cos2 u

el denominador se puede reescribir como


cosh2 v cos2 u = sinh2 v + 1 cos2 u = sinh2 v + sin2 u
reorganizando numerador y denominador, el potencial queda
1 Gm (M1 M2 ) cos u + Gm (M1 + M2 ) cosh v
V (u, v) =
a
sin2 u + sinh2 v
1
  1

Vu (u) + Vv (v)
a Gm (M2 M1 ) cos u + a Gm (M1 + M2 ) cosh v
V (u, v) =

2
2
sin u + sinh v
sin2 u + sinh2 v

192

ANGULO

CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-

por tanto este potencial posee la estructura (9.91) con


1
1
Gm (M2 M1 ) cos u ; Vv (v) = Gm (M1 + M2 ) cosh v
a
a
y reemplazando (9.97) en las Ecs. (9.93, 9.94) el problema queda reducido a cuadraturas
Vu (u) =



p2
1
1
dWu 2
+
E sin2 u + Gm (M2 M1 ) cos u = A
2
2
2
2ma
du
a
2ma sin u

2
2
p
1
dWv
1
+
E sinh2 v Gm (M1 + M2 ) cosh v = A
2
2
2
2ma
dv
a
2ma sinh v

9.8.

(9.97)

(9.98)
(9.99)

Variables acci
on-
angulo para sistemas con un grado de libertad

En m
ultiples ramas de la Fsica es de interes el estudio de movimientos peri
odicos. En muchos casos no
estamos interesados en los detalles de la orbita sino en la determinaci
on de las frecuencias del movimiento. Una
variante del formalismo de Hamilton-Jacobi nos permite hallar el periodo de estos movimientos sin resolver
completamente la ecuaci
on de movimiento. Ya hemos enfatizado que en el metodo de HJ, no estamos obligados
a tomar como nuevos momentos conjugados a las n constantes de integraci
on i , sino que podemos tomar un
conjunto de n funciones k () independientes entre s. Aprovechando esta arbitrariedad, no definiremos los
nuevos momentos conjugados como las constantes de integraci
on i sino como ciertas funciones de las i que
contienen informaci
on sobre un ciclo completo de movimiento, estos nuevos momentos se denotan por Ji y se
denominan variables de acci
on.

Figura 9.1: Trayectoria en el espacio de fase de un sistema unidimensional (a) para periodicidad tipo libraci
on
y (b) para periodicidad tipo rotaci
on.
Consideraremos en primera instancia el caso de un solo grado de libertad. Asumiremos adem
as que el
Hamiltoniano es constante
H (q, p) = 1
podemos resolver para el momento y obtener
p = p (q, 1 )

(9.100)

la Ecuaci
on (9.100) se puede considerar como una ecuaci
on de trayectoria en el espacio de fase. Cuando el
movimiento es peri
odico se habla de una orbita en el espacio de fase. Definiremos dos tipos de periodicidad de
acuerdo con las caractersticas de la orbita en el espacio de fase:

ANGULO

9.8. VARIABLES ACCIONPARA SISTEMAS CON UN GRADO DE LIBERTAD

193

1. En el primer tipo la orbita es cerrada en el espacio de fase como se ve en la figura 9.1(a). De


modo que el punto que define la din
amica en el espacio de fase, regresa sobre la misma trayectoria en
forma periodica. Tanto q como p son funciones peri
odicas en el tiempo con la misma frecuencia. Un
movimiento peri
odico de esta naturaleza se puede encontrar cuando la posici
on inicial yace entre dos
ceros de la energa cinetica, este movimiento se conoce con el termino astron
omico de libraci
on y tiene
como principal exponente al oscilador arm
onico unidimensional.
2. En el segundo tipo de orbita, la trayectoria en el espacio de fase es tal que p es una funci
on peri
odica de
q, con periodo q0 , como se ilustra en la figura 9.1(b). Equivalentemente este tipo de movimiento implica
que cuando la coordenada se incrementa en q0 , el sistema permanece b
asicamente inalterado. El ejemplo
mas familiar es el cuerpo rgido que rota sobre un eje fijo, siendo q el angulo de rotaci
on. Cuando se
incrementa q en 2, no se produce ning
un cambio esencial en el estado del cuerpo rgido. En realidad
para este tipo de periodicidad la coordenada de posici
on est
a siempre asociada a un angulo de rotaci
on
de tal modo que el movimiento peri
odico asociado se denomina simplemente rotaci
on, en constraste con
la libraci
on. En este caso los valores de q ya no est
an acotados sino que pueden crecer indefinidamente.

Figura 9.2: Trayectorias en el espacio de fase de un pendulo simple, para diferentes condiciones iniciales.
Cuando E < mgl, obtenemos una o
rbita cerrada i.e periodicidad tipo libraci
on. Para el caso E=mgl tenemos
bifurcaci
on. Finalmente, cuando E > mgl, tenemos periodicidad de rotaci
on.
Hay sistemas fsicos que pueden exhibir cualquiera de estos dos tipos de movimiento peri
odico. Un ejemplo
sencillo es el pendulo simple consistente en una lenteja sostenida por una varilla fija a un punto de suspensi
on,
11
donde el movimiento de la lenteja es en un plano . En este caso, q es el angulo de deflexi
on respecto a la
vertical. Tomando el cero de potencial en el punto de suspensi
on de la varilla sin masa, la energa es constante
y coincide con el Hamiltoniano quedando
E=
11

p2
mgl cos
2ml2

Asumimos una varilla en lugar de una cuerda para que la distancia al punto de suspensi
on sea siempre la misma, sin importar
la amplitud angular.

194

ANGULO

CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-

siendo l, la longitud de la varilla. Despejando p , obtenemos la ecuaci


on para el camino que describe el punto
del sistema en el espacio de fase en la forma descrita por (9.100)
p
(9.101)
p = 2ml2 (E + mgl cos )

si E es menor que mgl sabemos por consideraciones de energa que el movimiento es acotado en , de modo
que || < max el valor de la cota superior se obtiene cuando p = 0 y corresponde al valor
cos max =

E
mgl

en este caso la energa es siempre negativa. Claramente el pendulo oscila entre max y max lo cual nos
da un movimiento peri
odico tipo libraci
on (ver figura 9.2). N
otese adem
as que el doble signo en (9.101) es
necesario para que la orbita sea cerrada, es decir no define una funci
on. Por otro lado, si E > mgl, la energa
es suficiente para que el pendulo pueda girar completamente de modo que puede tomar cualquier valor y no
esta acotado, este sera un movimiento peri
odico tipo rotaci
on (ver figura 9.2). El lmite E = mgl se ilustra
tambien en la Fig. 9.2, y corresponde a un pendulo que llega a = con energa cinetica cero es decir con
p = 0. Este es un punto de equilibrio inestable en el cual se puede quedar indefinidamente, pero si hay la
menor perturbaci
on el pendulo toma uno de dos caminos dr
asticamente diferentes (giro en cualquiera de los
sentidos). El punto = , p = 0 es un punto de silla para el Hamiltoniano H = E (p , ), y en dicho punto se
intersectan dos caminos del espacio de fase con energa constante. Este fen
omeno se conoce como bifurcaci
on.

9.8.1.

Formulaci
on general de la variables acci
on-
angulo en una dimensi
on

Ignorando por el momento la posibilidad de la bifurcaci


on, asumiremos que nuestro sistema unidimensional
tiene movimiento de libraci
on o de rotaci
on dependiendo de las condiciones iniciales. Para cualquiera de estos
movimientos peri
odicos es u
til introducir una nueva variable J, designada para reemplazar a 1 como el nuevo
momento conjugado del sistema. Es decir el nuevo momento conjugado ya no ser
a el Hamiltoniano sino la
variable acci
on J definida por
I
J=

p dq

(9.102)

la integraci
on se realiza en un ciclo completo de libraci
on o rotaci
on seg
un el caso. Observese que este termino
se asemeja a la acci
on abreviada definida en (6.92) lo cual justifica su nombre de variable de acci
on. Las
dimensiones de J siempre ser
an en consecuencia unidades de momento angular. Teniendo en cuenta (9.100) y
(9.102) se observa que J es funci
on exclusivamente de 1 i.e. del Hamiltoniano
J = J (1 ) 1 H = H (J)

es decir cumple con la estructura dada por (9.39). Vemos adem


as que la coordenada conjugada a J es cclica,
como se espera con el metodo de HJR. La funci
on caracterstica de Hamilton puede escribirse como
W = W (q, J)

(9.103)

La coordenada generalizada conjugada a J se denomina variable angular w, y se define usando el segundo


conjunto de ecuaciones de transformaci
on (9.33)
w=

W (q, J)
J

(9.104)

las ecuaciones de Hamilton para el conjunto can


onico w, J nos dan
w =
J =

H (J)
= v (J)
J
H (J)
= 0 J = cte
w

(9.105)
(9.106)

ANGULO

9.8. VARIABLES ACCIONPARA SISTEMAS CON UN GRADO DE LIBERTAD

195

J es constante ya que est


a asociado a una coordenada cclica. A su vez, puesto que v (J) solo depende de J,
tambien es constante. Por tanto, la Ec. (9.105) tiene soluci
on inmediata
w = vt +

(9.107)

y w es funci
on lineal del tiempo lo cual es l
ogico ya que este es un caso particular de la Ec. (9.41) con w
haciendo el papel de la nueva coordenada Q.
Una vez obtenida W (q, J), la soluci
on formal del problema se puede obtener despejando q en terminos de
w, J a partir de (9.104), y luego reemplazando w por la expresi
on en (9.107). Esto nos da q como funci
on del
tiempo y de las constantes J, v, que a su vez se pueden obtener de las condiciones iniciales. Sin embargo, este
procedimiento no posee ninguna ventaja significativa con respecto a otras elecciones de los nuevos momentos.
El verdadero poder de la formulaci
on en variables acci
on angulo radica en la interpretaci
on Fsica de las
constantes v (J). Para ver su significado primero consideremos el cambio en w cuando q hace un ciclo completo
de libraci
on o rotaci
on, este cambio est
a dado por
w =

w
dq
q

(9.108)

usando (9.104) queda12


w =

2W
dq
q J

dado que J es constante a lo largo de todo el ciclo, la derivada con respecto a J se puede sacar fuera del signo
integral
I
I
W
d
d
dq =
p dq = 1
w =
dJ
q
dJ
donde hemos usado (9.33) y la definici
on de J (9.102). Esta ecuaci
on establece que w cambia en la unidad (w
es adimensional) cuando q se mueve a lo largo de un ciclo. Si ahora asumimos que el movimiento es peri
odico
en el tiempo13 , entonces este cambio tambien se puede evaluar de (9.107)
w = w ( ) w (0) = v = 1
donde denota el periodo para un ciclo completo de q en cualquiera de los dos tipos de periodicidad. De
aqu resulta entonces que v es el inverso del periodo, es decir la frecuencia asociada al movimiento peri
odico de
q. Por lo tanto el formalismo de las variables acci
on angulo nos permite evaluar la frecuencia del movimiento
peri
odico sin resolver completamente el movimiento del sistema. Si sabemos a priori que cierto sistema
de un grado de libertad es peri
odico en cualquiera de las dos formas, la frecuencia se puede determinar una
vez que H se escribe en terminos de J y aplicando (9.105). La identificaci
on de v (J) como una frecuencia
y la Ec. (9.107) nos refuerza el hecho de que a la variable w se le denomine variable angular. De la misma
forma se puede ver que si w tiene dimensiones de angulo (adimensional) el momento conjugado J debe tener
dimensiones de momento angular.
12
N
otese que en (9.108) no aparece dependencia explcita del tiempo como a priori se ve en (9.107). La raz
on es que cuando w
se escribe en terminos de q queda en la forma w = w (q, J) seg
un se puede ver de las Ecs. (9.103, 9.104). Adem
as J es constante a
lo largo del ciclo por construcci
on.
13
N
otese que hasta este punto no se ha utilizado la periodicidad en el tiempo, solo el hecho de que la trayectoria en el espacio
de fase sea cerrada o que p = p (q) sea peri
odica en q, pero podra ocurrir que cada ciclo en el espacio de fase tomara un tiempo
distinto en ejecutarse.

196

9.9.
9.9.1.

ANGULO

CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-

Problemas de aplicaci
on de variables acci
on-
angulo con un solo grado
de libertad
El oscilador arm
onico unidimensional en variables acci
on-
angulo

Como ejemplo de aplicaci


on de este formalismo veamos el oscilador arm
onico unidimensional. Retomando
el Hamiltoniano del oscilador arm
onico denot
andolo por

1
=
p 2 + m2 2 q 2
(9.109)
2m
Para calcular la acci
on debemos despejar el momento p en funci
on de la coordenada q, lo cual nos da
p
p = 2m m2 2 q 2
que coincide con la Ec. (9.22). Podemos ahora calcular la variable de acci
on en la forma
I
I  p

J = p dq =
2m m2 2 q 2 dq

siendo la energa total (conservada) y 2 = k/m. N


otese que el signo positivo vale para la mitad del ciclo
(en el que se incrementa q) y el negativo para la otra mitad (en el que decrece la variable q). Por simetra esto
se puede escribir como cuatro veces la integral que comprende al movimiento desde el origen hasta el punto
de m
aima elongaci
on en direcci
on positiva, en este cuarto de ciclo p > 0 y por tanto el radical es positivo
Z qmax p
2m m2 2 q 2 dq
J =4
0

el cambio de variable

2
sin
m 2
nos define claramente los lmites de integraci
on requeridos para el cuarto de ciclo de la franja superior del
plano de fase, y la integral se convierte en
s


Z /2 s
Z /2  2

2
2 
2m m2 2
sin2 cos d = 4
1 sin2 cos d
J = 4
2
m

0
0
Z /2
8
=
|cos | cos d
0
q=

pero en el intervalo [0, /2] tenemos que |cos | = cos , por tanto
Z
8 /2
2
J=
cos2 d =
0

(9.110)

despejando i.e. el Hamiltoniano resulta

J
2
con lo cual la frecuencia de oscilaci
on se obtiene aplicando (9.105)
r
H

1
k
v=
=
=
J
2
2 m
H (J) =

(9.111)

(9.112)

en concordancia con la frecuencia obtenida por otros metodos. Es interesante escribir las soluciones para las
Ecs. (9.21, 9.23) en funci
on de J y w, a pesar de que no se requieren para encontrar las frecuencias. Teniendo
en cuenta las Ecs. (9.112, 9.107) vemos que

w = vt + =
t+
2
2w = t + ; 2

ANGULO

9.9. PROBLEMAS DE VARIABLES ACCIONCON UN GRADO DE LIBERTAD

197

donde hemos definido adecuadamente la constante arbitraria de integraci


on . Con esta relaci
on, las soluciones
de (9.21, 9.23) en funci
on de J y w quedan de la forma
r
r
J
mJ
q=
sin 2w ; p =
cos 2w
(9.113)
m

Las Ecs. (9.113) definen la transformaci


on can
onica que nos lleva del sistema can
onico (q, p) al sistema
canonico (w, J). Vale la pena enfatizar que la forma explcita de la TC no fue necesaria para calcular la
frecuencia del movimiento.

9.9.2.

Partcula en movimiento peri


odico en una dimensi
on bajo un potencial V (x) = F |x|

Una partcula posee movimiento peri


odico en una dimensi
on bajo la influencia de un potencial V (x) = F |x|,
donde F es constante positiva. Encontraremos el periodo de movimiento utilizando variables acci
on-
angulo. El
Hamiltoniano del sistema es simplemente
p2
+ F |q|
2m
despejando el momento conjugado en terminos de la coordenada y las constantes de movimiento nos da
p
p = 2m (E F |q|)
HE=

con lo cual tenemos una ecuaci


on del tipo (9.100) que describe la trayectoria en el espacio de fase. La variable
de acci
on viene dada por la Ec. (9.102)
I
I p
J = p dq =
2m(E F |q|) dq
(9.114)

Puesto que F > 0, el movimiento est


a acotado dentro del intervalo [E/F, E/F ], como se puede ver por
consideraciones de energa. En un ciclo completo se recorre este intervalo de ida y vuelta. Este movimiento es
del tipo libraci
on ya que la coordenada no crece indefinidamente, sino que retorna a los mismos valores. Por
simetra, podemos recorrer solo el primer cuadrante desde q = 0 hasta q = E/F (donde p = 0), y multiplicamos
por el factor 4 para tener en cuenta el recorrido completo en el espacio de fase. En el recorrido desde 0 hasta
E/F tanto p como q son positivos. La integral (9.114) queda entonces
Z

J = 4 2m

con la sustituci
on

u = E Fq

E/F

p
E F q dq

du = F dq

la integral queda

J
J

Z 0
Z

4 2m E 1/2
1/2 du
u
=
u du
= 4 2m
(F )
F
E
0

8 2m 3/2
=
E
3F

despejando E = H en terminos de J encontramos la frecuencia de movimiento




3F J 2/3 (3F )2/3 2/3

E = H=
=
J
8 2m
4 3 2m
=

H
(3F )2/3 1/3
=
J
J
6 3 2m

(9.115)

198

ANGULO

CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-

y utilizando de nuevo la Ec. (9.115) tenemos


=
=


1/3
H
(3F )2/3
3F
3F

=
=
3
J
6 2m 8 2m E 3/2
12 2mE

1
4 2mE
F

; = =

F
4 2mE

(9.116)

que nos da la frecuenciay periodo del movimiento en terminos de los par


ametros del sistema (F y m) y las
condiciones iniciales (la energa).

9.10.

Variables acci
on-
angulo para sistemas completamente separables14

Cuando tenemos un n
umero arbitrario de grados de libertad, el formalismo de Hamilton Jacobi es particularmente relevante cuando existe uno o mas conjuntos coordenados en los cuales la ecuaci
on de Hamilton
Jacobi es completamente separable. Si adem
as existe alg
un tipo de periodicidad an
aloga a la discutida en la
secci
on anterior, entonces tendremos que la variante del formalismo de Hamilton Jacobi conocida como el formalismo de las variables acci
on angulo, puede ser particularmente ventajosa. Tomaremos adem
as la suposici
on
simplificadora de que H es constante, de modo que podemos usar el formalismo de HJR. La separabilidad
completa nos lleva a que las ecuaciones de la transformaci
on can
onica tengan la forma
pi =

Wi (qi ; 1 , . . . , n )
qi

(9.117)

lo cual nos da cada pi en funci


on de su coordenada conjugada qi y las n constantes de integraci
on
pi = pi (qi ; 1 , . . . , n )

(9.118)

la Ec. (9.118) es el equivalente de (9.100), pero aplicado ahora a varios grados de libertad. La Ec. (9.118)
representa la ecuaci
on de orbita de la proyecci
on del punto del sistema sobre el plano (qi , pi ) en el espacio de
fase (i es un ndice fijo en este caso). Es u
til definir variables acci
on angulo cuando las ecuaciones de orbita
para todos los planos (qi , pi ), describen orbitas cerradas (libraciones) o funciones peri
odicas de qi (rotaciones).
Es de anotar que las condiciones anteriores no significan que necesariamente las variables qi , pi sean funciones peri
odicas del tiempo, es decir que repitan su valor para intervalos de tiempo regulares. Incluso cuando
cada conjunto (qi , pi ) es peri
odico en este sentido, el movimiento completo no es necesariamente peri
odico.
Para tomar un ejemplo concreto, el oscilador arm
onico con tres grados de libertad puede tener una frecuencia
diferente sobre cada coordenada cartesiana, el movimiento solo ser
a peri
odico si las tres frecuencias son conmesurables entre s, es decir si los cocientes entre las frecuencias son racionales; de no ser as, se describen figuras
odico m
ultiple. Una
de Lissajous que no son curvas cerradas15 . Tal movimiento se denomina movimiento peri
de las ventajas de la formulaci
on de Hamilton Jacobi en variables acci
on angulo, es que permite evaluar todas
las frecuencias de un movimiento peri
odico m
ultiple sin resolver completamente el problema del movimiento.
En analoga con (9.102) las variables de acci
on Ji se definen en terminos de integrales de lnea sobre periodos
completos de la orbita en el plano (qi , pi ).
I
Ji =

pi dqi

(9.119)

n
otese que la separabilidad manifestada en la ecuaci
on (9.118) es indispensable para que cada Ji sea una
0
constante, ya que si cada pi depende de varios q s, esta integral depender
a de todos los q 0 s excepto de qi . Si
una coordenada es cclica, su momento conjugado es constante de modo que la trayectoria u orbita en el espacio
de fase (qi , pi ) es una lnea recta horizontal, que no parece ser la naturaleza de un movimiento peri
odico. En
realidad el movimiento se puede considerar un caso lmite de movimiento peri
odico de rotaci
on, en el cual
14

En lo que sigue del captulo no adoptaremos la convenci


on de suma de ndices repetidos a menos que se indique lo contrario.
Vale decir que este ejemplo es en el espacio real y no en el espacio de fase. Pero el razonamiento para el movimiento en el
espacio de fase es identico.
15

ANGULO

9.10. VARIABLES ACCIONPARA SISTEMAS COMPLETAMENTE SEPARABLES17

199

se le puede asignar un periodo arbitrario a qi . Dado que una coordenada de rotaci


on es invariablemente un
angulo, si la coordenada cclica es angular, entonces tendr
a un periodo natural de 2. En consecuencia, es
natural (aunque no obligatorio) evaluar la integral en la definici
on de la variable de acci
on correspondiente
on
a una coordenada angular cclica entre 0 y 2. Por tanto, para toda variable cclica qi su variable de acci
asociada se definir
a como
(9.120)
Ji = 2pi
usando la Ec. (9.117) en la definici
on de Ji Ec. (9.119) se tiene
I
Wi (qi ; 1 , . . . , n )
Ji =
dqi
qi

(9.121)

on de
como ya mencionamos, gracias a la completa separabilidad en las coordenadas, cada Ji es solo funci
las constantes de integraci
on i que aparecen al integrar la ecuaci
on de Hamilton Jacobi y es por tanto
constante. Por otro lado, debido a la independencia de los pares (qi , pi ), se tiene que adem
as las J 0 s son n
0
funciones independientes de las s de modo que forman un conjunto adecuado de constantes para definir los
on
nuevos momentos. Al expresar los 0 s en terminos de los J 0 s, podemos redefinir los argumentos en la funci
caracterstica16
n
X
W = W (q1 , . . . , qn ; J1 , . . . , Jn ) =
Wj (qj ; J1 , . . . , Jn )
(9.122)
j=1

en tanto que el Hamiltoniano sera funci


on exclusiva de las J
H = 1 = H (J1 , . . . , Jn )

(9.123)

al igual que en el caso de un grado de libertad, podemos definir variables angulares conjugadas wi a traves de
la funci
on caracterstica W teniendo en cuenta que esta u
ltima es una funci
on generatriz de tipo 2
n

X Wj (qj ; J1 , . . . , Jn )
W
=
wi =
Ji
Ji

(9.124)

j=1

esta ecuaci
on muestra que las wi son en general funciones de todas las qj y todas las Jj .
wi = wi (q1 , . . . , qn ; J1 , . . . , Jn )

(9.125)

De nuevo, la mitad de las ecuaciones de Hamilton conduce a


w i =

H (J1 , . . . , Jn )
= vi (J1 , . . . , Jn )
Ji

(9.126)

y de nuevo la otra mitad de las ecuaciones de Hamilton nos conduce a que las J 0 s son constantes. Adicionalmente, las vi son todas constantes puesto que son funciones exclusivas de las Ji . Por lo tanto, las ecuaciones
de Hamilton anteriores se pueden integrar para obtener wi como funciones lineales del tiempo
wi = vi t + i

(9.127)

en general cada wi se incrementa de forma diferente a los otros.


En este caso se puede ver que las vi son las frecuencias asociadas al movimiento peri
odico m
ultiple, pero el
argumento para llegar a esta aseveraci
on es m
as sutil que en el caso de un grado de libertad. Las ecuaciones
de transformaci
on que conducen al conjunto can
onico (w, J) implican que cada qj y pj es una funci
on de las
constantes Ji y las variables wi . El objetivo ahora es encontrar la funci
on matem
atica de los qi en terminos
de los wi , para lo cual examinamos el cambio de cada wi cuando cada una de las variables qj ha ejecutado
un n
umero entero de ciclos mj de libraci
on o rotaci
on. Este es un procedimiento puramente matem
atico ya
16

Dado que W es de tipo F2 , debe ser escrita en terminos de las antiguas coordenadas y los nuevos momentos W = W (q, J),
como en la Ec (9.122).

ANGULO

CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-

200

que en este caso no estamos ejecutando un movimiento del sistema en el tiempo. Es como si congel
aramos el
tiempo y cada qi fuera movido independientemente a traves de un cierto n
umero de ciclos de su movimiento.
Esto es an
alogo al concepto de desplazamiento virtual desarrollado para el principio de DAlembert, de modo
que los cambios infinitesimales en las wi cuando cambian las qi infinitesimalmente, son tambien de naturaleza
virtual por lo cual usamos la notaci
on wi
"
#
n
n
n
n
X
X
X
2 X
wi
2W
wi =
dqj =
dqj =
Wk (qk ; J1 , . . . , Jn ) dqj
qj
Ji qj
Ji qj
j=1

j=1

j=1

k=1

donde hemos usado (9.124). La derivada con respecto a qj se anula excepto para Wj y usando (9.117) y (9.118)
se obtiene
n
X
wi =
pj (qj ; J1 , . . . , Jn ) dqj
(9.128)
Ji
j=1

la Ec. (9.128) representa a wi como una suma de contribuciones independientes cada una asociada al movimiento virtual de un qj . El cambio total en wi se puede escribir entonces
I
n
X

wi =
pj (qj , J) dqj
Ji
j=1

(9.129)

mj

el operador diferencial con respecto a Ji se puede mantener por fuera de la integral ya que en el proceso de
integraci
on i.e. de variaci
on de las qi el conjunto de las Ji permanece inalterado. El smbolo mj indica que cada
una de las n integrales se realiza sobre un cierto n
umero de ciclos, siendo mj el n
umero de ciclos que ejecuta
la coordenada qj . Por otro lado, en virtud de la definici
on de variables accion angulo Ec. (9.119) cada una de
estas integrales es mj Jj . Adicionalmente, dado que cada Ji es independiente, se sigue que
wi = mi

(9.130)

si alg
un qj no se barre en un n
umero entero de ciclos en la correspondiente integraci
on, habr
a un remanente
debido a la fracci
on del ciclo que no se complet
o de modo que wi no tendr
a un valor entero. Si tratamos a
los wi y los mi como arreglos vectoriales podemos escribir la relaci
on anterior de la forma
w = m

(9.131)

en estas instancias conviene reafirmar la importancia de la naturaleza virtual del movimiento de rotaci
on o
libraci
on en cada plano qi , pi . N
otese que en (9.128) wi se representa como una suma de contribuciones
ametro tiempo
independientes gracias a la virtualidad del movimiento de cada qj ; pues de lo contrario, el par
hace que estos ciclos se recorran en forma correlacionada. M
as importante a
un, en el movimiento real si las
frecuencias en cada plano qi ,pi no son conmesurables, no existir
a un valor finito del tiempo para el cual se hayan
ejecutado ciclos completos en cada plano. Es decir para un movimiento real con frecuencias no conmesurables,
no hay un valor del tiempo para el cual las Ecs. (9.130, 9.131) sean v
alidas.
Finalmente, es importante insistir en que hasta el momento no se ha utilizado periodicidad en el tiempo,
lo cual est
a enfatizado por el caracter virtual de los wi .

9.10.1.

Movimientos peri
odicos m
ultiples de libraci
on

Supongamos que cada movimiento separado es de tipo libracion, de modo que cada qj , pj vuelve a su valor
inicial cuando se completa un ciclo. El resultado dado por la Ec. (9.131) puede ser expresado de la siguiente
forma: sea el arreglo vectorial de dimensi
on 2n de las qi , pi , que es en general funci
on de w de tal manera que
un cambio no trivial en el cual = 0, debe corresponder a un cambio w = m, que es un arreglo vectorial
de componentes enteras18 . Dado que el n
umero de ciclos para cada coordenada se puede elegir arbitrariamente,
18

Estrictamente es funci
on de w y J, pero J es constante durante el proceso de completar uno o m
as ciclos.

ANGULO

9.10. VARIABLES ACCIONPARA SISTEMAS COMPLETAMENTE SEPARABLES20

201

tomemos mk = ki , de modo que completamos un ciclo en las variables qi , pi dejando a las otras variables sin
transformar, es decir que todas las componentes qk , pk con k 6= i permanecen sin cambiar en tanto que las
componentes qi , pi vuelven a sus valores originales luego de completar un ciclo, esto nos da como resultado que
= 0. Por tanto, en el caso m
as general las componentes de tienen que ser funciones peri
odicas de cada
0
0
0
wi con periodo unidad; esto es, las q s y las p s son funciones peri
odicas m
ultiples de las w s con periodos
on peri
odica m
ultiple como esta puede ser siempre representada por una expansi
on de
unidad19 . Una funci
Fourier, la cual para un cierto qk se escribe como
qk =

...

j1 =

(k)

aj1 ,...,jn exp [2i (j1 w1 + . . . + jn wn )]

(9.132)

jn =

donde los jm son enteros. Naturalmente podemos tratar al conjunto de las j 0 s y las w0 s como arreglos vectoriales
para escribir esta relaci
on en forma mucho m
as compacta
qk =

X
j

(k)

aj exp [2i (j w)]

(9.133)

an
alogamente, la Ec. (9.127) tambien se puede escribir en forma vectorial
w = vt +

(9.134)

y la dependencia temporal de qk se escribe de la forma


qk (t) =

(k)

aj exp [2ij (vt + )]

(9.135)

on peri
odica en el tiempo; pues la expansi
on
observese que en general qk (t) no es necesariamente una funci
de Fourier solo ha requerido la periodicidad en cada coordenada wi por aparte y cada una de ellas crece a
diferente ritmo, no es necesario ni siquiera que haya periodicidad temporal para completar cada ciclo en un
a solo
qi , pi dado. Incluso si asumimos periodicidad temporal para cada qi , pi , la periodicidad en qk (t) ocurrir
si los vi son todos conmesurables entre s, es decir m
ultiplos racionales unos de otros. Por lo tanto, en el caso
m
as general qk se considera una funci
on cuasi peri
odica del tiempo. Finalmente, debe recordarse que los
(k)
coeficientes aj pueden encontrarse usando el procedimiento est
andar para encontrar coeficientes de Fourier.
Ellos est
an dados por integrales m
ultiples sobre la celda unitaria en el espacio w
(k)
aj

...

qk (w) exp [2i (j w)] dw

dw define el elemento de volumen en el espacio n dimensional de las wi . Un procedimiento an


alogo se puede
hacer para pk (t).

9.10.2.

Movimientos cuasi peri


odicos m
ultiples de rotaci
on

Cuando el movimiento peri


odico es del tipo rotaci
on, la coordenada qk no retorna a su valor original cuando
se realiza un ciclo completo del par de variables separables (qi , pi ), sino que se incrementa en una cantidad q0k .
Tal coordenada de rotaci
on no es en s multiplemente periodica. Sin embargo, cuando se realiza un n
umero
entero de ciclos mk vemos que la variable wk ha aumentado en mk unidades. En consecuencia, la funci
on
qk wk q0k s retorna a su valor inicial para cualquier n
umero entero de ciclos y a semejanza del caso de la
libraci
on, es una funci
on peri
odica m
ultiple de todos los w0 s con periodo unidad. Por tanto, podemos expandir
19

N
otese que para llegar a esta conclusi
on, fue necesario que cada plano qi , pi se barriera independientemente, es decir fue importante que el movimiento fuera virtual.

202

ANGULO

CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-

la funci
on en una serie de Fourier m
ultiple an
aloga a (9.132), y encontrar la dependencia temporal usando
(9.127)
X (k)
qk wk q0k =
aj exp [2i (j w)]
j

qk = q0k (vk t + k ) +

X
j

(k)

aj exp [2ij (vt + )]

por lo tanto, es siempre posible generar una funci


on peri
odica m
ultiple a partir de una coordenada de rotacion, la cual puede ser manipulada exactamente de la misma forma que una coordenada de libraci
on. En
consecuencia, para simplificar la discusi
on nos restringiremos a trabajar con el movimiento peri
odico tipo
libraci
on.

9.10.3.

Movimientos peri
odicos simples y m
ultiples tipo libraci
on

En el movimiento peri
odico m
ultiple tipo libraci
on, los momentos separables pk son funciones peri
odicas
0
ultiple similar a la presentada en
m
ultiples de las w s, y pueden ser expandidos en una serie de Fourier m
(9.132). De esto se deduce que cualquier funci
on de varios de los pares de variables (qi , pi ), tambien ser
an
funciones peri
odicas m
ultiples de los w0 s. De modo que se pueden escribir como
X
X
f (q, p) =
bj exp [2ij w] =
bj exp [2ij (vt + )]
(9.136)
j

por ejemplo, cuando las coordenadas cartesianas de las partculas en el sistema no son en s las coordenadas
de separaci
on, ellas a
un se pueden escribir como funciones del tiempo en la forma de las Ecs. (9.136), ya que
ri = ri (q).
Cuando asumimos periodicidad temporal en cada plano qi , pi ; las Ecs. (9.132, 9.135), representan el tipo
m
as general de movimiento peri
odico m
ultiple del tipo libraci
on. Sin embargo, no todos los sistemas con este
tipo de movimiento poseen todas las caracterstica mostradas en (9.132, 9.135). Por ejemplo, en una amplia
gama de problemas de aplicaci
on de las variables acci
on angulo las Ecs. (9.124, 9.125) se simplifican a
wi =

Wi
(qi ; J1 , . . . , Jn )
Ji

wi = wi (qi ; J1 , . . . , Jn )

(9.137)

de modo que cada coordenada qi de separaci


on es funci
on u
nicamente de su wi asociado. Cuando esto ocurre,
qk es una funci
on peri
odica solo de wk , y la serie de Fourier m
ultiple se reduce a una serie de Fourier sencilla
qk =

(k)

aj exp [2i (jwk )] =

j=

(k)

aj exp [(2i) j (vk t + k )]

(9.138)

j=

En el lenguaje de los sistemas de osciladores acoplados, se puede decir que estas q 0 s son las coordenadas
normales del sistema. Sin embargo, incluso cuando el movimiento de las q 0 s se pueda simplificar as, ocurre
con frecuencia que las funciones f (q) de todas las q 0 s, tales como las coordenadas cartesianas, contin
uan
0
siendo funciones peri
odicas m
ultiples de las w s y deben ser representadas como en la Ec. (9.136). Aunque
haya periodicidad temporal en cada plano (qk , pk ), solo habr
a periodicidad temporal de tales funciones si las
varias frecuencias vk son conmesurables. Una vez m
as, el movimiento de un oscilador arm
onico bidimensional
anisotr
opico es un buen ejemplo para ilustrar estas consideraciones.
Supongamos que en un conjunto particular de coordenadas cartesianas, el Hamiltoniano viene dado por
H=



1  2
px + 4 2 m2 vx2 x2 + p2y + 4 2 m2 vy2 y 2
2m

estas coordenadas cartesianas son entonces coordenadas de separaci


on adecuadas y cada una exhibe movimiento arm
onico simple con frecuencias vx y vy respectivamente. Luego, las soluciones para x, y son formas

ANGULO

9.10. VARIABLES ACCIONPARA SISTEMAS COMPLETAMENTE SEPARABLES22

203

particularmente simples de expansiones sencillas de Fourier de la forma (9.138). Supongamos ahora que las
coordenadas est
an rotadas /4 alrededor del eje z. Las componentes del movimiento a lo largo de los ejes x0 , y 0
seran21
x0 =
y0 =

1
[x0 cos 2 (vx t + x ) + y0 cos 2 (vy t + y )]
2
1
[y0 cos 2 (vy t + y ) x0 cos 2 (vx t + x )]
2

(9.139)

an conmesurables y corresponder
an a figuras de
si el cociente vx /vy es racional, estas dos expresiones ser
Lissajous cerradas. Pero si el cociente no es racional, la figura es tal que el punto en el espacio de fase nunca
vuelve exactamente sobre el mismo trazo y las Ecs. (9.139) nos dan un ejemplo sencillo de expansiones de
Fourier de periodicidad m
ultiple de la forma (9.136).
Incluso cuando qk es una funci
on peri
odica m
ultiple de todas las w0 s, intuitivamente parece existir una
relaci
on entre qk y su wk asociado (y por tanto con la frecuencia vk ). Despues de todo es de anotar que el
argumento que nos llev
o a la Ec. (9.130), nos dice que cuando qk completa un ciclo (moviendo solo a qk ), wk
se incrementa en la unidad en tanto que las otras w0 s retornan a sus valores iniciales. Un argumento riguroso
para esta relaci
on fue desarrollado por J. Vinti en 1961.
on
Supongamos que un cierto intervalo de tiempo T contiene a mk ciclos completos de qk mas una fracci
de un ciclo. En general el tiempo requerido para cada ciclo sucesivo puede ser diferente, puesto que qk no es
necesariamente una funci
on peri
odica en el tiempo. Vinti demostr
o, sobre la base de un teorema de la teora
de n
umeros, que cuando T crece indefinidamente
mk
= vk
T T
lm

de modo que la frecuencia promedio del movimiento de qk est


a siempre dada por vk , incluso cuando el movimiento completo es m
as complicado que una funci
on peri
odica con frecuencia vk .
Es notable el hecho de que la ecuaci
on (9.121) nos dice que cuando qi hace un recorrido virtual de un ciclo
completo (es decir cuando wi se incrementa en la unidad) la funci
on caracterstica se incrementa en Ji . Con
una estrategia similar a la que se sigue para el movimiento peri
odico de rotaci
on, se tiene que la funci
on
X
W0 = W
wk Jk
(9.140)
k

permanece invariante cuando cada wk se incrementa en la unidad, con las otras variables de acci
on permaneciendo constantes. La ecuaci
on (9.140) representa entonces una funci
on peri
odica m
ultiple que se puede
expandir en terminos de las wi (o las frecuencias vi y el tiempo), por una serie de la forma (9.136). Puesto que
las ecuaciones de transformaci
on para las variables angulares vienen dadas por
wk =

W
Jk

se puede reconocer que la ecuaci


on (9.140) define una transformaci
on de Legendre desde la base (q, J) hacia la
base (q, w). Recordando que W es una funci
on generatriz tipo 2 y usando las Ecs. (7.14, 7.18) tenemos que si
W (q, J) es de tipo F2 entonces W 0 (q, w) es la funci
on correspondiente de tipo F1 . Por tanto, ambas transforman
de las variables (q, p) a las variables (w, J). Sin embargo aunque W 0 genera la misma transformaci
on que W ,
no es una solucion de la ecuaci
on de Hamilton Jacobi, ya que el formalismo de Hamilton Jacobi est
a dise
nado
para funciones tipo 2.
Hemos visto que asumiendo periodicidad temporal para cada plano (qi , pi ), la conmesurabilidad es un
criterio esencial para distinguir entre un sistema peri
odico m
ultiple o un sistema peri
odico simple. Cuando las
frecuencias todas son conmesurables entre s, la configuraci
on se repite despues de un tiempo suficientemente
21

La clave es que x = x (vx ) , y = y (vy ) en tanto que x0 = x0 (vx , vy ) y y 0 = y 0 (vx , vy ).

204

ANGULO

CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-

largo y ser
a periodico simple. Matem
aticamente la conmesurabilidad entre pares de frecuencias se manifiesta
en las siguientes ecuaciones
ji vi = jk vk (no suma)
(9.141)
siendo ji y jk enteros positivos. Basta con probar que un cierto vi es conmesurable con los dem
as para demostrar
que todos son conmesurables entre s, en cuyo caso se habla de una sistema completamente conmesurable.
Pero si solo m de las n frecuencias satisfacen (9.141), el sistema se dice mconmesurable. Por ejemplo si
tenemos las frecuencias

v1 = 3M Hz, v2 = 5M Hz, v3 = 7M Hz, v4 = 2 2M Hz

v5 = 3 2 M Hz, v6 = 3M Hz,
v7 = 7M Hz
Los tres primeros son 3-conmesurados y los dos siguientes son doble conmesurados. Hay una relaci
on interesante
entre conmesurabilidad y las coordenadas en las cuales las Ecuaciones de Hamilton Jacobi son separables. Puede
demostrarse que el camino que recorre el punto en el espacio de configuraciones o de fase para un sistema no
conmesurable llena completamente una regi
on limitada del correspondiente espacio (es decir para cualquier
punto de esta regi
on, la curva pasa por dicho punto en alg
un instante de tiempo). Esto se ve en las figuras de
Lissajous para frecuencias inconmesurables.
Supongamos que el sistema es tal que en cualquiera de las coordenadas de separaci
on el movimiento
es simplemente peri
odico y que por tanto es independiente del movimiento en las otras coordenadas. En
consecuencia, el camino que traza el punto del sistema como un todo tiene que estar limitado por las superficies
de qi y pi constantes que marcan los lmites del movimiento oscilatorio de las variables de separaci
on (esto es
extendible al movimiento peri
odico rotacional si restringimos el valor del angulo entre 0 y 2). Estas superficies
por tanto definen un volumen en el espacio que est
a densamente lleno por la orbita del punto del sistema. De
esto se sigue que las variables de separaci
on en un sistema no conmesurado tienen que ser u
nicas; la ecuaci
on
de Hamilton Jacobi no puede ser separable en dos sistemas coordenados diferentes (excepto por variaciones
triviales tales como cambios de escala). La posibilidad de separar el movimiento de un sistema en m
as de un
sistema coordenado es usualmente una evidencia de conmesurabilidad.

9.10.4.

Variables acci
on-
angulo para sistemas degenerados

Un ejemplo particularmente simple de conmesurabilidad lo da el caso de la degeneraci


on, que ocurre
cuando dos o mas de las frecuencias son iguales. Si dos de las constantes el
asticas en el oscilador arm
onico
tridimensional son iguales, sus frecuencias asociadas son iguales y hay una degeneraci
on simple. Si el oscilador
es isotr
opico, el sistema es completamente degenerado.
Cuando hay degeneraci
on presente, las frecuencias no son todas independientes. Si ordenamos las n frecuencias
de modo que las m + 1 primeras sean iguales, tendremos m ecuaciones de degeneraci
on (degeneraci
on de orden
m)
1 2 = 0 , 2 3 = 0 , . . . , m m+1 = 0
(9.142)
de modo que solo una de estas frecuencias (digamos m+1 ) es independiente, es claro entonces que tendremos
n m frecuencias independientes
{m+1 , m+2 , . . . , n }
Veamos un metodo sistem
atico de reducir las frecuencias usando una transformaci
on can
onica de las variables
0
0
acci
on-
angulo (w, J), hacia otras variables tambien del tipo acci
on-
angulo (w , J ). Si tenemos m condiciones
de degeneraci
on sobre las frecuencias vi , podemos escribir las ecuaciones (9.142) en la forma
n
X

jki vi = 0, k = 1, ..., m.

(9.143)

i=1

donde las jki toman los valores 0 y 1. Haremos ahora una transformaci
on can
onica desde (w, J) hasta
(w0 , J 0 ) definida por una funci
on generatriz del tipo descrito en (7.23), con g = 0. En nuestro caso tenemos las
asignaciones
qi wi ; pi Ji ; Qi wi0 ; Pi Ji0
(9.144)

ANGULO

9.10. VARIABLES ACCIONPARA SISTEMAS COMPLETAMENTE SEPARABLES24


definiendo la funci
on
fk (w1 , . . . , wn ) =

 Pn

i=1 jki wi

si
si

wk

k = 1, . . . , m
k = m + 1, . . . , n

205

(9.145)

reemplazando (9.145) en (7.23) teniendo en cuenta las asignaciones (9.144) y el hecho de que en (7.23) hay
convenci
on de suma sobre ndices repetidos, se obtiene una funci
on tipo F2 de la forma
!
n
m
n
n
X
X
X
 X
0
0
F2 w, J =
fk (w1 , . . . , wn ) Jk =
jki wi Jk0 +
Jk0 wk
k=1

de modo que

k=1

i=1

k=m+1

m X
n
n
X
 X
F2 w, J 0 =
Jk0 jki wi +
Jk0 wk
k=1 i=1

(9.146)

k=m+1

las coordenadas nuevas se encuentran con las ecuaciones de transformaci


on (7.19) y las asignaciones (9.144)

m X
n
n
0)
X
X
F
(w,
J

wk0 =
=
Jp0 jpi wi +
Jp0 wp
Jk0
Jk0 p=1
p=m+1
i=1

con lo cual resulta

wk0

n
X

jki wi ;

k = 1, ..., m

i=1

wk0 = wk ;

k = m + 1, ..., n

(9.147)

La forma funcional de las J con respecto a las J 0 se obtiene utilizando la ecuaci


on (7.26) con las asignaciones
(9.144)


n
X
fk 0
J =
J
J Ji =
wi k
k=1
(m
" n
#) ( n
)
X
X
X
0
0 wk
Ji =
Jk
jkl wl
+
Jk
wi
wi

f
w

k=1

l=1

k=m+1

donde hemos usado (9.145). Las correspondientes constantes asociadas a las variables de acci
on Ji son las
soluciones de las n ecuaciones de transformaci
on23
Ji =

m
X
k=1

Jk0 jki

n
X

Jk0 ki

i = 1, . . . , n

(9.148)

k=m+1

Nuestra hip
otesis es que el sistema es peri
odico en las variables can
onicas (qi , pi ) y ello nos lleva a que las
variables del sistema son peri
odicas m
ultiples en las coordenadas wk . Cuando se ejecutan mi ciclos completos
en cada plano (qi , pi ) el cambio en las variables wi viene dado por
wi = mi
ahora bien, de las Ecs. (9.147) vemos que para k > m tenemos wi0 = wi . Por otro lado, las Ecs. (9.147)
para k m, se pueden escribir
km

wk0 = wk wk+1 wk0 = wk wk+1 = mk mk+1 = entero

23
N
otese que las Ecs. (9.147, 9.148), nos dicen que esta es una transformaci
on can
onica en donde las nuevas coordenadas solo
son funciones de las antiguas coordenadas y los nuevos momentos solo son funciones de los antiguos momentos wk0 = wk0 (w) , Jk0 =
Jk0 (J).

206

ANGULO

CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-

Si hacemos una solo ciclo en el plano (qk , pk ) y ning


un ciclo en los otros planos tenemos wk0 = 1 (para cualquier
valor de k). Estas consideraciones nos llevan a conclur que el sistema tambien es peri
odico m
ultiple en las wk0
coordenadas con periodo unidad. Por tanto, estas nuevas variables tambien son del tipo acci
on-
angulo, y las
nuevas frecuencias se pueden calcular como en las ecuaciones (9.126, 9.127)
vk0 = w k0 =

n
X

jki vi = 0 ;

k = 1, ..., m

i=1

vk0 = w k0 = vk ;

k = m + 1, ..., n

(9.149)

donde hemos tenido en cuenta (9.143). En el nuevo sistema can


onico tenemos entonces n m frecuencias
independientes (cuando k m + 1) que adem
as coinciden con las frecuencias originales del sistema, y las
m frecuencias esp
ureas asociadas con la mdegeneraci
on se han traducido en m frecuencias nulas25 . Puesto
0
0
0
que wk = vk t + k , las frecuencias nulas corresponden a wk0 = k0 y por tanto a factores constantes en la
expansi
on de Fourier, como se puede ver por ejemplo en la Ec. (9.132). Estos factores constantes tambien
aparecen en la expansi
on original, siempre que los ndices ji satisfagan una condici
on de degeneraci
on. Por
ejemplo, supongamos que tenemos tres frecuencias 1 , 2 , 3 y que 1 = 2 , la expansi
on (9.135) en las bases
(w, J) y (w0 , J 0 ) se escribe
X X X (k)
aj1 ,j2,j3 exp {2i [j1 (2 t + 1 ) + j2 (2 t + 2 ) + j3 (3 t + 3 )]}
qk (t) =
j1

qk (t) =

j2

j3

XXX
m1 m2 m3

a(k)
m1 ,m2 ,m3 exp {2i [m1 (1 2 ) + m2 (2 t + 2 ) + m3 (3 t + 3 )]}

Volviendo al caso general, dado que las frecuencias i0 se calculan como


vi0 =

H
Ji0

(9.150)

el Hamiltoniano tiene que ser independiente de las variables de acci


on Ji0 asociadas a las frecuencias nulas, que
por construcci
on son las m primeras frecuencias. Por tanto

0
0
H = H Jm+1
, Jm+2
, . . . , Jn0
(9.151)

En particular, si el sistema es completamente degenerado (i.e. degeneraci


on de orden n1), existir
an m = n1
0
condiciones de degeneraci
on del tipo (9.143), y el Hamiltoniano depender
a de solo una de las Ji . Vemos entonces
que el paso del sistema (w, J) al sistema (w0 , J 0 ) conduce a una simplificaci
on en la estructura del Hamiltoniano
y en las expansiones de Fourier de las variables del sistema.
Dado que las J 0 son n cantidades constantes independientes, las constantes originales de integraci
on pueden
ser expresadas en terminos de los J 0 , y por tanto W puede expresarse como W = W (q, J 0 ). Con estos
argumentos W genera una transformaci
on a un nuevo conjunto can
onico en donde las J 0 son los nuevos
26
momentos can
onicos . Pero en virtud de la transformaci
on puntual generada por F2 en (9.146), sabemos que
w0 es el conjugado de J 0 . Se sigue entonces que las nuevas coordenadas generadas por W (q, J 0 ) tienen que ser
el conjunto de variables angulares w0 , con ecuaciones de transformaci
on dadas por
wi0 =

W
Ji0

(9.152)

en conclusi
on, la funci
on caracterstica W sirve tambien como generatriz de la transformaci
on desde (q, p)
hasta (w0 , J 0 ).
25

Es obvio que las m frecuencias nulas no son frecuencias fsicas, sino artificios matem
aticos para simplificar el problema. En
todo caso, el n
umero de frecuencias no-nulas independientes permanece constante.
26
El hecho de que W (q, J) se pueda escribir como W (q, J 0 ), tambien se puede ver teniendo en cuenta que la transformaci
on
(w, J) (w0 , J 0 ) es tal que J 0 = J 0 (J).

ANGULO

9.11. COMENTARIOS FINALES SOBRE LAS VARIABLES ACCION-

9.11.

207

Comentarios finales sobre las variables acci


on-
angulo

Hemos visto que para sistemas que poseen movimientos tipo libraci
on o rotaci
on en el espacio de fase, existe
un formalismo adecuado para estudiar las frecuencias del movimiento sin resolver completamente las ecuaciones
de movimiento. El formalismo de las variables acci
on angulo es una variante de la tecnica de Hamilton Jacobi
en la cual los nuevos momentos no se eligen como las constantes de integraci
on sino como ciertas cantidades
constantes que contienen informaci
on sobre la orbita de libraci
on o rotaci
on, y que son en todo caso funci
on
exclusiva de las constantes de integraci
on. Cuando asumimos que el movimiento es peri
odico en el tiempo
este formalismo nos permite extraer de forma sencilla las frecuencias m
ultiples sin resolver completamente
las ecuaciones de movimiento. No obstante, debe tenerse claro que en el formalismo no hay ning
un criterio
que nos asegure que el movimiento es de tipo libraci
on o rotaci
on, ni mucho menos que sea peri
odico en el
tiempo. Estas son hip
otesis de trabajo que deben estar sustentandas por argumentos alternativos te
oricos y/o
experimentales. Vale destacar sin embargo, que si los movimientos son de tipo rotaci
on o libraci
on pero no son
peri
odicos en el tiempo, el formalismo permite extraer la frecuencia promedio tomada sobre muchos ciclos.
De otra parte, cuando existe degeneraci
on en ciertas frecuencias del sistema, es posible pasar de las variables
canonicas acci
on-
angulo (w, J) a otras variables can
onicas de acci
on-
angulo (w0 , J 0 ) que me conducen a las
mismas frecuencias independientes, y en donde las frecuencias no independientes se convierten en frecuencias
nulas. Estas frecuencias nulas no son fsicas pero permiten simplificar considerablemente el problema. En
algunos casos, la hip
otesis de periodicidad puede conducir autom
aticamente a la presencia de degeneraci
on
debido a algunas simetras del sistema (ver por ejemplo la secci
on 9.12). No obstante, en problemas generales
pueden existir degeneraciones accidentales (por ejemplo debidas a condiciones iniciales) que deben incorporarse
en este formalismo como hip
otesis de trabajo.

9.12.

El problema de Kepler en variables acci


on-
angulo

Para exhibir todas las propiedades de la soluci


on usaremos las tres dimensiones en coordenadas esfericas
tal como en la secci
on 9.6.2. Lo primero que debemos determinar es el tipo de periodicidad en los planos
(, p ) , (, p ) y (r, pr ). Para ello despejamos a cada momento generalizado en funci
on de su coordenada de
las ecuaciones (9.73, 9.76, 9.77, 9.79) con lo cual obtenemos
p =
p2 = 2

(9.153)
2

(9.154)

sin2

p2r = 2m [E V (r)]

2
r2

(9.155)

como es variable angular cclica se le puede asociar la acci


on J = 2 de acuerdo con (9.120), y asumir
que es una rotaci
on eligiendo por conveniencia el periodo 2 (recuerdese que para variable cclica el periodo
de rotaci
on es arbitrario). A primera vista, la Ec. (9.154) parece mostrar que la trayectoria en el plano de fase
(, p ) es peri
odica. No obstante, es necesario tener cierta informaci
on del movimiento para saber si est
a en
un intervalo acotado que se recorre de ida y vuelta en un intervalo finito de tiempo (o si tiene periodo tipo
rotaci
on donde el periodo en se recorra en un intervalo finito de tiempo). Algo similar ocurre con el plano
(, p ) y con el plano (r, pr ). En el movimiento real estos planos definir
an trayectorias peri
odicas solo si la
energa del sistema es negativa, pues de lo contrario la orbita no ser
a cerrada ni acotada (para m
as detalles,
ver Cap. 10). Por ejemplo cuando la trayectoria es abierta, no barre el intervalo completo entre 0 y 2 y el
intervalo acotado solo se recorre de ida, no hay en consecuencia movimiento de rotaci
on ni de libraci
on en el
plano (, p ). Por otro lado, cuando la trayectoria es cerrada y acotada se puede ver que y r son acotados (van
y vuelven dentro de un intervalo finito de tiempo) de modo que su movimiento es de libraci
on27 . En contraste
aumenta indefinidamente y su movimiento es de rotaci
on. La discusi
on anterior refuerza el hecho de que el
27

Si suponemos que el plano de movimiento pasa por el origen, y que el eje z no yace en el plano de movimiento, podemos
asegurar que 6= 0 (y en general 6= n) en todo punto de la trayectoria, lo cual nos evita una singularidad en la Ec. (9.154).

208

ANGULO

CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-

caracter peri
odico en el espacio de fase y/o en el tiempo son una hip
otesis de trabajo para iniciar el tratamiento
con variables acci
on angulo, pero no hay nada en este formalismo que nos garantice tal periodicidad, la cual
debe ser extrada por otros argumentos.
Asumiendo entonces periodicidad en cada plano (qi , pi ), vamos a construir las variables de accion asociadas
a cada coordenada. Para ello usamos los valores de los momentos conjugados a , , r de las Ecs. (9.153, 9.154,
9.155), y usando un potencial de la forma V = k/r
I
I
W
J =
d = d = 2
(9.156)

I
I
2

W

d = 2
J =
d
(9.157)

sin2

s
I
I
2
W
2mk
Jr =
dr = 2mE +
2 dr
(9.158)
r
r
r

la primera integral es trivial y est


a asociada con el hecho de que la variable asociada es cclica. Para calcular la
segunda integral es conveniente introducir el angulo polar del momento angular total que denotaremos por i .
Recordando que representa la componente polar del momento angular (ver Sec. 9.6.2), el angulo i viene
dado claramente por

Lz
(9.159)
cos i =
=
L

en terminos de cos i , la integral (9.157) queda


s

I
2 1
d
J = 1 2
sin2
I r
cos2 i
J =
1
d
(9.160)
sin2

podemos asumir sin perdida de generalidad, que el plano del movimiento pasa por el origen de coordenadas.
Para analizar los lmites de integraci
on debemos calcular los angulos mnimo y m
aximo 0 y 1 entre un vector
de posici
on de la partcula y el eje Z.
La Fig. 9.3 nos ayuda a encontrar estos angulos extremos. En esta figura, el plano Y Z se define de modo
que sea perpendicular al plano de movimiento. Por simplicidad, el plano Y Z se hace coincidir con el plano del
papel y el eje X sale del papel. La lnea punteada que pasa por el origen define la intersecci
on entre el plano
de movimiento y el plano Y Z. Puesto que L es perpendicular al plano de movimiento, si lo trasladamos al
origen claramente yacer
a en el plano Y Z. Teniendo en cuenta que i es el angulo entre el momento angular
L y el eje Z, y que L es perpendicular a cualquier vector de posici
on dentro del plano de movimiento, es
f
acil ver que el menor y el mayor valor de se obtienen cuando el momento angular, el eje Z y el vector de
posici
on son coplanares. Hay dos vectores unitarios de posici
on que cumplen esta condici
on: los dos vectores
unitarios que van a lo largo de la lnea punteada denotados por rA y rB , los cuales definen los angulos 0 y 1
respectivamente. Adicionalmente, la Fig. 9.3 muestra que

0 = i , 1 = 0 = + i .
2
2
De lo anterior, se deduce que el circuito completo del angulo consiste en ir desde (/2) i , hasta (/2) + i
y volver, donde sin 0 = cos i . La integral circuital (9.160) se puede escribir como 4 veces la integral entre /2
y (/2) + i quedando28
s
Z (/2)+i r
Z (/2)+i
cos2 i
sin2 cos2 i
d
=
4
d
(9.161)
J = 4
1

sin2
sin2
/2
/2
28

0 es el
angulo mnimo pero no necesariamente el
angulo inicial.

ANGULO

9.12. EL PROBLEMA DE KEPLER EN VARIABLES ACCION-

209

Figura 9.3: Movimiento bajo una fuerza central. El plano Y Z es perpendicular al plano de movimiento. Cuando
la partcula alcanza la posici
on de mnimo o m
aximo valor de , el vector posici
on de la partcula est
a en el
mismo plano que el eje Z y el momento angular.
ahora bien, en nuestra convenci
on L est
a en el plano Y Z. Por tanto, siempre es posible escoger el sentido del
eje Z de tal forma que el angulo i entre Z y L este en el intervalo [0, /2). Esto equivale a escoger cos i y
ua entre /2 y (/2) + i , tendremos que sin
sin i como positivos29 , y dado que la integral anterior se eval
tambien ser
a positivo. Por tanto, la integral (9.161) queda
Z (/2)+i p 2
Z (/2)+i
sin cos2 i
cos2 + 1 cos2 i
J = 4
d = 4
d
sin
sin
/2
/2
Z (/2)+i p 2
sin i cos2
J = 4
d
(9.162)
sin
/2
La sustituci
on
cos = sin i sin

sin d = sin i cos d

convierte la integral (9.162) en


Z (/2)+i
Z /2
q
sin d p 2
sin i cos d
2
J = 4
sin i cos = 4
sin2 i (sin i sin )2
2
2
sin
1 (sin i sin )
/2
0
Z /2
q
2
sin i cos d
= 4
1 sin2
1 sin2 i sin2
0
quedando
2

J = 4 sin i

/2

cos2 d
1 sin2 i sin2

(9.163)

29
Elegimos el intervalo [0, /2), ya que i = /2, equivale a que el eje Z este sobre el plano de movimiento, y esto permite
que = 0, en los puntos de la trayectoria en los cuales la
orbita cruza al eje Z. Esto a su vez nos lleva a una singularidad en la
expresi
on (9.154).

210

ANGULO

CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-

la sustituci
on adicional



u = tan ; du = 1 + tan2 d = 1 + u2 d

nos da
J = 4 sin2 i

/2
1
cos2

J = 4 sin2 i

(1 +

d
= 4 sin2 i
2
2
sin i tan

u2 )

du
 = 4
1 + u2 1 sin2 i

/2

d
= 4 sin2 i
(1 + tan2 ) sin2 i tan2
2

(1 +

sin i
du
+ u2 cos2 i ]

u2 ) [1

al utilizar fracciones parciales esta integral queda



Z 
Z
Z
1
cos2 i
du
du
2
J = 4
du

= 4
4 cos i
2
2
2
2
1+u
1 + u cos i
1+u
1 + u2 cos2 i
0
0
0
haciendo el cambio de variable u0 = u cos i , du0 = cos i du en la segunda integral queda
Z

Z
Z 0
Z
du
du / cos i
du
du0
2
J = 4
4 cos i
= 4
cos i
1 + u2
1 + u02
1 + u2
1 + u02
0
0
0
0
Z
du

J = 4 [1 cos i ]
= 4 (1 cos i ) [arctan u]
= 2 (1 cos i )
0 = 4 (1 cos i )
2
1+u
2
0
con lo cual se obtiene finalmente
J = 2

= 2 ( )

(9.164)

puesto que la idea es escribir todo en terminos de las J 0 s, invertimos las Ecs. (9.156, 9.164) para obtener ,
en terminos de J , J
J
J + J
=
; =
(9.165)
2
2
sustituyendo (9.165) en la expresi
on (9.158) para Jr resulta
s
I
I
W
2mk (J + J )2
Jr =
dr =
2mE +

dr
(9.166)
r
r
4 2 r 2
despues de realizar esta integraci
on, obtenemos una funci
on cuyos argumentos son
Jr = Jr (E, J + J )

(9.167)

y si despejamos la energa E = H en esta ecuaci


on obtenemos
E

H = H (Jr , J + J )

H
H
=
J
J
(9.168)

de modo que las frecuencias en los angulos est


an degeneradas. Este resultado no depende de la ley del
inverso cuadrado sino solo del hecho de que la fuerza sea central, y de que la orbita sea acotada, en
cuyo caso el movimiento ser
a al menos simplemente degenerado. Esta degeneraci
on es consecuencia del hecho
de que el movimiento se hace en un plano perpendicular al momento angular. El movimiento en este plano
indica que y est
an relacionados de tal manera que cuando completa un periodo entre 0 y 2, recorre
un ciclo completo entre los lmites 1 y 2 ida y vuelta siendo 1,2 = (/2) i , de modo que las frecuencias
en y son necesariamente iguales.
Para realizar la integraci
on en Jr primero tengamos en cuenta que el movimiento es acotado solo para
energas negativas y dado que el integrando es igual a pr = mr,
los lmites del movimiento est
an comprendidos

d
(1 +

ANGULO

9.12. EL PROBLEMA DE KEPLER EN VARIABLES ACCION-

211

entre las races r1 y r2 de la expresi


on que est
a dentro del radical en (9.166) y que forman los puntos de retorno
en r. Los extremos r1 y r2 son entonces las races de
2mk (J + J )2

= 0
r
4 2 r 2
(J + J )2
2
2mEr + 2mkr
= 0
(9.169)
4 2
Si r1 , r2 son los lmites inferior y superior respectivamente (las dos races de la cuadr
atica 9.169), un ciclo
completo incluye ir desde r1 hasta r2 y volver. En la ida (vuelta) pr es positivo (negativo) y por tanto la raz
cuadrada en (9.166) debe ser positiva (negativa). Con lo cual (9.166) se escribe como
s
Z r2
2mk (J + J )2
Jr = 2
2mE +

dr
r
4 2 r 2
r1
2mE +

La integraci
on por variable compleja se puede ver en la P
ag 469 de la Ref. [1], el resultado es
r
2m
Jr = (J + J ) + k
E

el cual tiene la estructura dada por (9.167) como se anticip


o. N
otese que Jr solo es real para energas negativas,
en concordancia con el hecho de que las trayectorias deben tener energa negativa para ser acotadas. Despejando
la energa i.e. el Hamiltoniano se tiene
E=H=

2 2 mk2
(Jr + J + J )2

(9.170)

se ve que para fuerzas atractivas inversas al cuadrado de la distancia, la degeneraci


on es a
un mayor de lo
predicho para fuerzas centrales en general. En este caso los tres periodos coinciden y el movimiento es completamente degenerado, lo cual nos dice que la orbita es cerrada cuando la energa es negativa. Con una orbita
cerrada el movimiento es simplemente peri
odico y en este caso, completamente degenerado. Si la fuerza central
contiene un termino proporcional a r 3 (por ejemplo una correcci
on relativista de primer orden), la orbita ya
no es cerrada sino que tiene la forma de una elipse que precesa. Una de las degeneraciones se remueve en este
caso, pero el movimiento es a
un simplemente degenerado ya que la fuerza a
un es central.
Volviendo al caso de Kepler, la frecuencia y el periodo vienen dados por
v=

(Jr + J + J )3
H
H
H
4 2 mk2
1
=
=
=
;

=
=
Jr
J
J

4 2 mk2
(Jr + J + J )3

(9.171)

la suma de los J 0 s se puede escribir en terminos de la energa a partir de (9.170), y el periodo resulta
r
m
= k
(9.172)
2E 3

esta f
ormula para el periodo est
a de acuerdo con la tercera ley de Kepler si tenemos en cuenta que el semieje
mayor a es igual a k/2E, como se ver
a en el Cap. 10, Ecs(10.94, 10.110).
Recalcamos finalmente, que para encontrar el periodo del movimiento no utilizamos la ecuaci
on de la
trayectoria ni la dependencia de las variables con el tiempo. Para integrar los Ji , solo fue necesario hacer
algunas suposiciones generales tales como: (a) El movimiento es peri
odico y acotado en todos los planos de
fase, solo si la energa es negativa30 . (b) El momento angular es una constante de movimiento y esto implica
que el movimiento es en un plano.
Vale decir que en este caso fue posible predecir con base en estas hip
otesis, la presencia de degeneraci
on
simple en el caso de fuerzas centrales ( = ), y de degeneraci
on total para interacci
on kepleriana atractiva
i.e. V (r) = k/r.
30
En la secci
on 10.4.1, P
ag. 222, veremos que se puede conclur que la curva es acotada solo para energas negativas, a traves
del an
alisis de curvas de energa potencial efectiva. En tal an
alisis, no es necesario recurrir a las ecuaciones de movimiento o de
trayectoria.

212

9.12.1.

ANGULO

CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-

Variables acci
on-
angulo teniendo en cuenta la degeneraci
on

La degeneracion completa nos indica que existe un conjunto de variables acci


on-
angulo (w0 , J 0 ) en las cuales
H solo depende de un Ji0 y solo una de las frecuencias es no nula. Vamos a encontrar la transformaci
on can
onica
caracterizada por

(w , w , wr , J , J , Jr ) w10 , w20 , w30 , J10 , J20 , J30

para lo cual usamos los resultados de la secci


on (9.10.4). Expresemos las condiciones de degeneraci
on en la
forma
v v = 0 ; v vr = 0
(9.173)

Ordenaremos las variables acci


on-
angulo originales en la forma

(w , w , wr , J , J , Jr ) (w1 , w2 , w3 , J1 , J2 , J3 )
con este criterio de orden, conviene reescribir las m = 2 condiciones de degeneraci
on (9.173), para las n = 3
frecuencias, en la forma
v + v + 0 vr = 0 ; v + 0 v vr = 0
(9.174)
comparando con (9.143) se tiene que

j11 = 1, j12 = 1, j13 = 0

j21 = 1, j22 = 0, j23 = 1

y reemplazando los elementos de jki en (9.146)


F2 =

2 X
3
X

Jk0 jki wi

k=1 i=1

3
X

Jk0 wk

k=3

" 2
X

Jk0

(jk1 w1 + jk2 w2 + jk3 w3 ) + J30 w3

k=1

F2 = J10 (j11 w1 + j12 w2 + j13 w3 ) + J20 (j21 w1 + j22 w2 + j23 w3 ) + J30 w3


F2 = J10 (w + w ) + J20 (w wr ) + J30 wr

(9.175)

las nuevas variables angulares se obtienen de (9.147)


w10

w20 =

3
X
i=1
3
X
i=1

j1i wi = j11 w1 + j12 w2 + j13 w3 = w + w


j2i wi = j21 w1 + j22 w2 + j23 w3 = w wr ; w30 = wr

(9.176)

para obtener la transformaci


on de los momentos, aplicamos (9.148), de lo cual resulta
J J1 =
J J2 =
Jr J3 =

2
X

Jk0 jk1 +

k=1

2
X
k=1
2
X

3
X
k=3

Jk0 jk2 +
Jk0 jk3 +

k=1

3
X
k=3
3
X
k=3

Jk0 k1 = J10 j11 + J20 j21 + J30 31 = J10 + J20


Jk0 k2 = J10 j12 + J20 j22 + J30 32 = J10
Jk0 k3 = J10 j13 + J20 j23 + J30 33 = J20 + J30

quedando
J = J20 J10 ; J = J10 ; Jr = J30 J20

las Ecs. (9.176) y el inverso de las ecuaciones (9.177), me caracterizan a


originales

(9.177)
(w0 , J 0 )

w10 = w w ; w20 = w wr ; w30 = wr


J10

= J ;

J20

= J + J ;

J30

= J + J + Jr

en terminos de los (w, J)


(9.178)
(9.179)

9.13. EJERCICIOS

213

y reemplazando estas expresiones en (9.170) resulta



2 2 mk2
H J30 = E =
J302

(9.180)

como se predijo, el Hamiltoniano es funci


on de una sola Ji0 en esta base de variables, debido a la completa
degeneraci
on del sistema. La u
nica frecuencia caracterstica (no nula) del problema es
30 =

H
4 2 mk2
=
0
J3
J303

para escribir la frecuencia y el periodo en terminos de constantes m


as Fsicas, podemos despejar J30 de la Ec.
(9.180) de modo que queda en terminos de la energa, esencialmente en la misma forma en que pasamos de la
Ec. (9.171) a la Ec. (9.172).
Si realizamos un an
alisis detallado de las variables angulares w0 veremos que estas tambien conducen a
constantes de movimiento. Esto se puede ver m
as f
acilmente si trabajamos el problema bidimensionalmente
desde el principio (ver secci
on 10.16).

9.13.

Ejercicios

1. Un sistema de un grado de libertad est


a descrito por el Hamiltoniano
H=

p2
mAtx
2m

siendo A una constante. Resuelva el problema din


amico utilizando la funci
on principal de Hamilton
bajo las condiciones iniciales x (0) = 0 y p (0) = mv0 . N
otese que este es un ejemplo de Hamiltoniano
dependiente del tiempo que se puede resolver por HJ. Es claro que para este Hamiltoniano no se puede
emplear la ecuaci
on de HJR para la funci
on caracterstica de Hamilton.
2. Una partcula de masa m est
a restringida a moverse sobre una curva en el plano vertical definida por las
ecuaciones parametricas
y = l (1 cos 2) ; x = l (2 + sin 2)
sobre la partcula act
ua la fuerza gravitacional en la direcci
on vertical y. Encuentre las frecuencias del
movimiento empleando variables acci
on-
angulo, empleando todas las condiciones iniciales que nos lleven
a que el m
aximo de sea menor o igual a /4.
3. Consideremos una partcula de carga q que se mueve en el plano XY sujeta a un campo magnetico
constante y uniforme B, perpendicular al plano XY . Escogeremos el vector potencial A de modo que
solo tenga componente y (esta escogencia se conoce como gauge de Landau), de modo que Ay = Bx y el
Hamiltoniano del sistema ser
a
H (x, y, px , py ) =

p2x
(py + bx)2
+
; b qB
2m
2m

(9.181)

asuma separaci
on de variables para la funci
on principal de Hamilton
S = Wx (x) + Wy (y) t
y reduzca el problema a cuadraturas.
4. Con respecto al Hamiltoniano (9.181), consideremos la transformaci
on gauge A A0 = A + , con
= bxy/2. (a) Demuestre que el nuevo Hamiltoniano queda




1
by 2
1
bx 2
H (x, y, px , py ) =
px
+
py +
(9.182)
2m
2
2m
2

214

ANGULO

CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCIONsi bien este Hamiltoniano es claramente equivalente al Hamiltoniano (9.181), la ecuaci
on de HamiltonJacobi para el Hamiltoniano (9.182), es considerablemente m
as difcil de separar. (b) Pruebe el ansatz
de separaci
on
1
S = Kxy + Wx (x) + Wy (y) t
2
y reduzca el problema a cuadraturas. Este problema ilustra el hecho de que la separabilidad de la ecuaci
on
de HJ no solo depende del sistema coordenado elegido, sino tambien del gauge elegido.

5. Una partcula de masa m est


a restringida a moverse sobre el eje X sujeta al potencial V = a sec2 (x/l).
(a) Resuelva la ecuaci
on de HJ y a partir de la funci
on generatriz, encuentre x (t). (b) Encuentre las
variables acci
on-
angulo y la frecuencia asociada al sistema. Obtenga la dependencia de la frecuencia
con la amplitud y encuentre el lmite de peque
nas amplitudes para .
6. Reduzca a cuadraturas la ecuaci
on de HJ para el Hamiltoniano
 2

p
kq 2
+
H (q, p, t) = f (t)
2m
2
donde m y k son constantes y f (t) una funci
on integrable. Encuentre q (t) y p (t) as como la trayectoria
en el espacio de fase, para los tres casos siguientes
f (t) = et ; f (t) = et ; f (t) = cos t ;
donde y son constantes.

>0

Captulo 10

Fuerzas centrales
Discutiremos a continuaci
on, el problema de la interaccion entre dos masas puntuales que se mueven
bajo la influencia de una fuerza que va a lo largo de la lnea que las une. Este es un problema que posee
muchas aplicaciones tanto en Fsica Cl
asica como en Fsica Moderna. Siguiendo el espritu de las formulaciones
aqu presentadas, primeros nos concentraremos en las primeras integrales que se pueden hallar sin resolver el
problema completo, para luego analizar algunos potenciales especficos.

10.1.

Reducci
on al problema equivalente de una partcula

Figura 10.1: Variables de posici


on fundamentales en el problema de dos cuerpos.
Consideremos un sistema monogenico de dos masas puntuales m1 y m2 como lo indica la Fig. 10.1, donde las
u
nicas fuerzas que act
uan sobre ellas son las debidas al potencial mutuo U . La isotropa del espacio nos sugiere
que si las masas no poseen alguna propiedad vectorial, la interacci
on entre ellas debe ir dirigida a lo largo de
la lnea que las une, esto indica que el potencial debe ser funci
on del valor absoluto de la coordenada relativa
r2 r1 r. Este sistema tiene seis grados de libertad y por tanto requiere de seis coordenadas generalizadas.
Quiz
as el sistema de coordenadas generalizadas m
as conveniente lo constituye las coordenadas de posici
on del
centro de masa R, y las coordenadas que determinan al vector relativo r. Estas coordenadas se pueden escribir
en terminos de las coordenadas de posici
on de las partculas r1 y r2
r r2 r1 ; R
215

m1 r1 + m2 r2
m1 + m2

(10.1)

CAPITULO 10. FUERZAS CENTRALES

216
estas ecuaciones se pueden invertir para obtener
r1 = R

m2
r
m1 + m2

r2 = R +

m1
r
m1 + m2

(10.2)

tambien son u
tiles las coordenadas de posici
on de las partculas relativas al centro de masa r01 y r02
r1 = R + r01 ; r2 = R + r02
con lo cual
r01 =

m2
r
m1 + m2

r02 =

m1
r
m1 + m2

(10.3)
(10.4)

En esta secci
on consideraremos una situaci
on algo m
as general en donde el potencial puede depender tambien
de las derivadas temporales del vector relativo r. El Lagrangiano del sistema se puede escribir como


r U (r, r , ..)
L = T R,
es bien sabido que la energa cinetica de un sistema de partculas se puede escribir como la energa cinetica
del centro de masa mas la energa cinetica con respecto al centro de masa (ver Ec. 1.32, P
ag. 13)

1
1
1
1 2
1
02
(10.5)
T = m1 r 21 + m2 r 22 = m1 r 02
1 + m2 r
2 + MR
2
2
2
2
2
donde M m1 + m2 . Usando (10.4) se puede escribir la energa cinetica en terminos de las coordenadas
y r
generalizadas elegidas i.e. las componentes de R


r = 1 m1 m2 r 2 + 1 M R
2
T R,
(10.6)
2 M
2
el Lagrangiano queda de la forma

1 2 1 m1 m2 2
+
r U (r, r , ..)
L = MR
2
2 M

(10.7)

se puede ver que las 3 coordenadas de R son cclicas. Si elegimos como coordenadas generalizadas las tres
componentes cartesianas de R, vemos que los tres momentos lineales (que seran los momentos can
onicos)
= cte, de modo que el centro de masa est
son constantes y por tanto, R
a en reposo o movimiento rectilneo
uniforme1

R = R0 + Rt
(10.8)
si nuestro sistema original de referencia es inercial, entonces el sistema con origen en el centro de masa tambien
lo es. Podemos entonces ver el movimiento a partir del centro de masa, en cuyo caso el Lagrangiano (10.7)
queda
1
L = r2 U (r, r , ..)
(10.9)
2
donde hemos definido la masa reducida del sistema como

m1 m2
M

(10.10)

El Lagrangiano (10.9) es el equivalente al Lagrangiano que se obtendra si tuvieramos una partcula de masa
(que llamaremos la partcula) sometida a una fuerza que apunta siempre hacia un punto fijo (fuerza
central), y a una distancia r del centro de fuerza. Por otro lado, el Lagrangiano (10.7) que se escribe desde
el sistema de referencia del laboratorio, es equivalente al Lagrangiano de dos partculas desacopladas, una de
ellas es la partcula ya mencionada y la otra es una partcula libre de masa M = m1 + m2 , que se mueve
1
Desde el punto de vista Newtoniano esto se puede ver por el hecho de que el sistema est
a aislado, de modo que el centro de
masa no puede estar acelerado. En terminos de simetras, se dice que el sistema tiene invarianza traslacional que conduce a la
conservaci
on del momento lineal.

10.2. ECUACIONES DE MOVIMIENTO Y PRIMERAS INTEGRALES

217

con velocidad constante como se ve en la Ec. (10.8) y que llamaremos la M partcula. Sin embargo, dado que
la din
amica de la M partcula es trivial, solo necesitaremos resolver la din
amica de la partcula. Por esta
razon suele decirse que el problema de dos cuerpos sometidos a fuerzas centrales mutuas, se puede reducir a
un problema de una sola partcula que interact
ua con un centro de fuerzas2 .
Debemos recordar sin embargo, que tanto la partcula como la M partcula SON IMAGINARIAS,
no hay ninguna partcula en el sistema Fsico con masa o con masa M . Las trayectorias que encontraremos
son las trayectorias de estas partculas imaginarias. Para encontrar la trayectoria de las partculas reales con
respecto al sistema inercial original (laboratorio), es necesario devolverse tomando las Ecs. (10.2, 10.8) junto
con las soluciones que encontremos para r.
No obstante, si ocurre que m1 << m2 entonces tanto la trayectoria como la masa de la partcula,
van a ser muy semejantes a la trayectoria y masa real de m1 . En el mismo lmite, la trayectoria y la masa
de la M partcula son muy similares a la trayectoria y la masa de la partcula real m2 . De hecho, en esta
aproximaci
on la posici
on del centro de masa es casi igual a la posici
on de la partcula m2 .
Podemos decir entonces que el paso de las coordenadas r1 , r2 a las coordenadas R, r nos lleva de un
sistema de dos partculas (reales) acopladas o interactuantes, a otro sistema de dos partculas (imaginarias)
desacopladas o no interactuantes entre s, donde una de ellas es libre y la otra interact
ua con el potencial
central.

10.2.

Ecuaciones de movimiento y primeras integrales

Nos concentraremos de aqu en adelante en el problema de una sola partcula sometida a un potencial
que solo depende de r y no de sus derivadas temporales, de modo que la fuerza va en la direcci
on de r. Es
natural tomar el origen en el punto de convergencia de las fuerzas. Dado que en tal sistema de referencia
la energa potencial solo depende de la distancia al origen, el problema exhibe simetra esferica, por lo tanto
cualquier rotaci
on sobre cualquier eje fijo que pase por el origen no tiene efecto en la soluci
on. Por lo tanto debe
haber alg
un angulo que representa la rotacion sobre el eje en cuesti
on que debe ser cclico. Estas propiedades
de simetra llevan a una simplificaci
on significativa del problema.
La simetra esferica del Lagrangiano (invarianza ante rotaciones arbitrarias) nos lleva a la conservaci
on del
3
momento angular L como vimos en la secci
on 5.4.3 aplicando el teorema de Noether
L = r p = cte
Naturalmente los vectores r y p forman el plano instant
aneo de movimiento. Si el vector L es constante,
esto significa que todos los planos instant
aneos de movimiento pertenecen a un mismo plano. En sntesis, el
movimiento es bidimensional, adem
as el sentido de giro dictaminado por las condiciones iniciales no se puede
invertir ya que esto implicara que L invirtiera su sentido. Un caso particular resulta cuando L es nulo, esto
solo se logra si r es paralelo a p, en cuyo caso el movimiento es lineal y la recta que contiene a la trayectoria
pasa por el centro de fuerzas (aunque no necesariamente la partcula pasar
a por el centro de fuerzas)4 .
Por comodidad podemos asumir que el movimiento yace en el plano XY de modo que L es paralelo al eje
Z. La conservaci
on de L nos provee de tres constantes de movimiento, al restringir el movimiento a un plano
hemos usado dos de ellas (los dos grados de libertad necesarios para definir el vector unitario en la direcci
on
de L), la tercera deber
a aparecer como la magnitud de L. El momento angular se puede calcular usando los
2

Es importante tener en cuenta que en el sistema de referencia del laboratorio, el problema equivalente es de dos cuerpos
desacoplados en donde uno de ellos tiene din
amica trivial. Por ejemplo, el n
umero de grados de libertad se tiene que conservar en
una transformaci
on de coordenadas, y los seis grados de libertad originales no se pueden manifestar en una sola partcula. Cuando
pasamos al sistema de referencia centro de masa (que tambien es inercial) absorbemos tres grados de libertad triviales y solo nos
quedamos con los tres grados de libertad no triviales de la partcula.
3
Recuerdese que desde el punto de vista Newtoniano, esto se puede ver teniendo en cuenta que para fuerzas centrales r es
paralelo a F de modo que el torque r F es nulo y por tanto se conserva el vector momento angular (ver secci
on 1.4 P
ag. 4).
4
L tambien es nulo si r = 0 y/o p = 0 para todo tiempo. Pero esto implicara que la partcula es libre.

CAPITULO 10. FUERZAS CENTRALES

218
vectores unitarios radial y transversal de las coordenadas polares

L = r p = mr v = mrur (vr ur + v u ) = mrv ur u


L = mr 2 uz

(10.11)

Trabajaremos entonces en coordenadas polares planas para las cuales el Lagrangiano se escribe

1 
L = m r 2 + r 2 2 V (r)
2

como se previ
o, existe una coordenada angular cclica . El momento conjugado a esta variable es constante y
corresponde a la magnitud del momento angular
p =

L
= mr 2 = cte

y por tanto del


n
otese que esta cantidad contiene la informaci
on sobre el sentido de giro (dada por el signo de )
sentido de L, como se observa en la Ec. (10.11), es decir nos dice si L apunta en forma paralela o antiparalela
al eje Z. Una de las primeras integrales de movimiento es entonces
d  2 
mr = 0
(10.12)
p =
dt
y se puede integrar en forma inmediata

mr 2 = l

(10.13)

siendo l la magnitud del momento angular. Podemos extraer mas informaci


on u
til a partir de (10.12), de la
cual se deduce


d 1 2
r =0
(10.14)
dt 2

veamos la interpretaci
on del termino entre parentesis. Sea ds la longitud de arco recorrida por la partcula
en un intervalo infinitesimal de tiempo dt, el diferencial de area que barre el radio vector de posici
on en un
tiempo dt es
r ds
1
= r (rd)
dA =
2
2
y la velocidad de area, es decir el area que barre el radio vector de posici
on por unidad de tiempo es
dA
1 d
1
= r2
= r 2
dt
2 dt
2

(10.15)

pero de acuerdo con (10.14) se llega a que


d
dt

dA
dt

=0

dA
= cte
dt

de modo que la velocidad de area es constante y se obtiene la segunda ley de Kepler, el radio vector de
posici
on barre
areas iguales en tiempos iguales. El valor de la velocidad de area se puede encontrar
f
acilmente a partir del valor del momento angular l. Kepler obtuvo esta ley con base en la interacci
on gravitacional en donde V (r) = k/r. Sin embargo, en nuestra presente derivaci
on solo se emple
o la conservaci
on del
momento angular, mostrando que esta ley es v
alida para cualquier fuerza central.
La ecuaci
on de Lagrange para la coordenada no cclica r es
d
V
(mr)
mr 2 +
=0
dt
r
recordando que la fuerza viene dada por V que en este caso es (V /r) ur se tiene que
m
r mr 2 = f (r)

10.2. ECUACIONES DE MOVIMIENTO Y PRIMERAS INTEGRALES

219

teniendo en cuenta la primera integral dada por (10.13) podemos eliminar de la anterior ecuacion
m
r

l2
= f (r)
mr 3

(10.16)

con lo cual se obtiene una ecuaci


on diferencial ordinaria solo en la variable r. Aunque esto reduce formalmente
el problema a cuadraturas, resulta m
as ventajoso obtener otra primera integral de movimiento teniendo en
cuenta que la funci
on energa (o el Hamiltoniano) re
une las condiciones para ser la energa del sistema y adem
as
no es funci
on explcita del tiempo lo cual nos lleva a la conservaci
on de la energa del sistema (esto tambien
se puede ver por el hecho de que las fuerzas centrales son conservativas). Esta ley de conservaci
on se escribe




1
1
r 2 l2
1  2
2
2
2 2
2
E =
(10.17)
m vr + v + V (r) = m r + r + V (r) = m r + 2 4 + V (r)
2
2
2
m r
1 2 1 l2
E =
mr +
+ V (r)
(10.18)
2
2 mr 2
donde hemos tenido en cuenta de nuevo (10.13). N
otese que la Ec. (10.18) es de primer orden en tanto que
(10.16) es de segundo orden, es decir formalmente hemos hecho un primer proceso de integraci
on. Este primer
proceso de integraci
on se puede ver de manera m
as transparente usando las Ecs. (10.12, 10.16). La Ec. (10.16)
se puede reescribir como


d
1 l2
m
r=
V +
dr
2 mr 2
multiplicando a ambos lados por r

mr r = r
el miembro de la izquierda se escribe como

d
dr

d
mr r =
dt

V +

1 l2
2 mr 2

1 2
mr
2

(10.19)

para el miembro de la derecha se tiene en cuenta que la derivada total respecto al tiempo de una funci
on g que
solo depende de r, se escribe como dg (r) /dt = (dg/dr) r.
De modo que





d
1 l2
d
1 l2

V +
= r
V +
dt
2 mr 2
dr
2 mr 2
con lo cual la Ec. (10.19) queda



1 2
d
1 l2
mr
=
V +

2
dt
2 mr 2
1 2
1 l2
mr + V +
= cte E
2
2 mr 2
d
dt

(10.20)

y la Ec. (10.20) coincide con (10.18). Se observa que el u


ltimo paso es un proceso de integraci
on que me redujo
la ecuaci
on diferencial de segundo orden a una de primer orden. El procedimiento anterior nos muestra tambien
la ventaja de conocer constantes de movimiento por argumentos de simetra, ya que permite obtener primeras
integrales de movimiento sin tener que realizar explcitamente el primer proceso de integraci
on.
Dado que originalmente tenemos dos variables r y y ecuaciones diferenciales de segundo orden, se requieren
cuatro integraciones para resolver las ecuaciones de movimiento de las cuales hemos obtenido dos. Como se
puede ver las primeras integrales obtenidas han convertido las ecuaciones de Lagrange en dos ecuaciones
de primer orden que requieren de dos integraciones Ecs. (10.13, 10.18). N
otese que la Ec. (10.18) tiene una
apariencia muy similar a una ecuaci
on unidimensional con potencial conservativo
E=

1
mx 2 + V (x)
2

CAPITULO 10. FUERZAS CENTRALES

220


excepto por el termino l2 / 2mr 2 . Esto nos induce a definir un potencial efectivo de la forma
1 l2
2 mr 2

(10.21)

1
E = mr 2 + Vef f (r)
2

(10.22)

Vef f V (r) +

de modo que la Ec. (10.18) se reescribe como

con la Ec. (10.22) el an


alogo unidimensional se hace perfecto. Esto nos permitir
a realizar curvas de energa
potencial efectiva versus r e interpretar el movimiento de manera an
aloga al caso unidimensional, aunque con
algunas diferencias que ya indicaremos m
as adelante.
Ya hemos visto varios metodos para obtener las integrales de movimiento, el m
as sencillo a partir del
procedimiento que hemos seguido es el de resolver para r en la Ec. (10.22)
r
2
[E Vef f (r)]
r =
(10.23)
m
con lo cual
dt = q

dr
2
m

[E Vef f (r)]

integrando y teniendo en cuenta los valores iniciales r (t0 ) = r0 se escribe


Z r
dr
q
t t0 =
2
r0
m [E Vef f (r)]

(10.24)

la Ec. (10.24) nos da t en funci


on de r y de las constantes de integraci
on E, l, r0 , recordemos que l est
a contenido
en el potencial efectivo. Este puede invertirse al menos formalmente para obtener r en funci
on del tiempo y
las constantes. Una vez encontrada la soluci
on para r (t) se puede sustitur en (10.13) para obtener la soluci
on
en
=
d =

l
mr 2 (t)
l dt
mr 2 (t)

tomando a 0 como el valor inicial de , la integraci


on nos da
Z t
dt
l
0 =
2
m t0 r (t)

(10.25)
(10.26)

(10.27)

finalmente, si estamos interesados en la ecuaci


on de la trayectoria, esta se puede obtener haciendo el cociente
de (10.25) sobre (10.23)
d/dt
dr/dt
0

d
l
q 
=
dr
2
mr 2
m (E Vef f )
Z r
l dr
q 
=
2
r0 mr 2
m (E Vef f )
=

(10.28)
(10.29)

formalmente las Ecs. (10.24, 10.27) nos proveen de las dos integrales restantes necesarias para determinar las
ecuaciones de movimiento5 . Dado que se requieren cuatro integrales tambien se requieren cuatro constantes
5

La integral (10.28) no es independiente y se obtiene a partir de las anteriores.

DE ORBITAS

10.3. EL PROBLEMA UNIDIMENSIONAL EQUIVALENTE Y LA CLASIFICACION

221

de movimiento, las cuales pueden ser r0 , 0 , r0 , 0 , sin embargo un conjunto mas conveniente para la mayora
de aplicaciones es E, l, r0 , 0 . En todo caso, un conjunto se puede convertir en el otro. En los problemas que
analizaremos sera mas conveniente usar E y l. En mec
anica cu
antica, los valores iniciales de las coordenadas
y sus derivadas pierden su significado, pero E, l son todava u
tiles en este formalismo y de por s muchas
de las diferencias entre los comportamientos cl
asicos y cu
anticos estriban en el comportamiento de estas dos
cantidades. Por este motivo, para cuantizar una teora es conveniente que este escrita en terminos de la energa
y el momento angular del sistema.

10.3.

El problema unidimensional equivalente y la clasificaci


on de
orbitas

Ya hemos visto que la definici


on de un nuevo potencial efectivo (10.21) conduce a que una de las primeras
integrales asociada a la conservaci
on de la energa, tenga un an
alogo unidimensional ya que queda escrito de
la forma
1
E = mr 2 + Vef f (r)
(10.30)
2
Donde el potencial efectivo Vef f corresponde al potencial real m
as un termino adicional en la forma
Vef f V (r) + Vcent

Vcent

1 l2
1
= mv2
2 mr 2
2

(10.31)

Vcent se conoce como potencial centrfugo. Este nombre se debe a que si este termino correspondiera a un
potencial real, correspondera a una fuerza central repulsiva (ya que es positivo). No obstante, debe tenerse
claro que este termino no da cuenta de una interacci
on real, es decir no es un verdadero potencial, realmente
corresponde a una porci
on de la energa cinetica de la partcula (la correspondiente a la velocidad transversal)
como puede verse en la secci
on anterior Ecs. (10.17, 10.18). Este termino centrfugo depende de l y por tanto
depende en general de las condiciones iniciales, un cambio en el momento angular corresponder
a a un cambio
en el potencial centrfugo, observese que el potencial real unidimensional es independiente de las condiciones
iniciales lo cual constituye una de las principales diferencias con el potencial efectivo. Sin embargo, mientras
el sistema no interact
ue con otros cuerpos, el momento angular ser
a una constante y por lo tanto el potencial
efectivo no cambiar
a.
Veamos ahora que observables se pueden determinar con base en las primeras integrales, la velocidad por
ejemplo se puede obtener en magnitud y direcci
on, su magnitud se obtiene de la conservaci
on de la energa
r
1
2
2
E = mv + V (r) v =
[E V (r)]
(10.32)
2
m
en este caso solo interviene el potencial real ya que el efectivo lo que hace es tomar una porci
on de la energa
cinetica la cual aqu se escribe completa. La componente radial de la velocidad se puede obtener de (10.23)6 .
Con la rapidez y la velocidad radial es suficiente para obtener el vector velocidad7 . Otra manera de hacerlo es
obtener a traves de l en la Ec. (10.13), y r con la ecuaci
on (10.23).
Las siguientes relaciones se siguen de las Ecs. (10.30, 10.31)
E Vef f

E V (r) =
Vef f V

1 2 1
mr = mvr2
2
2

1
1
2
mv = m vr2 + v2
2
2
1 2 2 1
mr = mv2
2
2

(10.33)
(10.34)
(10.35)

Las Ecs. (10.33, 10.34, 10.35) nos inspiran a hacer gr


aficas de la energa total, el potencial efectivo, y el
potencial real en funci
on de r. Naturalmente, la curva de E corresponde a una recta horizontal en virtud de su
6
N
otese que esto es equivalente a tomar (10.32), descomponiendo la velocidad en sus terminos radial y transversal y absorbiendo
el termino transversal en el potencial para definir el potencial efectivo que aparece en (10.23).
7
La conservaci
on del momento angular evita una posible ambig
uedad en el sentido de la velocidad transversal.

CAPITULO 10. FUERZAS CENTRALES

222

conservaci
on. De las mencionadas ecuaciones vemos que las regiones accesibles, es decir los valores permitidos
para r deben cumplir que E Vef f (r) puesto E Vef f es la cantidad no negativa 12 mr 2 , esta cantidad a lo
m
as puede ser cero lo cual ocurre en los puntos de retorno8 ri , en donde se anula la velocidad radial. De la
misma manera, la regi
on accesible debe cumplir que E V (r) ya que E V (r) es la energa cinetica completa
para un valor dado de r. Finalmente, en la regi
on permitida se debe cumplir que Vef f (r) V (r) puesto que
Vef f V es la energa cinetica transversal.
Las Ecs. (10.33, 10.34, 10.35), muestran que la brecha entre la energa total y la curva de potencial efectivo
es la energa cinetica radial, la brecha entre E y la curva V (r) nos da la energa cinetica total y la brecha
entre las curvas Vef f y V (r) nos da la energa cinetica transversal (termino centrfugo). Por tanto, estas curvas
proveen la rapidez de la partcula as como sus componentes radial y transversal para una distancia dada r,
con una energa y momento angular dados.
Por otro lado, vemos que la definici
on (10.21) conduce autom
aticamente a la condici
on Vef f (r) V (r), y
que el cumplimiento de la condici
on E Vef f , nos lleva autom
aticamente a E V (r). En consecuencia, solo
la condici
on E Vef f nos da informaci
on fsica sobre regiones permitidas o excludas para la partcula.
El an
alisis cualitativo aqu descrito permite pintar la orbita en forma aproximada.

10.4.

An
alisis de curvas de potencial efectivo

Vamos a ilustrar el an
alisis de curvas de potencial efectivo a traves de algunos ejemplos

10.4.1.

Potencial efectivo para interacci


on kepleriana

Figura 10.2: (a) Gr


aficas del potencial centrfugo (lnea punteada superior), potencial real (gr
afica punteada
inferior) y potencial efectivo (gr
afica contnua), como funciones de r, para un potencial Kepleriano. Las lneas
horizontales representan diversos valores de la energa total de la partcula. (b) Gr
afica del potencial efectivo
y de la energa total para el caso de energa total positiva.
8

Hay que tener cuidado con la interpretaci


on de los puntos de retorno en problemas bidimensionales como este. En el caso
unidimensional significaba un verdadero volver sobre los pasos de la partcula. En el caso bidimensional se devuelven los valores
de r, pero sigue avanzando en el mismo sentido de giro. De modo que corresponde a un retorno en el valor de la coordenada pero
no en el movimiento.


10.4. ANALISIS
DE CURVAS DE POTENCIAL EFECTIVO

223

Figura 10.3: (a) Gr


afica del potencial efectivo kepleriano y de la energa total para el caso de energa total
negativa donde E3 es mayor que el valor del mnimo del potencial efectivo. (b) Gr
afica del potencial efectivo
kepleriano y la energa total para el caso de energa total negativa donde E4 coincide con el valor del mnimo
del potencial.
Tomemos primero el ejemplo de una fuerza atractiva proporcional al inverso al cuadrado de la distancia al
centro de fuerzas
k
k
k
l2
f (r) = 2 ur ; V (r) = ; Vef f (r) = +
r
r
r
2mr 2
este potencial efectivo se ilustra en la figura 10.2a, y con lneas punteadas se grafican el termino centrfugo
y el potencial real V (r). El termino centrfugo domina para r 0, en tanto que el potencial real domina
cuando r . Existe un mnimo local que nos permitir
a tener equilibrio estable (
orbitas acotadas) en ciertas
circunstancias.
a una distancia mnima de aproximaci
on r1 al centro
Si la partcula tiene una energa positiva E1 , esta tendr
de fuerza de acuerdo con el diagrama 10.2b (valores menores de r implican E1 < Vef f que de acuerdo con
la Ec. 10.33 nos dice que la energa cinetica radial es negativa, lo cual no es posible), pero no posee un valor
m
aximo para r de modo que la orbita no est
a acotada. Una partcula que viene desde el infinito se tropieza con
la barrera efectiva repulsiva para ser repelida y vuelve hacia el infinito. Esta situaci
on se ilustra en la Fig.
10.4a. N
otese que esta barrera repulsiva efectiva no es causada solamente por la interacci
on real sino que es
generada por la conjugaci
on entre la interacci
on real y las condiciones iniciales. Efectivamente, si redirigimos
la partcula (cambiamos la direcci
on de v0 ) de manera que apunte desde el infinito directamente hacia el
centro atractor, la trayectoria sera una lnea recta que en principio puede pasar por el centro atractor. Este
cambio en las condiciones iniciales (en v0 ) corresponde a un cambio en el potencial centrfugo, mostrando que
esta barrera efectiva est
a relacionada con las condiciones iniciales y no solamente con la interacci
on9 . Por otro
lado, en el an
alisis anterior con la condici
on inicial r0 > r1 , hemos supuesto que r disminuir
a hasta rebotar
en la barrera efectiva para volver a aumentar ahora indefinidamente. No obstante, el perfil de la curva no nos
prohbe que la partcula empiece a aumentar su coordenada r desde el principio aumentando indefinidamente
sin acercarse nunca a la barrera de potencial, efectivamente esta sera la situaci
on si r0 > 0 como se puede ver
de la Fig. 10.4a, si invertimos el sentido de la velocidad inicial. Nuevamente las condiciones iniciales son las
que nos permiten dicernir cual es la situaci
on que est
a ocurriendo10 . De lo anterior, vemos que dependiendo
9
Naturalmente, puede verse que la interacci
on juega un papel en la creaci
on de la barrera efectiva, ya que si la interacci
on
estuviera ausente, la trayectoria sera una lnea recta para cualquier direcci
on inicial v0 y la distancia mnima de acercamiento
sera diferente al caso en que la interacci
on est
a presente y la trayectoria se curva. Esto tambien se puede ver teniendo en cuenta
que el potencial efectivo es la suma del potencial real (interacci
on) y la energa cinetica transversal (condiciones iniciales).
10
Recordemos que en principio se requieren cuatro condiciones iniciales para determinar la din
amica del sistema, y en la curva de
potencial hay solo dos, la energa y el momento angular. Usualmente las dos condiciones restantes que permiten un mejor an
alisis
son los valores iniciales de r y de r.

224

CAPITULO 10. FUERZAS CENTRALES

Figura 10.4: (a) Ilustraci


on del tipo de o
rbita no acotada que corresponde a una energa total no negativa en un
potencial kepleriano. r1 es la menor distancia de aproximaci
on al centro de fuerzas. (b) Ilustraci
on del tipo de
o
rbita acotada entre dos valores de r que corresponde a una energa total negativa. De momento no podemos
garantizar que esta o
rbita sea cerrada.
de las condiciones iniciales es posible que la partcula no acceda a toda la regi
on permitida por la curva de
potencial efectivo.
Ahora bien, para el caso de una energa E2 = 0, la historia es muy parecida al caso de energa positiva
excepto que en el infinito la partcula no poseer
a energa cinetica (la energa cinetica en el infinito es precisamente la energa total ya que todos los potenciales se van para cero). En contraste, cuando la energa es
positiva la partcula posee energa cinetica incluso en el infinito.
La Fig. 10.3a, muestra que para cualquier valor E3 < 0 que sea mayor que el mnimo de Vef f 11 , la
coordenada r est
a acotada entre dos puntos de retorno r1 y r2 que ser
an los valores m
aximo y mnimo de
la distancia al centro atractor, conocidas como distancias apsidales. Esto no significa que las orbitas sean
necesariamente cerradas, solo nos demuestra que est
an acotadas por la regi
on definida entre los crculos de
radios r1 y r2 , donde los puntos de retorno siempre est
an sobre una de las circunferencias. La forma generica
de la orbita esperada se muestra en la figura 10.4b.
La Fig. 10.3b ilustra la situaci
on en la cual la energa E4 es igual al mnimo de Vef f de modo que solo hay
un valor accesible de r donde r = 0, en cuyo caso la trayectoria es circular. Definiendo una fuerza efectiva
de la forma
Vef f
l2
fef f (r) =
=f+
(10.36)
r
mr 3
el requerimiento de orbita circular r Vef f = 0, corresponde claramente a la anulaci
on de la fuerza efectiva. Es
el equivalente a pararse en el sistema no inercial atado a la partcula para ver la anulaci
on entre la fuerza real
y la fuerza centrfuga de car
acter ficticio.
Por otro lado, recordemos que el cambio en l cambia el perfil de Vef f aunque esto no cambia la clasificaci
on
general de los tipos de orbitas (a menos que l se vuelva nulo). Es decir para valores negativos de la energa
seguimos teniendo orbitas acotadas, y para energas no negativas las orbitas contin
uan siendo no acotadas sin
importar el valor del momento angular (siempre que sea no nulo), aunque por supuesto el perfil especfico del
11

Si E < Vef f (r) para todo r, no hay regiones accesibles ya que conduce a energa cinetica radial negativa.


10.4. ANALISIS
DE CURVAS DE POTENCIAL EFECTIVO

225

potencial efectivo y la forma especfica de la orbita cambian con el momento angular. Sin embargo, cuando
el momento angular se vuelve nulo la clasificaci
on de las orbitas s cambia, ya que el potencial centrfugo se
anula y la trayectoria es una lnea recta.
M
as adelante veremos que en el caso de la ley de inverso cuadrado atractivo, las energas positivas conducen
a orbitas hiperb
olicas, energa cero conduce a orbitas parab
olicas y energa negativa a elipses. Estos resultados
estan en concordancia con el an
alisis cualitativo que mostramos aqu. Sin embargo, adem
as de los detalles de
la orbita, veremos que toda orbita acotada para potencial kepleriano corresponde a una trayectoria cerrada,
lo cual no se puede garantizar con el an
alisis del potencial efectivo. De hecho, son muy pocos los potenciales
para los cuales toda orbita acotada es cerrada (ver secci
on 10.9, P
ag. 238).

10.4.2.

Potencial efectivo equivalente para dos cuerpos no interactuantes

Figura 10.5: Ilustraci


on del comportamiento de la coordenada r para el caso de dos partculas no interactuantes. (b) Ilustraci
on de la barrera de potencial efectivo que nos indica el valor de la mnima distancia de
aproximaci
on. (c) Gr
afica de potencial efectivo para la partcula equivalente al problema de dos cuerpos no
interactuantes.
La gran simplicidad de este problema nos permitir
a reforzar el significado fsico del potencial centrfugo.
Sean dos cuerpos no interactuantes que se mueven con velocidades paralelas y opuestas como se ve en la
Fig. 10.5a. Las lneas paralelas que forman las trayectorias de las partculas est
an separadas una distancia b
usualmente denominada par
ametro de impacto.
Antes de realizar el an
alisis del potencial efectivo, realizaremos un an
alisis puramente cinem
atico. El gr
afico
10.5a muestra que inicialmente r es muy grande y cuando las partculas se acercan, r disminuye hasta alcanzar
su valor mnimo en r = b (ver Fig. 10.5b). Posteriormente, r vuelve a aumentar y crece indefinidamente. Esto
nos muestra que r = b es un punto de retorno para la coordenada r, la cual disminuye hasta llegar a b para
luego volver a aumentar. N
otese que r = b es un punto de retorno para r, pero no para el movimiento como
tal. Por otro lado, es f
acil ver que si en la Fig. 10.5a invertimos el sentido de ambas velociadades, y r (0) > b,
la coordenada r aumenta a partir de su valor inicial r (0) y crece indefinidamente, de modo que r nunca pasa
por el punto de retorno.
Ahora para construr el potencial efectivo, veremos como son las ecuaciones para la partcula equivalente
a este problema de dos cuerpos. Denotaremos por v0 la velocidad relativa la cual viene dada por
v0 = r = r 2 r 1 = v2 v1
claramente v0 es constante ya que v1 y v2 lo son. La energa total del sistema relativa al centro de masa es
E=

1 2
1
v0 + V (r) = v02
2
2

CAPITULO 10. FUERZAS CENTRALES

226
puesto que V (r) = 0. El potencial efectivo est
a dado por
Vef f =

l2
l2
+
V
(r)
=
2r 2
2r 2

podemos evaluar l en forma directa pero es m


as f
acil usando la relaci
on
l2
1
1
E = r 2 +
= v02
2
2r 2
2

(10.37)

es claro que cuando los dos cuerpos alcanza su distancia mnima de aproximaci
on r = b y r = 0 puesto que r
es un mnimo local en este punto, esto se ilustra en la Fig. 10.5b. Por tanto
1
l2
= v02 l = bv0
2b2
2

(10.38)

con lo cual el potencial efectivo tendr


a la forma
1
b2
Vef f = v02 2
2
r
de modo que el gr
afico del potencial efectivo es el indicado en la Fig. 10.5c. La regi
on permitida es aquella
en la cual E Vef f . Haremos un an
alisis del movimiento de la partcula equivalente. Denotaremos el
punto de retorno como rt . Si las condiciones iniciales son tales que r (0) > rt y r (0) < 0, entonces la partcula
inicialmente se aproxima al punto de retorno y al llegar a el rebota en la barrera de potencial efectivo luego
de lo cual se invierte el sentido radial de movimiento y la coordenada r crece indefinidamente. Debe tenerse
presente que el retorno es en la coordenada radial de la partcula, pero no en la coordenada , de modo
que no hay retorno del movimiento como tal. Si cambiamos las condiciones iniciales de modo que r (0) > rt y
r (0) > 0, la partcula inicialmente se aleja del punto de retorno y la coordenada r aumenta indefinidamente
puesto que no hay puntos de retorno a la derecha de r (0), en cuyo caso la partcula nunca pasa por el
punto de retorno. Comp
arese este an
alisis con el estudio puramente cinem
atico de las dos partculas reales al
principio de este secci
on.
La Fig. 10.5c muestra adem
as que cuando la partcula se dirige hacia el punto de retorno, la energa
cinetica radial va disminuyendo12 , y cuando se aleja del punto de retorno, la energa cinetica radial est
a aumentando hasta llegar al valor E en el infinito.
A manera de consistencia, encontraremos el punto de retorno con la condici
on E = Vef f (rt ) lo cual nos da
1 2 1 2 b2
v = v0 2
2 0
2
rt

rt = b

en concordancia con nuestro an


alisis cinem
atico. Esto se ve de las gr
aficas 10.5a,b ya que r disminuye hasta
llegar a r = b, y a partir de all vuelve a aumentar. En nuestra gr
afica unidimensional 10.5c, esto se interpreta
diciendo que la partcula equivalente rebota en la barrera de potencial efectivo. Insistiendo en que estos
rebotes o retornos son en la coordenada r y no en el movimiento del sistema.
Este ejemplo es muy enf
atico en su mensaje, el potencial efectivo (que aqu coincide con el potencial
centrfugo) no est
a de ninguna manera relacionado con interacci
on, ya que estas partculas no interact
uan
entre s. En este caso, la barrera de potencial efectiva (centrfuga) es debida exclusivamente a las condiciones
iniciales del problema. Efectivamente, si el choque fuera frontal i.e. b = 0, el potencial efectivo se anulara
y se desvanecera la barrera de potencial efectiva, lo cual se refleja en el hecho de que dos partculas no
interactuantes que se aproximan frontalmente, puede acercarse una a otra en forma indefinida.


10.4. ANALISIS
DE CURVAS DE POTENCIAL EFECTIVO

227

Figura 10.6: Gr
aficas del potencial centrfugo (lnea punteada superior), potencial real (gr
afica punteada inferior) y potencial efectivo (gr
afica contnua), como funciones de r, para un potencial de la forma V = a/r 3 .

10.4.3.

Potencial atractivo proporcional al inverso del cubo de la distancia

Tomemos como ejemplo un potencial atractivo de la forma


a
3a
f = 4
r3
r
2
a
l
= 3+
r
2mr 2

V (r) =
Vef f

(10.39)
(10.40)

el potencial efectivo junto con el potencial real y el termino centrfugo, se grafican en la figura 10.6. Este
potencial efectivo solo tiene un m
aximo local y tiende a cero por la derecha cuando r , tambien tiende
a cuando r 0. Para una energa E positiva menor que el m
aximo local, hay dos tipos de movimiento
dependiendo del valor inicial de r. Si r0 r1 el movimiento ser
a acotado entre 0 y r1 ; adem
as la energa
cinetica tender
a a infinito a medida que se acerca al centro atractor. Si r0 r2 el movimiento es no acotado y
su distancia mnima de acercamiento es r2 , la partcula no podr
a nunca acceder al pozo de potencial, debido
a que existe entre r1 y r2 una barrera de potencial. El intervalo r1 < r < r2 es claramente inaccesible.
Para el caso E 0 la orbita estar
a acotada entre r = 0 y un punto de retorno, la energa tiende a infinito
cuando r 0. Cuando E es mayor que el m
aximo del potencial todas las regiones son permitidas.
Resulta interesante el caso en el cual E coincide con el valor del m
aximo del potencial, llamemos rm al valor
a acerc
andose a rm , en este
de r en el cual ocurre el m
aximo. Si r0 > rm y r0 < 0 la coordenada r disminuir
proceso disminuye la energa cinetica radial hasta anularse cuando r = rm , y la partcula queda atrapada en
una trayectoria circular de radio rm . N
otese sin embargo que si la energa es ligeramente mayor o ligeramente
menor a este valor del m
aximo de potencial, la naturaleza del movimiento cambia dr
asticamente, de modo que
12
Naturalmente, la energa cinetica total es constante y est
a dada por E V (r) = E. De modo que la energa cinetica transversal
debe estar aumentando. Efectivamente, esta energa est
a dada por Vef f (r) V (r) = Vef f (r), y el potencial efectivo aumenta
cuando disminuye r.

CAPITULO 10. FUERZAS CENTRALES

228

tenemos una orbita circular inestable. De otra parte, si r0 > rm y r0 > 0 la partcula se aleja indefinidamente
alisis similar se puede hacer para la condici
on inicial r0 < rm .
del valor rm y nunca retorna. Un an

10.4.4.

Potencial efectivo para fuerza restauradora lineal

Figura 10.7: (a) Gr


afica del potencial efectivo correspondiente a una fuerza restauradora lineal para momento
angular nulo. (b) Gr
aficas de potencial centrfugo, potencial real y potencial efectivo para una fuerza restauradora lineal con momento angular no nulo.
Otro caso interesante es el de una fuerza restauradora lineal (oscilador arm
onico isotr
opico)
1
f = kr ; V = kr 2
2
para momento angular cero, correspondiente a movimiento a lo largo de una lnea recta, Vef f = V y la situaci
on
es como la que se ilustra en la Fig. 10.7a. Para cualquier valor positivo de la energa el movimiento est
a acotado
y como se sabe, es arm
onico simple. Si l 6= 0, surge un potencial centrfugo y las caractersticas del movimiento
se ilustran en la Fig. 10.7b. El movimiento es siempre acotado para todas las energas fsicamente posibles y
no pasa por el centro de fuerzas. En este caso particular es f
acil ver que la orbita es elptica, ya que si f = kr,
las componentes x, y de las fuerzas son
fx = kx ; fy = ky
el movimiento consta de la composici
on de dos movimientos arm
onicos simples de la misma frecuencia cada
uno perpendicular al otro. Esto conduce en general a orbitas elpticas.
Un ejemplo bien conocido es el del pendulo esferico de peque
nas oscilaciones. Las famosas figuras de
Lissajous se obtienen como la composici
on de dos movimientos arm
onicos simples perpendiculares entre s,
y son cerradas cuando los cocientes entre las frecuencias son n
umeros racionales. Para dos oscilaciones con
la misma frecuencia, la figura es una lnea recta cuando las oscilaciones est
an en fase, un crculo cuando su
diferencia de fase es /2, y una forma elptica en los dem
as casos. En consecuencia, el movimiento bajo una
fuerza central restauradora lineal nos provee las figuras de Lissajous m
as sencillas.

10.4.5.

Consideraciones generales sobre curvas de potencial efectivo

Para un potencial central (real) dado, la forma detallada de las orbitas puede ser muy compleja y depender
fuertemente de las condiciones iniciales. Sin embargo, de los an
alisis anteriores podemos deducir la siguiente

10.5. EL TEOREMA DEL VIRIAL

229

divisi
on cualitativa de las orbitas para una partcula sometida a una fuerza central (1) Movimiento acotado,
(2) Movimiento no acotado, (3) Movimiento circular, (4) Movimiento rectilneo.
Cuando el potencial efectivo posee un mnimo local, existen valores de la energa para los cuales la orbita
esta acotada en un intervalo [ra , rb ] siendo ra y rb puntos de retorno de r en donde la energa cinetica radial
se anula. Sin embargo, el movimiento estar
a acotado en este intervalo solo si la posici
on inicial es tal que
r0 [ra , rb ]. Aunque la presencia de un mnimo local en el potencial efectivo es una condicion suficiente
para que el movimiento acotado sea posible, el ejemplo de la secci
on 10.4.3 muestra que no es una condici
on
necesaria. Adicionalmente, el ejemplo del potencial tipo Hooke de la secci
on 10.4.4, nos muestra que existen
potenciales (reales) para los cuales el movimiento es siempre acotado sin importar las condiciones iniciales13 .
Los an
alisis anteriores tambien muestran que para muchos potenciales (reales) el movimiento no acotado
es posible. Para un par de valores fijos de la energa y el momento angular, esto ocurre cuando existe un punto
rb para el cual no hay puntos de retorno a la derecha de rb . Si en este caso las condiciones iniciales son tales
que r (0) > rb y r (0) > 0, la coordenada r crece indefinidamente.
Cuando el potencial efectivo posee un mnimo o un m
aximo local en un punto r1 , el movimiento circular
es posible si se cumple la condici
on E = Vef f (r1 ). Para el caso de un mnimo local se requiere adem
as la
condici
on14 r (0) = r1 . El movimiento circular tendr
a radio r1 y ser
a estable (inestable) si Vef f (r1 ) corresponde
a un mnimo (maximo) local. Para m
as detalles, ver seccion 10.7.
Una condici
on especial interesante ocurre cuando el momento angular es nulo, lo cual cinem
aticamente
implica que la velocidad inicial de la partcula es tal que su prolongaci
on pasa por el centro de fuerzas. En
otras palabras, ocurre cuando la partcula apunta directamente al centro de fuerzas. En este caso la simetra
esferica del potencial implica que la trayectoria debe ser una lnea recta (no hay velocidad inicial transversal
ni aceleraci
on transversal). En realidad, la velocidad inicial v0 rompe la simetra esferica del potencial y la
reduce a una simetra cilndrica donde el eje de simetra es aquel paralelo a v0 que pasa por el centro de
fuerzas. No obstante, hay un remanente de la simetra esferica si tenemos en cuenta que la direcci
on de este
eje es arbitraria. Es decir no importa cual sea la direcci
on de v0 (siempre y cuando la partcula apunte hacia
el centro de fuerzas) vamos a obtener una simetra cilndrica. Podemos expresar esto diciendo que hay una
simetra esferica que nos permite escoger el eje de simetra en direcci
on arbitraria, pero una vez elegido un
eje especfico, la simetra esferica se rompe reduciendose a una simetra cilndrica alrededor de dicho eje. En
todo caso, los argumentos de simetra nos dicen que el movimiento de la partcula para L = 0 debe realizarse
a lo largo del eje de simetra determinado por v0 y el centro de fuerzas, de modo que la trayectoria debe ser
recta.
No todos los potenciales pueden exhibir los cuatro tipo de orbita. Por ejemplo, el potencial real de Hooke
no puede conducir a orbitas no acotadas para ning
un conjunto de condiciones iniciales. Existe un conjunto de
condiciones suficientes (pero no necesarias), para que los cuatro tipos de movimiento sean posibles para un
potencial dado, y son las siguientes: (a) el potencial real decae mas lentamente que 1/r 2 cuando r y (b)
diverge mas lentamente que 1/r 2 cuando r 0. La primera condici
on asegura que el potencial real predomina
sobre el termino centrfugo para valores grandes de r, en tanto que la segunda condici
on asegura que para
peque
nos valores de r predomina el termino centrfugo. En sntesis, estas condiciones nos garantizan que el
potencial en cuesti
on tendr
a un comportamiento asint
otico similar al del potencial de Kepler V (r) = k/r.

10.5.

El teorema del virial

Algunas propiedades de las fuerzas centrales se pueden derivar como un caso particular del teorema del
virial, el cual es de car
acter estadstico ya que se refiere a los promedios temporales de varias cantidades
mec
anicas. Consideremos un sistema de masas puntuales con vectores de posici
on ri y fuerzas resultantes Fi .
13

En el caso del potencial de Hooke esto es de esperarse, debido a que se trata de una interacci
on que aumenta con la distancia.
Puede pensarse que para mnimos locales con E = Vef f (r1 ) la condici
on r (0) = r1 es redundante, ya que en cierta vecindad
de r1 , el u
nico valor permitido para r es precisamente r1 . No obstante, si el mnimo local no es un mnimo absoluto del potencial
efectivo, pueden existir otras regiones permitidas para r.
14

CAPITULO 10. FUERZAS CENTRALES

230
Las ecuaciones fundamentales de movimiento son
p i = Fi
ahora nos concentraremos en la cantidad
G=

N
X
i=1

pi ri

donde la suma es sobre todas las partculas del sistema. Fi incluye a las fuerzas internas y externas sobre la
partcula i. La derivada total en el tiempo de esta cantidad es
dG
dt
dG
dt

N
X
i=1

r i pi +

= 2T +

N
X
i=1

N
X
i=1

p i ri =

N
X
i=1

mi r i r i +

N
X
i=1

F i ri = 2

N
X
1
i=1

mi vi2 +

N
X
i=1

F i ri

F i ri

calculemos ahora el promedio temporal de esta cantidad tomado sobre un intervalo [0, ], lo cual se obtiene
integrando en dicho intervalo y dividiendo por



Z 
X
dG
1 dG
dt
= 2T +
F i ri
0
dt
dt
i
X
1
2T +
F i ri =
[G ( ) G (0)]

hay dos situaciones interesantes para las cuales el termino de la derecha se anula. (a) Cuando el movimiento
es peri
odico de tal modo que todas las coordenadas y velocidades se repiten despues de cierto tiempo, en tal
caso el termino de la derecha se anula si elegimos a como el periodo del movimiento. (b) Las coordenadas y
velocidades de todas las partculas permanecen finitas para todo tiempo, el sistema est
a entonces acotado y el
valor de G tambien. En este caso el termino de la derecha tiende a cero para tiempos suficientemente largos.
En cualquiera de estas situaciones se tiene
1X
T =
F i ri
(10.41)
2
i

La ecuaci
on (10.41) se conoce como el teorema del virial, y el lado derecho se conoce como el virial de Clausius.
(e)
Con frecuencia es conveniente separar las fuerzas externas Fi e internas Fij de cada partcula para escribir
cada contribuci
on en forma separada. Si asumimos que se cumple el principio de acci
on y reacci
on el teorema
queda
(
)
X
1 X (e)
T =
F i ri +
Fij rij
(10.42)
2
pares
i

Si las fuerzas son derivables de un potencial, el teorema del virial (10.41) queda de la forma
1X
T =
V ri
2

(10.43)

En el contexto de las fuerzas centrales, examinaremos la informaci


on que nos da el teorema del virial aplicado
a una sola partcula sujeta a un potencial central. Si usamos una ley de potencial de la forma
V (r) = ar n+1
de manera que la fuerza va como r n , se tiene que


V
V
V r =
ur (rur ) =
r = (n + 1) V
r
r

DE LA ORBITA

10.6. ECUACION
Y POTENCIALES INTEGRABLES

231

de modo que la Ec. (10.43) para una partcula queda


T =

n+1
V
2

(10.44)

este mismo resultado se puede obtener aplicando el teorema de Euler Ec. (5.16) para un potencial homogeneo
en r de grado n + 1 (lo cual es m
as general). Para el caso particular de una fuerza con ley de inverso al
cuadrado, usamos n = 2 y resulta
1
T = V
(10.45)
2
n
otese que aunque el teorema del virial est
a relacionado con promedios temporales, se puede emplear para
una sola partcula o para muchas. Ya vimos que el promedio temporal debe tomarse sobre un periodo si el
movimiento es peri
odico, o para tiempos muy grandes si el movimiento no es peri
odico pero es acotado en el
espacio y las velocidades. En el caso de fuerzas centrales, el promedio dado por la Ec. (10.44) solo ser
a v
alido
si la orbita es acotada. Si la orbita no es peri
odica, el promedio se debe tomar sobre un intervalo muy grande
de tiempo, si es peri
odica se debe tomar sobre el periodo.

10.5.1.

Otras aplicaciones del teorema del virial

Una de las aplicaciones mas interesantes del teorema del virial es la derivaci
on de la ecuaci
on de estado
de un gas. Aplicando el teorema del virial junto con ciertas consideraciones estadsticas para un gas en un
contenedor, se obtiene
1X
pV = N kT +
Fij rij
3 pares
El lector interesado puede consultar los detalles por ejemplo en la Ref. [2]. N
otese que la contribuci
on del
termino de fuerzas internas puede ser negativo (positivo) para fuerzas atractivas (repulsivas). En el caso de
un gas ideal, se desprecia la interacci
on entre moleculas y solo se considera la interacci
on con las paredes, de
modo que todas las fuerzas internas se anulan y la ecuaci
on de estado queda en la forma
pV = N kT

gas ideal

Adicionalmente, si la fuerza resultante (para una o m


as partculas) es la suma entre fuerzas no friccionales
y fuerzas friccionales proporcionales a la velocidad, entonces el virial solo depende de las primeras, no hay contribuci
on de las fuerzas friccionales viscosas. No obstante, es necesario que se le inyecte energa al sistema para
mantener el movimiento ya que si las fuerzas viscosas detienen el movimiento todos los promedios temporales
tienden a cero para tiempos suficientemente grandes.

10.6.

Ecuaci
on de la
orbita y potenciales integrables

Ya hemos escrito la ecuaci


on de la orbita Ec. (10.29). Una forma alternativa que nos provee de cierta
informaci
on interesante, se obtiene reescribiendo la Ec. (10.13) de la siguiente forma
dt =

mr 2
d
l

esta ecuaci
on permitir
a relacionar la derivada temporal de una funci
on arbitraria F con su derivada con
respecto a . Para nuestros prop
ositos nos interesa tambien la segunda derivada
dF
dF
l dF
=  2
=
mr
dt
mr 2 d
d
l

CAPITULO 10. FUERZAS CENTRALES

232
d2 F
dt2
d2 F
dt2

d
dt

dF
dt

l d
mr 2 d

d
dt

l dF
mr 2 d

l dF
mr 2 d


=

d


mr 2
l

l dF
mr 2 d

y como F es arbitrario, hemos encontrado una relaci


on entre las derivadas en y en t


d (. . .)
l d (. . .)
d2 (. . .)
l d
l d (. . .)
=
;
=
dt
mr 2 d
dt2
mr 2 d mr 2 d

(10.46)

esta ecuaci
on se puede sustituir bien sea en la Ec. (10.16) o en (10.23). La sustituci
on en (10.16) nos da una
ecuaci
on de segundo orden, en tanto que la sustituci
on en (10.23) nos da una ecuaci
on de primer orden en el
tiempo. Aunque las ecuaciones de segundo orden son en general m
as difciles de resolver, aplicaremos primero
la Ec. (10.46) a la Ec. (10.16) ya que esta ecuaci
on diferencial tambien nos dar
a un informaci
on u
til. Aplicando
las relaciones (10.46) en la Ec. (10.16) se obtiene


l d
l dr
l2

m 2
= f (r)
(10.47)
mr d mr 2 d
mr 3
usando la identidad

d (1/r)
1 dr
=
2
r d
d

en la Ec. (10.47) se obtiene




 
l d
l d (1/r)
l2 1 3

= f (r)
r 2 d
m d
m r

l2
m

 2 2
 
1
d (1/r)
l2 1 3
+
= f (r)
r
d 2
m r

de lo cual se ve conveniente el cambio de variable u = 1/r, resultando




 
1
l2 u2 d2 u
+ u = f
2
m d
u
 2

 
d u
m 1 d
1
+u = 2 2 V
2
d
l u dr
u

(10.48)
(10.49)

y teniendo en cuenta

dr d
1 d
d
=
= 2
du
du dr
u dr
la Ec. (10.49) se puede escribir en funci
on del potencial
 2

 
d u
m d
1
+u = 2
V
d 2
l du
u

(10.50)

empleando cualquiera de las Ecs. (10.48, 10.50) podemos hallar la orbita con base en la fuerza o el potencial de
interacci
on. Es tambien interesante el caso inverso, es decir dada la orbita (determinada experimentalmente)
encontrar el potencial de interacci
on. Por el momento, deseamos demostrar a partir de (10.50) que la orbita es
simetrica respecto a los puntos de retorno del movimiento. Notemos que si la orbita es simetrica ser
a posible
reflejarla respecto a la direcci
on del angulo de retorno sin producir ninguna variaci
on. Si se eligen las coordenadas de tal modo que el punto de retorno corresponda a = 0, la reflexi
on podr
a hacerse matem
aticamente
sustituyendo por . La ecuaci
on diferencial (10.50) que describe la orbita es evidentemente invariante ante
dicha sustituci
on, ya que aparece la segunda derivada en pero no la primera derivada. Veamos ahora si las
condiciones iniciales son tambien invariantes15 , para verlo ser
a m
as u
til escribir las condiciones iniciales en
15
Hemos visto en la secci
on 10.4.5, que las condiciones iniciales pueden romper las simetras del potencial. Similarmente, las
condiciones iniciales pueden romper la simetra de las ecuaciones de movimiento. Podemos expresarlo diciendo que las simetras
din
amicas pueden ser rotas por la cinem
atica.

DE LA ORBITA

10.6. ECUACION
Y POTENCIALES INTEGRABLES

233

terminos de derivadas en en lugar de derivadas temporales







d (1/r)
1 dr
1 dr dt
r
du
=
=

=0
2 t=0
d t=0
d t=0
r 2 d t=0
r 2 dt d t=0
r

donde hemos tenido en cuenta que r0 = 0 ya que empezamos a una distancia apsidal. Por otro lado, tambien
por nuestras hip
otesis de trabajo t = 0 corresponde a = 0 por tanto las condiciones iniciales quedan
 
 
du
du
u = u ( = 0) ,
=
=0
d t=0
d =0
y estas condiciones iniciales tampoco se ven afectadas por la transformaci
on de inversi
on angular. Por lo tanto,
la ecuaci
on de la orbita es la misma tanto si la expresamos en terminos de , como si la expresamos en funci
on
de , siempre que se mida con respecto a una lnea apsidal. Esto nos lleva a la conclusi
on de que la o
rbita
es invariante ante una reflexi
on respecto a los vectores apsidales. Esto implica que se puede construr
la orbita completa si se conoce la porci
on de la orbita comprendida entre dos puntos de retorno cualesquiera.
La reflexi
on de la porci
on dada respecto a uno de los vectores apsidales produce un trozo adicional de la orbita
y se puede repetir este proceso indefinidamente hasta completar el resto de la orbita como se ilustra en la Fig.
10.8.

Figura 10.8: Construcci


on de la o
rbita a partir de una secci
on orbital entre dos lneas apsidales (curva 1
contnua). La curva 2 se form
o por imagen especular de la curva 1 con respecto al a
pside r2 en tanto que la
curva 3 se form
o por reflexi
on de la curva 1 con respecto al a
pside r1 .
Retornaremos ahora a la ecuaci
on de orbita en la forma (10.29) pero escribiendola de nuevo en terminos
del potencial real V (r)
Z r
l dr
r h
0 =
i
r0
2
l2
mr 2 m
E V (r) 2mr
2
la cual se puede reescribir apropiadamente como
Z r
dr
q
=
2mE
2mV
r0 r 2
l2 l2

1
r2

+ 0


de nuevo haciendo un cambio de variable u = 1/r, du = 1/r 2 dr = u2 dr resulta
Z u
du
q
= 0
2mE
2mV
2
u0
l2 l2 u

(10.51a)

(10.52)

CAPITULO 10. FUERZAS CENTRALES

234

la integraci
on detallada de esta expresi
on no es en general sencilla. En realidad solo ciertos tipos de potenciales
han sido estudiados en forma detallada. Los m
as importantes son los potenciales de la forma
V = kr n+1

(10.53)

para los cuales la ecuaci


on (10.52) queda
= 0

u
u0

du
2mE
l2

2mk n1
l2 u

(10.54)
u2

la cual es integrable en terminos de funciones sencillas solo en algunos casos. Las soluciones se pueden escribir
en terminos de funciones trigonometricas en los casos en que
n = 1, 2, 3
en tanto que para las potencias
n = 5, 3, 0, 4, 5, 7
las soluciones se pueden expresar en terminos de funciones elpticas. Estos son todos los casos para potencias
enteras en los cuales las soluciones se pueden escribir en terminos de funciones sencillas. Algunos exponentes
fraccionarios tambien se pueden escribir en terminos de funciones elpticas y muchos otros en terminos de
funciones hipergeometricas. Las funciones trigonometricas y elpticas son casos especiales de las funciones
integrales hipergeometricas. Un an
alisis mas detallado se puede ver en la segunda edici
on de la Ref. [1].

10.7.

Condici
on para
orbitas circulares estables e inestables

A
un es posible extraer informaci
on adicional del problema unidimensional equivalente as como de la
ecuaci
on de la trayectoria. En particular, se puede deducir un teorema relacionado con los tipos de fuerzas
centrales atractivas que nos llevan a orbitas cerradas, es decir orbitas en las cuales la partcula trace de nuevo
los mismos pasos.
Ya hemos descrito un tipo de orbita cerrada: la orbita circular centrada en el centro de fuerzas. Para un
valor dado de l (es decir para un perfil dado del potencial efectivo), este movimiento se d
a si la energa total
E de la partcula coincide con un mnimo o m
aximo local del potencial efectivo, y el radio r0 del crculo
estar
a dado por el valor de r para el cual se encuentra dicho mnimo o m
aximo. Recordemos que el requisito
de que Vef f tenga un extremo coincide con el requisito de que la fuerza efectiva dada por (10.36) se anule
para el valor r0 donde se ubica el extremo, por lo tanto
f (r0 ) =

l2
mr03

(10.55)

esto nos dice que la fuerza (real) debe ser atractiva al menos a la distancia r0 , con el fin de lograr una orbita
circular. Adicionalmente, la energa de la partcula se obtiene de las Ecs. (10.30, 10.31) simplemente teniendo
en cuenta que la energa cinetica radial es cero ya que r0 debe ser nulo.
E = Vef f (r0 ) = V (r0 ) +

l2
2mr02

(10.56)

las Ecs. (10.55) y (10.56) implican que para toda fuerza central atractiva se puede obtener una orbita circular
de radio arbitrario r0 dado, si el momento angular viene dado por (10.55) y la energa viene dada por (10.56).
Si el potencial efectivo presenta un mnimo local y elevamos la energa ligeramente, la orbita ya no ser
a circular pero estar
a acotada entre dos crculos de radios cercanos al de la orbita original, de modo que la trayectoria
no se desva significativamente de la original (aunque podra dejar de ser cerrada). Tomando la terminologa
del caso unidimensional decimos que esta orbita circular es estable. Por el contrario si estamos en un m
aximo

PARA ORBITAS

10.7. CONDICION
CIRCULARES ESTABLES E INESTABLES

235

Figura 10.9: (a) Para este potencial efectivo el movimiento es acotado para energas alrededor de E. (b) Para
este potencial un ligero aumento en la energa conduce a movimiento no acotado, una ligera disminuci
on de
la energa conduce a movimiento no acotado si r (t = 0) > r0 .
local, el m
as leve aumento (o disminuci
on) de la energa puede llevar a orbitas totalmente diferentes aunque
podran todava ser acotadas como se ve en la Fig. 10.9a, pero en algunos casos como el de la figura 10.9b el
movimiento se vuelve no acotado. El hecho importante es que un ligero cambio en la energa (y por tanto en
las condiciones iniciales) conduce a trayectorias totalmente distintas por lo cual decimos que la orbita circular
es inestable. Dado que la estabilidad (inestabilidad) est
a dictaminada por la condici
on de mnimo (m
aximo),
del potencial efectivo, podemos en consecuencia traducirlo algebr
aicamente en segunda derivada positiva (negativa) que corresponde a un perfil c
oncavo hacia arriba (abajo) en el punto donde se encuentra el extremo.
El criterio de estabilidad se escribe entonces como





2 Vef f
2 V
3l2
f
3l2
df
3l2
=
+
=
+
>0
> 4



4
2
2
4
r
r r=r0
mr r=r0
r r=r0 mr0
dr r=r0
mr0
r=r
0
df
3l2
<

dr
mr 4
0

r=r0

usando (10.55) resulta:


df
3f (r0 )
<

dr r=r0
r0

(10.57)

y teniendo en cuenta que r0 /f (r0 ) es negativo lo cual se puede verificar de (10.55), obtenemos
 
df



f
r0 df
d ln f


> 3
> 3
> 3
dr
f (r0 ) dr r=r0
d ln r r=r0
r
r=r0

la condici
on de estabilidad se puede escribir entonces de dos maneras equivalentes


r0 df
d ln f
=
> 3
f (r0 ) dr r=r0
d ln r r=r0

(10.58)

como caso particular, si la fuerza est


a gobernada por una ley de potencias de r de la forma
f = kr n ; k > 0

(10.59)

sacando logaritmo resulta


ln f
d ln f
d ln r

= ln (k) + ln r n = ln (k) + n ln r d ln f = n d ln r
= n

(10.60)

CAPITULO 10. FUERZAS CENTRALES

236

combinando (10.60) con (10.58), la condici


on de estabilidad (10.58) resulta
n > 3
N
otese que esta condici
on de estabilidad no depende del radio. Por tanto, una ley de fuerza atractiva del tipo
(10.59) que vare mas lentamente que 1/r 3 puede sostener orbitas circulares estables para todos los valores de
r0 .

10.8.

Orbitas
circulares perturbadas a primer orden

Ya hemos visto que si la orbita circular es estable, un ligero aumento en la energa conduce a una peque
na
variaci
on de r alrededor de r0 . Para u = 1/r, usaremos la identidad
 
 
1
d
1
dr d
dr
1
V
=
V (r) = f (r) = 2 f
du
u
du dr
du
u
u
Escribamos la Ec. (10.50) en la forma

 2
d u
+
u
= J (u)
d 2

J (u)

m d
V
l2 du

 
 
1
1
m
= 2 2f
u
l u
u

La condici
on de orbita circular dada por (10.55), para un radio r0 = u1
0 queda en la forma
 


1
m
1
l2
f
= u30 2 2 f
= u0
u0
m
u0
l u0

(10.61)

(10.62)

sustituyendo (10.62) en la segunda de las Ecs. (10.61), con u = u0 resulta


J (u0 ) = u0

(10.63)

y la energa debe cumplir la condici


on (10.56). Ahora bien, bajo la condici
on de estabilidad, con una energa
ligeramente superior a la dada por (10.56) obtendremos un movimiento acotado en el que para todo tiempo la
variable u solo difiere ligeramente de u0 . Utilizando (10.63), la expansi
on de Taylor de J (u) alrededor de u0 ,
es
h
i
dJ
J (u) = u0 + (u u0 )
+ O (u u0 )2
(10.64)
du0
y para u u0 , esta expansi
on se podr
a tomar a primer orden. Denotando x u u0 y reemplazando esta
expansi
on a primer orden en (10.61) resulta
 2

 2

d u
dJ
d (u u0 )
dJ
+ u = u0 + (u u0 )

+ (u u0 ) = (u u0 )

d 2
du0
d 2
du0



 2
d x
dJ
d2 x
dJ
+
x
=
x

+x 1
=0
2
2
d
du0
d
du0
la ecuaci
on se puede escribir en la forma
d2 x
+ 2x = 0
d 2

dJ
1
du0

(10.65)

es claro que 2 es una cantidad real, adicionalmente la condici


on de estabilidad para x exige que 2 sea
16
2
definido positivo . Para encontrar la relaci
on de con la interacci
on y las condiciones iniciales debemos
evaluar dJ/du0 . De la definici
on de J (u) en (10.61) resulta
 
 
 
dJ
2m
1
m d
1
2J
m d
1
= 2 3f
2 2 f
=
2 2 f
du
l u
u
l u du
u
u
l u du
u
16

Se podra pensar que una soluci


on estable con 2 negativo es posible ya que en este caso x = Ae|| + Be|| y si A = 0,
entonces x permanece acotado. No obstante podemos ver que cuando se tiene que x 0. Fsicamente, esto significa que la
energa E inicial ha disminudo al valor E0 de la energa que corresponde a la condici
on de circularidad. Pero las fuerzas centrales
son conservativas de modo que esto solo es posible si se introduce una fuerza disipativa adicional.


10.8. ORBITAS
CIRCULARES PERTURBADAS A PRIMER ORDEN
y aplicando las condiciones de circularidad (10.55, 10.63), se tiene que


dJ
2J (u0 )
m df
m
df
=
2 2
= 2 + u0 2 3
du0
u0
l u0 du0
l u0 du0
u0 df
dJ
= 2 +
du0
f0 du0
reemplazando (10.66) en la segunda de las Ecs. (10.65), 2 queda en la forma




u0 df
u0 dr df
u0 1 df
1 df
2
= 3
=3
=3+
=3+
f0 du0
f0 du dr r=r0
f0 u20 dr r=r0
f0 u0 dr r=r0


r0 df
d ln f
2 = 3 +
=3+

f0 dr
d ln r
r=r0

237

(10.66)

(10.67)

r=r0

n
otese que la condici
on de estabilidad (i.e. de positividad de 2 ) coincide con la condici
on de estabilidad dada
por la Ec. (10.58). Con 2 definida positiva y tomando un origen adecuado para , la ecuaci
on diferencial
(10.65) tendr
a como soluci
on


r0 df
d ln f
2
x u u0 = a cos ;
3+
=3+
(10.68)
f0 dr r=r0
d ln r r=r0

En resumen, hemos demostrado que para peque


nas variaciones con respecto a la condici
on de circularidad
estable, la partcula ejecuta un movimiento arm
onico simple en u ( 1/r) alrededor de u0
u = u0 + a cos

(10.69)

donde a es la amplitud del movimiento, la cual depende de la desviaci


on de la energa con respecto al valor
de esta cuando la orbita es circular, es un valor que surge de la expansi
on de Taylor de J (u) alrededor de
1
la orbita circular de radio r0 = u0 y est
a dado por la Ec. (10.67). Por otro lado, la ecuaci
on (10.69) muestra
que cuando el radio vector de la partcula ha barrido completamente el plano (i.e. ha barrido un intervalo
entre 0 y 2), u ha ejecutado oscilaciones. Si es un n
umero racional, de tal forma que = n/m con n
y m enteros, entonces despues de m revoluciones del radio vector la orbita comenzar
a a repetirse17 , es decir
18
obtenemos una
orbita cerrada a primer orden .
Para cada valor de r0 que cumpla la desigualdad (10.57) o (10.58), es posible construr una orbita circular
estable de radio r0 si el momento angular y la energa adquieren los valores prescritos por las Ecs. (10.55,
10.56). La pregunta natural es para que formas funcionales de la fuerza, las orbitas ligeramente perturbadas
con respecto a la circular son cerradas a primer orden?. Es claro que la condici
on de que sea racional es
necesaria, pero se requiere un ingrediente adicional: el valor de debe ser el mismo para todos los valores de
r0 para los cuales se pueden construr orbitas circulares estables. De no ser as, puesto que solo puede tomar
valores discretos (por ser racional), el n
umero de periodos de oscilaci
on cambiara discontnuamente con r0 , y
las orbitas no podran ser cerradas en la discontinuidad. Con 2 constante para todo el rango de r0 , podemos
sin ambig
uedad quitar la evaluaci
on en r0 de la expresi
on de la derecha en la Ec. (10.67)
2 = 3 +

r df
d ln f
=3+
f dr
d ln r

(10.70)

con lo cual resulta una ecuaci


on diferencial para f en terminos de la variable r, siempre que tengamos en cuenta
que solo es v
alida en el rango de r en donde las orbitas circulares estables son posibles. Tenemos entonces
d ln f
dF 0
= 2 3
d ln r
dr 0
17

Naturalmente, para obtener el mnimo de revoluciones necesarias para repetir la


orbita, se requiere que n y m sean primos
entre s.
18
Esta
orbita tal vez no es exactamente cerrada ya que aqu solo estamos en aproximaci
on de primer orden, en seguida veremos
un criterio para tener
orbitas exactamente cerradas.

CAPITULO 10. FUERZAS CENTRALES

238
la soluci
on para F 0 en terminos de r 0 es inmediata

F 0 = 2 3 r0 + C 0


ln f = 2 3 ln r + C 0

ahora tendremos en cuenta que C 0 es una constante que en general puede ser compleja. Definiremos entonces
C 0 ln (k) con lo cual queda
2
ln f = ln r 3 + ln (k)
i
h
2
ln f = ln kr 3

de aqu resulta

f (r) = kr

2 3

k>0

(10.71)

donde la condicion k > 0 proviene del hecho ya discutido de que la condici


on de circularidad requiere de una
fuerza atractiva como se ve en la Ec. (10.55). Todas las leyes de fuerza de la forma (10.71) con racional,
conducen a ecuaciones de orbitas que son cerradas a primer orden, es decir cuando las condiciones iniciales solo
difieren ligeramente de aquellas que conducen a una orbita circular. Aparecen dentro del espectro de fuerzas
permitidas las leyes de fuerza mas familares: ley del inverso cuadrado ( = 1) y ley de Hooke ( = 2). Tambien
aparecen por supuesto un infinito espectro de otras leyes de fuerza.

10.9.

Orbitas
circulares perturbadas a orden superior al primero y condiciones para
orbitas cerradas (teorema de Bertrand)

Ahora supongamos que las condiciones iniciales se mueven en una forma no necesariamente ligera, pero de
tal forma que la orbita sigue estando acotada. El problema se puede resolver tomando un termino adicional en
la expansi
on de Taylor y resolviendo la ecuaci
on de orbita resultante (primer termino anarm
onico) J. Bertrand
resolvi
o el problema en 1873 y encontr
o que para desviaciones a segundo orden en la circularidad, las orbitas
son cerradas para todo movimiento acotado solo si 2 = 1 o 4. Estos valores corresponden a la ley de inverso
cuadrado y la ley de Hooke respectivamente. Por supuesto, a
un es posible que a orden m
as alto estas orbitas
puedan ser abiertas. Por fortuna, dado que solo quedan dos leyes de interacci
on, estas se pueden examinar
en todo detalle y se puede demostrar que ambas conducen a orbitas cerradas de manera exacta (de hecho lo
demostraremos para la ley del inverso al cuadrado), siempre que la orbita sea acotada. Estas son entonces las
u
nicas leyes de fuerza que conducen a orbitas cerradas para cualquier orbita acotada, es decir para condiciones
iniciales arbitrarias en E y l salvo por la condici
on de que estos valores conduzcan a orbita acotada. De
aqu resulta el teorema de Bertrand
Theorem 6 Las u
nicas fuerzas centrales (atractivas) que producen o
rbitas cerradas para toda trayectoria
acotada de una partcula, son la ley del inverso cuadrado y la ley de Hooke.
Este resultado es muy notable ya que las apreciaciones astron
omicas muestran que muchos cuerpos celestes
se mueven en orbitas cerradas al menos a primer orden. Esto nos conduce a leyes de la forma (10.71). Sin
embargo, si pensamos que la orbita debe ser cerrada cuando solo interact
uan dos cuerpos y las peque
nas
desviaciones se atribuyen a la interacci
on con otros cuerpos quedamos con solo dos leyes posibles. La ley
de Hooke es descartable ya que implicara que la interacci
on aumenta con la distancia haciendo imposible
despreciar la interacci
on con muchos cuerpos. Nos queda entonces que la ley de gravitaci
on debe ser de la
forma 1/r 2 .
En el formalismo de Hamilton Jacobi vimos una forma alterna de ver el movimiento orbital cerrado: El
movimiento orbital en el plano se puede ver como la composici
on de dos movimientos oscilatorios peri
odicos
uno en r y el otro en . En el caso de la ley inverso cuadrado y de Hooke, ambos movimientos tienen el mismo
periodo y tenemos entonces una degeneraci
on que como vimos, tiene una fuerte relaci
on con la naturaleza del
potencial.
Un comentario final, el teorema de Bertrand no prohibe la existencia de orbitas cerradas para otras leyes de
fuerzas. Lo que el teorema prohibe para otras leyes de fuerzas es que toda trayectoria acotada sea cerrada, pero


ANGULO

10.10. ORBITAS
CIRCULARES PERTURBADAS USANDO VARIABLES ACCION(OPCIONAL)239
es posible que ciertas trayectorias acotadas con condiciones iniciales muy especficas nos lleven a trayectorias
cerradas. De hecho hemos demostrado que toda fuerza central atractiva puede generar orbitas circulares para
cualquier valor del radio del crculo, siempre que los valores de E y l se ajusten de una manera muy especfica.

10.10.

Orbitas
circulares perturbadas usando variables acci
on-
angulo (Opcional)

Describiremos las peque


nas oscilaciones radiales alrededor de un movimiento circular estable perturbado,
utilizando el formalismo del potencial efectivo y las variables acci
on-
angulo. Expandiendo el potencial efectivo
alrededor de alg
un valor r = r0 , tenemos
Vef f (r) = Vef f (r0 ) + (r r0 )

d2 Vef f (r0 )
dVef f (r0 ) 1
+ (r r0 )2
+ ...
dr
2
dr 2

el Hamiltoniano en coordenadas polares asociado al potencial central real V (r), est


a dado por
1
H=
2m



1 2
l2
2
pr + 2 + V (r)
p + Vef f (r)
r
2m r

una orbita circular estable existe si r0 corresponde a un mnimo local del potencial efectivo, en cuyo caso
dVef f (r0 )
dr
d2 Vef f (r0 )
dr 2

l2
dV (r0 )
=0
+
3
dr
mr0
3l2
d2 V (r0 )
+
k>0
dr 2
mr04

=
=

(10.72)

dado que las oscilaciones alrededor del movimiento circular son peque
nas, podemos definir
r = r0 +

<< r0

y el Hamiltoniano queda
d2 Vef f (r0 )
1 2
1 2
1
pr + Vef f (r0 + ) '
pr + Vef f (r0 ) + (r r0 )2
2m
2m
2
dr 2
1 2
1
H = E'
pr + Vef f (r0 ) + 2 k
2m
2
H =

(10.73)

las peque
nas oscilaciones se dan cuando la energa es apenas un poco mayor al valor del mnimo del potencial
efectivo. Podemos entonces definir el peque
no valor de energa dado por
 E Vef f (r0 )

(10.74)

y teniendo en cuenta que r = se tiene que


pr =

L
L
=
= p
r

utilizando las Ecs. (10.74, 10.75), la Ec. (10.73) queda



  
1 2 1 2
1
k
2
2
'
p + k =
p + m
2
2m
2
2m
m

(10.75)

CAPITULO 10. FUERZAS CENTRALES

240

lo cual es equivalente a redefinir el Hamiltoniano con un corrimiento constante, que claramente no afecta a la
Fsica del problema. Este es el Hamiltoniano de un oscilador arm
onico para la variable . Compar
andolo con
el Hamiltoniano (9.109), con q resulta
'


1
p2 + m2 2 2
2m

k
m

Por tanto, podemos utilizar la Ec. (9.111) para escribir


=

J
2

con lo cual la frecuencia est


a dada por (9.112)
H


1
=
=
=
=
J
J
2
2

k
m

(10.76)

y el movimiento est
a descrito por las Ecs. (9.113) con la asignaci
on q .
r
r
J
mJ
r = r0 +
sin 2w ; pr =
cos 2w
m

se deja como ejercicio al lector escribir la frecuencia de peque


nas oscilaciones radiales (10.76) en terminos de
las condiciones iniciales, y comprobar que coincide con la obtenida en las Ecs. (10.68).

10.11.

El problema de Kepler: Ley del inverso al cuadrado (atractiva)

Examinemos brevemente el problema inverso19 : dada la trayectoria, encontrar la ley de fuerzas que gobierna
la din
amica de la partcula. Vale recordar que Newton emple
o las leyes de Kepler para deducir la ley de
gravitaci
on universal, es decir abord
o el problema de manera inversa. Es l
ogico pensar que esta interacci
on sea
de naturaleza central, en virtud de la isotropa del espacio. Emplearemos las leyes de Kepler que describen el
movimiento planetario como postulados observacionales:
1. Todo planeta se mueve con una trayectoria elptica, en uno de cuyos focos se encuentra el Sol
2. El radio vector que une el Sol y el planeta recorre areas iguales en tiempos iguales
3. El cociente k entre el cubo de la distancia r del sol al planeta y el cuadrado del periodo de revoluci
on T
del planeta
r3
(10.77)
k= 2
T
es identico para todos los planetas.
Tomaremos por simplicidad una trayectoria circular (elipse con distancia focal cero) con rapidez constante.
El movimiento lunar es un buen ejemplo de esta trayectoria, la fuerza centrpeta es de la siguiente forma
F = mac = m

v2
r

(10.78)

como la velocidad tangencial constante es de la forma


v=
entonces

19

2r
T


m 4 2 r 2
4 2 mr
F =
=
rT 2
T2

Este problema inverso se conoce usualmente como problema de dispersi


on o scattering como veremos m
as adelante.

(10.79)

(10.80)

PARA LA ORBITA

10.12. SOLUCION
EN EL PROBLEMA DE KEPLER

241

Aplicando la tercera ley de Kepler Ec. (10.77) a la Ec. (10.80), resulta


F =

4 2 m r 3
4 2 km
=
r2 T 2
r2

lo cual nos lleva a una ley proporcional al inverso cuadrado de la distancia que adem
as involucra como constante
de proporcionalidad a la masa (inercial) de la partcula. Es natural adem
as asumir que esta fuerza depende de
dos constantes de acople m1 y m2 asociadas con cada cuerpo y que llamaremos masas gravitacionales, llegando
a la llamada ley de gravitaci
on universal
Gm1 m2
F =
(10.81)
r2
Donde G es una constante que se ajusta experimentalmente y que se denomina constante de gravitaci
on
universal. Por otro lado, la segunda ley de Kepler fortalece la idea de que la fuerza es de naturaleza central,
ya que vimos que esta ley se cumple para cualquier fuerza central (ver secci
on 10.2).
Newton calcul
o la relaci
on entre la aceleraci
on de la gravedad en la tierra g y la aceleraci
on centrpeta ac de
la Luna. Aplicando la ley de gravitaci
on universal (asumiendo que la masa inercial y la masa gravitacional son
identicas) podemos calcular la fuerza FR que la tierra hace sobre una masa m1 en su superficie, as como la
fuerza centrpeta Fr que la tierra hace sobre la luna.
FR =

G 6 m1 mT
=6 m1 g
R2

Fr =

G 6 mL mT
=6 mL ac
r2

siendo R el radio de la tierra y r la distancia de la tierra a la luna; mT y mL son las masas de la tierra y la
luna. De esta relaci
on se obtiene
g
r2
= 2
(10.82)
ac
R
Cavendish realizo la corroboraci
on de esta igualdad. Veamos algunos datos tpicos
R = 6,37 106 m ; r = 3,84 108 m ; T = 2,36 106 s ; g = 9,8m/s2
siendo T un periodo lunar. Aplicando estos valores a las Ecs. (10.78, 10.79) se tiene
ac =

v2
4 2 r
=
' 2,72 103 m/s2
r
T2

g
(60)2
ac

en tanto que los cocientes entre r 2 y R2 son


3,84 108

(6,37

2

106 )2

= 3634 (60)2

de modo que la igualdad (10.82) est


a sustentada por los valores experimentales. Este an
alisis le da consistencia
a la ley del inverso al cuadrado.

10.12.

Soluci
on para la
orbita en el problema de Kepler

Habiendo establecido que la atracci


on gravitacional es inversamente proporcional al cuadrado de la distancia
en el caso de trayectoria circular, tomaremos esta ley de fuerza como hip
otesis de trabajo para obtener las
posibles trayectorias para diversas condiciones iniciales y contrastar con las observaciones astron
omicas. La
fuerza y el potencial vienen dados por
k
k
f = 2 ; V =
(10.83)
r
r
como ya vimos, existen varias maneras de integrar la ecuaci
on de movimiento. La mas simple, consiste en
sustituir (10.83) en (10.48). Con lo cual se obtiene

mf u1
d2 u
mk
+u = 2 2 = 2
2
d
l u
l

CAPITULO 10. FUERZAS CENTRALES

242
usando el cambio de variable y = u

mk
l2 ,

la ecuaci
on diferencial queda
d2 y
+y =0
d 2

(10.84)

cuya soluci
on m
as general se puede escribir de la forma
y = B cos 0
u =


mk
+ B cos 0
2
l


mk
0
=
B
cos

l2

on. Escribiendo la soluci


on en funci
on de r
donde B y 0 son las constantes de integraci

1
mk 
= 2 1 + cos 0
r
l

l2
mk

(10.85)

Otra alternativa consiste en hacer las asignaciones n 2 y k k en las ecuaciones (10.53, 10.54) 20
Z
du
0
= q
(10.86)
2mE
2mku
2
+

u
l2
l2

tomaremos la integral como indefinida y a cambio 0 absorbe las constantes de integraci


on que surjan, de modo
que 0 no necesariamente coincide con el valor inicial de . Puesto que 0 absorbe a la constante 0 y a los
lmites de integraci
on en la ecuaci
on (10.54) se sigue que 0 depender
a tanto de 0 como de r0 .
La integral indefinida tiene la estructura siguiente


Z
du
1
+ 2u
p
=
arc cos
; q 2 4
(10.87)

q
+ u + u2
la integral (10.86) se resuelve a traves de (10.87) con las siguientes sustituciones
=

2mk
2mE
, = 2 ; = 1 ; q =
l2
l

2mk
l2

2 

1+

2El2
mk2

(10.88)

donde el valor de q se obtuvo de


 2 2 2 2



2mE
2mk 2
2 m k El
4
+2
q 4 =
(1) =
2
2
l
l
l4 mk2

2 
2 





2mk
2mk
2El2
2mk 2
2El2
+
q =
=
1
+
l2
l2
mk2
l2
mk2
2

2mk
l2

2

sustituyendo (10.87, 10.88) en la integral (10.86) se tiene


2mk

2u
l2
= 0 arc cos
r
= 0 arc cos





2mk 2
2El2
1
+
2
2
l
mk

l2 u
1
0
mk

= arc cos q
2
1 + 2El
mk 2
20

2mk
l2

h

2ul2
2mk

1
r

2mk
1+
l2


2

2El
mk 2

Aunque este camino es m


as largo, tiene la ventaja de que la constante queda directamente en terminos de la energa y el
momento angular

PARA LA ORBITA

10.12. SOLUCION
EN EL PROBLEMA DE KEPLER
>1
=1
<1

E>0
E=0
E<0

=0

E = mk
2l2

l 6= 0
l 6= 0
l 6= 0

l 6= 0

243

hiperbola
par
abola
elipse
circunferencia

Cuadro 10.1: Tipos de c


onicas que se obtienen con diferentes valores de la excentricidad. La segunda columna
nos da el valor de la energa para el cual se obtienen estas c
onicas. El momento angular se asume diferente de
cero.
y resolviendo para u 1/r la ecuaci
on de la trayectoria queda
r
l2 u
 l2 u

1
2El2
0
0
mk
=
cos = q

1+
cos

1
2
mk2
mk
1 + 2El
mk 2
"
#
r
r
2


l2 u
2El2
2El
mk
= 1+ 1+
cos 0
u= 2 1+ 1+
cos 0
mk
mk2
l
mk2
"
#
r

mk
2El2
1
0
= 2 1+ 1+
cos
r
l
mk2

(10.89)

se puede ver que esta ecuaci


on coincide con (10.85) excepto que aparece en (10.89) como funcion de E y l
tal como se anticip
o. La Ec. (10.89) nos permite identificar a 0 como uno de los angulos correspondientes a la
inversi
on del movimiento de la orbita, ya que si tomamos 0 = 0 vemos que esta ecuaci
on queda invariante ante
la transformaci
on especular . Esto nos indica seg
un la discusi
on de la secci
on 10.6 que = 0 corresponde
al lugar geometrico de un apside, de hecho la Ec. (10.89) nos indica que es un peri
apside, puesto que para = 0
la coordenada r adquiere su valor mnimo. Notemos que de las cuatro constantes de integraci
on solo aparecen
tres (E, l, 0 ), esto se debe a que la cuarta constante (0 o r0 ) ubica la posici
on inicial de la partcula, la cual
a aparecer
es claramente irrelevante en la ecuaci
on de la orbita21 . Sin embargo, esta cuarta constante deber
cuando se solucione el problema de r y en funci
on del tiempo. En particular, si queremos resolver la primera
integral de movimiento asociada a la conservaci
on del momento angular Ec. (10.13), tenemos que conocer el
valor inicial de i.e. 0 .

10.12.1.

Clasificaci
on de las o
rbitas seg
un los valores de E y l

Teniendo en cuenta que en coordenadas polares, la ecuaci


on general de una c
onica con foco en el origen es
de la forma


1
= C 1 + cos 0
r
siendo la excentricidad de la secci
on c
onica, se tiene por comparaci
on con (10.89) que la orbita siempre
corresponde a una secci
on c
onica con foco en el centro de fuerzas y excentricidad
r
2El2
(10.90)
= 1+
mk2
como se sabe de la teora de secciones c
onicas, el tipo de c
onica depende del valor de la excentricidad seg
un la
tabla 10.1
Los valores de la tabla 10.1 corresponden a todos los casos posibles con l 6= 0. Cuando el momento angular
es nulo la Ec. (10.89) ya no es v
alida, y recalculando se observa f
acilmente que la trayectoria consiste en una
21
No obstante, si la
orbita es abierta, esta informaci
on ser
a necesaria para encontrar la porci
on de la
orbita que la partcula
recorre, la cual depende del punto de partida. Para trayectoria cerrada el punto de partida no es relevante para trazar la trayectoria
completa.

CAPITULO 10. FUERZAS CENTRALES

244

lnea recta, que corresponde al caso en el cual la velocidad inicial es tal que la partcula apunta directamente
al centro de fuerzas. La clasificaci
on anterior coincide con la clasificaci
on general de trayectorias acotadas y no
acotadas que se hizo en la secci
on 10.4.1, basados en el an
alisis de la curva de energa potencial efectiva. N
otese
que siempre que garanticemos que l 6= 0, el tipo de c
onica solo depende de la energa, aunque la trayectoria
detallada depende de E y l. Adicionalmente, si la trayectoria es abierta y la posici
on inicial de la partcula no
esta en el infinito22 , la partcula solo recorrer
a una porci
on de la secci
on c
onica (par
abola o hiperbola).

10.12.2.

Condici
on de circularidad

Veamos como se relaciona la condici


on de circularidad con la estudiada en la secci
on 10.7. Aplicando el
teorema del virial (10.45) y teniendo en cuenta que en la orbita circular E, T y V son constantes, tenemos
1
V
V
E =T +V = V +V =
=
2
2
2
por lo tanto
E=

k
2r0

(10.91)

pero recordando la condici


on de circularidad (10.55), que equivale a la anulaci
on de la fuerza efectiva podemos
escribir
k
l2
l2
f (r0 ) = 2 = 3 r0 =
(10.92)
mk
r0
mr0
que al reemplazar en (10.91) resulta
mk2
(10.93)
2l2
esta expresi
on coincide con la que se obtendra haciendo = 0 (condici
on de circularidad) en la Ec. (10.90).
Un breve c
alculo nos muestra que esta expresi
on tambien coincide con la que se obtuvo en (10.56) para la
condici
on de circularidad con un potencial central arbitrario. Partiendo de (10.93) y usando (10.92) se tiene
que


mk
l2 mk 2
k
l2
l2
mk2 mk2
=

+
=
V
(r
)
+
E = 2 + 2 = k 2 +
0
l
2l
l
2m l2
r0 2mr02
2mr02
E=

que coincide con (10.56).

10.12.3.

Orbitas
elpticas

Para el caso de orbitas elpticas ( < 1, E < 0, l 6= 0), se puede demostrar que el eje mayor solo depende
de la energa, hecho fundamental en la teora at
omica de Bohr. De las propiedades de la elipse, la suma de las
distancias apsidales r1 + r2 es la longitud del eje mayor. Como en los puntos ri que determinan las apsides la
velocidad radial es por definici
on nula, la conservaci
on de la energa nos dice que
1
k
l2
E = V (ri ) + mv2 = +
; i = 1, 2
2
ri 2mri2
por tanto, las distancias apsidales corresponden a las races de la siguiente ecuaci
on
l2
k
+
2
ri
2mri

= 0

k
l2
ri
E
2mE

= 0

E
ri2 +
22

Si la partcula est
a inicialmente en el infinito (que en la pr
actica significa muy lejos), a
un es posible que la velocidad inicial
lo aleje a
un m
as del centro de fuerza.

10.13. MOVIMIENTO EN EL TIEMPO EN EL PROBLEMA DE KEPLER

245

en una ecuaci
on cuadr
atica, la suma de las races es el cociente entre el coeficiente del termino lineal sobre el
coeficiente del termino cuadr
atico cambiado de signo. Por lo tanto el semieje mayor viene dado por
a=

r1 + r2
k
=
2
2E

(10.94)

y el semieje mayor solo depende de la energa como se anticip


o. En el lmite de circularidad la Ec. (10.94)
coincide con (10.91). Despejando la energa en (10.94) y reemplazando en (10.90), se obtiene la excentricidad
de la elipse en funci
on del semieje mayor
r
l2
= 1
(10.95)
mka
la cual se puede despejar en la forma

l2
= a 1 2
(10.96)
mk
con lo cual la ecuaci
on de la orbita (10.85) cuando esta es elptica se puede reescribir en la forma

a 1 2
r=
(10.97)
1 + cos ( 0 )
de la Ec. (10.97) se encuentra que las dos distancias apsidales (correspondientes a 0 igual a cero y ) son
iguales a
r1 = rmn = a (1 ) ; r2 = rmax = a (1 + )
lo cual es consistente con las propiedades de la elipse.

10.13.

Movimiento en el tiempo en el problema de Kepler

La relaci
on entre las coordenadas y el tiempo es mucho m
as complicada de obtener que la ecuaci
on de la
orbita. Las Ecs. (10.24, 10.27) nos dan en principio la relaci
on entre la distancia radial y el tiempo y la posici
on
angular y el tiempo, que para el potencial (10.83) toman la forma
Z r
Z r
dr
dr
q
r 
=
(10.98)
t t0 =

2
r0
r0
2
k
l2
(E

V
)
ef
f
E
+

m
m
r
2mr 2
Z t
l
dt
= 0 +
(10.99)
2
m t0 r (t)
sin embargo, la expresi
on (10.99) tiene la desventaja de requerir la integraci
on previa de (10.98) y la inversi
on
de la relaci
on obtenida para encontrar r (t). Por esta raz
on, es m
as f
acil encontrar la relaci
on entre y el
tiempo usando la Ec. (10.13) de conservaci
on del momento angular.
mr 2

d
=l
dt

dt =

mr 2
d
l

(10.100)

combinando esta ecuaci


on con la ecuaci
on de orbita (10.85) resulta
h 2
i2
l
1
m mk
1+ cos( 0 )
ml4 d
dt =
d dt =
l
lm2 k2 [1 + cos ( 0 )]2
t t0 =

l3
mk2

d
[1 + cos ( 0 )]2

(10.101)

aunque esta integral se puede escribir en forma cerrada, la forma funcional es muy compleja y su inversi
on
para obtener las coordenadas en funci
on del tiempo es un problema colosal.

CAPITULO 10. FUERZAS CENTRALES

246

10.13.1.

Dependencia temporal en el caso parab


olico

Ilustraremos entonces un caso m


as simple reduciendo nuestra atenci
on al movimiento parab
olico ( = 1). Es
usual medir el angulo polar a partir del radio vector en el punto de mayor acercamiento conocido como periheon de orbita (10.85). Correspondientemente
lio o periapsis. Este convenio implica hacer 0 nulo en la ecuaci
el tiempo se comienza a medir a partir del paso por el periapsis. Usando la identidad
1 + cos = 2 cos2

la ecuaci
on (10.101) aplicada a una secci
on parab
olica ( = 1) con 0 = 0 nos da
t =
t =

Z
Z
l3
l3
d
d

sec4 d

2 =
2 = mk 2
2

2
4mk 0
2
0 [1 + cos ]
0 2 cos
2


Z

l3

1 + tan2
sec2 d
4mk 2 0
2
2
l3
mk2

usando el cambio de variable x = tan (/2), dx =


t =
t =

1
2

sec2



Z x

l3
l3
x3
2
1 + x dx =
x+
2mk 2 0
2mk 2
3


3
l
1

tan + tan3
2mk 2
2 3
2

(10.102)

a
un la inversi
on de esta ecuaci
on implica resolver una c
ubica para tan (/2), para luego hallar el arcotangente
respectivo. La distancia radial en ese instante se encuentra mediante la ecuaci
on orbital.

10.13.2.

Dependencia temporal para el movimiento elptico

Para el movimiento elptico la integraci


on se realiza de manera m
as conveniente mediante una variable
auxiliar conocida como anomala exc
entrica, definida por la relaci
on
r = a (1 cos )

(10.103)

al comparar con la Ec. (10.97) para la orbita, queda claro que tambien cubre el intervalo entre 0 y 2 cuando
recorre una revoluci
on completa, adem
as = 0 en el perihelio al igual que (por convenio), as mismo en
el afelio = = . A partir de las Ecs. (10.94, 10.95) podemos expresar a E y l en funci
on de a, , y k
E=

k
l2
; 2 = 1
2a
mka

l2 = mka 1 2

estos reemplazos tienen la ventaja de que a y son variables m


as geometricas y por tanto m
as observables
astron
omicamente. Reemplazando estas expresiones en la Ec. (10.98) para movimiento elptico resulta
Z r
Z r
dr
dr
r 
r
t =
=



r0
r0
mka(12 )
a(12 )
2
k
k
2k
r2

+
r

2
2
m
2a
r
2a
2
2mr
mr
r Z r
m
r dr
q
t =
(10.104)
2)
2k r0
r2
r 2a
a(1
2
on de la anomala
por convenci
on r (t = 0) = r0 es la distancia al perihelio, para la cual = 0. La introducci
excentrica (10.103)
r = a (1 cos ) ; dr = a sin d

10.13. MOVIMIENTO EN EL TIEMPO EN EL PROBLEMA DE KEPLER

247

reduce la integral (10.104) a una forma m


as simple:
t =

t =

t =

r
r
r

m
2k
m
2k

a (1 cos ) (a sin d)
q
2
2)
a (1 cos ) [a(12acos )] a(1
2

ma4
2k

a2 (1 cos ) sin d
q
2
+2 cos2 )
a (1 cos ) a (12 cos2a

a(12 )
2

(1 cos ) sin d
pap
2 (1 cos ) (1 2 cos + 2 cos2 ) (1 2 )
2

2ma4
(1 cos ) sin d
p
2ka 0
2 2 cos 1 + 2 cos 2 cos2 1 + 2
r
r
Z
Z
ma3 (1 cos ) sin d
ma3 (1 cos ) sin d
p
p
=
t =
k
k
2 2 cos2
sin2
0
0
t =

t=

ma3
k

(1 cos ) d

(10.105)

primero podemos observar que esta ecuaci


on nos permite obtener una expresi
on para el periodo del movimiento elptico, si extendemos la integral a todo el dominio de entre 0 y 2
r
m
3/2
= 2a
(10.106)
k
Ahora escribamos (10.105) introduciendo la frecuencia de revoluci
on en la forma
r
k
2
=
=

ma3
donde hemos usado (10.106). La integral de (10.105) se calcula f
acilmente y se obtiene
t = sin

(t = 0) = 0

(10.107)

esta relaci
on es conocida como ecuaci
on de Kepler. La cantidad t barre el dominio entre 0 y 2 junto con y
, en el curso de una revoluci
on completa, raz
on por la cual tambien se le llama una anomala, m
as exactamente
anomala media.
Para hallar la posici
on en la orbita en un tiempo t, se debera en primer lugar invertir la ecuaci
on de
Kepler (10.107) de tal manera que se obtiene la anomala excentrica en funci
on del tiempo. Esta u
ltima se
reemplaza entonces en (10.103) que es la ecuaci
on que define la anomala excentrica, con ello obtenemos r (t).
Por otro lado, el angulo polar se puede expresar en funci
on de por comparaci
on de (10.103) con la ecuaci
on
de la orbita elptica (10.97), donde nuevamente por convenci
on tomaremos 0 = 0, que equivale a que = 0 en
el perihelio y por tanto en t = 0.

a 1 2
1 2
= a (1 cos ) 1 + cos =
1 + cos
1 cos
2
2
1
1
1 (1 cos )
( + cos )
cos =
=
=
(1 cos )
(1 cos )
(1 cos )
de modo que esta ecuaci
on se puede escribir como
cos =

cos
1 cos

(10.108)

CAPITULO 10. FUERZAS CENTRALES

248
tenemos a partir de (10.108) que

cos
1 cos cos +
(1 cos ) + (1 cos )
=
=
1 cos
1 cos
1 cos
(1 cos ) (1 + )
1 cos

1 cos = 1
1 cos =
similarmente

cos
1 cos + cos
(1 + cos ) (1 + cos )
=
=
1 cos
1 cos
1 cos
(1 + cos ) (1 )
1 cos

1 + cos = 1 +
1 + cos =
por tanto

y usando la identidad

(1 cos ) (1 + )
1 cos
=
1 + cos
(1 + cos ) (1 )
1 cos

= tan2
1 + cos
2

tenemos que
tan2

(1 + )

=
tan2
2
(1 )
2

teniendo en cuenta que tan /2, tiene el mismo signo que tan /2 en todo el rango de ambos angulos, nos
queda finalmente
r

1+

tan =
tan
(10.109)
2
1
2

la ecuaci
on (10.109) nos da como funci
on de . Para encontrar en funci
on del tiempo, es necesario invertir
la ecuaci
on de Kepler (10.107). La soluci
on de esta ecuaci
on ha sido tema de amplio estudio (ver Ref. [1]
segunda edici
on).

10.13.3.

Tercera ley de Kepler

Elevando al cuadrado la Ec. (10.106), obtenemos


2 =

4 2 m 3
a
k

(10.110)

este resultado tambien se puede obtener a traves de las propiedades de la elipse. Ya hemos visto que la
conservaci
on del momento angular conduce a que la velocidad aerolar es constante y viene dada por la Ec.
(10.15)
dA
1
l
= r 2 =
dt
2
2m
si integramos sobre un periodo completo, se obtiene el area total, la cual para una elipse viene dada por ab,
siendo b el semieje menor.
Z
dA
l
dt = AT =
= ab
(10.111)
2m
0 dt
el semieje menor viene dado por

p
b = a 1 2

y combinando (10.112) con la relaci


on (10.95) nos permite escribir el semieje menor en la forma
r
a
b=l
mk

(10.112)

(10.113)

10.14. VECTOR DE LAPLACE-RUNGE-LENZ

249

y sustituyendo (10.113) en (10.111) resulta


l
= al
2m

a
mk

= 2a

3/2

m
k

en consistencia con (10.110). Estas expresiones coinciden con la tercera ley de Kepler, la cual se puede enunciar
de la siguiente manera: los cuadrados de los periodos de los distintos planetas son proporcionales a los cubos
de sus ejes (o semi-ejes) mayores.
Kepler enunci
o adem
as que la constante de proporcionalidad es la misma para todos los planetas. No
obstante, esta u
ltima afirmaci
on es solo aproximadamente cierta. Para verlo, recordemos que el movimiento
de un planeta alrededor del sol, es un problema de dos cuerpos y la masa que aparece aqu equivale a la masa
reducida del sistema
m1 m2
=
m1 + m2
por convenci
on tomaremos a m1 como la masa de un planeta y a m2 como la masa del sol. La fuerza gravitatoria
de atracci
on se escribe
Gm1 m2
k
f =
= 2 ; k Gm1 m2
r2
r
y la Ec. (10.110) queda de la forma

2 =

2 m m
4 2 3 4 m11+m22 3
a =
a
k
Gm1 m2
4 2 a3
4 2 a3

=
G (m1 + m2 )
Gm2

(10.114)

n
otese que la constante de proporcionalidad es diferente para cada planeta, pero si despreciamos la masa
m1 del planeta con respecto a la masa m2 del sol, la constante ser
a la misma para todos los planetas. En las
orbitas del atomo de Bohr esta constante de proporcionalidad es la misma, ya que todos los electrones poseen
la misma masa y carga (es decir igual valor de la masa reducida y de k).

10.14.

Vector de Laplace-Runge-Lenz

A continuacion veremos que en el problema de Kepler existe un vector conservado adem


as del momento
angular. La segunda ley de Newton para fuerzas centrales se puede escribir como
p = f (r) ur = f (r)

r
r

(10.115)

teniendo en cuenta (10.115), desarrollemos la cantidad


p L =
p L =

ri
f (r)
mf (r)
(r p) =
r (r mr) =
[r (r r )]
r
r
r

mf (r) 
r (r r ) r 2 r
r
f (r)

donde hemos usado la identidad

a (b c) = (a c) b (a b) c
podemos simplificar la ecuaci
on (10.116) teniendo en cuenta la identidad
r r =

1 d
1 d
(r r) =
(rr) = r r
2 dt
2 dt

o visto de otra forma


r r = rur r = rur (vr ur + v u ) = rvr = r r

(10.116)

CAPITULO 10. FUERZAS CENTRALES

250
de modo que




mf (r) 
r
2
2 rr
p L =

r (r r)
r r = mf (r) [rr r r ] = mf (r) r
r
r2
r

Teniendo en cuenta esta identidad y el hecho de que L es constante, se tiene que




r
rr
d r
d
(p L) = p L = mf (r) r 2
2 = mf (r) r 2
dt
r r
dt r
d
dur
(p L) = mf (r) r 2
dt
dt

(10.117)

hasta aqu podemos llegar para una expresi


on general de la fuerza central. Ahora tomando una fuerza atractiva
proporcional al inverso al cuadrado de la distancia f (r) = k/r 2 , la integraci
on resulta inmediata, ya que la
Ec. (10.117) se convierte en
d
k dur
d
(p L) = m 2 r 2
=
(mkur )
dt
r
dt
dt

d
(p L mkur ) = 0
dt

que nos dice que en el problema de Kepler hay un vector conservado A definido por
A p L mkur

(10.118)

on de A nos muestra que


conocido como vector de Laplace-Runge-Lenz (L-R-L). Dado que L = luz , la definici
AL=0

(10.119)

esta ortogonalidad implica que A es un vector fijo que yace en el plano de movimiento. Si llamamos el angulo
que hace r con el vector fijo A, el producto escalar de estos dos vectores ser
a
A r = Ar cos = (p L) r mkr

(10.120)

permutando terminos en el producto mixto


r (p L) = L (r p) = l2
con lo que la Ec. (10.120) queda en la forma
Ar cos = l2 mkr
o alternativamente

(A cos + mk) r = l2



1
mk
A
= 2 1+
cos
r
l
mk

(10.121)

vemos entonces que el vector de L-R-L proporciona otra manera de llegar a la ecuaci
on de la orbita en el
problema de Kepler. Comparando (10.121) con la ecuaci
on de la orbita en la forma (10.85), se ve que el
m
odulo de A viene dado por
A = mk
(10.122)
de la Ec. (10.121) es claro que = 0 corresponde a la direcci
on del peri
apside r ( = 0) = rmn rm .
Recordando adem
as que por definici
on es el angulo entre A y r (seg
un la Ec. 10.120), vemos que = 0
indica que A es paralelo a rm . Por tanto, A tiene la direcci
on del radio vector que corresponde al periapsis o
perihelio de la orbita.
Hemos identificado en consecuencia dos vectores y un escalar que se conservan (L, A, E) para un total
de siete cantidades conservadas. Por otro lado, el sistema requiere de seis constantes de movimiento que
corresponden por ejemplo a las tres componentes de la posici
on inicial y a las tres componentes de la velocidad
inicial de la partcula. N
otese por otro lado, que todas las constantes que aparecen en el conjunto (L, A, E) son
funciones algebraicas de r y p que describen la orbita en su conjunto (orientaci
on en el espacio, excentricidad

DE LAS ORBITAS

10.15. PARAMETRIZACION
KEPLERIANAS EN EL ESPACIO

251

etc.), ninguna de las siete cantidades se refiere a la localizaci


on de la partcula en el instante inicial. Como
una de las constantes de movimiento debe referirse a esta informaci
on, por ejemplo en forma del tiempo de
paso T de la partcula por el perihelio, solo podr
a haber cinco cantidades de movimiento independientes en
el conjunto (L, A, E) que describan el tama
no, forma y orientaci
on de la orbita. Es necesario entonces que
existan dos relaciones entre las cantidades L, A y E. La primera viene dada por la relaci
on de ortogonalidad
entre L y A, Ec. (10.119). La otra se deduce de la Ec. (10.122) cuando se escribe la excentricidad en terminos
de E y l, Ec. (10.90)
r
2El2
A = mk 1 +
A2 = m2 k2 + 2mEl2
(10.123)
mk2
confirmando que solo hay cinco cantidades independientes entre las siete descritas por el conjunto (L, A, E).
Dado que el momento angular y la energa proveen cuatro cantidades independientes, el vector de L-R-L
nos da una m
as. Es entonces natural preguntarse si para una fuerza central arbitraria existe una cantidad
conservada an
aloga al vector de L-R-L que junto con L y E nos sirvan para definir la orbita. Parece ser que
s se pueden construr cantidades de este tipo pero en general no son funciones muy simples del movimiento
(D. M. Fradkin, Progress of Theoretical Physics 37, 798, mayo 1967). Esto se debe a que las constantes de
movimiento relacionadas con la orbita definen la forma funcional r (), pero hemos visto que en general las
fuerzas centrales conducen a orbitas no cerradas, como se ve en el teorema de Bertrand. Es una caracterstica
general de las orbitas no cerradas el hecho de que la curva llegar
a a pasar por un punto (r, ) arbitrario que
este entre las cotas de los puntos de retorno de r. Podemos verlo heursticamente teniendo en cuenta que si la
orbita no es cerrada, al variar a lo largo de todo un ciclo la partcula no deber
a recorrer de nuevo sus pasos
sobre ninguna orbita anterior. En consecuencia la orbita es tal que r es funci
on multiforme de (m
odulo 2),
en realidad es una funci
on infinitiforme de . En consecuencia, la cantidad conservada adicional a L y a E que
define la orbita, deber
a contener una funci
on infinitiforme del movimiento de la partcula. Solo en el caso de
orbitas cerradas o m
as generalmente cuando el movimiento sea degenerado, como en el problema de Kepler,
se puede esperar que la cantidad conservada adicional sea una funci
on sencilla de r y p tal como el vector de
L-R-L.
Es interesante ver el aporte geometrico de cada constante de movimiento, dos grados de libertad de L
determinan el plano de movimiento, los valores de E y l determinan el tama
no y forma de la elipse23 , finalmente
el vector de L-R-L determina la orientaci
on de la elipse en el plano de movimiento. N
otese que una elipse solo
requiere un par
ametro angular para ser orientada dentro de un plano, lo cual coincide con el hecho de que el
vector L-R-L solo contribuye con un par
ametro24 .
A la luz del teorema de Bertrand, es de esperarse que en el caso de una ley de fuerza central tipo Hooke,
encontremos una cantidad conservada semejante al vector de L-R-L, puesto que en este caso las orbitas tambien
son degeneradas. Tal cantidad existe pero la manera m
as natural de definirla es con un tensor de segundo rango.
De esta forma la existencia de una constante de movimiento adicional a E, L y relacionada con la orbita que
sea funci
on algebraica simple del movimiento, es suficiente para indicar que el movimiento es degenerado y
que las orbitas acotadas son cerradas.

10.15.

Parametrizaci
on de las
orbitas keplerianas en el espacio

Aunque matem
aticamente es posible determinar la orbita en el espacio usando cantidades como E, L y
A. Es m
as conveniente parametrizar la orbita con cantidades m
as geometricas. Hemos visto que en el espacio
tridimensional que es un problema de tres grados de libertad, se requieren seis condiciones iniciales (por ejemplo
23

El tama
no y forma de la elipse se determinan geometricamente con la excentricidad y el semi-eje mayor a. Las Ecs. (10.90,
10.94) nos dicen que E y l nos determinan las cantidades a y .
24
Estrictamente un plano requiere para su determinaci
on un vector normal a el y un punto por donde pasa, igualmente la
ubicaci
on de la elipse dentro del plano requiere adem
as de su forma, tama
no y orientaci
on, conocer dos puntos por donde pasa o un
punto por donde pasa con su velocidad. Aqu son indispensables la posici
on y velocidad inicial. N
otese sin embargo, que cambiar
la posici
on inicial con las mismas cinco constantes de movimiento, implica que la elipse sufre una traslaci
on paralela con lo cual es
obvio que las caractersticas del movimiento son identicas. No obstante, el an
alisis anterior muestra que la determinaci
on completa
de la posici
on de la trayectoria en el espacio requiere de un grado de libertad adicional asociado a la posici
on inicial.

252

CAPITULO 10. FUERZAS CENTRALES

Figura 10.10: Parametrizaci


on de la o
rbita elptica en el espacio para el problema de Kepler.
qi , qi para las tres coordenadas generalizadas), para resolver completamente la din
amica. Ya hemos observado
que para el problema de fuerzas centrales es m
as conveniente tomar las seis constantes de modo que cinco
de ellas sean funciones de las coordenadas y momentos que describen la orbita en el espacio y solo la u
ltima
se refiere a la posici
on de la partcula en la orbita en un instante dado (ver secci
on 10.14). Para el caso de
la orbita elptica, las cinco constantes que determinan la orbita se pueden tomar de la siguiente forma: dos
constantes tpicamente angulares determinan la orientaci
on del plano de movimiento, un par
ametro para la
escala de la elipse (por ejemplo el semieje mayor), otro para la forma de la elipse (digamos la excentricidad
o el eje menor), y finalmente un par
ametro que especifique la orientaci
on de la elipse dentro del plano de la
orbita.
Veamos de forma especfica la manera de determinar la orbita con cinco par
ametros de esta naturaleza y
un sexto par
ametro que me introduce la dependencia temporal. La Fig. 10.10, muestra un sistema xyz donde
el origen se eligi
o en el centro de fuerzas, de modo que el plano de movimiento pasa por dicho origen. En el
proceso de determinaci
on de la orbita seguiremos los siguientes pasos: (a) determinaci
on del plano de la orbita,
(b) determinaci
on de la escala y forma de la elipse, (c) determinaci
on de la orientaci
on de la elipse en el plano
de movimiento y el sentido en que la partcula recorre la elipse. Estos pasos nos determinan completamente la
orbita, de modo que para determinar la din
amica completa solo se necesita un paso adicional (d) determinaci
on
de la dependencia de la posici
on de la partcula en la orbita con el par
ametro tiempo.
Para realizar el paso (a), observemos que el vector unitario n especifica el plano de movimiento, podramos
en consecuencia pensar en utilizar los angulos que definen a este vector unitario como los par
ametros que
definen la orientaci
on de este plano. Resulta no obstante, m
as pr
actico definir la direcci
on de este plano en la
forma siguiente: La intersecci
on del plano xy con el plano orbital se llama lnea de nodos. Si determinamos
la direcci
on de la lnea de nodos, lo que nos falta para determinar el plano orbital es el angulo diedro entre el
plano xy y el plano de movimiento. Para determinar la direcci
on de la lnea de nodos, notemos que en dicha
lnea hay dos puntos que corresponden a la intersecci
on de la orbita elptica con el plano xy. El punto en el
cual la partcula pasa del hemisferio inferior o hemisferio sur (z < 0) al hemisferio superior o hemisferio norte
(z > 0) se denomina nodo ascendente. La parte punteada de la orbita en la Fig. 10.10 corresponde a la
porci
on que est
a en el hemisferio sur. La recta ON es un segmento de la lnea de nodos que va del origen al
nodo ascendente. La direcci
on de ON en el plano xy (y por tanto la direcci
on de la lnea de nodos) puede

ANGULO

10.16. PROBLEMA DE KEPLER EN VARIABLES ACCIONREVISADO (OPCIONAL)

253

determinarse con el angulo que este segmento hace con el eje x conocido como longitud del nodo ascendente
y denotado por . Una vez determinada la direcci
on de la lnea nodal a traves de , vemos f
acilmente que el
angulo diedro entre el plano de movimiento y el plano xy corresponde justamente a i i.e. el angulo entre n y
el eje z que usualmente se denomina inclinaci
on de la
orbita.
El paso (b) se realiza de manera inmediata si conocemos dos de los siguientes tres par
ametros: semieje menor, semieje mayor y excentricidad. Usualmente se toman los dos u
ltimos, de modo que tpicamente obtenemos
la escala de la elipse con el semieje mayor y la forma de esta con la excentricidad.
Ahora para el paso (c) determinamos la orientaci
on de la elipse en el plano de movimiento. Es natural
tomar como referente la orientaci
on del peri
apside, la cual se puede obtener a traves del angulo N OC siendo
C el punto de la orbita que corresponde al peri
apside, este angulo se denota por y se denomina argumento
del perihelio (incluso para orbitas no relacionadas con el sol). Este es el angulo entre la lnea nodal (con su
sentido determinado por el nodo ascendente), y la lnea del peri
apside. N
otese que la determinaci
on del nodo
ascendente ya nos determina el sentido en el cual la partcula recorre la elipse.
Finalmente, para el paso (d) de determinar la dependencia de la posici
on de la partcula con el par
ametro
tiempo, podemos determinar por ejemplo la posici
on angular inicial de la partcula, digamos con respecto al
peri
apside. Sin embargo, un par
ametro m
as utilizado es el tiempo T para el cual la partcula pasa por el
peri
apside. Es decir el tiempo que le toma a la partcula en ir desde su posici
on inicial en t = 0 hasta el
peri
apside.
En sntesis, la din
amica completa de movimiento se determina con los siguientes par
ametros
i , , a, , , T

(10.124)

los dos primeros par


ametros definen la orientaci
on del plano por medio de la orientaci
on de la lnea de nodos
(), y el angulo diedro i entre el plano orbital y el plano xy. El semieje mayor a define la escala de la
elipse, y la excentricidad define la forma de esta. El angulo determina la direcci
on de la elipse en el plano
de movimiento tomando como referente la lnea del peri
apside. El sentido del movimiento lo determina la
localizaci
on del nodo ascendente (que a su vez se usa para definir ). Finalmente, el par
ametro T define la
dependencia de la posici
on de la partcula en la orbita en funci
on del tiempo.

10.16.

Problema de Kepler en variables acci


on-
angulo revisado (opcional)

En la secci
on 9.12 vimos la reducci
on a cuadraturas del problema de Kepler con el formalismo de variables
acci
on-
angulo, comenzando con un problema tridimensional en coordenadas esfericas. Para entonces solo nos
interesaba indicar la soluci
on formal. En esta secci
on nos ocuparemos de mostrar algunos detalles adicionales
que se pueden observar para el problema de Kepler en variables acci
on-
angulo, aprovechando adem
as el conocimiento adicional que hemos obtenido en este captulo. En particular usaremos desde el principio el hecho
de que el movimiento corresponde a una orbita bidimensional cerrada, y que la frecuencia es completamente
degenerada.
En primer lugar, cuando utilizamos coordenadas esfericas o polares planas como coordenadas generalizadas,
la transformaci
on de coordenadas cartesianas a las generalizadas no depende explcitamente del tiempo, por
consiguiente la energa cinetica en estas coordenadas solo depende cuadr
aticamente de qi (ver secci
on 2.3.1)
i.e. T = T2 . Por otro lado, para una partcula sometida a una fuerza central, el Lagrangiano y el Hamitoniano
en coordenadas esfericas o en coordenadas polares planas poseen las siguientes propiedades estructurales
L

T V = L2 + L0 ; L2 = T , L0 = V
pi qi L = T + V

pi qi = 2T = 2L2

pi qi (T V ) = T + V

por tanto, la energa cinetica se puede expresar en coordenadas esfericas (r, , ) o en coordenadas polares

CAPITULO 10. FUERZAS CENTRALES

254

planas (r, ), si tenemos en cuenta la naturaleza bidimensional del movimiento25


2T = pr r + p + p = pr r + p
con lo cual se obtiene

(10.125)

p + p = p p d = p d p d

as que p = l es el m
odulo del
esta expresi
on nos permite calcular la integral de J , teniendo en cuenta adem
momento angular, y que p es constante ya que es cclica. La definici
on de J queda
I
I
I
I
I
J p d = p d p d = l d p d
y dado que las frecuencias de y son iguales, y varian en 2 cuando realiza un ciclo completo de
libraci
on, de modo que las integrales se simplifican en la forma
J = 2 (l p ) = 2 ( )

(10.126)

donde hemos tenido en cuenta que coincide con el momento conjugado a , en tanto que corresponde
al m
odulo del momento angular, seg
un las Ecs. (9.76, 9.79)26 . La Ec. (10.126) concuerda con la Ec. (9.164).
La variable J es inmediata dado el car
acter cclico de
J = 2 = 2p

10.16.1.

(10.127)

Determinaci
on del Hamiltoniano en t
erminos de variables de acci
on

Es posible extraer informaci


on de manera m
as directa con las variables acci
on-
angulo, utilizando la completa
degeneraci
on entre las frecuencias en r, y . Dicha degeneraci
on nos permite utilizar los resultados de la
secci
on 9.12.1, en la cual obtenemos la transformaci
on can
onica

(w , w , wr , J , J , Jr ) w10 , w20 , w30 , J10 , J20 , J30

la cual es independiente de la forma explcita de las variables acci


on-
angulo originales. La completa degeneraci
on
de las frecuencias de r, , implica que el Hamiltoniano es funci
on de un solo Ji0 como se ve en las Ecs. (9.179,
9.180), aqu omitiremos la notaci
on primada de estas ecuaciones. La dependencia de H con este J u
nico se
puede obtener de (10.125). Para verlo, aplicamos el teorema del virial al problema de Kepler Ec. (10.45)
V = 2T

(10.128)

H = E = T + V = T

(10.129)

de modo que el Hamiltoniano se escribe como

integrando la Ec. (10.125) en el tiempo sobre un periodo (degenerado y denotado por 3 ) se tiene que
Z
I
I
I
3 3
2
T dt =
pr r dt + p dt + p dt
3 0
I
I
I
23 T =
pr dr + p d + p d
utilizando la definici
on de Ji y la Ec. (9.179), obtenemos
2T
= Jr + J + J = J3
v3

(10.130)

25
N
otese que en tanto el movimiento este confinado a un plano y el origen pase por dicho plano, la coordenada r de distancia al
origen es igual en coordenadas esfericas, que en las coordenadas polares asociadas a dicho plano.
26
Recordemos que y surgen como constantes de integraci
on (ver Sec. 9.6.2, P
ag. 185).

ANGULO

10.16. PROBLEMA DE KEPLER EN VARIABLES ACCIONREVISADO (OPCIONAL)

255

donde v3 es la frecuencia degenerada del movimiento. Combinando las Ecs. (10.129, 10.130) y teniendo en
cuenta (9.126) resulta
dH
2
1 dH
2H = J3 v3 = J3
=
dJ3
J3
H dJ3
esta ecuaci
on diferencial tiene soluci
on inmediata
H=

D
J32

(10.131)

donde D es una constante que no puede contener ning


un J y por tanto solo depende de m y k. Podemos
calcular D usando una trayectoria circular de radio r0 para la cual Jr = 0 (ya que pr = mr = 0), y por tanto
J3 = Jr + J + J = J + J = 2 (l ) + 2
J3 = 2l

(10.132)

el teorema del virial Ec. (10.128) nos dice que


H =T +V =

V
V
+V =
2
2

y dado que en el movimiento circular el potencial es constante, tenemos


H=E=

k
2r0

(10.133)

Para potenciales keplerianos la condici


on de circularidad descrita por la Ec. (10.55) se puede escribir en la
forma
l2
J32
k
=
=
(10.134)
r02
mr03
4 2 mr03
donde hemos tenido en cuenta la Ec. (10.132). Despejando r0 en esta ecuaci
on tenemos
r0 =

J32
4 2 mk

(10.135)

sustituyendo (10.135) en (10.133) obtenemos H en funci


on de J3
k
k
H =
=
2r0
2
H = E=

4 2 mk
J32

2 2 mk2
J32


(10.136)

aunque esta relaci


on la hemos encontrado para orbitas circulares, la Ec. (10.131) nos dice que tambien debe
ser v
alida para cualquier orbita cerrada kepleriana, ya que el Hamiltoniano es una cantidad din
amica (no
cinem
atica), y por tanto es independiente de las condiciones iniciales. Esta relaci
on coincide adem
as con (9.180).
Vemos que hemos evaluado H (J) sin calcular las integrales circuitales, usando la degeneraci
on completa de las
frecuencias de movimiento. Esto significa una simplificacion importante, ya que la realizaci
on de las integrales
circuitales es considerablemente extensa como vimos en la secci
on 9.12.

10.16.2.

Relaci
on entre variables acci
on-
angulo y variables orbitales

El tratamiento del problema de Kepler en variables acci


on-
angulo para degeneraci
on completa, nos permitir
a escribir las cinco constantes que determinan la orbita en una parametrizaci
on diferente a la establecida
en la secci
on 10.15, Ec. (10.124). Para nuestro caso, tres constantes est
an asociadas a las variables de acci
on

CAPITULO 10. FUERZAS CENTRALES

256

J1 , J2 , J3 , en tanto que las otras dos constantes estar


an asociadas a w1 y w2 ya que sus frecuencias correspondientes son nulas27 . En consecuencia, debe ser posible relacionar las cinco primeras constantes en (10.124) con
las cinco constantes J1 , J2 , J3 , w1 , w2 generadas por las variables acci
on-
angulo (la variable temporal se deja
intacta). Combinando las Ecs. (9.179, 10.126, 10.127) se observa que
J2 = J + J = 2 ( ) + 2
J2 = 2 2l

(10.137)

y usando la Ec. (9.159) se tiene que

2
J
=
=

2
J2
J1
J2

cos i =
cos i =

(10.138)

donde hemos tenido en cuenta las Ecs. (9.179, 10.137). Ahora bien, puesto que el semieje mayor a solo es
funci
on de la energa seg
un (10.94), la Ec. (10.136) nos indica que a solo es funci
on de J3
a=

k
J2
= 23
2E
4 mk

(10.139)

la ecuaci
on (10.95) para la excentricidad se puede escribir en funci
on de J2 y J3 usando (10.137) y (10.139)
s
r
r
 2

l2
J22
J22
4 mk
=
1
= 1 2
= 1 2
mka
4 mka
4 mk
J32
s
 2
J2
=
1
(10.140)
J3
Las Ecs. (10.138, 10.139, 10.140) conectan las variables orbitales (i , a, ) con las variables de acci
on
(J1 , J2 , J3 ).
Falta la identificaci
on de w1 y w2 con los elementos cl
asicos de orbita (10.124). Es claro que w1 y w2 deben
contener a y las cuales no est
an contenidas en los J 0 s. Veremos que para una elecci
on adecuada de las
constantes de integraci
on aditivas w1 y w2 ser
an proporcionales a y .
Veamos el caso de w1 , la ecuaci
on (9.152) define a w1 en terminos de la funci
on generatriz W
w1 =

W
J1

podemos utilizar la Ec. (9.16) para escribir


Z
Z
Z
W = p d + p d + pr dr

(10.141)

(10.142)

debemos recordar que en (9.16) las integrales eran indefinidas. Para poder usar (10.141), debemos escribir W
en terminos de (J1 , J2 , J3 ). De acuerdo con (10.142), esto equivale a encontrar p , p , pr en terminos de los Ji .
La Ec. (9.166), P
ag. 210 nos da una expresi
on para pr
s
W
2mk (J + J )2
pr =
= 2mE +

(10.143)
r
r
4 2 r 2
podemos obtener pr en funci
on de los Ji , sustituyendo (10.136, 9.179) en (10.143)
s
4 2 m2 k2 2mk
J22
pr (J1 , J2 , J3 ) =
+

r
4 2 r 2
J32
27

(10.144)

Esto se puede ver derivando temporalmente las ecuaciones (9.178), y teniendo en cuenta la degeneraci
on en las frecuencias de
r, , .

ANGULO

10.16. PROBLEMA DE KEPLER EN VARIABLES ACCIONREVISADO (OPCIONAL)

257

por tanto pr es independiente de J1 de manera que


W

=
w1 =
J1
J1

p d +
J1

p d

(10.145)

Usando (10.127) y (9.179) se tiene


J1
2
finalmente, el momento p se puede obtener de la Ec. (9.71) P
ag. 185


2
2
W 2
2
2
2
+
=

p
=

sin2
sin2
p = =

(10.146)

(10.147)

para obtener p en terminos de los Ji , sustitumos las Ecs. (10.137, 10.146) en (10.147)
s
s 
 2
2
J2 2
1
J1
2
p =
=

2
2
2
sin
sin 2
q
1
p =
J22 J12 csc2
2

(10.148)

para relacionar w1 con el nodo ascendente debe tomarse el signo negativo de la raz cuadrada, ya que cuando
la partcula pasa por el nodo ascendente, la variable est
a disminuyendo como se aprecia en la Fig. 10.10.

En consecuencia, < 0 al pasar por el nodo ascendente y por tanto p = mr 2 < 0. Observese que cuando
calculamos J no tuvimos que preocuparnos por la elecci
on del signo, ya que al efectuar un ciclo completo los
dos signos aparecen cada uno en un semiciclo. La variable angular w1 est
a dada por la Ec. (10.145)

 
 q
Z
Z
Z
Z
p
p

J1
1
2
2
2
d +
d =
d
J2 J1 csc d
w1 =
J1
J1
J1 2
J1 2
donde hemos usado las Ecs. (10.146, 10.148). Recordando de nuevo que estas integrales son indefinidas, se
obtiene
Z
Z

J1
d
1 J1

d
p
r
w1 =
+
+
=
 2
2
2
2
2
2 2
2
2
J
sin J2 J1 csc
2
sin2 1 JJ12 csc2
Z

cos i
d

w1 =
+
2
2
2
sin 1 cos2 i csc2
donde hemos usado (10.138), tenemos entonces
Z
Z
d
cos i

2w1 = + cos i
=+
sin i
sin2 1 cos2 i csc2
Z
csc2 d
= + cot i q
2
2
1
cossini2csc
sin2

sin2
sin i

d
1 cos2 i csc2

desarrollando el radical tenemos

1
cos2 i csc2

2
sin i
sin2 i

1 cos2 i csc2
sin2 i + cos2 i cos2 i csc2
=
2
sin i
sin2 i

cos2 i 1 csc2
= 1+
= 1 cot2 i cot2
sin2 i
=

con lo cual resulta


2w1 = +

cot i csc2 d
p
1 cot2 i cot2

CAPITULO 10. FUERZAS CENTRALES

258
realizamos el cambio de variable
sin u = cot i cot
con lo cual obtenemos
2w1 =
resultando finalmente

;
Z

cos u du = cot i csc2 d


cos u du
p
=
1 sin2 u

(10.149)

du

2w1 = u

(10.150)

La ecuaci
on (10.149), nos da la relaci
on entre u y el angulo . Es posible encontrar la interpretaci
on de

Figura 10.11: Variables angulares para el posicionamiento de la o


rbita que aparecen en el problema de Kepler,
cuando se usa el formalismo de variables acci
on a
ngulo.
u aplicando trigonometra esferica al tri
angulo esferico definido por la lnea de nodos, el radio vector y la
proyecci
on del radio vector sobre el plano xy. Resulta m
as simple sin embargo, realizar algunas manipulaciones
con la trigonometra plana. En la Fig. 10.11 la recta que contiene al segmento OA es la misma recta que contiene
al segmento ON de la Fig. 10.10, y por tanto define la lnea de nodos, OR es colineal con el radio vector de
posici
on en un instante dado y OP es paralelo a la proyecci
on del radio vector sobre el plano xy. Definiremos a
como el angulo azimutal i.e. entre el eje x y la proyecci
on OP . Vamos a demostrar que u es el angulo entre
la proyecci
on del radio vector y la lnea de nodos i.e. entre OP y OA. Para ello imaginemos un plano normal
al plano xy y a la lnea de nodos y que corte al radio vector a una distancia del origen O igual a la unidad.
Este plano corta a las rectas OA, OR y OP en los puntos A, B y C respectivamente. Los puntos A, B y C
junto con el origen O, definen cuatro tri
angulos rect
angulos OAC, OCB, OAB y ACB donde el vertice en
angulo recto est
a definido por la letra de la mitad28 . De los tri
angulos OCB y ACB vemos que
BC
AC
= BC ; cot i =
OB
BC
AC = cos cot i

cos =

(10.151)

28
Aunque los segmentos ON y OA de las figuras 10.10, 10.11 son paralelos, vale decir que el punto N (definido por el nodo
ascendente), es en general diferente al punto A (definido por la intersecci
on de una recta con un plano), de modo que la longitud
de estos segmentos es en general distinta.

10.17. EJERCICIOS

259

donde hemos tenido en cuenta que OB tiene longitud unidad por construcci
on. Por otro lado, los tri
angulos
OCB y OAC nos dicen que
OC
AC
AC
= OC ; sin u =
=
OB
OC
sin
AC = sin sin u

sin =

(10.152)

igualando la ecuaciones (10.151, 10.152), se obtiene


sin u = cot i cot
que coincide con la Ec. (10.149) con lo cual vemos que u en dicha ecuaci
on es el angulo indicado en la Fig.
10.11. Es claro tambien de dicha figura y de la definici
on de en la Fig. 10.10, que u = de lo cual se
obtiene
2w1 =
(10.153)
un procedimiento similar se puede realizar para encontrar la interpretaci
on fsica de w2 . De las integrales que
alculo de
aparecen en (10.142), las correspondientes a y r contienen a J2 y por tanto intervienen en el c
w2 . A partir de w2 = W/J2 se puede calcular la integral asociada a con una sustituci
on trigonometrica
as
similar a la utilizada para calcular w1 . La integral asociada a r se puede calcular de varias formas, la m
directa es usando la ecuaci
on de la orbita que da r en terminos del angulo polar en el plano orbital. Eligiendo
adecuadamente el lmite inferior de integraci
on que es arbitrario se puede encontrar que 2w2 est
a dado por la
diferencia entre dos angulos que est
an en el plano de la orbita, uno de ellos es el angulo entre el radio vector y
la lnea de nodos y el otro es el angulo entre el radio vector y la lnea del peri
apside (ver Figs. 10.10 y 10.11),
con lo cual se obtiene
2w2 =
(10.154)
donde es el argumento del perihelio como se aprecia en la Fig. 10.10.
Si bien el metodo de las variables acci
on-
angulo no es el m
as ventajoso para trabajar el problema de Kepler,
veremos que las variables acci
on-
angulo constituyen una parametrizaci
on muy adecuada para el tratamiento
de la teora canonica de perturbaciones en el problema de Kepler. En el lenguaje de la mec
anica celeste, a
la variables acci
on-
angulo en el problema de Kepler se les conoce como variables de Delauney, si bien en
algunas convenciones las variables de Delauney difieren de las acci
on-
angulo por constantes multiplicativas.

10.17.

Ejercicios

1. A partir de la expresi
on (10.41) para el teorema del virial obtenga la expresi
on (10.42), teniendo en
cuenta la ley de acci
on y reacci
on y el hecho de que la fuerza resultante sobre la iesima partcula se
escribe como
X
(e)
Fi = Fi +
Fij
j6=i

(e)

siendo Fi la fuerza externa neta y siendo Fij la fuerza interna que la partcula j hace sobre la partcula
i del sistema de partculas.
2. Sea una fuerza atractiva central de la forma
f (r) = kear ; k > 0
encuentre los valores de r para los cuales es posible una orbita circular estable. Repita el ejercicio para
2
f (r) = kr 3 ear .
3. Escriba la frecuencia de peque
nas oscilaciones radiales (10.76) en terminos de las condiciones iniciales, y
compruebe que coincide con la obtenida en las Ecs. (10.68). Sugerencia: Utilice la Ec. (10.72).

260

CAPITULO 10. FUERZAS CENTRALES

4. Con base en la Ec. (10.114), eval


ue el valor de la constante de proporcionalidad que relaciona el cuadrado
del periodo con el cubo del semi-eje mayor, para cada planeta del sistema solar. Eval
ue la desviaci
on
porcentual m
axima que se presenta entre estas constantes.
5. Un cometa se aproxima a la tierra y en un instante dado, se mide su posici
on y su velocidad inicial
tomando a la tierra como origen de coordenadas. Asuma que la masa de la tierra es mucho mayor a
la del cometa, y que el sistema de referencia fijo a la tierra es inercial. Prescindiendo del tama
no de
ambos astros, describa bajo que condiciones el cometa retornar
a en una orbita cerrada, no retornar
ao
colisionar
a con la tierra. Como cambia esta descripci
on al introducir el tama
no de estos astros?. En
ambos casos, desprecie la interacci
on del cometa con la atm
osfera de la tierra.
6. Obtenga la relaci
on entre w2 y las variables orbitales descrita por la ecuaci
on (10.154), con un procedimiento similar al realizado para obtener la Ec. (10.153).

Captulo 11

Colisiones y dispersi
on
Vamos a analizar el problema de dos partculas que interact
uan de alguna manera, pero que est
an aisladas del resto del universo. En algunos casos es suficiente asumir que las dos partculas chocan o entran en
contacto directo entre s, lo cual implcitamente significa que las dos partculas se pueden aproximar indefinidamente una a la otra. En este caso hablamos de una colisi
on entre las dos partculas. Cuando estudiamos
el comportamiento de partculas macrosc
opicas, esta constituye una buena aproximaci
on y ser
a el primer caso
que trataremos.
Sin embargo, debe tenerse en cuenta que las interacciones son funciones de la distancia, y la fuerza usualmente adquiere un valor singular para distancia cero. Este hecho resulta de particular importancia en la Fsica
at
omica y subatomica dado que en estos escenarios la distancia mnima de aproximaci
on entre dos partculas
es de un orden de magnitud similar al tama
no mismo de las partculas. Cuando tenemos en cuenta que existe
una fuerza a distancia entre las partculas (por ejemplo una interacci
on electrica) entonces el proceso no se
interpreta como un contacto directo entre tales partculas sino como la interacci
on de estas u
ltimas a una distancia muy corta. En este caso hablamos de una dispersi
on (tambien suele usarse el anglicismo scattering).
Usualmente, el experimento se prepara de manera que inicialmente las dos partculas esten muy alejadas entre
s de manera que se puede despreciar la interacci
on entre ellas en el instante inicial (y por tanto, la energa
potencial). Se lanzan entonces las dos partculas de masas m1 y m2 con velocidades v1 y v2 respectivamente.
Las dos partculas se acercan entonces e interact
uan entre s para luego dispersarse de modo que el producto
0
0
saliente son dos partculas de masas m1 y m2 con velocidades v10 y v20 respectivamente. Observese que hemos
supuesto que en los productos finales tanto las velocidades como las masas pueden haber cambiado, incluso
el n
umero de partculas salientes podra ser diferente del n
umero de partculas entrantes. Por ejemplo, veremos m
as adelante que en las reacciones de captura entran dos partculas y sale s
olo una, la explosi
on de una
granada se puede ver como un fen
omeno de colisi
on ya que s
olo intervienen fuerzas internas; en este caso el
estado inicial es de una partcula y el estado final podra ser de muchas. Generalmente, en el experimento
se miden los estados finales cuando las partculas han vuelto a alejarse lo suficiente como para despreciar de
nuevo la interacci
on entre ellas. Estos estados final e inicial en que las partculas est
an muy alejadas entre s,
se conocen como estados asint
oticos inicial y final respectivamente, son entonces estos valores asint
oticos los
que usualmente interesan en un experimento de dispersi
on.
Es de anotar sin embargo, que los terminos colisi
on y dispersi
on suelen usarse indistintamente. Es as como
es com
un utilizar el termino colisiones at
omicas en lugar de dispersiones at
omicas.

11.1.

Colisiones y dispersiones generales

Cuando dos partculas se aproximan y llegan a su regi


on de colisi
on o dispersi
on, se apartan de nuevo
y lo que analizamos usualmente es su cambio de momento lineal y de energa, independientemente de si
consideramos una interacci
on a distancia o no. Como primera consideraci
on, es obvio que el momento lineal
se debe conservar ya que el sistema es aislado, si asumimos que el n
umero de partculas se conserva tendremos
entonces:
261


CAPITULO 11. COLISIONES Y DISPERSION

262

p1 + p2 = p01 + p02

m1 v1 + m2 v2 = m01 v10 + m02 v20

(11.1)

y si suponemos que la interacci


on entre las dos partculas es conservativa, se tiene que el principio de conservaci
on de la energa se puede escribir como:
T + V (r) = T 0 + V 0 (r)

(11.2)

siendo r kr2 r1 k la distancia entre las partculas. En esta secci


on utilizaremos la notaci
on primada para
estados finales, y la no primada para estados iniciales. Como lo que se puede medir con mayor facilidad en
un experimento es la energa cinetica de los estados iniciales y finales, definiremos el factor Q de una colisi
on
como:
Q T 0 T = V (r) V 0 (r)

(11.3)

en una colisi
on general las dos partculas intercambian momento lineal y energa pero de tal manera que la
suma total de estas dos cantidades no se modifique. Si las energas cineticas final e inicial no son las mismas,
significa que hubo un cambio de signo contrario en la energa potencial de modo que se conserve la energa
mec
anica dada por (11.2).
Ya hemos mencionado que en el caso macrosc
opico por lo general consideramos la colisi
on como un contacto
directo entre las partculas como sucede con las bolas de billar. Dado que en tal caso no se considera una
interacci
on a distancia, no necesitamos que en los estados inicial y final las partculas esten muy alejadas la
una de la otra para efectuar nuestras mediciones, en este caso el cambio en la energa cinetica es debido a la
deformaci
on que los cuerpos puedan sufrir en virtud de sus propiedades pl
asticas o el
asticas.
A partir de la definici
on de momento lineal, la energa cinetica se puede escribir como:

1
1
(m1 v1 )2 (m2 v2 )2
m1 v12 + m2 v22 =
+

2
2
2m1
2m2
p21
p2
+ 2
2m1 2m2

(11.4)

ahora bien, las colisiones se pueden clasificar de acuerdo al valor del factor Q. Si Q = 0 se dice que la colisi
on
es el
astica ya que se conserva la energa cinetica en el proceso. Si Q < 0 se dice que la colisi
on es inel
astica de
primera clase o endoergica, este u
ltimo nombre se debe al hecho de que Q < 0 indica que la energa cinetica
ha disminudo en el proceso, de manera que la energa potencial aumenta (y por tanto la energa interna).
Finalmente, si Q > 0 tenemos una colisi
on inel
astica de segunda clase o exoergica.
De lo anterior se concluye que el factor Q nos da informaci
on acerca de la naturaleza de las interacciones
internas entre las partculas. Teniendo en cuenta (11.3) y (11.4) podemos escribir:
p02
p02
p21
p22
1
2
+

=Q
2m01 2m02 2m1 2m2

(11.5)

si el factor Q es conocido, la Ec. (11.5) junto con el principio de conservaci


on del momento lineal, resuelven
completamente el problema de la colisi
on entre dos partculas, siempre y cuando sus estados finales no sean
de m
as de dos partculas. Es decir, dados los momentos iniciales podemos predecir el valor de los momentos
finales. Sin embargo, el factor Q no puede obtenerse de primeros principios, ya que depende en general de las
intrincadas interacciones microsc
opicas que suceden durante la colisi
on. Por tanto, es usual determinar Q en
forma experimental.
Un hecho importante es que el factor Q as definido es independiente del observador. Para el caso de
partculas con interacci
on central a distancia, esto es inmediato si tomamos en cuenta que la energa potencial
para una fuerza central es independiente del observador, ya que s
olo depende de la magnitud de la coordenada

11.1. COLISIONES Y DISPERSIONES GENERALES

263

relativa entre las partculas, y como Q = V (r) V 0 (r) se concluye que Q es independiente del observador.
Para interacciones de contacto es necesario probar que la diferencia de energa cinetica final e inicial es la
misma para cualquier observador. El factor Q viene dado por:
1
1
1
1
Q = T 0 T = m01 v102 + m02 v202 m1 v12 m2 v22
2
2
2
2
ahora bien, el factor Q medido por el centro de masa se obtiene teniendo en cuenta que la energa cinetica
en el laboratorio y en el centro de masa se relacionan como en la Ec. (1.32), P
ag. 131 . Con lo cual se puede
escribir:

QCM

 

 2
1
1
0
0
2
TCM = T
m1 + m2 vCM T (m1 + m2 ) vCM
2
2

1
1
1
1 0 02 1 0 02 1
2
2
m1 v12 m2 v22 + (m1 + m2 ) vCM
m1 v1 + m2 v2
m01 + m02 vCM
2
2
2
2
2
2

0
TCM

=
=

donde hemos tenido en cuenta que la velocidad del centro de masa es la misma antes y despues de la colisi
on,
0
0
ya que el sistema es aislado. Adicionalmente, puesto que m1 + m2 = m1 + m2 = M se concluye que:
0
TCM
TCM

1 0 02 1 0 02 1
1
m v + m2 v2 m1 v12 m2 v22 = T 0 T
2 1 1
2
2
2
Q = QCM
=

de modo que Q es el mismo en el sistema de referencia laboratorio y en el del centro de masa


0
Q = T 0 T = TCM
TCM

y dado que el laboratorio es cualquier sistema inercial, esto prueba la invariancia de Q con respecto al sistema
de referencia inercial que lo mide. Veremos a continuaci
on, que la descripci
on de la colisi
on vista por el centro
de masa es mucho m
as sencilla que vista desde el laboratorio. Con respecto al centro de masa, el momento
lineal total del sistema es cero de modo que:
p1,CM

p21,CM = p22,CM ; p01,CM = p02,CM




p21,CM
p22,CM
p21,CM
1
1
1
+
=
+
p21,CM =
2m1
2m2
2 m1 m2
2


02
p1,CM
1
1
1
+ 0 p02
1,CM =
0
2 m1 m2
20

= p2,CM

TCM

0
TCM

02
p02
1,CM = p2,CM

siendo y 0 las masas reducidas antes y despues de la colisi


on. Podemos escribir en sntesis las siguientes
relaciones v
alidas en el sistema de referencia centro de masa
p1,CM
TCM

= p2,CM , p21,CM = p22,CM


=

p21,CM
2

p22,CM
2

0
TCM

02
p01,CM = p02,CM , p02
1,CM = p2,CM

p02
1,CM
20

p02
2,CM
20

(11.6)

N
otese que aunque la masa total sea la misma antes y despues de la colisi
on, la masa reducida s puede cambiar
cuando las masas individuales cambian su valor. Empleando la definici
on de Q en el centro de masa resulta:
p02
1,CM
20
1

p21,CM
2

=Q

(11.7)

La notaci
on primada en la Ec. (1.32), significa visto por el centro de masa, en nuestra secci
on la notaci
on primada significa
depues de la colisi
on.


CAPITULO 11. COLISIONES Y DISPERSION

264

si suponemos que la colisi


on es el
astica y que adem
as la masa reducida no cambia en el proceso, se tiene que
Q = 0, 0 = de modo que
p02
1,CM
2

p21,CM
2

2
p02
1,CM = p1,CM

(colisi
on el
astica con = 0 )

(11.8)

es decir no hay intercambio de energa cinetica entre las partculas2 , y los momentos no cambian de magnitud.
No obstante, s hay intercambio de momento ya que aunque no vara la magnitud de los momentos, su direcci
on
puede variar en el proceso.

11.1.1.

Caso especial 1: reacci


on de captura

La reacci
on de captura es un choque inel
astico en el cual, las dos partculas incidentes chocan y salen
unidas como una sola partcula. En tal caso, el estado final es una partcula de masa M = m1 + m2 . Como el
sistema es aislado, la velocidad del centro de masa es la misma antes y despues de la colisi
on. En consecuencia,
la partcula saliente viajar
a con la velocidad del centro de masa. Por tanto, la energa cinetica de la partcula
saliente es:

T0 =

1
1
2
= M
M vCM
2
2

m1 v1 + m2 v2
m1 + m2

1 (m1 v1 + m2 v2 )2
2
m1 + m2

2

1
= (m1 + m2 )
2

m1 v1 + m2 v2
m1 + m2

2

y el factor Q es entonces:
1 (m1 v1 + m2 v2 )2 1
1
Q = T0 T =
m1 v12 m2 v22
2
m1 + m2
2
2
"
#

2
2
2
2
1 m1 v1 + m2 v2 + 2m1 m2 v1 v2 m1 (m1 + m2 ) v12 m2 (m1 + m2 ) v22
=
2
m1 + m2


1 2m1 m2 v1 v2 m1 m2 v12 m1 m2 v22
1 m1 m2
=
=
(v2 v1 )2
2
m1 + m2
2 (m1 + m2 )
1
Q = v2 ; v v2 v1
2
0
es m
as inmediato el c
alculo desde el centro de masa ya que en tal caso TCM
= 0 puesto que la partcula final
sale con la velocidad del centro de masa y estara en reposo respecto a este u
ltimo. Luego Q queda:

0
Q = TCM
TCM
1
Q = TCM = v2
2

(11.9)

donde hemos usado la Ec. (10.6), P


ag. 216 vista desde el centro de masa. Es decir, en el caso de una reacci
on
de captura, el factor Q es igual a menos la energa cinetica del sistema inicial vista por el centro de masa.

11.1.2.

Caso especial 2, blanco en reposo

Vamos a suponer ahora que la partcula 1 tiene masa m1 y momento lineal p1 y que la partcula dos
tiene masa m2 y est
a en reposo respecto al laboratorio, es decir p2 = 0. En este caso la partcula 1 puede
2

Aqu se ha probado que no hay intercambio de energa cinetica visto por el centro de masa, pero el lector puede verificar
f
acilmente que tampoco hay intercambio de energa cinetica en el laboratorio.

11.1. COLISIONES Y DISPERSIONES GENERALES

265

considerarse como el proyectil, y la partcula 2 como el blanco, el principio de conservaci


on de la energa nos
dice que:
p01 + p02 = p1 p02 = p1 p01
elevando esta ecuaci
on al cuadrado obtenemos:

p02
=
2

p1 p01

2

0
0
2
02

= p21 + p02
1 2p1 p1 = p1 + p1 2 kp1 k p1 cos

0
p02
= p21 + p02
2
1 2p1 p1 cos

(11.10)

donde es el angulo entre los vectores p1 y p01 , es decir el angulo con que se dispersa la partcula 1. El factor
Q viene dado por:
Q=

p02
p02
p2
1
+ 20 1
0
2m1 2m2 2m1

(11.11)

y reemplazando (11.10) en (11.11), se obtiene:

Q =
Q =

Q =

0
p02
p21 + p02
p21
1
1 2p1 p1 cos
+

2m01
2m02
2m1




02
2
1
1
p1
1
p1
1
p1 p01
+
+

cos
2
m01 m02
2 m02 m1
m02
r
p2 p02




4m1 m01 2m11 2m1 0
0
2
p02
1
m
p
m
1
1
1 + 10 + 1
1
cos
0
0
0
2m1
m2
2m1 m2
m2

y recordando que Ti = p2i / (2mi ), el factor Q viene dado por:


Q=

T10

m0
1 + 10
m2

T1

m1
1 0
m2

p
2 m1 m01 T1 T10

cos
m02

(11.12)

la cual se conoce como ecuaci


on Q y expresa dicho factor para el caso de un blanco inicialmente en reposo.
Example 7 Una granada inicialmente en reposo explota en dos fragmentos m01 y m02 , hallar la energa cinetica
final en terminos de Q.
on del momentum p01 + p02 =
Como la granada est
a inicialmente en reposo, entonces p1 = 0 y por conservaci
02
02
0, con lo cual p1 = p2 por tanto la energa cinetica final es:

p02
1
2

1
1
+ 0
0
m1 m2

p02
1
20

p02
Q = T 0 T = T 0 = 10
2
0
p
p1 = p02 = 20 Q


CAPITULO 11. COLISIONES Y DISPERSION

266
de lo cual queda:
T10 =
T10 =
T20 =
T20 =
T0 =

11.2.

p21
20 Q
m01 m02 Q
=
=
2m01
2m01
m01 (m01 + m02 )
m02 Q
(m01 + m02 )
p22
p2
20 Q
= 10 =
0
2m2
2m2
2m02
m01 Q
(m01 + m02 )
T10 + T20 = Q

Dispersi
on en un campo de fuerzas centrales

Hist
oricamente las fuerzas centrales surgen para estudiar el movimiento planetario, no obstante hay muchos
escenarios en donde dichas fuerzas son importantes, un ejemplo notable lo constituye el atomo de Bohr. No
obstante, si pretendemos trabajar fsica microsc
opica las correcciones cu
anticas pueden ser importantes. Sin
embargo, el lenguaje as como muchos aspectos fenomenol
ogicos suelen ser similares en mec
anica cl
asica y en
mec
anica cu
antica.
En general, si conocemos la forma de la interacci
on es posible predecir la forma de la orbita y su dependencia
con el par
ametro tiempo. Sin embargo, es usual en la b
usqueda de nueva fsica realizar experimentos de
dispersi
on (o scattering) que consisten en enviar proyectiles a un blanco que interact
ua con estos y observar la
deflexi
on en la trayectoria de los proyectiles, en este caso lo que se pretende es determinar experimentalmente
la forma de la orbita para deducir la forma (desconocida) de la interacci
on.
Motivados por la anterior discusi
on, en esta secci
on trabajaremos la desviaci
on de un haz de partculas
por un centro de fuerzas en la formulaci
on de un cuerpo, lo cual significa las siguientes simplificaciones: (a) el
centro dispersor es fijo en el espacio de modo que no hace parte de la din
amica del sistema, equivalente a que
su masa sea infinita, y (b) se desprecia la interacci
on entre las partculas del haz, de modo que cada partcula
incidente solo interact
ua con el centro dispersor. Consideremos por simplicidad que todas las partculas del haz
poseen las misma masa y energa, estos proyectiles pueden ser electrones, n
ucleos, planetas, etc. En general,
consideraremos que este haz uniforme es tal que las partculas vienen de regiones muy lejanas al centro de
fuerzas de modo que su interacci
on con el centro de fuerzas se considera despreciable en el tiempo inicial (que
se suele tomar como t ). En consecuencia, las trayectorias incidentes son lneas rectas. Una vez que las
partculas pasan por las vecindades del centro de fuerza (denominada regi
on de dispersi
on o de colisi
on), se
alejan de dicho centro y sus trayectorias vuelven a ser lneas rectas cuando las partculas est
an suficientemente
lejos del centro dispersor (usualmente decimos que esto ocurre en t ), pero la direcci
on de las partculas
salientes no coincide con la direcci
on de las partculas incidentes. La desviaci
on de las partculas contiene
informaci
on valiosa sobre la naturaleza de la interacci
on.
El haz incidente se caracteriza a traves de su intensidad, es decir, n
umero de partculas por unidad de
area por unidad de tiempo que atraviesan una superficie normal a la direcci
on de propagaci
on del haz (a esta
cantidad tambien se le conoce con el nombre de densidad de flujo). Debido al cambio de direcci
on del haz
cuando ha pasado por el centro de fuerzas, diremos que el haz se ha dispersado o desviado como se puede ver
en la Fig. 11.1. Una cantidad fsicamente u
til para estudiar el fen
omeno de la dispersi
on es la secci
on eficaz de
dispersi
on en un direcci
on dada (denotada por () d)
n
umero de partculas dispersadas por unidad de
tiempo en un a
ngulo s
olido d
() d =
intensidad incidente

(11.13)

donde d es un elemento diferencial de angulo s


olido en la direcci
on . La cantidad () suele tambien

EN UN CAMPO DE FUERZAS CENTRALES


11.2. DISPERSION

267

Figura 11.1: Dispersi


on de un haz de partculas por un centro de fuerzas repulsivo.
denominarse secci
on eficaz diferencial de dispersi
on. Escribiendo el angulo s
olido explcitamente resulta
() d = () sin d d

(11.14)

Si la fuerza es central debe haber una simetra total con respecto al eje del haz incidente, lo cual nos conduce
a que la secci
on eficaz diferencial debe ser independiente del angulo azimutal (i.e. el angulo de rotaci
on
alrededor del eje de simetra). Por esta raz
on se puede hacer una integraci
on parcial del angulo solido. Como
no depende de es decir posee simetra azimuthal, tenemos que la integraci
on en se puede realizar para
obtener
Z 2
= () sin d
d
() d = () sin d d () d
= 2 () sin d
() d

(11.15)

de modo que podemos definir el diferencial de angulo s


olido en la forma
= 2 sin d
d

(11.16)

es el angulo que hacen la direcci


on desviada e incidente y se denomina angulo de dispersi
on. El termino
secci
on eficaz se debe a que () tiene dimensiones de area. Cuando tenemos una fuerza central y por tanto
dado por (11.16) que corresponde al anillo
simetra azimutal, podemos trabajar con el angulo s
olido d
sombreado sobre la superficie esferica en la Fig. (11.1), en lugar del angulo s
olido d = sin d d. De
aqu en adelante, volveremos a la notaci
on d sobreentendiendo que nos referimos al angulo s
olido dado en
(11.16).
Es importante mencionar que lo que se puede medir experimentalmente es la integral de la Ec. (11.14) o
de la Ec. (11.15) sobre una cierta porci
on finita de angulo s
olido, ya que en la realidad solo podemos calcular
angulos de dispersi
on y contar las partculas que se dispersan dentro de cierto rango finito de esos angulos de
dispersi
on.
Tomaremos el origen de nuestro sistema coordenado en el centro dispersor, el eje X ir
a paralelo a la
velocidad del haz incidente y en el mismo sentido del haz. El angulo de una determinada posicion r se mide
con respecto al eje X positivo de modo que para las partculas incidentes (cuando t ) se tiene que
r y = . Para una partcula dada, asumiendo que conocemos su plano de movimiento3 y teniendo
en cuenta que su posici
on inicial est
a dada por r y = , veremos que las constantes de la orbita y
por tanto la dispersi
on, est
an determinadas por la energa y el m
odulo del momento angular E y l. Conviene
expresar el momento angular en funci
on de la energa y de una cantidad s denominada par
ametro de impacto
que es la distancia entre las rectas paralelas a la velocidad del proyectil, que pasan por el proyectil y el centro
de fuerza respectivamente (ver Fig. 11.1). Si v0 es la rapidez incidente de la partcula se tiene que
s



1
2
l = rp sin ( ) = r sin mv0 = mv0 s = s 2m
mv0 = s 2mE
(11.17)
2
3

La determinaci
on del plano de movimiento implica el conocimiento de la variable azimutal .

268

CAPITULO 11. COLISIONES Y DISPERSION

donde es el angulo entre el vector posici


on incidente y la lnea paralela a la direcci
on de incidencia que pasa
por el centro dispersor (i.e. el angulo entre el vector posici
on de la partcula incidente y el eje X negativo)4 .
En esta expresi
on hemos tenido en cuenta que la partcula incidente est
a muy lejos del centro de fuerza, de
modo que su energa es puramente cinetica. Una vez fijados E y s queda determinado unvocamente el angulo
de dispersi
on 5 . Las partculas cuyo par
ametro de impacto est
a entre s y s + ds deben cruzar la superficie
del anillo con radio interno s y radio externo s + ds ilustrado en la Fig. 11.1, el area de este anillo es 2s |ds|.
Ahora bien, el n
umero de partculas por unidad de tiempo que pasan por dicho anillo es igual a la intensidad
incidente I multiplicada por el area del anillo es decir

dN
= 2Is |ds|
(11.18)
dt anillo ds
por otro lado, el n
umero de partculas por unidad de tiempo que se dispersan en el angulo s
olido d (determi6
nado por la regi
on sombreada sobre la superficie esferica en la Fig 11.1) se puede calcular teniendo en cuenta
la definici
on (11.13), de la cual se ve que corresponde simplemente a I () d, teniendo en cuenta (11.15)
el n
umero de partculas por unidad de tiempo que se dispersa en un angulo s
olido d es

dN
= 2 () I sin |d|
(11.19)
dt angulo solido d

Supondremos de momento que partculas con diferente par


ametro de impacto no pueden llegar al mismo angulo
de dispersi
on. En tal caso, el n
umero de partculas dispersadas por el angulo s
olido d comprendido entre y
+ d deber
a ser igual al n
umero de partculas incidentes con par
ametro de impacto comprendido entre los
valores s y s + ds. Por tanto en este caso las cantidades definidas en (11.18, 11.19) son iguales y se obtiene
2Is |ds| = 2 () I sin |d|

(11.20)

los valores absolutos se introducen para asegurar que el n


umero de partculas sea positivo, ya que a menudo s
y varan en sentidos opuestos. Si consideramos a s como funci
on de la energa y el angulo de dispersi
on
s = s (, E)

(11.21)

y despejando () en (11.20), la dependencia entre la secci


on eficaz diferencial y vendr
a dada por


s ds
() =
(11.22)
sin d

a partir de la ecuaci
on de orbita general (10.51a) se puede obtener directamente una expresi
on formal para el
angulo de dispersi
on. Consideraremos por simplicidad una fuerza totalmente repulsiva. Teniendo en cuenta que
la orbita debe ser simetrica respecto a la direcci
on del peri
apside (recordemos que la orbita es simetrica ante
reflexi
on con respecto a las apsides, ver discusi
on de la Ec. 10.50), el angulo del peri
apside con la direcci
on
incidente es igual al angulo entre el peri
apside y la direcci
on de dispersi
on (ver Fig. 11.2). En consecuencia, el
angulo de dispersi
on viene dado por
= 2
(11.23)
El angulo se puede obtener de (10.51a) tomando el lmite r0 cuando 0 (direcci
on incidente).
4

Dado que la partcula incidente est


a muy lejos, es muy peque
no. Sin embargo, r sin es claramente finito e igual al par
ametro
de impacto.
5
En este punto la mec
anica cu
antica s difiere de la cl
asica ya que en la primera no se pueden definir trayectorias sino probabilidades de desviaci
on en distintas direcciones.
6
Es importante observar que la partcula no necesariamente tiene que cruzar por el anillo sombreado sobre la esfera. Lo que
define este anillo es el espacio angular por donde debe pasar la partcula. En la Fig. 11.1, la trayectoria dibujada no pasa por el
lugar geometrico en el que se dibuj
o el anillo, pero el
angulo de deflexi
on de esta partcula est
a dentro del intervalo angular que
define el anillo, cuando dicho
angulo se mide desde el origen.

EN UN CAMPO DE FUERZAS CENTRALES


11.2. DISPERSION

269

Figura 11.2: Ilustraci


on del a
ngulo entre la direcci
on incidente y la lnea del peri
apside para una dispersi
on
central repulsiva. La simetra de reflexi
on conduce a que este a
ngulo coincide con el formado por la direcci
on
de dispersi
on y el peri
apside.
Por otro lado, es claro que = cuando r = rm distancia de mayor acercamiento7 . Integrando la orbita
(10.51a) desde la posici
on incidente hasta el peri
apside con estas consideraciones se tiene
Z rm
dr
q
+
=
2mE
2mV
1
r2

l2
l2
r2
quedando finalmente

rm

r2

dr
2mE
l2

y expresando l en funci
on de s Ec. (11.17) queda
Z
dr
q
=
2mE
2mV
rm r 2
2mEs
2
2mEs2
Z

rm

r2

s dr

V (r)
E

s2
s2 r 2

2mV
l2

rm

(11.24)

1
r2

r2

r

s dr
1

V
E

s2
r2


(11.25)

s2

de aqu se puede encontrar una expresi


on formal para calcular reemplazando (11.25) en (11.23)
Z
s dr
r h
(s) = 2
i
rm
r r 2 1 V E(r) s2
o en terminos de u 1/r con du = dr/r 2 = u2 dr

(s) = 2

(s) = 2

0
um 1
u
um
0

1
u2

nh

s dr
1

V (1/u)
E

s u2 dr

V (1/u)
E

s2 u2

o =2

0
um

rh
1

s u2 dr
i
V (1/u)
E

(11.26)

s2 u2

s2 u2

Conviene recordar que = (t) es la posici


on angular de la partcula en cualquier instante de tiempo, medida desde el eje X
positivo. En cambio es el a
ngulo de dispersi
on de la partcula el cual es u
nico para cada partcula que se dispersa.


CAPITULO 11. COLISIONES Y DISPERSION

270
quedando finalmente
(s) = 2

um
0

s du
1

V (1/u)
E

(11.27)
s2 u2

Sin embargo, cuando se dispone de una funci


on analtica para la orbita, es frecuente que se pueda encontrar
a en funci
on de s por simple inspecci
on. En consecuencia, las Ecs. (11.26, 11.27) se usan muy poco para
c
alculos analticos, y usualmente se emplean para el c
alculo numerico del angulo de dispersi
on.

11.2.1.

Dispersi
on de Rutherford

Es de enfatizar que fue un experimento de dispersi


on el que condujo a Rutherford a modelar la distribuci
on
de cargas electricas en los atomos. En un experimento cl
asico realizado por Rutherford, Geiger y Marsden en
1909, se dipersaron partculas alfa (n
ucleos de Helio) por una l
amina de oro de 104 cm de espesor. El tratamiento de este problema exige consideraciones estadsticas ya que se trata de muchos proyectiles (partculas
alfa) incidiendo sobre un enorme conjunto de blancos (
atomos de oro) que en primera aproximaci
on se pueden
considerar inm
oviles. Aqu consideraremos una versi
on muy simplificada con un solo blanco inm
ovil y un haz
bien colimado, es decir todas las partculas en la misma direcci
on. Adicionalmente, despreciamos la interacci
on
de las partculas del haz entre s y de las partculas del haz con la nube electr
onica que rodea al n
ucleo inm
ovil.
Nuestra version simplificada estudia entonces la repulsion causada por un centro dispersor coulombiano
(repulsi
on entre cargas electricas). El campo de fuerzas dispersor es creado por una carga fija Ze 8 al ejercerse
sobre partculas incidentes de carga Z 0 e, la fuerza viene dada por
f (r) =

ZZ 0 e2
ur
r2

es decir una fuerza repulsiva de la forma k/r 2 . Los resultados obtenidos para el problema de Kepler se pueden
usar teniendo en cuenta que k = ZZ 0 e2 en la Ec. (10.83)
Ya que la energa potencial es positiva, la energa total E tambien lo es, y la orbita ser
a una hiperbola con
excentricidad dada por la Ec. (10.90)
s
s


2El2
2Es 2
= 1+
>1
(11.28)
= 1+
ZZ 0 e2
m (ZZ 0 e2 )2
donde hemos tenido en cuenta la Ec. (11.17). Tomemos 0 = en (10.85) y escribamos la ecuaci
on de la orbita

m ZZ 0 e2
1
mk
= 2 [1 + cos ( )] =
[1 cos ]
r
l
l2
y la ecuaci
on de la orbita queda

1
mZZ 0 e2
=
( cos 1)
(11.29)
r
l2
vemos que al tomar 0 = en (10.85), el peri
apside corresponder
a a = 0. Por otro lado, la Ec. (11.29)
requiere que cos 1 sea no negativo, el hecho de que > 1 garantiza que existen valores de para los cuales
se cumple esta condici
on. No obstante, tal condici
on excluye ciertos valores de . Adicionalmente, dado que
el peri
apside esta definiendo el angulo cero, la direcci
on de la asntota de incidencia (o dispersi
on) queda
determinada por el valor de en el lmite r en (11.29)
cos =

(11.30)

n
otese que los valores permitidos de yacen justamente en el intervalo [, ] como se puede observar de la
Fig. 11.2 o teniendo en cuenta que si reemplazamos cos = cos () = 1/ en (11.29) se anula el termino de
8

Se define e como la carga negativa del electr


on de modo que Ze se refiere a una carga positiva. Z se refiere al n
umero at
omico.

EN UN CAMPO DE FUERZAS CENTRALES


11.2. DISPERSION
la derecha lo cual viene de la condici
on r . De acuerdo con la Ec. (11.23)



1
cos = cos

= sin =

2
2
2

= csc
2 1 = csc2 1
2
2
2
2
= 1
cot
2
y usando (11.28) se obtiene

cot2

2Es

=
2
ZZ 0 e2

271

(11.31)

(11.32)

(11.33)

de la Ec. (11.31) y teniendo en cuenta que 1, se tiene que


0<
de modo que
0<

= sin 1

2
2

cot

0
2

(11.34)

con lo cual la Ec. (11.33) queda de la forma


cot

2Es
=
2
ZZ 0 e2

(11.35)

despejando s en esta ecuaci


on, se obtiene la relaci
on funcional entre el par
ametro de impacto y el angulo de
dispersi
on
ZZ 0 e2

cot
(11.36)
s=
2E
2
que es una relaci
on de la forma (11.21) con la cual es posible calcular () por medio de la Ec. (11.22).
Reemplazando (11.36) en (11.22) se encuentra que () es





ZZ 0 e2

1 d
ZZ 0 e2

() =
cot
cot
2E
2 sin d
2E
2
"
#



2
1

ZZ 0 e2

1
2

 csc
() =
cot

2E
2
2
2
2 sin 2 cos 2

2

2
cos 2
csc2 2
csc2 2
1 ZZ 0 e2
1 ZZ 0 e2

() =
=
4
2E
4
2E
sin 2 sin 2 cos 2
sin2 2
finalmente

1
() =
4

ZZ 0 e2
2E

2

csc4

(11.37)

La Ec. (11.37) corresponde a la llamada dispersi


on de Rutherford quien la dedujo para la dispersi
on de
partculas por n
ucleos at
omicos. Es notable el hecho de que en mec
anica cu
antica en el lmite no relativista,
la secci
on eficaz coincide con este resultado cl
asico.

11.2.2.

Caractersticas generales de la secci


on eficaz

En Fsica at
omica tiene tambien importancia el concepto de secci
on eficaz total de dispersi
on T definido
por
T =

() d = 2

() sin d

(11.38)

272

CAPITULO 11. COLISIONES Y DISPERSION

el u
ltimo paso solo se puede realizar si hay simetra azimutal, lo cual efectivamente ocurre si la fuerza es
central. Sin embargo si intentamos calcular la secci
on eficaz total para la dispersi
on coulombiana de Rutherford,
sustituyendo (11.37) en (11.38) obtenemos un resultado divergente. Es f
acil ver la raz
on por la cual esto es as,
la secci
on eficaz total es el n
umero de partculas que por unidad de intensidad incidente se dispersan en todas
direcciones. Ocurre que la interacci
on coulombiana es de alcance infinito, las desviaciones muy peque
nas solo
tienen lugar para partculas con par
ametro de impacto muy grande. Por tanto todas las partculas de un haz
incidente de secci
on lateral infinita se desviaran en mayor o menor medida y por tanto deben inclurse en la
secci
on eficaz total de dispersi
on. En consecuencia, la infinitud de la secci
on eficaz total en mec
anica cl
asica no
es exclusiva del potencial coulombiano y se extiende a todos los potenciales de alcance infinito independiente de
lo grandes que sean9 . Solo si el potencial presenta un corte de modo que se anula mas all
a de cierta distancia,
sera finita esta secci
on eficaz total. Este es el caso del campo coulombiano de un n
ucleo, el cual presenta un
corte debido al apantallamiento de la nube electr
onica.

Figura 11.3: (a) perfil de un potencial repulsivo que permanece finito en el centro de fuerza. (b) Gr
afica
de vs s para el anterior potencial donde se observa que a cada valor permitido de le corresponde dos
par
ametros de impacto diferentes (excepto para = m ).
Es muy importante tener presente que la validez de la Ec. (11.22) depende de que las partculas con diferente
par
ametro de impacto no puedan llegar al mismo angulo de dispersi
on, ya que de ello depende la validez de
(11.20) y (11.22). En la dispersi
on de Rutherford, esta condici
on se cumple ya que el angulo de dispersi
on es
una funci
on monotona suave (y por tanto uno a uno) del par
ametro de impacto s. Esto se puede apreciar en
la Ec. (11.36), teniendo en cuenta que est
a entre cero y . En la Ec. (11.36) se ve que al disminuir s desde
el infinito hacia cero el angulo crece mon
otonamente a partir de cero (cuando s es l
ogico que 0
ya que la interacci
on tiende a cero), alcanzando el valor de cuando s = 0 lo cual corresponde a colisi
on
frontal con el centro de fuerzas, que naturalmente obliga a la partcula a recular en la direci
on contraria a la
incidencia.
No obstante, existen otros potenciales cl
asicos cuyo comportamiento requiere reevaluar la expresi
on (11.22),
por ejemplo para un potencial repulsivo como el de la figura 11.3a, tal que el potencial es finito incluso en
r 0 y tal que la energa de la partcula es mayor al potencial para todo valor de r, es f
acil ver que la curva
de versus s se puede comportar de la forma indicada en la figura 11.3b, la cual no es una funci
on uno a uno.
Este comportamiento se puede explicar mediante el siguiente razonamiento fsico: Para p
arametros de impacto
muy grandes, la partcula permanece todo el tiempo muy lejos del centro de fuerzas de tal modo que su angulo
de dispersi
on es muy peque
no. Si s = 0 la partcula se dirige en lnea recta directamente al centro de fuerzas
y dado que su energa es superior al m
aximo valor del potencial, pasar
a a traves del centro de fuerzas sin
deviarse de su curso (en vez de recular). Por esta raz
on, el angulo de dispersi
on se anula en los dos extremos de
s, y dado que 0 , si la gr
afica es bien comportada es de esperarse que tenga por lo menos un m
aximo
un valor del par
ametro de impacto. La Fig. 11.3b muestra que para < M existen dos
local M , para alg
valores de s que corresponden al mismo angulo de dispersi
on. Cada uno de ellos contribuye a la secci
on eficaz
9

En cu
antica, todos los potenciales que tienden a cero a grandes distancias m
as r
apidamente que 1/r 2 producen un secci
on
eficaz total de dispersi
on finita.

EN UN CAMPO DE FUERZAS CENTRALES


11.2. DISPERSION
de dispersi
on seg
un un angulo y por tanto la Ec. (11.22) se debe modificar en la forma


X si ds


() =
sin d i

273

(11.39)

donde el subndice i distingue los distintos valores de s que dan el mismo valor de . A manera de ejemplo,
pensemos que la curva de vs s es tal que = 0 en s = 0, y que adem
as posee dos m
aximos locales
1 , 3 (1 > 3 ) y un mnimo local 2 tal que s1 < s2 < s3 . En este caso, hay angulos para los cuales hay
ametros s asociados (3 < <
cuatro par
ametros de impacto asociados (2 < < 3 ), otros tienen dos par
1 y < 2 ), cuando = 2 o = 3 hay tres par
ametros de impacto asociados, y finalmente cuando
= 1 solo hay uno.
Volviendo al caso descrito por la Fig. 11.3b, resulta de especial interes la secci
on eficaz correspondiente al
angulo m
aximo M . Puesto que para este angulo se anula la derivada de con respecto a s, se ve de la Ec.
(11.39) que la secci
on eficaz debe diverger cuando M . Pero para todos los angulos con > M , la
secci
on eficaz es nula (para el caso de la Fig. 11.3b, solo hay un m
aximo local de modo que ninguna partcula
se dispersa con una angulo mayor a M ). Este fen
omeno de la subida infinita de la secci
on eficaz seguida de
una desaparici
on brusca, es muy semejante a lo que ocurre en la optica geometrica de la dispersion de la luz
solar por las gotas de lluvia. En virtud de esta semejanza, a este fen
omeno se le denomina dispersi
on en
arco iris.
Cuando el scattering es debido a fuerzas atractivas, pueden surgir otras complicaciones. Por ejemplo, dado
que la partcula es atrada hacia el centro de fuerzas, el angulo entre la direcci
on incidente y la direcci
on del
periapsis puede ser mayor que /2, con lo cual a traves de la Ec. (11.23) obtenemos un angulo de dispersi
on
negativo. Esto no supone mucho problema en virtud de que lo que importa para medir () es el valor absoluto
de . No obstante, el valor absoluto de dicho angulo de acuerdo con la Ec. (11.26) o (11.27), puede ser mayor
que 2, lo cual significa que fsicamente la partcula podra dar una o m
as vueltas alrededor del centro de
fuerzas, antes de ser lanzada hacia su direcci
on asint
otica de dispersi
on.

Figura 11.4: (a) Potenciales efectivos asociados a un potencial intermolecular real tpico, cada valor del par
ametro de impacto conduce a un potencial efectivo diferente. (b) Gr
afica del a
ngulo de desviaci
on en funci
on de
s, para el potencial anterior con dos valores diferentes de la energa.
Veamos un ejemplo de como puede ocurrir esto fsicamente. En la gr
afica 11.4a, se pintan una serie de potenciales efectivos para un potencial intermolecular (real) tpico. Cada curva est
a asociada al mismo potencial
real, pero con una barrera centrfuga diferente, lo cual corresponde a un valor distinto del momento angular l
y por tanto tambien del par
ametro de impacto s. Lo m
as caracterstico de esta clase de potenciales intermoleculares reales es que son atractivos a grandes distancias decayendo a un ritmo mayor a 1/r 2 , y repulsivos con


CAPITULO 11. COLISIONES Y DISPERSION

274

magnitud de fuerza r
apidamente creciente a cortas distancias10 . Dado que a grandes distancias el potencial
a a grandes
real (atractivo) decae m
as r
apido que 1/r 2 la barrera centrfuga que se forma cuando s 6= 0 dominar
distancias y para valores peque
nos de s se formar
a un m
aximo local, a medida que el par
ametro de impacto
aumenta la curva tiende a aplanarse y para alg
un valor del par
ametro de impacto s2 , solo hay un punto de
inflexi
on en Vef f para cierto valor de la energa E2 . Finalmente, para par
ametros de impacto a
un mayores no
aparecen extremos locales ni puntos de inflexi
on en el potencial.
Consideremos una partcula con par
ametro de impacto s1 y energa E1 correspondiente a la energa en el
m
aximo local. Recordemos que la distancia entre Vef f y E1 es la energa cinetica radial. Por tanto, cuando
la partcula llega a una distancia r1 del centro de fuerzas la velocidad radial se anula. Recordemos adem
as
que cuando la energa coincide con un m
aximo local tenemos una orbita circular inestable. En ausencia de
perturbaciones la partcula de energa E1 y par
ametro de impacto s1 quedar
a realizando una orbita circular
de radio r1 de forma indefinida. Si la energa es un poco mayor que E1 la orbita ya no es circular pero su
velocidad radial ser
a muy peque
na en las vecindades de r1 , y la partcula puede permanecer en esta vecindad
un largo tiempo realizando varios giros. En contraste, la velocidad angular no est
a afectada por la existencia
de un m
aximo y para un valor dado de r viene dada por (11.17)
r
= l = s1 2E
mr12
r12 m
por tanto durante el tiempo en el que la partcula atraviesa la regi
on del m
aximo, su velocidad angular
vendr
a dada aproximadamente por este valor y puede hacer que dicha partcula ejecute varios giros. En tales
casos, se dice que la dispersi
on cl
asica exhibe una orbitalizaci
on o espiralaci
on.
Claramente para energas mayores que E2 (en donde se presenta el punto de inflexi
on para un s2 dado),
no es posible un movimiento orbital. All se puede presentar no obstante otro fen
omeno interesante, y es
que la combinaci
on de componentes atractivas y repulsivas del potencial efectivo puede incluso conducir a
deflexi
on nula para alg
un valor finito del par
ametro de impacto. Por otro lado, a valores grandes de energa
con peque
nos par
ametros de impacto, los efectos de dispersi
on dominantes corresponden a repulsi
on fuerte a
11
cortas distancias, y el scattering se asemeja cualitativamente a la dispersi
on de Rutherford .
Dado que la partcula se puede deflectar en un angulo mayor a , pero el angulo medido en el laboratorio
est
a entre 0 y , es u
til en este caso diferenciar el angulo de deflexi
on , que es el que se calcula con las
expresiones de la derecha en las Ecs. (11.26) o (11.27) y el angulo de dispersi
on que se observa . Para un
dado el valor se calcula con la expresi
on
= 2m

m entero positivo

el signo y el valor de m se escogen para que quede en el rango entre 0 y . La suma expresada por (11.39)
cubre entonces todos los valores de que conducen al mismo . En la Fig. 11.4b, se hace una gr
afica de
vs s para el potencial de la figura 11.4a, para dos energas diferentes. La orbitaci
on que se produce en
E = E1 se muestra como una singularidad en la curva en s = s1 ya que el sistema da infinitas vueltas12 . Para
E > E2 no hay orbitaci
on pero hay un efecto arco iris en = 0 (aunque la secci
on eficaz no se anula para
angulos mayores, sino menores a 0 ). N
otese que se anula (y por tanto tambien ) para s = s3 lo cual
significa a partir de (11.22) que la secci
on eficaz se vuelve infinita en la direcci
on adelante debido a que el
factor sin = sin se anula13 . Similarmente, la secci
on eficaz puede diverger en la direcci
on hacia atr
as (i.e.
10
Estas son las caractersticas que a grandes rasgos se esperan para que la materia no implosione y al mismo tiempo pueda
formar condensados.
11
Esto es de esperarse ya que a mayor energa con bajo par
ametro de impacto, la partcula puede penetrar la nube electr
onica
y acercarse mucho al n
ucleo. En realidad la dispersi
on de Rutherford se da gracias a este efecto.
12
Dado que > 0, la Ec. (11.23) muestra que , de modo que solo puede diverger con valores negativos, como se aprecia
en la Fig. 11.4b.
13
El hecho de que exista un par
ametro de impacto finito y diferente de cero para el cual no hay deflexi
on, significa que los efectos
de atracci
on y repulsi
on a diversas distancias en que estuvo la partcula, tuvieron un efecto de cancelaci
on. Sin embargo, esto no
significa que la partcula viaj
o en lnea recta, pues en la regi
on de dispersi
on la trayectoria pudo ser muy compleja. De hecho las
lneas rectas que definen las trayectorias inicial y final son paralelas pero no necesariamente coincidentes.

DEL PROBLEMA DE LA DISPERSION


ENTRE COORDENADAS DE LABORATOR
11.3. TRANSFORMACION
para = ) si ocurre que



ds


s
d

permanece finito en = . Estos infinitos en la dispersi


on adelante atr
as se conocen como dispersi
on gloria,
de nuevo por su an
alogo al correspondiente fen
omeno en optica metereol
ogica. El efecto optico es familiar para
los viajeros de avi
on que pueden ver un anillo de luz que envuelve la sombra del avi
on proyectada sobre una
nube subyacente.
Aunque las correcciones cu
anticas son en general importantes, a veces dichas correcciones son peque
nas
como ocurre con la dispersi
on a bajas energas en retculos cristalinos de iones. Incluso en ocasiones se recurre
a metodos semiclasicos en los cuales es necesario el conocimiento de la orbita cl
asica.

11.3.

Transformaci
on del problema de la dispersi
on entre coordenadas de
laboratorio y centro de masa para blanco en reposo

Figura 11.5: (a) Dispersi


on de dos partculas vista por el sistema de referencia del laboratorio. (b) Dispersi
on
de dos partculas vista por el sistema de referencia del centro de masa.
Hasta el momento, hemos supuesto que el centro de fuerzas es fijo y por lo tanto trabajamos el problema
de un cuerpo. En la realidad, lo que tenemos es un cuerpo mucho m
as masivo que el otro que en todo caso
debe recular. Por otro lado, podemos estar interesados en la colisi
on de dos partculas con masas similares o
casos en que el blanco es m
ovil. Todo ello conduce al hecho de que el problema de la colisi
on es un problema
de dos cuerpos. Aunque ya hemos demostrado que este problema se puede reducir al problema de un cuerpo
con masa reducida cuando la interacci
on es central, no podemos simplemente reemplazar los dos cuerpos por
este cuerpo equivalente. La dificultad radica en que el angulo de dispersi
on se mide realmente en el laboratorio
y corresponde al angulo entre las direcciones inicial y final de la partcula dispersada en las coordenadas de
laboratorio. Por otro lado, el angulo calculado a partir del problema equivalente de un cuerpo es el angulo
entre las direcciones inicial y final del vector relativo entre las dos partculas en las coordenadas del centro de
masa14 .
En lo que sigue asumiremos que en el instante inicial (t ), uno de los cuerpos est
a en reposo. En
este caso, los valores de y solo son iguales si la partcula que estaba en reposo permanece estacionaria
en el proceso. Dado que en la realidad la partcula inicialmente en reposo se pone en movimiento gracias a la
interacci
on con el proyectil, los dos angulos ser
an diferentes como se ve en la figura 11.5a. En consecuencia, el
problema equivalente de un cuerpo no nos da directamente el angulo de dispersi
on que mide el laboratorio15 .
14

Estrictamente, es el mismo cuando se mide en el sistema de referencia del laboratorio como se ve en la Fig. 11.5a, en virtud
de que el vector relativo es identico en ambos sistemas de referencia. Esto se puede ver en la Fig. 10.1 de la P
ag. 215, la cual
muestra claramente que r2 r1 = r02 r01 = r, y esta relaci
on es v
alida para todo tiempo.
15
Recordemos que las trayectorias que hemos obtenido para un cuerpo bajo fuerzas centrales, tampoco son las
orbitas que vera
un sistema de referencia inercial, y solo coinciden razonablemente cuando uno de los cuerpos est
a casi en reposo y es muy masivo


CAPITULO 11. COLISIONES Y DISPERSION

276

11.3.1.

Relaci
on entre el
angulo de dispersi
on medido por el laboratorio y el medido por
el centro de masa

Para encontrar la relaci


on entre y debemos primero examinar como ocurre la dispersi
on para un
sistema de referencia que se mueve con el centro de masa (que claramente tambien es inercial). En este sistema
de referencia el momento total es cero siempre, as que las dos partculas siempre se mueven con momentos
opuestos. Antes de la dispersi
on las dos partculas se acercan mutuamente y luego de la dispersi
on se alejan
una de otra.
En la Fig. 10.1 de la P
ag. 215, podemos ver que el vector relativo entre las partculas pasa por el centro de
masa, as mismo los vectores r, r01 ,r02 son todos colineales para todo tiempo. Esto significa que desde el punto
de vista del centro de masa, no solo los momentos son antiparalelos sino que las direcciones incidentes de las
dos partculas yacen sobre la misma recta, al igual que las direcciones salientes o reflejadas como se ilustra
en la Fig. 11.5b. De aqu se concluye que los angulos de dispersi
on de las dos partculas son identicos ya que
son opuestos por el vertice como se ve en la Fig. 11.5b. Por otro lado, vemos que el angulo de dispersi
on de
r0i sera el mismo que el angulo de deflexi
on de r ya que son colineales todo el tiempo. Por tanto el angulo de
deflexi
on de las partculas visto por el CM es el angulo que se muestra en la Fig. 11.5a. La dispersi
on vista
por el centro de masa se ilustra en la Fig. 11.5b.
Ahora bien, la relaci
on entre y se obtendr
a entonces haciendo la transformaci
on entre el sistema centro
de masa y laboratorio. Esta transformaci
on ya fue considerada en la secci
on 10.1. Derivando en el tiempo la
Ec. (10.3) se obtiene
(11.40)
v1 = V + v10
esta relaci
on es v
alida para todo tiempo. Por conveniencia, haremos un ligero cambio en la terminologa: r1 , v1
son la posici
on y velocidad de la partcula incidente m1 despu
es de la dispersi
on en el sistema de laboratorio
(L). r01 , v10 son la posici
on y velocidad de la partcula incidente m1 despu
es de la dispersi
on en el sistema
del centro de masa (CM). R y V no sufren modificaci
on en su significado antes y despues de la colisi
on.

Figura 11.6: Relaci


on entre los vectores v1 , v10 y V despues de la colisi
on.
Dado que el blanco m2 est
a inicialmente estacionario en el laboratorio, la velocidad incidente v0 del proyectil
on del momento
m1 en dicho sistema, coincide con la velocidad relativa inicial de las partculas. Por conservaci
lineal total (medido en el laboratorio) la velocidad constante del centro de masa es
(m1 + m2 ) V = m1 v0 V =
V =
con respecto al otro.

v0
m2

m1 m2
v0
m2 (m1 + m2 )
(11.41)

DEL PROBLEMA DE LA DISPERSION


ENTRE COORDENADAS DE LABORATOR
11.3. TRANSFORMACION
La Ec. (11.41) muestra que v0 es paralelo a V. En consecuencia, si tomamos como eje X el eje de incidencia de
la partcula, la velocidad del centro de masa V es paralela a este eje. La Fig. 11.6 muestra la relaci
on vectorial
0
(11.40) evaluada despu
es de la dispersi
on, en cuyo tiempo v1 y v1 hacen los angulos y respectivamente
con el vector V, que yace a lo largo de la direcci
on incidente. Adicionalmente, la figura 11.6 muestra que
v1 sin = v10 sin
v1 cos =

v10 cos

(11.42)
+V

(11.43)

el cociente entre estas ecuaciones nos da la relaci


on entre y que busc
abamos
tan =

sin
V
v0
, 0 =
cos +
v1
m2 v10

(11.44)

donde hemos usado (11.41). Se puede obtener una expresi


on alternativa cuando se expresa v1 en terminos de
otras velocidades a traves del teorema del coseno aplicado al tri
angulo de la Fig. 11.6.
v12 = v102 + V 2 2v10 V cos ( ) = v102 + V 2 + 2v10 V cos

(11.45)

despejando cos en (11.43) y usando las Ecs. (11.45, 11.44) se obtiene


cos =

v 0 cos + V
v10 cos + V
=r
= p 02 1
v1
v1 + V 2 + 2v10 V cos
cos +
cos = p
1 + 2 cos + 2

cos + V /v10
 2
1 + vV0
+ 2 vV0 cos
1

(11.46)

vemos que las relaciones entre y expresadas en (11.44) y (11.46) involucran el factor que depende de las
rapideces inicial de la partcula 1 vista por (L) y final de la misma partcula pero vista por (CM). Conviene
por tanto, caracterizar adecuadamente a este factor.

11.3.2.

Caracterizaci
on del factor de la colisi
on

Por la definici
on de centro de masa, la velocidad v10 de la partcula 1 en el CM despues de la colisi
on,
est
a conectada con la velocidad relativa v despues de la colisi
on. Esta relaci
on se obtiene utilizando la Ec.
(10.4) y deriv
andola con respecto al tiempo

m2
m2 m1

v v10 =
kvk v10 =
v
v10 =
m1 + m2
(m1 + m2 ) m1
m1
y reemplazando esta expresi
on en (11.44), el factor se puede escribir como
=

m1 v0
m2 v

(11.47)

es necesario recalcar que v es la rapidez relativa despu


es de la colisi
on.
Si la colisi
on es inel
astica, la energa cinetica total de las dos partculas cambia despues de la colisi
on (por
ejemplo algo de la energa cinetica se puede convertir en energa de excitaci
on interna del blanco). Ya vimos
que el cambio de energa cinetica resultante de la colision se expresa por medio del factor Q. Expresando la
energa cinetica vista por el laboratorio, su cambio se parametriza en la forma
v 2 1
v 2 1
+ MV 2 = 0 + MV 2 + Q
2
2
2
2
donde hemos tenido en cuenta que la velocidad del centro de masa permanece constante de modo que
v 2
v 2
= 0 +Q
2
2

(11.48)


CAPITULO 11. COLISIONES Y DISPERSION

278

El valor Q del choque inel


astico es usualmente negativo16 , aunque el convenio de signos se toma de manera
que sea consistente con el que se usa para las reacciones at
omicas y nucleares. Multiplicando por 2/ esta
ecuaci
on resulta
!
2
Q
Q
v 2 = v02 + Q = v02 + 1 2 v02 = v02 1 + 1 2
(11.49)

2 v0
2 v0
teniendo en cuenta que la energa del sistema en el laboratorio es (1/2) m1 v02 se tiene que

 

1 2 1
m2
m2
2
v = m1 v0
=
E
2 0
2
m1 + m2
m1 + m2
y la Ec. (11.49) queda



 
m1 + m2 Q
v 2 = v02 1 +
m2
E

Por tanto, el cociente entre las rapideces relativas antes y despues del choque se puede escribir como
s


v
m1 + m2 Q
= 1+
(11.50)
v0
m2
E
siendo E el valor de la energa de la partcula incidente (en el sistema de laboratorio). Reemplazando (11.50)
en (11.47), se tiene que el factor para dispersi
on inel
astica, vendr
a dado por
inelast =
m2

1+

m1


m1 +m2
m2

(11.51)
Q
E

Cuando la colisi
on es el
astica (Q = 0), la energa cinetica total de las dos partculas permanece inalterada
y el factor de la Ec. (11.51) se simplifica a
m1
elast =
(11.52)
m2
y es independiente de las energas y rapideces. El mismo resultado se obtiene haciendo Q = 0 en (11.48) de lo
cual se obtiene v = v0 y reemplazando esta igualdad en (11.47), se obtiene (11.52).
Las Ecs. (11.44, 11.46) muestran que los valores de y son en general diferentes si 6= 0, y la Ec. (11.51)
muestra que esta condici
on ocurre para cualquier valor finito de Q.

11.3.3.

Secci
on eficaz en t
erminos de los dos
angulos de dispersi
on

Los valores de la secci


on eficaz diferencial dependen de cual de los dos angulos se tome como variable
independiente para . Para obtener la relaci
on entre ellas, observemos que en un experimento particular el
n
umero de partculas dispersadas por unidad de tiempo a traves de un elemento de angulo s
olido dado, debe
ser el mismo sin importar si medimos el fen
omeno como funci
on de o como funci
on de . Esta cantidad
expresada para el angulo viene dada por (11.19) y al ser igual para ambos angulos se obtiene
2I () sin |d| = 2I 0 () sin |d|
donde 0 () , () son las secciones eficaces diferenciales expresadas en funci
on de cada angulo de dispersi
on,
ambos medidos en el sistema de laboratorio. Esta relaci
on se puede escribir en la forma




d (cos )
sin d
0

() = ()
= ()
sin d
d (cos )
16

En todo caso, es posible observar un incremento en la energa cinetica a expensas de una disminuci
on de la energa interna de
los cuerpos que colisionan.

DEL PROBLEMA DE LA DISPERSION


ENTRE COORDENADAS DE LABORATOR
11.3. TRANSFORMACION
La derivada se puede evaluar por medio de la Ec. (11.46) y se obtiene f
acilmente
cos =
d (cos )
d (cos )

d (cos )
d (cos )

d (cos )
d (cos )

cos +
1 + 2 cos + 2


2 1/2
1 + 2 cos + 2 2
2 (cos + ) 1 + 2 cos +
(1 + 2 cos + 2 )
"
p
p
1/2 #
1 + 2 cos + 2 (cos + ) 1 + 2 cos + 2
1 + 2 cos + 2
p
(1 + 2 cos + 2 )
1 + 2 cos + 2

1 + 2 cos + 2 (cos + )
(1 + 2 cos + 2 )3/2

d (cos )
1 + cos
=
d (cos )
(1 + 2 cos + 2 )3/2
de lo cual la secci
on eficaz 0 () queda finalmente
1 + 2 cos + 2
0 () = ()
1 + cos

3/2

(11.53)

es importante enfatizar que () no es la secci


on eficaz que medira un observador en el sistema del centro
de masa. Tanto () como 0 () son secciones eficaces medidas en el laboratorio, pero estan expresadas en
termino de coordenadas angulares diferentes. Un observador fijo en el centro de masa vera una densidad de
flujo de partculas incidentes diferente de la que se mide en el sistema de laboratorio y habra que inclur esa
transformaci
on de la densidad de flujo si por alguna raz
on quisieramos relacionar las secciones eficaces medidas
en uno y otro sistema.
La relaci
on entre los dos angulos de dispersi
on es particularmente simple en el caso en el cual tenemos una
colisi
on el
astica donde las partculas tienen masas iguales, en este caso = 1 y seg
un (11.46) se tiene
r

1 + cos
= cos
cos =
2
2
de modo que

( = 1)
(11.54)
2
en consecuencia, en el caso de dispersi
on el
astica con masas iguales no podr
a haber angulos de dispersi
on
mayores que /2 en el sistema de laboratorio; toda la dispersi
on tiene lugar en el hemisferio de adelante.
Correspondientemente, la secci
on eficaz de dispersi
on vendr
a dada en funci
on de seg
un la Ec. (11.53) en la
forma
=

(2 + 2 cos )3/2
23/2 (1 + cos )3/2
() = ()
= ()
1 + cos

"1 + cos

1/2 #
h
i
1/2
3/2
3/2
2
= () 2 (1 + cos )
= () 2
2 cos
2
0

que combinada con (11.54) nos da

, (colisi
on el
astica con = 1)
(11.55)
2
incluso si tenemos dispersi
on is
otropa seg
un , en la cual () es una constante independiente de , la secci
on
eficaz en funci
on de vara como el coseno de este angulo.
De acuerdo con la discusi
on anterior, incluso en los choques el
asticos en los que la energa cinetica total
permanece constante, una colisi
on con blanco fijo trae como consecuencia que el proyectil cede parte de
0 () = 4 cos () ;


CAPITULO 11. COLISIONES Y DISPERSION

280

su energa cinetica al blanco. Es decir, la colisi


on frena a la partcula incidente. Para obtener el grado de
frenamiento en un escenario inel
astico, podemos emplear la Ec. (11.45) expresando v10 y V en funci
on de v0 a
traves de las Ecs. (11.44, 11.41), respectivamente
v12
v12

v0
=
+V +
cos =
m2

2


v0
=
1 + 2 + 2 cos
m2
v102

2v10 V

2

v0
m2

2

+2

v0
m2



v0
m2

cos

el cociente entre las rapideces v1 y v0 queda


v12
=
v02

m2

2

1 + 2 cos + 2

(11.56)

si el choque es elastico, se tiene que = m1 /m2 con lo cual la Ec. (11.56) se puede simplificar en la forma
1
2
2 m1 v1
1
2
2 m1 v0

E1
E0



2



m1 m2 / (m1 + m2 ) 2 
m2
2
=
1 + 2 cos + =
1 + 2 cos + 2
m2 (m1 /m2 )
(m1 + m2 )

2


1
 1 + 2 cos + 2
= 
1
1+ m
m2

quedando finalmente

E1
1 + 2 cos + 2
=
E0
(1 + )2

, =

m1
m2

(choque el
astico)

(11.57)

acil ver que


siendo E0 (E1 ) la energa cinetica inicial (final) del proyectil en el sistema de laboratorio. Es f
(11.57) corresponde a un frenamiento del proyectil incidente i.e. E1 E0
1 + 2 cos + 2
1 + 2 + 2
E1
=

=1
E0
(1 + )2
(1 + )2
La relaci
on se simplifica a
un m
as si el choque el
astico ocurre entre masas iguales i.e. con = 1
E1
E0
E1
E0

1 + cos
= cos2
2
2

= cos2

(choque el
astico con = 1)

donde hemos utilizado (11.54). Por lo tanto, para el angulo de dispersi


on m
aximo ( = , = /2), el proyectil
cede toda su energa al blanco y queda detenido, visto por el sistema de referencia del laboratorio.
Esta transferencia de energa cinetica por dispersi
on es el principio b
asico utilizado en los reactores de
neutrones termicos. Los neutrones r
apidos producidos por fisi
on colisionan el
asticamente en forma sucesiva con
un moderador, hasta que su energa cinetica se convierte en energa termica, en cuyo caso es m
as posible que
originen fisiones a que sean capturados. A priori, los elementos ligeros deberan ser los mejores moderadores,
idealmente el hidr
ogeno (con el cual
ogeno solo es
= 1). Sin embargo, por otras razones tecnicas, el hidr
pr
actico en los reactores nucleares cuando es parte de una mezcla o compuesto (como el agua). Se utilizan
m
as como moderadores el deuterio y el carbono 12. El hidr
ogeno que forma parte de la parafina, el agua o los
pl
asticos s se usa como moderador.
Estos c
alculos de transformaci
on del laboratorio al centro de masa y la cesi
on de energa cinetica se han
realizado en un contexto cl
asico. C
alculos an
alogos se pueden realizar para choques de contacto tales como
los que ocurren entre bolas de billar (ver Sec. 11.1.2). Lo interesante es que a pesar de su simplicidad estos
c
alculos son de muy amplio uso ya que usan principios fundamentales como la conservaci
on del momento

11.4. EJERCICIOS

281

lineal y la energa. Mientras se usen los principios de conservaci


on y el factor Q, los detalles de la colisi
on
son irrelevantes, en realidad la regi
on de interacci
on se considera como una caja negra y lo que medimos
son los estados asint
oticos inicial y final. No interesa mucho que los fen
omenos ocurridos en esta caja negra
sean cu
anticos o cl
asicos. Como ya mencionamos, las f
ormulas obtenidas en este captulo sirven para analizar
fen
omenos de naturaleza cu
antica tales como la dispersi
on neutr
on prot
on, siempre que las energas sean lo
suficientemente bajas para ignorar los efectos relativistas.

11.4.

Ejercicios

1. Se ha encontrado experimentalmente que en una colisi


on frontal (o central) de dos esferas s
olidas tales
como dos bolas de billar, las velocidades despues del choque est
an relacionadas con las velocidades antes
del choque por la expresi
on v10 v20 = e (v1 v2 ) donde e es el coeficiente de restituci
on y tiene un
valor entre cero y uno. Esta relaci
on fue propuesta por Newton y tiene validez solamente aproximada.
Adicionalmente, se conserva el momento lineal en el choque. Probar lo siguiente:
a) Las velocidades despues del choque est
an dadas por:
v10 =
v20 =
b) La Q de la colisi
on es:

v1 (m1 m2 e) + v2 m2 (1 + e)
m1 + m2
v2 (m2 m1 e) + v1 m1 (1 + e)
m1 + m2

 m1 m2
1
1 e2
(v1 v2 )2
2
m1 + m2

c) Cu
al debera ser el valor de e para que la colisi
on fuera el
astica?
2. ;;;;;

(11.58)
(11.59)

(11.60)

Captulo 12

Interludio matem
atico: Matrices, vectores
y tensores cartesianos
En el presente captulo desarrollaremos desde un punto de vista pr
actico el algebra b
asica de los vectores y
n
matrices en el espacio cartesiano R . Enfatizaremos en la relaci
on que hay entre matrices y transformaciones
lineales. Se asume cierta familiaridad del lector con el algebra lineal ya que el prop
osito de este captulo es el de
dar un compendio de propiedades requeridas para los captulos subsiguientes. Debe mencionarse sin embargo,
que adem
as de las propiedades matem
aticas de los vectores y matrices se estudiar
an aspectos de un interes
m
as fsico como son la interpretaci
on pasiva y activa de las matrices, la clasificaci
on de escalares y vectores
por sus propiedades bajo paridad, y la caracterizaci
on de los tensores cartesianos.

12.1.

Propiedades b
asicas de las matrices

Asumiremos que un vector cartesiano (en el espacio Rn ) se puede representar como un arreglo de la forma

x1

(12.1)
x ...
xn

on lineal si dicha transformaci


on es de
una transformacion de x a otro vector x0 se denomina una transformaci
la forma
x0i = aij xj ; i, j = 1, . . . , n
(12.2)

donde aij son coeficientes constantes y se usa convenci


on de suma sobre ndices repetidos. Consideremos el
caso de dos transformaciones lineales sucesivas de la forma (12.2). Adicionalmente, definiremos vectores x que
son generales (no necesariamente vectores posici
on). Hagamos primero la transformaci
on de x a x0 realizada
por el operador B
x0 = Bx x0k = bkj xj

(12.3)

seguida por una transformaci


on de x0 a x00 realizada por el operador A
x00 = Ax0 x00i = aik x0k

(12.4)

para obtener la relaci


on entre x00i y las xj se pueden combinar las dos ecuaciones para obtener
x00 = ABx
x00i

= aik bkj xj

cij

aik bkj

x00 = Cx C = AB

x00i

= cij xj

(12.5)
(12.6)
(12.7)

282


12.1. PROPIEDADES BASICAS
DE LAS MATRICES

283

vemos que podemos definir una nueva transformaci


on lineal C caracterizada por los elementos cij que forman
un nuevo arreglo matricial que se obtiene de los elementos aik y bkj de A y B con el algoritmo descrito en
(12.7). Esto nos indica que la composici
on de transformaciones lineales A y B nos define otra transformaci
on
lineal C. Es f
acil ver que el algoritmo (12.7) nos dice que la composici
on (multiplicaci
on) de operadores no
es conmutativa
(AB)ij

cij = aik bkj ; (BA)ij = dij = bik akj

AB 6= BA
lo cual se puede comprobar con unos simples casos particulares (ver ejercicio 1, P
ag. 322). Esto implica que
el resultado de aplicar dos operadores lineales sucesivos depende en general del orden de aplicaci
on de tales
operadores. Puede comprobarse sin embargo que esta multiplicaci
on es asociativa (ver ejercicio 2, P
ag. 322)
(AB) C = A (BC)
la operaci
on descrita por la Ec. (12.2) se puede escribir en arreglo matricial emulando el algoritmo (12.7) en
donde los vectores se escriben como matrices de una columna en la forma de la Ec. (12.1). Por simplicidad,
ilustraremos esta operaci
on en tres dimensiones
0

x1
x1
a11 a12 a13
x0 = Ax ; x0 x02 ; x x2 ; A a21 a22 a23
x03
x3
a31 a32 a33

0
0
x i = (Ax)i xi = aij xj = ai1 x1 + ai2 x2 + ai3 x3 ; i = 1, 2, 3
la suma de dos matrices se define como la matriz que se obtiene al sumar los elementos de cada una, claramente
esta operaci
on s es conmutativa
(A + B)ij = aij + bij = cij = (C)ij
un proceso importante es la composici
on inversa de A que nos lleva de regreso desde x0 hacia x
x0 = Ax ; A1 x0 = x A1 Ax = x

(12.8)

como x es un vector arbitrario se concluye que


A1 A = 1

(12.9)

donde 1 es el operador identidad que deja al vector (o al sistema coordenado) inalterado. Por otro lado,
multiplicando la segunda de las Ecs. (12.8) por A a la izquierda
AA1 x0 = Ax AA1 x0 = x0
y teniendo en cuenta que x0 tambien es arbitrario se tiene que
AA1 = 1

(12.10)

de modo que la matriz inversa de A debe cumplir


A1 A = AA1 = 1

(12.11)

designemos a los elementos de la inversa como a


ij . La segunda de las Ecs. (12.8) se escribe como
xi = a
ij x0j

(12.12)

que debe ser consistente con la primera de las Ecs. (12.8)


x0k = aki xi

(12.13)


284CAPITULO 12. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS
y sustituyendo xi de (12.12) en (12.13)
ij x0j
x0k = aki a
y puesto que las componentes de x0 son independientes, esta ecuaci
on solo es correcta si la suma se reduce
0
identicamente a xk i.e.
aki a
ij = kj
(12.14)
la delta de Kronecker efectivamente es la u
nica representaci
on de los elementos de la matriz identidad como
se puede ver del algoritmo (12.7). Podemos llegar tambien a (12.14) directamente a partir de (12.10) usando
el algoritmo (12.7). Si partimos de (12.9) llegamos a la relaci
on
a
ij ajk = ik
se puede ver adem
as que la inversa del producto de dos matrices es la inversa del producto aplicado en orden
contrario. Por definici
on de inverso se tiene que
ABx = x0 (AB)1 x0 = x

(12.15)

multiplicando por A1 a la izquierda de la primera ecuaci


on (12.15) y posteriormente por B1 resulta
A1 ABx

A1 x0

Bx = A1 x0

x = B1 A1 x0

Bx = B1 A1 x0

comparando esta ecuaci


on con la segunda de las Ecs. (12.15) teniendo en cuenta que estas deben ser v
alidas
0
para x y x arbitrarios, resulta
(12.16)
(AB)1 = B1 A1
es importante tener en cuenta tambien que la matriz identidad deja inalterada a otra matriz cuando se hace
el producto entre ellas
A1 = 1A = A
finalmente, definiremos la traspuesta de una matriz como aquella matriz que se obtiene intercambiando filas
e se define entonces por
por columnas y viceversa en la matriz A, esta matriz simbolizada por A
 
e
A
e
aij = aji
ij

es obvio que la traspuesta de la traspuesta es la misma matriz




]
e =A
A

(12.17)

es f
acil demostrar que la traspuesta del producto de dos matrices es el producto de las matrices traspuestas
en orden contrario


   
^
eA
e
e
e
B
= B
A
= bki ajk = ajk bki = (AB)ji = (AB)
ij
ij

ik

kj

y como esto vale para un elemento arbitrario i, j se tiene que


^=B
eA
e
(AB)

es muy f
acil verificar que la traspuesta de una suma es la suma de las traspuestas
^
e +B
e
(A
+ B) = A

(12.18)


12.1. PROPIEDADES BASICAS
DE LAS MATRICES

285

Matrices sim
etricas y antisim
etricas
Si una matriz coincide con su traspuesta
aij = aji

e
A=A

se dice que la matriz es sim


etrica. Si la matriz coincide con menos la traspuesta
aij = aji

e
A = A

entonces tenemos una matriz antisim


etrica. Claramente, los elementos diagonales de una matriz antisimetrica
son nulos.
N
otese que siempre es posible descomponer una matriz en una componente simetrica y otra antisimetrica
de la siguiente forma


1
1
e
e
A = As + Aa ; As
A+A
; Aa
AA
2
2

adem
as, la traspuesta de la matriz tambien es combinaci
on de estas componentes
e = As Aa
A

Para el caso particular de tres dimensiones, las matrices antisimetricas reales pueden parametrizarse vectorialmente. En virtud de las propiedades anteriores, una matriz antisimetrica real 3 3 se puede parametrizar
en la forma

0
a3 a2
0
a1
(12.19)
Aa = a3
a2 a1
0

esta matriz tiene solo tres grados de libertad independientes, de modo que es razonable construr una arreglo
vectorial de la forma

a1

vA a2
(12.20)
a3

Ahora bien, si aplicamos la matriz a un vector arbitrario x obtenemos

0
a3 a2
x1
a3 x2 a2 x3
Aa x = a3
0
a1 x2 = a1 x3 a3 x1
a2 a1
0
x3
a2 x1 a1 x2

(12.21)

las componentes del nuevo vector claramente son identicas a las obtenidas a traves del siguiente producto cruz
Aa x = x vA

(12.22)

De modo que a cualquier producto cruz se le puede asociar una matriz antisimetrica, esto se aplica con
frecuencia a cantidades como el torque y el momento angular.

12.1.1.

Determinantes y trazas de matrices

Otra propiedad importante de las matrices es el determinante. El determinante de una matriz A se denota
en una de estas dos formas
|A|
o det A
usaremos una u otra notaci
on de acuerdo con la conveniencia. El determinante consiste en un n
umero real
o complejo asociado a la matriz, su construcci
on est
a motivada por el estudio de las ecuaciones lineales
simult
aneas. Supondremos que el lector est
a familiarizado con el algoritmo de expansi
on por cofactores para el
c
alculo de los determinantes. Hablamos de matrices singulares cuando su determinante es nulo, de lo contrario


286CAPITULO 12. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS
hablamos de matrices no singulares. Es condici
on necesaria y suficiente que una matriz sea no singular para
que exista su inversa, puesto que dicha inversa depende de |A|1 . El determinante de la traspuesta de la matriz
coincide con el determinante de la matriz

e
e = det A
det A
(12.23)
A = |A| o

y para la matriz conjugada se tiene

|A | = |A|

det A = (det A)

(12.24)

Adicionalmente, se puede demostrar que el determinante del producto, es el producto de los determinantes
|AB| = |A| |B|

det (AB) = (det A) (det B)

(12.25)

y dado que el determinante de la identidad es 1 se tiene que






1 = |1| = AA1 = |A| A1

de modo que

1
A = |A|1


det A1 = (det A)1

por otro lado si cualquier fila o columna de una matriz se multiplica por un escalar ,
multiplicado por tal escalar. Por ejemplo en tres dimensiones




a11 a12 a13 a11 a12 a13
a11 a12




a21



a21 a22

a
a
=
a

a
a
=

22
23
21
22
23








a31 a32
a31
a32
a33
a31 a32 a33

(12.26)
el determinante queda

a13
a23
a33

(12.27)

de modo que si multiplicamos un escalar por una matriz n n, el nuevo determinante es


det (A) = n det A

como caso particular

det (A) = (1)n det A

(12.28)
(12.29)

otra propiedad importante es la traza de la matriz, definida como la suma de sus elementos diagonales
T rA = aii

(12.30)

donde enfatizamos en la suma sobre ndices repetidos. Demostraremos que


T r [AB] = T r [BA]

(12.31)

lo cual se puede ver f


acilmente en la forma
T r [AB] = (AB)ii = aik bki = bki aik = (BA)kk = T r [BA]
Una propiedad muy importante de la traza es que es un invariante cclico, es decir
i
h
i
h
T r A(1) A(2) . . . A(n2) A(n1) A(n) = T r A(n) A(1) A(2) . . . A(n2) A(n1)
h
i
= T r A(n1) A(n) A(1) A(2) . . . A(n2)

(12.32)

y as sucesivamente. Para demostrarlo, basta con definir

B A(1) A(2) . . . A(n1)


de modo que
h
i
h
i
h
i
h
i
T r A(1) A(2) . . . A(n2) A(n1) A(n) = T r BA(n) = T r A(n) B = T r A(n) A(1) A(2) . . . A(n2) A(n1)

y teniendo en cuenta que los ndices (1) , (2) , ... son mudos, vemos que cualquier cambio cclico es posible. Vale
la pena tener en cuenta que la propiedad (12.31) no significa que para calcular la traza se puedan conmutar las
matrices, por ejemplo para tres o m
as matrices la traza no es la misma para cualquier orden de las matrices,
solo cambios cclicos son posibles (ver ejercicio 1). En tal sentido debemos interpretar (12.31) como un cambio
cclico de dos matrices y no como una conmutaci
on.
Veremos m
as adelante que las trazas y los determinantes son invariantes ante un cambio de base.

ACTIVA Y PASIVA DE LAS TRANSFORMACIONES LINEALES: CAMBIOS DE BAS


12.2. INTERPRETACION

12.1.2.

Matrices rectangulares

Una matriz rectangular es un arreglo de n


umeros constitudo por m filas y n columnas. En ese caso se dice
que la matriz es de dimensi
on m n. Los elementos de esta matriz seran de la forma
(A)ik = aik

i = 1, . . . , m

k = 1, . . . , n

la traspuesta de esta matriz sera de dimensi


on n m. Un arreglo vectorial columna (de aqu en adelante lo
llamaremos simplemente vector aunque no necesariamente sea un vector en todo el sentido de la palabra) es
una matriz rectangular de dimensi
on m 1, su traspuesta es una matriz de dimensi
on 1 m.
Ahora bien, sera deseable extrapolar el algoritmo (12.7) para realizar productos de matrices rectangulares
cij aik bkj
Se observa que la extrapolaci
on del producto matricial entre dos matrices rectangulares C = AB solo se puede
definir consistentemente si el n
umero de columnas de A es el mismo que el n
umero de filas de B.
AB = C

si A Amn

B Bnd

Cmd

En particular el producto de un vector columna (matriz m 1) con una matriz m m en la forma xA no


se puede definir. Sin embargo, el producto entre la traspuesta del vector anterior (vector fila) y la matriz A
eA se puede definir. Similarmente no se puede definir Ae
en la forma x
x pero si se puede definir Ax. De las
eA corresponden a un nuevo vector columna y un nuevo vector
anteriores consideraciones las cantidades Ax y x
fila respectivamente.
A partir de las dimensiones para las matrices rectangulares
e nm y Bnd B
e dn
Amn A

el producto AB est
a definido. Sin embargo, se puede notar que sus traspuestas solo se pueden multiplicar
e A.
e De por s es simple demostrar que al igual que con las matrices
en el orden opuesto, i.e. en el orden B
cuadradas el traspuesto del producto es el producto del traspuesto en orden inverso, Ec. (12.18). Aplicando
esta propiedad se puede ver que
] =x
]
e
e
eA
(Ax)
; (e
xA) = Ax

donde hemos tenido en cuenta que la traspuesta de la traspuesta es la matriz original.

12.2.

Interpretaci
on activa y pasiva de las transformaciones lineales: cambios de base

Es usual describir un vector dado en dos sistemas coordenados diferentes, digamos X1 X2 X3 y X10 X20 X30 .
Asumiremos que ambos sistemas tienen un origen com
un, de modo que uno de ellos se obtiene por rotaci
on
del otro. Cada sistema coordenado tiene un conjunto ortonormal de vectores {u1 , u2 , u3 } y {u01 , u02 , u03 }.
La matriz de transformaci
on A puede ser considerada como un operador que actuando sobre el sistema
coordenado no primado lo transforma en el sistema coordenado primado. Simb
olicamente esta operaci
on se
escribe como:
(r)0 = Ar
(12.33)
el parentesis indica que el vector r como tal NO ha sido transformado, simplemente sus componentes se est
an
escribiendo en un nuevo sistema coordenado. De modo que la matriz A opera sobre las componentes del
vector en el sistema no primado para dar las componentes del mismo vector en el sistema primado. Esta
operaci
on se conoce como un cambio de base, puesto que A act
ua solo sobre el sistema coordenado dejando
al vector inalterado. En tres dimensiones la transformacion de coordenadas es simplemente una rotaci
on de
los ejes coordenados. Usualmente estaremos interesados en transformaciones lineales que nos lleven de un
sistema coordenado ortonormal a otro sistema coordenado tambien ortonormal, este tipo de transformaciones


288CAPITULO 12. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS
se denominan transformaciones ortogonales, las cuales caracterizaremos matem
aticamente en la seccion
12.4. Sin embargo, la discusi
on que estamos desarrollando no requiere estrictamente que las transformaciones
sean ortogonales, la u
nica condici
on indispensable como veremos m
as adelante es que la transformaci
on sea
invertible.
Por otro lado, es de anotar que sin cambiar el andamiaje matem
atico construdo hasta ahora, podemos
reinterpretar al operador A como actuando sobre el vector r para producir un nuevo vector r0 donde las
componentes de ambos se calculan en el mismo sistema coordenado. Esto lo representamos por
r0 = Ar

(12.34)

esta notaci
on sin parentesis indica que el vector como tal ha sido transformado, con ambos vectores r y r0
descritos por el mismo sistema coordenado. Por tanto, en el caso particular de rotaci
on en dos dimensiones
en lugar de rotar el sistema coordenado en el sentido antihorario, estaramos girando el vector posici
on en
sentido horario manteniendo fijos los ejes. Los angulos de rotaci
on en ambos casos poseen naturalmente la
misma magnitud pero signo opuesto. Vale destacar que en la transformaci
on (12.34) las componentes del
nuevo vector estar
an relacionadas con las del vector original por las mismas transformaciones que en las Ecs.
(12.33) aunque la interpretaci
on geometrica sea distinta.
Para entender la diferencia, es esencial comprender que la definici
on completa de un operador requiere
conocer no solo que operaci
on realiza, sino sobre que objetos act
ua, en este sentido matem
atico estricto los
dos operadores (cambio de base y cambio del vector) son en realidad diferentes aunque posean la misma
representaci
on matricial. N
otese en particular que el sentido de la rotaci
on cuando se interpreta como cambio
en el vector, es inverso con respecto al caso en que se interpreta como rotaci
on del sistema coordenado.
No obstante visto desde un punto de vista pr
actico, dado que las operaciones matem
aticas son las mismas,
es posible y a veces conveniente cambiar de una interpretaci
on a otra seg
un las necesidades. Por ejemplo, en
el caso de la especificaci
on de la orientaci
on de un cuerpo rgido relativo a S0 la interpretaci
on del operador
como transformando el sistema coordenado es la mas conveniente. Por otro lado la interpretaci
on del operador
como agente que cambia al vector tiene muchas aplicaciones. Por tanto, tomaremos una u otra interpretaci
on
a lo largo del texto.
Esta dualidad en la interpretaci
on o m
as bien en el rol de los operadores est
a presente en otro tipo
de transformaciones de coordenadas mas generales que las transformaciones ortogonales. En ocasiones se
interpreta su rol como el de cambiar el sistema coordenado expresando cierta cantidad o funci
on en terminos
del nuevo sistema coordenado pero sin alterarla. En otras ocasiones se puede considerar como actuando sobre
la cantidad o funci
on en s misma cambiando a nuevas cantidades en el mismo sistema coordenado. Cuando
la transformaci
on es del tipo de un cambio de base i.e. solo sobre el sistema coordenado hablamos de un rol
pasivo de la transformaci
on. Por otro lado cuando al operador se le otorga el rol de cambiar a un vector u
otra cantidad fsica, hablamos de un rol activo de la transformaci
on. Ya nos habamos encontrado con esta
dualidad en el captulo sobre transformaciones can
onicas y en realidad es aplicable en muchos campos de la
Fsica.
Es importante el hecho de que las propiedades matem
aticas de las transformaciones activas y pasivas son
identicas, de modo que en la mayor parte de lo que sigue, no haremos distinci
on entre (r)0 y r0 en las operaciones
subsecuentes, a menos que se especifique lo contrario (como es el caso de la secci
on 12.2.1).

12.2.1.

Transformaciones de similaridad

Veremos que las interpretaciones activa y pasiva de un operador se pueden combinar para encontrar la
manera en la cual la representaci
on de un operador activo se transforma cuando se realiza un cambio de base.
Pensemos que tenemos una matriz activa A que act
ua sobre un vector F (matriz columna) para transformarlo
en el vector G. Tenemos entonces la transformaci
on
G = AF

(12.35)

ahora pensemos que el sistema coordenado original ser


a transformado a otro a traves de una matriz ortogonal
B. El cambio de base se expresa como
(G)0 = BG
(12.36)

ACTIVA Y PASIVA DE LAS TRANSFORMACIONES LINEALES: CAMBIOS DE BAS


12.2. INTERPRETACION
donde revivimos la notaci
on (G)0 para indicar que representa al mismo vector pero en un sistema coordenado
diferente. Combinando (12.35) y (12.36) se obtiene
BG = BAF (G)0 = (BA) F
n
otese que en la u
ltima igualdad los dos vectores G y F est
an expresados en bases diferentes. Es deseable
que ambos queden escritos en la nueva base (por ejemplo dos vectores solo se pueden sumar componente a
componente si ambos est
an expresados en la misma base). Esto se logra introduciendo un operador identidad
en la forma
(G)0



(BA) B1 B F (G)0 = BAB1 (BF)


(G)0 = BAB1 (F)0


=

(12.37)

Si comparamos (12.35) con (12.37) teniendo en cuenta que los vectores primados son identicos a los vectores sin primar salvo que est
an escritos en bases diferentes, llegamos a la siguiente conclusi
on: La matriz de
transformaci
on A (en la base original) me produce la misma transformaci
on que la matriz de transformaci
on
BAB1 en la nueva base. En otras palabras, A y BAB1 son representaciones diferentes del mismo operador,
donde se ve que la representaci
on depende de la base que usemos para construirla. En consecuencia podemos
definir
A0 = BAB1
(12.38)
una transformaci
on de esta forma (entre A y A0 ) se denomina una transformaci
on de similaridad. A las
0
matrices A y A se les denomina matrices equivalentes, lo cual es l
ogico si recordamos la interpretaci
on
0
activa de A y pasiva de B que nos llev
o a observar que A representa en la nueva base al mismo operador
activo que representa la matriz A en la base antigua. Otra raz
on para llamar equivalentes a estas matrices
es tener en cuenta que la transformaci
on de similaridad forma una relaci
on de equivalencia entre A0 y A
(reflexiva, simetrica y transitiva). Se deja como ejercicio al lector demostrar que la similaridad es una relaci
on
de equivalencia.
Puede demostrarse que tanto el determinante como la traza de una matriz A son invariantes ante una transformaci
on de similaridad. Esto es de gran importancia porque significa que estas cantidades est
an asociadas a
un operador lineal de manera unvoca, sin importar la base en que se exprese tal operador.
Veamos la invarianza del determinante
0
A





BAB1 = |B| |A| B1 = |B| |A| |B|1

A0 = |A|
=

donde hemos usado (12.25) y (12.26).


La invarianza de la traza se demuestra f
acilmente en forma explcita


T r A = T r BAB

n
X
i=1

BAB1

ii

X
ikl

bik aklbli =

X
ikl

bli bik akl =

X
kl

kl akl =

akk = T rA

una forma m
as inmediata de verlo es teniendo en cuenta que la traza es un invariante cclico (ver Ec. 12.32),
de modo que
 




T r A0 = T r BAB1 = T r B1 BA = T rA

n
otese que las propiedades de las transformaciones de similaridad aqu mostradas, no dependen de que la
matriz B para el cambio de base sea ortogonal. Lo u
nico que se pide es que esta matriz sea no singular para
que exista la inversa. En realidad la definici
on de transformaci
on de similaridad no se restringe al caso en el cual
la matriz B sea ortogonal, aunque el uso de estas transformaciones nos facilitar
a realizar una interpretaci
on
geometrica, ya que una transformaci
on ortogonal transforma una base ortonormal en otra base ortonormal.


290CAPITULO 12. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS

12.3.

Problema de valores propios

Sea A una matriz n n y x un vector columna n 1. Para una matriz especfica A definimos la ecuaci
on
Ax = x

(12.39)

como la ecuaci
on de valores propios asociada a dicha matriz. La idea es solucionar para los posibles valores de
y vectores asociados x. Los valores son en general complejos y se conocen como valores propios en tanto
que los vectores x asociados se denominan vectores propios. La operaci
on en (12.39) nos muestra que la
ecuaci
on de valores propios consiste en la b
usqueda de vectores para los cuales el operador A nos alarga o nos
acorta el vector en cuesti
on eventualmente cambiando su sentido pero siempre conservando su direcci
on.
El valor propio sera entonces el factor de contracci
on o dilataci
on y en caso de ser negativo invertira el
sentido del vector original1 .
La ecuaci
on de valores propios o autovalores, se puede escribir de la forma
(A 1) x = 0

(12.40)

en forma expandida en tres dimensiones se puede escribir


(a11 ) x1 + a12 x2 + a13 x3 = 0

a21 x1 + (a22 ) x2 + a23 x3 = 0


a31 x1 + a32 x2 + (a33 ) x3 = 0

(12.41)

los argumentos que siguen son v


alidos para matrices de dimensi
on arbitraria finita, pero por comodidad los
escribiremos en tres dimensiones. Este conjunto de ecuaciones homogeneas para x1 , x2 , x3 solo tiene soluci
on
no trivial si el determinante del sistema es nulo de modo que


a11
a12
a13

|A 1| = a21
a22
a23 = 0
(12.42)
a31
a32
a33

condici
on que se conoce como ecuaci
on secular o caracterstica de la matriz. Los valores de para los
cuales se satisface esta ecuaci
on son los autovalores o valores propios asociados a la matriz. Es de anotar
que a
un en el caso en el cual existen soluciones no triviales, el conjunto de ecuaciones homogeneas (12.41)
no nos da valores definidos para las tres (o para las n) componentes sino solo cocientes entre estas. Este
hecho se puede entender por argumentos algebraicos o geometricos. Desde el punto de vista algebr
aico, esto
esta relacionado con el hecho de que el producto del autovector x con un escalar tambien sera autovector,
lo cual se puede ver inmediatamente de (12.40)2 . Geometricamente, esto implica que solo la direcci
on del
autovector est
a determinada pero su magnitud (e incluso sentido) permanecen indeterminados, lo cual se ve
particularmente claro en tres dimensiones. Dado que A representa una transformaci
on lineal es claro que si A
conserva la direcci
on del vector x i.e. Ax = x tambien conservar
a la direcci
on del vector x para arbitrario.
Al expandir el determinante (12.42) se observa que en general la soluci
on de la ecuaci
on secular se reduce
a encontrar las races de un polinomio de grado n. Sabemos pues que hay un n
umero m
aximo de n de estas
races y que tales races pueden ser complejas. En general, podemos construr a lo m
as n vectores linealmente
independientes xk cada uno asociado a un valor propio k . Denotaremos la componente iesima del kesimo
vector en la forma xik podemos realizar un arreglo matricial con estos vectores, coloc
andolos como vectores
columna en forma adyacente. En tres dimensiones tal arreglo matricial queda en la forma

x11 x12 x13


X (x1 x2 x3 ) = x21 x22 x23
(12.43)
x31 x32 x33
1

La raz
on para colocar todos estos terminos entre comillas, es que tal interpretaci
on geometrica solo es clara para vectores
reales. Si bien la analoga para vectores complejos no est
a excenta de utilidad.
2
Alternativamente, esto se puede ver del hecho de que la ecuaci
on secular solo tiene soluci
on no trivial cuando una o m
as de las
ecuaciones es linealmente dependiente con las dem
as. En tal caso hay m
as inc
ognitas que ecuaciones y tenemos entonces infinitas
soluciones.


12.4. PROPIEDADES BASICAS
DE LAS MATRICES ORTOGONALES

291

las Ecs. (12.40) se escriben para cada valor propio k y su respectivo vector propio xk en la forma
(A k 1) xk = 0 Axk = k xk no suma sobre k

(12.44)

escribiendo las Ecs. (12.44) en componentes resulta (para n dimensiones)


n
X
j=1
n
X

aij xjk = k xik


aij xjk =

j=1

n
X

xij jk k

(12.45)

j=1

en las dos ecuaciones anteriores no hay suma sobre el ndice repetido k. Recordemos que xjk es la componente
jesima del vector xk . Ahora bien, la cantidad jk k jk se puede asociar a una matriz diagonal que en
tres dimensiones se escribe

1 0 0
0 2 0
(12.46)
0 0 3
matricialmente la Ec. (12.45) se escribe como

AX = X
si multiplicamos por X1 a la izquierda se obtiene
X1 AX =

(12.47)

esta operaci
on es una transformaci
on de similaridad operando sobre A. N
otese que adem
as la matriz X
que se construye con los vectores propios es la matriz de transformaci
on (m
as estrictamente la matriz de
on de similaridad y los
transformaci
on es X1 ), dicha matriz X1 diagonaliza a A a traves de la transformaci
elementos de la diagonal corresponden a los valores propios (k asociado al vector columna xk en la matriz
X en la Ec. 12.43). Cuando existen valores propios degenerados es decir un subconjunto de ellos posee el mismo
valor, no es siempre posible diagonalizar la matriz A. La raz
on es que si todos los vectores propios que forman
la matriz X no son linealmente independientes, su determinante es cero y no es posible encontrar X1 .
Por otro lado, en el caso en que la diagonalizaci
on es posible, el determinante y la traza de A se pueden
calcular teniendo en cuenta que tales cantidades son invariantes ante una transformaci
on de similaridad, por
lo tanto


det A = det X1 AX = det = 1 2 . . . n
(12.48)
 1

T rA = T r X AX = T r = 1 + 2 + . . . + n
(12.49)
de modo que el determinante y la traza de una matriz diagonalizable son simplemente el producto y la suma
de sus valores propios respectivamente.

12.4.

Propiedades b
asicas de las matrices ortogonales

Del conjunto de transformaciones lineales


x0i = aij xj ,

i = 1, 2, 3

(12.50)

existe un conjunto particularmente interesante para la Fsica: el conjunto m


as general de transformaciones
lineales que deja invariante la norma de los vectores con componentes reales. Si un vector arbitrario r se
escribe en la forma r = xi ui siendo xi valores reales, entonces las transformaciones lineales (activas o pasivas)
de la forma (12.50) que mantengan invariante la norma de vectores reales, deben cumplir la condici
on
xi xi = x0i x0i

(12.51)


292CAPITULO 12. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS
usando (12.50) esta ecuaci
on se reescribe como
xi xi = (aij xj ) (aik xk )
jk xj xk = aij aik xj xk
donde hemos tenido en cuenta que los ndices repetidos son mudos. Como las coordenadas xk , xj son arbitrarias
entonces la relacion anterior es cierta si y solo si
aij aik = jk

j, k = 1, 2, 3

(12.52)

el lector puede demostrar que esta condici


on tiene la siguiente forma alternativa
aji aki = jk ; j, k = 1, 2, 3

(12.53)

A cualquier transformaci
on lineal de la forma (12.50) que cumpla las condiciones (12.52) (o su forma
alternativa las Ecs. 12.53) se le denomina una transformaci
on ortogonal. Las Ecs. (12.52) se conocen como
condiciones de ortogonalidad.
Consideremos las condiciones de ortogonalidad (12.52) y escrib
amoslas en notaci
on matricial


e
aji aik = jk AA
= 1jk
aij aik = jk e
jk

tenemos que

con lo cual se llega a la relaci


on

1
e = 1 AAA
e
e = A1
AA
= 1A1 A1

e = AA
e =1
e = A1 AA
A

(12.54)

aki aji = kj

(12.55)

Inversamente se puede demostrar que la condici


on anterior nos conduce a las condiciones de ortogonalidad. De
modo que para las matrices ortogonales la inversa debe coincidir con la traspuesta. N
otese que la condici
on
e = 1, nos lleva a que la condici
AA
on de ortogonalidad se puede escribir como
que mnemotecnicamente se puede ver como un producto punto entre los arreglos vectoriales formados por las
filas de la matriz A (ver Ec. 13.13 en pag 328 y comentarios). Por tanto, en una matriz ortogonal el producto
punto entre filas o entre columnas debe ser cero.
De la condicion (12.54) se puede ver que el inverso de una matriz ortogonal es tambien una matriz ortogonal.
En el caso de las rotaciones (que son operaciones que claramente conservan la norma de los vectores) esto es
de esperarse ya que geometricamente sabemos que si realizamos una rotaci
on, existe la rotaci
on inversa que
me devuelve a la configuraci
on original.
En lo que concierne al determinante de una matriz ortogonal, vemos que al combinar (12.23) (12.25) y
(12.54) se obtiene que



e
e
AA
=
1
=


A |A|
|A|2 = 1 ;

|A| = 1

vemos entonces que el determinante de una matriz ortogonal es m


as o menos uno. Por razones que veremos m
as
adelante, las transformaciones ortogonales de determinante +1 se denominan propias y las de determinante
1 se denominan impropias.
De otra parte, existe otra forma geometrica de caracterizar a las matrices ortogonales reales en un enfoque
pasivo. Este es el conjunto m
as general de matrices reales que me convierte una base ortonormal real en otra
base ortonormal real, esto se demostrar
a como caso especial de un contexto m
as general en la secci
on 12.8.
Esta caracterstica es muy importante ya que usualmente estamos interesados en pasar de un conjunto de


12.4. PROPIEDADES BASICAS
DE LAS MATRICES ORTOGONALES

293

ejes ortogonales a otro conjunto de ejes tambien ortogonales y adicionalmente conservar la unitariedad de los
vectores base.
Cuando el autovalor es complejo, entonces en general su correspondiente vector propio tambien tendr
a componentes complejas. Cuando los vectores son complejos, la magnitud al cuadrado de estos se calcula usualmente
de la forma
kxk2 = |xi | |xi | = xi xi
(12.56)
y la condici
on de invarianza de esta norma no coincide con la condici
on de invarianza (12.51). Examinemos en
detalle algunos aspectos de las invarianzas expresadas por (12.51) y (12.56).

12.4.1.

Matrices ortogonales y norma de vectores complejos (opcional)

Las matrices ortogonales han sido originalmente construdas para mantener invariante la norma de vectores
con componentes reales, dicha norma se define usualmente en la forma descrita por la Ec. (12.51)
xi xi = x0i x0i

(12.57)

debemos tener presente que en la demostraci


on no se usa en ning
un momento el car
acter real de los xi ni
tampoco de las componentes de la matriz aij . En conclusi
on, aunque la motivaci
on original involucra solo
n
umeros reales los resultados nos muestran que podemos hacer un enunciado m
as general
Theorem 8 Sea xT = (x1 , .., xn ) un arreglo vectorial con componentes complejas. El conjunto de transformaciones lineales m
as general que deja invariante la cantidad xi xi es el conjunto de matrices complejas A que
e = A1 .
cumplen la condici
on A
El punto es que en la mayora de los casos, la norma de vectores complejos no se define como xi xi sino en la
forma xi xi como ya se discuti
o. No obstante, existe una importante excepci
on, en relatividad especial cuando
usamos el espacio de Minkowski con eje temporal imaginario, definimos los vectores complejos (x1 , x2 , x3 , ict)
y su m
odulo cuadrado se define como xi xi = x21 + x22 + x23 c2 t2 .
Veamos ahora como act
uan la matrices ortogonales sobre el m
odulo cuadrado de un vector complejo cuando
tal m
odulo se define en la forma xi xi , siguiendo el algoritmo para multiplicaci
on de matrices rectangulares se
tiene que
e x ; x x
e
kxk2 = x
donde hemos definido la conjugada transpuesta del vector como el adjunto del vector simbolizado x . Escribimos entonces
kxk2 = x x

usando la propiedad (12.54) se tiene que si x0 = Ax siendo A una matriz ortogonal, la norma de x0 se escribe
como
0 2


] Ax = x
x = xe0 x0 = (Ax)
e Ax = x
e A
e A1 Ax = x
e (A )1 Ax

Ahora bien si la matriz es ortogonal real se tiene que A = A y se obtiene la invarianza de la norma usual
para vectores complejos de modo que se llega al siguiente
Theorem 9 Bajo una transformaci
on ortogonal real, la magnitud al cuadrado de vectores complejos definida
en la forma xi xi permanece invariante.
Sin embargo, las matrices ortogonales reales no son el conjunto m
as general de matrices que dejan invariante
la norma de vectores complejos. M
as adelante caracterizaremos al conjunto m
as general de matrices (complejas)
que dejan invariante la norma de n
umeros complejos, este conjunto se denomina matrices unitarias y contiene
a las matrices ortogonales reales como subconjunto propio.
Por otro lado multiplicando la Ec. (12.39) por su conjugada transpuesta, podemos escribir

g (x)
] (Ax) = (x)
(Ax)

e x
xe0 x0 = x


294CAPITULO 12. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS
y si imponemos la invarianza de la norma del vector complejo ante la transformaci
on se tiene que
kk2 = 1

(12.58)

en conclusi
on, todos los valores propios de una matriz que preserva la norma usual de los vectores complejos
tienen norma unidad3 .

12.4.2.

Transformaciones ortogonales propias e impropias

Figura 12.1: Conversi


on de un sistema coordenado dextr
ogiro en uno lev
ogiro. En la figura de la derecha el eje
X va hacia adentro del papel. N
otese que en el sistema dextr
ogiro se tiene que ux uy = uz en tanto que en
el sistema lev
ogiro se tiene que ux uy = uz
Previamente hemos encontrado que las matrices ortogonales solo pueden tener determinante 1. A continuaci
on mostraremos que una matriz ortogonal que describe a una transformaci
on contnua, no puede ser
descrita por una matriz de determinante 1. Consideremos la matriz ortogonal m
as simple con determinante
1 que es menos la identidad
S = 133

esta transformaci
on tiene la propiedad de cambiar el signo de cada una de las componentes de los ejes coordenados (si la transformaci
on es pasiva). Esta operaci
on nos convierte un sistema coordenado dextr
ogiro (de
mano derecha) en uno lev
ogiro (de mano izquierda) como se aprecia en la Fig. 12.1, esta operaci
on se denomina
inversi
on de los ejes coordenados4 . Una forma de realizar esta operaci
on es rotar alrededor de un cierto eje
en 180 , para luego realizar una reflexi
on con respecto al plano definido por dicho eje y que pasa por el origen
de coordenadas. Si tomamos por ejemplo el eje Z para la operaci
on de girar 180 , vemos que esta operaci
on
debe realizar la transformaci
on x, y, z x, y, z; la cual se puede obtener aplicando sobre el vector columna
(x, y, z) la siguiente matriz

1 0 0
rotaci
on 180 alrededor de Z = 0 1 0
0
0 1
3

N
otese que en este caso la suposici
on de que la matriz sea real no es necesaria, de modo que las matrices complejas m
as
generales que preservan la norma de los vectores complejos (matrices unitarias) tambien poseen valores propios con norma unidad.
4
En el sistema dextr
ogiro ux uy = uz en tanto que en el lev
ogiro ux uy = uz y lo mismo pasa con todos los productos
cruz fundamentales. Esto implica que el algoritmo del producto cruz en el sistema lev
ogiro cambia todos los signos respecto al
algoritmo del dextr
ogiro.

DE VECTORES Y ESCALARES POR SUS PROPIEDADES DE PARIDAD


12.5. CLASIFICACION
la matriz de reflexi
on debe convertir z z y dejar inalteradas las otras

1 0
ref lexi
on respecto al plano XY = 0 1
0 0

295

coordenadas

0
0
1

la composici
on de las dos operaciones (tomada en cualquier orden) nos da la matriz de inversi
on que cambia
de signo todas las coordenadas

1 0
0
Inversi
on = 0 1 0
0
0 1

la naturaleza discreta de esta operaci


on nos dice que una inversi
on de un sistema dextr
ogiro a uno lev
ogiro
no puede ser realizado por ning
un cambio contnuo en la orientaci
on de los ejes coordenados. Por lo tanto,
una inversi
on no puede corresponder a una transformaci
on contnua (por ejemplo, una rotaci
on contnua de
los ejes coordenados o el desplazamiento fsico de un cuerpo rgido). Ahora bien, teniendo en cuenta que toda
matriz ortogonal de determinante 1 se puede escribir como el producto de S con una matriz ortogonal de
determinante +1 (e.g. una rotaci
on m
as una inversi
on), la argumentaci
on anterior ser
a v
alida para todas las
matrices ortogonales de determinante 1. En consecuencia, las transformaciones ortogonales que representan
a cualquier transformaci
on contnua deben ser de determinante +1. Otra forma de ver esto es teniendo en
cuenta que la matriz que representa a una transformaci
on contnua, debe evolucionar en forma contnua desde
la identidad la cual tiene determinante +1, el cambio repentino a un determinante 1 no se puede lograr con
una transformaci
on contnua de los elementos de la matriz.
En virtud de lo anterior, las matrices ortogonales se dividen en dos grandes grupos: Las transformaciones propias (determinante +1) e impropias (determinante 1). Las primeras generan transformaciones
contnuas, en tanto que las otras representan una transformaci
on contnua combinada con una transformaci
on
discreta de inversi
on. Un estudio sistem
atico de las propiedades de transformaci
on de los vectores bajo la operacion de inversi
on (tambien conocida como transformaci
on de paridad) nos lleva a clasificar a los vectores y
escalares de acuerdo con tales propiedades de transformaci
on como veremos a continuaci
on.

12.5.

Clasificaci
on de vectores y escalares por sus propiedades de paridad

Tomemos una matriz antisimetrica Aa y construyamos una matriz equivalente A0a por medio de una
transformaci
on de similaridad
A0a = BAa B1
(12.59)
nos restringiremos a transformaciones de similaridad con matrices ortogonales reales B. En una transformaci
on
0
de similaridad ortogonal se conserva la antisimetra i.e. Aa tambien es antisimetrica, lo cual se puede ver
transponiendo la Ec. (12.59)
e
g
1 A
e 0a = B
e aB
e =B
eA
e aB
e = BAa B1 = A0a
A

En el caso de tres dimensiones, recordemos que los argumentos que nos llevaron a las Ecs. (12.20-12.22) nos
indicaron que a toda matriz Aa real antisimetrica y de dimensi
on 3 3 se le puede asociar un arreglo vectorial
vA . Esto implica que la matriz A0a tambien se puede escribir en la parametrizaci
on (12.19), y denotamos los
0
0
0
nuevos elementos como a1 , a2 , a3 . Un examen explcito de la transformaci
on de similaridad (12.59) en tres
dimensiones, muestra que los nuevos elementos a0i transforman como
a0i = |B| bij aj

(12.60)

esto a su vez se puede interpretar como la propiedad de transformaci


on para el arreglo vectorial vA asociado a
la matriz Aa . El arreglo vectorial vA transforma bajo una transformaci
on de similaridad ortogonal en la forma
0
vA
= |B| BvA

(12.61)


296CAPITULO 12. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS
si comparamos este comportamiento con el del vector posicion bajo transformaciones ortogonales
r0 = Br
notamos que la transformaci
on de vA es similar a la del vector posici
on excepto por el factor |B|. Para transformaciones propias (i.e. |B| = +1) ambas transformaciones son identicas. En contraste, ambas transformaciones
poseen un signo diferente bajo transformaciones ortogonales impropias. Recordando adem
as que una transformaci
on impropia consiste en una transformaci
on propia junto con una inversi
on, se deduce que el vector
0 difiere en un signo (con respecto al vector posici
vA
on) cuando se hace una transformaci
on de inversi
on. El
vector posici
on r invierte su signo bajo inversi
on en tanto que vA permanece inalterado ante una operaci
on de
inversi
on. Esto induce a definir dos tipos de vectores
1. Vectores polares: aquellos que bajo el operador de inversi
on, invierten el signo de sus componentes. El
vector posici
on (con origen fijo) es un prototipo para estos vectores.
2. Vectores axiales o pseudovectores: aquellos que permanecen inalterados ante una operaci
on de inversi
on,
el vector vA asociado a una matriz antisimetrica es el prototipo para esta clase de vectores.
Un ejemplo muy com
un de vector axial es aquel que proviene del producto cruz de dos vectores polares
VA = V1 V2
lo cual se puede ver teniendo en cuenta que bajo inversi
on de los ejes coordenados, cada vector V1 y V2
invierte su signo (por ser polares). Ejemplos comunes son el momento angular y el torque
L = rp ; = rF
similarmente el producto cruz de un vector axial por uno polar es un vector polar. De lo anterior y teniendo
en cuenta la fuerza de Lorentz
F = q (v B)

se ve que el campo magnetico debe ser un vector axial, ya que F y v son vectores polares. Este hecho es
consistente con la ley de Biot Savart que nos describe la integral de un vector axial diferencial ya que es el
producto cruz de dos vectores polares (de la forma dl b
r/r 2 ), la integraci
on es entonces un vector axial.
b definido
Una manera de establecer sistem
aticamente esta clasificaci
on es a traves del operador paridad P
til de obtener un escalar es a traves del
como aquel que invierte todas las coordenadas xi xi . Una forma u
producto punto, por ejemplo el producto punto rr no cambia su signo bajo paridad ya que cada vector cambia
su signo. En general, el producto punto entre dos vectores polares no cambia su signo bajo paridad y ser
an
el prototipo de los verdaderos escalares. Por otro lado, el producto punto de un vector polar con uno axial
invierte su signo bajo paridad, es decir, difiere del comportamiento de un verdadero escalar y se le denomina
un pseudoescalar. Si S es un escalar, SA un pseudoescalar, VP un vector polar y VA un vector axial, se
obtiene
b
b A = SA ; PV
b P = VP ; PV
b A = VA ; P
b (SVP ) = SVP
PS
= S ; PS
b (SA VA ) = SA VA ; P
b (VA VP ) = (VA VP ) ; P
b (VA VA ) = (VA VA )
P

b (VP VP ) = (VP VP ) ; P
b (SA SP ) = SA SP ; P
b (SVP ) = SVP ; P
b (SVA ) = SVA
P

desde un punto de vista pasivo se puede ver porque un vector polar invierte su signo bajo inversi
on. El vector
permanece inalterado en tanto que los ejes coordenados se invierten, de modo que las componentes en el nuevo
sistema coordenado aparecen invertidas. Que ocurre con un vector axial? ocurre que un vector axial lleva
consigo una convenci
on de quiralidad. Bajo inversi
on, un sistema coordenado dextr
ogiro se convierte en uno
levogiro, si tomamos el producto cruz de dos vectores polares
(1)

(2)

(2)

(1)

VAi = VP j VP k VP j VP k

i, j, k en orden cclico

el orden cclico requerido en esta ecuaci


on implica un cambio similar desde la regla de la mano derecha hacia la
regla de la mano izquierda. Por lo tanto, incluso en una interpretaci
on pasiva, hay un cambio real de direcci
on
de este producto cruz bajo inversi
on.

12.6. TRANSFORMACIONES ORTOGONALES PROPIAS

12.6.

297

Transformaciones ortogonales propias

La anterior discusi
on nos motiva a restringir nuestro estudio a las transformaciones ortogonales propias
dado que estaremos interesados en transformacioes contnuas. La propiedad de ortogonalidad usada en la forma
(12.54) nos lleva a la propiedad
e =1A
e
(A 1) A
tomando el determinante a ambos lados



e
e
|(A 1)| A
= 1 A


e
y como A
= |A| = 1, y la matriz identidad es simetrica se tiene que



 ^ 

e = |1 A| |(A 1)| = | (A 1)|
|(A 1)| = 1 A

y aplicando la propiedad (12.29) para matrices de dimensi


on impar
|(A 1)| = |A 1|
|(A 1)| = 0

(12.62)

y comparando con la ecuaci


on general de valores propios (12.40) se observa que = 1 es una soluci
on para tal
ecuaci
on. En conclusi
on, para una matriz ortogonal propia de dimensi
on impar, uno de los valores propios de
la matriz es = +1. Es importante enfatizar que esta conclusi
on solo es v
alida para matrices de dimensi
on
impar en virtud del uso de la Ec. (12.29). Para n par, b
asicamente se llega a una identidad trivial y no a
(12.62). Adicionalmente si la matriz A es real, se tiene que si es soluci
on de la ecuaci
on secular, tambien lo

sera .

12.6.1.

Matrices ortogonales reales propias en tres dimensiones

Para el caso especfico de tres dimensiones, es posible obtener m


as propiedades sobre los valores propios.
Dado que la dimensi
on es impar, tenemos al menos un valor propio igual a la unidad. Por convenci
on designemos
3 = +1 de modo que queremos obtener informaci
on sobre 1 y 2 . Ya hemos demostrado que el determinante
de una matriz es invariante ante una transformaci
on de similaridad. Por lo tanto, el determinante de A coincide
con el de la matriz en virtud de la relaci
on (12.47) por lo tanto para matrices ortogonales propias se tiene
que5
|A| = 1 2 3 = 1 2 = 1
(12.63)
y recordando que los valores propios son de m
odulo unidad para las matrices unitarias y en particular para las
matrices ortogonales reales (ver Ec. 12.58 y su discusi
on), tenemos
k1 k = k2 k = 3 = +1

(12.64)

todo complejo unitario se escribe de la forma ei . Teniendo en cuenta las Ecs. (12.63) y (12.64) podemos
escribir
1 = ei1 ; 2 = ei2 ; 3 = 1
1 2 = 1 = ei1 ei2 1 = 2
finalmente, la estructura de valores propios se escribe como
1 = ei ; 2 = ei ; 3 = 1
5

(12.65)

Esto es v
alido siempre que la matriz sea diagonalizable. Se puede demostrar que este es el caso para las matrices ortogonales
pero no lo trataremos aqu.


298CAPITULO 12. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS
Vemos que 1 es el complejo conjugado de 2 lo cual es consistente con el hecho de que si la matriz A es
on de la ecuaci
on secular, siempre que lo sea. Esto a su vez implica que 1 y 2 son ambos
real, es soluci
complejos o ambos reales. Son reales cuando = 0, y complejos en otros casos. Tenemos entonces tres
posibles estructuras
1. Cuando = 0, todos los autovalores son +1. La matriz de transformaci
on es la identidad, este caso es
la soluci
on trivial
2. Cuando = , 1 = 2 = 1, y 3 = 1. Esta transformaci
on se puede considerar como una inversi
on
en dos ejes coordenados manteniendo el tercero inalterado, como se puede ver si usamos estos valores de
i en la matriz (12.46) y la aplicamos a un vector arbitrario. Igualmente se puede ver como una rotaci
on
de con respecto al tercer eje.
3. 6= 0, , en este caso 1 y 2 son complejos y 1 = 2 .

12.7.

Matriz adjunta

Para definir la norma de un vector complejo en forma matricial podemos escribir


e x
kxk2 = xi xi kxk2 = x

n
otese que hemos tenido que escribir a la izquierda el vector traspuesto (es decir vector fila) a fin de que la
e se obtiene al conjugar
operaci
on este definida seg
un la discusi
on en la secci
on (12.1.2). La matriz rectangular x
e como la adjunta de la matriz x y la denotamos con
y trasponer la matriz rectangular x, vamos a definir a x
un obelisco
e
(12.66)
x x
vamos a definir ahora una funci
on compleja de los vectores columna x e y en la forma
(x, y) x y
esta operaci
on cumple con las propiedades de un producto interno i.e.
(x, y) = (y, x) ; (x,y + z) = (x, y) + (x, z) ; (x, x) = kxk2

(12.67)

vemos que si hacemos x = y se obtiene la norma al cuadrado del vector x. Adicionalmente, si los vectores
son reales esta operaci
on me genera el producto punto. En general, diremos que un vector x es unitario o
normallizado si (x, x) = kxk2 = 1, y dos vectores x e y ser
an ortogonales si (x, y) = 0.
Por otra parte, si transformamos el vector x a traves de cierta matriz
x0 Mx

(12.68)

y realizamos el producto escalar o producto interno


C = x0

y = x0 , y

nos preguntamos ahora como debe transformar el vector y (sin alterar al vector x) de modo que este producto
interno permanezca intacto, es decir de modo que
x0



y = x y0 x0 , y = x, y0

(12.69)

siendo y0 la correspondiente transformaci


on en y denotemos entonces
y0 = By

(12.70)

12.8. MATRICES UNITARIAS Y CAMBIOS DE BASE (OPCIONAL)

299

a la matriz B la llamamos la matriz adjunta de M. Reemplazando (12.68) y (12.70) en (12.69) resulta

^ y = x (By) x
f y = x (By)
e M
(Mx) y = x (By) (Mx)

y definiendo a la conjugada traspuesta de la matriz M en forma an


aloga a la Ec. (12.66)
f
M M

obtenemos

(12.71)

x M y = x By
dado que esto es v
alido para todo x e y, se concluye que
B = M
donde el smbolo M indica la conjugada traspuesta de la matriz M concepto que se extiende naturalmente
de la definici
on an
aloga para vectores columna. La matriz adjunta de M es entonces su conjugada traspuesta.
En notaci
on de producto interno escribimos


(12.72)
(Mx, y) = x, M y

Veremos que varias propiedades interesantes de transformaci


on se traducen en propiedades de la matriz adjunta.
Es f
acil ver las siguientes propiedades

 

M = M ; (AB) = B A ; M = |M|
a continuaci
on veremos algunas matrices especiales relacionadas con la adjunta de una matriz.

12.8.

Matrices unitarias y cambios de base (opcional)

Nos preguntamos ahora por el conjunto m


as general de matrices que al transformar a ambos vectores deja
invariante el producto interno i.e.


(x, y) = x0 , y0 x y = x0 y0 con x0 = Ux ; y0 = Uy

resulta entonces que

x y = (Ux) (Uy) = x U Uy
al ser v
alido para todo x y para todo y resulta
U U = 1

(12.73)

U es entonces la inversa a izquierda de la matriz U pero recordando que para matrices cuadradas la inversa
a izquierda es igual a la inversa a la derecha resulta
U = U1

(12.74)

En particular, si x = y observamos que estas transformaciones dejan invariante la norma del vector x. Por
lo tanto la propiedad (12.74) define al conjunto m
as general de transformaciones lineales que preservan el
producto interno y en particular la norma de los vectores. A las matrices que cumplen esta propiedad se les
denomina matrices unitarias. Cuando los elementos matriciales son complejos, la magnitud de los vectores
(que en general tendr
an tambien componentes complejas), no ser
a invariante bajo una transformaci
on con
matrices ortogonales. Las matrices unitarias son matrices complejas que mantienen invariante la norma de
vectores complejos. Los valores propios de las matrices unitarias poseen m
odulo unidad como se demostr
o en
(12.58) pues debemos recordar que la u
nica condici
on que se us
o para llegar a (12.58) fue la preservaci
on de


300CAPITULO 12. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS
la norma de los vectores (reales o complejos) ante la transformaci
on asociada a la matriz (real o compleja). El
determinante se obtiene de la propiedad (12.73)




e

U U = 1 U
|U| = 1 |U| |U| = 1
|det U |2 = 1 det U = ei

de modo que el determinante al igual que los valores propios es un n


umero complejo con norma unidad. Esto
es consistente con el hecho de que cuando la matriz es diagonalizable, el determinante es el producto de sus
valores propios.
Existe otra propiedad fundamental de las matrices unitarias que con frecuencia la literatura la toma como
definici
on. Una matriz unitaria es aquella que transforma cualquier base ortonormal en otra base ortonormal,
ve
amoslo. Sean {ui } un conjunto de vectores ortonormales con respecto a alg
un producto interno i.e.
(ui , uj ) = ij
transformemos cada elemento ui de la base con una matriz unitaria i.e. u0i = Uui tenemos que

u0i , u0j = (Uui , Uuj ) = (ui , uj )

donde hemos usado la definici


on de matriz unitaria como aquella que no altera el valor del producto interno.
Por lo tanto

u0i , u0j = (ui , uj ) = ij

que es lo que se quera demostrar. Esta propiedad es de suma importancia dado que usualmente estamos
interesados en utilizar bases ortonormales incluso cuando cambiamos de base. Si definimos un espacio vectorial
donde los escalares son reales los vectores base est
an asociados al espacio Rn , en tanto que si los escalares son
complejos hablamos de una base en el espacio unitario Cn de dimensi
on n donde cada componente representa
un n
umero complejo. El espacio C2 es por ejemplo de gran importancia en la caracterizaci
on del espn en
mec
anica cu
antica y los cambios de base en este espacio se realizan con matrices unitarias de dimensi
on dos.
Para nuestros prop
ositos estaremos interesados en vectores de Rn en cuyo caso ser
a suficiente trabajar el
subconjunto propio de matrices unitarias reales: es decir el conjunto de transformaciones ortogonales reales
propias6 . Los cambios de base se realizar
an entonces con matrices ortogonales reales propias. Recordemos
entonces que ante un cambio de base, un operador activo A cambia su representaci
on matricial en la forma
A0 = BAB1

(12.75)

y si ambas bases son ortonormales, B es una matriz unitaria u ortogonal real propia seg
un el espacio en el que
trabajemos.
La condici
on de unitariedad (12.74) se puede escribir en componentes en la forma siguiente
e = 1 ; U
e U = 1 uij u
UU
ejk = jk

uij ukj = jk

uji ujk = jk

u
eij ujk = jk

(12.76)

el primer conjunto de ecuaciones (12.76) nos indica que los vectores fila que constituyen a la matriz unitaria
son ortonormales entre s. Similarmente, el segundo conjunto de ecuaciones (12.76) muestra la ortonormalidad
de los vectores columna que constituyen la matriz unitaria. Es claro que solo un conjunto de estas relaciones
es independiente y el otro es redundante. Naturalmente, si las componentes son reales las condiciones de
unitariedad (12.76) coinciden con las condiciones de ortogonalidad Ecs. (12.52, 12.53).
Finalmente, cabe enfatizar que un cambio de base en Cn (Rn ) de la forma (12.75) no requiere que la matriz
de transformaci
on sea unitaria u ortogonal. Solo se necesita que la matriz pasiva de transformaci
on sea no
singular. El problema es que la nueva base no ser
a ortonormal lo cual puede traer varias dificultades que
6

Las matrices unitarias complejas mantienen la norma de los vectores que originalmente son reales, pero me pueden llevar un
vector de Rn a un vector de C n .

12.8. MATRICES UNITARIAS Y CAMBIOS DE BASE (OPCIONAL)

301

ilustraremos con un sencillo ejemplo, escribamos el producto interno de un cierto conjunto de vectores base en
la forma
(vi , vj ) = gij
(12.77)
y denominamos a gij el tensor metrico. Si los vectores unitarios son ortonormales entonces gij = ij . Si la base
es ortogonal pero los vectores base no est
an normalizados gij es no trivial pero sigue siendo diagonal. Si la
base no es ortogonal ni normal este tensor es adem
as no diagonal. Escribimos x e y en terminos de la base y
calculamos el producto interno entre ellos
x

y = j vj (x, y) = (i vi , j vj ) = i j (vi , vj )

i vi ;

(x, y) = i gij j
o en notaci
on matricial

(x, y) = G
Sea una matriz A que representa a un operador activo y veamos que relaci
on tiene esta matriz con su adjunta
B en esta base
(Ax, y)

(x, By) (Ax) Gy = x G (By)

x A Gy = x GBy
que nos lleva a la condici
on

A G = GB B = G1 A G
n
otese que la representaci
on del operador adjunto no est
a dada por la conjugada traspuesta de la representaci
on
del operador original.
Es f
acil ver la condici
on para que una matriz represente a un operador activo unitario en esta base
(Ux, Uy)



(x, y) x U G (Uy) = x Gy U GU = G

G1 U G = U1

(12.78)

En bases no ortonormales, la condici


on de ortogonormalidad entre dos vectores ai y aj se escribe
(ai , aj ) = ai Gaj = ij
Esto nos motiva a introducir una sutil diferencia entre operadores lineales adjuntos, unitarios, etc. y matrices adjuntas, unitarias, etc. Tomemos de ejemplo los operadores unitarios y matrices unitarias para la
discusi
on. En general la literatura utiliza el termino matriz unitaria para los arreglos matriciales que cumplen el algoritmo matricial U1 = U esta es una definici
on algebr
aica. Por otro lado, se define un operador
lineal unitario como aquel que deja invariante el producto interno entre dos vectores arbitrarios, esta es una
definici
on geometrica y por tanto independiente del sistema coordenado que se use. No obstante, una matriz
unitaria en el sentido aqu expuesto solo representa a un operador unitario cuando la base es ortonormal.
Cuando la base no es ortonormal la representaci
on matricial de un operador unitario est
a dada por el algoritmo (12.78) y la llamaremos representaci
on matricial del operador unitario. Por supuesto, la misma
discusi
on vale para el concepto de adjunto y otros conceptos que veremos a continuaci
on como hermiticidad,
normalidad, etc.
Lo anterior nos ilustra algunas dificultades que aparecen cuando se toman bases no ortonormales, por esta
raz
on es usual que los cambios de base se hagan garantizando que se llega a otra base ortonormal i.e. con
matrices unitarias u ortogonales reales. Veremos sin embargo, que las bases no ortonormales nos permiten
resolver un problema modificado de valores propios con muchas aplicaciones en Fsica (ver Sec. 12.11).


302CAPITULO 12. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS

12.9.

Matrices Hermticas y sim


etricas reales

Se define una matriz hermtica o autoadjunta si dicha matriz coincide con su adjunta i.e.
e A
A=A

Es f
acil demostrar que para una matriz hermtica de dimensi
on arbitraria, su naturaleza hermtica se
preserva ante una transformaci
on de similaridad unitaria. Bajo una transformaci
on de similaridad
A0 = BAB1
la matriz conjugada traspuesta i.e. la adjunta, estar
a dada por

A0 = B1 AB

donde hemos usado el car


acter hermtico de A. Si la matriz B es unitaria entonces B1 = B y B1


B = B de lo cual resulta
A0 = BAB1 = A0

debe enfatizarse que la si la matriz del cambio de base B no es unitaria, en general la matriz transformada no
sera hermtica. Cuando los elementos matriciales son reales las matrices hermticas se vuelven simetricas y las
matrices unitarias se vuelven ortogonales. Por lo tanto las matrices simetricas reales y ortogonales reales son
casos particulares de matrices hermticas y unitarias respectivamente.
Veamos algunas propiedades de las matrices hermticas: hemos visto que la soluci
on del problema de valores
y vectores propios de una cierta matriz A, nos permite obtener una matriz que genera un cambio de base que
diagonaliza a la matriz A. La matriz de transformaci
on (m
as exactamente su inversa), se obtiene adjuntando
los arreglos columna que corresponden a los vectores propios y la matriz diagonalizada consta de los valores
propios colocados en la diagonal de la nueva matriz ver Ecs. (12.47, 12.46). Este procedimiento tiene sin
embargo algunos problemas en el caso general, por ejemplo si no todos los vectores propios son linealmente
independientes la matriz que debe diagonalizar se vuelve singular y por tanto, no existe su inversa. Esto implica
que en particular pueden existir problemas con la diagonalizaci
on cuando hay valores propios degenerados. Sin
embargo, el proceso de diagonalizaci
on es en general m
as sencillo para las matrices Hermticas.
Una de las primeras propiedades interesantes de las matrices hermticas es que sus valores propios son
reales, a
un cuando la matriz sea compleja. Denotaremos a la matriz Hermtica como H para enfatizar en su
hermiticidad, adem
as V(j) denotar
a el jesimo vector propio, con valor propio j . La ecuaci
on de valores
propios se escribe como
HV(j) = j V(j)
haciendo el producto por la izquierda con el vector adjunto (conjugado traspuesto) correspondiente al vector
propio nesimo tenemos
V(n) HV(j) = j V(n) V(j)
(12.79)
para la ecuaci
on de valores propios correspondiente al nesimo vector propio
HV(n) = n V(n)
podemos tomar la ecuaci
on adjunta
V(n) H = n V(n)
y multiplicamos por el vector (columna) V(j) a la derecha de ambos miembros, teniendo en cuenta adem
as
que la matriz H es hermtica, se obtiene
V(n) HV(j) = n V(n) V(j)

(12.80)

(j n ) V(n) V(j) = 0

(12.81)

restando las Ecs. (12.79, 12.80) resulta


12.9. MATRICES HERMITICAS Y SIMETRICAS
REALES
si j = n se obtiene que

303


2


(n n ) V(n) = 0

de modo que n = n y los valores propios son reales como se quera demostrar. Ahora bien, si j 6= n y j 6= n ,
es decir si estos valores propios no son degenerados, se obtiene de (12.81)


(j n ) V(n) V(j) = 0 V(n) V(j) = V(n) , V(j) = 0

donde hemos usado el car


acter real de los valores propios. Vemos entonces que los vectores propios correspondientes a valores propios diferentes son ortogonales. Este hecho tiene un gran alcance en terminos de
aplicaciones. Por ejemplo en ecuaciones diferenciales, muchos operadores diferenciales son lineales y hermticos, tales operadores act
uan sobre espacios vectoriales de funciones (usualmente de dimensi
on infinita) sus
valores propios son reales y sus vectores propios son ortogonales al menos en ausencia de degeneraci
on, estos
vectores propios permiten generalmente construr una base para el espacio vectorial en cuesti
on. En consecuencia el problema de Sturn-Liouville se reduce a un problema de valores propios de un operador hermtico que al
ser lineal admite una representaci
on matricial (aunque estas matrices son en general de dimensi
on infinita lo
cual introduce problemas que no trataremos aqu). Es necesario enfatizar sin embargo que los vectores propios
asociados a valores propios degenerados no son necesariamente ortogonales.
Si la matriz hermtica es real se convierte en una matriz sim
etrica real y los cosenos directores (i.e. las
componentes de los vectores propios) ser
an tambien reales, esto implicar
a a su vez que la matriz de rotaci
on
n
que nos lleva a diagonalizar la matriz es real, en consecuencia si partimos de unos ejes en R reales, la
transformaci
on me lleva a otro conjunto de ejes Rn reales en donde la matriz es diagonal. En el caso del
on corresponde a una reorientaci
on
espacio Euclideano Rn , el cambio de base que conduce a la diagonalizaci
a un nuevo conjunto de ejes en donde la representaci
on matricial es diagonal. Llamaremos a estos ejes los
ejes principales asociados a la matriz. Los ejes estar
an orientados en la direcci
on de los vectores propios
independientes asociados a la matriz.
Para enfatizar la importancia de que los valores propios de matrices reales simetricas sean reales, recordemos
por ejemplo que las matrices ortogonales reales en tres dimensiones, solo poseen un valor propio real excepto en
casos triviales y por tanto una sola direcci
on real asociada a un vector propio (eje de rotaci
on). En contraste,
al ser los valores propios de H reales, y que los vectores asociados son ortogonales (al menos en ausencia de
degeneraci
on) nos indica que hay n direcciones reales de los vectores propios que son mutuamente ortogonales.
En funci
on de la matriz X1 que diagonaliza a H con una transformaci
on de similaridad, vemos que esto
equivale a que dicha matriz sea ortogonal y real, de modo que tenemos garantizado el hecho de que si partimos
de un sistema cartesiano ortogonal real, la matriz X1 nos lleva a otro sistema cartesiano ortogonal real.

12.9.1.

Problema de valores propios de matrices hermticas en tres dimensiones

Una propiedad interesante para la matrices hermticas en tres dimensiones es que dados dos vectores
propios ortogonales y sus valores propios correspondientes, el tercer vector propio se puede hallar simplemente
construyendo un sistema coordenado dextr
ogiro con los dos anteriores. Para ello debemos demostrar que
(p)
(p)
si u1 , u2
son vectores propios unitarios ortogonales que generan ejes principales, entonces un vector u3
ortogonal a los anteriores tambien es vector propio que genera el tercer eje principal7 . Para demostrarlo,
tengamos en cuenta que de acuerdo con la ecuaci
on de vectores propios se cumple por hip
otesis que
(p)

(p)

Hp u1 = 1 u1
(p)

aplicando ui

(p)

(p)

; Hp u2 = 2 u2

(12.82)

a la izquierda
(p)

ui

(p)

(p) (p)
u1

Hp u1 = 1 ui

(p)

; ui

(p)

(p) (p)
u2

Hp u2 = 2 ui

; i = 1, 2, 3

7
Cuando los vectores son complejos n dimensionales, es decir que yacen en el espacio C n donde cada componente es compleja,
la relaci
on de ortogonormalidad se define por (ui , uj ) = ui uj = ij . Para el caso de vectores reales, el tercer eje principal se puede
generar con u3 = u1 u2 que garantiza la obtenci
on de ejes a derecha.


304CAPITULO 12. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS
tendremos entonces
(Hp )i1 = 1 i1 ; (Hp )i2 = 2 i2
de lo cual resulta que
(Hp )21 = (Hp )31 = (Hp )12 = (Hp )32 = 0
el car
acter hermtico de la matriz nos dice que los otros elementos fuera de la diagonal tambien son cero.
(p)
(p)
(p)
De modo que la matriz construda en la base u1 , u2 , u3 s es diagonal y en consecuencia el tercer eje es
tambien un eje principal. N
otese que el car
acter hermtico de la matriz es necesario para aseverar que el tercer
(p)
(p)
(p)
eje tambien es principal. Si la matriz es simetrica real, los ejes definidos por u1 , u2 y u3 tambien ser
an ejes
principales.
Ya hemos visto que si los valores propios no son todos distintos no podemos garantizar que los vectores
propios sean ortogonales entre s. Sin embargo, en virtud de lo anterior, este problema no presenta mayor
obst
aculo en tres dimensiones, al menos para ejes reales. Supongamos por ejemplo que 1 = 2 6= 3 , en
este caso siempre ser
a posible hallar al menos un vector propio que satisfaga la ecuaci
on de valores propios
asociada al valor propio degenerado 1 , este vector tiene que ser ortogonal al vector propio asociado a 3 , estos
dos vectores propios ya me determinan dos ejes principales ortogonales de modo que el tercero se construye
simplemente definiendo un sistema coordenado dextr
ogiro. En este caso sin embargo podemos decir algo m
as,
(p)
(p)
si definimos una nueva base en donde rotamos solo los vectores u1 y u2 i.e. los vectores asociados a la
degeneraci
on, tenemos que

0
cos sin 0
u1
u1
u02 = sin cos 0 u2
0
0
1
u3
u3

se puede verificar que los nuevos vectores u01 , u02 tambien son vectores propios con valor propio 1 = 2 . Debe
enfatizarse que la matriz de transformaci
on debe ser ortogonal real. Esto implica entonces que dados dos valores
propios degenerados 1 = 2 dos vectores propios independientes asociados a este valor propio degenerado me
definen un plano en donde todos los vectores que yacen en tal plano son vectores propios. Los ejes principales son
entonces cualquier par ortogonal de ejes en este plano. Tenemos entonces que esta degeneraci
on est
a asociado
alogamente, si todos los valores propios son iguales, todas las
a una simetra axial (alrededor del eje X3 ). An
direcciones del espacio conducen a vectores propios, es decir tenemos una simetra esferica pero en este caso
la matriz ya estar
a diagonalizada, de modo que la degeneraci
on total no representa tampoco un problema en
tres dimensiones.

12.9.2.

Matrices sim
etricas reales en R3

Finalmente, para matrices simetricas reales (i.e. hermticas reales) es interesante la interpretaci
on geometrica que se le puede dar a los ejes principales en R3 . Tomemos un escalar definido por cierto vector unitario real
en la forma
e Hn H
n
(12.83)

si denotamos 1 , 2 , 3 los cosenos directores de n tenemos


n = i ui

y podemos escribir la Ec. (12.83) usando el car


acter simetrico de H
i Hij j H
H11 21 + H22 22 + H33 23 + 2H12 1 2 + 2H13 1 3 + 2H23 2 3 = H
No obstante ser
a m
as pr
actico escribir esta ecuaci
on en forma normalizada para lo cual definimos un vector
en la forma
n

(12.84)
H

12.10. MATRICES NORMALES (OPCIONAL)

305

ahora dividimos por H a ambos lados de (12.83) con lo cual queda


eH = 1

(12.85)

H11 21 + H22 22 + H33 23 + 2H12 1 2 + 2H13 1 3 + 2H23 2 3 = 1

(12.86)

usando el car
acter simetrico de H, esta ecuaci
on se escribe

si la consideramos como una funci


on en tres variables esta es la ecuaci
on de una superficie en el espacio de
configuraci
on con ejes 1 , 2 , 3 . Podemos realizar un cambio de base a traves de una matriz ortogonal real
propia B, reescribiendo (12.85) de la siguiente forma



e BHB1 B = 1
e B1 B H B1 B = 1 e B

] BHB1 (B) = 1
(B)

y dado que para matrices simetricas reales es posible encontrar una matriz ortogonal real propia que la
diagonalice con una transformaci
on de similaridad, escogemos a B como la matriz de diagonalizaci
on (que se
construira con los vectores propios de H) tenemos entonces que BHB1 = siendo la matriz diagonal con
los valores propios en la diagonal. Resulta entonces
e0 0 = 1 ;

0 B

(12.87)

Esto implica que en general siempre es posible pasar a un sistema coordenado con ejes 01 , 02 , 03 en donde la
Ec. (12.86) toma su forma normal
02
02
(12.88)
1 02
1 + 2 2 + 3 3 = 1
Si todos los coeficientes i son positivos, entonces la Ec. (12.88) define la superficie de un elipsoide, estando
los ejes principales del elipsoide a lo largo de los nuevos ejes de coordenadas. Esto ocurrir
a cuando la matriz
H sea una matriz positiva como se discutir
a en la secci
on 12.11. A manera de ejemplo, se sabe que para el
tensor de inercia los momentos principales de inercia (elementos diagonales del tensor) son positivos cualquiera
que sea la inclinaci
on de los ejes, lo cual garantiza que la forma diagonal tiene solo coeficientes positivos. La
forma cuadr
atica (12.88) es precisamente la forma que tiene la Ec. (12.86) en un sistema de coordenadas en el
cual la matriz simetrica real es diagonal. Es decir los ejes principales que vuelven diagonal a H son los mismos
que llevan a la ecuaci
on de un elipsoide a su forma normal. Los valores propios en consecuencia determinan
las longitudes de los ejes del elipsoide. Si dos valores propios coinciden, el elipsoide tendr
a dos ejes iguales de
modo que ser
a un elipsoide de revoluci
on manifestando la simetra axial asociada, si la degeneraci
on es total,
el elipsoide es una esfera manifestando la simetra esferica del problema.
Por supuesto es posible que los coeficientes en (12.88) y por lo tanto los valores propios de la matriz
simetrica asociada no sean positivos, en tal caso estaremos transformando otra clase de superficie (en general
c
onicas) a su forma normal.

12.10.

Matrices normales (opcional)

Hemos visto que una matriz n n se puede diagonalizar a traves de una transformaci
on de similaridad
siempre que se pueda encontrar un conjunto de n vectores propios linealmente independientes, de tal modo
que se pueda construr una matriz no singular de diagonalizaci
on. Adicionalmente, hemos visto que es deseable
que la diagonalizaci
on se pueda realizar a traves de una matriz unitaria u ortogonal real a fin de pasar de
una sistema ortonormal a otro sistema ortonormal. Sin embargo, la diagonalizaci
on por matrices unitarias no
es posible para cualquier matriz, queremos indagar entonces cual es el conjunto m
as general de matrices que
pueden ser diagonalizadas por matrices unitarias a traves de transformaciones de similaridad. Para averiguarlo,
partamos de la hip
otesis de que la matriz A es diagonalizable con una matriz unitaria
UAU = UA U =


306CAPITULO 12. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS
donde la segunda ecuaci
on es simplemente la adjunta de la primera. Multiplicando las dos ecuaciones en
diferente orden tenemos






UAU UA U
= ; UA U UAU =
UAA U = ; UA AU =

donde hemos usado el car


acter unitario de U y el hecho de que dos matrices diagonales conmutan entre s.
Restando las dos ecuaciones queda
h 


 i
U AA A A U = 0 U U AA A A U U = U 0U
AA A A = 0

por tanto para que una matriz sea diagonalizable con una transformaci
on unitaria, es necesario que la matriz
conmute con su adjunto, mas adelante demostraremos la suficiencia de esta condici
on. LLamaremos entonces
matrices normales a aquellas que conmutan con su adjunto i.e.
h
i
AA A A A, A = 0

en esta secci
on, la notaci
on de parentesis cuadrados indicar
a conmutador y no corchete de Poisson. Puede
demostrarse sin embargo, que los conmutadores obedecen un algebra similar a la de los corchetes de Poisson
Ecs. (8.9, 8.12). Es inmediato ver que las matrices hermticas y unitarias son casos particulares de matrices
normales, por tanto todos los resultados que se deriven aqu ser
an v
alidos para matrices hermticas y unitarias.
Veremos entonces algunas de las propiedades de las matrices normales. Escribamos la ecuaci
on de valores
propios y su correspondiente adjunta


(A 1) x = 0 ; x A 1 = 0
Bx = 0 ; x B = 0 ; B A 1

(12.89)

calculemos el siguiente conmutador


h
i
h
i h
i
(A 1) , (A 1) = A 1, A 1 = A , A 1 [ 1, A 1]
h
i h
i h
i h
i
= A , A 1 = A , A A , 1 = A , A = 0

donde hemos usado el hecho de que la identidad conmuta con cualquier matriz. Tenemos entonces que
h
i h
i
(A 1) , (A 1) B , B = 0
(12.90)
de modo que B es tambien una matriz normal. Usando (12.89) y (12.90) resulta

 

B x = 0
x B Bx = 0 = x BB x B x


B x = 0 A 1 x = 0

esto nos demuestra que para matrices normales, A tiene los mismos autovectores de A pero sus autovalores
son los conjugados de los autovalores de A.
Usando lo anterior, tomemos ahora la ecuaci
on de valores propios para A y A en la forma
A xi = i xi

; Axj = j xj

tomando la traspuesta de la primera ecuaci


on y multiplicando la segunda ecuaci
on por xi se tiene
xi A = i xi

; xi Axj = j xi xj

12.11. PROBLEMA DE VALORES PROPIOS MODIFICADO

307

multiplicando la primera ecuaci


on por xj a la derecha y restando las dos ecuaciones resulta
(i j ) xi xj = 0
para i 6= j se tiene que

xi xj = (xi , xj ) = 0

de modo que los autovectores correspondientes a autovalores diferentes son ortogonales. Esto significa que al
construr la matriz de diagonalizaci
on sus filas ser
an ortogonales (en el sentido del producto interno) y por
tanto formar
an un matriz unitaria. Esto indica que al menos en ausencia de degeneraci
on podemos construr
n vectores linealmente independientes ortogonales. La matriz de vectores propios tendr
a columnas ortogonales
(en el sentido del producto interno) y por tanto formar
a una matriz unitaria. Entonces una matriz normal puede
ser diagonalizada por una matriz unitaria. Cuando existe degeneraci
on, hay una mayor libertad para escoger
los vectores ortogonales asociados a los valores propios degenerados. Esto prueba la condici
on de suficiencia
arriba mencionada. Tenemos entonces que las matrices normales son el conjunto m
as general de matrices que
pueden diagonalizarse con una matriz unitaria.
Ya hemos dicho que las matrices unitarias y hermticas son normales. Por tanto, una matriz unitaria
puede ser diagonalizada por otra matriz unitaria que significado puede tener la diagonalizaci
on de una matriz
unitaria por otra matriz unitaria?. Esto tendr
a sentido geometrico si la matriz que se diagonaliza es activa
(por ejemplo una matriz que representa la rotaci
on de un vector en Cn o en Rn ) en tanto que la matriz que
diagonaliza debe ser pasiva (reorientaci
on de los ejes en Cn o en Rn ).

12.11.

Problema de valores propios modificado

En el tratamiento de los osciladores acoplados, se llega a una ecuaci


on matricial de la forma
Va = Ta

(12.91)

Donde T y V son matrices, un n


umero complejo y a un vector columna. N
otese que la Ec. (12.91), es una
ecuaci
on de valores propios con estructura diferente a la mostrada en (12.39), ya que al operar V sobre a no
obtenemos a por una constante sino una constante multiplicada por Ta. Adicionalmente, asumiremos que las
matrices T y V en la Ec. (12.91) son simetricas y reales y adem
as T es definida positiva en tanto que V es
positiva8 . Con estas hip
otesis de trabajo demostraremos las siguientes propiedades:
1. Los valores propios son reales no negativos. Si adem
as V es definida positiva, los valores propios
ser
an estrictamente positivos.
2. Si V no es definida positiva, tendremos un valor propio nulo mdegenerado, donde m es el n
umero de
vectores propios ak (no triviales) linealmente independientes tal que ak Vak = 0.
3. Las componentes de los autovectores a son reales, excepto por una posible fase global.
4. Los autovectores a correspondientes a valores propios diferentes son ortogonales, aunque bajo una metrica
diferente como veremos m
as adelante.
5. La matriz de autovectores A diagonaliza tanto a T como a V. Esta diagonalizaci
on se realiza con una
transformaci
on de congruencia que definiremos m
as adelante. La matriz T se diagonaliza a la identidad
y la matriz V se diagonaliza a una matriz cuya diagonal contiene los valores propios.
8

Se dice que una matriz M es definida positiva cuando e


aMa 0 para todo a, y solamente es cero si a = 0. Cuando e
aMa 0
pero no es necesario que a sea nulo para que esta cantidad sea nula, decimos que la matriz es positiva.


308CAPITULO 12. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS
Para demostrar esas propiedades comencemos por rotular los valores propios k y los correspondientes
vectores propios a(k) el parentesis indica que estamos rotulando un vector propio y no una componente del
vector, reescribimos la Ec. (12.91) en la forma
Va(k) = k Ta(k)

(12.92)

la ecuaci
on adjunta resultante (para cualquier otro valor y vector propio) es
a(m) V = m a(m) T

(12.93)

donde hemos usado el car


acter real y simetrico de T y V 9 . Multiplicando (12.93) por a(k) a la derecha,
multiplicando (12.92) por a(m) a la izquierda y sustrayendo se obtiene
0 = k a(m) Ta(k) m a(m) Ta(k)
0 = (k m ) a(m) Ta(k)

(12.94)

cuando k = m la Ec. (12.94) queda de la forma


(k k ) a(k) Ta(k) = 0

(12.95)

Queremos probar que el producto a(k) Ta(k) es real y positivo10 . Para ello separamos a(k) en sus partes real e
imaginaria
a(k) = (k) + i(k)
(12.96)
la matriz producto se escribe como



(k) i(k)
T (k) + i(k)


=
e(k) T(k) + e(k) T (k) + i
e(k) T (k) e(k) T(k)

a(k) Ta(k) =
a(k) Ta(k)

(12.97)

donde hemos usado el hecho de que por construcci


on los vectores , son reales y por tanto su adjunto
coincide con su traspuesto. La parte imaginaria en (12.97) se anula debido a la simetra de T de modo que el
factor a(k) Ta(k) es real.
a Ta(k) =
e(k) T(k) + e(k) T
(12.98)
(k)

(k)

Pero dado que T es definida positiva para vectores reales, entonces los dos miembros de la derecha son positivos
y solo son cero si todas las componentes de y son cero, es decir si a = 0. Esto nos lleva a la conclusi
on de
que toda matriz simetrica definida positiva para vectores reales tambien ser
a definida positiva para vectores
complejos i.e. si a 6= 0 tenemos
a(k) Ta(k) > 0

(12.99)

combinando (12.99) con (12.95) se obtiene que los k son reales11 .


Ahora puesto que los valores propios son reales, los cocientes de las componentes de los autovectores aj(k)
determinados por las Ecs. (12.91) tienen que ser todos reales. Hay por supuesto a
un un grado de arbitrariedad
ya que el valor de una componente particular de los aj(k) se puede escoger a voluntad sin violar la Ec. (12.91).
Podemos entonces requerir que esta componente sea real y el car
acter real de k asegura entonces el car
acter
9

Estrictamente, solo estaramos usando su car


acter hermtico.
Asumiremos que T es una matriz definida positiva solo para vectores reales a, y llegaremos a que tambien ser
a definida positiva
para vectores complejos.
11
Asumimos que el factor es estrictamente positivo ya que estamos interesados en los vectores propios no triviales.
10

12.11. PROBLEMA DE VALORES PROPIOS MODIFICADO

309

real de todas las otras componentes12 . Multipliquemos ahora la Ec. (12.92) por e
a(k) a la izquierda y resolvemos
para k
e
a(k) Va(k) = k e
a(k) Ta(k)
e(k) Va(k)
a
k =
e
a(k) Ta(k)

(12.100)

y como los vectores a(k) son reales y los asumimos no nulos13 , el numerador es no negativo y el denominador
es estrictamente positivo en virtud de la car
acter positivo de V y definido positivo de T. Por tanto los valores
propios k son no negativos. Si adicionalmente V es definida positiva, el numerador es tambien positivo y
por lo tanto los valores propios son estrictamente positivos. Por otro lado, si V no es definida positiva, existe
e(k) Va(k) = 0, por tanto tendremos m
un conjunto m de vectores no nulos linealmente independientes tal que a
valores propios nulos.
Volvamos a la Ec. (12.94) para la cual hemos examinado el caso en que k = m Ec. (12.95). Estudiemos
entonces el caso en el cual m 6= k, teniendo en cuenta que los vectores y valores propios son reales
a(m) Ta(k) = 0
(k m ) e

(12.101)

si las races k y m de la ecuaci


on secular son distintas, la Ec. (12.101) solo se cumple si
e(m) Ta(k) = 0
a

m 6= k

(12.102)

ya se ha mencionado en varias ocasiones que los valores de los aj(k) no est


an completamente fijados por la
ecuaci
on de valores propios (12.92). Podemos remover esta indeterminaci
on exigiendo la condici
on
e
a(k) Ta(k) = 1

(12.103)

e
ATA
=1

(12.104)

hay n de estas ecuaciones y por tanto queda fija la componente que antes era arbitraria en cada a(k) , excepto
por un signo global ya que si cambiamos a(k) a(k) a
un se siguen cumpliendo (12.102) y (12.103). Si
organizamos los vectores propios en columnas adyacentes para formar una matriz A con elementos ajk las Ecs.
(12.102) y (12.103) se pueden sintetizar en una sola

si existe alg
un tipo de degeneraci
on ya no ser
a v
alido el argumento que nos llev
o a la Ec. (12.102). Estudiaremos
el caso de degeneraci
on m
as adelante. De momento estableceremos el hecho de que siempre se puede encontrar
un conjunto de coeficientes ajk que satisfagan la ecuaci
on de valores propios (12.92) y las Ecs. (12.102, 12.103)
con lo cual se cumple la Ec. (12.104), dicha ecuaci
on nos inspira para definir una relaci
on semejante a la
transformaci
on de similaridad. Hablamos de la transformaci
on de congruencia de C por medio de A cuando
tenemos la relacion
e
C0 = ACA
(12.105)
e = A1 B y la transformaci
si A es ortogonal se tiene que A
on de congruencia se convierte en transformaci
on
de similaridad. La Ec. (12.104) nos dice entonces que A transforma a T por medio de una transformaci
on de
congruencia en una matriz diagonal, en particular en la matriz identidad n n.
En componentes, la ecuaci
on de valores propios (12.92) se escribe
Vij aj(k) = k Tij aj(k)
Vij aj(k) = Tij aj(m) mk k
12
Es obvio de la Ec. (12.91) que si un vector real a es vector propio entonces tambien lo ser
a ei a, es decir que es necesario que
cada componente del vector tenga la misma fase.
13
N
otese que a
un si los vectores tienen una fase global, esta se anula en el cociente.


310CAPITULO 12. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS
no hay suma sobre k. Podemos definir una matriz diagonal que contiene a los valores propios en la diagonal,
de la forma mk = mk k . Si adem
as escribimos aj(k) como un arreglo matricial A de los vectores propios se
tiene que
Vij ajk = Tij ajm mk
que matricialmente se escribe
VA = TA
e a la izquierda
multiplicando (12.106) por A

(12.106)

e
e
AVA
= ATA

que teniendo en cuenta (12.104) se convierte en

e
AVA
=

(12.107)

las Ecs. (12.104) y (12.107) nos dicen entonces que la misma transformaci
on de congruencia (ambas con la
matriz A de vectores propios) diagonaliza tanto a T como a V. La primera se diagonaliza a la identidad y la
segunda a una matriz diagonal donde los elementos diagonales son los valores propios.
Reescribiendo (12.91) en la forma
(V T) a = 0
vemos que lo que tenemos es un conjunto homogeneo de ecuaciones para los coeficientes ak que solo tiene
soluci
on no trivial cuando el determinante del sistema es nulo
|V T| = 0

(12.108)

por tanto, los valores propios son las races de esta ecuaci
on secular (modificada). En coordenadas cartesianas
y usando T = 1, (12.108) se convierte en la ecuaci
on secular usual
|V 1| = 0

12.11.1.

(12.109)

Diagonalizaci
on simult
anea de dos formas cuadr
aticas

Una aplicaci
on interesante de los resultados anteriores es la diagonalizaci
on simult
anea de dos formas
cuadr
aticas. Tomemos dos formas cuadr
aticas en las variables i y i con coeficientes reales de la forma
T
V

=
=

n X
n
X
i=1 ji
n X
n
X
i=1 ji

Kij i j =

1
i Tij j
2

1
Zij i j = i Vij j
2

siempre es posible tomar a Tij y Vij en forma simetrica. Impongamos la condici


on de que la matriz T definida
por los elementos Tij es definida positiva y que la matriz V definida por los Vij es una matriz positiva. Las
formas cuadr
aticas son entonces positivas. Matricialmente podemos escribir
1
T =
eT
2

1
V = eV
2

(12.110)

hagamos una transformaci


on a otras coordenadas y transformando estas coordenadas por medio de la
matriz de los vectores propios
= A

; = A

(12.111)

GEOMETRICA

SIMULTANEA

12.12. INTERPRETACION
DE LA DIAGONALIZACION
DE UNA MATRIZ POS
por razones que veremos m
as adelante, llamaremos a i y a i las coordenadas normales asociadas a las
formas cuadr
aticas T y V respectivamente. Usando (12.111), la forma cuadr
atica positiva V Ec. (12.110) en
terminos de las coordenadas normales queda
1 f
1 ee 
1
eV =
A V (A) =
A V (A)
V =
2
2
2


1e e
V =
AVA
2

pero recordemos que A diagonaliza a V a traves de una transformaci


on de congruencia Ec. (12.107) de modo
que la estructura de la forma cuadr
atica positiva se simplifica en estas coordenadas.
1
1e
V =
= k k k
2
2

(12.112)

la forma cuadr
atica T definida positiva, adquiere una forma a
un m
as simple que la de V en las nuevas
coordenadas , puesto que A diagonaliza a T y la convierte en la identidad, como se ve en (12.104)
1
1 g
1  ee 

eT =
A T (A) =
A T (A)
T =
2
2
2


1e e
ATA
T =
2

y usando (12.104) esta forma cuadr


atica se reduce finalmente a
T =

1e
1
= i i
2
2

(12.113)

las Ecs. (12.112, 12.113) muestran que en coordenadas normales tanto V como T se simplifican puesto que
no aparecen terminos cruzados. Esto es en u
ltimas consecuencia de que A produce una transformaci
on a ejes
principales similar a la transformaci
on a ejes principales que deja a una matriz hermtica en forma diagonal.
Los ingredientes nuevos en este caso son: a) la transformaci
on es de congruencia (y no de similaridad), b) La
transformaci
on de congruencia diagonaliza simult
aneamente a dos matrices T y V.
Esta tecnica resulta muy poderosa para desacoplar sistemas de ecuaciones algebr
aicas y diferenciales. En la
secci
on 15.2 aplicaremos esta tecnica para encontrar los modos normales de una red de osciladores acoplados.

12.12.

Interpretaci
on geom
etrica de la diagonalizaci
on simult
anea de una
14
matriz positiva y otra definida positiva (opcional)

12.12.1.

Argumentaci
on por geometra analtica

A priori la diagonalizaci
on simult
anea de las dos matrices parece un incidente afortunado. Sin embargo,
a traves de un an
alisis geometrico alterno, veremos que en realidad esto es una consecuencia inmediata de la
naturaleza positiva de V y definida positiva de T. Este an
alisis nos llevar
a adem
as a la conclusi
on de que no
podemos en general diagonalizar tres formas cuadr
aticas en forma simult
anea.
Considerando que los vectores y yacen en un espacio cartesiano n dimensional, y teniendo en cuenta
que T es simetrica y real, se sigue que siempre existe una transformaci
on ortogonal real B que lleve a un nuevo
sistema de coordenadas cartesianas y en el cual T sea diagonal
y = B

(12.114)

la matriz B debe transformar a T mediante una transformaci


on de semejanza en una matriz diagonal C

14

e =C
BTB1 = BTB

(12.115)

Esta secci
on no es muy u
til para c
alculos pr
acticos, pero aporta una gran claridad conceptual sobre la diagonalizaci
on simult
anea
de dos formas cuadr
aticas. Puede omitirse en una primera lectura.


312CAPITULO 12. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS
la transformaci
on inversa se escribe como
e
= By

eB
;
e=y

la forma cuadr
atica T se transforma de la siguiente manera

e =y
eBTBy
eCy = Ci yi yi
2T =
eT = y

(12.116)

la forma cuadr
atica Ci yi yi solo puede ser definida positiva si cada termino Ci es estrictamente positivo, lo cual
se puede ver haciendo todas las yi cero excepto una. De esta forma la ecuaci
on para las yi
Ci
yi yi = 1
2T

(12.117)

define un elipsoide de dimensi


on n cuyos ejes principales van a lo largo de los ejes definidos por las nuevas
coordenadas yi , la Ec. (12.117) se puede convertir de forma inmediata en la ecuaci
on de una esfera para un
nuevo conjunto de variables zi
p
zi = yi Ci no suma
(12.118)
1
zi zi = 1
(12.119)
2T
podemos reescribir (12.118) en la forma
zi = ij
Dij

ij

en forma matricial podemos escribir

z = Dy

p
p

Cj yj = Dij yj
Cj

D 1CR

la forma cuadr
atica T queda

no suma


C1
C2

CR .
..

Cn

(12.120)

(12.121)

2T = zi zi = e
z1z

es decir T ha sido transformado a la identidad a traves de dos transformaciones sucesivas: primero una
transformaci
on de similaridad con una matriz ortogonal real Ec. (12.115) y luego un reescalamiento (12.118).
La primera transformaci
on comporta una rotaci
on de ejes a los ejes principales en donde el elipsoide asociado
a T queda en su forma normal, la segunda transformaci
on no involucra una rotaci
on de ejes, sino un cambio
de escala de los ejes yi . Lo que hace tal reescalamiento es estirar o comprimir los ejes principales de modo que
el elipsoide se convierta en una esfera.
Ahora nos preguntamos que le hace estas transformaciones a la forma cuadr
atica positiva V . Hagamos las
mismas transformaciones sobre las coordenadas asociadas a V
w B

x Dw x = DB

la inversa ser
a
e 1 x
= (DB)1 x = BD

eD1 B
e = x

1
D 1 ij = p ij
Cj

(12.122)

GEOMETRICA

SIMULTANEA

12.12. INTERPRETACION
DE LA DIAGONALIZACION
DE UNA MATRIZ POS
donde hemos usado que D es diagonal y por tanto es simetrica y su inversa se obtiene con el recproco de los
elementos diagonales ver Ec. (12.120). La composici
on de estas dos transformaciones no diagonaliza en general
a V, pero la forma cuadr
atica V queda de la forma

h
i
 
e 1 x = x
e 1 x
eD1 B V BD
e D1 BVBD
2V = eV = x

y dado que D1 y V son simetricas es inmediato que la matriz

e 1
M D1 BVBD

(12.123)

es simetrica, adicionalmente todas las matrices involucradas son reales luego M es simetrica y real. N
otese
e
que en general el producto BVB no necesariamente es diagonal, ya que la diagonalizaci
on de V con la misma
transformaci
on de congruencia, solo est
a garantizada si tal transformaci
on diagonaliza a T a la identidad. Sin
embargo, la matriz B diagonaliza a T pero no la convierte en general en la identidad (salvo en el caso que el
elipsoide asociado ya sea una esfera, en cuyo caso el escalamiento sera identico para todas las componentes
de yi ). No obstante, el hecho de que V se escriba
eMx
2V = x

siendo M simetrica y real nos garantiza que existe una transformaci


on ortogonal real F que diagonaliza a M
por medio de una transformaci
on de similaridad
e
e x
e = F
= Fx x = F

(12.124)

e
e =
e = i i i
eMx = FM
2V = x
F

(12.125)

= Fz

(12.126)

como la idea es diagonalizar a las dos matrices T y V con la misma transformaci


on, debemos realizar esta tercera transformaci
on en las variables asociadas a T (que son las zi luego de las dos transformaciones anteriores),
para lo cual definimos unas nuevas variables i asociadas a T

e F
e
e = 1
2T = e
z1z = F1

vemos que esta u


ltima rotaci
on no afecta la estructura de la forma cuadr
atica definida positiva T , de modo
que el tensor sigue siendo representado por la identidad. Geometricamente, esto se ve con el hecho de que la
esfera asociada no establece ninguna diferencia cuando se rotan los ejes. Aqu tenemos entonces la explicaci
on
de porque una matriz definida positiva y otra positiva se pueden diagonalizar simult
aneamente: la superficie
asociada a la forma cuadr
atica definida positiva es un elipsoide que se puede transformar en una esfera mediante dos transformaciones sucesivas, una rotaci
on ortogonal de ejes seguido de un reescalamiento de ejes.
Aunque esta transformaci
on no diagonaliza a V, nos permite hacer una transformaci
on ortogonal adicional ya
que cualquier rotaci
on adicional sigue definiendo ejes principales para la esfera. Esta libertad para rotar los
ejes sin romper la estructura cuadr
atica de T (i.e. sin cambiar la representaci
on para T) es la que permite
diagonalizar a V. En resumen, la diagonalizaci
on de las dos formas cuadr
aticas se realiza comenzando con una
transformaci
on ortogonal real B que diagonaliza a T seguida de un rescalamiento de ejes D que lo trivializa,
y otra transformaci
on ortogonal F que no cambia la representaci
on de T. Por el lado de V las dos primeras
transformaciones no diagonalizan a V pero la matriz resultante resulta ser simetrica y real lo cual posibilita
la diagonalizaci
on de esa matriz a traves de la u
ltima transformaci
on F.
En aras de organizar la informaci
on resumiremos los resultados aqu obtenidos: hemos partido de dos
formas cuadr
aticas en terminos de las variables , descritas por la Ec. (12.110)
1
T =
eT
2

1
V = eV
2


314CAPITULO 12. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS
donde la matriz T es definida positiva y la matriz V es positiva, ambas son simetricas y reales. Hemos reescrito
esta forma cuadr
aticas en terminos de nuevas variables , que denominamos coordenadas normales en virtud
de que en ellas la forma cuadr
atica se desacopla seg
un se ve en las Ecs. (12.112, 12.113)
1e
1
1e
1
V =
= k k k ; T =
= i i
2
2
2
2

la transformaci
on que nos lleva de las coordenadas originales a las normales se puede rastrear en las Ecs.
(12.122, 12.124) y las Ecs. (12.114, 12.121, 12.126)
= FDB ; = FDB
Esto entonces implica que la matriz de transformaci
on R que nos lleva desde las coordenadas originales a
las normales viene dada por
R = FDB
(12.127)
por otro lado la matriz que trasnforma a T y V se obtiene f
acilmente de (12.123, 12.125)


^
1
g
1 F
e 1 F
e = FD1 BVB
eD
e = FD1 B V FD
= FD1 BVBD
B

la matriz de trasnformaci
on de T y V es entonces
e FD1 B
A

e
; AVA
=

e
; ATA
=1

(12.128)

esta ecuaci
on nos muestra que la matriz A no es en general ortogonal y por tanto las transformaciones de
congruencia (12.104, 12.107) no son en general transformaciones de similaridad, a menos que D sea proporcional
a la identidad en cuyo caso es obvio que la transformaci
on resultante sea ortogonal, ya que esto implica que
la forma cuadr
atica T ya tena forma esferica en la base de coordenadas original. An
alogamente, la matriz de
valores propios en terminos de F, D, y B, se obtiene combinando (12.107) con (12.127).
Este razonamiento nos explica tambien porque en general no se puede diagonalizar tres formas cuadr
aticas
digamos T, V1 y V2 donde la primera es definida positiva y las otras dos son positivas. La tercera rotaci
on se
puede usar para diagonalizar digamos a V1 , pero V2 queda en general no diagonal, si intentamos una cuarta
rotaci
on para diagonalizar a V2 ocurre en general que se estropea la diagonalizaci
on de V1 . Si tenemos por
ejemplo dos formas definidas positivas y una positiva, es evidente que se podr
an diagonalizar las tres formas
simult
aneamente cuando las superficies elipsoidales est
an orientadas de la misma forma y son semejantes (i.e.
los cocientes entre sus ejes tomados digamos en orden ascendente son todos iguales). Lo primero asegura
que la misma reorientaci
on de ejes lleva ambos elipsoides a su forma normal y lo segundo asegura que el
mismo reescalamiento convierte en esferas a las dos formas cuadr
aticas definidas positivas (condicion suficiente
aunque no necesaria), al tener dos esferas tenemos entonces libertad para rotar y diagonalizar la tercera forma
cuadr
atica sin romper la diagonalizaci
on de las otras.
N
otese que si las dos formas cuadr
aticas son positivas pero ninguna es definida positiva, entonces la forma
normal de las cuadr
aticas es tambien de la forma (12.116), pero por lo menos uno de los coeficientes es no
positivo, esto imposibilita que en general esta superficie defina un elipsoide que se pueda convertir en una
esfera con un reescalamiento. Es por esto que por lo menos una de las formas cuadr
aticas debe ser definida
positiva. Por ejemplo, si uno o m
as de los coeficientes en (12.116) es cero, la ecuaci
on define un elipsoide de
menor dimensi
on que solo se puede convertir en una esfera tambien de menor dimensi
on. Tomemos el caso
tridimensional, si uno de los coeficientes es cero entonces la ecuaci
on define una elipse que se convierte en
crculo, pero un crculo no permanece invariante ante una rotaci
on arbitraria de ejes en tres dimensiones.

12.12.2.

Argumentaci
on por geometra de Riemann

Podemos darle una interpretaci


on geometrica a la ecuaci
on de valores propios modificada (12.92), teniendo
en cuenta que la Ec. (12.104) se asemeja a una condici
on de ortonormalidad (en coordenadas cartesianas T = 1
y obtenemos la condici
on de ortogonormalidad). En realidad, la ecuaci
on (12.104) es equivalente a la condici
on

GEOMETRICA

SIMULTANEA

12.12. INTERPRETACION
DE LA DIAGONALIZACION
DE UNA MATRIZ POS
de que los vectores propios a(k) sean ortonormales, pero en un espacio de Riemann que no es necesariamente
cartesiano. Por simplicidad todas las componentes de vectores y matrices se asumir
an reales. En un espacio
de Riemann se define el elemento de longitud de camino en la forma
ds2 = gik dxi dxk
donde los gik son elementos del tensor m
etrico G del espacio. En dicho espacio se define un producto escalar
inducido por el tensor metrico (ver Ec. 12.77)
eGy
(x, y) = x y = xi gij yj = x

; gij (vi , vk )

siendo vi los vectores de la base elegida. Este tensor induce a su vez una norma o m
odulo para los vectores
eGx 0
xx =x

(12.129)

recordemos que una de las propiedades de la norma es que sea no negativa y solo sea cero para el vector
nulo del espacio, esto implica que el tensor metrico debe estar representado por una matriz definida positiva.
Adicionalmente, se ve de su definici
on que es una matriz simetrica real. Para coordenadas cartesianas es
claro que el tensor metrico est
a descrito por la matriz identidad. En general, G ser
a diagonal en el caso de
coordenadas ortogonales curvilneas tales como las esfericas o cilndricas. Pero es no diagonal si el sistema que
forma los vectores base no es ortonormal.
Comparando la Ec. (12.99) con la Ec. (12.129), podemos decir que la matriz T cumple con las propiedades
de un tensor metrico ya que el m
odulo de un vector sera no negativo y es nulo solo si corresponde al vector
nulo. T es por definici
on una matriz simetrica real y definida positiva como lo es el tensor metrico. En otras
palabras, en un espacio de configuraci
on en el cual T sea el tensor metrico, el termino e
aTa define una norma al
cuadrado para un vector en el espacio de configuraciones. En tal espacio, la Ec. (12.104) o las correspondientes
ecuaciones por vectores componentes (12.102, 12.103), representan
una condici
on de ortonormalidad.


Veamos primero como hacer el cambio de una base viT que no es ortonormal a otra base viI que s es
ortonormal. Escribamos el producto interno para el espacio de Riemann con tensor metrico T


eTy = x
e B1 B T B1 B y
(x, y) = x

elijamos a B como una matriz ortogonal real. Dado que T es una matriz simetrica real, siempre es posible
encontrar una matriz ortogonal real que la diagonalice, por tanto para una elecci
on apropiada de B se tiene

] (By) = x
e BTB1 By = (Bx)C
eB
ea Cya
(x, y) = x
eTy = x
ea Cya ; xa Bx
(x, y) = x

(12.130)

donde C es una matriz diagonal. La Ec. (12.130) nos muestra que la transformaci`
on de coordenadas inducida
por B nos lleva a un tensor metrico C diagonal

Cij = viC , vjC = ij Ci

esto quiere decir que los vectores que forman la nueva base son ortogonales pero no son normales, es decir
su norma no esla unidad. Si cada Ci es diferente, tenemos que cada vector base tiene norma diferente (que
corresponde a Ci ). Pasemos ahora a una base normalizada
!
p
 vC vC p


j
i ,
ea Cya = xai Cij yja = xai viC , vjC yja =
(x, y) = x
Ci xai
Ci yja
Ci
Ci

biD , v
bjD yjb
(x, y) = xbi v
donde hemos definido

xbi

p
vC
biD i
Ci xai ; v
Ci

(12.131)


316CAPITULO 12. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS
biD son ahora unitarios y ortogonales, el producto interno se escribe entonces en la
claramente los vectores v
forma
(x, y) = xbi ij yjb = xbi yib
Esta relaci
on se puede construr tambien por componentes
ea Cya = xai Cij yja = xai ij Ci yja = xai Ci yia =
(x, y) = x

p

Ci xai

 p

Ci yia = xbi yib

la primera de las Ecs. (12.131), se puede escribir matricialmente en la forma


xb Dxa

donde D es la matriz descrita en las Ecs. (12.120, 12.121). Tenemos que el tensor metrico es ahora la identidad
e b yb = x
eb 1yb
(x, y) = xbi yib = x

hemos partido de una base que no es ortogonal ni normal para llegar a una base ortonormal. Esto se hizo
con dos transformaciones: la primera es una transformaci
on asociada a una matriz ortogonal que convierte
la base original en una base ortogonal pero que no est
a normalizada. La segunda es una transformaci
on de
escala que se usa para normalizar los vectores de la base ortogonal, los factores de escala son efectivamente
las normas de los vectores de la base ortogonal. El tensor metrico asociado es ahora la identidad. N
otese que
aqu podramos realizar una tercera transformaci
on con cualquier matriz ortogonal real y el tensor seguira
siendo la identidad ya que esta matriz me convertira una base ortonormal en otra base ortonormal. Hagamos
entonces una transformaci
on ortogonal real F que m
as adelante se elegir
a de forma adecuada.

 
b
e
eb 1yb = x
eb F1Fy
(x, y) = x
= ^
Fxb 1 Fyb

ec 1yc ;
(x, y) = x

xc Fxb

rastreando las definiciones tenemos

Bx = xa ; DBx = xb Nx = xb ; N DB

FDBx = xc Rx = xc ; R FDB
el producto interno se puede escribir en los pasos sucesivos


e
e
e D1 CD1 Dya
eTy = x
eBBT
ea DD1 CD1 Dya = x
ea D
(x, y) = x
BBy
=e
xa Cya = x
e FFy
e b=x
e c=x
eb 1yb = x
eb FF1
ec F1Fy
ec 1yc
= x

donde hemos usado el car


acter simetrico de D. N
otese que dado que D y C son ambos diagonales, entonces conmutan entre s de modo que D1 CD1 = D2 C = 1. Se puede ver entonces que el algoritmo de trivializaci
on
del tensor metrico es


h


i
h


i
e D 1 BTB
e D1 F D1 BTB
e D1 F
e = F D1 BTB
e D
e 1 F
e
T BTB
h
i
h
i

^
1 B) F
^ WTW
e F KTK
e F
e = (FK) T(FK)
f
=
F D1 B T(D
donde hemos definido

K D1 B ; W FD1 B
como esto es v
alido para x, y arbitrarios se tiene que despues de las dos primeras transformaciones donde el
tensor metrico ya se ha trivializado, el producto interno se escribe


e KTK
e Ny
eTy = x
eb 1yb = x
eN
(x, y) = x

12.13. TENSORES

317

y luego de la tercera transformaci


on donde el tensor contin
ua trivializado


e WTW
f Ry
eTy = x
ec 1yc = x
eR
(x, y) = x

K es entonces la primera transformaci


on que trivializa al tensor metrico. Veamos como se comporta V ante
esta misma trasnformaci
on
e
V KVK

en virtud de la simetra de V y del hecho de que todas las matrices que intervienen son reales, es claro que esta
nueva matriz es simetrica y real. Por tanto puede ser diagonalizada por alguna matriz ortogonal real. Esgogemos
entonces la matriz ortogonal real F de modo que diagonalize a V recordemos que esta transformaci
on contin
ua
dejando trivial al tensor metrico de modo que las dos matrices T y V quedan diagonalizadas una vez se ejecuta
la tercera transformaci
on


e F
e = WVW
f =
V F
KVK

e
e W = FD1 W
AVA
= ; A

(12.132)

la matriz de diagonalizaci
on est
a entonces dada por la Ec. (12.132) que coincide con la Ec. (12.128). N
otese
que la diagonalizaci
on de V a traves de A no nos da los valores propios de la ecuaci
on normal de valores
propios ya que esta matriz posee una matriz de reescalamiento.

Con base en lo anterior, podemos dar una interpretaci


on geometrica a la diagonalizaci
on simult
anea de T y
V a traves de A. La transformaci
on (12.104) corresponde a una transformaci
on lineal de un sistema de ejes que
no son ortogonales ni normales para pasar a un sistema de ejes ortogonales y normales, a traves de tres pasos.
En el primer paso se hace una transformaci
on ortogonal que me produce una base ortogonal pero no normal
(tensor metrico diagonal), en el segundo paso se realiza un reescalamiento que me normaliza los vectores. Con
estos pasos se consigue una base ortonormal lo cual equivale a trivializar al tensor metrico T. En cuanto a la
matriz V estas dos transformaciones no la diagonalizan pero la matienen simetrica y real. Esto implica que
una trasnfomacion ortogonal adicional (tercer paso) puede diagonalizarla al tiempo que dicha trasnformaci
on
mantiene inalterada la forma del tensor metrico ya que una matriz ortogonal me lleva de una base ortonormal
a otra base ortonormal. Obtenemos entonces un conjunto de ejes principales comunes para T y V.
Cuando se presenta degeneraci
on el n
umero de ecuaciones independientes entre los valores propios resulta
insuficiente para determinar los cocientes entre componentes de un vector propio. Por ejemplo, si es una
as se determinan a
raz doble, se podr
an elegir de forma arbitraria dos componentes cualesquiera aj , y las dem
traves de las ecuaciones de valores propios. Recordemos adem
as que degeneraci
on corresponde a una simetra
del sistema, cuanto m
as degenerados son los valores propios, m
as libertad existe de escoger los vectores propios,
es decir aumentan las transformaciones que dejan invariante al sistema.
Finalmente, vale decir que esta interpretaci
on debe tomarse con cuidado en el sentido de que sugiere que
la matriz T es pasiva. Por ejemplo en el problema de los osciladores acoplados se llega a la ecuaci
on de valores
propios modificada en la cual T representa la matriz de energa cinetica y V representa al potencial, en este
problema ambas matrices son activas.

12.13.

Tensores

Hemos visto que los vectores en 3 dimensiones (mas estrictamente los vectores Euclidianos) transforman
bajo una transformaci
on ortogonal de coordenadas de la forma
Vi0 = aij Vj
siendo aij los elementos de la matriz ortogonal A. Todas las transformaciones que consideraremos en esta
secci
on son de tipo pasivo, pero omitiremos la notaci
on con parentesis. Si adjuntamos dos vectores V, W la
transformaci
on de dicha yuxtaposici
on se escribe de la forma
Vi0 Wj0 = (aik Vk ) (ajm Wm ) = aik ajm Vk Wm


318CAPITULO 12. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS
similarmente podemos yuxtaponer un conjunto de N vectores, los cuales transformaran de la forma
(1)0

(2)0

Vi1 Vi2

(N )0

. . . Vi N

(1)

(2)

(N )

= ai1 j1 ai2 j2 . . . aiN jN Vj1 Vj2 . . . VjN

(12.133)

donde V(i) denota al iesimo vector. Esta yuxtaposici


on tendra 3N componentes (en 3 dimensiones). Por extensi
on, diremos que un tensor T de rango N en el espacio cartesiano tridimesional es una cantidad constituda
on ortogonal
por 3N componentes que denotamos por Ti1 i2 ...iN (i.e. con N ndices) que bajo una transformaci
de coordenadas A, transforma bajo el esquema
Ti01 i2 ...iN = ai1 j1 ai2 j2 . . . aiN jN Tj1 j2 ...jN

(12.134)

lo cual es una emulaci


on directa de la propiedad de transformaci
on (12.133) que posee una yuxtaposici
on
de N vectores. Sin embargo, el tensor Ti1 i2 ...iN es una entidad independiente definida por la propiedad de
transformaci
on (12.134) y no necesariamente proviene de una yuxtaposici
on de vectores.
Con esta definici
on, un tensor de rango cero tendra una sola componente, que sera invariante bajo una
transformaci
on ortogonal. Pero esta ha sido nuestra definici
on de escalar, por lo tanto un escalar es un tensor de
rango cero. Naturalmente, por la forma en que ha sido construda esta definici
on, es inmediato que un vector
Euclidiano es un tensor de primer rango. Adicionalmente, las nueve componentes de un tensor de segundo
rango se transforman como
Tij0 = aik ajl Tkl
en rigor, es necesario distinguir entre un tensor de segundo rango T y la matriz cuadrada formada por sus
componentes. Un tensor est
a definido solo por sus propiedades de transformaci
on ante una transformaci
on
ortogonal de coordenadas. En contraste, una matriz no est
a restringida de ninguna forma por los tipos de
transformaci
on que pueda experimentar y se puede considerar totalmente independiente de sus propiedades
bajo un tipo particular de transformaci
on. Una matriz es simplemente un arreglo de elementos con un algoritmo
de suma y multiplicaci
on. Tales arreglos junto con sus algoritmos sirven para expresar de manera sintetica
cualquier transformaci
on lineal aplicada sobre cierto espacio (no necesariamente vectorial). De la misma forma,
un arreglo en columna no es necesariamente un vector Euclidiano, pero est
a bien definido el producto del arreglo
matricial con el arreglo vectorial. Incluso las matrices se pueden definir por s solas con sus propiedades de
suma, producto, inversa etc. formando estructuras matem
aticas tales como grupos, anillos etc. En contraste,
los tensores siempre est
an ligados a un espacio vectorial o a una variedad.
Vale decir sin embargo, que si una matriz representa una transformaci
on activa sobre un espacio vectorial,
los componentes tensoriales y matriciales se manipulan en la misma forma al menos dentro del dominio
restringido a las transformaciones ortogonales. Para toda ecuaci
on tensorial habr
a una ecuacion matricial
correspondiente y viceversa. La Ec. (12.38) nos indica la manera en que transforma una matriz que representa
a un operador lineal en un espacio vectorial, cuando hacemos un cambio de base (cambio de sistema coordenado)
T0 = ATA1
siendo A la matriz que genera el cambio de coordenadas (transformaci
on pasiva). La nueva matriz T0 representa
al mismo operador en una base diferente. Si la transformaci
on es ortogonal se tiene

que en componentes se escribe

e
T0 = ATA

Tij0 = aik Tkl e


alj = aik Tkl ajl = aik ajl Tkl

que resulta identica a la transformaci


on de un tensor de segundo rango al menos bajo las transformaciones
ortogonales especficamente.
N
otese sin embargo que si la matriz T tiene por ejemplo el rol pasivo de representar un cambio de coordenadas de un sistema especfico a otro tambien especfico, entonces no tiene sentido preguntarse por sus
propiedades de transformaci
on. Algortmicamente hablando, la operaci
on ATA1 es posible y sigue siendo
una transformaci
on de similaridad pero ya no tiene sentido geometrico. En el caso de matrices activas que

12.13. TENSORES

319

representan un operador lineal en un espacio vectorial, la transformaci


on ATA1 es autom
aticamente inducida
por el cambio de base, en cambio no hay una manera natural geometrica de inducir la misma transformaci
on
en una matriz que juega el rol de cambio de base. En este punto queda quiz
as mas claro el hecho de que
las matrices y sus algoritmos se pueden trabajar sin saber que est
an representando, pero para conocer sus
eventuales propiedades de transformaci
on es necesario saber en que espacio act
uan y sobre que objetos (e.g.
los vectores o el sistema coordenado).
En virtud de la analoga entre las propiedades de los tensores y las matrices activas, podemos deducir
que la misma terminologa derivada del algebra matricial (traspuesta, antisimetrica etc.) ser
a de gran utilidad
tambien en el algebra de tensores de segundo rango. De igual modo, en el algebra de tensores de primer rango,
podemos usar formas de vector fila y columna para las manipulaciones algebraicas.
on entre los ndices covariantes y
En el espacio Rn con coordenadas cartesianas, no existe diferenciaci
contravariantes, de modo que no se emplea esta terminologa. Estrictamente estos tensores est
an construdos
n
en una base cartesiana de R y deben llamarse en principio tensores Cartesianos. Sin embargo, emplearemos
la simple denominaci
on de tensor mientras no se presente ambig
uedad.
Por otro lado, inspirados en el concepto de vector axial o pseudovector que ante transformaciones ortogonales propias e impropias transforma seg
un la prescripci
on (12.60), podemos tambien definir pseudotensores en tres dimensiones. Su ecuaci
on de transformaci
on (ante una transformaci
on ortogonal de coordenadas)
tendr
a una forma similar a (12.60):
TiS0
= |A| ai1 j1 ai2 j2 . . . aiN jN TjS1 j2 ...jN
1 i2 ...iN
si la transformaci
on es impropia se puede descomponer en una transformaci
on ortogonal contnua (propia) y
una inversi
on. De esto se deduce que bajo el operador paridad obtenemos
TS0 = PTS P1 = (1)N +1 TS
Los vectores axiales son pseudotensores de primer rango y los pseudoescalares son pseudotensores de rango
cero. Un ejemplo de pseudotensor muy importante en Fsica es el tensor de Levi Civita. Supongamos que
tenemos un pseudotensor de tercer rango Tijk que en una base particular coincide con el tensor de Levi civita,
cuando cambiamos a otro sistema coordenado ortogonal (comenzando con el sistema en donde ijk = Tijk ) se
tiene que
0
Tijk
= |A| aip ajq akr pqr
(12.135)
puede demostrarse explcitamente que

a1p a2q a3r pqr = |A|

de modo que las componentes T123 transforman como

0
= |A|2 = 1 = 123
T123

y se puede comprobar explcitamente por componentes que


0
Tijk
= ijk

lo cual demuestra que ijk es un pseudotensor. Podemos ver que el factor |A| en (12.135) es crucial para
obtener la misma forma numerica del Levi Civita cuando se cambia de base.
En virtud de la forma en que se construy
o el concepto de tensor podemos definir estructuras algebraicas
que permiten realizar f
acilmente las operaciones. Definiremos una diada, como la yuxtaposici
on de dos vectores
en la forma AB, CD etc. Podemos definir por ejemplo el producto punto entre una diada y un vector en la
forma
A (BC) (A B) C ; (BC) A B (C A)
n
otese que el orden es importante en este producto punto. No es igual operar por la izquierda que por la
derecha. Adem
as el producto punto entre una diada y un vector es otro vector (ya no podemos llamarlo
producto escalar). Cada vector se puede escribir en una base, de modo que una diada se escribe como
AB = (ai ui ) (bj uj ) = ai bj ui uj


320CAPITULO 12. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS
esto nos lleva a construr el concepto de afinor, como una combinaci
on lineal de diadas
aAB + bCD + ...
y la diada se puede ver como un afinor construdo con la yuxtaposici
on de los vectores base. Hemos supuesto
implcitamente propiedades de distributividad y de producto por escalar (linealidad). Se puede definir el
producto punto doble de la siguiente forma
(AB) : (CD) = (A C) (B D)
quiz
as una notaci
on mas apropiada es
A (CD) B = (A C) (B D)
este doble producto punto s es un producto escalar. La diada identidad se construye en la forma
1 ui ui
donde ui son los vectores unitarios de una base ortonormal. Es f
acil ver su car
acter de identidad con los
algoritmos que acabamos de establecer
A 1 = (ak uk ) (ui ui ) = ak (uk ui ) ui = ak ki ui = ak uk = A
similarmente se puede demostrar que
A1 =1A=A

A1A=AA

al igual que las matrices, las diadas y afinores son algoritmos de c


alculo que permiten clarificar las operaciones
con tensores de segundo rango. Sin embargo, es el tensor el que tiene significado geometrico y el algoritmo
puede cambiar si usamos por ejemplo bases diferentes a las cartesianas (en donde los conceptos de covarianza
y contravarianza adquieren sentido) o definimos tensores en espacios m
as generales. Por el momento, notemos
que si definimos la diada a traves de dos ndices (cada uno correspondiente a un vector) i.e.
AB Ai Bj Tij
podemos emular el algebra de los tensores en la forma
K (AB) = (K A) B = Ki Ai Bj
K T = Ki Tij

similarmente
T K = Tij Kj ; D T K = Di Tij Dj
estas operaciones son en consecuencia totalmente an
alogas a los algoritmos construdos para matrices y vectores fila y columna. As mismo, son los algoritmos para trabajar tensores cartesianos. La suma sobre ndices
repetidos se conoce como contracci
on, n
otese que cuando un n
umero n de ndices de un tensor se contrae con
ndices de otro, el rango del tensor est
a dado por N 2n, siendo N el n
umero total de ndices y n el n
umero
total de contracciones. Por ejemplo Tij Kj tiene en total tres ndices y una contracci
on, su resultado es un
tensor de primer rango (3 2 1). El producto cruz entre dos vectores ijk Aj Bk tiene N = 5 y n = 2 de modo
que tiene rango 1. N
otese que ijk es un pseudotensor y si A y B son vectores polares, el producto ser
a un
pseudovector como ya vimos que ocurre con el producto cruz entre dos vectores polares. El producto D T K
donde T es tensor de segundo rango y D, K son de primer rango, da como resultado un escalar. Si uno (o
tres) de ellos es un pseudotensor obtendremos un pseudoescalar, si dos de ellos son pseudotensores obtenemos
un escalar.

12.13. TENSORES

321

Estas reglas de contracci


on no son sin embargo un simple capricho, sino consecuencia directa de las propiedades de transformaci
on de los tensores. Por ejemplo si Tij es un tensor cartesiano de segundo rango y Ki
un tensor cartesiano de primer rango (vector euclidiano) y hacemos la contracci
on
Rj Ki Tij

(12.136)

demostraremos que la cantidad Rj es efectivamente un tensor cartesiano de primer rango, para ello NO basta
con saber que es una cantidad que depende de un solo ndice, es necesario que se examinen sus propiedades
de transformaci
on ante una transformaci
on ortogonal A
Rj0 = Ki0 Tij0 = (aik Kk ) (aim ajn Tmn ) = (aik aim ajn ) (Kk Tmn )
donde hemos usado el hecho de que Ki y Tij son tensores cartesianos. Usando las condiciones de ortogonalidad
(12.52) resulta
Rj0

(km ajn ) Kk Tmn = ajn Km Tmn = ajn Rn

Rj0 = ajn Rn

(12.137)

donde hemos usado la definici


on de Rj Ec. (12.136). La Ec. (12.137) nos muestra que efectivamente, la contracci
on definida en (12.136) corresponde a un tensor de primer rango. Si por ejemplo Tij es un pseudotensor
y Ki es un vector polar se puede demostrar con una transformaci
on ortogonal impropia, que el resultado de
la contracci
on es un pseudovector o vector axial. Se deja al lector la demostraci
on general para la contracci
on
de tensores de rango arbitrario.
Por otro lado, consideremos el conjunto de ecuaciones
Ki Ai = B
Kij Aj

(12.138)

= Bi

(12.139)

Kij Ajk = Bik


Kijkl Aij

(12.140)

= Bkl

(12.141)

Kij Ak = Bijk

(12.142)

donde en cada expresi


on, A y B son tensores cartesianos de rangos indicados por los ndices, y A es arbitrario.
En cada caso K es una cantidad desconocida. La llamada regla del cociente establece que si la ecuaci
on en
cuesti
on es v
alida en todo sistema (rotado) cartesiano de coordenadas, K es un tensor cartesiano del rango
indicado por sus ndices.
Probaremos la regla del cociente (12.139) a manera de ilustraci
on. En un cierto sistema cartesiano primado
tenemos
0
Kij
A0j = Bi0 = aik Bk
donde hemos usado las propiedades tensoriales de B. Puesto que la ecuaci
on es v
alida en todo sistema cartesiano
rotado
aik Bk = aik (Kkl Al )
y transformando A de nuevo al sistema cartesiano primado tenemos
0
Kij
A0j

aik Kkl Al = aik Kkl ajl A0j



0
Kij
aik ajl Kkl A0j = 0
=

esto debe ser v


alido para cara ndice i y para todo sistema coordenado primado, y dado que A0j es arbitrario18
resulta
0
Kij
= aik ajl Kkl
(12.143)
que es la definicion de un tensor de segundo rango. Vale mencionar sin embargo que es importante que B sea
diferente de cero. Las otras reglas de cociente se demuestran en forma similar.
18

0
Por ejemplo si tomamos A0j = 1j se sigue de inmediato que Ki1
= aik a1l Kkl . Otras escogencias adecuadas nos dan el resto de
Ecs. (12.143).


322CAPITULO 12. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS

12.14.

Ejercicios

1. Para las matrices dadas por

3 2 1
1 4 2
6 2 1
A= 0
2 7 ; B = 3 0 9 ; C = 9 5 1
1 6 4
1 1 2
3 2 4

encuentre los productos AB y BA y muestre que AB 6= BA. Calcule T r (AB) y T r (BA). Demuestre
explcitamente que
T r (ABC) = T r (CAB) = T r (BCA)
T r (BAC) = T r (CBA) = T r (ACB)
pero
T r (ABC) 6= T r (BAC)
explique este hecho.

2. Demuestre que la multiplicaci


on matricial es una operaci
on asociativa.
3. Demuestre que la delta de kronecker es la u
nica representaci
on posible de la matriz identidad en cualquier
base.

Captulo 13

Cinem
atica del cuerpo rgido
Ya hemos definido un cuerpo rgido como un conjunto de partculas cuyas distancias relativas son constantes.
La condici
on de cuerpo rgido se traduce en un conjunto de ligaduras hol
onomas de la forma
rij = cij ; i < j, i = 1, . . . , N

(13.1)

siendo rij la distancia entre las partculas iesima y j-esima, y cij son valores constantes. Aunque esto constituye una idealizaci
on, la mec
anica del cuerpo rgido es de fundamental importancia en muchos campos de la
Fsica. En este captulo discutiremos la cinem
atica del cuerpo rgido, es decir las caractersticas de su movimiento, para lo cual ser
a necesario desarrollar ciertas herramientas matem
aticas, que adem
as seran aplicables
en muchos otros campos de la Fsica.
De particular importancia ser
a el movimiento de rotaci
on de un cuerpo rgido, el cual estudiaremos con
el formalismo de la matrices ortogonales. Dicho tipo de movimiento introducir
a consideraciones geometricas
relativas a la rata de cambio de un vector con el tiempo con respecto a un sistema de referencia rotante.
Posteriormente se estudiar
a la din
amica del cuerpo rgido, es decir la respuesta que estos sistemas producen
cuando se someten a torques y fuerzas externas.

13.1.

Coordenadas independientes de un cuerpo rgido

Como punto de partida, es necesario clarificar cuales son los grados de libertad independientes de un cuerpo
rgido, es decir las coordenadas necesarias para especificar completamente su configuraci
on en un instante dado
de tiempo. La intuici
on nos indica que para ubicar la configuraci
on completa de un s
olido rgido es necesario
especificar la posici
on de un punto de referencia del cuerpo (por ejemplo su centro de masa, un punto fijo
de este, etc.), y la orientaci
on relativa de este cuerpo, todo ello con respecto a un sistema inercial fijo de
coordenadas que lo llamaremos el sistema de laboratorio (S) ver Fig. 13.1. Si trasladamos paralelamente los
ejes de S hasta el punto de referencia que se tomar
a como nuevo origen (sistema S0 en la Fig. 13.1), la
orientaci
on relativa se obtiene usando un sistema S 0 cuyos ejes est
an fijos al cuerpo rgido y que por tanto,
0
siguen su din
amica. El sistema S est
a en general rotado con respecto a S0 pero con origen com
un con este.
El sistema S 0 se puede obtener entonces por rotaci
on pura del sistema S0 (sin traslaci
on), para realizar esta
rotaci
on hay que definir el eje de rotaci
on i.e. un vector unitario en direcci
on de dicho eje, esto representa dos
grados de libertad (dos angulos, o las tres coordenadas cartesianas con la ligadura de normalizaci
on), para
completar la rotaci
on se requiere conocer el angulo que barre el eje de rotaci
on cuando el giro se ejecuta, con lo
cual tenemos tres grados de libertad necesarios para lograr girar desde S0 hasta S 0 . Esto nos conduce entonces
a seis grados de libertad para definir la configuraci
on del cuerpo rgido a partir de S: 3 para definir el punto
0
de referencia (origen de S0 y de S ) y 3 para definir la orientaci
on relativa de S 0 con respecto a S (o lo que es
lo mismo, con respecto a S0 ). N
otese que dicho n
umero de grados de libertad es independiente del n
umero de
partculas del s
olido e incluso de su naturaleza discreta o contnua.
Veamos como conciliar este n
umero con las ligaduras enunciadas en (13.1). Hay 3N grados de libertad
superficiales debidos a las N partculas del s
olido. Para un n
umero N de partculas el n
umero de ecuaciones
323

324

CAPITULO 13. CINEMATICA


DEL CUERPO RIGIDO

Figura 13.1: Orientaci


on relativa de un cuerpo rgido. El sistema S es inercial, S0 es un sistema cuyo origen
est
a fijo en alg
un punto de referencia del cuerpo y cuyos ejes son paralelos a los de S. El sistema S 0 est
a fijo
al cuerpo y tiene origen com
un con S0 .
de ligadura de la forma (13.1) viene dado por N (N 1) /2. Si intentamos simplemente sustraer el n
umero de
ligaduras de los 3N grados de libertad, obtenemos valores negativos (para N 8) que crecen r
apidamente en
magnitud cuando aumenta N . El punto es que estas ligaduras no son todas independientes. Para fijar un punto
en el cuerpo rgido, no es necesario especificar las distancias a todos los dem
as puntos del cuerpo, es suficiente
con especificar su distancia a otros 3 puntos fijos al cuerpo y no colineales como se ve en la figura 13.2. Por lo
tanto, una vez fijadas las posiciones de tres partculas no colineales del cuerpo, las ligaduras fijan las posiciones
de las otras. Por el momento esto nos deja con 9 grados de libertad, sin embargo, una vez fijada la partcula
1 de referencia (3 grados de libertad) la ubicaci
on de la partcula 2 solo requiere dos grados de libertad pues al
estar fija su distancia a la primera, debe yacer en la superficie de una esfera centrada en la partcula 1. Fijadas
las partculas 1 y 2 la tercera debe yacer en una circunferencia cuyo centro pasa por el eje definido por el vector
relativo r12 siendo dicho vector perpendicular al crculo y la distancia entre un punto de la circunferencia y
las partculas 1 y 2 fijadas por las ligaduras (13.1), esto nos deja con un grado de libertad necesario para fijar
esta posici
on (por ejemplo un angulo). Aparecen entonces seis grados de libertad en consistencia con lo que se
obtuvo con el argumento anterior. Esto se puede ver a su vez de forma m
as simple teniendo en cuenta que a
los 9 grados de libertad para fijar las tres partculas se les deben restar 3 ligaduras independientes
r12 = c12 ; r23 = c23 ; r13 = c13
por supuesto pueden haber ligaduras adicionales tales como condiciones de rodadura, existencia de puntos fijos
etc. que pueden disminur a
un m
as el n
umero de grados de libertad independientes.

DE LOS GRADOS DE LIBERTAD DE UN CUERPO RIGIDO


13.2. ASIGNACION

325

Figura 13.2: Tres puntos de referencia no colineales del cuerpo rgido permiten localizar cualquier partcula
i-esima en dicho cuerpo.

13.2.

Asignaci
on de los grados de libertad de un cuerpo rgido

Ya mencionamos que una forma de determinar la configuraci


on del cuerpo rgido en un instante dado
con respecto a un sistema de referencia inercial S, consiste en construr un sistema de referencia S0 con ejes
paralelos a S y con su origen en un punto de referencia del s
olido. Adicionalmente construmos otro sistema de
ejes S 0 fijos al cuerpo y con origen en el punto de referencia del s
olido. Tres grados de libertad fijan el origen
0
com
un de S0 y S con respecto a S (i.e. la posici
on del punto de referencia con respecto a S), en tanto que
otros 3 fijan la orientaci
on relativa de S 0 con respecto a S0 o lo que es lo mismo con respecto a S.
Como la determinaci
on de la posici
on del origen de S0 con respecto a S no representa particular dificultad,
nos restringiremos a estudiar la forma de parametrizar la orientaci
on relativa de S 0 con respecto a S0 . Hay
varias maneras de realizar esta parametrizaci
on. Una de las m
as fructferas es la determinaci
on de los cosenos
0
directores de los ejes primados (de S ) con respecto a los ejes no primados (de S0 ). Por simplicidad usaremos
una notaci
on de ndices en lugar de la nomenclatura x, y, z i.e. x1 , x2 , x3
La direcci
on del eje X10 se puede especificar a traves de los angulos que este eje hace con cada uno de los
ejes X1 , X2 , X3 . Los cosenos directores se definen de la forma

cos ij = cos u0i , uj = u0i uj = uj u0i ; i, j = 1, 2, 3
(13.2)

siendo uj los vectores cartesianos unitarios a lo largo de los ejes Xj , y u0i los an
alogos para el sistema S 0 . En
ij el primer ndice se refiere al ndice primado y el segundo al ndice no primado. La proyecci
on de un vector
u0i a lo largo de u1 est
a dada por u0i u1 de modo que la componente de u0i a lo largo de u1 viene dada por
(u0i u1 ) u1 de manera similar se obtienen las componentes de u0i a lo largo de u2 y u3 con lo cual se obtiene



u0i = u0i u1 u1 + u0i u2 u2 + u0i u3 u3


CAPITULO 13. CINEMATICA
DEL CUERPO RIGIDO

326

pero recordando la definici


on de los cosenos directores y usando convenci
on de suma sobre ndices repetidos
de aqu en adelante
u0i = (cos ij ) uj
(13.3)
con lo cual se muestra que los 9 cosenos directores determinan completamente la orientaci
on del nuevo sistema
coordenado X10 , X20 , X30 con respecto a X1 , X2 , X3 de S0 . El proceso es f
acilmente invertible para obtener a los
on de los u0j .
ui en funci

Podemos escribir entonces


ui = ui u0j u0j = (cos ji ) u0j

(13.4)

r = xi ui = x0j u0j

puesto que el vector posici


on en esencia no cambia (ya que el origen es com
un), solo cambian las componentes
y bases con que se mide. Claramente

x0i = r u0i = (xj uj ) u0i = xj uj u0i
x0i = cos ij xj

(13.5)

los cosenos directores en consecuencia permiten obtener la relaci


on entre las coordenadas de un punto en un
sistema con respecto a las del otro (componentes de r). Claramente el an
alisis anterior es extensible a otros
vectores, diferentes al vector posici
on1 . La componente de un cierto vector G a lo largo de Xi0 viene dada por

Gx0i = G u0i = (Gj uj ) u0i = Gj uj u0i = cos ij Gj

de modo que el conjunto de los 9 cosenos directores nos da la transformaci


on completa entre los dos sistemas
coordenados.
Al ser los ejes primados fijos al cuerpo, los 9 cosenos directores son en general funciones del tiempo ya que
el cuerpo puede cambiar su orientaci
on en el curso del movimiento. En tal sentido, los cosenos directores se
pueden considerar como coordenadas que especifican la orientaci
on instant
anea del cuerpo rgido con respecto
a S0 . Ya hemos visto sin embargo, que solo tres coordenadas son necesarias para orientar el cuerpo de modo
que los 9 cosenos directores no pueden ser independientes.
Veamos el problema primero geometricamente, a partir de los ejes X1 , X2 , X3 se puede construr el eje X10
con dos grados de libertad (e.g. dos angulos que definen al vector unitario u01 ). Recordando que el origen es
com
un para S0 y S 0 el eje X20 yace en el plano perpendicular a X10 y que pasa por el origen. En consecuencia
solo un grado de libertad adicional es necesario (e.g. un angulo) para orientar a X20 en este plano. Finalmente,
X30 ya queda determinado si queremos construr ejes a derecha.
Veamos como traducir las ligaduras sobre los cosenos directores en forma de ecuaciones. Tanto los sistemas
primado como sin primar son ortogonales
ui uj = ij

u0i u0j = ij

(13.6)

teniendo en cuenta las ecuaciones (13.3)


u0i u0k = [(cos ij ) uj ] [(cos km ) um ] = cos ij cos km uj um
u0i u0k = cos ij cos km jm = cos im cos km

que combinado con las relaciones de ortonormalidad en el sistema primado nos da


cos im cos km = ik
1

(13.7)

N
otese que estrictamente hablando, la posici
on no es un vector en el sentido Euclidiano, pues a un punto en el espacio no se
le puede asignar magnitud ni direcci
on. Un vector debe ser un objeto independiente del sistema coordenado con que se mire, por
ejemplo esto lo cumple el vector desplazamiento. El vector posici
on se puede pensar como un vector relativo entre el punto en
cuesti
on y un punto de referencia (origen).

13.3. TRANSFORMACIONES ORTOGONALES

327

se puede obtener una expresi


on an
aloga partiendo de expresar ui uk en terminos de cosenos directores
cos mi cos mk = ik

(13.8)

en cualquiera de sus formas, estas relaciones nos brindan seis ecuaciones independientes (por ejemplo se puede
imponer que i k en estas ecuaciones). Esto nos deja con tres grados de libertad independientes como
esper
abamos.
En vista de lo anterior, los 9 cosenos directores no se pueden usar como coordenadas generalizadas en un
formalismo Lagrangiano o Hamiltoniano para encontrar las ecuaciones de movimiento, es necesario encontrar
tres funciones independientes de estos cosenos directores. Discutiremos m
as adelante algunos de ellos siendo los
m
as importantes los angulos de Euler. No obstante, los cosenos directores son de gran utilidad para estudiar
la conexi
on entre los dos sistemas cartesianos y expresar de una forma mas simple y general varios teoremas
relativos a los cuerpos rgidos. De igual forma permite el uso de algoritmos extendibles a la relatividad especial
y la mec
anica cu
antica. Por lo tanto, seguiremos trabajando en el lenguaje de los cosenos directores.

13.3.

Transformaciones ortogonales

Con el fin de acortar la notaci


on definiremos
aij cos ij
las ecuaciones (13.5) constituyen un conjunto de transformaciones lineales siendo aij un conjunto de coeficientes constantes (independientes de x, x0 ). En la nueva notaci
on podemos sintetizar estas transformaciones
como
x0i = aij xj , i = 1, 2, 3
(13.9)
dado que los cosenos directores no son todos independientes, estas ecuaciones no definen la transformaci
on
lineal m
as general. Las ligaduras obtenidas anteriormente se pueden ver f
acilmente a la luz de la nueva notaci
on,
teniendo en cuenta que el vector posici
on tiene la misma magnitud en ambos sistemas de referencia S 0 y S0 en
virtud de su origen com
un. Esto nos conduce a la condici
on
xi xi = x0i x0i

(13.10)

que en el caso de vectores reales corresponde a la invarianza de su norma, y como se puede ver en la secci
on
12.4, la transformaci
on lineal m
as general que deja invariante la cantidad xi xi , conduce a las condiciones
aij aik = jk

j, k = 1, 2, 3

(13.11)

que resultan identicas a las ligaduras expresadas en (13.8). Naturalmente, la forma alternativa de la condici
on
de ortogonalidad Ec. (13.7), se escribe en esta notaci
on en la forma
aji aki = jk ; j, k = 1, 2, 3

(13.12)

La transformaci
on lineal (13.9) se denomina transformaci
on ortogonal si los coeficientes aij de la transformaci
on satisfacen las Ecs. (13.11) conocidas como condiciones de ortogonalidad. De modo que la transicion entre las coordenadas de S0 y las de S 0 se realizan a traves de una transformaci
on ortogonal. Los
coeficientes de la transformaci
on se pueden escribir en un arreglo matricial de la forma

a11 a12 a13


A a21 a22 a23
a31 a32 a33


CAPITULO 13. CINEMATICA
DEL CUERPO RIGIDO

328

que denominaremos matriz de la transformaci


on siendo los aij elementos matriciales de la transformaci
on.
N
otese que la condici
on de ortogonalidad (13.11) se puede ver mnemotecnicamente como si la matriz estuviera
constituda por 3 vectores columna ortonormales entre s i.e.

a1k
Vk a2k
; k = 1, 2, 3
a3k
Vj Vk = aij aik = jk
(13.13)
la cual se puede ver como una relaci
on de ortonormalidad entre los vectores columna arriba descritos2 . Sin
embargo, es importante enfatizar que esta es una regla mnemotecnica ya que los Vk no definen ning
un vector
en el espacio. Un vector en un espacio vectorial est
a constitudo por combinaciones lineales en una u
nica
base. Estos coeficientes son realmente enlaces entre dos bases diferentes y constituyen una transformaci
on que
genera un cambio de base. El producto punto definido aqu es solo un algoritmo establecido para el arreglo
vectorial pero no se est
a realizando el producto entre vectores unitarios bien definidos.
A manera de ejemplo, veamos el caso del movimiento en un plano. Si por simplicidad, nos restringimos a
rotaci
on en el plano X1 X2 entonces el eje de rotaci
on es el eje X3 de modo que u03 = u3 . Pensemos que en un
instante dado de tiempo el angulo entre X1 y X10 es , se tiene entonces que


a11 = cos 11 = u01 u1 = cos ; a12 = u01 u2 = cos
= sin ; a13 = u01 u3 = u01 u03 = 0
2


0
0
a21 = u2 u1 = cos
+ = sin ; a22 = u2 u2 = cos ; a23 = u02 u3 = u02 u03 = 0
2
a31 = u03 u1 = u3 u1 = 0 ; a32 = u03 u2 = u3 u2 = 0 ; a33 = u03 u3 = 1
la matriz de transformaci
on queda de la forma
Ax1 ,x2

cos sin 0
= sin cos 0
0
0
1

(13.14)

y la transformacion de coordenadas queda

0
cos sin 0
x1
x1
sin cos 0 x2 = x02
0
0
1
x3
x03

x01 = x1 cos + x2 sin ; x02 = x1 sin + x2 cos ; x03 = x3

puede observarse que las condiciones de ortogonalidad (13.11) se cumplen en esta matriz. Es claro que en este
caso solo hay una coordenada independiente cual es el angulo de rotaci
on del eje X3 , los otros dos grados de
libertad requeridos para determinar el vector unitario a lo largo del eje de rotaci
on ya han sido considerados.
Para continuar trabajando sobre la cinem
atica del cuerpo rgido, es necesario utilizar las propiedades
matriciales que desarrollamos en el captulo 12. Insistimos nuevamente que estas propiedades son identicas en
cualquiera de las dos interpretaciones activa o pasiva, de modo que en general no haremos distincion entre (r)0
y r0 en las operaciones subsecuentes, a menos que se especifique lo contrario.

13.4.

Angulos
de Euler

Hemos visto que los 9 cosenos directores no forman un conjunto independiente de modo que no pueden
ser usados como coordenadas generalizadas para un formalismo Lagrangiano o Hamiltoniano. Es necesario en
2

Similarmente, se puede ver a la matriz como compuesta de tres vectores fila que tambien son ortonormales entre s. Esto se
puede ver de la forma alternativa de la condici
on de ortogonalidad Ec. (13.12).


13.4. ANGULOS
DE EULER

329

Figura 13.3: Conjunto de rotaciones para llegar desde los ejes X1 X2 X3 hasta los ejes X10 X20 X30 .

consecuencia buscar tres par


ametros independientes con los cuales se pueda escribir la matriz ortogonal de
rotaci
on. Estos par
ametros se podr
an usar entonces como coordenadas generalizadas independientes para un
formalismo Lagrangiano o Hamiltoniano. Por otro lado, dado que las rotaciones son transformaciones contnuas,
se sigue que adem
as de las condiciones de ortogonalidad, las matrices ortogonales asociadas deben ser propias


CAPITULO 13. CINEMATICA
DEL CUERPO RIGIDO

330
i.e. su determinante debe ser +1.

Hay muchas escogencias posibles para los tres par


ametros independientes, siendo las m
as populares los
angulos de Euler que describimos a continuaci
on: Queremos pasar de un conjunto de ejes coordenados ortogonales X1 X2 X3 a otro conjunto de ejes ortogonales X10 X20 X30 donde ambos sistemas de ejes tienen origen com
un.
Es claro que si determinamos las direcciones de los ejes X10 X20 el tercer eje est
a unvocamente determinado
si la transformaci
on es contnua (ya que en este caso se conserva la quiralidad del sistema de ejes). Para ello
un angulo que oriente a estos ejes en dicho plano. La
necesitamos determinar el plano en donde yace X10 X20 y alg
figura 13.3 muestra al plano generado por X1 X2 y al plano (sombreado) generado por X10 X20 los cuales forman
un angulo diedro, y se intersectan en una lnea nodal como indica la figura 13.3. Para pasar del sistema
X1 X2 X3 al sistema X10 X20 X30 debemos llevar a los ejes X10 X20 a sus posiciones finales lo cual se puede realizar
esquem
aticamente en tres pasos (a) Rotar el sistema para que el nuevo eje X1 quede en el plano sombreado
(plano generado por X10 X20 ), (b) rotar el sistema para que el nuevo eje X2 entre tambien en el plano sombreado,
on de los
una vez que los nuevos ejes X1 X2 ya esten en el plano de X10 X20 el paso final es (c) hacer una rotaci
ejes en el plano sombreado para que tengan su orientaci
on final.
(a)

(a)

(a)

Veamos en detalle el proceso, (a) En primer lugar pasamos del sistema X1 X2 X3 al sistema X1 X2 X3
(a)
haciendo una rotaci
on alrededor del eje X3 en un angulo de modo que el nuevo eje X1 quede a lo largo de
(a)
(a)
la lnea nodal, es decir X1 queda dentro del plano sombreado, en este caso es claro que X3 = X3 . (b) En
(a) (a) (a)
(b) (b) (b)
(b)
el siguiente paso, pasamos del sistema X1 X2 X3 al sistema X1 X2 X3 de modo que el nuevo eje X2
quede dentro del plano sombreado pero sin sacar al eje que ya se introdujo en ese plano, por tanto se deduce
(a)
que la rotaci
on debe realizarse alrededor de X1 para que este eje no se salga del plano sombreado, haremos
(a)
(b)
entonces una rotaci
on en un angulo alrededor de X1
siendo el angulo adecuado para que el eje X2
(b)
(a)
quede dentro del plano sombreado. En este caso es claro que X1 = X1 y con este paso hemos conseguido
(b)
(b)
que los nuevos ejes X1 y X2 esten en el plano generado por X10 X20 , solo falta en consecuencia realizar una
(b)
(b)
rotaci
on dentro de este plano que nos lleve desde X1 X2 hacia los ejes X10 X20 lo cual se logra con (c) una
(b)
(b)
rotaci
on alrededor del eje X3 en un angulo . En este caso X30 = X3 .
En consecuencia, una rotaci
on arbitraria del sistema coordenado X1 X2 X3 al sistema coordenado X10 X20 X30
se puede realizar de la forma que se ve en la Fig. 13.3: comenzamos haciendo una rotaci
on antihoraria en un
(a)
(a)
angulo alrededor de X3 , al sistema coordenado resultante de esta rotaci
on lo denotaremos por X1 , X2 ,
(a)
(a)
X3 (naturalmente, X3 coincide con X3 ). En el segundo paso, rotamos al nuevo sistema coordenado con
(a)
respecto a X1 en sentido antihorario en una cantidad como muestra la figura 13.3, denotamos al sistema
(b)
(b)
(b)
(b)
(a)
resultante como X1 , X2 , X3 . El eje X1 (que coincide con X1 ), se forma con la intersecci
on entre los planos
(b) (b)
X1 X2 y X1 X2 y se conoce como lnea nodal. Finalmente, se hace una rotaci
on antihoraria alrededor
(b)
de X3 para llegar al sistema coordenado final X10 X20 X30 . Los elementos de una transformaci
on completa se
puede obtener por composici
on de las tres operaciones aqu descritas. La rotaci
on inicial (alrededor de X3 )
transforma a un vector (o a sus componentes) en la forma

x(a) = Dx

cos sin 0
D = sin cos 0
0
0
1

(13.15)

(a)

(a)

(a)

donde D es una matriz que describe un cambio de base de la forma X1 X2 X3 X1 X2 X3 . La segunda


(a)
(a) (a) (a)
(b) (b) (b)
rotaci
on alrededor de X1 describe un cambio desde la base X1 X2 X3 hacia la base X1 X2 X3 y nos
da

1
0
0
x(b) = Cx(a) ; C = 0 cos sin
(13.16)
0 sin cos


13.5. PARAMETROS
DE CAYLEY-KLEIN

331
(b)

(b)

(b)

(b)

y finalmente describimos el cambio de base X1 X2 X3 X10 X20 X30 con la rotaci


on alrededor de X3 :

cos sin 0
x0 = Bx(b) ; B = sin cos 0
(13.17)
0
0
1

de modo que llegamos desde x hasta x0 con la transformaci


on:
x0 = Ax ;

A BCD

(13.18)

haciendo el producto de las tres matrices se obtiene la matriz de rotaci


on m
as general en terminos de los
angulos de Euler

cos cos cos sin sin


cos sin + cos cos sin sin sin
A = sin cos cos sin cos sin sin + cos cos cos cos sin
(13.19)
sin sin
sin cos
cos

se puede verificar que esta matriz es ortogonal propia. Tambien se puede demostrar que su inversa coincide
con su traspuesta como corresponde a toda matriz ortogonal

cos cos cos sin sin sin cos cos sin cos sin sin
e = cos sin + cos cos sin sin sin + cos cos cos sin cos
A1 = A
(13.20)
sin sin
cos sin
cos

Existe por supuesto una arbitrariedad en la secuencia de rotaciones que se puede escoger, la primera rotaci
on
se puede realizar con respecto a cualquiera de los ejes y en las dos rotaciones posteriores, la u
nica limitaci
on
es que no se puede hacer dos rotaciones sucesivas con respecto al mismo eje. Por lo tanto hay un total de
12 convenciones posibles para un sistema dextr
ogiro. Las dos convenciones m
as usadas en Fsica solo difieren
en la segunda rotaci
on: en nuestra convenci
on (xconvenci
on) la segunda rotaci
on se hace con respecto a
(a)
(a)
X1 en tanto que en la otra (yconvenci
on), la rotaci
on se realiza con respecto al eje X2 . Hay una tercera
convenci
on muy usada en aplicaciones en ingeniera conocida como xyzconvenci
on. Es muy importante
conocer la convenci
on usada en la construcci
on de la matriz a la hora de comparar resultados.

13.5.

Par
ametros de Cayley-Klein

????????????????????

13.6.

Teorema de Euler para el movimiento del cuerpo rgido

Hemos visto que la orientaci


on relativa de un cuerpo rgido en cualquier instante se puede especificar con
una transformacion ortogonal real propia. Tres par
ametros debidamente escogidos determinan la matriz de la
transformaci
on. Ahora bien, la orientaci
on del cuerpo puede cambiar en el tiempo, y por lo tanto la matriz de
transformaci
on se escribe como A (t). En particular, se pueden escoger los ejes iniciales de S 0 coincidentes con
los de S0 con lo cual
A (0) = 1
como el movimiento del cuerpo es contnuo, la matriz debe evolucionar en forma contnua desde la identidad
hasta su valor en un tiempo dado A (t).
Habamos tambien mencionado que intuitivamente, una orientaci
on arbitraria pareca poder ser generada
especificando un eje de rotaci
on (vector unitario) y el angulo de rotaci
on alrededor de tal eje. El siguiente
teorema es un enunciado formal de tal hecho
Theorem 10 Teorema de Euler: El movimiento general de un cuerpo rgido con un punto fijo es una rotaci
on
alrededor de alg
un eje

332

CAPITULO 13. CINEMATICA


DEL CUERPO RIGIDO

El teorema establece que para toda rotaci


on con un punto fijo es siempre posible encontrar un eje que pasa
por el punto fijo orientado de una forma particular (con respecto a S0 ), tal que la rotaci
on con un cierto angulo
alrededor de este eje, emula la rotaci
on general. En este caso podemos pensar en los par
ametros , (que
orientan al eje) y el par
ametro de rotaci
on como los tres par
ametros independientes.
Es claro que una rotaci
on con un punto fijo en un intervalo dado de tiempo nos lleva de una configuraci
on
inicial a una configuraci
on final. Si bien el teorema nos afirma que a partir de la configuraci
on inicial es posible
llegar a la configuraci
on final por medio de una rotaci
on con un eje fijo para cierto angulo, esto no quiere decir
que el movimiento real haya sido con eje fijo, de hecho durante el movimiento es posible que la orientaci
on
del eje de rotaci
on haya cambiado en el tiempo. Esto es an
alogo al caso traslacional: el movimiento de una
partcula puntual nos lleva de una posici
on inicial a una posici
on final, para ir de esta posici
on inicial a la
posic
on final es siempre posible realizarlo a traves de una lnea recta (direcci
on constante) recorriendo cierta
distancia, pero esto no siginifica que el movimiento real haya sido en lnea recta, aunque en ambos casos la
posici
on inicial y la final coincidan.
Si el punto es fijo con respecto al sistema inercial S (el punto fijo no es necesariamente el centro de masa
del cuerpo), entonces S0 coincide con S y tal punto se toma como origen de S, S0 y S 0 para todo tiempo, el
desplazamiento del cuerpo rgido no involucra traslaci
on de los ejes del cuerpo respecto a S, solo cambia su
orientaci
on. El teorema entonces establece que los ejes coordenados X10 X20 X30 se pueden obtener para cualquier
tiempo t, por medio de una u
nica rotaci
on alrededor de un eje dado del sistema X1 X2 X3 . Esto implica
formalmente que el operador representado por la matriz A que describe el movimiento fsico del cuerpo rgido
es una rotaci
on. Es caracterstico de una rotaci
on, que la direcci
on del eje de rotaci
on permanezca inalterada
en el proceso. Por tanto, un vector que vaya a lo largo de tal eje debe tener las mismas componentes en S0
y S 0 . La otra condici
on necesaria para una rotaci
on de que la magnitud de los vectores sea un invariante,
est
a garantizada por el car
acter ortogonal real de la matriz como vimos en la secci
on 12.4. En consecuencia,
el teorema de Euler ser
a probado si podemos mostrar que existe al menos un vector x que tiene las mismas
componentes en ambos sistemas coordenados S y S 0 . En notaci
on matricial esto implica
x0 = Ax = x

(13.21)

comparando esta ecuaci


on con la ecuaci
on de valores propios (12.39), se observa que el problema se reduce a
demostrar que = 1 es un valor propio de la matriz A. Podemos entonces reescribir el teorema de Euler en la
siguiente forma:
La matriz ortogonal real que especifica el movimiento de un cuerpo rgido con un punto fijo es tal que al
menos uno de sus valores propios es igual a la unidad.
En la secci
on 12.4 encontramos que para toda matriz ortogonal real propia de dimensi
on impar
siempre hay por lo menos un valor propio igual a la unidad. Recordando adem
as que las rotaciones solo
pueden ser descritas por matrices ortogonales propias y que nuestra dimensi
on es tres, se obtiene lo que se
quera demostrar. N
otese que la validez del teorema de Euler dependi
o del car
acter impar de la dimensi
on
del espacio. Por ejemplo, en dos dimensiones no existe un vector en el espacio bidimensional que quede
invariante ante una rotaci
on, el eje de rotaci
on es perpendicular al plano y est
a por tanto fuera de dicho
espacio.
Adicionalmente, examinando los valores propios de una matriz ortogonal propia de tres dimensiones Ecs.
(12.65) y recordando las transformaciones asociadas a las posibles estructuras de valores propios (ver pag 298),
se puede dar una forma m
as completa al teorema de Euler: Cualquier matriz ortogonal real propia no trivial de
tres dimensiones posee uno y solo un valor propio igual a la unidad. Esto es de esperarse, ya que una rotaci
on
no trivial transforma de manera no trivial a cualquier vector que no sea colineal con el eje de rotaci
on.
La Ec. (13.21) nos muestra que el autovector asociado a = 1 determina la direcci
on del eje de rotaci
on,
y dado que si la rotaci
on es no trivial solo hay un valor propio = 1 podemos determinar unvocamente dicho
eje. Los cosenos directores del eje de rotaci
on se pueden obtener entonces haciendo = 1 en las ecuaciones de
valores propios (12.41) y resolviendo para X1 , X2 , X3 cuyas soluciones forman un autovector asociado a = 1
(recordemos que estrictamente solo se obtienen cocientes entre tales componentes, si imponemos unitariedad
podemos definir casi completamente un vector en la direcci
on del eje excepto por su sentido, cualquier m
ultiplo
de este autovector tambien es autovector asociado al mismo autovalor).

13.7. ROTACIONES FINITAS

333

Una vez determinado el eje de rotaci


on procedemos a encontrar el angulo de rotaci
on alrededor de dicho
eje. A traves de una transformaci
on de similaridad (cambio de base), es posible transformar la matriz A a una
matriz equivalente i.e. que describe al mismo operador pero en otra base
A0 = BAB1
en particular podemos escoger el cambio de base B de tal forma que el nuevo eje X30 coincida con el eje de
rotaci
on. En tal sistema coordenado A0 representa una rotaci
on alrededor de X30 i.e. en el plano X10 X20 , en un
0
angulo . En consecuencia, la matriz A adquiere la forma

cos sin 0
(13.22)
A0 = sin cos 0
0
0
1
la traza de A0 es de la forma

T rA0 = 1 + 2 cos

(13.23)

y recordando que la traza es invariante ante una transformaci


on de similaridad tenemos que
T rA0 = T rA
3
X
aii = 1 + 2 cos

(13.24)

i=1

siendo aii los elementos diagonales (conocidos) de la matriz A. Por tanto, se puede despejar en terminos
de estos elementos. Por otra parte, asumamos otra transformaci
on de similaridad que nos lleve a una forma
diagonal equivalente (ver Ecs. 12.46, 12.47). De nuevo usando la invarianza de la traza y la estructura de
valores propios (12.65)
(13.25)
T rA = T r = 1 + ei + ei = 1 + 2 cos
e igualando (13.24) con (13.25) resulta
1 + 2 cos = 1 + 2 cos
=

(13.26)

de modo que el angulo de rotaci


on es igual a una de las fases complejas asociadas a los valores propios.
Ya hemos mencionado que si xk es un autovector asociado a k entonces xk tambien lo es. De modo que
no solo es ambig
ua la magnitud del vector sino tambien su sentido. Similarmente, la soluci
on del problema
de valores propios tambien nos da una ambig
uedad en el sentido de giro del eje de rotaci
on seg
un se ve en
(13.26). En realidad, es claro que la soluci
on de valores propios no fija unvocamente a la matriz ortogonal
A. Por ejemplo, la ecuaci
on secular para el determinante (12.42) nos muestra que la matriz traspuesta (y
por tanto la inversa en una matriz ortogonal) tiene los mismos autovalores y autovectores que A. Esto es
l
ogico geometricamente, ya que la rotaci
on inversa corresponde al mismo eje de rotaci
on y al mismo angulo
excepto por un signo relativo en uno u otro, pero ya vimos que los vectores propios contin
uan siendo vectores
propios bajo un cambio de signo y los valores propios de una matriz ortogonal propia 33 tienen la estructura
uedades
i = 1, ei es decir invariante ante un cambio de signo de la fase . A pesar de lo anterior, las ambig
pueden ser al menos aminoradas asumiendo que se asocia a A y se asocia a A1 , y fijando el sentido de
los ejes de rotacion por la regla de la mano derecha.
Como corolario del teorema de Euler aparece el Teorema de Chasles: El desplazamiento m
as general
de un cuerpo rgido consiste en una traslaci
on mas una rotaci
on. Esto se ve simplemente teniendo en cuenta
que si el punto de referencia ya no es fijo entonces podemos descomponer el movimiento visto por S como
la traslaci
on pura de S0 mas la rotaci
on pura de S 0 con respecto a S0 . En realidad, Chasles demuestra una
versi
on m
as fuerte que dice que es posible escoger el origen de S 0 de modo que la traslaci
on este en la misma
direcci
on que el eje de rotaci
on.


CAPITULO 13. CINEMATICA
DEL CUERPO RIGIDO

334

Figura 13.4: Rotaci


on finita en un a
ngulo . El vector unitario n determina el eje de rotaci
on en el sentido
horario (regla de la mano izquierda).

13.7.

Rotaciones finitas

Hemos trabajado hasta aqu dos parametrizaciones para determinar la orientaci


on relativa de un sistema
coordenado. Por un lado los angulos de Euler me permiten construr cualquier orientaci
on relativa de S 0 a partir
de la orientaci
on de S0 mediante tres rotaciones sucesivas. Por otro lado, el teorema de Euler nos dice que la
transformaci
on de coordenadas necesaria para cualquier cambio de orientaci
on se puede llevar a cabo con una
sola rotaci
on en torno a una direcci
on adecuada. Es natural entonces tratar de construr una representaci
on
en terminos de los grados de libertad de dicha rotaci
on como son el angulo de rotaci
on y los cosenos directores
del eje (probablemente con condici
on de unitariedad del vector director).
Es m
as conveniente en este caso utilizar un punto de vista activo de la rotaci
on de modo que el sistema
coordenado permanece inalterado y se hace una rotaci
on de los vectores. Hay que recordar que una rotaci
on
antihoraria para el sistema coordenado corresponde a una rotaci
on horaria para los vectores.

En la figura 13.4, el vector OP es la posici


on inicial r del vector y la posici
on final r0 ser
a OQ. El vector
unitario n define la direcci
on del eje de rotaci
on y su sentido sigue la regla de la mano izquierda, los vectores

N P y N Q son perpendiculares al eje de rotaci
on y pasan por el. Es claro que la distancia ON tiene valor n r,
por lo tanto podemos escribir

ON = n (n r)
(13.27)
Del diagrama tambien se observa que


ON + N P = OP N P = OP ON

N P = r n (n r)
y as mismo se observa que





N P = N Q = kr nk

(13.28)

(13.29)

estas magnitudes son iguales al radio de la circunferencia en la figura. La figura 13.4 muestra a la derecha
el diagrama de vectores en el plano N QP perpendicular al eje de rotaci
on. Con estas relaciones ya podemos
escribir la relaci
on entre r y r0 en funci
on de n y . De este diagrama es f
acil ver que

r0 = ON + N V + V Q

(13.30)

13.7. ROTACIONES FINITAS

335

siendo el vector V Q perpendicular a N P . El vector r n es perpendicular al plano ON P . Por otro lado la


figura tambien muestra que

NP
NP
N P





N V = N V = N Q cos
= N P cos = N P cos
N P
N P
N P

donde hemos usado (13.29). Ahora usando (13.28) resulta

N V = [r n (n r)] cos

(13.31)

similarmente escribamos el vector V Q usando (13.29)


(r n)

(r n)





V Q = V Q
= N Q sin

kr nk
N Q

V Q = (r n) sin

(13.32)

reemplazando (13.27), (13.31) y (13.32) en (13.30) resulta


r0 = n (n r) + [r n (n r)] cos + (r n) sin
ahora simplemente reagrupamos terminos para escribir el resultado final
r0 = r cos + n (n r) [1 cos ] + (r n) sin

(13.33)

a la ecuaci
on (13.33) se le conoce como f
ormula de rotaci
on. Esta ecuaci
on es v
alida para cualquier rotaci
on
de cualquier magnitud, y por tanto constituye una versi
on para la rotaci
on finita (en sentido horario, es decir
con el vector unitario definido por la regla de la mano izquierda) de la expresi
on que se encontr
o en la p
agina
74 para rotaciones infinitesimales en un vector.

13.7.1.

Forma matricial de la f
ormula de rotaci
on

La f
ormula (13.33) para la rotaci
on se puede colocar en forma m
as adecuada para una formulacion matricial
introduciendo un escalar e0 y un vector de componentes e1 , e2 , e3 en la forma
e0 = cos

; e = n sin
2
2

(13.34)

es evidente que estos par


amtros est
an relacionados por
e20 + e2 = e20 + e21 + e22 + e23 = 1

(13.35)

usando la identidad
cos2

sin2
= cos = e20 e2
2
2
cos = e20 e21 e22 e23

(13.36)

y de la identidad
2 sin

cos
= sin = 2e0 e
2
2
n sin = 2e0 e

(13.37)


CAPITULO 13. CINEMATICA
DEL CUERPO RIGIDO

336

usando las identidades (13.34), (13.35), (13.36), (13.37) en la Ec. (13.33) resulta


= r

+ n (n r) 2 sin
+ 2 (r e) e0
2




2
2
2
2
= r e0 e1 e2 e3 + 2n sin
n sin r + 2 (r e) e0
2
2

2
= r e0 ek ek + 2e (e r) + 2 (r e) e0
e20

r0
r0

e21

e22

e23

(13.38)

esta ecuaci
on establece una relaci
on lineal entre r0 y r, en una forma vectorial. Para construir la matriz
ortogonal A en estos par
ametros, se procede a escribir la ecuaci
on para cada componente x0i en terminos de
una combinaci
on lineal de los xj , los coeficientes de la combinaci
on nos dan la matriz A. Por ejemplo, para
una componente primada se tiene

x0i = xi e20 ek ek + 2ei (ej xj ) + 2ijk e0 xj ek

x0i = xj ij e20 ek ek + 2ei ej xj + 2ijk e0 ek xj



x0i = ij e20 ek ek + 2ei ej + 2ijk e0 ek xj aij xj

la matriz asociada es entonces


aij = ij e20 ek ek + 2ei ej + 2ijk e0 ek

que explcitamente se escribe

e20 + e21 e22 e23


A = 2 (e1 e2 e0 e3 )
2 (e1 e3 + e0 e2 )

2 (e1 e2 + e0 e3 ) 
2
e0 e21 + e22 e23
2 (e2 e3 e0 e1 )

2 (e1 e3 e0 e2 )
2 (e2 e3 + e0 e1 ) 
2
e0 e21 e22 + e23

(13.39)

a manera de consistencia veremos que la traza de la matriz (13.39) es identica a la traza expresada en la Ec.
(13.25), puesto que la traza es invariante ante un cambio de base.



2
2
2
2
T rA =
= 3 cos
sin
= 2 cos
+ cos
sin
2
2
2
2
2
= (1 + cos ) + cos = 1 + 2 cos
3e20

e21

e22

e23

que coincide con (13.25).

13.7.2.

Relaci
on entre n y y los
angulos de Euler

La relaci
on entre los angulos de Euler y el angulo de rotaci
on alrededor del eje de rotacion, se puede
obtener igualando las trazas de la matrices en (13.19) y (13.39). La traza de (13.19) se escribe como
T r1 A = cos cos cos sin sin sin sin + cos cos cos + cos
= (1 + cos ) cos cos (1 + cos ) sin sin + cos
= (1 + cos ) (cos cos sin sin ) + cos

= (1 + cos ) cos ( + ) + cos




 



 


+
+

= 1 + cos2 sin2
cos2
sin2
+ cos2 sin2
2
2
2
2
2
2





 


+
+

=
2 cos2
cos2
sin2
+ cos2 sin2
2
2
2
2
2

13.8. ROTACIONES INFINITESIMALES

T r1 A =
=
=
=
=

337







 


2 +
2 +
2 +
2
2
2 cos
cos
sin
+ cos
sin
2 cos
2
2
2
2
2
2




 

+

2 cos2
2 cos2
1 + cos2 sin2
2
2
2
2



 
 


2
2
2
2
2
4 cos
cos
2 cos
+ cos
sin
2
2
2
2
2


+

4 cos2
cos2 cos2 sin2
2
2
2
2


+

4 cos2
cos2 1
2
2
2

en tanto que la traza de (13.39) se escribe como

T r2 A = 3e20 e21 e22 e23 = 3 cos2 sin2


2

 2

= 4 cos2 1
T r2 A = 3 cos2 1 cos2
2
2
2
igualando ambas trazas se obtiene



1 = 4 cos2
cos2 1
2
2
2
 


 

cos
= cos
cos
2
2
2

4 cos2

13.8.

Rotaciones infinitesimales

A lo largo de este captulo hemos aprendido que para generar rotaciones tridimensionales solo se requieren
tres elementos independientes, con lo cual una representaci
on matricial 3x3 necesariamente contiene muchos
elementos redundantes y se han tenido que agregar ligaduras que garanticen el n
umero correcto de grados de
libertad. El hecho de que las componentes independientes sean tres y que hayamos podido encontrar un eje de
rotaci
on que permita realizar el cambio de orientaci
on con una sola rotaci
on, nos conduce a la posibilidad de
construr un vector que denota a tal transformaci
on. Una posibilidad mas bien evidente sera elegir un vector
a lo largo del eje de rotaci
on cuya magnitud sea una funci
on del angulo de rotaci
on. Veremos sin embargo, que
esta construcci
on no es consistente: si realizamos dos transformaciones sucesivas asociadas a vectores A y B
la composici
on de ellos debe hacerse por la suma de estos la cual es conmutativa
A+B=B+A
hemos visto que la composici
on de dos matrices en general no es conmutativa y esto es v
alido en particular para
las matrices ortogonales. Es f
acil mostrar un ejemplo fsico en el cual las rotaciones sucesivas no conmutan,
la Fig. 13.5 muestra dos rotaciones sucesivas de un bloque realizadas en diferente orden: en el primer caso
se comienza con una rotaci
on antihoraria alrededor de x con x = /2 seguida por otra rotaci
on antihoraria
de /2 alrededor de y. En el segundo caso se invierte el orden de las rotaciones y se observa una marcada
diferencia entre las dos configuraciones.
En consecuencia, si un vector representara satisfactoriamente a una rotaci
on, y la adici
on de vectores me
representara la composici
on de rotaciones, dicha operaci
on de adici
on vectorial no debera ser conmutativa,
pero esta es un propiedad fundamental de un espacio vectorial. Luego, las rotaciones finitas no pueden ser
representadas por vectores.
Veremos a continuaci
on que las transformaciones infinitesimales conmutan a primer orden y que por tanto
pueden ser representadas por un vector. Visto de manera pasiva, consideraremos un cambio de orientaci
on de los
ejes coordenados en la cual los ejes X10 , X20 , X30 solo difieren infinitesimalmente de X1 , X2 , X3 respectivamente.


CAPITULO 13. CINEMATICA
DEL CUERPO RIGIDO

338

La transformaci
on solo difiere de la identidad por cantidades infinitesimales. Las nuevas componentes x0i de un
vector vendr
an dadas por
x0i = xi + ij xj
donde los par
ametros ij son infinitesimales de modo que para efectos de c
alculo solo se conservar
an terminos
de primer orden en tales par
ametros. La relaci
on anterior se escribe
x0i = (ij + ij ) xj
que en notaci
on matricial adquiere la forma:
r0 = (1 + ) r

(13.40)

que manifiesta el hecho ya mencionado de que la matriz de transformaci


on solo difiere infinitesimalmente de
la identidad. Veamos ahora como act
ua la composici
on de dos transformaciones infinitesimales
A1 A2 = (1 + 1 ) (1 + 2 ) = 1 + 1 + 2 + 1 2
sin embargo, considerando solo terminos de primer orden
A1 A2 = 1 + 1 + 2

(13.41)

esta operaci
on es claramente conmutativa (solo el termino de segundo orden que se despreci
o es no conmutativo). En consecuencia, es posible representar estas operaciones infinitesimales mediante vectores.
Es muy sencillo obtener la matriz inversa de una transformaci
on infinitesimal si tenemos en cuenta la
regla de composici
on a primer orden dada por (13.41), en esta composici
on se obtiene la identidad si y solo si
1 = 2 , por lo tanto la inversa se escribira con la siguiente asociaci
on
A = (1 + ) A1 = (1 )
n
otese que esto se asemeja a la relaci
on escalar de primer orden (1 + x)1
on
= 1x. Recordando que la condici
de ortogonalidad equivale a que la inversa sea identica a la traspuesta, se obtiene la siguiente relaci
on3
1 + e = 1
e =

de modo que la matriz infinitesimal debe ser antisimetrica. Dada su antisimetra los elementos diagonales de
la matriz son nulos y tenemos tres grados de libertad como corresponde a toda matriz antisimetrica real 3x3.
Esto a su vez implica que la diagonal de A sigue teniendo elementos unidad y al expandir el determinante se
observa que este contin
ua siendo +1 a primer orden. Naturalmente, no era de esperarse un cambio brusco del
determinante a 1 ya que estas transformaciones son contnuas e infinitesimales. Visto de otro modo, no era
de esperarse que ocurriera una transformaci
on discreta de inversi
on cuando lo que tenemos son par
ametros
contnuos infinitesimales. En conclusi
on estas transformaciones ortogonales son propias y pueden asociarse a
una rotaci
on.
Ya hemos visto que una matriz antisimetrica se puede parametrizar como en la ecuaci
on (12.19). Aplicando
esta parametrizaci
on para escribimos

0
d3 d2
= d3
0
d1
(13.42)
d2 d1
0
donde la notaci
on enfatiza el car
acter infinitesimal de los par
ametros. Teniendo en cuenta (13.40), el cambio
infinitesimal en las componentes de un vector se escribe como
3

Lo discutido hasta aqu es v


alido para cualquier transformaci
on lineal infinitesimal, ya que no se ha usado la relaci
on de
ortogonalidad en ninguna forma.

13.8. ROTACIONES INFINITESIMALES

339

r0 r dr = r

(13.43)

Aplicando ademas las Ecs. (12.19, 12.20, 12.21, 12.22) vemos que un diferencial del vector r se escribe
dr = r d ;

d (d1 , d2 , d3 )T

(13.44)

Esta ecuaci
on nos dice que el cambio infinitesimal del vector r es perpendicular a r mismo y al vector d el
cual como veremos m
as adelante va a lo largo del eje de rotaci
on. Lo primero se puede ver por el hecho de
que si hubiera una componente de dr a lo largo de r implicara un cambio de magnitud de r que no puede ser
producido por una transformaci
on ortogonal. Ahora bien, ya hemos visto que el vector asociado a una matriz
antisimetrica es un vector axial (ver secci
on 12.5). N
otese que la ecuaci
on (13.44) es consistente con este hecho,
ya que r y dr son vectores polares, por lo tanto es necesario que d sea axial para que su producto cruz con un
vector polar sea polar. Como todo vector axial d posee las propiedades de transformaci
on dadas por (12.60)
d0i = |B| bij dj
la forma explcita de d en terminos de los par
ametros de rotaci
on se puede encontrar tomando la f
ormula de
rotaci
on Ec. (13.33) y aplic
andola a un angulo infinitesimal para el cual cos d 1, sin d d, resulta
r0 = r + (r n) d

r0 r = dr = (r n) d

(13.45)

comparando esta expresi


on con (13.44) obtenemos que
d = n d

(13.46)

N
otese que hemos obtenido lo que esper
abamos: el vector d que caracteriza a la rotaci
on infinitesimal va en
la direcci
on del eje de rotaci
on y su magnitud es el angulo de rotaci
on infinitesimal d. Vale la pena anotar
que este vector diferencial no proviene de ninguna diferencia entre vectores finitos, ya que las rotaciones finitas
no pueden ser asociadas a un vector como ya se vi
o. Geometricamente, una inversi
on pasiva nos cambia de un
sistema dextr
ogiro a uno lev
ogiro para definir el sentido de n con lo cual dicho vector ser
a axial, y dado que d
tambien es axial, se deduce que d debe ser un escalar (y no un pseudoescalar). La relaci
on (13.46) tambien se
puede encontrar muy f
acilmente considerando un angulo infinitesimal de rotaci
on en la figura (13.6). El signo
de d se considera positivo en la direcci
on horaria es decir con convenci
on quiral izquierda.
Finalmente, debemos tener en cuenta que las interpretaciones pasiva o activa de las transformaciones se
han tomado a conveniencia. Originalmente se tom
o la interpretaci
on pasiva que nos permite orientar los ejes
coordenadas que se mueven con el cuerpo rgido. Vimos ademas que una interpretaci
on activa de la rotaci
on de
un vector en un sistema coordenado fijo implica una rotaci
on en el sentido contrario i.e. en el sentido horario.
Sin embargo, es m
as usual considerar tales transformaciones activas en la convenci
on antihoraria (en tal caso
n y d s estaran definidos por la regla de la mano derecha). Por esta raz
on, haremos un resumen de las
f
ormulas u
tiles encontradas pero en la convenci
on de sentido antihorario de rotaci
on. De aqu de adelante
se usar
an estas f
ormulas en esta convenci
on antihoraria es decir con regla de la mano derecha
La f
ormula de rotaci
on (13.33) en convenci
on antihoraria es
r0 = r cos + n (n r) [1 cos ] + (n r) sin
la rotaci
on infinitesimal correspondiente (13.45, 13.46) es
r0 r = dr = (n r) d = d r
la matriz antisimetrica de rotaci
on (13.42) se escribira como

0
d3 d2
0
n3 n2
= d3
0
d1 = n3
0
n1 d
d2 d1
0
n2 n1
0
N d

(13.47)

(13.48)

340

CAPITULO 13. CINEMATICA


DEL CUERPO RIGIDO

ni son las componentes del vector unitario n que define al eje de rotaci
on. dr es el cambio infinitesimal desde
r hasta r0 . Teniendo en cuenta (13.43), as como (13.48) se tiene que
dr = r = (N d) r
resultando entonces una ecuaci
on diferencial matricial con respecto al angulo de rotaci
on
dr
= Nr
d

(13.49)

los elementos de la matriz N definida en (13.48), est


an dados por
Nij = ijk nk = jik nk
adicionalmente, la matriz en (13.48) se puede representar de

0 0 0
0
= ni Mi d ; M1 0 0 1 ; M2 0
0 1 0
1

la siguiente forma

0 1
0 1 0
0 0 ; M3 1 0 0
0 0
0 0 0

(13.50)

(13.51)

las matrices Mi se conocen como los generadores de rotaciones infinitesimales y su combinacion posee la
siguiente propiedad
Mi Mj Mj Mi [Mi , Mj ] = ijk Mk
(13.52)
la diferencia entre los dos productos matriciales se denomina conmutador o corchete de Lie. La Ec. (13.52)
define un algebra de Lie del grupo de rotaciones parametrizado en terminos del angulo de rotaci
on y el vector
unitario a lo largo del eje de rotaci
on.
Veremos ahora como se puede construr un operador de rotaci
on finita, a partir de infinitas rotaciones
infinitesimales sucesivas que parten desde la identidad. El proceso es similar al realizado para las transformaciones can
onicas secci
on 8.13 aunque aqu partiremos en el orden inverso, comenzando con transformaciones
infinitesimales para construr la transformaci
on finita. Partiendo de un cierto eje de rotaci
on el angulo de
rotaci
on comienza en = 0 hasta un valor final , podemos hacer la transformaci
on en k etapas sucesivas y
en cada una el angulo aumenta en una cantidad = /k. Si k es suficientemente grande se puede considerar
que cada una de las k rotaciones es infinitesimal de modo que la primera transformaci
on es



r (0) + r = (1 + ) r (0) = (1 + ni Mi ) r (0) = 1 + n M


r (0)
k
donde hemos usado (13.51). El producto punto definido por n M es solo una forma sintetica para denotar
la suma ni Mi la cual a su vez es una matriz. La segunda transformaci
on es


2
r (0) + r + r = (1 + ) (1 + ) r (0) = 1 + n M
r (0)
k
y as sucesivamente se requieren k transformaciones para llegar al vector final


k
r (0) + kr = r () = 1 + n M
r (0)
k
para que cada transformaci
on sea realmente infinitesimal debe tomarse el lmite cuando k


k
r () = lm 1 + n M
r (0)
k
k
y recordando que en funciones ordinarias esta es precisamente una representaci
on de la exponencial


x k
ex = lm 1 +
k
k

(13.53)

DE CAMBIO DE UN VECTOR VISTO POR SISTEMAS ROTANTES


13.9. RAZON

341

se tiene entonces que la Ec. (13.53) se puede reescribir como


r () = e(nM

r (0)

(13.54)

b se puede escribir como una funci


es decir el operador de rotaci
on O
on de operadores
b r (0)
r () = O

b exp (n M )
O

donde n y se denominan par


ametros de la rotaci
on y las tres matrices M definidas en (13.51) son los
generadores. N
otese que las matrices M son las mismas para cada rotaci
on en tanto que los par
ametros varan
de una rotaci
on a otra.
Hay por supuesto otras representaciones de los generadores M, pero todas ellas deben cumplir el algebra
definida por los corchetes de Lie en (13.52). N
otese la similitud entre (13.54) y (8.69), la cual no es coincidencial ya que ambas representan transformaciones contnuas que se construyen a partir de transformaciones
infinitesimales partiendo de la identidad. Notese finalmente que (13.54) es soluci
on de la ecuaci
on diferencial
(13.49) con N = n M.

13.9.

Raz
on de cambio de un vector visto por sistemas rotantes

Consideremos la din
amica de un vector tal como el vector posici
on, momento angular etc. El vector puede
estar cambiando en el tiempo de cierta manera. No obstante, el cambio observado depender
a en general del
sistema coordenado elegido para medir dicho cambio. Definiremos sistemas de referencia S, S0 , Srot en donde
S es un sistema inercial, S0 un sistema con ejes paralelos a S y Srot es un sistema rotante con respecto a S0
pero que tiene origen com
un con el. Srot tiene por tanto un eje de rotaci
on instant
aneo n (t). Nos centraremos
en la forma en que S0 y Srot ven la raz
on de cambio de un cierto vector V, ya que la transformaci
on desde S0
hasta S es muy sencilla (S0 posee traslaci
on pura con respecto a S).

13.9.1.

Raz
on de cambio por argumentos vectoriales

Es importante notar que para ciertos vectores que llamaremos primitivos ambos sistemas S0 y Srot ven
el mismo vector, solo que lo escriben en componentes diferentes como ya se ha mencionado de las transformaciones pasivas. El caso m
as importante de este tipo de vector es el vector posici
on teniendo en cuenta que
ambos sistemas de referencia tienen origen com
un. Antes de hacer el formalismo general tomemos un ejemplo:
Supongamos que el sistema Srot est
a fijo a un cuerpo rgido de tal forma que el vector posici
on de un punto del
cuerpo es claramente constante visto por Srot . Es claro tambien que si el cuerpo rgido tiene cierta din
amica,
dicho vector no ser
a constante con respecto a S0 . N
otese entonces que S0 y Srot miden el mismo vector en cada
instante, digamos en r (t) y en r (t + t). No obstante, ambos sistemas de referencia miden diferentes cambios
en tal vector medidos en el mismo intervalo entre t y t + t, ya que es evidente que para Srot el cambio del
vector en cualquier intervalo es nulo, en tanto que el cambio visto por S0 es diferente de cero. Lo anterior nos
lleva a conclur que aunque en ambos sistemas de referencia S0 y Srot los vectores son los mismos en cada
instante de tiempo, tales sistemas de referencia van a medir razones de cambio diferentes de dichos vectores,
veamos ahora el formalismo general.
Tomemos un vector primitivo pero por lo dem
as arbitrario V. En un instante t dicho vector se escribe
en ambas bases de la forma
(13.55)
V = Vi ui = Virot urot
i
un diferencial de este vector se escribir
a en la forma

rot
dV = (dVi ) ui = dVirot urot
durot
i + Vi
i

(13.56)

donde hemos empleado la convenci


on de que los vectores unitarios asociados a S0 son constantes, lo cual es
razonable ya que esta misma base se usara en el sistema inercial S. Los vectores unitarios urot
pueden en
i
cambio cambiar de direcci
on con respecto a S0 . Dado que los urot
son
unitarios,
no
pueden
cambiar
su
magnitud
i


CAPITULO 13. CINEMATICA
DEL CUERPO RIGIDO

342

y por tanto su cambio es una transformaci


on infinitesimal ortogonal y propia (rotaci
on infinitesimal) alrededor
del eje de rotaci
on instant
aneo n (t). En consecuencia podemos tomar el resultado expresado en (13.47).

rot
durot
d = d urot
i = n ui
i

a partir de esta expresi


on la Ec. (13.56) queda


(dVi ) ui = dVirot urot
i +

d Virot urot
i

ambos miembros de esta ecuaci


on se refieren al cambio del vector visto por S0 4 . En contraste, el cambio
rot
del vector visto por S
corresponde solo al primer termino de la derecha, ya que este sistema ve que los
rot
vectores ui son estacionarios, es decir que visto por S rot se tiene que durot
= 0 y por tanto d urot
= 0.
i
i
rot
rot
Finalmente, de acuerdo con (13.55) tenemos que Vi ui es simplemente V
(dV)S0 = (dV)rot + d V

(13.57)

N
otese que dado que V como tal es igual en ambos sistemas, no escribimos un r
otulo para designar al sistema
que lo mide. Finalmente la raz
on de cambio en un intervalo de tiempo dt sera




dV
dV
d
=
+
V
dt S0
dt rot
dt
definimos la velocidad angular instant
anea asociada al eje de rotaci
on como

d
d
=n
dt
dt

(13.58)

este vector est


a orientado a lo largo del eje de rotaci
on con su sentido definido por la regla de la mano derecha.
Su magnitud corresponde al angulo barrido por unidad de tiempo en el intervalo dt. La raz
on de cambio se
escribe




dV
dV
=
+V
(13.59)
dt S0
dt rot
Es importante diferenciar las rotaciones est
aticas con las cuales se realiza un cambio de base, de las
rotaciones din
amicas que estamos trabajando aqu. Las rotaciones est
aticas nos llevan de un conjunto
0
0
0
de ejes ortogonales X1 X2 X3 a otro conjunto de ejes X1 X2 X3 inclinado con respecto al primero, pero esta
transformaci
on no ocurre en el tiempo, y la inclinaci
on es la misma en todo instante (i.e. los angulos de Euler
que caracterizan la rotaci
on son constantes). En las rotaciones din
amicas, el sistema S 0 no solo est
a rotado
con respecto a S sino que tambien es rotante, es decir la rotaci
on evoluciona en el tiempo y tanto la velocidad
de rotaci
on como la direcci
on del eje son funciones del tiempo (o equivalentemente los angulos de Euler son
funciones del tiempo).

13.9.2.

Raz
on de cambio por argumentos algebr
aicos

Tambien podemos realizar una derivaci


on con base en el formalismo de las matrices ortogonales. Si denotamos A a la matriz que produce la transformaci
on desde la base en S0 a la base en S rot . Las componentes de
V en ambas bases se escriben como
(V)rot = A (V)S0 A1 (V)rot = (V)S0
e (V)
(V)
= A
S0

rot

(13.60)

4
Aunque S0 no es necesariamente inercial, solo tiene traslaci
on pura con respecto a un sistema inercial. Por tanto, todas las
propiedades puramente rotacionales que aparezcan en S0 se ver
an identicas en un sistema inercial S. Incluso podra permitirse que
los ejes de S0 estuvieran inclinados con respecto a los de S, siempre que esta inclinaci
on no cambie en el tiempo.

DE CAMBIO DE UN VECTOR VISTO POR SISTEMAS ROTANTES


13.9. RAZON

343

de aqu en adelante acortaremos la notacion para escribir (V)S y (V)r en lugar de (V)S0 y (V)rot . En
componentes la Ec. (13.60) se escribe
ViS = aji Vjr
(13.61)
la matriz A (i.e. sus componentes) evoluciona en forma contnua con el tiempo. Por tanto, una transformaci
on
infinitesimal (en un intervalo dt) produce cambios infinitesimales en sus elementos. El diferencial del cambio
del vector ser
a
(13.62)
dViS = aji dVjr + daji Vjr
por otro lado, siempre es posible elegir los ejes de modo que S0 coincida con S rot en un cierto instante t. De
esta forma se tiene que
A (t) = 1 ; A (t + dt) = 1 +
(13.63)
como corresponde a las transformaciones infinitesimales, Ec. (13.40). A partir de (13.63) se observa que
aji (t + dt) = ji + ji ; daji = ji = ij

(13.64)

donde hemos usado la antisimetra de . Como los ejes de ambos sistemas coordenados son coincidentes en t,
las componentes de los vectores coinciden instant
aneamente, pero los diferenciales no ser
an identicos ya que
los dos sistemas se mueven el uno relativo al otro. Se tiene entonces que
VjS = Vjr

; aji dVjr = (ji + ji ) dVjr = dVir

(13.65)

donde solo se conservan diferenciales de primer orden. Reemplazando las Ecs. (13.65, 13.64) en (13.62) se
obtiene
dViS = dVir ij Vjr
(13.66)
Por otro lado, usando las Ecs. (13.46), (13.48) y (13.50), podemos escribir los elementos de la matriz
antisimetrica ij en terminos del tensor cclico de Levi civit
a ijk 5 . Hay sin embargo un aspecto delicado cual
es el hecho de que estamos trabajando una transformaci
on pasiva, recordemos que una trasnformaci
on activa
en convenci
on antihoraria equivale a una pasiva en convenci
on horaria, por tanto debemos trabajar con la
convenci
on original de ejes a izquierda, para ello basta con cambiar de signo uno de los miembros de la Ec.
(13.50) manteniendo intactas las definiciones en (13.46), (13.48)
ij
ij

= Nij d = ijk nk d = ikj dk


= ikj dk

(13.67)

y reemplazando (13.67) en (13.66) se obtiene


dViS = dVir + ikj dk Vjr
(dV)Si = (dV)ri + (d Vr )i

recordando adem
as que las componentes del vector como tal coinciden entonces Vjr = VjS Vj y se obtiene
finalmente
(13.68)
(dV)S = (dV)r + d V

que coincide con la expresi


on (13.57). N
otese que la Ec. (13.68) no es tanto una ecuaci
on acerca de un vector
particular sino mas bien una aseveraci
on acerca de la transformaci
on infinitesimal entre dos sistemas coordenados. Ahora bien, dado que (13.59) es v
alida para un vector o pseudovector arbitrario, podemos escribir una
ecuaci
on de operadores de la forma




d (. . .)
d (. . .)
=
+ (. . .)
(13.69)
dt
dt
S
r

y la ecuaci
on vectorial resultante puede ser resuelta a lo largo de cualquier conjunto ortogonal de ejes, fijo o
m
ovil. N
otese de nuevo que la raz
on de cambio en el tiempo es solo relativa a un conjunto coordenado especfico.
Cuando la derivada temporal de un vector es con respecto a un sistema coordenado, las componentes pueden
ser tomadas a lo largo de otro sistema coordenado solo despues de realizar la diferenciaci
on.
5

Dado que el tensor de Levi Civit


a tiene tres ndices y la matriz antisimetrica que genera las rotaciones infinitesimales tiene
dos ndices, no habr
a confusi
on aunque se use la misma letra.


CAPITULO 13. CINEMATICA
DEL CUERPO RIGIDO

344

13.9.3.
y

Segunda derivada en el sistema rotante

Para consideraciones futuras ser


au
til tambien calcular la segunda derivada del vector arbitrario V en S0
Para simplificar la notaci
on definimos


dV
ZS,r
(13.70)
dt S,r

S rot .

la segunda derivada de V en el sistema S0 (denotada por WS ) se escribe como




dZS
WS
dt S
y aplicando el operador (13.69) sobre el vector ZS resulta




dZS
dZS
WS =
=
+ ZS
dt S
dt r

(13.71)

(13.72)

n
otese que en la expresi
on ZS hemos puesto un r
otulo para denotar el sistema de referencia en donde se observa
a Z, situaci
on diferente a la que se ve en la Ec. (13.59), en la cual no se especifica el sistema que observa a V.
La diferencia consiste en que V es un vector primario que no depende del sistema de referencia, en tanto
que Z ya es una raz
on de cambio temporal, que en consecuencia depende explcitamente del sistema elegido.
Por otro lado, usando (13.59) con la nueva notaci
on resulta
ZS = Zr + V
reemplazando (13.73) en (13.72) resulta


d
WS =
(Zr + V) + Zr + ( V)
dt
r

(13.73)

(13.74)

es claro que la segunda derivada vista por S rot sera




dZr
Wr =
dt
de modo que

d
WS = Wr +
( V)
dt

+ Zr + ( V)

(13.75)

tomaremos el caso de constante i.e. eje de rotaci


on y rapidez angular constantes


dV
WS = Wr +
+ Zr + ( V)
dt r
usando (13.70) queda
WS = Wr + 2 Zr + ( V)

(13.76)

retornando a escribir estas segundas derivadas en terminos del vector original V, para ello usamos (13.70,
13.71) y resulta
 
 
 
 


d dV
d dV
dV
=
+ 2
+ ( V)
dt dt S S
dt dt r r
dt r
que nos induce a escribir la ecuaci
on de operadores equivalente
 
 
 
 


d d (. . .)
d d (. . .)
d (. . .)
=
+ 2
+ [ (. . .)]
dt
dt
dt
dt
dt
S S
r r
r

(13.77)

13.10. SISTEMAS NO INERCIALES ROTANTES

345

Una anotaci
on metodol
ogica importante, para la validez de las ecuaciones (13.69, 13.77) no es estrictamente necesario suponer que ninguno de los sistemas de referencia S0 o S 0 sea inercial o que alguno de los
dos este relacionado con un sistema inercial a traves de una traslaci
on pura. Ambos sistemas podran ser
rotantes con respecto a un sistema inercial, las relaciones aqu obtenidas son puramente cinem
aticas y parten
0
simplemente de dos premisas: S0 y S tienen origen com
un y establecemos a S0 como el sistema no rotante
y a S 0 como el sistema rotante. Lo que hacemos entonces es comparar los vectores y sus derivadas vistas
por ambos sistemas, es entonces la rotaci
on de S 0 vista por S0 . Cuando entremos al estudio de la din
amica,
sera importante que uno de los dos sistemas sea inercial (o de lo contrario introducimos un tercero que s lo
sea) a fin de establecer un marco de referencia en donde se puedan emplear las leyes de Newton. Pero las Ecs.
(13.69, 13.77) mantendr
an su validez incluso cuando ambos sistemas sean no inerciales.

13.10.

Sistemas no inerciales rotantes

Las Ecs. (13.69, 13.77) son las leyes cinem


aticas b
asicas sobre las cuales se escribir
an las ecuaciones de
movimiento del cuerpo rgido. Sin embargo, su validez es mucho m
as general dado que son aplicables a un
vector arbitrario.
Las Ecs. (13.69, 13.77) ser
an de particular utilidad en el estudio del movimiento de una partcula o sistemas
de partculas relativo a un sistema coordenado rotante. Describiremos brevemente el problema de una partcula
que se mueve relativo a un sistema rotante. Para ello tomaremos como vector base el vector posici
on de la
partcula (que coincide en ambos sistemas S0 y S 0 ), medido desde el origen com
un de S0 y S 0 . Dado que la
base de la descripci
on din
amica de la partcula es la segunda ley de Newton, debemos calcular la primera y
segunda derivada de este vector con respecto a ambos sistemas de referencia. Partamos de la segunda ley de
Newton en un sistema inercial
F = maS
por simplicidad asumiremos que S0 es un sistema inercial y podemos entonces tomarlo coincidente con S.
Debemos entonces calcular la relaci
on entre la aceleracion vista por S0 denotada por aS y la vista por S 0
denotada como ar . Primero aplicamos el operador (13.69)
 
 
dr
dr
=
+r
dt S
dt r
vS = vr + r
y la aceleraci
on se obtiene aplicando el operador (13.77) al vector r
   
   
 
d dr
d dr
dr
=
+ 2
+ [ r]
dt dt S S
dt dt r r
dt r
aS = ar + 2 ( vr ) + [ r]
despejando ar se obtiene
ar = aS + 2 (vr ) + [( r) ]

(13.78)

analicemos los terminos que aparecen a la derecha de la expresi


on (13.78). El termino [( r) ] se ilustra en
la Fig. 13.7, en tal figura se asume que y r est
an en el plano del papel de modo que r es perpendicular al
papel hacia adentro. Colocando la cola del vector [( r) ] en el punto donde se ubica la partcula, vemos
que tal vector es perpendicular a y apunta en la direcci
on que se aleja de y por tanto del eje de rotaci
on,
2
raz
on por la cual se le conoce como aceleraci
on centrfuga. Su magnitud es r sin siendo el angulo entre
y r. El termino 2 (vr ) se conoce como aceleraci
on de coriolis y es claramente perpendicular al eje de
rotaci
on y a la velocidad de la partcula vista por el sistema rotante.
Multiplicando (13.78) por la masa de la partcula vemos que un observador en el sistema rotante observa
el movimiento de la partcula como si esta se moviera bajo la influencia de una fuerza efectiva:
mar = maS + 2m (vr ) + m [( r) ]

(13.79)

346

CAPITULO 13. CINEMATICA


DEL CUERPO RIGIDO
Ff ict = F + 2m (vr ) + m [( r) ]

(13.80)

Naturalmente, los terminos correspondientes a las aceleraciones centrfuga y de coriolis se denominan efecto
centrfugo y efecto de coriolis. Es m
as adecuado usar los terminos efecto de coriolis o efecto centrfugo que
los terminos fuerza de Coriolis o fuerza centrfuga. Ya que la primera terminologa nos recuerda que estos
efectos surgen de emplear un observador no inercial y no corresponde a interacciones entre sistemas fsicos.
Esto se puede ver claramente del hecho de que cada uno de estos terminos est
a relacionado con la masa de
la partcula por una aceleraci
on que no est
a relacionada con la partcula sino con el sistema rotante. En la
literatura tambien se usa el termino fuerza ficticia para indicar este tipo de efectos.
N
otese que el efecto de coriolis solo aparece si la partcula tiene una velocidad no nula con respecto al
sistema rotante y produce una aceleraci
on normal a la velocidad instant
anea, esto implica a su vez que este
efecto (tomado aisladamente) solo produce cambio de direcci
on pero no de rapidez en la partcula. De otra
parte el efecto centrfugo desaparece si el vector posicion de la partcula es paralelo al vector velocidad angular
i.e. al eje de rotaci
on.
Un sistema rotante particular de gran utilidad en la Fsica es el planeta tierra. Aunque un sistema de
referencia fijo a la tierra puede tomarse en buena aproximaci
on como un sistema inercial, para ciertas medidas
de alta precisi
on es necesario considerar el hecho de que este sistema rota con respecto a un sistema mucho
mas cercano al ideal inercial (sistema de referencia de las estrellas fijas). En tal caso, debe estudiarse los
efectos centrfugo y de coriolis para un sistema de referencia fijo a la tierra. Estimaremos entonces el orden de
magnitud de estos efectos en la tierra. La tierra rota en direcci
on antihoraria con respecto al polo norte, con
una velocidad angular relativa a las estrellas fijas dada por



366,25
2
= 7,292 105 s1
=
(24 3600) s
365,25
el primer termino entre parentesis se refiere a la velocidad angular relativa al radio vector del sol. La cantidad
en el segundo parentesis se refiere a el cociente entre el n
umero de das siderales en un a
no, dividido por el
n
umero de das en un a
no solar, es decir es el factor de correcci
on para obtener la velocidad angular relativa a
las estrellas fijas. Tomado este valor de junto con el radio de la tierra en el ecuador, la m
axima aceleraci
on
centrpeta estar
a dada por
2 r = 3,38cm/s2
que corresponde a un 0,34 % de la aceleraci
on de la gravedad. Este efecto es peque
no pero no despreciable.
En realidad, el efecto medido de la gravedad representa el efecto combinado del campo gravitacional de la
distribuci
on de masa de la tierra y los efectos de la aceleraci
on centrpeta. En general se denota la suma de los
dos efectos como el campo de gravedad, para distinguirlo del campo gravitacional.
????????????????????????????????
????????????????????????????????

13.11.

Velocidad angular en t
erminos de los
angulos de Euler

Para prop
ositos futuros, es conveniente expresar el vector velocidad angular en terminos de los angulos
de Euler y sus derivadas temporales. La rotaci
on infinitesimal asociada a se puede construr como tres
= ,
= .
Dadas
rotaciones infinitesimales sucesivas cada una asociada a velocidades angulares = ,
las propiedades vectoriales de las rotaciones infinitesimales, el vector se puede obtener como una suma de
cada uno de los tres vectores asociados a las rotaciones sucesivas. Sin embargo, las direcciones , y no
est
an dispuestas en forma simetrica. est
a dispuesta a lo largo del eje X3 del sistema sin rotar S0 , est
aa
(a)
(b)
lo largo del eje X1 (lnea de nodos), y est
a a lo largo del eje X3 . Por esta raz
on, es mas viable recurrir a
las matrices B, C, D definidas en las Ecs. (13.15, 13.16, 13.17) para obtener las componentes de estos vectores
a lo largo de cualquier conjunto de ejes coordenados.
El sistema mas conveniente para discutir las ecuaciones de movimiento en un cuerpo rgido es el sistema
S 0 fijo al cuerpo. Es importante enfatizar que es la velocidad angular medida por S0 pero se escribir
a en la

13.11. VELOCIDAD ANGULAR EN TERMINOS


DE LOS ANGULOS
DE EULER
base de vectores unitarios de S 0 es decir

347

= i ui = i0 u0i

de hecho la velocidad angular medida por S 0 es cero. No podemos entonces confundir un vector medido por
S 0 , con un vector medido por S0 pero escrito en la base de S 0 .
Obtendremos entonces las componentes de con respecto a los ejes de S 0 , aunque omitiremos la notaci
on
primada para las componentes. Comencemos entonces con el vector . Dado que es paralelo al eje X3 del
sistema S0 , podemos escribirlo f
acilmente en la base de los ejes X1 X2 X3 en la forma (0, 0, )T . Para obtener
sus componentes a lo largo de los ejes del cuerpo X10 X20 X30 debemos en consecuencia transformar el vector de la
base X1 X2 X3 a la base X10 X20 X30 para lo cual hay que aplicar la transformaci
on ortogonal completa A = BCD,
Ecs. (13.18, 13.19)

cos cos cos sin sin


cos sin + cos cos sin sin sin
0
( )S 0 = sin cos cos sin cos sin sin + cos cos cos cos sin 0
sin sin
sin cos
cos

resultando

( )X 0 = sin sin ; ( )X 0 = sin cos


1

( )X 0 = cos
3

n
otese que tiene la proyecci
on sin en el plano X10 X20 y es perpendicular a la lnea de nodos.
Ahora debemos escribir las componentes de con respecto a los ejes X10 X20 X30 . Dado que va a lo largo
(a)
(b)
de la lnea de nodos, la cual est
a definida por el eje X1 = X1 , vemos que el vector se puede escribir en
(b) (b) (b)
el sistema coordenado X1 X2 X3 en la forma ( , 0, 0)T . Para escribir sus componentes con respecto a los
(b) (b) (b)
ejes de S 0 requerimos en consecuencia pasar del sistema X1 X2 X3 al sistema X10 X20 X30 lo cual se obtiene
aplicando u
nicamente la transformaci
on ortogonal final B definida en (13.17)

cos sin 0

( )S 0 = sin cos 0 0
0
0
1
0
con lo que se obtiene

( )X 0 = cos ; ( )X 0 = sin ; ( )X 0 = 0
1

(b)
0

no es necesaria ninguna transformaci


on para obtener  , el cual
 yace a lo largo de X3 = X3 ( = ) de
modo que en la base X10 X20 X30 ya se escribe en la forma 0, 0, . Sumando las componentes de cada velocidad

angular, se obtienen las componentes de con respecto a los ejes fijos al cuerpo i.e. de S 0 :
X10
X20
X30

= sin sin + cos


= sin cos sin
= cos +

(13.81)

con un procedimiento similar se puede encontrar las componentes de a lo largo de los ejes de S0 en terminos
de los angulos de Euler.

348

CAPITULO 13. CINEMATICA


DEL CUERPO RIGIDO

Figura 13.5: Dos rotaciones finitas sucesivas realizadas en diferente orden: Este ejemplo ilustra la no conmutatividad de las operaciones finitas de rotaci
on.

13.11. VELOCIDAD ANGULAR EN TERMINOS


DE LOS ANGULOS
DE EULER

349

Figura 13.6: Ilustraci


on de una rotaci
on infinitesimal. Se usa regla de la mano izquierda para la determinaci
on
del vector unitario n que determina al eje de rotaci
on.

Figura 13.7: Ilustraci


on de la aceleraci
on centrfuga. Para una posici
on dada de la partcula, la aceleraci
on
centrfuga va en la direcci
on perpendicular al eje y alej
andose de el.

Captulo 14

Ecuaciones de movimiento del cuerpo


rgido
En el captulo anterior, hemos desarrollado las herramientas matem
aticas para el estudio sistem
atico de
la cinem
atica del cuerpo rgido. Los angulos de Euler proveen un conjunto conveniente (aunque asimetrico)
de 3 coordenadas generalizadas independientes para determinar la orientaci
on relativa de un cuerpo rgido.
En particular, el metodo de transformaciones ortogonales propias provee una elegante tecnica para generar
las orientaciones relativas. Finalmente, las transformaciones ortogonales infinitesimales proveen un marco para
generar rotaciones finitas por transformaciones sucesivas infinitesimales (tal como ya se vi
o en el captulo de
transformaciones can
onicas). En este captulo se pondra en acci
on el formalismo ya descrito para encontrar
las ecuaciones din
amicas de movimiento de Euler para el cuerpo rgido en una forma conveniente. Veremos
tambien las soluciones para algunas configuraciones simples pero muy importantes.

14.1.

Momento angular y energa cin


etica de movimiento alrededor de un
punto

El teorema de Chasles establece que el movimiento general de un cuerpo rgido consta de una traslaci
on mas
una rotaci
on. Esto permite separar el movimiento en una fase traslacional y una rotacional. En particular si el
cuerpo rgido posee un punto fijo, es claro que alrededor de dicho punto solo tenemos rotaci
on y la componente
traslacional estara ausente. Incluso cuando no hay un punto fijo, los seis grados de libertad para determinar la
configuraci
on del cuerpo rgido se pueden separar en tres grados de libertad que determinan la posici
on de un
punto de referencia y otros tres grados de libertad (e.g. los angulos de Euler) que determinan la orientaci
on
del cuerpo rgido. Si adicionalmente tomamos como punto de referencia el centro de masa del cuerpo rgido,
entonces una divisi
on similar ocurre para el momento angular seg
un se ve en la Ec. (1.25), en donde se observa
que el momento angular visto por el laboratorio (sistema S) se escribe como la suma del momento angular con
respecto al centro de masa (sistema S0 con origen en el centro de masa) mas el momento angular debido a la
traslaci
on del centro de masa. El primer termino involucra solo variables angulares, en tanto que el segundo
incluye solo a las coordenadas cartesianas del centro de masa. Adicionalmente, la Ec. (1.32) nos muestra que
se puede hacer una divisi
on an
aloga para la energa cinetica del cuerpo rgido, en una notaci
on adecuada para
nuestras variables independientes escribimos
1
2
T = M vCM
+ TCM (, , )
2
para el potencial ocurre con frecuencia que una divisi
on similar es tambien posible, si bien no hay un teorema
que lo garantice. El potencial puede usualmente escribirse en dos terminos donde cada uno de ellos involucra
solo uno de los conjuntos coordenados traslacional o rotacional. Como ejemplos sencillos se puede ver que la
energa potencial en un campo gravitacional uniforme depender
a solo de la coordenada vertical del centro de
gravedad (que para campo uniforme coincide con el centro de masa). Por otro lado, si la fuerza sobre un cuerpo
350


14.1. MOMENTO ANGULAR Y ENERGIA CINETICA
DE MOVIMIENTO ALREDEDOR DE UN PUNTO351
es debida a un campo magnetico uniforme B, actuando sobre su momento dipolar magnetico M el potencial
sera proporcional a M B que involucra solo la orientaci
on del cuerpo. En realidad casi todos los problemas
solubles en la practica permiten este tipo de divisi
on de modo que el Lagrangiano, L = T V se podr
a dividir
en dos partes una que involucra solo coordenadas traslacionales y otra que solo involucra variables rotacionales
(coordenadas angulares). Los dos grupos de coordenadas se separar
an completamente y por tanto el problema
traslacional y el rotacional se resolver
an tambien por separado.
Es por tanto de gran importancia encontrar expresiones para el momento angular y la energa cinetica
de movimiento con respecto a alg
un punto fijo en el cuerpo. Para ello emplearemos la relaci
on (13.69) que
liga a las derivadas temporales entre sistemas rotantes y no rotantes. No obstante, es necesario demostrar
previamente la siguiente aseveraci
on: el
angulo de rotaci
on asociado al desplazamiento de un cuerpo
rgido, as como el vector velocidad angular de rotaci
on, son independientes de la escogencia de
origen del sistema coordenado fijo al cuerpo.
Para probarlo tomemos a partir del origen de S dos vectores R1 , R2 asociados a dos posibles orgenes de
sistemas de ejes fijos al cuerpo S10 y S20 respectivamente. Sea R el vector relativo que va desde el origen de S10
hasta el origen de S20 . Claramente resulta que
R2 = R1 + R
si el origen de S20 se considera como un medida relativa a S10 , entonces la derivada temporal de R2 relativa a
S se escribe






dR2
dR1
dR
=
+
(14.1)
dt S
dt S
dt S
calculemos el segundo miembro de la derecha usando (13.69)




dR
dR
=
+ 1 R
dt S
dt r1
donde 1 es el vector velocidad angular apropiado para el sistema S10 . Teniendo en cuenta adem
as que las
derivadas de R relativas a todo sistema de ejes fijos al cuerpo deben ser nulas se obtiene:


dR
= 1 R
dt S
con lo cual la Ec. (14.1) queda

dR2
dt

=
S

dR1
dt

+ 1 R

(14.2)

por otro lado, podemos tambien considerar el origen de S10 como una medida relativa a S20 . El origen del primer
sistema coordenado se considera fijo en el segundo sistema con vector posici
on R. En este caso la derivada
del vector posici
on R1 con respecto a los ejes de S se escribe








dR1
dR2
dR
dR2
=

=
2 R
dt S
dt S
dt S
dt S




dR2
dR1
=
+ 2 R
(14.3)
dt S
dt S
restando las Ecs. (14.2, 14.3) se obtiene la relaci
on
(1 2 ) R = 0
es decir cualquier diferencia en los vectores velocidad angular en dos puntos arbitrarios debe ser paralela a la
lnea que une los dos puntos. Asumiendo que es un campo vectorial contnuo, la u
nica soluci
on posible para
todos los pares de puntos es que los dos vectores velocidad angular sean iguales
1 = 2

352

CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

de modo que el vector velocidad angular es el mismo para todo sistema coordenado fijo al cuerpo rgido. Esto
se puede vislumbrar intuitivamente teniendo en cuenta que las partculas del cuerpo rgido se mueven y rotan
como un todo.
Ahora bien, dado un sistema S0 no rotante1 con origen en cierto punto O, el momento angular del cuerpo
rgido alrededor de este origen ser
a
L = mi (ri vi )
(14.4)
siendo ri , vi el radio vector y la velocidad respectivamente de la iesima partcula relativa al origen escogido.
Es conveniente colocar el origen de S0 en un punto por donde pase el eje de rotaci
on. Cuando hay un punto
fijo del cuerpo rgido respecto a un sistema inercial, este punto es un buen origen ya que el eje de rotaci
on
pasa por el (teorema de Euler), y el sistema S0 ser
a inercial. Si no hay punto fijo un origen conveniente ser
a el
centro de masa, ya que en este caso el movimiento se podr
a separar en una traslaci
on pura del centro de masa
y una rotaci
on pura alrededor de un eje que pasa por el centro de masa.
Como el problema de la traslaci
on pura es muy simple, nos concentraremos en la rotaci
on pura. Supondremos por simplicidad que existe un punto fijo con respecto a un sistema inercial de modo que S0 coincide
con nuestro sistema inercial S. Su origen estar
a en el punto fijo y el eje de rotaci
on pasa por este punto
(de lo contrario el punto no podra ser fijo). Es claro que cada partcula i del cuerpo rgido realizar
a un
movimiento circular con la misma frecuencia angular alrededor del eje de rotaci
on2 , donde el radio del
on de la partcula y i el angulo entre el eje de rotaci
on y ri . La rapidez
crculo ser
a ri sin i siendo ri la posici
instant
anea de la partcula est
a dada por
vi = Ri = ri sin i
y su desplazamiento es tangente al crculo de modo que en direccci
on y magnitud tenemos que
vi = ri

(14.5)

como corresponde a todo movimiento circular. Es importante enfatizar que para que esta expresi
on y otras
que vienen de aqu en adelante sean v
alidas, ri debe medirse con respecto a un origen tal que el eje de rotacion
on es usando la Ec. (13.69) aplicada al vector ri en donde el sistema
pase por el3 . Otra forma de ver esta relaci
rotante S 0 se define como un sistema con ejes fijos al cuerpo




dri
dri
=
+ ri
dt S
dt S 0
el primer termino a la derecha es nulo porque en S 0 la partcula debe estar en reposo, ya que el sistema es fijo
al cuerpo. Por tanto se reproduce la Ec. (14.5). Usando (14.5) en la Ec. (14.4) se obtiene
L = mi [ri ( ri )]
expandiendo el triple producto cruz resulta

explcitamente se escribe



L = mi ri2 ri (ri )

n
h
io
Ln = mi n ri2 (ri )n (ri )j j

(14.6)

Con esto queremos decir que existe un sistema inercial S con ejes paralelos a los de S0 todo el tiempo. Es decir entre S y S0
solo hay traslaci
on pura.
2
El eje de rotaci
on puede variar de direcci
on, pero para nuestros fines, es posible tomar el eje de rotaci
on instant
aneo definido
en un tiempo t. En consecuencia, el movimiento circular tendr
a un plano fijo solo en un intervalo de tiempo infinitesimal, pero
esto no limita nuestra demostraci
on.
3
Hay un aspecto delicado en el sentido de que n como vector no define completamente al eje de rotaci
on, ya que los vectores
no tienen su origen localizado, puesto que una traslaci
on paralela los deja identicos. En contraste, el eje de rotaci
on est
a bien
localizado en el espacio y no se puede trasladar paralelamente sin alterar el problema fsico.


14.1. MOMENTO ANGULAR Y ENERGIA CINETICA
DE MOVIMIENTO ALREDEDOR DE UN PUNTO353
donde los ndices j, n denotan componentes en tanto que el ndice i rotula a una partcula, hay suma sobre los
ndices i, j. Expandiendo la componente x del momento angular resulta
n
h
io
n
h
io
Lx = mi x ri2 (ri )x (ri )j j
= mi x ri2 xi (ri )x x + (ri )y y + (ri )z z


Lx = mi x ri2 xi [xi x + yi y + zi z ]

Lx = mi ri2 x2i x mi xi yi y mi xi zi z

y ecuaciones similares para las otras componentes de L. Vemos que L est


a relacionado con a traves de una
transformaci
on lineal. Parametrizaremos las trasformaciones lineales de las componentes de L en la forma
Lx = Ixx x + Ixy y + Ixz z
Ly = Iyx x + Iyy y + Iyz z
Lz = Izx x + Izy y + Izz z

(14.7)

Comparando las expresiones de Lx se tiene


Ixx = mi ri2 x2i

; Ixy = mi xi yi ; Ixz = mi xi zi

(14.8)

donde a los elementos diagonales se les conoce como coeficientes de momento de inercia, en tanto que
los elementos no diagonales se denominan productos de inercia. Las Ecs. (14.8) son adecuadas si el sistema
de partculas es discreto. Para cuerpos rgidos contnuos la suma sobre i debe reemplazarse por una integral
volumetrica, la masa se convierte en diferencial de modo que los elementos de matriz se escriben como
Z
Z


2
2
Ixx =
r x dm =
(r) r 2 x2 dV
V
Z
(r) xy dV
(14.9)
Ixy =
V

podemos condensar la notaci


on para los elementos diagonales y no diagonales si denotamos los ejes por Xi con
i = 1, 2, 3 y el elemento de matriz Ijk se escribir
a como
Z

Ijk =
(r) r 2 jk xj xk dV
(14.10)
V

De la Ec. (14.7) podemos escribir la ecuaci


on que relaciona al momento angular total con la velocidad angular
de rotaci
on en la forma
Li = Iij j LS = IS S
(14.11)

donde los elementos matriciales Iij est


an dados por (14.10). El subndice S enfatiza que esta ecuaci
on y todos
los observables se miden en el sistema inercial S y con la base de vectores unitarios definida por S. En la
pr
actica sin embargo, resulta poco u
til esta relaci
on ya que los elementos de la matriz IS dependen de la
din
amica del cuerpo y solo se podr
a calcular cuando este resuelto el problema. Por tanto reescribiremos a los
vectores L y y al operador I en una base de vectores unitarios de un sistema S 0 de ejes fijos al cuerpo. Para
ello usamos la matriz pasiva de cambio de base B que nos lleva de la base en S a la base en S 0 , esta matriz es
ortogonal real propia ya que pasa una base ortonormal a otra base ortonormal, multiplicando por B a ambos
lados de (14.11)

BLS = BIS B1 B S (BLS ) = BIS B1 (B S )
LS 0 = I S 0 S 0

(14.12)

recordando que estas transformaciones son de tipo pasivo tenemos que LS 0 , S 0 representa a los mismos
vectores que LS , S . As mismo, IS 0 representa al mismo operador que IS . Simplemente, se est
an escribiendo
en bases diferentes. Por ejemplo LS 0 NO representa el momento angular medido por el sistema S 0 (el cual

CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

354

obviamente es cero), lo que representa es al vector momento angular que mide el sistema S pero escrito en la
base de vectores unitarios u0i fija al sistema S 0 .
Que se logra con esta transformaci
on pasiva? basta notar el hecho de que si la matriz que representa
al operador I en la nueva base conserva su forma, es decir si IS 0 viene dada por las Ecs. (14.10) con el
simple reemplazo xk x0k esta matriz ser
a independiente del tiempo, ya que las coordenadas x0i , yi0 , zi0 son
a fijo al cuerpo. En consecuencia IS 0 solo
constantes en el tiempo para cada partcula iesima cuando S 0 est
depender
a de factores geometricos. Los elementos de matriz ser
an constantes en el tiempo caractersticas del
cuerpo involucrado y dependientes del origen y orientaci
on del sistema coordenado particular fijo al cuerpo.
Sin embargo, para poder afirmar que IS 0 es constante en el tiempo, es necesario demostrar que efectivamente
la representaci
on matricial de I conserva su forma ante una transformaci
on ortogonal propia (cambio de base),
esto se ve simplemente del hecho de que I es un tensor euclidiano de segundo rango, seg
un se puede demostrar
a traves de la regla del cociente expresada en la Ec. (12.139). Para ello notamos que se cumplen todas las
condiciones exigidas para la validez de esta regla del cociente: la ecuaci
on (14.11) es v
alida en cualquier sistema
cartesiano rotado seg
un se puede ver en el procedimiento que nos llev
o a la Ec. (14.12) pues aunque elegimos
el sistema primado como un sistema de ejes del cuerpo, esta condici
on no es necesaria para llegar a (14.12), el
vector es arbitrario pues en principio un cuerpo rgido se puede poner a rotar en cualquier direcci
on y con
cualquier velocidad angular y finalmente las cantidades L y son tensores bien definidos (vectores axiales).
En consecuencia, la regla del cociente nos lleva a que I es un tensor euclidiano de segundo rango (y no un
pseudotensor).
Con base en la discusi
on anterior, entenderemos que de ahora en adelante, la ecuaci
on
L = I

(14.13)

se escribir
a en componentes usando la base de vectores unitarios definida por alg
un sistema coordenado fijo
al cuerpo rgido S 0 4 . Pero no debemos perder de vista que los observables involucrados en esta ecuaci
on son
los medidos con respecto al sistema de referencia S. El operador I est
a representado por una matriz 3x3 cuyos
elementos son los coeficientes de momento de inercia y los productos de inercia. L y son vectores columna. Es
claro que el operador I act
ua desde un punto de vista activo sobre . Esto se puede ver de varias maneras: los
vectores L y son vectores fsicamente diferentes que incluso tienen diferentes dimensiones, y no simplemente
el mismo vector expresado en sistemas coordenados distintos. A diferencia del operador de rotaci
on que es
adimensional, el operador I tiene dimensiones de masa por longitud al cuadrado, y no est
a restringido por
ninguna condici
on de ortogonalidad.

14.2.

Tensor de inercia y momento de inercia

Considerado como un operador lineal que transforma a en L, la matriz I posee las propiedades de
transformaci
on de un tensor de segundo rango. Por esta raz
on se conoce como tensor de inercia. A partir
de la Ec. (14.8) se puede ver claramente que este tensor se puede escribir en forma de afinor de la forma

I = mi ri2 1 ri ri
(14.14)
de lo cual resulta



I = mi ri2 ri (ri ) = L

que coincide con la Ec. (14.6) y nos muestra la ventaja de usar el algoritmo algebr
aico de afinores. La energa
cinetica del cuerpo rgido se escribe como
1
T = mi vi2
2
donde vi es la velocidad de la partcula iesima relativa al punto fijo en el sistema S0 . A partir de la Ec.
(14.5), esta energa cinetica se puede escribir de la forma
1
T = mi vi ( ri )
2
4

Naturalmente esta base de vectores unitarios es diferente en cada instante de tiempo, pero esto no compromete la validez de
la Ec. (14.13), la cual se eval
ua en cada instante de tiempo.

14.2. TENSOR DE INERCIA Y MOMENTO DE INERCIA

355

utilizando identidades vectoriales esto se escribe como

T = mi (ri vi )
2
la cantidad sumada sobre i se reconoce como el momento angular total del cuerpo alrededor del origen de S0
y en consecuencia la energa cinetica se puede escribir en la forma
T =

L
I
=
2
2

(14.15)

definamos ahora
n

(14.16)

siendo n la direcci
on del eje de rotaci
on, reescribimos la expresi
on como
T =

2
1
n I n = I 2
2
2

I nIn

usando (14.14) y la definici


on de I en (14.17) vemos que esta cantidad est
a dada por
h
i
I n I n = mi ri2 (ri n)2

(14.17)

(14.18)

este factor I es un escalar y se conoce como el momento de inercia con respecto al eje de rotaci
on definido
por n y que pasa por el origen de S0 . Podemos escribir esta cantidad de la forma:


I n I n = mi ri2 ri2 cos2 i = mi ri2 sin2 i
La figura 14.1 muestra que la distancia entre el eje de rotaci
on y la partcula iesima est
a dada por
Ri = ri sin i . Por lo tanto, el momento de inercia se puede escribir como
I = mi Ri2

(14.19)

siendo Ri la distancia entre la partcula iesima y el eje de rotaci


on. De esta expresi
on es claro que el valor del
momento de inercia depende de la direcci
on y localizaci
on del eje de rotaci
on5 . Dado que cambia en general
su direcci
on con respecto al cuerpo a medida que el tiempo transcurre, el momento de inercia ser
a tambien en
6
general funci
on del tiempo . No obstante, si el cuerpo est
a restringido a rotar sobre un eje fijo, el momento de
inercia ser
a una constante. En tal caso, la energa cinetica (14.15) est
a casi en la forma requerida para construir
ecuaciones de movimiento de Lagrange o Hamilton, solo se requiere escribir como la derivada temporal de
alg
un angulo lo cual est
a sugerido en la Ec. (13.58), y no presenta mayor dificultad.
Tanto el tensor de inercia como el momento de inercia dependen del origen elegido para los ejes fijos al
cuerpo. Si tenemos en cuenta que adem
as el momento de inercia depende del eje de rotaci
on, vemos que esta
cantidad debe recalcularse cada vez que cambiamos de ejes. Sin embargo, existe un teorema que relaciona a
los momentos de inercia entre dos ejes paralelos cuando uno de ellos para por el centro de masa del cuerpo
rgido.
Theorem 11 Teorema de Steiner: si tenemos dos ejes paralelos y uno de ellos pasa por el centro de masa del
cuerpo rgido, los momentos de inercia vistos por ambos ejes est
an relacionados por
I = I C + M a2
siendo M la masa total del cuerpo y siendoa la distancia entre los ejes.
5

Es decir para calcular el momento de inercia debemos ubicar la direcci


on del eje y un punto por donde pasa. Por otro lado,
recordemos que el origen se debe tomar de tal forma que pase por el eje de rotaci
on, en ese sentido se dice que el momento de
inercia (y el tensor de inercia) depende de la orientaci
on del eje y del origen.
6
De la expresi
on (14.18) vemos que I depende del tiempo solo a traves de n, puesto que el tensor I es independiente del tiempo,
al menos si usamos una base fija al cuerpo.

356

CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

Figura 14.1: Ilustraci


on del momento de inercia con respecto al eje definido por n y que pasa por el punto O
que se elige como origen. La partcula iesima del cuerpo rgido est
a a una distancia Ri de dicho eje.
Definamos un eje XO que pasa por un cierto origen O, y sea XC un eje que pasa por el centro de masa
del cuerpo y que es paralelo a XO . Denotemos por RC a la posici
on del centro de masa (CM) con respecto al
origen O. Recurriendo a la definici
on del momento de inercia (14.19) y a las Figs. 14.1 y 14.2, escribiremos el
momento de inercia con respecto a XO
IO = mi Ri2 = mi (ri n)2

(14.20)

donde la posici
on de la partcula iesima con respecto al origen O se define por ri , y su posici
on con respecto

14.2. TENSOR DE INERCIA Y MOMENTO DE INERCIA

357

Figura 14.2: Ilustraci


on del teorema de los ejes paralelos o teorema de Steiner para el momento de inercia.
al CM se denota por r0i , la Fig. 14.2 muestra que
ri = RC + r0i

(14.21)

es claro adem
as de la Fig. 14.2, que la distancia entre la partcula iesima y el eje XC viene dada por
2 0
2
02
RiC = ri sin i . Reemplazando (14.21) en (14.20), el momento de inercia se escribe (escribiremos la suma
explcita)
h
i
X


2 X
2

IO =
mi r0i + RC n =
mi r0i n + (RC n)2 + 2 r0i n (RC n)
i

IO =

Xh

mi ri02 sin2 i0

IO =

2
mi RiC

i

+ mi (RC n)2 + 2 mi r0i n (RC n)

X
i

mi

(RC n) + 2M

"

1 X
mi r0i
M
i

n (RC n)

0
i mi ri /M

el termino
se refiere a la posicion del centro de masa vista por el propio centro de masa de modo
que se anula. Por otro lado, el primer termino a la derecha es claramente el momento de inercia visto por el
eje XC .

2
IO = IC + M (RC n)2 = IC + M RC
sin2
y nuevamente la Fig. 14.2 muestra que RC sin es la distancia entre los dos ejes, de modo que (omitiendo el
subndice O)
I = I C + M a2
(14.22)

lo cual demuestra el teorema de Steiner. El segundo termino de la derecha equivale al momento de inercia que
tendra el cuerpo rgido con respecto al eje X0 si toda la masa del cuerpo estuviera condensada en un punto

CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

358

que est
a a una distancia a de tal eje (en particular, un punto que pasa por el eje XC ). Podemos ver como
corolario que dada una orientaci
on especfica, de todos los ejes con esta orientaci
on el que pasa por el centro
de masa es el que da el mnimo valor posible del momento de inercia.
Para el tensor de inercia existe una propiedad an
aloga. Reemplacemos (14.21) en (14.14) y escribamos la
suma de forma explcita
h
X
2

i
mi RC + r0i 1 RC + r0i RC + r0i
I =
i

I =

mi



  

2
RC
1 + ri02 1 + 2 RC r0i 1 RC RC + RC r0i + r0i RC + r0i r0i

el tensor de inercia medido en el origen O se puede escribir en forma de afinor de la siguiente forma
(
)
X
 02


2
0
0 0
0
0
mi ri + 2RC ri 1 ri ri + RC ri + ri RC
I = M RC 1 +
M RC RC
I =

(
X
i

I =

(
X
i

0 0
0
0
0
mi r02
i 1 ri ri + 2RC ri 1 RC ri ri RC


0 0
mi r02
i 1 ri ri

+ 2RC

X
i

mi r0i

1 RC

2
+ M RC
1 M RC RC

X
i

mi r0i

(
X

mi r0i

2
RC + M RC
1 M RC RC

todas las sumas de la forma mi r0i se anulan ya que est


an asociadas a la posici
on del CM vista por el propio
CM. La expresi
on se reduce a
"
#
X


2
(14.23)
I =
mi ri02 1 r0i r0i + M RC
1 RC RC
i

2
I = IC + M RC
1 RC RC

(14.24)

de la Ec. (14.14) vemos que el segundo termino a la derecha de (14.24) correspondera al tensor de inercia con
respecto a O asociado a una partcula puntual de masa M situada en el centro de masa. En tal sentido, tanto
el momento de inercia como el tensor de inercia admiten una descomposici
on relativa al CM muy semejante a
la que existe para la energa cinetica, el torque y el momento angular.
Finalmente, para distribuciones de masa bidimensionales, es f
acil relacionar el momento de inercia de un
sistema de tres ejes perpendiculares con origen com
un, si colocamos el s
olido rgido plano sobre el plano XY
es claro que sus momentos de inercia con respecto a cada eje vendr
an dados por
Ix = mi yi2 ; Iy = mi x2i ; Iz = mi x2i + yi2
de modo que se obtiene la identidad

Ix + Iy = Iz
que se conoce como teorema de los ejes perpendiculares, v
alido solo para s
olidos bidimensionales contnuos
o discretos.

14.3.

Compendio de propiedades del tensor de inercia

A partir de (14.10) se observan algunas propiedades inmediatas


1. La representaci
on matricial del tensor de inercia depende de la base de vectores cartesianos elegida pero
tambien del origen de coordenadas elegido, ya que depende del vector posici
on y de sus coordenadas.

14.3. COMPENDIO DE PROPIEDADES DEL TENSOR DE INERCIA

359

2. Iij = Iji el tensor de inercia es simetrico y real, lo cual corresponde a una matriz hermtica real.
Recordemos que la propiedad de simetra es invariante ante un cambio de base ortogonal. Por tanto,
esta propiedad es v
alida en cualquier sistema ortogonal de ejes7 . La simetra a su vez, implica que el
tensor tiene seis grados de libertad.
on (14.8) nos
3. Iii 0, en cualquier base de modo que los elementos diagonales son no negativos. La ecuaci
muestra que Ixx se puede escribir como

Ixx = mi yi2 + zi2

que solo es cero si todos los yi y zi son nulos. Esto indicara que la masa del cuerpo rgido est
a toda
distribuda sobre el eje X como ocurre por ejemplo con un filamento que va a lo largo de dicho eje.

Por otro lado, como la representaci


on matricial de este tensor es simetrica y real es por tanto hermtica,
a partir de la discusi
on de matrices hermticas dada en la secci
on 12.9 se deduce que sus valores propios son
reales. M
as a
un dado que sus elementos diagonales son no negativos en cualquier base, lo ser
an en particular
en la base que diagonaliza tal tensor. Es inmediato ver que una matriz diagonal cuyos elementos diagonales
son no negativos corresponden a una matriz positiva (ver secci
on 12.11) el lector puede adem
as comprobar que
la positividad de una matriz se preserva ante una transformaci
on de similaridad ortogonal real propia. Si los
elementos de la diagonal son estrictamente positivos la matriz ser
a definida positiva, y esto es lo que ocurre en
la mayora de los casos para el tensor de inercia, pues hemos visto que estos elementos solo pueden ser nulos
para distribuciones unidimensionales de masa.
Otra forma de ver la positividad del tensor de inercia es a traves de la definici
on del momento de inercia
(14.17) combinada con la Ec. (14.19) para el momento de inercia con lo cual
n I n I = mi Ri2 0

(14.25)

siendo n un vector unitario arbitrario y Ri la distancia de la masa mi al eje de rotaci


on. Puesto que I es
positivo y n es arbitrario la Ec. (14.25) corresponde a la definici
on de una matriz positiva. De hecho la matriz
es definida positiva excepto para distribuciones unidimensionales para las cuales el momento de inercia con
respecto a un eje que pasa por la distribuci
on de masa es nulo.
Puesto que el tensor de inercia es positivo, su ecuaci
on de valores propios corresponde a un caso particular
de la Ec. (12.91) con T = 1, con lo cual podemos aplicar los resultados de la secci
on 12.11. Resultan entonces
las siguientes propiedades
1. El tensor de inercia es simetrico real y positivo. En realidad, salvo para ciertas singularidades unidimensionales, ser
a definido positivo.
2. Sus valores propios son reales no negativos. En la mayora de los casos ser
an estrictamente positivos.
3. Siempre es posible para un origen dado hacer una rotaci
on a ejes principales donde este tensor sea
diagonal, incluso en presencia de degeneraci
on de los valores propios.
4. Cuando hay degeneraci
on simple (1 = 2 6= 3 ), y encontramos vectores propios V1 , V2 linealmente
independientes asociados al valor propio degenerado, cualquier conjunto de ejes en el plano generado por
ellos son ejes principales. Esto es un indicativo de simetra axial, como ocurre con los s
olidos de revoluci
on
8
cuando uno de los ejes principales es el eje de simetra . Adem
as un vector ortogonal a V1 y V2 tambien
ser
a vector propio y por tanto tambien define un eje principal (ver secci
on 12.9.1). Similarmente, si V1
es vector propio asociado a 1 = 2 y V3 es vector propio asociado a 3 entonces V2 = V1 V3 tambien
es vector propio asociado a 1 = 2 (secci
on 12.9.1).
7

En tensores, es de suma importancia saber si cierta propiedad es independiente de la base, o es v


alida s
olo en una base
particular.
8
Si el origen que elegimos no pasa por el eje de simetra, el eje de simetra no ser
a en general eje principal con respecto a dicho
origen.

360

CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

5. La degeneraci
on completa indica simetra esferica como es el caso de esferas, cascarones y anillos esfericos
etc. (con densidad uniforme).
6. La rotaci
on que nos lleva a ejes principales tiene una interesante analoga con la rotaci
on que lleva a la
ecuaci
on de un elipsoide a su modo normal (ver secci
on 12.9.2). En tal caso hablamos del elipsoide de
inercia. Los momentos principales de inercia determinan las longitudes de los ejes del elipsoide de inercia.
7. Recordemos que la degeneraci
on simple tiene como an
alogo geometrico a un elipsoide de revoluci
on y la
degeneraci
on total corresponde a una esfera.
Vimos adem
as otras propiedades como son:
1. La cantidad I es un tensor cartesiano de segundo rango, lo cual justifica el termino tensor de inercia. Esto
adem
as implica que esta cantidad conserva su forma (definida por 14.10) en cualquier base cartesiana.
En notaci
on di
adica, I se escribe en la forma de la Ec. (14.14)
I = mi ri2 1 ri ri

(14.26)

2. Tanto el momento de inercia como el tensor de inercia poseen un teorema de ejes paralelos, estos teoremas
se escriben:
I = I C + M a2
I = IC + M

2
RC
1

RC RC

(14.27)
(14.28)

La Ec. (14.27) nos dice que si tenemos dos ejes paralelos uno de los cuales pasa por el centro de masa
del cuerpo, siendo a la distancia entre los ejes y M la masa del cuerpo rgido, el momento de inercia en
los dos ejes est
a relacionado por dicha ecuaci
on. La Ec. (14.28) nos dice que si tenemos dos sistemas de
ejes S X1 X2 X3 y SC X1C X2C X3C paralelos entre s donde el origen de SC yace sobre el centro de
masa del cuerpo, los tensores de inercia medidos por ambos sistemas coordenados est
an relacionados por
esta ecuaci
on, siendo RC el vector posici
on del origen de SC medido con respecto al origen de S.
3. A partir de la definici
on de momento de inercia (14.18), se ve que esta cantidad depende de la orientaci
on
y localizaci
on del eje con que se mide. El vector unitario n define la direcci
on, pero como I depende del
origen (el cual se debe elegir de modo que el eje pase por el), tenemos la direcci
on del eje y un punto por
donde pasa, lo cual define al eje unvocamente.
4. En el caso de cuerpos rgidos planos, tenemos un teorema de ejes perpendiculares: si la distribuci
on de
masa del cuerpo yace sobre el plano XY entonces los momentos de inercia con respecto a estos ejes est
an
relacionados por
Ix + Iy = Iz
Ahora bien, dado que el tensor de inercia es simetrico y real lo cual garantiza la existencia de ejes principaples en los cuales su representaci
on matricial es diagonal, veremos que aspecto adquieren las ecuaciones
antes vistas cuando se expresan en esta base de ejes principales. Cuando calculamos el tensor sobre los ejes
principales obtendremos una diada de la forma
I = Ikk uk uk Ik uk uk ; k = 1, 2, 3
con un origen dado, la relaci
on entre el momento angular y la frecuencia angular Ec. (14.13) se simplifica en
la forma
Lk = Ik k ; k = 1, 2, 3 (no hay suma)
(14.29)

14.3. COMPENDIO DE PROPIEDADES DEL TENSOR DE INERCIA

361

de la misma manera la expresi


on para la energa cinetica ser
a
T

1
1
I = (m um ) (Ik uk uk ) (n un )
2
2
1
1
(m Ik n ) (um uk ) (uk un ) = (m Ik n ) mk kn
2
2
1
Ik k2
2

(14.30)

se observa ademas, que si el eje de rotaci


on coincide con alguno de los ejes principales digamos X3 entonces
k = k3 entonces la Ec. (14.29) nos da
Lk = Ik k3 = I3 k3
es decir que solo sobrevive la componente 3, de modo que cuando la rotaci
on es alrededor de alguno de los ejes
principales, el momento angular es paralelo a la velocidad angular. Recordemos que la direcci
on de los ejes
principales coincide con la direcci
on de los vectores propios (conociendo los vectores propios, solo hay que elegir
un origen para determinar los ejes, pero este origen debe pasar por el eje de rotaci
on), por lo tanto el efecto
de I sobre cualquier vector paralelo a un eje principal nos da otro vector tambien paralelo al eje principal, sea
v un vector paralelo a uj
I v = (Ik uk uk ) (vuj ) = Ik vuk (uk uj ) = Ik vuk jk
I v = Ij vuj

(no suma)

lo cual demuestra la anterior afirmaci


on. Este vector v tambien es naturalmente vector propio de I ya que la
acci
on de un operador sobre uno de sus vectores propios es tambien un vector propio9 .
Un concepto muy relacionado con el momento de inercia es el factor geometrico denominado radio de
giro definido por
I M R02
(14.31)
es decir dado un eje XO , el radio de giro es la distancia a este eje a la cual habra que colocar una masa puntual
con la masa de todo el s
olido, para que tuviese el mismo momento de inercia (con respecto a XO ) que el s
olido
completo. Recordando la definici
on original del momento de inercia Ec. (14.18)
I =nIn
y comparando con la Ec. (12.83) podemos retomar el an
alisis hecho en la secci
on 12.9.2. La Ec. (12.84) en este
contexto nos queda
n
n

=
I
R0 M
El radio vector a un punto sobre el elipsoide de inercia es entonces inversamente proporcional a R0 con respecto
a la direcci
on del vector. Las ecuaciones an
alogas a (12.86) y a (12.88) nos dan
I11 21 + I22 22 + I33 23 + 2I12 1 2 + 2I13 1 3 + 2I23 2 3 = 1
02
02
I1 02
= 1
1 + I2 2 + I3 3

siendo la u
ltima la ecuaci
on escrita en la base que diagonaliza al tensor de inercia, en la cual el elipsoide de
inercia adquiere su forma normal, lo cual geometricamente significa que los ejes de la base (ejes principales)
van a lo largo de los ejes del elipsoide. Ii son los valores propios del tensor de inercia (en cualquier base), en
presencia de degeneraci
on simple el elipsoide de inercia corresponder
a a un elipsoide de revolucion, en tanto
que en el caso de degeneraci
on completa el elipsoide se convierte en esfera.
El hecho de que el tensor de inercia y todas las cantidades asociadas a el tales como el ejes principales,
momentos principales, elipsoide de inercia etc., dependan del punto particular fijo en el cuerpo (origen elegido),
9

Existen en todo caso posibles diferencias relativas a las unidades.

362

CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

tiene como consecuencia que si cambiamos de punto en el cuerpo todas estas cantidades en general se modifican.
La Ec. (14.28) nos indica la manera en que el tensor de inercia se modifica cuando pasamos del punto de
referencia centro de masa a otro punto. En particular, la transformaci
on que diagonaliza a I0 cuando
el punto

21R R
fijo es el centro de masa no diagonalizar
a en general al termino diferencia M RC
de
modo
que
C C
en general no definir
a ejes principales en el nuevo punto. El tensor diferencia solo ser
a tambien diagonal en
el caso en el cual RC vaya a lo largo de uno de los ejes principales relativos al centro de masa. En tal caso,
el nuevo tensor de inercia I posee los mismos ejes principales que en el centro de masa, pero los momentos
principales de inercia cambian, excepto en lo que corresponde al desplazamiento de ejes, donde es claro que el
elemento diagonal del tensor diferencia ser
a nulo. El teorema de los ejes paralelos para la forma diagonalizada
del tensor de inercia tiene entonces una forma algo especial y restringida.
El an
alogo geometrico del elipsoide de inercia resulta muy c
omodo para resolver al menos cualitativamente,
algunos aspectos de la din
amica del cuerpo rgido, para esto resulta m
as conveniente parametrizar al vector
usando las Ecs. (14.17) y (14.16)

= = p
=
(14.32)
2
I
2T
2T /

en el sistema coordenado de los ejes principales del cuerpo, definimos la funci


on
F () = I = 2i Ii

(14.33)

donde las superficies con F constante son elipsoides y F = 1 define el elipsoide de inercia (cuyos semiejes nos
dan los momentos principales de inercia). A medida que el eje de rotaci
on cambia en el tiempo, el vector
se mueve con el, y su extremo siempre esta en un punto de la superficie del elipsoide10 . El gradiente de F
evaluado en ese punto nos da la direcci
on de la normal al elipsoide en ese punto. De acuerdo con (14.33) tal
gradiente con respecto a viene dado por
( F )m = m ( I ) = m (k Ikj j ) = (m k ) Ikj j + k Ikj (m j )

( F )m = mk Ikj j + k Ikj mj = Imj j + k Ikm


usando la simetra del tensor de inercia

( F )m = Imj j + Imk k = 2Imk k


que en el lenguaje de diadas se escribe
F
F

2I
= 2I =
2T
r
2
L
=
T

(14.34)

con lo cual se observa que se mover


a de tal forma que la normal11 al elipsoide de inercia (en el punto donde
el extremo de toca al elipsoide) va en la direcci
on del momento angular.

14.4.

Ecuaciones de Euler para el movimiento de un cuerpo rgido

Con las herramientas anteriores estamos en capacidad de plantear ecuaciones de movimiento para un cuerpo
rgido. Si existen ligaduras no hol
onomas tales efectos deben manejarse para cada problema particular. Quiz
as
el caso m
as simple de ligadura no hol
onoma que se emplea en la mec
anica del cuerpo rgido, ocurre en el caso
de las ligaduras por rodadura, las cuales deben introducirse en la ecuaciones de movimiento por el metodo
de los multiplicadores indeterminados de Lagrange.
10

Si la energa cinetica no es constante, el vector no dictamina unvocamente la magnitud de , pero sigue emulando la din
amica
de su orientaci
on.
11
Es claro que esta normal va hacia afuera del elipsoide en este punto, ya que el gradiente va en la direcci`
on en la cual aumenta
F.

14.4. ECUACIONES DE EULER PARA EL MOVIMIENTO DE UN CUERPO RIGIDO

363

La estrategia general es buscar un punto de referencia que permita separar el movimiento en una parte
traslacional y otra rotacional. Cuando el cuerpo rgido posee un punto fijo respecto a un sistema inercial, este
punto ser
a una buena elecci
on ya que solo tendremos que tratar con el movimiento rotacional alrededor de
tal punto. Cuando no hay puntos fijos, casi siempre el mejor punto de referencia ser
a el centro de masa del
cuerpo, en virtud del teorema de Chasles y del hecho de que la energa cinetica y el momento angular se pueden
escribir como un termino relativo a la traslaci
on del centro de masa mas uno relativo a la rotacion alrededor
del centro de masa. La energa cinetica por ejemplo tendra la forma
1
1
T = M VC2 + IC 2
2
2
adem
as ocurre que una separaci
on similar es posible para el potencial en muchos problemas de aplicaci
on. Esto
implica que las ecuaciones de movimiento se podr
an separar en una parte traslacional y otra rotacional que se
resuelven por separado. Por las ecuaciones de movimiento de Newton, esto es posible utilizando las Ecs. (1.15)
para la traslaci
on del CM y las Ecs. (1.20) para la rotaci
on alrededor del CM. Por otro lado, si el sistema es
hol
onomo y conservativo la formulaci
on de Lagrange o Hamilton puede ser apropiada. El Lagrangiano tendr
a la
forma
L (q, q)
= LC (qC , qC ) + Lr (qr , qr )
siempre que el potencial admita una separaci
on similar. El primer termino condensa los efectos de traslaci
on
y tendr
a coordenadas y velocidades generalizadas del centro de masa. El segundo termino condensa los efectos
de rotaci
on alrededor del CM y depende de variables angulares, que definen la orientaci
on del cuerpo en
cada instante. esta estructura permite de nuevo separar los problemas traslacional y rotacional. Bien sea
con el formalismo Newtoniano, Lagrangiano o Hamiltoniano, es muy ventajoso trabajar en el sistema de ejes
principales del punto de referencia, que como ya vimos simplifica mucho la expresi
on para la energa cinetica
y el momento angular.
Para trabajar el movimiento rotacional casi siempre se usan los angulos de Euler como coordenadas generalizadas. Sin embargo, cuando el movimiento rotacional es bidimensional, podemos definir un solo par
ametro
independiente de rotaci
on y se simplifica el problema.
Bien sea que nuestro punto de referencia sea un punto fijo o el centro de masa, podemos obtener las
ecuaciones de movimiento de un cuerpo rgido empleando las Ecs. (1.15, 1.20) del formalismo Newtoniano.
Consideramos entonces un sistema inercial con origen en el punto fijo, o un sistema de ejes no rotante (con
respecto a un sistema inercial) con origen en el CM. En ambos casos es v
alida la Ec. (1.20) como se puede
verificar con la Ec. (1.28), estos sistemas los llamaremos simplemente sistemas no rotantes S0 , de modo que se
puede escribir
 
dL
=N
(14.35)
dt S0
donde cambiamos la notaci
on para el torque por N. Podemos relacionar esta raz
on de cambio con aquella que
mide un sistema fijo al cuerpo usando (13.69)


dL
dt

=
S0

dL
dt

S0

+L

(14.36)

combinando (14.35) con (14.36) se obtiene




dL
dt

S0

+L =N

(14.37)

n
otese que esta ecuaci
on es estrictamente de car
acter mixto en el sentido de que la raz
on de cambio de L es
medida por el sistema rotante fijo al cuerpo en tanto que los vectores N, L y est
an medidos en el sistema no
rotante, sin embargo las coordenadas de estos vectores se escribir
an en la base de vectores unitarios asociados
a S 0 . A pesar de este car
acter mixto, esta ecuaci
on resulta ser la m
as conveniente para extraer la din
amica

CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

364

del cuerpo rgido. Borraremos ahora el subndice S 0 sobreentendiendo que se usa la base de un sistema
coordenado fijo al cuerpo y escribiremos esta ecuaci
on en componentes12
dLk
+ kmn m Ln = Nk
dt
si tomamos ejes principales con respecto al punto de referencia, podemos emplear (14.29) para escribir
Ik

dk
+ kmn m n In = Nk
dt

(14.38)

no hay suma sobre k pero s sobre los otros ndices. Hemos usado el hecho de que los momentos principales de
inercia son independientes del tiempo, lo cual a su vez est
a ligado al hecho de escribir los vectores en la base
on est
an escritos en
generada por S 0 . Vale decir sin embargo, que aunque todos los observables en esta ecuaci
la base de ejes principales, como vector est
a medido en el sistema S0 . En forma expandida estas ecuaciones
se escriben
I1 1 2 3 (I2 I3 ) = N1
I2 2 3 1 (I3 I1 ) = N2
I3 3 1 2 (I1 I2 ) = N3

(14.39)

Las Ecs. (14.38) o (14.39) se denominan ecuaciones de Euler de movimiento para un cuerpo rgido
con un punto fijo. Estas ecuaciones definen un sistema acoplado, sin embargo en presencia de degeneraci
on
simple (e.g. I1 = I2 6= I3 simetra cilndrica) se observa un desacople parcial de la tercera ecuaci
on ya que las
componentes N1 y N2 del torque solo afectan a 1 y 2 , cuando la degeneraci
on es total (simetra esferica)
las ecuaciones se desacoplan completamente, esto nos muestra de nuevo que la degeneraci
on est
a asociada con
simetras del sistema.
Es necesario hacer notar que las ecuaciones de Euler solo contienen la descripci
on del movimiento rotacional,
y deben ser complementadas con las ecuaciones de la din
amica traslacional del centro de masa o del punto
de referencia. Finalmente, es necesario se
nalar otro inconveniente con las Ecs. (14.39), las componentes de
los vectores y N que all aparecen, est
an evaluadas en la base fija al cuerpo, de modo que para obtener
el valor de cada uno de estos vectores necesitamos conocer la orientaci
on relativa de los vectores unitarios
base con respecto a los vectores base del sistema no rotante en el instante de tiempo en que evaluemos a
estos vectores. Por lo tanto, necesitaremos en general conocer la din
amica del sistema de ejes rotante para
determinar completamente a estos vectores en cualquier instante.

14.4.1.

Ecuaciones de Euler con el formalismo de Lagrange

Podemos tambien deducir estas ecuaciones a partir del formalismo de Lagrange partiendo de la Ec. (2.17)


d T
T

= Qj
dt qj
qj
y dado que las coordenadas generalizadas ser
an angulares (e.g. los angulos de Euler) las fuerzas generalizadas
seran los torques asociados a tales angulos. Sin embargo, solo uno de los angulos de Euler tiene su torque
asociado dirigido a lo largo de uno de los ejes del cuerpo y las otras dos ecuaciones deber
an obtenerse por
permutaci
on cclica. Comenzamos por escribir la energa cinetica con base en los momentos principales
1
T = Ik k2
2

(14.40)

como la base mas conveniente para escribir las ecuaciones es la asociada a S 0 , emplearemos las relaciones
(13.81) que nos dan las componentes de la velocidad angular en terminos de los angulos de Euler y en la base
12

Es necesario que todos los vectores esten escritos en la misma base para que sea v
alida la igualaci
on componente a componente.

LIBRE
14.5. PRECESION

365

de los vectores fijos al cuerpo (ver secci


on 13.11)
1 = sin sin + cos
2 = sin cos sin

3 = cos +

las coordenadas generalizadas son q1 = , q2 = , q3 = , los angulos


movimiento para


d T
T
=

dt






d
1

1
2
2

=
Ik k
Ik k
dt 2
2


d
k
k
Ik k
=
Ik k
dt


debemos calcular las cantidades
1

1
2
=
=0

de Euler. Escribamos la ecuaci


on de

N
N

(14.42)

(14.43)

para lo cual usamos (14.41)

= sin + sin cos = 2


=

(14.41)

2
= cos sin sin = 1

3
=1

(14.44)

y reemplazando (14.44) en (14.43) resulta




d
3
1
2
I3 3
I1 1
I2 2
= N

dt

I3 3 I1 1 (2 ) I2 2 (1 ) = N
I3 3 1 2 (I1 I2 ) = N3

que nos reproduce la tercera de las Ecs. (14.39), las otras ecuaciones se obtienen por permutacion cclica de
esta
I2 2 3 1 (I3 I1 ) = N2
I1 1 2 3 (I2 I3 ) = N1

14.5.

Precesi
on libre

Un problema muy sencillo pero con muchas aplicaciones consiste en la din


amica de un cuerpo rgido sin
fuerzas ni torques netos. En este caso el centro de masa define un sistema inercial ya que tiene velocidad
uniforme con respecto al laboratorio, por supuesto tambien es posible en este caso tomar cualquier punto fijo
del cuerpo rgido con respecto al laboratorio como punto de referencia, siempre que no haya torque neto con
respecto a este punto (recordemos que el torque depende en general del origen elegido). En este caso, con el
origen colocado en el centro de masa, el movimiento ser
a de rotaci
on pura de modo que las ecuaciones de Euler
me determinaran la din
amica completa del cuerpo rgido, y el momento angular solo se debe a la rotaci
on
alrededor del centro de masa. En ausencia de torques netos, las ecuaciones de Euler se escriben en la forma
I1 1 = 2 3 (I2 I3 )
I2 2 = 3 1 (I3 I1 )
I3 3 = 1 2 (I1 I2 )

(14.45)

366

CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

Ahora bien, ya hemos visto que para un sistema de partculas exento de torque neto externo, el momento
angular es una constante de movimiento. Por otro lado, dado que la fuerza neta externa es cero, la energa
potencial externa se puede tomar como cero y por tanto se debe conservar la energa propia (que al ser
medida por el centro de masa corresponde a la energa interna), la cual consta de la energa cinetica mas
la potencial interna, pero esta u
ltima se conserva en virtud de que las distancias relativas de las partculas
permanecen constantes (que es precisamente la condici
on de cuerpo rgido), en consecuencia la energa cinetica
del sistema debe conservarse. Se concluye entonces que para un cuerpo rgido exento de torques y fuerzas netas
externas, tenemos dos integrales primeras de movimiento correspondientes a la conservaci
on del momento
angular y la energa cinetica. Con estas dos integrales es posible en principio integrar completamente las Ecs.
(14.45) en terminos de funciones elpticas. No obstante, ser
a m
as ilustrativo usar el an
alogo geometrico del
elipsoide (conocido como construcci
on de Poinsot) que nos dar
a muchas caractersticas del movimiento sin
resolver completamente el problema. M
as adelante, abordaremos el problema algebr
aicamente para s
olidos con
simetra axial.

14.5.1.

Construcci
on de Poinsot para la precesi
on libre

Figura 14.3: Ilustraci


on de la construcci
on de Poinsot para el estudio de la precesi
on libre. El elipsoide rueda
sin deslizar sobre el plano invariable definido por el momento angular. La Polhodia y Herpolodia son las curvas
trazadas sobre la superficie del elipsoide y el plano invariable respectivamente.
Ya hemos visto que en el sistema coordenado de los ejes principales del s
olido, la superficie que forma el
elipsoide de inercia nos da una relaci
on entre y L. En particular cuando la energa cinetica es constante, el
vector dado por (14.32) nos define completamente la din
amica del vector , y ya vimos que el extremo de
define un punto sobre la superficie del elipsoide, y que la normal a la superficie del elipsoide en este punto
determina precisamente la direcci
on del momento angular como se puede apreciar en (14.34).
En el caso particular de s
olido libre, el momento angular es fijo en el sistema inercial y por tanto define
la direcci
on de un plano, y dado que precisamente L es perpendicular a la superficie del elipsoide en el punto
donde est
a el extremo de , podemos definir unvocamente un plano normal a L y tangente al elipsoide en el
punto donde est
a ubicado el extremo de (que denominaremos plano invariable). Cuando cambia el valor de
(i.e. de ), el elipsoide (que est
a fijo al cuerpo) se debe mover entonces sobre este plano tangente a fin de
preservar la conexi
on entre y L. La fig 14.3 muestra la configuraci
on geometrica resultante. Adicionalmente,
se puede mostrar que la distancia entre el origen del elipsoide y el plano tangente a este en el extremo de
debe ser constante en el tiempo. Esta distancia es la proyecci
on de sobre la direcci
on de L

L
2T
L
b
=
=
L=
L
L
L 2T

LIBRE
14.5. PRECESION

367

donde hemos usado las Ecs. (14.15, 14.32). Es claro que esta cantidad es constante en nuestro caso ya que T y
L son constantes. En consecuencia el centro del elipsoide est
a a una altura constante con respecto al plano
invariable. Adicionalmente el centro del elipsoide coincide con el origen de todos los sistemas de referencia que
estamos usando ya que este origen se eligi
o para que no exista traslaci
on respecto al sistema inercial del centro
de masa (o punto fijo), por tanto dicho punto es estacionario con respecto al plano invariable. De lo anterior
se puede ver que el movimiento libre de fuerzas de un cuerpo rgido se puede representar considerando que
es el del elipsoide de inercia rodando sin deslizar sobre el plano invariable, con el centro del elipsoide fijo y a
una altura constante en el plano. La rodadura tiene lugar sin deslizamiento puesto que el punto de contacto
esta definido por el extremo de , el cual por estar dirigido seg
un el eje instant
aneo de rotaci
on, es la direcci
on
del cuerpo que est
a moment
aneamente en reposo. La curva trazada por el punto de contacto sobre la superficie
del elipsoide de inercia se denomina polhodia. En tanto que la curva que traza el punto de contacto sobre
el plano invariable se denomina herpolhodia. Ocurre entonces que la polohodia rueda sin deslizar sobre la
herpolhodia que est
a en el plano invariable.
La construcci
on de Poinsot es adecuada para describir completamente el movimiento de un cuerpo rgido
libre de fuerzas, ya que la direcci
on del plano invariable y la altura del elipsoide de inercia se determinan con los
valores de T y L, las cuales est
an entre las condiciones iniciales del problema. El problema se reduce entonces
al problema geometrico de trazar la polhodia y la herpolhodia. Es notable el hecho de que la herpolhodia
es siempre c
oncava hacia el origen de aqu su nombre que significa en forma de serpiente. La direcci
on y
magnitud de la velocidad angular est
an dictaminadas por el vector como se puede ver de (14.32) teniendo en
cuenta que en nuestro caso T es constante. Por otro lado, la orientaci
on instant
anea del cuerpo est
a determinada
por la orientaci
on del elipsoide de inercia, ya que este est
a fijo al cuerpo. Muchas descripciones del movimiento
libre de un cuerpo rgido basadas en estos argumentos se pueden encontrar en la literatura.
En el caso especial de simetra axial del cuerpo (que se representa por la degeneraci
on simple de los valores
propios del tensor de inercia), el elipsoide de inercia se convierte en un elipsoide de revoluci
on, de modo que
claramente la polhodia sobre el elipsoide es un crculo alrededor del eje de simetra. De la misma manera,
la herpolhodia ser
a tambien un crculo sobre el plano invariable. Un observador fijo al cuerpo ver
a que se
mueve sobre la generatriz de un cono (denominado el cono del cuerpo) cuya intersecci
on con el elipsoide
de inercia forma la polhodia. De manera an
aloga, un observador fijo en los ejes inerciales ve que se mueve
sobre la superficie de un cono del espacio cuya intersecci
on con el plano invariable genera la herpolhodia.
Por esta raz
on es usual describir el movimiento libre de un s
olido con simetra axial como el generado por el
rodamiento del cono del cuerpo sobre el cono del espacio.
Adicionalmente, si el momento de inercia alrededor del eje de simetra es menor que aquel correspondiente
a los otros dos ejes principales, se ve a traves de la Ec. (12.88) que el elipsoide sera prolato i.e. la longitud a
lo largo del eje de simetra sera mayor a la longitud de la secci
on de revoluci
on (alargado como un bal
on de
rugby). Si por el contrario, el momento de inercia alrededor del eje de simetra es mayor, el elipsoide es oblato
(achatado).
En el caso de elipsoides prolatos, el cono del cuerpo es exterior al cono del espacio, para elipsoides oblatos
el cono del cuerpo rueda sobre el interior del cono del espacio. No obstante, en ambos casos se observa que
la direcci
on de precesa en el tiempo alrededor del eje de simetra del cuerpo. Por esta raz
on hablamos del
fenomeno de precesi
on libre.

14.5.2.

Elipsoide de Binet y el momento angular

La construccion de Poinsot nos dice como se mueve con respecto al sistema inercial y con respecto al
sistema de ejes del cuerpo. Sin embargo, esta construcci
on no nos describe la din
amica del vector L vista por
el sistema de ejes del cuerpo13 . Para describir el movimiento de L medido por un observador que se mueve con
los ejes principales del cuerpo, recurrimos a otro artificio geometrico. Combinando las Ecs. (14.29) y (14.30),
vemos que en los ejes principales, la energa cinetica se puede escribir como
T =
13

L21
L2
L2
+ 2 + 3
2I1 2I2 2I3

Es claro que con respecto al sistema de ejes inerciales, L es constante.

(14.46)

368

CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

puesto que T es constante, esta relaci


on define un elipsoide, referido como el elipsoide de Binet, que tambien
esta fijo en los ejes del cuerpo pero que NO coincide con el elipsoide de inercia14 . Si adoptamos la convenci
on
I3 I2 I1 y escribimos la ecuaci
on para el elipsoide en forma est
andar
L22
L2
L21
+
+ 3 =1
2T I1 2T I2 2T I3

(14.47)

el elipsoide tendr
a semiejes que en orden decreciente corresponden a 2T I1 , 2T I2 , 2T I3 . Por otro lado,
dado que se conserva la magnitud del momento angular podemos escribir una ecuaci
on de la forma
L21 + L22 + L23
=1
L2

(14.48)

que corresponde a una esfera de radio L en el espacio L1 , L2 , L3 . El vector L se mueve de tal manera que
describe un camino tanto sobre el elipsoide (14.47) como sobre la esfera (14.48). Es decir, el camino de L visto
por un observador fijo al cuerpo, es la intersecci
on del elipsoide y la esfera. Naturalmente, para que esta imagen
sea consistente es necesario garantizar que dicha intersecci
on existe, y es claro que esto equivale a demostrar
que el valor del radio L de la esfera est
a entre el valor del semieje menor y el semieje mayor. Cada semieje del
elipsoide est
a dado por la cantidad
p
ai 2T Ii

ahora usando convenio de suma de ndices, reescribimos (14.47) en la forma


Li Li
=1
ai ai

multiplicando la ecuaci
on por a2j siendo j un ndice fijo j = 1, 2, 3 se obtiene
a2j = Li Li

a2j
ai ai

si aj es el menor de los semiejes principales (por convenci


on a3 ) tendremos que aj /ai 1 y por tanto
a23 = L21

2
2
a23
2 a3
2 a3
2
2
2
2
+
L
+
L
2 2
3 2 L1 + L2 + L3 = L
a21
a2
a3

similarmente para el mayor de los semiejes se puede probar


a21 L2
por lo tanto

2T I3 L

2T I1

(14.49)

que es lo que se quera demostrar. Si a3 6= a1 , la esfera est


a fuera del elipsoide sobre el eje L3 y dentro del
15
elipsoide en el eje L1 . Las Figs. 14.4 muestran las curvas que resultan de la intersecci
on del elipsoide con la
esfera para diferentes valores de L ydesde diferentes perspectivas. Las curvas que aparecen como lneas rectas
en la Fig. 14.4 corresponden a L = 2T I2 .
14
De (14.47), es inmediato ver que las longitudes de los semiejes del elipsoide de Binet son diferentes a las del elipsoide de
Poinsot. Incluso las longitudes de los ejes tienen dimensiones diferentes.
15
Si a3 = a1 entonces por definici
on todos los momentos de inercia ser
an iguales y el elipsoide coincide con la esfera.

LIBRE
14.5. PRECESION

369

Figura 14.4: Ilustraci


on de las trayectorias posibles del vector L sobre la superficie del elipsoide de Binet fijo
al cuerpo, para el estudio de la precesi
on libre.

14.5.3.

Elipsoide de Binet, rotaci


on estacionaria y condiciones para la rotaci
on estable

Las ecuaciones de Euler para s


olido libre (14.45) muestran claramente que la rotaci
on estacionaria (i.e. con
todas las componentes de constantes) solo es posible para un s
olido libre de fuerzas si se cumple la condici
on
1 2 (I1 I2 ) = 2 3 (I2 I3 ) = 3 1 (I3 I1 ) = 0
Recordemos que i son componentes medidas en la base de los ejes principales del cuerpo, por tanto la
estacionaridad se est
a midiendo con respecto a ejes fijos al cuerpo. Si en general suponemos que todos los
momentos principales de inercia son diferentes como es de esperarse con un s
olido irregular, vemos que el
movimiento estacionario para dicho s
olido solo es posible si al menos dos de las componentes de son cero, es
decir va a lo largo de un solo eje principal16 . Si existe degeneraci
on simple por ejemplo I1 = I2 solo existe
la condici
on de que 3 = 0 de modo que puede estar en cualquier direcci
on dentro del plano X1 X2 lo cual
es de esperarse ya que cualquier eje sobre ese plano es eje principal. Si la degeneraci
on es total puede estar
en cualquier direcci
on ya que cualquier eje es principal en virtud de la simetra esferica.
Retornemos al caso no degenerado en donde los ejes principales forman un conjunto con una orientaci
on
bien definida. En este caso como ya vimos el movimiento solo puede ser estacionario si hay rotaci
on alrededor de alguno de los ejes principales. Una pregunta natural que surge en toda condici
on estacionaria es su
estabilidad, es decir la desviaci
on del comportamiento estacionario ante peque
nas perturbaciones, para lo cual
examinaremos lo que ocurre en cada eje. Supongamos que como condici
on inicial la rotaci
on comienza alrededor del tercer eje principal (recordemos que por convenci
on I3 es el menor de los tres momentos de inercia),
ocurrir
a movimiento estable alrededor de L3 si comenzando con L en la direcci
on L3 garantizamos que no hay
otras orientaciones posibles en la vecindad del eje L3 ; geometricamente esto significa que la esfera y el elipsoide
de binet solo se deben intersectar en un punto en una vecindad de L3 de modo que el radio de la esfera debe
coincidir con el valor del semieje menor, es decir L2 = 2T I3 . Cuando hay una peque
na desviaci
on de este
valor, el radio de la esfera del momento angular es solo un poco mayor de este valor17 , y la intersecci
on con el
16
17

En tal caso L es paralelo a , y como L es constante, tambien lo ser


a .
La Ec. (14.49) nos garantiza que el radio de la esfera no puede ser menor que el semieje menor del elipsoide de Binet.

370

CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

elipsoide de la energa cinetica ser


a una peque
na figura cerrada alrededor del eje L3 . El movimiento es entonces
estable ya que una peque
na perturbaci
on produce una desviaci
on ligera de L alrededor del eje original.
Una situaci
on similar ocurre en el otro extremo en el cual el movimiento se hace alrededor del eje de mayor
momento de inercia. El movimiento estable ocurre cuando L2 = 2T I1 y cuando este movimiento es perturbado,
el radio de la esfera del momento angular es solo ligeramente menor que este valor. La intersecci
on es de nuevo
un peque
no crculo alrededor del eje principal y el movimiento es estable. En contraste, para el eje intermedio
L2 , la energa cinetica tiene dos orbitas que circundan al elipsoide y se cruzan entre s donde L2 pasa a traves
del
elipsoide (ver Figs. 14.4). En consecuencia, hay dos orbitas diferentes con
valores ligeramente menores que
2T I2 y otras dos orbitas diferentes con valores ligeramente mayores que 2T I2 18 , todas las cuatro orbitas
tienen caminos largos y apartados sobre la superficie del elipsoide (Figs. 14.4). Este es un fen
omeno tpico de
bifurcaci
on que por supuesto implica inestabilidad.
Lo anterior se puede entender teniendo en cuenta que para el eje con momento intermedio el radio de
curvatura del elipsoide en una direcci
on es mas grande que el de la esfera de contacto en tanto que es menor
en la direcci
on perpendicular. En los otros extremos en cambio los radios de curvatura son o bien mas grandes
o bien m
as peque
nos que el radio de la esfera en todas las direcciones. Estos criterios de estabilidad son de
gran utilidad en aplicaciones concernientes a la estabilidad de sistemas rotantes tales como naves espaciales.
No obstante, cuando hay fuerzas disipativas presentes, estos argumentos de estabilidad deben ser modificados.
Por ejemplo, para un cuerpo con L constante pero con T suavemente decreciente, la u
nica rotaci
on estable
es alrededor del eje principal con mayor momento de inercia. Esto se puede ver teniendo en cuenta que la
energa cinetica de rotaci
on alrededor de un eje principal iesimo viene dada por T = L2 /2Ii la cual tiene
un valor mnimo para el eje con mayor momento de inercia, y por tanto conduce a un movimiento estable
alrededor de tal eje. Cuando se pone a rotar al cuerpo alrededor de otro de los ejes principales el efecto de
decrecimiento ligero de la energa cinetica es el de cambiar gradualmente el eje de rotaci
on hasta que termina
rotando alrededor del eje con m
aximo valor de momento de inercia.

14.5.4.

Soluci
on algebraica para la precesi
on libre con simetra axial

Para un cuerpo simetrico no es difcil obtener la soluci


on analtica de las ecuaciones de Euler para el caso
de cuerpo libre de fuerzas. Tomemos el eje de simetra como el eje principal L3 de modo que I1 = I2 . Las
ecuaciones de Euler (14.45) se reducen entonces a
I1 1 = 2 3 (I1 I3 )

I1 2 = 3 1 (I3 I1 )
I3 3 = 0

(14.50)

la u
ltima de estas ecuaciones establece que 3 es constante, y se puede tratar como una condici
on inicial
conocida del problema. Las dos ecuaciones siguientes se escriben como
1 = 2

2 = 1

I3 I1
3
I1

(14.51)

derivando la primera de estas ecuaciones y teniendo en cuenta la segunda, se obtiene

1 = 2 = 2 1
1 = 2 1
esta ecuaci
on tiene la tpica soluci
on arm
onica
1 = A cos t

(14.52)

Similarmente tampoco puede ser mayor que el semieje mayor. Estrictamente, tanto la esfera como el elipsoide pueden cambiar,
por ejemplo si se introduce una peque
na fuerza que produce un peque
no torque por un breve instante, puede ocurrir en general un
ligero cambio en el momento angular y tambien en la energa cinetica y ambas figuras deben cambiar. En cualquier caso al volver
a ser libre el cuerpo rgido se tiene que mantener la relaci
on (14.49) de modo que no cambia nuestra discusi
on.
18
N
otese que en este caso el radio de la esfera puede aumentar o disminuir dentro de cierto intervalo sin violar la condici
on
(14.49).

LIBRE
14.5. PRECESION

371

y sustituyendo esta expresi


on en la segunda de las Ecs. (14.51) resulta
2 = A cos t 2 = A sin t

(14.53)

estas soluciones muestran que 3 u3 es constante en tanto que 1 u1 + 2 u2 es constante en magnitud y rota
uniformemente alrededor del eje de simetra X3 del cuerpo con frecuencia angular . Esto indica entonces que
el vector completo es constante en magnitud y precesa alrededor de X3 con la misma frecuencia, tal como
lo predijo la construcci
on de Poinsot.
Otra forma interesante de ver la precesi
on es construyendo un vector a lo largo de X3 y con magnitud
descrita por la tercera de las Ecs. (14.51). En tal caso, las Ecs. (14.50) se pueden sintetizar en una ecuaci
on
vectorial
=
la cual muestra inmediatamente la precesi
on de con frecuencia .
Es importante tener en cuenta que la precesi
on aqu descrita es vista por los ejes del cuerpo, que a su vez
rotan en el espacio con una frecuencia que es mayor que . De otra parte, la tercera de las Ecs. (14.51)
nos dice que entre m
as cerca este I1 de I3 mas lenta ser
a la precesi
on i.e. menor ser
a con respecto a . Las
constantes A (amplitud de precesi
on) y 3 se pueden evaluar en terminos de las constantes de movimiento
m
as usuales como son T y L2 , es f
acil ver que estas cantidades se pueden escribir en terminos de A y 3 de la
siguiente forma. Empleamos primero las Ecs. (14.29, 14.30) para ejes principales con I1 = I2 y tendremos en
cuenta las Ecs. (14.52, 14.53)
T
T
L2

 1
 1
1
1
I1 12 + 22 + I3 32 = I1 A2 cos2 t + A2 sin2 t + I3 32
2
2
2
2
1
1
2
2
=
I1 A + I3 3
2
2
= (I ) (I ) = [(Ik uk uk ) (m um )] [(Ij uj uj ) (n un )]
=

= [Ik m uk (uk um )] [Ij n uj (uj un )] = [Ik m uk km ] [Ij n uj jn ]

quedando finalmente

= [Ik k uk ] [Ij j uj ] = Ik Ij k j (uk uj ) = Ik Ij k j kj = Ik2 k2



= I12 12 + 22 + I32 32 = I12 A2 + I32 32
1
1
T = I1 A2 + I3 32
2
2

L2 = I12 A2 + I32 32

y estas relaciones se pueden invertir para obtener A y 3 en terminos de T y L2 .


Por ejemplo, es de esperarse que la tierra sufra una precesi
on aproximadamente libre ya que los torques
externos son muy debiles. La tierra es aproximadamente simetrica alrededor del eje polar y oblata en los polos
de modo que I1 es menor que I3 . Numericamente, el radio de estos momentos es tal que
I3 I1
= 0,00327
I1
y la magnitud de la frecuencia angular de la precesi
on debe ser
=

3
3

=
305,81039
306

y dado que 3 es casi igual en magnitud que este resultado predice un periodo de precesi
on de unos 306
dias es decir unos 10 meses. Si alguna perturbaci
on ocurre sobre el eje de figura de la tierra, esperaramos que
el eje de rotaci
on precese alrededor del eje de figura (alrededor del polo norte) una vez cada diez meses. En
realidad se ha medido una precesi
on alrededor del polo con una amplitud del orden de unas pocas decimas
de segundo de latitud, aunque modelos m
as realistas deben inclur otros efectos tales como fuerzas de fricci
on
que se producen por la no rigidez del planeta.

372

14.5.5.

CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

Estabilidad de s
olidos irregulares por m
etodos algebr
aicos

Retornemos al caso de s
olidos irregulares para los cuales los tres momentos de inercia a lo largo de ejes
principales son diferentes. Veremos el problema de la estabilidad directamente con las ecuaciones de Euler y sus
soluciones. Asumiremos que en t = 0 el movimiento comienza con 2 = 3 = 0 y 1 6= 0. Y que inmediatamente
despues de una breve perturbaci
on, 2 y 3 adquieren valores no nulos pero mucho menores que 1 . Cuando
la perturbaci
on termina, el movimiento vuelve a ser libre de fuerzas y torques de modo que las ecuaciones de
Euler quedan
I1 1 = 2 3 (I2 I3 )

(14.54)

I3 3 = 1 2 (I1 I2 )

(14.56)

I2 2 = 3 1 (I3 I1 )

(14.55)

dado que 2 y 3 son peque


nos con respecto a 1 el termino a la derecha de la ecuaci
on (14.54) es de segundo
orden y se puede despreciar, por tanto tenemos que a primer orden I1 1 = 0 y 1 se puede considerar constante.
Derivando (14.55)
I2
2 = ( 3 1 + 3 1 ) (I3 I1 ) 3 1 (I3 I1 )
(14.57)
y sustituyendo (14.56) en (14.57) resulta




(I1 I2 )
(I1 I2 ) (I3 I1 ) 2
2 = 1 2
1 (I3 I1 ) =
1 2
I2
I3
I3


(I1 I2 ) (I3 I1 ) 2

2 = A2 ; A
1
I2 I3

(14.58)

si I1 es el mayor o el menor de los tres momentos de inercia A ser


a negativo
y la Ec. (14.58) corresponde

acil
a la ecuaci
on de un oscilador arm
onico simple. 2 oscila con frecuencia A con amplitud acotada, es f
demostrar que 3 tambien realiza movimiento arm
onico simple, en tanto que 1 es constante a primer orden.
Esto implica que el vector solo sufre una ligera desviaci
on de su valor original. En contraste, si I1 es el eje
intermedio, A ser
a positivo y las componentes 2 y 3 tender
an a crecer exponencialmente con el tiempo,
dando un movimiento inestable.

14.6.

La peonza sim
etrica pesada con un punto fijo

Consideraremos ahora un ejemplo un tanto m


as complejo pero muy ilustrativo y de amplias aplicaciones:
la peonza simetrica pesada en un campo gravitacional uniforme con un punto fijo sobre el eje de simetra
del cuerpo. Este ejemplo permite estudiar diversos sistemas que van desde los trompos infantiles hasta los
instrumentos girosc
opicos de navegaci
on. Puesto que la mayor parte del tiempo utilizaremos los ejes fijos al
cuerpo, denotaremos X1 X2 X3 a dichos ejes, en tanto que los ejes inerciales se denotar
an por X10 X20 X30 contrario
a lo tradicional. La configuraci
on se muestra en la Fig. 14.5

14.6.1.

Reducci
on del problema a cuadraturas

El eje de simetra es claramente un eje principal del cuerpo. Dado que un punto es estacionario, la configuracion de la peonza est
a completamente especificada por los tres angulos de Euler: nos da la inclinaci
on del
eje X3 (eje de simetra fijo al cuerpo ) con respecto a la vertical i.e. con respecto al eje X30 asociado al sistema
inercial; mide el azimuth de la peonza alrededor de la vertical, en tanto que mide el angulo de rotaci
on de
la peonza alrededor del eje de simetra X3 , (ver Fig. 14.5). La distancia entre el centro de masa y el punto fijo,
ambos sobre el eje de simetra est
a dada por l. La raz
on de cambio de cada angulo nos da las caractersticas
del movimiento de la peonza
1. mide la rotaci
on (o spinning) de la peonza alrededor de su eje de figura X3 .


14.6. LA PEONZA SIMETRICA
PESADA CON UN PUNTO FIJO

373

Figura 14.5: Peonza simetrica pesada con un punto fijo en el cual se coloca el origen de ambos sistemas
coordenados. En esta configuraci
on el punto fijo no est
a en el centro de masa.
2. mide la precesi
on o rotaci
on del eje de figura X3 alrededor del eje vertical X30 .
3. mide la nutaci
on, o cabeceo arriba y abajo del eje de figura X3 relativo al eje vertical X30 .

En la mayora de casos de interes estas razones de cambio est


an en la siguiente jerarqua: >> >> .
Puesto que I1 = I2 6= I3 las ecuaciones de Euler (14.39) quedan
I1 1 + 2 3 (I3 I1 ) = N1

I2 2 + 1 3 (I1 I3 ) = N2
I3 3 = N3

(14.59)

consideremos el caso en el cual inicialmente N3 = N2 = 0, N1 6= 0 y 1 = 2 = 0, 3 6= 0, con lo cual 3


sera constante. El torque N1 hace que 1 cambie ya que debido a este torque 1 6= 0 incluso al principio,
como se puede ver de la primera ecuaci
on (14.59) teniendo en cuenta que 2 es nulo al principio. Dado que
para tiempos posteriores a t = 0 se tiene que 1 ya no es nulo, la segunda ecuaci
on requiere que 2 tambien
comience a cambiar. Sin embargo, no es f
acil descifrar el significado de esta din
amica puesto que lo que se
,
y sus angulos asociados en el sistema
mide en el laboratorio son los cambios en los angulos de Euler ,
X10 X20 X30 del laboratorio. No se observa directamente a 1 , 2 , 3 y sus angulos asociados en los ejes principales.
Esto sugiere que las ecuaciones de Euler no nos dan la descripci
on m
as u
til del movimiento del sistema. En

CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

374

consecuencia, utilizaremos el formalismo Lagrangiano en lugar de las ecuaciones de Euler. El origen tanto del
sistema inercial como del fijo al cuerpo est
a en el punto fijo de la peonza, de modo que para el sistema inercial
con este origen hay una rotaci
on pura alrededor de alg
un eje que pasa por este origen (teorema de Euler). La
energa cinetica para cuerpos simetricos en rotaci
on pura se escribe como
T =

 1
1
I1 12 + 22 + I3 32
2
2

como la idea es escribirla en terminos de los angulos de Euler, usaremos las Ecs. (13.81)
12 + 22 =

sin sin + cos

2


2
+ sin cos sin

12 + 22 = 2 sin2 sin2 + 2 cos2 + 2 sin sin cos


+ 2 sin2 cos2 + 2 sin2 2 sin cos sin



12 + 22 = 2 sin2 sin2 + cos2 + 2 cos2 + sin2
12 + 22 = 2 sin2 + 2

2
cos +
32 =

(14.60)
(14.61)
(14.62)
(14.63)

la energa cinetica en terminos de angulos de Euler queda

 I 
2
1 
3
T = I1 2 sin2 + 2 +
cos +
2
2

(14.64)

por otro lado, la energa potencial gravitacional del cuerpo rgido es la suma de las energas potenciales
individuales de cada partcula
m r 
i i
g
V = Fi ri = mi g ri = M
M
V = M RC g
siendo g el campo gravitacional uniforme en la superficie de la tierra y RC la posici
on del centro de gravedad
de la peonza (que coincide con el centro de masa para campo gravitacional uniforme). En consecuencia la
energa potencial es la misma que si todo el cuerpo estuviera concentrado en su centro de masa. A partir de
la geometra de la Fig. 14.5 se ve que
V
V

= M kRC k kgk cos ( ) = M gl cos ( )

= M gl cos

el Lagrangiano queda entonces de la forma


 I 
2
1 
3
L = I1 2 sin2 + 2 +
cos + M gl cos
2
2

los angulos y no aparecen explcitamente en este Lagrangiano. En consecuencia son coordenadas cclicas
y sus momentos conjugados ser
an constantes de movimiento. Hemos visto que el momento conjugado a una
coordenada angular de rotaci
on corresponde a la componente del momento angular total a lo largo del eje de
rotaci
on, el cual para es el eje vertical, para es el eje de simetra del cuerpo y para es la lnea de nodos.
Precisamente se puede ver de una forma directa la raz
on de que estos momentos sean constantes teniendo en
cuenta que el torque generado por la gravedad va a lo largo de la lnea de nodos, de modo que no hay componente
del torque a lo largo del eje vertical ni del eje de simetra, los cuales son por definici
on perpendiculares a la
lnea de nodos. La ausencia de torques en estos ejes conduce entonces a que las componentes del momento
angular total a lo largo de ellos sean constantes en el tiempo.


14.6. LA PEONZA SIMETRICA
PESADA CON UN PUNTO FIJO

375

Aparecen entonces dos integrales primeras de movimiento


p =
p =



L
= I3 + cos = I3 3 I1 a


L
= I1 sin2 + I3 cos2 + I3 cos I1 b

(14.65)
(14.66)

donde hemos usado la tercera de las Ecs. (13.81). Adem


as hemos expresado estas constantes de movimiento en
terminos de nuevas constantes a y b. Es inmediato ver que existe una constante adicional de movimiento dado
que el sistema es conservativo: la energa total del sistema (que coincide con la funci
on energa y numericamente
con el Hamiltoniano)
 I
1 
3
E = T + V = I1 2 sin2 + 2 + 32 + M gl cos
(14.67)
2
2
donde hemos usado la Ec. (14.64) y la tercera de las Ecs. (13.81). Solo se requieren tres cuadraturas para resolver
el problema, estas se pueden obtener de las integrales primeras de movimiento sin recurrir explcitamente a
las ecuaciones de Euler Lagrange. Despejando en (14.65) se obtiene
I3 = I1 a I3 cos

(14.68)

que a su vez se puede sustituir en (14.66) para eliminar en dicha ecuaci


on


I1 sin2 + I3 cos2 + I1 a I3 cos cos I1 b
I1 sin2 + I1 a cos I1 b

y despejando

b a cos
=
(14.69)
sin2
esta ecuaci
on sera integrable si conocieramos a en funci
on del tiempo. Sustitumos (14.69) de nuevo en

(14.68) de lo cual resulta una ecuaci


on an
aloga para


b

a
cos

I3 = I1 a I3
cos
sin2


I1 a
b a cos

=
cos
(14.70)
I3
sin2
que de nuevo es integrable siempre que conozcamos a en funci
on del tiempo. Finalmente, se observa que las

Ecs. (14.69, 14.70) se pueden usar para eliminar y en la ecuaci


on (14.67) de la energa19 , con lo cual se
obtendra una ecuaci
on diferencial ordinaria para . Antes de hacer esto, notemos que la Ec. (14.65) nos dice
que 3 es una constante en el tiempo y por tanto tambien lo ser
a la expresi
on I3 32 /2. En consecuencia la
expresi
on
I3 32
E0 = E
2
es tambien una constante de movimiento, esto permite eliminar esta constante de la Ec. (14.67) ya que un
corrimiento constante en la energa no tiene ninguna consecuencia fsica. Reemplazando (14.69) en (14.67) y
redefiniendo E 0 se tiene
"
#
2
1
b

a
cos

E0 =
I1
sin2 + 2 + M gl cos
2
sin2
E0 =
19

1 2 1 (b a cos )2
I1 + I1
+ M gl cos
2
2
sin2

Estrictamente ya ha sido eliminada en (14.67) a traves del factor 3 .

(14.71)

CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

376

la Ec. (14.71) tiene la forma de un problema unidimensional equivalente si definimos un potencial efectivo de
la forma
1 (b a cos )2
Vef () = M gl cos + I1
2
sin2
el cual ser
a muy u
til para describir el movimiento en al igual que en el caso de fuerzas centrales en el cual
la construcci
on de un potencial efectivo nos sirvi
o para analizar el movimiento radial20 . Es conveniente hacer
el cambio de variable u = cos , con lo cual du = sin d ya que en tal caso la ecuaci
on (14.71) queda de la
forma
1 2 1 (b au)2
0
+ M glu
E = I1 + I1
2
2
1 u2
y como

du
d
= sin
u 2 = sin2 2 = 1 u2 2
dt
dt
0
la expresi
on para E queda
E0 =
E 0 1 u2
despejando u 2
u 2 =

1
u 2
1 (b au)2
I1
+
I1
+ M glu
2 (1 u2 ) 2 (1 u2 )

1
1
I1 u 2 + I1 (b au)2 + M gl u 1 u2
2
2



2E 0
2M gl
1 u2 (b au)2
u 1 u2
I1
I1

(14.72)

es conveniente introducir las siguientes constantes de movimiento


=

p
p
2E 0
2E I3 32
2M gl
I3 3
=
; =
; a=
=
; b=
I1
I1
I1
I1
I1
I1

(14.73)

donde a y b provienen de las Ecs. (14.65, 14.66). Estas constantes est


an asociadas a los momentos conservados,
la energa total y la energa potencial. Por ejemplo, es proporcional a la energa del sistema excluyendo la
energa cinetica angular asociada a X3 (es decir excluyendo el spinning asociado a 3 ). Usando (14.73) en
(14.72) se obtiene


u 2 = 1 u2 (b au)2 u 1 u2

u 2 = 1 u2 ( u) (b au)2
(14.74)
que se puede reducir de manera inmediata a cuadraturas
t=

u(t)

u(0)

du
(1

u2 ) (

(14.75)

u) (b au)

integrando esta ecuaci


on obtenemos en principio = (t) que al ser sustitudo en (14.69) y (14.70) nos reduce
a cuadraturas la din
amica de y . En cuanto a la soluci
on de (14.75), el polinomio del radical es c
ubico de
manera que las soluciones son integrales elpticas. De nuevo la forma analtica de las soluciones puede ser muy
compleja y poco ilustrativa. Por lo tanto es mas provechoso para los prop
ositos actuales realizar consideraciones
generales, con las cuales se pueden extraer aspectos de la naturaleza general del movimiento sin integrar las
ecuaciones de movimiento.
Antes de analizar las soluciones posibles de (14.75), es importante analizar las constantes definidas en
(14.73). La Fig. 14.5 muestra un caso en el cual el punto fijo no yace en el centro de masa. Si la peonza
20
As como en el escenario de fuerzas centrales, los terminos adicionales en el potencial efectivo corresponden a las componentes
de la energa cinetica asociadas a las coordenadas cclicas que en este caso son dos. Sin embargo, en la definici
on de E 0 hemos
2
sustrado las componentes que dependen de las cuales est
an contenidas en 3 .


14.6. LA PEONZA SIMETRICA
PESADA CON UN PUNTO FIJO

377

esta rotando sobre una superficie horizontal, entonces tanto como son mayores que cero. Si en cambio la
peonza posee un soporte que le permite estar por debajo de la horizontal, entonces sigue siendo mayor que
cero pero puede ser positivo o negativo. En otras aplicaciones como algunos gir
oscopos, el punto fijo puede
estar en el centro de masa, en tal caso se tiene que = l = 0 y 0. Enfocaremos nuestra atenci
on al caso
en el cual la energa cinetica rotacional alrededor de X3 es mucho mayor que la energa cinetica asociada a los
otros dos ejes.

14.6.2.

An
alisis cualitativo del movimiento

Definamos f (u) usando (14.74), y ordenando las potencias de u




u 2 f (u) = u3 + a2 u2 + (2ab ) u + b2

(14.76)

esta ecuaci
on nos muestra por un lado que la funci
on f (u) es un polinomio de grado 3 en u, y por otro lado
que debe ser no negativa ya que f (u) = u 2 . Es decir valores de u (y por tanto de ) que conduzcan a valores
negativos de f (u) estar
an fsicamente descartados. Esto a su vez nos llevar
a a que las races de este polinomio

de tercer grado nos dan los valores de en los cuales cambia de signo, es decir los
angulos de retorno en
. El conocimiento de estos angulos nos puede dar informacion cualitativa del movimiento del sistema.
Para el gir
oscopo f (u) es cuadr
atica puesto que = 0, pero para la peonza contribuye en general todo el
polinomio c
ubico. Dado que en muchas aplicaciones los gir
oscopos usan montajes libres de torque, la precesi
on y
la nutaci
on estaran suprimidos de modo que el movimiento del gir
oscopo es trivial. Para entender el movimiento
general de un cuerpo rotante, consideraremos solo el caso en el cual > 0.
Las ecuaciones c
ubicas con coeficientes reales poseen tres races que pueden venir en cuatro tipos de
combinaciones21
1. Una raz real y un par conjugado de races complejas
2. Tres races reales, dos de las cuales son iguales
3. Tres races reales todas distintas
4. Tres races reales todas identicas
Estas posibilidades dependen de los signos relativos y magnitudes de las cuatro constantes definidas en
(14.73). Para nuestro problema especfico, hay tambien una restricci
on fsica y es que 1 u 1 para que
sea real. Consideraremos solo el caso en el cual u > 0 que corresponde a que el centro de masa permanezca
por encima de la horizontal. Recordemos sin embargo que muchos gir
oscopos poseen un soporte puntual que
permite que el centro de masa se sit
ue por debajo del plano horizontal.
En los puntos u = 1, f (u) adquiere el valor (b a)2 y es por tanto negativa en ambos extremos,
excepto en el caso inusual en que u = 1 es una raz, lo cual corresponde a tener una peonza vertical, caso
que analizaremos m
as adelante. Por tanto, en el presente an
alisis asumiremos que el polinomio no tiene races
en u = 1 y por tanto que f (1) < 0.
Para u grande, el termino dominante en f (u) es u3 . Dado que es una constante siempre positiva seg
un
se ve en la Ec. (14.73), f (u) ser
a positiva para valores grandes positivos de u y negativa para valores grandes
negativos de u. Ahora bien, ya que f () > 0 y f (1) < 0, el polinomio debe cortar al eje u en alg
un punto
del intervalo (1, +). En conclusi
on, f (u) tiene una raz real en el intervalo (1, ). Ahora bien puesto que
un valor de u en este intervalo est
a fsicamente excludo, vemos que a lo m
as existen dos races reales de u que
correspondan a una situaci
on fsicamente posible. Dicho algebr
aicamente, hay a lo m
as dos races reales en el
intervalo 1 < u < 1.
Por otro lado, la ausencia de races de f (u) en el intervalo 1 < u < 1, indicara que no hay ning
un
valor posible para lo cual sera inconsistente. Esto indica que tiene que haber al menos una raz real en tal
21

Puede verse que para cualquier polinomio de grado n con coeficientes reales, el n
umero de soluciones complejas (no reales)
deben ser siempre par, pues es inmediato ver que si ua es una raz, entonces ua tambien ser
a una raz.

378

CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

intervalo. Vemos entonces que f (u) tiene al menos dos races reales una en (1, 1) y la otra en (1, +). Esto
descarta los casos 1 y 4 y nos conduce a que las tres races deben ser reales a lo m
as con degeneraci
on simple.
Hemos visto que en ambos extremos del intervalo f (u) es negativa. Si un polinomio posee el mismo signo
en los dos extremos de un intervalo dado, entonces debe ocurrir uno de estos casos
(a) El polinomio puede contener un n
umero par de races diferentes (o no tener ninguna) en dicho
intervalo.
(b) Hay un n
umero impar de races diferentes en el intervalo debido a un degeneramiento. En tal caso,
al menos una raz coincide con un m
aximo (mnimo) local, si la funci
on es negativa (positiva) en el
intervalo.
Para nuestro polinomio c
ubico, el escenario (a) indicara que todas las tres races son reales y diferentes
(caso 3) estando dos de ellas en el intervalo 1 < u < 1 (la ausencia de races sera inconsistente). El escenario
(b) indica que solo una raz22 aparece en el intervalo 1 < u < 1; esta raz correspondera a un m
aximo local.
En el primer escenario hay dos races reales distintas u1 < u2 en el intervalo (1, 1). Puesto que f (1) < 0
entonces f (u) 0 en el intervalo [u1 , u2 ]. Esto se puede probar f
acilmente teniendo en cuenta que si f (u) > 0
para alg
un punto en [u1 , u2 ] entonces para que f (u) < 0 en otros puntos de este intervalo tendra que haber m
as
races del polinomio, lo cual no es posible. Por otro lado, es posible que f (u) < 0 en todo el intervalo (u1 , u2 ),
aximo local implica que la raz es degenerada, lo
esto solo se logra si f (u) posee un m
aximo local en u1 , un m
cual nos lleva a que el polinomio tendra cuatro races (u1 contara por dos, u2 6= u1 y u3 que est
a fuera del
intervalo [1, 1]), esto contradice al teorema fundamental del algebra.
aximo local
En el segundo escenario, solo hay una raz u1 en el intervalo (1, 1), que coincide con un m
(degeneraci
on). Como f (1) < 0 se concluye que f (u) < 0 en [u1 , u2 ] excepto en la raz u1 donde f (u) = 0.
Analicemos fsicamente las dos soluciones algebr
aicas posibles. Cuando hay dos races distintas u1 , u2 en
(1, 1), hemos visto que f (u) 0 en [u1 , u2 ], lo cual significa que todo el intervalo es una region accesible
fsicamente. Cuando hay una sola raz en (1, 1) hay un solo valor posible fsicamente para u ya que en el
resto del intervalo f (u) < 0.
En resumen, el movimiento fsico corresponde a casos en que f (u) = u 2 es un valor no negativo estando u
en el intervalo 1 u 1, lo cual corresponde a que este entre 0 y . Se llega a que para cualquier peonza
fsica no vertical, f (u) debe tener dos races u1 y u2 (posiblemente degeneradas) en el intervalo (1, 1) y la
peonza se mueve de manera que el cos permanezca entre estas races. Si no hay degeneraci
on (ver Fig. 14.7a,
Pag.384) la peonza cabecea o nuta dentro del intervalo de permitido. Si hay degeneraci
on (ver Fig. 14.7b,
Pag.384) solo hay un valor de permitido y no se produce nutaci
on. Es importante por tanto, localizar estas
dos races para extraer informaci
on cualitativa del comportamiento de y para los valores de permitidos.
Es usual describir el movimiento de la peonza trazando la curva que se produce con la intersecci
on entre el
eje de figura y una esfera de radio unidad centrada en el punto fijo. Esta curva es conocida como el locus del
eje de figura. La coordenada de un punto sobre el locus se especifica con los angulos de Euler y definidos
por los ejes del cuerpo23 . Las races u1 y u2 definen el intervalo permitido para
2 1

1,2 = arc cos u1,2

(14.77)

donde hemos asumido que u1 u2 . El locus yace entonces entre dos crculos de colatitud 1 y 2 trazados sobre
la esfera unidad (ver Figs. 14.6). El valor de es nulo en ambos crculos y por tanto son puntos de retorno en
.
Es natural ahora preguntarse si hay puntos de retorno posibles para , esto corresponde a hacer = 0, y
de la Ec. (14.69) vemos que esto equivale a la condici
on
b au = 0
22

Puesto que hay al menos una raz fuera del intervalor [1, 1], no es posible que la tres races esten all.
Es decir, el locus describe la precesi
on y nutaci
on pero no dice nada sobre el spinning. No obstante, en ausencia de fricci
on
esto no implica ninguna perdida de informaci
on ya que el spinning est
a descrito por 3 que es constante de movimiento.
23


14.6. LA PEONZA SIMETRICA
PESADA CON UN PUNTO FIJO

379

Figura 14.6: Ilustraci


on de la precesi
on y nutaci
on de una peonza simetrica pesada con un punto fijo. La
nutaci
on se realiza entre dos crculos.
La forma del locus est
a determinada en gran medida por el valor de la raz de esta ecuaci
on, la cual
denotamos por u0
b
u0
(14.78)
a
supongamos por ejemplo que las condiciones iniciales son tales que u0 es mayor que u2 . En tal caso la Ec.
(14.69) nos dice que siempre tendr
a el mismo signo para todos los valores permitidos de entre 2 y 1 (si
u1 < u2 2 < 1 ), puesto que los puntos de retorno de ocurren en regiones no accesibles para . Por lo
tanto, el locus del eje de figura debe ser tangente a los crculos lmite de tal forma que est
a en la misma
direcci
on tanto en 2 como en 1 . En otras palabras, la precesi
on del eje de figura alrededor del eje X30 nunca
revierte su sentido. Sin embargo, a diferencia de la precesi
on libre, en este caso el eje de figura tambien produce
un cabeceo o nutaci
on (variaci
on de ) hacia arriba y hacia abajo dentro del intervalo definido por 2 y 1 . Hay
entonces una nutaci
on durante la precesi
on de la forma ilustrada en la Fig. 14.6a. Por otro lado, vale la pena
aclarar que la precesi
on de la que hablamos aqu es del eje de simetra del cuerpo y no de la velocidad angular
o del momento angular con respecto a ejes del cuerpo que es la precesi
on que se discute en el caso libre.
0
Si ahora asumimos que u est
a entre u1 y u2 , tenemos que existe un punto de retorno para dentro del
intervalo permitido para i.e. = 0, para alg
un valor de entre 2 y 1 . En otras palabras, la direcci
on de la
precesi
on ser
a diferente en los dos crculos lmite, de manera que el locus del eje de figura exhibe lazos cerrados
como muestra la figura 14.6b. No obstante, el promedio de no es nulo y hay un sentido neto de avance de la
precesi
on.
Otro caso interesante ocurre cuando u0 coincide con una de las races de f (u). Por ejemplo, si u0 = u2 , tanto
como deben anularse en el crculo superior lo cual requiere que el locus tenga c
uspides tocando este crculo,
como muestra la figura 14.6c. Este caso no es tan excepcional como podra pensarse a priori, pues se cumple
cuando asumimos que la peonza simetrica est
a rotando inicialmente alrededor del eje de figura solamente. En
otras palabras, asumamos que en t = 0 solo hay rotaci
on alrededor del eje de figura y en ese instante se suelta
dicho eje. El movimiento subsecuente viene descrito por las condiciones iniciales 0 , 0 (orientaci
on inicial del
24

eje de figura) y (0) = (0) = 0 . La cantidad u0 = cos 0 tiene que ser entonces una de las races de f (u)
ya que = 0 significa que el punto inicial es de retorno en . De hecho, corresponde a la raz del crculo lmite
Por supuesto las condiciones iniciales (0) = 0 y (0) = 3 tambien son necesarias. La primera se puede tomar 0 = 0 sin
perdida de generalidad y la segunda es constante de movimiento.
24

CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

380

superior (correspondiente a 2 )

b
(14.79)
a
para probarlo, notemos que con estas condiciones iniciales E 0 en t = 0, coincide con M gl cos 0 y que los
terminos en E 0 provenientes de la energa cinetica no pueden ser negativos. Por tanto, tan pronto como y
comienzan a ser no nulos, la energa solo se puede conservar si hay un decrecimiento del termino potencial
M gl cos i.e. aumentando 25 . El valor inicial de corresponde por tanto a 2 el mnimo valor posible
para que corresponde al crculo superior. En otras palabras, tan pronto como el eje de figura se suelta la
peonza comienza a caer hasta que llega al valor m
aximo de que es 1 para retornar de nuevo hacia 2 y
as sucesivamente. Adicionalmente, el eje tambien est
a precesando mientras se cumple el ciclo de nutaci
on ver
Fig. 14.6c. Finalmente, dado que en este caso u0 = u2 , el locus presenta c
uspides en el crculo superior.
Desde el punto de vista de la energa (omitiendo la energa constante de spinning) podemos decir que
cuando = 2 las energas cineticas de nutaci
on y precesi
on son nulas y la potencial toma el valor m
aximo,
cuando la peonza cae hasta el punto m
as bajo, la energa potencial alcanza su valor mnimo y la energa
cinetica de nutaci
on vuelve a ser nula ya que = 0, en tanto que la energa cinetica de precesi
on alcanza su
valor m
aximo.
cos 0 = u0 = u2 = u0 =

14.6.3.

An
alisis cuantitativo aproximado de la peonza r
apida

Tomemos de nuevo las condiciones iniciales (0) = (0) = 0, y supongamos adicionalmente que la energa
cinetica de rotacion alrededor de X3 es mucho mayor que el m
aximo valor posible para el cambio en la energa
potencial,
1
I3 32 >> 2M gl
(14.80)
2
los efectos de los torques gravitacionales, es decir, la precesi
on y la nutaci
on que los acompa
nan, ser
an solo
peque
nas perturbaciones de la rotaci
on dominante (spinning) alrededor del eje de figura. Esta condici
on define
el regimen de peonza r
apida. Bajo estas suposiciones es posible obtener expresiones analticas aproximadas
para la amplitud y frecuencia de nutaci
on, as como para la frecuencia promedio de precesi
on.
La extensi
on de la nutaci
on para las condiciones iniciales dadas se obtiene a traves de u1 u0 , siendo u0 la
raz de f (u) dada en (14.79) y siendo u1 la otra raz fsica de f (u). Las condiciones iniciales nos conducen a
1
E = I3 32 + M gl cos 0 E 0 = M gl cos 0
2
que se puede reescribir como

2E 0
2M gl
=
cos 0
I1
I1

y teniendo en cuenta (14.73, 14.79) tales condiciones equivalen a la igualdad


= u0
esta relaci
on nos permite reescribir f (u) en la Ec. (14.76) de la forma


f (u) = u3 u0 + a2 u2 + (2ab ) u + u0 b2

f (u) = u3 u0 u2 u + u0 a2 u2 + 2abu b2
i
 h
f (u) = (u0 u) 1 u2 (au)2 2b (au) + b2

f (u) = (u0 u) 1 u2 [au b]2
25

En otras palabras, existe una energa cinetica asociada al spinning, otra asociada a la precesi
on, y otra a la nutaci
on. La
primera es una constante en el tiempo puesto que est
a asociada a 3 , y las dos siguientes son nulas en t = 0, por tanto en t = 0 la
energa cinetica adquiere el valor mnimo posible y por lo tanto, tan pronto como la peonza adquiere energa cinetica de nutaci
on
y precesi
on, debe compensar con una disminuci
on de la energa potencial ya que bajo estas condiciones la energa cinetica de
spinning no cambia.


14.6. LA PEONZA SIMETRICA
PESADA CON UN PUNTO FIJO

381

por otro lado la Ec. (14.79) nos dice que


b = au0

(14.81)

de modo que

f (u) = (u0 u) 1 u2 [au au0 ]2

f (u) = (u0 u) 1 u2 a2 (u u0 )2

quedando finalmente




f (u) = (u0 u) 1 u2 a2 (u0 u)

(14.82)

esta parametrizaci
on permite encontrar las otras races diferentes de u0 por medio de la expresi
on cuadr
atica
en los brackets. La raz buscada u1 debe en consecuencia satisfacer tal ecuaci
on cuadr
atica que la podemos
expresar en la forma
 a2
(u0 u1 ) = 0
1 u21
(14.83)

de acuerdo con la discusi


on de la secci
on 14.6.2, una de las races de f (u) es real con u > 1, es decir no es
fsicamente accesible. En este caso debe corresponder a una de las races de la ecuaci
on cuadr
atica (14.83), y
por tanto tal ecuaci
on solo nos dar
a una soluci
on fsica. Definiendo la cantidad
x1 u0 u1

(14.84)

de acuerdo con la secci


on 14.6.2, vemos que si u1 es una soluci
on fsica, entonces x1 > 0. Solo las soluciones
positivas de x1 son fsicamente accesibles. Podemos reescribir (14.83) como
h

i a2
1 (u0 x1 )2 x1 = 0

a2
1 u20 + 2u0 x1 x21 x1 = 0

 2

a
x21 +
2u0 x1 + u20 1 = 0

teniendo en cuenta (14.79) la ecuaci


on cuadr
atica queda de la forma
x21 + px1 q = 0 ;

a2
2 cos 0 ; q = sin2 0

(14.85)

Hasta el momento no se ha realizado ninguna aproximaci


on, aunque si se han usado las condiciones iniciales
(0) = (0) = 0, ya que de ellas depende la validez de las Ecs. (14.79, 14.81). La condici
on de peonza r
apida
2
(14.80) implica que p es mucho mayor que q, lo cual se puede ver calculando el radio a / y empleando (14.73)
a2

a2


I3 3 2 I1
=
I1
2M gl
 
I3 I3 32
=
I1 2M gl

(14.86)

claramente bajo la condici


on (14.80) este cociente es mucho mayor que la unidad excepto en el caso en el cual
I3 << I1 (que correspondera a una peonza tipo cigarro). De esto se deduce entonces que p >> q. Calculemos
las races de (14.85)
x1 =

p2 + 4q
p
=
2
2

4q
1+ 2
p




p
2q

1 1 + 2
=
2
p

382

CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

y dado que 2q/p2 << 1, solo hay una raz positiva y por tanto solo hay una soluci
on fsica como se anticip
o.
Por lo tanto, la u
nica raz fsicamente realizable de (14.85), est
a dada a primer orden en q/p por
q
p

x1 =

usando la segunda de las Ecs. (14.85) y despreciando 2 cos 0 comparado con a2 / este resultado se escribe
como
sin2 0
I1 2M gl
=
sin2 0
(14.87)
x1 =
2
a
I3 I3 32
donde hemos usado (14.73). En consecuencia, la extensi
on de la nutaci
on medida por x1 = u0 u1 disminuye
2
en la misma forma que 1/3 , de modo que a mayor spinning de la peonza menor es la extensi
on de la nutaci
on.
Tambien vemos que la extensi
on de la nutaci
on disminuye cuando disminuye 0 , es decir a medida que nos
acercamos a la vertical en la condici
on inicial. Debemos recordar sin embargo que la condici
on 0 = 0 de
peonza vertical ha sido excluda del an
alisis hasta el momento.
La frecuencia de la nutaci
on para la peonza r
apida se puede encontrar de manera aproximada teniendo en
cuenta que en (14.82) podemos hacer la aproximaci
on


1 u2
= 1 u20 = sin2 0
en virtud de lo peque
no de la extensi
on de la nutaci
on. Teniendo en cuenta esta aproximaci
on y definiendo
x u0 u

(14.88)

tenemos que la Ec. (14.82) queda




sin2 0
x
f (u) = x sin 0 a x = a x
a2


de las Ecs. (14.74, 14.76) vemos que f (u) = u 2 = x 2 . Adicionalmente, usando la Ec. (14.87), se tiene que
f (u) = x 2 = a2 x (x1 x)

x u0 u

si corremos el origen de x hasta el punto medio de su intervalo permitido por medio del cambio de variable
y =x

x1
2

y = x

la ecuaci
on diferencial queda en la forma



i
x1  h
x1 i
x1  h x1
y 2 = a2 y +
x1 y +
y 2 = a2 y +
y
2
2
2
 2 2 
x
1
y 2 = a2
y2
4
al derivar a ambos lados se obtiene
2y y = 2a2 y y
que se simplifica a la ecuaci
on familiar de un oscilador armonico
y = a2 y y = A cos (at + )
x1
x1
x
= A cos (at + ) x =
+ A cos (at + )
2
2
puesto que u (0) = u0 se tiene que x (0) = 0, y la condici
on inicial (0) = 0 implica x (0) = 0. Con estas
condiciones iniciales la amplitud A y la fase vienen dadas por
A=

x1
2

; =0


14.6. LA PEONZA SIMETRICA
PESADA CON UN PUNTO FIJO

383

la soluci
on completa es

x1
(1 cos at)
(14.89)
2
donde x1 viene dada por (14.87). La frecuencia angular de la nutaci
on del eje de figura entre 0 y 1 es entonces
x=

a=

I3
3
I1

(14.90)

donde se ha tenido en cuenta (14.73). Vemos que esta frecuencia angular de nutaci
on se incrementa cuando
aumenta el spinning inicial de la peonza.
Finalmente, la velocidad angular de precesi
on se obtiene a traves de (14.69)

b
a

cos

a
cos

a (u0 u) ax
a
=
=
=
(14.91)
=
2
2
sin
sin
sin2
sin2 0
donde hemos tenido en cuenta las definiciones (14.79) y (14.88). Sustituyendo (14.89) en (14.91) se obtiene

=

a x1
(1 cos at)
sin2 0 2

(14.92)

La Ec. (14.92), nos muestra que la velocidad de precesi


on es directamente proporcional a la extensi
on de la
nutaci
on x1 . Usando (14.87)


a
I1 2M gl

sin2 0 (1 cos at)
=
2 sin2 0 I3 I3 32
 2 
a
I1
2M gl

(1 cos at)
=
2
2
2 I3 3
I1
finalmente, aplicando las definiciones (14.73)
a 1

(1 cos at)
=
2 a2


(1 cos at)
(14.93)
=
2a
con lo cual se ve que la rata de precesi
on no es constante sino que vara arm
onicamente con el tiempo con la
misma frecuencia que la nutaci
on. No obstante, debe tenerse en cuenta que para este caso no hay inversi
on del

sentido de precesi
on ya que nunca invierte su signo seg
un se ve en (14.93), esto se debe a que = 0 ocurre
al mismo tiempo que = 0 en un extremo del intervalo permitido. La frecuencia promedio de precesi
on es
sin embargo
Z 2/a
1

=
(1 cos at) dt
2/a 0
2a

M gl

=
(14.94)
=
2a
I3 3
que indica que la rata de precesi
on promedio disminuye a medida que aumenta la velocidad rotacional inicial
de la peonza.
Tenemos ahora un cuadro completo del movimiento de la peonza simetrica pesada con punto fijo, cuando
el eje de figura est
a inicialmente en reposo. Una vez se suelta dicho eje, la peonza comienza a caer bajo la
influencia de la gravedad. Pero a medida que cae, el torque resultante alrededor del eje de cada (lnea de nodos)
causa que la peonza adquiera una velocidad de precesi
on, directamente proporcional a la extensi
on de su cada,
el eje de figura empieza entonces a precesar alrededor de la vertical. La cada inicial resulta en una nutaci
on
peri
odica del eje de figura que se combina con la precesi
on. A medida que incrementamos el valor inicial de
la velocidad angular alrededor del eje de figura la extensi
on de la nutaci
on decrece r
apidamente aunque la
frecuencia de la nutaci
on aumenta, y la precesi
on alrededor de la vertical tambien disminuye. En la pr
actica,

384

CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

para peonzas suficientemente r


apidas, la nutaci
on se amortigua muy r
apidamente debido a la fricci
on en el
pivote y resulta muy difcil de observar. En consecuencia, la peonza parece precesar uniformemente alrededor
de la vertical. Puesto que la peonza parece precesar uniformemente solo en apariencia se habla frecuentemente
de precesi
on pseudoregular.
N
otese sin embargo que aunque en la pr
actica la nutaci
on suele ser inobservable para peonzas r
apidas,
ignorar completamente la nutaci
on nos lleva a la conclusion inconsistente de que una vez que se suelta el
eje de figura, la peonza comienza inmediatemente a precesar uniformemente, un movimiento que es normal
a las fuerzas de gravedad las cuales son la u
ltima causa de la precesi
on. Nuestro tratamiento de precesi
on
pseudoregular resuelve la inconsistencia; la precesi
on crece contnuamente a partir del reposo sin ninguna
aceleraci
on infinita y la tendencia inicial de la peonza es moverse en la direcci
on de la fuerza de gravedad.

14.6.4.

Peonza con precesi


on regular

Figura 14.7: Comportamiento de las races del polinomio f (u) dado en la Ec. (14.76). (a) Hay dos races en
el intervalo (1, 1) y el sistema exhibe nutaci
on. (b) Hay solo una raz fsica u0 en el intervalo (1, 1) y por
tanto un solo valor permitido de , en este caso no hay nutaci
on (precesi
on regular). (c) Corresponde a un
m
aximo local con una u
nica raz fsica en u = 1 que corresponde a peonza vertical sin nutaci
on. Finalmente,
en (c) hay dos races fsicas donde una de ellas corresponde a u = 1, esto describe una peonza inicialmente
vertical con nutaci
on.
En vista de lo anterior, resulta de interes saber que condiciones iniciales conducen a una precesi
on verdaderamente regular. En tal caso permanece constante con su valor inicial 0 , lo cual significa que 1 = 2 = 0 .
Esto implica que f (u) debe tener una degeneraci
on simple en las races que yacen en el intervalo [1, 1] i.e.
u1 = u2 = u0 (ver Fig. 14.7b). Recordando que en este caso f (u) era no positivo en todo el intervalo [1, 1],
la u
nica manera de obtener una sola raz (o m
as bien dos races degeneradas) en el interior de tal intervalo es
considerar el caso en el cual f (u) posee un m
aximo local en la raz, como se aprecia en la Fig. 14.7b, es decir
f (u0 ) =

u 20

=0 ;


df
=0
du u=u0

(14.95)


14.6. LA PEONZA SIMETRICA
PESADA CON UN PUNTO FIJO

385

a partir de (14.74) la primera de las condiciones en (14.95) con u 0 = 0 conduce a


( u0 ) =

(b au0 )2
1 u20

(14.96)

utilizando (14.74), la segunda de las condiciones en (14.95) se traduce en




df (u)
2
=
1

u
() 2u0 ( u0 ) 2 (b au0 ) (a) = 0
0
du
u0


1 u20 = 2u0 ( u0 ) + 2a (b au0 )

a (b au0 )
( u0 )
=
u0
2
2
1 u0
1 u20

(14.97)

sustituyendo (14.96) en (14.97) y teniendo en cuenta (14.69), se llega a una ecuaci


on cuadr
atica para

a (b au0 )
1 (b au0 )2

u
0
1 u20
1 u20 1 u20


(b au0 )
b au0 2
= a
u0
sin2 0
sin2 0
=

= a 2 cos 0
(14.98)
2
y teniendo en cuenta las definiciones de (14.73) para y a podemos escribir estos terminos en dos formas
alternativas, dependiendo de si a se expresa en terminos de 3 o de los valores constantes de y (ver Ecs.
14.73 y 14.65)
 I
I3 
2M gl
3
a=
+ cos = 3 ; =
(14.99)
I1
I1
I1
reemplazando (14.99) en (14.98) usando las dos formas de a
M gl
I1
M gl
I1

=
=

I3
3 2 cos 0
I1

I3 
+ cos 0 2 cos 0
I1

donde hemos tenido en cuenta que = 0 para todo tiempo. Estas ecuaciones se pueden escribir como


M gl = I3 3 I1 cos 0
i
h
M gl = I3 (I1 I3 ) cos 0
(14.100)

las condiciones iniciales para el problema de la peonza pesada simetrica con punto fijo, requieren la especifica y o 3 en el tiempo t = 0. Dado que las variables y son cclicas sus valores iniciales
ci
on de , , , ,
no son muy relevantes, y en general podemos elegir cualquier valor que deseemos para cada una de las otras
cuatro constantes. Pero si hacemos la exigencia adicional de que el eje de figura precese uniformemente sin
nutaci
on, nuestra escogencia de estas cuatro condiciones iniciales ya no es completamente libre, ya que debe
satisfacer cualquiera de las Ecs. (14.100), que en general nos dan una relaci
on entre 0 , 0 y 0 o entre 0 , 0
y 3 . Para = 0 podemos a
un elegir valores iniciales de y 3 casi arbitrariamente, pero el valor de queda
entonces determinado a traves de la Ec. (14.69). La frase casi arbitrariamente, se refiere a que al ser las Ecs.
(14.100) cuadr
aticas, y teniendo en cuenta que debe ser real, entonces el discriminante de (14.100) debe ser
positivo
I32 32 > 4M glI1 cos 0
(14.101)

386

CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

para 0 > /2 es decir cuando el centro de masa puede estar por debajo del punto fijo, el miembro derecho
on uniforme. Pero
de esta expresi
on es negativo, de modo que cualquier valor de 3 puede conducir a precesi
0
para 0 < /2, el valor escogido para 3 tiene que ser mayor a un valor mnimo 3 que se obtiene igualando
los miembros en (14.101)
2p
M glI1 cos 0
(14.102)
3 > 30 =
I3
para lograr la precesi
on uniforme. Condiciones similares se pueden obtener a partir de la segunda de las
Ecs. (14.100) para los valores permitidos de . Como un resultado de la naturaleza cuadr
atica de (14.100),

habr
a en general dos soluciones para conocidas como precesi
on r
apida y lenta. N
otese tambien que las
Ecs. (14.100) no se pueden satisfacer con (0) = 0 para valores finitos de o de 3 ; para obtener precesi
on
uniforme, debemos darle siempre al cuerpo rgido un impulso a la peonza que la ponga en tal situaci
on. Sin esta
velocidad precesional adecuadamente generada, podemos en el mejor de los casos obtener solo una precesi
on
pseudoregular. Esto es l
ogico ya que sin un torque adicional no es posible generar la precesi
on sin una cada
previa del centro de masa (que generara la nutaci
on), como ya vimos anteriormente.
En el caso en el cual la precesi
on es lenta, podemos despreciar a cos 0 comparado con a de la Ec.
(14.98) vemos entonces que una soluci
on aproximada para viene dada por
M gl

=
precesi
on lenta

=
2a
I3 3
expresi
on que coincide con la correspondiente para el promedio de la precesi
on pseudoregular de una peonza
r
apida Ec. (14.94). Este resultado es l
ogico ya que si la precesi
on es lenta no hay mucha diferencia entre aplicar

un ligero impulso al gir


oscopo, o no imprimirle impulso en lo absoluto. Se puede ver que con este valor de ,
despreciar a cos 0 con respecto a a es equivalente a requerir que 3 tenga un valor mucho mayor a su
cota inferior permitida. Para estos valores grandes de 3 existe un lmite de precesi
on r
apida (no confundir
con el lmite de peonza r
apida cuyo lmite se refiere al spinning y no a la precesi
on), que se obtiene cuando
es grande de tal forma que M gl es peque
no comparado con los otros terminos en las Ecs. (14.100)
I3 3
precesi
on r
apida
I1 cos 0
vemos entonces que la precesi
on r
apida es independiente de los torques gravitacionales, ya que precisamente
estos se han despreciado. Es natural entonces suponer que dicho lmite est
a m
as relacionado con la precesi
on
libre, dado que no hay mas torques en el sistema.
=

14.6.5.

Peonza inicialmente vertical

En la secci
on 14.6.2 se descart
o del an
alisis la posibilidad de que una de las races de f (u) estuviera en
u = 1. Un lmite interesante es el caso en que u = 1 es una de las races de f (u). Este caso corresponde a
una peonza inicialmente vertical con el centro de masa por encima del origen, y se debe analizar por aparte ya
que en todo el tratamiento que se ha hecho hasta ahora el sin2 0 ha aparecido a menudo en el denominador.
Trabajemos entonces bajo la condici
on de que la peonza este inicialmente vertical con una velocidad angular
inicial de spinning 3 . En t = 0 el eje de figura coincide con el eje vertical, y recordando que p (p ) es la
componente total del momento angular alrededor del eje vertical (de figura), se concluye que p = p en t = 0
y en todo tiempo ya que son constantes de movimiento. De las Ecs. (14.65, 14.66) vemos entonces que lo
anterior conduce a que a = b. Por otro lado, dado que la energa cinetica inicial es solo de spinning se obtiene
que
1
E 0 = E I3 32 = M gl
2
de esta expresi
on y las relaciones (14.73) se obtiene que = . Con estas condiciones, la Ec. (14.74) queda en
la forma

f (u) = u 2 = 1 u2 (1 u) a2 (1 u)2
f (u) = u 2 = (1 u) (1 + u) (1 u) a2 (1 u)2


f (u) = u 2 = (1 u)2 (1 + u) a2


14.6. LA PEONZA SIMETRICA
PESADA CON UN PUNTO FIJO

387

lo cual nos indica que u = 1 es una raz doble siempre que sea raz de f (u), donde la tercera raz viene dada
por
a2
u3 =
1
(14.103)

si a2 / > 2, lo cual se cumple por ejemplo en el lmite de peonza r


apida, se tiene que u3 > 1, de modo que
solo la raz u = 1 corresponde a una situaci
on fsica. Esto significa que la peonza contin
ua con su eje de figura
vertical, con energa cinetica de spinning u
nicamente. En tal caso la raz degenerada u = 1 corresponde a un
m
aximo local de f (u) con la tercera raz en alg
un punto fuera del intervalo [1, 1], como se ve en la Fig. 14.7c.
Por otro lado, si a2 / < 2 se tiene que la tercera raz es menor que 1, tomaremos solo el caso en que u3 est
a en
el intervalo (0, 1). En este escenario, la raz u = 1 corresponde a un mnimo local y f (u) se comporta como
an los puntos de retorno en . Estas desigualdades
muestra la Fig. 14.7d, la peonza nutar
a entre 0 y 3 que ser
2
muestran en consecuencia que existe un valor crtico a / = 2 que define la transici
on entre un movimiento
perfectamente vertical y uno con nutaci
on y precesi
on26 . Aplicando (14.86), este valor lmite nos da
 
a2
I3 I3 02
=
=2

I1 2M gl
la u
nica variable que se puede modular en este termino (para una peonza dada) es la velocidad angular. Por
tanto, existe una velocidad angular crtica por encima de la cual solo el movimiento vertical es posible.
02 = 4

M glI1
I32

(14.104)

expresi
on que es identica al valor expresado en la Ec. (14.102) de la frecuencia mnima para precesi
on constante,
y que ahora se aplica para 0 = 0.
En la pr
actica, si la peonza gira inicialmente con eje vertical y 3 es superior al valor crtico, ella rotar
a un
tiempo solo sobre el eje vertical (trompo dormido) pero su spinning va disminuyendo por efecto de la fricci
on,
cuando 3 pasa el valor crtico, comienza a bambolearse en cantidades cada vez mayores a medida que disminuye
el spinning.

14.6.6.

Efectos de fricci
on, torques adicionales y aplicaciones de la peonza sim
etrica
pesada

Los efectos de fricci


on (que no se pueden introducir en forma directa en el formalismo Lagrangiano)
producen ciertos fen
omenos inesperados. Un ejemplo notable es el tippie-top que consiste b
asicamente en algo
mas que media esfera con un soporte unido a la parte plana. Cuando se comienza a rotar con la superficie esferica
hacia abajo sobre una superficie dura y lisa, el artefacto comienza a deslizarse y nutar hasta que eventualmente
se gira quedando con la superficie esferica hacia arriba, pivoteando sobre el soporte, comport
andose como un
trompo dormido. La inversi
on completa del vector momento angular es el resultado del torque friccional que
ocurre cuando el trompo se desliza sobre su superficie esferica.
Hay una amplia gama de aplicaciones concernientes al uso de peonzas r
apidas. Una de ellas es el gir
oscopo
que consiste en una peonza simetrica que se monta sobre un soporte que permite la reorientaci
on del eje de
figura en cualquier direcci
on, el eje de figura gira muy r
apidamente debido a la aplicaci
on de ciertos torques
externos. El centro de masa se hace coincidir con el punto fijo a traves de alg
un contrapeso colocado al otro
extremo de la peonza. Una vez se libera el eje de figura con una gran velocidad angular, se observa que la
direcci
on del eje de figura permanece constante (medida por un observador inercial, por ejemplo las estrellas
fijas) sin importar como reorientemos el montaje, fen
omeno conocido como inercia girosc
opica, el cual se debe a
la ausencia de torques netos externos. En particular, si el montaje se deja por seis horas (asumiendo muy bajo
amortiguamiento) se puede observar una rotaci
on del eje de figura de /2 que en realidad se debe justamente
26
Vemos que cuando u = 1 es una raz, es posible que las tres races de f (u) sean todas fsicas, aunque solo hay a lo m
as dos
races fsicas diferentes. Es tambien posible que las tres races sean degeneradas. Estas caractersticas difieren del an
alisis realizado
en la secci
on 14.6.2, cuando descart
abamos la posibilidad de que u = 1 fueran races de f (u).

388

CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

a que el eje de figura permanece constante en direcci


on respecto a un sistema inercial, en tanto que la tierra
ha tenido una rotaci
on de /2. Esta caracterstica hace del gir
oscopo un excelente instrumento para mantener
direcciones especficas, por ejemplo para proveer plataformas estables.
Si se le aplican torques externos adecuados al gir
oscopo, puede generar precesi
on y nutaci
on. En la mayora
de ocasiones se puede utilizar el lmite de peonza r
apida para estos dispositivos y como vimos antes, en
la pr
actica la nutaci
on se aten
ua r
apidamente por efectos de fricci
on y pronto se vuelve inobservable. En
realidad, en muchos gir
oscopos el montaje se realiza para atenuar deliberadamente el efecto de nutaci
on. En
tal caso, el estado estacionario del sistema solo presenta precesi
on, lo cual simplifica fuertemente el tratamiento
matem
atico. Podemos entonces generalizar el tratamiento hecho para la peonza simetrica de una manera simple.
Si R es el radio vector que va desde el punto fijo hasta el centro de masa a lo largo del eje de figura, el
torque gravitacional que se ejerce sobre la peonza viene dado por
N = R Mg

(14.105)

donde g define al campo gravitacional uniforme en la vecindad de la superficie terrestre. Definamos L3 como
la componente del momento angular de la peonza a lo largo del eje de figura, el cual describe el momento
angular de espn del s
olido, y definamos p como el vector de precesi
on, el cual est
a alineado con el eje vertical

y posee magnitud igual a la velocidad angular promedio de precesi


on dada aproximadamente por (14.94).
De las definiciones es claro que



p u03 ; L3 I3 3 u3

y aplicando (14.94), podemos calcular |p L3 |





M gl

|p L3 | = |L3 | sin =
(I3 3 ) sin = |M g| |R| sin = |R M g|
I3 3

La direcci
on de la precesi
on pseudoregular est
a dada por u u03 u3 que es la direcci
on de la lnea de nodos.
Por tanto, p L3 est
a dado por

p L3 = |p L3 | u03 u3 = |R M g| u
pero recordando que la direcci
on de la lnea de nodos u es tambien la direcci
on del torque, nos queda finalmente
p L3 = N

(14.106)

Puesto que el torque alrededor del punto fijo o del centro de masa se puede colocar en la forma R F, en
forma similar a (14.105), la rata de precesion promedio para una peonza r
apida se puede derivar siempre de
(14.106), donde la direcci
on de la fuerza F define al eje de precesi
on. Casi todas las aplicaciones pr
acticas de
los gir
oscopos involucran el comportamiento del equilibrio (despreciando transientes) que se puede derivar de
(14.106).
En virtud de la ecuaci
on (14.106) se puede ver que un gir
oscopo originalmente libre de torques puede servir
para medir ratas de rotaci
on angular y torques aplicados por medio del fen
omeno de precesi
on. Pues dicha
ecuaci
on nos dice que la rata de precesi
on es proporcional al torque, en contraste con el caso de un cuerpo sin
rotaci
on de espn en el cual es la aceleraci
on angular la que es proporcional al torque. Una vez que el torque se
remueve, el cuerpo que no tiene espn contin
ua moviendose; bajo condiciones similares el gir
oscopo contin
ua
con su espn sin precesar.
El caso del girocomp
as es m
as complejo, ya que en este caso lo que se pretende es mantener el objeto con
direcci
on fija con respecto a un sistema de referencia no inercial (la tierra). Para ello se le adiciona al dispositivo
una precesi
on aplicada a una rata tal que contrarrestre la rata de rotaci
on terrestre. Una vez ajustado en la
direcci
on de rotaci
on de la tierra i.e. la direcci
on norte, el girocompas preserva esta direcci
on, por lo menos en
vehculos que se muevan lentamente.
Dos ejemplos interesantes como fen
omenos en s y para la aplicaci
on de las tecnicas aqu descritas, son: la
precesi
on de los equinoccios, y la precesi
on del movimiento de cargas en un campo magnetico.

14.7. EJERCICIOS

14.7.

389

Ejercicios

1. Sea un s
olido de revoluci
on como el de la Fig. 3.2, P
ag. 51, con densidad constante. Demuestre que los
momentos de inercia con respecto a los ejes X e Y vienen dados por (ver problema 4 p
ag 52, y Ref. [8])
Z
Z xf
xf
IX
4
f (x) dx ; IY =
x2 f (x)2 dx
IX =
+
2 x0
2
x0

Captulo 15

Oscilaciones
Un tipo de sistema cl
asico de muy amplia utilidad en diversas ramas de la Fsica es aquel que consiste de un
conjunto de elementos que oscilan alrededor de sus posiciones de equilibrio. Si la desviaci
on del equilibrio estable
de cada elemento del sistema es suficientemente peque
na, entonces el movimiento de este se puede simular
como un conjunto de osciladores arm
onicos acoplados. Estudiaremos en este captulo el comportamiento de un
sistema discreto de osciladores. Las tecnicas matem
aticas a emplear ser
an muy similares a las que se usan para
estudiar la mec
anica del cuerpo rgido, aunque los sistemas mec
anicos considerados aqu, no necesariamente
deben involucrar cuerpos rgidos.

15.1.

Peque
nas oscilaciones y equilibrio estable

Consideraremos sistemas conservativos en donde la energa potencial solo es funci


on de la posici
on. Adicionalmente, asumiremos que las ecuaciones de transformaci
on que definen a las coordenadas generalizadas
del sistema q1 , . . . , qn no dependen explcitamente del tiempo. En consecuencia, se excluye la posibilidad de
ligaduras dependientes del tiempo explcitamente. Decimos que el sistema est
a en equilibrio cuando cada una
de las fuerzas generalizadas asociadas a las coordenadas qi se anulan


V
=0
Qi =
qi 0
la energa potencial posee por lo tanto un extremo en la configuraci
on de equilibrio del sistema, que describimos
por q01 , . . . , q0n . Si el sistema est
a inicialmente en equilibrio con velocidades generalizadas nulas i.e. qi (0) = 0,
el sistema continuar
a indefinidamente en el equilibrio.
Intuitivamente tenemos la idea de lo que es el equilibrio estable e inestable. Por ejemplo, un l
apiz que se
suspende verticalmente con su punta como punto de apoyo, abandona f
acilmente su configuraci
on de equilibrio
ante la mas mnima perturbaci
on. En cambio un pendulo simple vertical no tiende a alejarse de su posici
on de
equilibrio cuando ejercemos una peque
na perturbaci
on, m
as bien el sistema oscila ligeramente alrededor del
equilibrio gracias a la presencia de fuerzas restauradoras que apuntan siempre hacia el punto de equilibrio.
Clasificamos como posici
on de equilibrio estable a aquella en la cual una peque
na perturbaci
on del sistema
resulta solo en un movimiento acotado en cierta regi
on alrededor del equilibrio, con la condici
on adicional de que
esta regi
on de oscilaci
on se puede hacer arbitrariamente peque
na modulando adecuadamente la perturbaci
on1 .
El equilibrio se dice inestable si una perturbaci
on arbitrariamente peque
na se traduce en movimiento acotado
en una regi
on finita o en movimiento no acotado. Vemos pues que el pendulo vertical y el l
apiz descritos arriba
est
an en equilibrio estable e inestable respectivamente de acuerdo con esta definici
on.
Podemos ver que si el extremo en el potencial es un mnimo local entonces el equilibrio tiene que ser estable.
Para demostrarlo tendremos en cuenta que en cierta vecindad alrededor del punto de equilibrio, el potencial
1
El equilibrio inestable tambien puede producir movimiento acotado como se ve en la Fig. ???. Sin embargo, vemos que el
intervalo permitido mnimo para el movimiento, no se puede hacer arbitrariamente peque
no, incluso si la perturbaci
on se hace
arbitrariamente peque
na.

390


15.1. PEQUENAS
OSCILACIONES Y EQUILIBRIO ESTABLE

391

se incrementa en cualquier direcci


on. Supongamos que el sistema tiene inicialmente la energa total V (q0i ) i.e.
est
a en reposo en la configuraci
on de equilibrio. Cuando hacemos un incremento de energa E (perturbaci
on)
el sistema adquiere energa cinetica cuyo valor en t = 0 es justamente E, como en cualquier direcci
on
la energa potencial aumenta, entonces la energa cinetica debe disminuir, podemos hacer un incremento de
energa (perturbaci
on) suficientemente peque
no para que
E Vmax V (q0i )

(15.1)

donde Vmax es el m
aximo valor que toma el potencial dentro de la regi
on alrededor del equilibrio en la cual el
potencial aumenta en todas direcciones (denotamos a esta regi
on por Rmax ). Si se cumple la condici
on (15.1)
entonces existe un valor del potencial Vc dentro de la regi
on en cuesti
on para la cual E = Vc V (q0i ).
El conjunto de puntos en donde V (q0i ) V Vc define una regi
on que denotamos por Rc , y claramente
Rc Rmax . En los puntos de Rc en donde E = Vc V (q0i ) la energa cinetica es cero (punto de retorno) y
solo puede volver a aumentar si el sistema se mueve hacia donde disminuye el potencial. Esto impide al sistema
salir de la regi
on Rc ya que en los puntos inmediatamente fuera de tal regi
on el potencial es superior al de
cualquier punto en Rc . Finalmente para una funci
on bien comportada, la regi
on Rc disminuye arbitrariamente
a medida que disminumos a E.
En un m
aximo local, ocurre que en general la energa cinetica aumenta a medida que nos alejamos del
equilibrio dado que el potencial disminuye en cualquier direcci
on. Cuando hay un m
aximo local de una funci
on
bien comportada existe una regi
on finita en la cual el potencial decrece mon
otonamente y se puede ver que
dentro de esta regi
on no hay puntos de retorno. En consecuencia si E > 0, el sistema se mueve mnimo
en esta regi
on finita accesible a
un cuando la perturbaci
on sea arbitrariamente peque
na. Gr
aficamente, estas
caractersticas son f
aciles de visualizar para sistemas unidimensionales como se puede apreciar en la figura
????.
Estaremos interesados en el movimiento del sistema dentro de una peque
na regi
on alrededor de un punto
de equilibrio estable. Dado que las desviaciones del equilibrio son peque
nas, podemos hacer una expansi
on de
Taylor para las funciones involucradas alrededor del punto de equilibrio y retener solo los terminos de m
as
bajo orden. Denotaremos las desviaciones de las coordenadas generalizadas por i
qi = q0i + i

(15.2)

estas se tomar
an como las nuevas coordenadas generalizadas del movimiento. Una expansi
on de Taylor del
potencial alrededor del punto de equilibrio nos da
 2 


V
1
V
V (q1 , . . . , qn ) = V (q01 , . . . , q0n ) +
i +
i j + . . .
(15.3)
qi 0
2 qi qj 0
se ha usado convenci
on de suma sobre ndices repetidos. Los terminos lineales en i se anulan debido a la
condici
on de equilibrio (15.1). El primer termino es una constante que se puede remover redefiniendo el cero
on a
de potencial. Por tanto, nos quedamos solo con los terminos cuadr
aticos en i como primera aproximaci
V.
 2 
1
V
V (q1 , . . . , qn ) = Vij i j + . . . ; Vij
(15.4)
2
qi qj 0
Los coeficientes Vij son constantes que dependen de los valores de las qi en el punto de equilibrio. De la
definici
on es claro que los Vij son simetricos i.e. Vij = Vji . Es posible que bajo diversas circunstancias, algunos
de estos coeficientes se anulen, por ejemplo, si el potencial es independiente de una coordenada qk el equilibrio
ocurrir
a para un valor arbitrario de esta coordenada y hablaremos de equilibrio neutro o indiferente con respecto
a dicha coordenada. Tambien puede ocurrir que el potencial se comporte como cuadr
atico (sin algunos terminos
cruzados) en tal punto, de modo que uno o m
as de los Vij ser
an nulos. Cualquiera de estos casos debe ser
tratado por aparte con respecto a la formulaci
on que desarrollaremos.
Una expansi
on en serie es tambien posible para la energa cinetica. Como las transformaciones a las qi no
dependen explcitamente del tiempo (y por lo tanto, tampoco las transformaciones a las i ) la energa cinetica

CAPITULO 15. OSCILACIONES

392

resulta ser una funci


on homogenea de grado dos en las velocidades como se puede verificar a partir de (2.24)
T =

1
1
mij qi qj = mij i j
2
2

(15.5)

los coeficientes mij son en general funciones de las coordenadas que por tanto tambien pueden ser expandidos
alrededor de la configuraci
on de equilibrio.


mij
k + . . .
(15.6)
mij (q1 , . . . , qn ) = mij (q01 , . . . , q0n ) +
qk 0
pero dado que la ecuaci
on (15.5) ya es cuadr
atica en los i , el termino m
as bajo que no se anula en T se obtiene
del primer termino en la expansi
on (15.6) definimos entonces
Tij mij (q01 , . . . , q0n )

(15.7)

y escribimos la energa cinetica a orden cuadr


atico como
T =

1
Tij i j
2

(15.8)

es claro que tambien los coeficientes Tij siempre se pueden hacer simetricos, ya que la expresi
on total no se
afecta con un intercambio de ndices. El Lagrangiano se obtiene entonces a partir de las Ecs. (15.4) y (15.8)
1
(Tij i j Vij i j )
2

L=

(15.9)

tomando las 0 s como coordenadas generalizadas, podemos construr las ecuaciones de Lagrange
L
k
L
k

=
=

Tij i
Tij j
Tij
Tij
j +
i =
ik j +
jk i
2 k
2 k
2
2
Tkj
Tik
Tki
Tki
j +
i =
i +
i
2
2
2
2

donde hemos usado la simetra de los Tij y el hecho de que los ndices de suma son mudos, tenemos entonces
que


L
d L
= Tki i
= Tki i
k
dt k
similarmente, usando la simetra de las Vij


L
Vij i
j
Vij
=
j +
i =
(ik j + jk i )
k
2
k
k
2
Vkj
Vik
=
j
i = Vki i
2
2
las ecuaciones de Lagrange quedan
Tki i + Vki i = 0

(15.10)

cada una de las Ecs. (15.10) involucra en general a todos los i y forman un conjunto acoplado de ecuaciones
diferenciales simult
aneas que debemos resolver para describir el movimiento del sistema alrededor del equilibrio.
En la mayora de aplicaciones, la energa cinetica se puede escribir de modo que no posea productos
cruzados, con lo cual el Lagrangiano (15.9) se escribe como
L=
y las ecuaciones de movimiento (15.10) quedan


1
Ti i2 Vij i j
2

Tk k + Vki i = 0 (no suma sobre k)

(15.11)

(15.12)

DE LAS ECUACIONES DE MOVIMIENTO COMO PROBLEMA DE VALORES PROPIOS393


15.2. SOLUCION

15.2.

Soluci
on de las ecuaciones de movimiento como problema de valores
propios

Las Ecs. (15.10) son ecuaciones diferenciales lineales con coeficientes constantes. Como se trata de osciladores acoplados es natural usar una funcion de ensayo de naturaleza arm
onica, por lo cual realizaremos el
siguiente ansatz
(15.13)
i = Cai eit
donde Cai es una amplitud compleja de la oscilaci
on para cada coordenada i , el factor C es un factor de escala
que se introduce por conveniencia y que es igual para todas las coordenadas. Por supuesto se sobreentiende
que es la parte real de (15.13) la que corresponde a la solucion fsica del problema. Sustituyendo (15.13) en
(15.10) se obtiene
C 2 ai Tki eit + Cai Vki eit = 0
Vki ai 2 Tki ai = 0

(15.14)

El sistema (15.14), consiste en un conjunto de n ecuaciones homogeneas para las ai , y por tanto solo tendr
an
soluci
on no trivial si el determinante de los coeficientes se anula


V11 2 T11 V12 2 T12 V13 2 T13


V21 2 T21 V22 2 T22 V23 2 T23


(15.15)
V31 2 T31 V32 2 T32 V33 2 T33 = 0




..
..
..
..

.
.
.
.

esta condici
on secular, que consiste en encontrar las n races i2 del polinomio caracterstico, nos provee de
los valores de las frecuencias para los cuales (15.13) es soluci
on de (15.10). Para cada valor de 2 las Ecs.
(15.14) pueden ser resueltas para las amplitudes ai o m
as exactamente para los cocientes de n 1 amplitudes
con la amplitud restante.
Matricialmente podemos reescribir las Ecs. (15.14) sustituyendo 2 en la forma
Va = Ta

(15.16)

que coincide con la ecuaci


on de valores propios modificada que se estudi
o en la secci
on 12.11 como se puede
2
ver de la Ec. (12.91) . Tenemos adem
as que tanto T como V son matrices simetricas y reales. Por otro lado,
la energa cinetica dada por (15.8) se puede reescribir en forma matricial
1
T = e
T

2

pero la energa cinetica es positiva y solo es cero cuando todas las velocidades son cero, esto nos lleva a conclur
que T es una matriz definida positiva ya que un termino de la forma zTz corresponde a dos veces la energa
cinetica cuando z se interpreta como un vector de velocidades .
Finalmente, la condici
on de que el potencial
se este evaluando en un mnimo local nos lleva a la condicion
i Vij j 0 V 0
de modo que la matriz V es positiva. Como consecuencia se cumplen todas las hip
otesis establecidas en la
secci
on 12.11 es decir tenemos una ecuaci
on de valores propios modificada de la forma (15.16) donde T y V
son matrices reales y simetricas, siendo T definida positiva y V positiva. En dicha secci
on se concluy
o que
bajo estas hip
otesis
2

Similarmente, (15.15), corresponde a la ecuaci


on secular modificada (12.108).

CAPITULO 15. OSCILACIONES

394

1. Los valores propios son reales no negativos: en este contexto, significa que 2 es positivo y por lo tanto
las frecuencias son reales. De la Ec. (12.100) se puede ver claramente que si V no fuera positiva (i.e.
no estuvieramos en un mnimo local del potencial) entonces es posible que sea negativo y por lo tanto
sera imaginario. Por otro lado, se puede ver que introducir un imaginario en el ansatz (15.13)
producira movimiento no acotado en i con el tiempo. Este movimiento sera obviamente inestable con
lo cual se ve desde otro punto de vista, que la estabilidad requiere un mnimo de potencial.
2. Las componentes de los autovectores a son reales, excepto por una posible fase global: En nuestro
contexto, vemos que una fase compleja en la amplitud se puede absorber en el factor C de la Ec. (15.13),
de modo que la posibilidad de a complejo resulta a
un m
as irrelevante.
3. Los autovectores a correspondientes a valores propios diferentes son ortogonales bajo la metrica definida
por T. En este caso, si interpretamos a z como un vector cuyas componentes son velocidades generalizadas
podemos decir que la norma al cuadrado inducida para z viene dada por dos veces la energa cinetica
zTz T
= 2T = kzk2

kzk =
2T
la ortogonalidad con la metrica T est
a definida por la propiedad (12.102). Si queremos normalizar los
vectores propios debemos imponer una condici
on de normalizaci
on de la forma (12.103), recordando que
ambas ecuaciones se sintetizan en la Ec. (12.104)
e
ATA
=1

(15.17)

siendo A la matriz de vectores propios ortonormales bajo la metrica T.


4. La matriz de autovectores ortonormales A diagonaliza tanto a T como a V a traves de una transformaci
on
de congruencia. T se diagonaliza a la identidad Ec. (15.17) y V se diagonaliza a una matriz diagonal en
donde los valores propios yacen en la diagonal.

AVA = ; diag 12 , 22 , ..., n2
retomando la Ec. (12.100) en nuestro contexto tenemos que
k2


e
a(k) Va(k)
2V a(k)

=
=
e
a(k) Ta(k)
2T a(k)

el denominador es dos veces la energa cinetica con velocidades generalizadas ai(k) , en tanto que el
numerador es dos veces la energa potencial asociada a coordenadas ai(k) . Insistimos nuevamente en que
la positividad del numerador est
a asociada con el hecho de que la energa potencial est
a evaluada en un
mnimo local.
Finalmente recordemos que la transformaci
on de congruencia que diagonaliza a T y V se puede interpretar
como el paso desde un sistema de ejes inclinados no cartesianos a un conjunto de ejes principales cartesianos.
El proceso total de obtenci
on de las frecuencias fundamentales de peque
nas oscilaciones es un tipo particular
de transformaciones a ejes principales (que diagonaliza a V) que tambien involucran una transformaci
on del
3
tensor metrico (desde T hasta la identidad que es el tensor metrico cartesiano ).

15.2.1.

Un ejemplo con dos grados de libertad

A manera de ejemplo, pensemos en una partcula de masa m con dos grados de libertad (x1 , x2 ) para la
cual el Lagrangiano viene dado por (15.9)
L=
3

 1
1
m x 21 + x 22 Vij xi xj
2
2

Estrictamente hay que definir x0i = xi mi para que el tensor metrico (tensor cinetico) sea de la forma Tij = ij .

DE LAS ECUACIONES DE MOVIMIENTO COMO PROBLEMA DE VALORES PROPIOS395


15.2. SOLUCION
donde las Vij son constantes. Como las coordenadas son cartesianas podemos normalizar al tensor T como
on de valores propios modificada (12.91), se convierte en la ecuaci
on de
Tij = ij . De modo que la ecuaci
valores propios ordinaria Ec. (12.39). La transformaci
on de congruencia (12.107) tiene soluciones solo cuando
se satisface la relaci
on (12.109), que en dos dimensiones se escribe


V11
V12

=0
V21
V22
que resulta en una ecuaci
on cuadr
atica para con soluciones


q
1
2
1,2 =
V11 + V22 (V11 V22 ) + 4V12 V21
2

(15.18)

asociado a los valores propios i hay asociados vectores propios a(i) . Denotamos la jesima componente del
iesimo vector en la forma aji . El vector propio a(i) se define con





a1i
a1i
V11 V12
= i
V21 V22
a2i
a2i




a1i
V11 a1i + V12 a2i
= i
V21 a1i + V22 a2i
a2i


V11 a1i + V12 a2i i a1i
= 0
V21 a1i + V22 a2i i a2i
para i = 1 queda
V11 a11 + V12 a21 1 a11 = 0

(15.19)

V21 a11 + V22 a21 1 a21 = 0

(15.20)

similarmente se pueden escribir las expresiones para i = 2


V11 a12 + V12 a22 2 a12 = 0

(15.21)

V21 a12 + V22 a22 2 a22 = 0

(15.22)

solo una del par de ecuaciones para cada i es linealmente independiente, tomemos las Ecs. (15.19) y (15.22) y
asumiendo suma sobre j pero no sobre i reescribimos estas ecuaciones en la forma
Vij aji i aii = 0

(15.23)

reescribiendo la Ec. (15.23) y usando la condici


on de normalizaci
on de los autovectores4 escribimos
aji (Vij i ij ) = 0 ; a21i + a22i = 1 ; i = 1, 2 ; suma sobre j no sobre i

(15.24)

consideremos dos casos lmites


Primer caso: Asumimos V11 > V22 > 0 y 0 6= V21 = V12 << (V11 V22 ). Con estas condiciones podemos
definir un par
ametro peque
no de la forma
V12

(V11 V22 )
escribiendo los autovalores (15.18) en terminos de
1,2 =
1,2 =
1,2
=
4

2
4V12
V11 + V22 (V11 V22 ) 1 +
(V11 V22 )2

p
1
V11 + V22 (V11 V22 ) 1 + 42
2

1
V11 + V22 (V11 V22 ) 1 + 22
2

1
2

recordemos que la normalizaci


on se hace de acuerdo con la metrica impuesta por T. Pero al ser las cooordenadas cartesianas,
esta se reduce a la metrica Eucldea.

CAPITULO 15. OSCILACIONES

396


1
V11 + V22 (V11 V22 ) 22 (V11 V22 )
2

1
(V11 V22 )
2

1,2 =
V11 + V22 (V11 V22 ) 2 V12
2
V12


1
1
2

1,2 =
V11 + V22 (V11 V22 ) 2 V12
2

1
[V11 + V22 (V11 V22 ) 2V12 ]
1,2
=
2
los valores propios quedan finalmente
1
= V11 + V12 ; 2
= V22 V12
1,2
=

(15.25)

veamos como quedan los autovectores a primer orden en . Para ello reemplacemos (15.25) en la Ec. (15.19)
V11 a11 + V12 a21 (V11 + V12 ) a11 = 0
V12 a21 V12 a11 = 0

a21 = a11

(15.26)

junto con la condici


on de normalizaci
on


a211 + a221 = 1 a211 + (a11 )2 = 1 a211 1 + 2 = 1
s
1
1

a11 =
= 1 2
2
(1 + )
2

(15.27)

donde hemos tomado la raz positiva, recuerdese que a


un con la condici
on de normalizaci
on, hay una ambig
uedad en el vector propio concerniente al sentido de dicho vector. El vector propio normalizado asociado a
1 se obtiene entonces de (15.27) y (15.26) y se escribe como

 

a11
1 12 2
a(1) =
=
a21
12 3
reemplazando (15.25) en (15.22) y con un procedimiento an
alogo se obtiene el vector propio asociado a 2

 

a12
+ 12 3
a(2) =
=
a22
1 12 2
la matriz asociada a los vectores propios se escribe como

 

a11 a12
1 12 2 + 12 3
A=
=
a21 a22
12 3 1 12 2

(15.28)

que nos da las relaciones (v


alidas a primer orden en )
a11 = a22 ; a12 = a21

(15.29)

Segundo caso: Examinemos el caso en el cual V12 > V22 > 0 y (V11 V22 ) << V12 = V21 . En este
caso un par
ametro conveniente es = (V11 V22 ) /8V12 que es una cantida peque
na. A primer orden en los
autovalores y autovectores est
an descritos por
1
1 =
(V11 + V22 ) + V12 + (V11 V22 )
2
1
2 =
(V11 + V22 ) V12 (V11 V22 )
2
!
1 (1 + 2) 1 (1 2)
2
2
A=
(15.30)
1 (1 2)
1 (1 + 2)
2
2
en este caso tambien se cumplen las relaciones (15.29), aunque los valores numericos difieren fuertemente. En
la primera matriz los valores fuera de la diagonal son de orden en tanto que los diagonales
son de orden 1.

En cambio, los elementos de la matriz en el segundo caso son todos de l orden de 1/ 2.


15.3. PROBLEMA DE VALORES PROPIOS CON DEGENERACION

15.3.

397

Problema de valores propios con degeneraci


on

Ya mencionamos que en el caso en el cual existe degeneraci


on hay m
as grados de libertad disponibles para
crear los vectores propios. Los vectores propios posibles escogidos no es de esperarse que sean ortogonales entre
s. No obstante, siempre es posible construr un conjunto de vectores propios ortogonales entre s, con base
en los vectores previamente elegidos. Estos vectores ortogonales se pueden entonces usar para construr una
matriz ortogonal A.
Vamos a considerar por simplicidad el caso de una doble raz. Sean a0(k) y a0(l) un cierto par de vectores
propios asociados a una raz doble . Asumiremos que estos vectores ya han sido normalizados seg
un (12.103)
0
0
i.e. normalizados seg
un la metrica T. Cualquier combinaci
on lineal entre ak y al tambien ser
a un autovector
correspondiente a la raz . Construmos entonces un vector al en la forma
al = c1 a0k + c2 a0l

(15.31)

donde c1 , c2 son constantes elegidas de tal forma que al sea ortogonal a a0k . Multiplicando ambos miembros
de (15.31) por Ta0k y usando las condiciones de ortogonalidad (12.102) y (12.103) se obtiene
e
al Ta0k = c1 e
a0k Ta0k + c2 e
a0l Ta0k = 0
e
al Ta0k = c1 + c2 e
a0l Ta0k = 0

con lo cual se obtiene el cociente entre las constantes

c1
= e
a0l Ta0k l
c2

(15.32)

un (12.103), tenemos una condici


on adicional sobre tales consrequiriendo adem
as que al este normalizado seg
tantes
e
al Tal = 1 = c21 + c22 + 2c1 c2 l
(15.33)

las condiciones (15.32) y (15.33) fijan a c1 y c2 en forma casi unvoca5 . Hemos formado entonces el conjunto
as son ortogonales a los otros vectores propios correspondientes a valores
ortonormal al y ak = a0k . Estos adem
propios diferentes, lo cual ya se ha demostrado. De esta forma ya tenemos un conjunto de n autovectores aj
cuyas componentes pueden formar la matriz A que diagonaliza simult
aneamente a T y a V.
Este procedimiento constituye un caso particular del llamado proceso de ortogonalizaci
on de Gram-Schmidt.
Cuando tenemos una raz de multiplicidad m, los vectores ortonormalizados se forman por combinaciones lineales de una conjunto original de vectores propios linealmente independientes a01 , . . . , a0m . El conjunto ortonormal
a1 , . . . , am se forma de la siguiente forma: el primero se elige igual a un m
ultiplo (normalizado) de a01 ; a2 se
0
0
toma como una combinaci
on lineal de a1 y a2 y as sucesivamente. Con este algoritmo, el n
umero de constantes
1
a determinar equivale a la suma de los primeros m n
umeros i.e. 2 m (m + 1). Las condiciones de normalizaci
on
nos dan m condiciones, junto con 12 m (m 1) condiciones de ortogonalidad, de esta forma los vectores quedan
definidos casi unvocamente excepto por sus sentidos pues si se cambia ak por ak el nuevo vector sigue siendo
ortogonal a los otros y normal, esto est
a relacionado con el hecho de que las condiciones de normalizaci
on son
cuadr
aticas e invariantes ante una cambio de signo en todas las componentes de un vector dado. Finalmente,
cabe destacar que este conjunto ortogonal no es en general u
nico.
Recordemos adem
as que en general la degeneraci
on est
a ligada con alguna simetra, por ejemplo en el caso
de matrices 3x3 (como el tensor de inercia), la indeterminaci
on en las componentes de los autovectores para
una raz doble indican que todos los vectores en un cierto plano son vectores propios, con lo cual basta elegir
dos vectores perpendiculares en dicho plano para formar ejes principales, y los vectores en A son vectores
normalizados que van a lo largo de tales ejes.
5

Recordemos que el cambio ci ci para ambas constantes tambien satisface ambas ecuaciones, es decir el sentido del vector
queda a
un ambig
uo.

CAPITULO 15. OSCILACIONES

398

15.3.1.

Un ejemplo bidimensional con degeneraci


on

Un caso muy simple que ilustra las caracterstica enunciadas para el problema degenerado, consiste en el
ejemplo bidimensional dado en la secci
on (15.2.1). Este ejemplo presenta degeneraci
on cuando la matriz del
potencial cumple las condiciones
V11 = V22 V0 ,

V12 = 0 1 = 2 = V0

como un paso al lmite podemos analizar el problema de dos formas


a) Tomando el lmite V12 0, para luego tomar el lmite V11 V22 . En este caso los autovectores en
(15.28) quedan de la forma
 
 
1
0
; a2 =
(15.34)
a1 =
0
1
b) Tomando el lmite V11 V22 para luego tomar el lmite V12 0, en este caso la Ec. (15.30) nos da los
vectores propios
!
!
1
1

2
2
b1 =
; b2 =
(15.35)
1
1
2

cada par de autovectores es combinaci


on lineal del otro i.e.
1
1
b1 = (a1 + a2 ) ; b2 = (a2 a1 )
2
2
n
otese que ambos pares de vectores (15.34) y (15.35) poseen la estructura generica




c1
c2
; c2 =
c1 =
c2
c1

(15.36)

de modo que los anteriores resultados se generalizan para pares de vectores propios con la estructura (15.36).
Por tanto, los vectores propios est
an determinados por cualquier par de n
umeros c1 y c2 que formen la estructura
(15.36) y cumplan la condici
on de normalizaci
on definida en (12.103). Esto nos muestra que hay un conjunto
infinito de pares de vectores propios normalizados y linealmente independientes en el caso en que hay presencia
de degeneraci
on.
Existe otra forma de ver los resultados anteriores. N
otese que los autovectores aproximados dados por
(15.28) corresponden al caso en el cual los terminos principales de la energa potencial V11 y V22 , est
an sobre
la diagonal en tanto V12 est
a en las posiciones fuera de la diagonal. Si tomamos los autovectores de las Ecs.
(15.30) en el lmite 0 y hacemos que los autovectores (15.30) transformen a V seg
un la prescripci
on
0
e
V = AVA, obtenemos el tensor de energa potencial transformado
 1

1
(V
+
V
)
+
V
(V

V
)
11
22
12
11
22
0
2
2
V =
1
1
2 (V11 V22 )
2 (V11 + V22 ) V12
en el cual el termino diferencia (V11 V22 ) est
a fuera de la diagonal. En consecuencia, el conjunto de autovectores dados por las Ecs. (15.30) corresponden a la situaci
on fsica en la cual el peque
no termino de energa
(V11 V22 ) est
a fuera de la diagonal.

15.4.

Frecuencias de vibraci
on libre y coordenadas normales

Hemos visto que con los valores adecuados de las constantes, la expresi
on (15.13) representa una soluci
on
consistente para las ecuaciones de movimiento (15.10) asociadas a peque
nas oscilaciones. Sin embargo, esta no
es necesariamente la soluci
on m
as general del problema ya que no ha tenido en cuenta las condiciones iniciales.
Por otro lado, en virtud de la linealidad de la Ec. (15.10) se observa inmediatamente que una superposici
on
de soluciones de tal ecuaci
on es tambien una soluci
on. Combinando este hecho con el teorema matem
atico que

LIBRE Y COORDENADAS NORMALES


15.4. FRECUENCIAS DE VIBRACION

399

nos dice que las funciones ein t son completas en un intervalo acotado (teorema de Fourier) podemos deducir
que la soluci
on m
as general a las Ecs. (15.10) consiste en una superposici
on de soluciones de la forma (15.13).
Por tanto, si el sistema se desva ligeramente del equilibrio es posible que realice oscilaciones alrededor de
on a las soluciones de la ecuaci
on secular se
cualquiera de las frecuencias permitidas 1 , . . . , n . Por esta raz
les conoce usualmente como frecuencias de vibraci
on libre o frecuencias de resonancia del sistema.
Escribamos entonces la soluci
on general como superposici
on de soluciones del tipo (15.13), representada
como una suma sobre el ndice k
i = Ck aik eik t
(15.37)
donde Ck es un factor complejo asociado a cada frecuencia de resonancia k . Podra objetarse que para cada
soluci
on k de la ecuaci
on secular tanto k como k son frecuencias de resonancia ya que ambas est
an
asociadas al mismo vector propio ak pero los factores de escala para cada frecuencia denotados por Ck+ y Ck
podran ser en general diferentes. Con esta argumentaci
on la soluci
on debe escribirse como

(15.38)
i = aik Ck+ eik t + Ck e+ik t

recordemos sin embargo que el movimiento fsico est


a descrito por la parte real de la soluci
on compleja planteada, y la parte real de cualquiera de las dos ecuaciones (15.37) o (15.38) se puede escribir en la forma
i = fk aik cos (k t + k )

(15.39)

donde las amplitudes fk y fases k se determinan a partir de las condiciones iniciales. Por tanto cualquiera
de las soluciones (15.37, 15.38, 15.39) puede representar al movimiento fsico. Tomaremos entonces la m
as
conveniente para nuestros prop
ositos Ec. (15.37). N
otese que en la Ec. (15.37), la fase del movimento real k
esta contenida en la fase compleja de Ck , en tanto que la magnitud de Ck estara relacionada con la amplitud
asociada a cada frecuencia k .
Los factores de escala Ck se pueden determinar f
acilmente gracias a las propiedades de ortogonalidad de
A. En el tiempo t = 0 la parte real de (15.37) se reduce a
i (0) = aik ReCk

(15.40)

donde hemos tenido en cuenta que los elementos de A son reales. Para las velocidades generalizadas i se
obtiene una expresi
on an
aloga. Derivando (15.37) y evaluando la parte real de la soluci
on en t = 0
i = ik Ck aik eik t ; Re i (0) = k aik Re (iCk )

Re i (0) = k aik Re [i (ReCk + i ImCk )]


i (0) = k aik ImCk

(15.41)

las 2n ecuaciones (15.40) y (15.41) nos permiten evaluar las n partes reales y n partes imaginarias a partir de
las condiciones iniciales6 . Para resolver (15.40) es m
as conveniente escribir dicha ecuaci
on en notaci
on matricial
(0) = A ReC
e y usando (12.104) se obtiene la soluci
multiplicando a la izquierda por el factor AT
on para ReC
e
ReC = AT
(0)

ReCl = ajl Tjk k (0)

(15.42)

similarmente, se obtiene para la parte imaginaria de C


ImCl =

1 X
ajl Tjk k (0)
l

(15.43)

j,k

Estrictamente, las Ecs. (15.40) y (15.41) deberan contener <i (0) y < i (0) a la izquierda de estas expresiones. Sin embargo,
asumimos que las condiciones iniciales son reales y por ello dicha notaci
on no es necesaria.

CAPITULO 15. OSCILACIONES

400

Las Ecs. (15.42) (15.43), permiten calcular directamente los factores complejos (y por tanto las amplitudes y
fases) en terminos de las condiciones iniciales y las matrices A y T.
La soluci
on para cada coordenada dada por (15.37) es en general una suma de oscilaciones arm
onicas
simples en todas las frecuencias k que satisfacen la ecuaci
on secular. A menos que todas las frecuencias
sean conmesurables, el conjunto de todas las i no retornan en general a sus valores iniciales en ning
un
on peri
odica simple del tiempo7 .
instante posterior, esto significa que la configuraci
on de las i no es una funci
No obstante, la condici
on de ortogonalidad de A nos permite encontrar a partir de las i un conjunto de
coordenadas generalizadas i que son todas funciones peri
odicas en el tiempo. A este conjunto de coordenadas
generalizadas las llamaremos coordenadas normales. Partiendo de (15.37) y multiplicando por a1
ni a ambos
lados
1
ik t
a1
= nk Ck eik t
ni i = ani aik Ck e
in t
a1
ni i = Cn e

n
otese que el resultado de la derecha en la u
ltima ecuaci
on depende solo de la frecuencia n y de su correspondiente factor de escala Cn ; es por tanto natural definir las nuevas coordenadas generalizadas en la forma
in t
a1
ni i n n = Cn e

(15.44)

la relaci
on inversa ser
a
amn a1
ni i = amn n mi i = amn n
m = amn n

(15.45)

matricialmente se escribe
= A

(15.46)

comparando con el procedimiento de la secci


on 12.11.1, Ecs. (12.110), (12.111), vemos que las coordenadas i
son precisamente las que diagonalizan la forma cuadr
atica positiva, que en nuestro contexto est
a asociada con
el potencial
1
V = eV
(15.47)
2
por tanto podemos tomar el resultado (12.112) para escribir
1e
1
V =
= k2 k k
2
2

(15.48)

la energa cinetica es una forma cuadr


atica definida positiva que se escribe como
1
T = e
T

2

(15.49)

Es
comparando con la Ec. (12.110) vemos que y la coordenada normal asociada es simplemente .
decir que en este caso las coordenadas normales asociadas a la matriz definida positiva se obtienen simplemente
derivando temporalmente (15.46)8
= A
(15.50)
y la forma cuadr
atica para la energa ci
netica se obtiene de (12.113)

1 e
1
T =
= i i
2
2

(15.51)

Si las coordenadas generalizadas i son todas funciones peri


odicas simples en el tiempo, esto implicara que la trayectoria en
el espacio de fase es cerrada como vimos en el movimiento peri
odico de libraci
on en el captulo de Hamilton Jacobi.
8
Recordemos que en el caso m
as general, el conjunto de coordenadas normales asociadas a la matriz positiva es totalmente
independiente del conjunto de coordenadas normales asociadas a la matriz definida positiva, como se aprecia en la secci
on 12.11.1.

15.5. VIBRACIONES LIBRES DE UNA MOLECULA


TRIATOMICA

401

Usando (15.48) y (15.51) podemos construir el Lagrangiano y las Ecuaciones de movimiento en coordenadas
normales

1 
2 2
L =
k k k k
2
k + k2 k = 0

(15.52)
(15.53)

las soluciones de (15.53) son inmediatas


k = Ck eik t

(15.54)

en concordancia con (15.44). Cada una de estas nuevas coordenadas es entonces una funci
on periodica simple
del tiempo que involucra a una sola frecuencia de resonancia.
Cada coordenada normal corresponde a una vibraci
on del sistema con una sola frecuencia y estas oscilaciones componentes suelen denominarse modos normales de vibraci
on. Todas las partculas en cada modo vibran
9
con la misma frecuencia y la misma fase . Las amplitudes relativas est
an dadas por los elementos de matriz
aij . Finalmente, los modos normales se deben superponer para formar la soluci
on fsica, cada modo contribuye
con un peso es decir con cierta amplitud relativa y fase contenidos en Ck .
Los arm
onicos de frecuencias fundamentales est
an ausentes en el movimiento completo b
asicamente debido
a la estipulaci
on de que la oscilaci
on del movimiento sea peque
na. Podemos entonces representar el potencial
como una forma cuadr
atica, la cual es caracterstica del movimiento arm
onico simple. La transformaci
on a
coordenadas normales enfatiza este hecho puesto que el Lagrangiano en tales coordenadas se puede escribir
como la suma de lagrangianos desacoplados correspondientes a osciladores arm
onicos de frecuencias k (ver
Ec. 15.52). Por lo tanto, podemos considerar que el movimiento completo para peque
nas oscilaciones se puede
obtener excitando los osciladores arm
onicos con diferentes intensidades y fases. Este punto de vista es muy
u
til en mec
anica cu
antica, por ejemplo para la cuantizaci
on del campo electromagnetico. Las frecuencias de
los osciladores arm
onicos se identifican con las frecuencias de los fotones y las amplitudes de excitaci
on se
convierten en los n
umeros de ocupaci
on discretos y cuantizados, i.e. el n
umero de fotones para cada frecuencia.
Caso similar se presenta en el estudio de otras excitaciones colectivas que se pueden desacoplar en sumas de
osciladores arm
onicos tales como las redes de fonones y magnones en la Fsica del estado s
olido.

15.5.

Vibraciones libres de una mol


ecula triat
omica

Ilustraremos la obtenci
on de los modos normales de oscilaci
on considerando el caso de una molecula
triat
omica lineal, la cual en estado de equilibrio consiste de dos masas m en los extremos y una masa M
en el centro, la distancia entre cada masa m y la masa M se denota por b. Todos los atomos est
an en lnea
recta como lo indica la figura ????. Por simplicidad asumiremos que solo hay vibraciones longitudinales y el
potencial interatomico se aproximar
a a aquel equivalente a dos resortes acoplados identicos que unen a la masa
M con las dos masas m. Esta aproximaci
on est
a justificada siempre que haya peque
nas oscilaciones alrededor
del equilibrio. No obstante, este modelo hace implcitamente una aproximaci
on adicional, ya que se desprecia
la interacci
on entre las masas m. De acuerdo con la Figura ???, la energa potencial se puede escribir en la
forma
k
k
V = (x2 x1 b)2 + (x3 x2 b)2
2
2
introducimos entonces las coordenadas relativas a la posici
on de equilibrio
i = xi x0i
donde claramente se ve que
x02 x01 = b = x03 x02
9

Las partculas pueden estar tambien en total antifase si las a0 s poseen signos contrarios.

CAPITULO 15. OSCILACIONES

402
La energa potencial en estas coordenadas se escribe como
V

k
k
(2 1 )2 + (3 2 )2
2
2

k 2
1 + 222 + 32 21 2 22 3
2

(15.55)
(15.56)

para construr la matriz asociada a V definimos

1
V i Vij j
2

(15.57)

comparando (15.56) con (15.57) y escribiendo los terminos de tal modo que Vij sea simetrico, el tensor V se
escribe de la forma

k k 0
V = k 2k k
(15.58)
0 k k
la energa cinetica en estas coordenadas tiene la forma
T =
de modo que el tensor T es diagonal

 M 2
m 2
1 + 32 +

2
2 2

m 0

T=
0 M
0 0

(15.59)

0
0
m

(15.60)

con base en los tensores (15.58) y (15.60) la ecuaci


on secular queda

k 2m
k
0



2
2
V T =
k
k
2k M


0
k
k 2m

que nos da el polinomio c


ubico caracterstico para 2


2 k 2 m k (M + 2m) 2 M m = 0




=0

cuyas soluciones son inmediatas

1 = 0, 2 =

k
, 3 =
m

k
m

2m
1+
M

(15.61)

el primer valor propio 1 = 0 puede ser sorprendente e incluso alarmante a priori ya que no correspondera a
un movimiento oscilatorio, sino a la soluci
on de una ecuaci
on de la forma
1 = 0
que describe un movimiento traslacional uniforme a lo largo del eje de la molecula (dado que solo estamos
permitiendo movimiento longitudinal). Pero precisamente hay que tener en cuenta que la traslaci
on rgida de la
molecula a lo largo de su eje no produce ning
un cambio en la energa potencial, este es un ejemplo del equilibrio
indiferente que ya hemos comentado. Este modo de frecuencia nula corresponde entonces a una traslaci
on rgida
de la molecula, pues no hay fuerza restauradora asociada a este movimiento. Hemos hecho la suposici
on de que
la molecula posee tres grados de libertad para el movimiento vibracional, pero en realidad uno de ellos es un
grado de libertad asociado a este movimiento rgido. Otro aspecto interesante de las frecuencias de resonancia
nulas se puede ver a traves de la Ec. (12.100) que un valor nulo de solo se puede obtener si la energa

15.5. VIBRACIONES LIBRES DE UNA MOLECULA


TRIATOMICA

403

potencial es positiva pero no definida positiva (i.e. positiva si y solo si todos los i son cero)10 . La Ec. (15.55),
muestra efectivamente que la condici
on necesaria y suficiente para que V sea nulo es que 1 = 2 = 3 , la cual
efectivamente corresponde a traslaci
on rgida de la molecula.
Por otro lado, si relajamos la condici
on de movimiento longitudinal (que solo nos da un grado de libertad
traslacional) y permitimos vibraciones en todas las tres direcciones el n
umero de grados de libertad de traslaci
on
rgida se incremente a 6 ya que la molecula podr
a moverse a lo largo de los tres ejes o realizar rotaciones
uniformes alrededor de tales ejes. Por lo tanto, en un sistema general de n grados de libertad habr
a 6 frecuencias
nulas y solo n 6 frecuencias verdaderas de vibraci
on.
Adem
as de la traslaci
on o rotaci
on rgida, existe una condici
on adicional bajo la cual ocurren frecuencias
nulas y es el caso en el cual tanto la primera como la segunda derivada del potencial se anulan en la posici
on
de equilibrio. En este escenario k = 0 (no hay termino cuadr
atico en la expansi
on de Taylor del potencial) y
a
un son posibles peque
nas oscilaciones si la cuarta derivada es no nula (la tercera debe ser nula para que haya
equilibrio estable). No obstante, en este caso la oscilacion no ser
a de tipo arm
onico pues el primer termino
no nulo en la expansi
on del potencial ser
a de orden cu
artico, el caso m
as simple es un potencial de la forma
nas oscilaciones diferente
V = ax4 con a positivo, siendo x = 0 el punto de equilibrio. Este es un caso de peque
a la aproximaci
on arm
onica usual, pero no se presenta con mucha frecuencia.
De la discusion anterior se ve entonces que las frecuencias nulas de resonancia no tienen ninguna incidencia
en el estudio de los modos vibracionales. Una forma de remover los modos traslacionales (aunque no los
rotacionales) es imponer la condici
on de que el centro de masa permanezca estacionario en el origen (para lo
cual uso el sistema de referencia adecuado)
m (x1 + x3 ) + M x2 = 0

(15.62)

esta ecuaci
on se puede usar para eliminar coordenadas en V y T .
Volvamos ahora al examen de los modos vibracionales reales. La frecuencia de resonancia 2 descrita en
(15.61), se reconoce como la frecuencia de oscilaci
on de una masa suspendida por un resorte de constante k
atado a un soporte fijo. En consecuencia, es de esperarse que los atomos de los extremos sean los que esten
vibrando en tanto que el atomo del centro est
a en reposo con el fin de que sirva como soporte fijo para los
resortes. Solo en el tercer modo de vibraci
on 3 la masa central M participa de la vibraci
on en el movimiento
oscilatorio. Estas predicciones se pueden verificar encontrando los vectores propios asociados a cada modo de
vibraci
on.
Las componentes aij de la matriz A de los vectores propios se obtiene para cada frecuencia a traves de las
ecuaciones


k j2 m a1j
ka2j
= 0


ka1j
+ 2k j2 M a2j
ka3j
= 0
(15.63)


ka2j
+ k j2 m a3j = 0
que junto con la ecuaci
on de normalizaci
on


m a21j + a23j + M a22j = 1 ; j = 1, 2, 3

(15.64)

determina a los vectores propios excepto por un signo. Con 1 = 0 se obtiene de la primera y tercera de las
Ecs. (15.63) que todos los coeficientes ak1 son iguales. Este hecho junto con la condici
on de normalizaci
on
(15.64) nos fija el valor de ak1
1
a11 = a21 = a31 =
(15.65)
2m + M
la igualdad de los ak1 era de esperarse en virtud de la naturaleza traslacional del movimiento asociado.
10

Si la energa potencial fuera definida positiva entonces = 0 solo podra corresponder a la situaci
on trivial de reposo de todas
las partculas en sus posiciones de equilibrio.

CAPITULO 15. OSCILACIONES

404


Para el segundo modo tomando el 2 de (15.61) vemos que k 22 m se anula y las ecuaciones (15.63)
muestran que a22 = 0 como se haba anticipado y a12 = a32 . Nuevamente estas relaciones junto con la
condici
on de normalizaci
on (15.64) nos determinan el segundo vector propio
a12 =

1
1
; a22 = 0 ; a32 =
2m
2m

(15.66)

en este modo el atomo central est


a en reposo en tanto que los atomos de los extremos vibran en antifase (o
contrafase), lo cual es necesario para que haya conservacion del momento lineal.
Finalmente, para 3 se obtiene que a13 = a33 . Los vectores propios normalizados son
a13 = a33 = q

1
2m 1 +

 ; a23 = q
2m
M

2
2M 2 +

M
m

(15.67)

en este tercer modo los atomos de los extremos vibran con la misma amplitud, y en fase en tanto que el atomo
central vibra en antifase con respecto a los otros y tiene diferente amplitud. Los tres modos de vibraci
on
longitudinal se muestran en la figura ???.
Con base en las Ecs. (15.65, 15.66, 15.67) se construye la matriz A de vectores propios, y usando (15.46)
hallamos las coordenadas normales i
e
= A1 = A
donde hemos usado la condici
on de ortogonalidad de A. Explcitamente las coordenadas normales quedan
1

(m1 + M 2 + m3 )
2m + M
r
m
=
(1 3 )
2
s
mM
=
[(1 + 3 ) 22 ]
2 (2m + M )

1 =
2
3

cualquier vibracion longitudinal de la molecula que no involucre traslaci


on rgida ser
a una combinaci
on lineal
de los modos asociados a 2 y 3 . Las amplitudes de los modos normales, as como las fases relativas, estar
an
determinadas por las condiciones iniciales.
Hasta el momento nos hemos limitado al estudio de las vibraciones longitudinales. El caso m
as general
en el cual se consideran vibraciones transversales es m
as complicado matem
aticamente ya que el movimiento
general involucra 9 grados de libertad, por tanto solo haremos un an
alisis cualitativo de dicho movimiento.
En primer lugar, el n
umero de modos con frecuencia cero nos va a dar los grados de libertad asociados al
movimiento como cuerpo rgido, en consecuencia habr
a 6 grados de libertad asociados a tales frecuencias sin
importar el n
umero de atomos de la molecula, es decir 3n 6 modos vibracionales para una molecula de n
atomos.
En el caso de una molecula lineal habr
a tres grados de libertad de traslaci
on pero solo dos grados de libertad
de rotaci
on rgida, puesto que una rotaci
on alrededor del eje de la molecula no es relevante y no aparecer
a como
un modo de rotaci
on rgida. Esto implica que tendremos cuatro grados de libertad asociados a la vibraci
on:
2 de las vibraciones longitudinales como ya vimos, y otros dos asociados a vibraciones perpendiculares al
eje (transversales). No obstante, la simetra axial de la molecula nos dice que los dos modos vibracionales
transversales deben ser degenerados. No hay nada que distinga a una vibraci
on a lo largo de cualquier eje
perpendicular a la lnea de la molecula, por lo cual las frecuencias asociadas deben ser identicas.
La indeterminaci
on de los autovectores inherentes a los modos degenerados se refleja en el hecho de que
todas las direcciones perpendiculares al eje de la molecula son equivalentes, cualquier par ortogonal de ejes
que yace en el plano perpendicular a tal eje se pueden escoger como las direcciones de los modos normales
de vibraci
on. El movimiento transversal depende de las amplitudes y fases de estos modos degenerados. Por
ejemplo, si ambos modos est
an presentes y en fase los atomos se mover
an en lnea recta pasando a traves de

15.6. VIBRACIONES FORZADAS Y AMORTIGUADAS

405

la configuraci
on de equilibrio. Pero si est
an en antifase, el movimiento compuesto producir
a una elipse que
corresponde a una figura de Lissajous, tal como ocurre con el oscilador arm
onico bidimensional isotr
opico.
Esto significa que los dos modos representan una rotaci
on mas que una vibraci
on.
La simetra tambien nos lleva a que las amplitudes de los atomos de los extremos sean identicas en magnitud.
El c
alculo detallado muestra adem
as que los atomos de los extremos viajan en la misma direcci
on que las figuras
de Lissajous. Por tanto el atomo del centro viaja en direcci
on opuesta con el fin de mantener el centro de masa
en reposo. La figura ??? muestra el movimiento de los atomos en el caso en el.cual los modos degenerados
estan en desfase /2.
Cuando la complejidad de la molecula crece, la complejidad de la ecuaci
on secular aumenta significativamente. No obstante, en muchos casos las simetras de la molecula han jugado un papel simplificador fundamental a
traves de la teora de grupos, gracias a la cual es a veces posible factorizar la ecuaci
on secular en bloques m
as
peque
nos que se pueden diagonalizar por separado para encontrar las amplitudes y las frecuencias normales del
sistema. Estos metodos encuentran importantes aplicaciones en espectroscopa infraroja y en espectroscopa
Raman.

15.6.

Vibraciones forzadas y amortiguadas

15.6.1.

Vibraciones forzadas

Ocurre con frecuencia que el sistema no se deja oscilar libremente sino que es sometido a alguna fuerza
externa en forma contnua a partir de un cierto tiempo t = 0. Cuando dicha fuerza es tambien de tipo oscilatorio,
el sistema termina vibrando con la frecuencia de la fuerza externa en lugar de su frecuencia natural. No obstante,
las coordenadas normales siguen siendo de gran importancia para la determinaci
on de las amplitudes de la
vibraci
on forzada y contin
ua siendo las coordenadas que desacoplan a las ecuaciones diferenciales como veremos
a continuaci
on.
Si denotamos por Fj a la fuerza generalizada correspondiente a la coordenada j , tenemos que en virtud
de la Ec. (2.9) la fuerza generalizada Qi asociada a la coordenada normal i se escribe como
Qi = aji Fj

(15.68)

en este caso las ecuaciones de movimiento en coordenadas normales se escriben como


i + i2 i = Qi

(15.69)

en este caso las n ecuaciones (15.69) son inhomogeneas y para solucionarlas se debe conocer Qi en funci
on
de tiempo. Vale recalcar que estas ecuaciones para las coordenadas normales aunque inhomogeneas, siguen
estando desacopladas como ya se haba anticipado.
A menudo la fuerza externa es de tipo senoidal como ocurre por ejemplo si el forzamiento lo da una onda
incidente sobre el sistema (mec
anica o electromagnetica), o si el forzamiento lo produce un sistema mec
anico
externo que a su vez tambien est
a vibrando. En otros casos aunque el forzamiento no sea senoidal, se puede
escribir como una superposici
on de componentes senoidales, por ejemplo si el forzamiento es peri
odico se puede
escribir como una serie de Fourier y si no es peri
odico una integral de Fourier podra representar el forzamiento.
Teniendo en cuenta que las ecuaciones (15.69) son lineales las soluciones para frecuencias particulares se pueden
superponer para generar la soluci
on general para Qi dado.
Escribiremos entonces un forzamiento de la forma
Qi = Q0i cos (t + i )

(15.70)

siendo la frecuencia externa de forzamiento, las ecuaciones de movimiento quedan


i + i2 i = Q0i cos (t + i )

(15.71)

de acuerdo con la teora de ecuaciones diferenciales, la soluci


on de (15.71) consta de una soluci
on general de la
ecuaci
on homogenea correspondiente mas una soluci
on particular de la inhomogenea. Por medio de una elecci
on

CAPITULO 15. OSCILACIONES

406

apropiada de condiciones iniciales, es posible hacer que las vibraciones libres superpuestas se cancelen11 , por
lo tanto vamos a centrar nuestra atenci
on en las soluciones particulares de (15.71), teniendo presente que es
de esperarse que el sistema termine oscilando con la frecuencia del forzamiento es natural comenzar con un
ansatz de la forma
i = Bi cos (t + i )
(15.72)
las amplitudes Bi se obtienen sustituyendo este ansatz en (15.71)
Bi =

Q0i
2

i2

(15.73)

la soluci
on para las coordenadas j son
j = aji i =

aji Q0i cos (t + i )


i2 2

(15.74)

de nuevo, la vibraci
on de cada partcula est
a compuesta por una combinaci
on lineal de los modos normales,
pero en este caso cada oscilaci
on normal posee la frecuencia de la fuerza externa.
A partir de (15.74) se puede observar que la excitaci
on de cada modo est
a determinada por la amplitud
2
2
del forzamiento Q0i y por la diferencia i . Si la fuerza sobre cada partcula no tiene componente en la
direcci
on de vibraci
on de alg
un modo normal particular es obvio que la fuerza generalizada asociada a tal
modo ser
a nula i.e. Q0i = 0. En consecuencia, una fuerza externa solo puede excitar un modo normal si tiende
a mover a las partculas en la misma direcci
on que el modo dado. Por otro lado, se puede ver que a medida
as cerca este la
que disminuye la diferencia i2 2 aumenta el valor de la amplitud del modo asociado, entre m
frecuencia natural de un modo dado a la frecuencia externa, mayor ser
a la intensidad de este modo relativo a
los otros. Se puede ver incluso que la ecuaci
on (15.74) predice una divergencia cuando i = (resonancia). Sin
embargo, hay que tener en cuenta que el formalismo que nos llev
o a (15.74) presupone peque
nas oscilaciones
alrededor de la configuraci
on de equilibrio, de modo que cuando la f
ormula predice amplitudes grandes ya no
es v
alida. Finalmente podemos ver que cuando i > (i < ) las oscilaciones est
an en fase (antifase) con la
fuerza externa, es hay un cambio brusco en la fase relativa entre el sistema y el forzamiento cuando pasamos
por la resonancia.

15.6.2.

Vibraciones amortiguadas

En problemas reales de la fsica es muy usual que los sistemas que vibran esten sujetos a fuerzas disipativas
debidas a la interacci
on con sistemas externos. En muchas situaciones, las fuerzas disipativas son proporcionales
a las velocidades de las partculas de tal manera que se pueden generar a traves de una funci
on de disipaci
on
de Rayleigh como la discutida en la secci
on 2.5. De su definici
on Ec. (2.37), z debe ser una funci
on homogenea
de segundo grado en la velocidades
1
z = zij i j
(15.75)
2
los coeficientes zij se pueden definir para que sean simetricos zij = zji , y ser
an en general funciones de las
coordenadas. Dado que estamos interesados solo en peque
nas oscilaciones alrededor del equilibrio, expandiremos
los coeficientes alrededor del equilibrio reteniendo solo el primer termino de la expansi
on de forma an
aloga al
caso de la energa cinetica T . De aqu en adelante la notaci
on zij se refiere a esos factores constantes
zij zij (q01 , . . . , q0n )

(15.76)

recordemos que de acuerdo con la Ec. (5.19), 2z representa la rata de disipaci


on de energa debida a las fuerzas
de fricci
on. Por lo tanto z no puede ser nunca negativa. Las ecuaciones de Lagrange en este caso se pueden
extraer de (2.38)
Tij j + zij j + Vij j = 0
(15.77)
11
Las vibraciones libres son b
asicamente los transientes generados por la aplicaci
on de la fuerza externa. Si consideramos que el
sistema est
a inicialmente en la configuraci
on de equilibrio y que la fuerza crece desde cero en forma contnua, estos transientes no
aparecen. Alternativamente, las fuerzas disipativas cuando est
an presentes amortiguan las oscilaciones libres.

15.6. VIBRACIONES FORZADAS Y AMORTIGUADAS

407

Se puede ver que si queremos encontrar coordenadas normales en donde las ecuaciones (15.77) desacoplen,
es necesario encontrar ejes principales de transformaci
on en los cuales las tres formas cuadr
aticas T, V y z
se diagonalicen simult
aneamente. Sin embargo, esto no es posible en el caso m
as general y solo se pueden
encontrar coordenadas normales para ciertos tipos de funciones de disipaci
on (ver secci
on 12.11.1).
Uno de los casos en los cuales es posible encontrar coordenadas normales es aquel en el cual la fuerza de
fricci
on es proporcional tanto a la velocidad de las partculas como a su masa, en tal caso z ser
a diagonal
siempre que T sea diagonal. En tal caso la ecuaci
on en coordenadas normales se escribe como
i + zi i + i2 i = 0

(no suma)

(15.78)

los zi son los coeficientes (no negativos) de la funci


on disipaci
on en la base de ejes principales en la cual z se
expresa en terminos de i . Siendo un conjunto de ecuaciones diferenciales lineales con coeficientes constantes
podemos establecer un ansatz de soluci
on para las Ecs. (15.78) en la forma
0

i = Ci eii t

(15.79)

introduciendo (15.79) en (15.78) resulta una ecuaci


on cuadr
atica para i0
i02 + ii0 zi i2 = 0 (no suma)

(15.80)

cuyas soluciones son de la forma


r

i0 = i2

z2i
zi
zi
i
i i
4
2
2

(15.81)

la soluci
on para las coordenadas normales es entonces de la forma
i = Ci e

zi
t
2

eii t

(15.82)

vemos entonces que la din


amica de las coordenadas normales nos da un factor de amortiguamiento para la
amplitud debido a la componente imaginaria de i0 , que como era de esperarse es causada por la funci
on de
disipaci
on i.e. por las fuerzas disipativas. N
otese que este termino es siempre decreciente ya que zi no puede
ser negativo (aunque zi puede ser cero si no hay efectos de fricci
on en el modo normal correspondiente). Desde
el punto de vista de la energa se ve que cuando las partculas vibran las fuerzas disipativas hacen un trabajo
negativo sobre ellas con lo cual el sistema que vibra pierde energa traduciendose en una disminuci
on de la
amplitud con el tiempo. Por otro lado, la Ec. (15.82) muestra que la parte real de i0 produce un termino
oscilatorio, se ve adem
as que la fricci
on tambien afecta las frecuencias de oscilaci
on y que como es de esperarse
a medida que disminuye el efecto de la fricci
on, tales frecuencias se acercan a las frecuencias naturales del
sistema. Por otro lado, si z2i > i la cantidad i tambien se vuelve compleja y deja de ser oscilante para
convertirse en otro termino de decaimiento (sobreamortiguamiento); cuando z2i = i la forma de la soluci
on
cambia ligeramente pero sigue siendo decayente sin oscilaci
on (amortiguamiento crtico), el caso en el cual el
amortiguamiento es peque
no y se presenta oscilaci
on se conoce como subamortiguamiento.
Si la funci
on de disipaci
on no puede ser diagonalizada junto con T y V , la soluci
on es mucho m
as difcil de
obtener debido a la ausencia de desacople en las ecuaciones de movimiento. No obstante, la naturaleza general
de las soluciones es similar: un termino que decae y un termino que oscila (para amortiguamiento peque
no).
Aunque no trabajaremos exhaustivamente la soluci
on del problema, podemos extraer mucha informaci
on cualitativa e incluso semicuantitativa a partir de ciertas consideraciones generales
Comencemos con un ansatz de soluci
on para (15.77) de la forma
j = Caj eit = Caj et e2it

(15.83)

introduciendo este ansatz en (15.77) resulta un conjunto de ecuaciones lineales simult


aneas
Vij aj izij aj 2 Tij aj = 0

(15.84)

CAPITULO 15. OSCILACIONES

408
definimos
i = 2i

(15.85)

El conjunto de ecuaciones (15.84) se puede escribir en terminos de los tensores T, z y V as como de las
constante en la forma
Va + za + 2 Ta = 0
(15.86)
el conjunto de ecuaciones homogeneas (15.84) o (15.86) se puede resolver para las aj solo para ciertos valores
de o de . Sin embargo, es posible demostrar que tiene que ser no negativo sin necesidad de resolver la
ecuaci
on secular completa. En primer lugar, convertimos la Ec. (15.86) en una ecuaci
on escalar multiplicando
a ambos lados por a a la izquierda de tal ecuaci
on
a Va + a za + 2 a Ta = 0

(15.87)

que es una ecuaci


on cuadr
atica para cuyos coeficientes son productos matriciales con una estructura semejante
a los que aparecen en la Ec. (12.97). Descomponiendo al vector a de la misma forma que en (12.96)
a = + i

(15.88)

Y con un an
alisis an
alogo al efectuado en la secci
on 15.2, podemos ver que en virtud de la simetra de T, V, y
z todos los productos matriciales en (15.87) son reales. En consecuencia si es una soluci
on de la Ec. (15.87),

atica
tambien lo ser
a . Ahora bien para una cuadr

b b2 4ac
2
ax + bx + c ; x1,2 =
2a
b
x1 + x2 =
a
como en este caso nuestras races son y tenemos que
+ =

a za
= 2
a Ta

donde tambien se tuvo en cuenta la definici


on de Ec. (15.85). Usando (15.88) podemos expresar de la
forma
1 zij (i j + i j )
=
2 Tkl (k l + k l )
la funci
on de disipaci
on z definida en (15.75) debe ser positiva por tanto la matriz asociada zij debe ser
positiva, en tanto que la matriz Tkl es definida positiva, por lo tanto no puede ser negativo. Es decir, la
oscilaci
on del sistema puede decrecer exponencialmente pero no puede crecer en el tiempo. Es de anotar que si
zij fuera definida positiva, entonces sera estrictamente positivo y todos los modos normales estaran amortiguados. Como antes, las frecuencias de oscilaci
on estaran afectadas por el factor de amortiguamiento, aunque
naturalmente estas frecuencias deben tender a las frecuencias libres cuando el factor de amortiguamiento es
muy peque
no.

15.6.3.

Vibraciones amortiguadas forzadas

Considerando ahora en el cual el sistema que vibra posee una fuerza arm
onica externa y fuerzas disipativas
externas, podemos plantear m
as f
acilmente las ecuaciones diferenciales usando una extensi
on compleja. Para
ello escribamos la fuerza arm
onica externa en la forma
Fj = F0j eit
donde F0j es complejo de modo que absorbe cualquier fase inicial que pueda existir. Las ecuaciones de movimiento quedan en la forma
Vij j + zij j + Tij j = F0i eit
(15.89)

15.6. VIBRACIONES FORZADAS Y AMORTIGUADAS

409

coloquemos como soluci


on particular (fase estacionaria) un ansatz de la forma
j = Aj eit
se obtiene el siguiente conjunto de ecuaciones lineales inhomogeneas para las amplitudes Aj

Vij izij 2 Tij Aj = F0i

(15.90)

las soluciones de estas ecuaciones se obtienen por regla de Cramer para los determinantes
Aj =

Dj ()
D ()

(15.91)

D () es el determinante correspondiente a la versi


on homogenea de (15.89), en tanto que Dj () es el determinante que resulta de modificar D () cuando la jesima columna se reemplaza por los terminos inhomogeneos
F01 , . . . , F0n . Para la presente discusi
on no centraremos en las propiedades de D () solamente, ya que las
caractersticas de las resonancias en la amplitud dependen fundamentalmente del denominador en (15.91).
D () es el determinante que aparece en la ecuaci
on secular correspondiente a la versi
on homogenea de las
Ecs. (15.89) i.e. las Ecs. (15.84), sus races son las frecuencias complejas de la vibraciones sin el forzamiento
arm
onico. Por otro lado, el requerimiento de que y sean ambas races de la Ec. (15.87) significa teniendo
en cuenta la Ec. (15.85) que si i es una raz de D () entonces i tambien lo es. Por lo anterior es posible
representar D () para un sistema de n grados de libertad en la forma
D () = G ( 1 ) ( 2 ) . . . ( n ) ( + 1 ) ( + 2 ) . . . ( + n )
siendo G una constante. En notaci
on de productoria y denotando por 2 podemos escribir
D () = G

n
Y
i=1

[2 ( i ) + ii ] [2 ( + i ) + ii ]

(15.92)

racionalizando la Ec. (15.92) para separar Ai en sus partes real e imaginaria, el denominador sera
D () D () = GG

n h
Y
i=1

4 2 ( i )2 + 2i

ih

4 2 ( + i )2 + 2i

(15.93)

las amplitudes de la oscilaci


on forzada exhiben entonces resonancia en las cercanas de las frecuencias de las
oscilaciones libres i . Se ve tambien de la Ec. (15.93) que la presencia de la constante de amortiguamiento
i remueve la divergencia que aparecan en las resonancias forzadas sin amortiguamiento. Las frecuencias
del forzamiento externo para las cuales la amplitud alcanza m
aximos locales ya no coincide exactamente con
las frecuencias de los modos libres debido a la dependencia con la frecuencia de terminos en Aj diferentes al
denominador. No obstante, de nuevo estas frecuencias de resonancia se aproximan a las frecuencias de vibraci
on
libre cuando el factor de amortiguamiento se vuelve muy peque
no.
Aunque la presente discusi
on se realiz
o en el marco de sistemas mec
anicos, hay en realidad diversos sistemas fsicos que est
an descritos por ecuaciones de la forma (15.89). Quiz
as el ejemplo mas conocido es el de
los circuitos electricos en donde las Ecs. (15.89) representan la din
amica de un conjunto de n circuitos acoplados donde los coeficientes Vij representan coeficientes recprocos de capacitancia, las zij son resistencias,
y las Tij son inductancias. Adicionalmente, el termino de forzamiento representara generadores senoidales de
determinada frecuencia aplicada a uno o mas de los circuitos.
Hay una serie de consideraciones generales que solo mencionaremos por efecto de espacio, por ejemplo,
cuando el forzamiento sobre un sistema oscilante lineal tiene una dependencia temporal de forma arbitraria, la
tecnica de la transformada de Laplace resulta muy u
til para estudiar la respuesta de estos sistemas. Cuando
tomamos la expansi
on del potencial m
as all
a del termino cuadr
atico en (15.4) aparecen oscilaciones no lineales
(oscilaciones anarm
onicas). Otro aspecto relevante es la generalizaci
on a oscilaciones de sistemas contnuos.

CAPITULO 15. OSCILACIONES

410

15.7.

Ejemplos de oscilaciones anarm


onicas

Consideraremos el caso de un pendulo amortiguado y forzado en el cual no haremos restriccion sobre los
angulos de oscilaci
on i.e. . Asumiremso por simplicidad que la varilla que lo sostiene no tiene masa
y esta se concentra en la lenteja.
Para el presente an
alisis haremos consideraciones de torques en lugar de fuerzas. Por ejemplo, la din
amica
del pendulo simple de longitud R y masa m est
a gobernada por el torque gravitacional mgR sin el cual es de
tipo restaurador.
d2
mR2 2 + mgR sin = 0
(15.94)
dt
nos se hace la aproximacion sin
donde I = mR2 es el momento de inercia. Para desplazamientos peque
=
lo cual linealiza las ecuaciones haciendo que el torque sea proporcional al desplazamiento, y el movimiento
ser
a arm
onico simple con frecuencia caracterstica 0
r 
g
0 =
R

Si aplicamos un torque adicional N al pendulo estacionario, este oscilar


a hasta un cierto angulo . El valor de
este angulo puede ser acotado gracias a la acci
on del torque gravitacional restaurador y el pendulo asume una
posici
on de equilibrio a un angulo dado por


d
=0
(15.95)
N = mgR sin
dt

por supuesto que entre mayor sea N , mayor es el angulo . Por ejemplo, para N = 0 se tiene que = 0; para
N = 12 mgR se tiene = /6 y para N = mgR se tiene que = /2 este u
ltimo caso define un valor crtico
Nc para el torque

(15.96)
Nc = mgR ; =
2
si N excede este valor crtico, el torque aplicado ser
a siempre mayor al torque restaurador N > mgR sin . En
consecuencia, el pendulo girar
a en forma indefinida hasta que dejemos de aplicar dicho torque (o deje de ser
v
alida la condicion N > Nc ) aunque naturalmente el movimiento puede continuar despues de que ha cesado
el torque.
Si ahora el pendulo est
a amortiguado debido por ejemplo a alg
un medio viscoso en el cual est
a inmerso, es
usual considerar que la fuerza viscosa es proporcional a la velocidad lineal, en nuestro caso ser
a mas conveniente
(y equivalente) asumir que es proporcional a la velocidad angular
F = 0 = 0

d
dt

N =

a
nadimos entonces a las ecuaciones de movimiento (15.94), el torque asociado a la fuerza viscosa con lo cual
queda
d2
d
mR2 2 + mgR sin +
=N
(15.97)
dt
dt
ahora definimos una frecuencia crtica c a la cual el torque se iguala al torque crtico mgR
c =

mgR
Nc
=

(15.98)

con lo cual la Ec. (15.97) se puede escribir en una forma normalizada


N
1 d2
1 d
+ sin
= 2 2 +
Nc
c dt
0 dt

(15.99)

las soluciones a esta ecuaci


on poseen comportamiento complejos de en funci
on del tiempo. Estudiaremos
el caso en el cual se aplica un torque constante a un pendulo inicialmente en reposo. En tal sistema hay un


15.7. EJEMPLOS DE OSCILACIONES ANARMONICAS

411

comportamiento transitorio inicial que eventualmente cede para dar paso a un comportamiento estacionario.
Examinaremos varios casos concentr
andonos u
nicamente en el estado estacionario
1) Para torques peque
nos N Nc hay un estado estacionario est
atico
N = Nc sin

(15.100)

en el cual se anulan todas las derivadas temporales despues de que se han extinguido todas las oscilaciones
transitorias iniciales. Esto se ilustra en la Fig. ???? que nos muestra un pendulo estacionario en el angulo .
2) Para movimiento no amortiguado ( = 0) con torque aplicado constante N , la Ec. (15.97) toma la forma
NT = N mgR sin = mR2

d2
dt2

(15.101)

que nos muestra que el torque neto NT depende del angulo. Es f


acil ver el valor de este torque para ciertos
angulos particulares
NT

= N

NT

= N Nc

= N + Nc

NT

= N

NT

=0
;

= /2

=
= 3/2

(15.102)

si el torque aplicado excede al valor del torque crtico Nc el movimiento ser


a de rotaci
on contnuamente
acelerada, de modo que el pendulo incrementa su energa cinetica con el tiempo. La velocidad angular tambien
se incrementar
a con el tiempo, pero con fluctuaciones que varan cclicamente como lo muestra la Fig. ???, El
promedio sobre estas oscilaciones nos da una velocidad angular
 
d
hi =
dt
que se incrementa linealmente con el tiempo cuando no hay atenuaci
on.
3) Cuando hay atenuaci
on con c << 0 y N > Nc , la velocidad angular contin
ua aumentando hasta que
el termino de atenuaci
on d/dt alcanza el valor del torque aplicado. En tal caso, la velocidad angular promedio
hi alcanza un valor asint
on fluct
ua de tal forma que su

otico hi
L como muestra la Fig. ???, y la aceleraci
valor promedio es nulo d2 /dt2 = 0. En este regimen asint
otico, el pendulo experimenta un movimiento
cuasi-est
atico rotando con una velocidad angular que fluct
ua alrededor de hiL pero que permanece cerca
al valor promedio hiL .
Es f
acil obtener informaci
on cuantitativa de este regimen asint
otico cuasi est
atico, ya que solo hay que
despreciar el termino de aceleraci
on en (15.99)
N
1 d
=
+ sin
Nc
c dt

(15.103)

que tiene soluci


on analtica de la forma
hi = 0
hi = c

f or N < Nc
i1/2
(N/Nc )2 1

hi = (N/Nc ) c

f or N > Nc

f or N >> Nc

la figura ??? muestra el comportamiento del promedio hi en tanto que la figura ???? muestra el comportamiento de las fluctuaciones en los puntos A y B de la gr
afica anterior. En A se ha tomado N = 1,2Nc de modo
que a partir de las Ecs. (15.102) se ve que el torque neto vara entre 0,2Nc y 2,22Nc alrededor del ciclo, y la
velocidad angular es grande en la parte baja y lenta en la parte superior, con las variaciones que se muestran
en la parte de abajo de la fig. ???. Para el punto B se tom
o N = 2Nc de tal modo que seg
un (15.102), el

CAPITULO 15. OSCILACIONES

412

torque vara entre Nc y 3Nc , produciendo las variaciones m


as regulares en la rapidez angular que se muestran
en la parte superior de la fig. ????. En el lmite N >> Nc que se traduce en hi >> c , la rapidez angular se
aproxima a una variaci
on sinusoidal en el tiempo
(t)
= hi + sin t
que es en forma aproximada el perfil que se ve para las fluctuaciones del punto B en la fig. ???.

Captulo 16

Relatividad especial
??????????????????????
??????????????????????

16.1.

Propiedades de las transformaciones de Lorentz puras

Consideremos dos sistemas de referencia S y S 0 cuyo origen es coincidente en t = 0 vistos por ambos
sistemas. S 0 se mueve a velocidad constante v con respecto a S en una direcci
on paralela al eje X3 . Las
transformaciones de Lorentz vienen dadas por
x01 = x1
x03

x02 = x2

x vt
p3
1 2


3
t vx
2
c
t = p
1 2
0

v
c

(16.1)

siendo c la velocidad de la luz en el vaco. Estas leyes de transformaci


on cumplen con las propiedades que las
inspiraron. En particular, cumple con los postulados de la relatividad especial. Por ejemplo, la velocidad de
la luz es la misma en ambos sistemas. Supongamos que con respecto al sistema S se emite una onda esferica
desde el origen en t = 0, la ecuaci
on del frente de onda vista por S es
xi xi = c2 t2
Usando las transformaciones de Lorentz (16.1) vemos que la ecuaci
on para el frente de onda transformado (es
decir visto por S 0 ) es tambien esferico y se propaga tambien con velocidad c
x0i x0i = c2 t02
si hacemos una expansi
on de las Ecs. (16.1)
x01 = x1
x03

x02 = x2


1
(x3 vt) 1 + 2 + . . .
2
;

t0

x3
c



1
1 + 2 + . . .
2

a orden cero en = v/c


x01 = x1

x03 x3 vt

x02 = x2
;

t0 t

con lo cual se obtienen las transformaciones de Galileo. Al ser el movimiento a lo largo de x3 las coordenadas
x1 y x2 no se ven afectadas como es de esperarse en virtud de la isotropa del espacio. Las ecuaciones de
transformaci
on son lineales lo cual se puede demostrar a partir del requerimiento del principio de relatividad
413

CAPITULO 16. RELATIVIDAD ESPECIAL

414

restringida, pues si el movimiento uniforme en S debe transformarse en movimiento uniforme en S 0 las transformaciones entre tales sistemas deben ser lineales. Como la transformaci
on debe ser igualmente v
alida para
0
1
pasar desde S hacia S se puede ver que la inversa de la transformaci
on debe ser tal que T (v) = T (v) lo
cual se puede verificar invirtiendo las transformaciones de Lorentz.
La parte espacial de las transformaciones de Lorentz se puede escribir en forma vectorial teniendo en cuenta
que v va en la direcci
on x3
!
!

x3 vt
x3 vt
0
0
0
= x1 , x2 , x3 x3 + p
x1 , x2 , x3 =
x1 , x2 , p
1 2
1 2
!

x3 vt
x01 , x02 , x03 = (x1 , x2 , x3 ) + 0, 0, p
x3
1 2
!
x

vt
3
r0 = r + p
x3 u3
1 2
y teniendo en cuenta que u3 = v/v se obtiene
0

r =r+
podemos adem
as hacer el reemplazo

x vt
p3
x3
1 2

v
v

v r = vx3
con lo cual la parte espacial se puede escribir en forma enteramente vectorial
!
!
2t
v
v
vx

v
vx
v2 t
v
3
3
p
p
r0 = r + p
vx3
=
r
+

vx

3
2
2
v
v
1 2
1 2
1 2 v2
!
1
v
vt
0
r = r + vx3 p
1
p
2
v
1 2
1 2
!
v
1
vt
r0 = r + (v r) 2 p
1 p
2
v
1
1 2
y definiendo

v
c

se obtiene
r0 = r +

1
1 2

( r)
( 1) ct
2

(16.2)

y para la transformaci
on de la coordenada temporal


3
t vx
v r
2
c
t = p
= t 2
c
1 2
0

t0 = t ( r)

(16.3)

dado que no hay nada especial en la direcci


on x3 elegida (por la isotropa del espacio) las ecuaciones vectoriales
(16.2, 16.3) son v
alidas para direcciones arbitrarias de v siempre que los ejes de S y S 0 sean paralelos.
Las Ecs. (16.2, 16.3) definen transformaciones lineales en 4 componentes, por tanto podemos utilizar el
formalismo matricial para describir estas transformaciones. Un artificio ideado por Minkowski nos permite

16.1. PROPIEDADES DE LAS TRANSFORMACIONES DE LORENTZ PURAS

415

construir un sistema coordenado cartesiano con cuatro ejes en el cual el cuarto eje coordenado se elije como
x4 ict. El cuadrado del m
odulo de un vector en este espacio se escribe como
x21 + x22 + x23 + x24 = x21 + x22 + x23 c2 t2

(16.4)

recordemos que esta cantidad es invariante debido a la exigencia de que la velocidad de la luz sea invariante. En
consecuencia debemos usar transformaciones ortogonales en cuatro dimensiones1 , por tanto la transformaci
on
de Lorentz es una transformaci
on ortogonal en el espacio de Minkowski.
Dado que la cuarta coordenada es imaginaria, los elementos de la matriz de transformaci
on pueden ser complejos. La representaci
on matricial se puede obtener de las ecuaciones vectoriales (16.2, 16.3). Representando
por L a la matriz de transformaci
on de Minkowski se tiene que
x0 = Lx

(16.5)

an a las cuatro coordenadas en tanto que las


siendo L un elemento generico. Las letras griegas representar
letras latinas representar
an solo coordenadas espaciales. Las ecuaciones vectoriales (16.2, 16.3) en componentes
se escriben como
x0j
x04

j k xk
( 1) + ij x4
2
= ik xk + x4
= xj +

(16.6)
(16.7)

Con lo cual se pueden determinar los elementos de L para una direcci


on arbitraria de


j k
x0j = jk + 2 ( 1) xk + ij x4

0
x4 = ik xk + x4

(16.8)

que podemos escribir en la forma


x0j = Ljk xk + Lj4 x4
x04 = L4k xk + L44 x4

(16.9)

y comparando (16.8) con (16.9) se obtienen los elementos de L


j k
( 1)
2
= ik ; L44 =

Ljk = jk +
L4k

; Lj4 = ij
(16.10)

En el caso particular en el cual v va dirigida a lo largo de x3 tenemos que j = j3 y L adopta la forma


2 j3 k3
( 1) = jk + j3 k3 ( 1)
2
= ik3 ; L44 =

Ljk = jk +
L4k

que explcitamente se escribe

1
0
L=
0
0

0
0
0
1
0
0

i
0 i

; Lj4 = ij3
(16.11)

(16.12)

1
Las transformaciones unitarias mantienen invariante la cantidad xi xi en tanto que las transformaciones ortogonales mantienen
invariante la cantidad xi xi . La invarianza de la cantidad expresada en (16.4) es de la forma xi xi con algunas componentes complejas,
en consecuencia las matrices asociadas ser
an ortogonales complejas.

CAPITULO 16. RELATIVIDAD ESPECIAL

416

ya hemos visto que en una matriz ortogonal la inversa es igual a la traspuesta. Veamos que ocurre al hacer la
traspuesta de la matriz L () en (16.10)
e jk () = Lkj () = kj + k j [ () 1] = jk + (j ) (k ) [ () 1] = Ljk ()
L
2
()2
e j4 () = L4j () = ij = i (j ) = Lj4 ()
L

e 4k () = Lk4 () = ik = i (k ) = L4k ()
L

e 44 () = L44 () = () = () = L44 ()
L

donde hemos usado el hecho de que () = () lo cual es evidente de su definici


on. Tenemos por tanto que
e () = L ()
L

y como la traspuesta es la inversa llegamos a la propiedad esperada de que L1 (v) = L (v).


Notemos que la submatriz inferior 22 en (16.12) se asemeja a una rotaci
on en un plano, la cual se escribira
de la forma


cos sin
sin cos
en este caso lo que tenemos es una rotaci
on en los ejes x3 x4 del espacio de Minkowski, pero en un angulo
imaginario
cos = ; sin = i
(16.13)
podemos definir un angulo real en la forma i con lo cual
cosh =

sinh =

y la matriz (16.12) queda

1
0
L =
0
0


0
0
0
1 0
0
0

1
0
0 0 1
0
0
=
0 cos sin 0 0
cosh
i sinh
0 sin cos
0 0 i sinh cosh

(16.14)

esta parametrizaci
on facilita muchas operaciones matriciales. Por ejemplo, si hacemos dos transformaciones
de Lorentz sucesivas en donde ambas poseen velocidades relativas a lo largo de x3 la transformacion matricial
solo es no trivial en el plano x3 x4 y se puede ver que simplemente se suman los angulos y 0 correspondientes
como ocurre en una rotaci
on en el plano, de modo que L0 (0 ) L () = L ( + 0 ). De las Ecs. (16.13) se tiene
que
tan


tan + tan 0
; tan 00 = tan + 0 =
1 tan tan 0
i + i 0
i 00 =
1 (i) (i 0 )
=

de modo que estas dos transformaciones de Lorentz sucesivas corresponden a una sola transformaci
on de
Lorentz equivalente de la forma
+ 0
00 =
(16.15)
1 + 0
la Ec. (16.15) corresponde a la ley de adicion de velocidades para velocidades paralelas. En esta ecuaci
on se
ve que la velocidad equivalente no es simplemente la suma de las velocidades de las dos transformaciones en
virtud del factor de correcci
on 0 en el denominador. Podemos ver adem
as que incluso tomando valores de
0
y cercanos a la unidad, se tiene que 00 < 1. Esto indica que no se puede obtener una velocidad mayor que c
con transformaciones de Lorentz sucesivas. No hay manera de que una sistema de referencia vaya m
as r
apido
que la luz con respecto a otro.

16.2. TRANSFORMACIONES DE LORENTZ RESTRINGIDAS

16.2.

417

Transformaciones de Lorentz restringidas

Aunque hemos visto que las transformaciones de Lorentz son ortogonales, no hemos demostrado que estas
cubran todas la transformaciones ortogonales posibles en el espacio de Minkowski, de por s esto no es cierto
como se puede demostrar con una transformaci
on descrita por L44 = 0, L4i = Li4 = 0 y los nueve elementos
restantes formando una submatriz 33 ortogonal en el espacio eucldeo tridimensional. Esta matriz es ortogonal
en el espacio de Minkowski, pero no produce movimiento relativo entre los dos sistemas, su efecto es una rotaci
on
de las coordenadas espaciales. Las rotaciones espaciales son un subconjunto de las transformaciones
ortogonales en el espacio de Minkowski. Similarmente, (16.5) no define la transformaci
on de coordenadas
m
as general ante la cual deben permanecer invariantes las ecuaciones de la Fsica, pues es claro que una
redefinici
on de origen espacio temporal tampoco debe afectar a las leyes de la Fsica. Debemos ver adem
as si
existen otro tipo de transformaciones ortogonales en el espacio de Minkowski. La transformaci
on m
as general
en el espacio de Minkowski que mantiene invariante la velocidad de la luz es
x0 = Lx + a

(16.16)

donde a representa una traslaci


on del origen en el espacio de Minkowski (i.e. de espacio y tiempo) y L es una
matriz ortogonal. A las transformaciones del tipo (16.16) se les conoce como transformaciones de Poincare o
transformaciones de Lorentz inhomogeneas. La condici
on de ortogonalidad
e = LL
e = 1 ; L L =
LL

L L =

(16.17)

representa diez ligaduras sobre los elementos de L (cuatro condiciones diagonales y seis no diagonales) de
modo que solo hay seis cantidades independientes en L. Por otro lado, vemos que las transformaciones de
Lorentz (16.10) involucran tres grados de libertad (las tres componentes de la velocidad) en tanto que las
rotaciones eucldeas involucran otros tres grados de libertad (e.g. los angulos de Euler). Esto parece indicarnos
que las transformaciones de Lorentz del tipo (16.10) junto con las rotaciones espaciales (o combinaciones de
ambas) forman el conjunto m
as general de transformaciones ortogonales en el espacio de Minkowski. Por otro
lado, para la transformaci
on (16.16) existen cuatro grados de libertad adicionales con lo cual la cantidad de
elementos independientes ser
a diez. En el presente estudio nos restringimos a las transformaciones de Lorentz
homogeneas de modo que requerimos manejar seis elementos independientes de L
x0 = Lx
recordemos que las matrices ortogonales tienen determinante 1
(det L)2 = 1
y ya hemos visto que si nos restringimos a las transformaciones contnuas debemos exclur las matrices de
determinante 1. Las matrices L de determinante +1 representan entonces transformaciones de Lorentz
propias. Sin embargo, no hay garanta de que todas las matrices de determinante +1 correspondan a transformaciones contnuas. Efectivamente, en el caso de la inversi
on simult
anea de todas las coordenadas espacio
2
temporales, el determinante sigue siendo +1 . Necesitamos entonces un criterio para excluir las transformaciones propias no contnuas. Examinemos el comportamiento de L44 , usando las Ecs. (16.17) se puede escribir
con = = 4
L4 L4 = 44 L244 + L4j L4j = 1
(16.18)
y como los elementos L4j conectan una coordenada espacial (real) con una temporal (imaginaria), estos elementos deben ser imaginarios puros. En contraste L44 debe ser real porque conecta al eje imaginario consigo
mismo, estas caractersticas se pueden apreciar en (16.10). En consecuencia L4j L4j debe ser negativo y L244 debe
ser positivo de modo que
|L44 |2 > |L4j L4j |
y L244 1
(16.19)
2

Observese que esto se debe al car


acter par de la dimensi
on del espacio. En R3 las inversiones espaciales producen determinante
3
(1) = 1 de modo que no hay trasnformaciones discretas con determinante +1 en el espacio cartesiano tridimensional.

CAPITULO 16. RELATIVIDAD ESPECIAL

418

La Ec. (16.19) plantea dos posibilidades: L44 1 que implica una inversi
on del tiempo y L44 1 que implica
una transformacion contnua a partir de la identidad3 . Las transformaciones de Lorentz con L44 1 se denominan ort
ocronas en tanto que las de L44 1 se denominan no ort
ocronas. Solamente las transformaciones
ortogonales propias ort
ocronas pueden evolucionar en forma contnua a partir de la identidad. De las cuatro
subclases solo las transformaciones propias ort
ocronas forman un grupo, las otras tres subclases no.
A las transformaciones de Lorentz propias ort
ocronas se les conoce como transformaciones de Lorentz restringidas, solo ellas pueden generar rotaciones contnuas en el espacio y reducirse a las transformaciones de Galileo
en el lmite de bajas velocidades. En consecuencia, solo trabajaremos transformaciones de Lorentz restringidas
denomin
andolas simplemente transformaciones de Lorentz.
A las transformaciones de Lorentz restringidas que corresponden a dos sistemas de ejes paralelos que
se mueven uniformemente uno respecto al otro se les denomina transformaciones de Lorentz puras (o
boosts). La matriz descrita por (16.10) corresponde a una transformaci
on de Lorentz pura. La intuici
on nos
indica que una transformaci
on de Lorentz restringida puede descomponerse en una transformaci
on de Lorentz
pura junto con una rotaci
on espacial sin movimiento relativo (en uno u otro orden). Veamos como se realizara
tal descomposicion. Descompongamos la transformaci
on de Lorentz en un boost seguido de una rotaci
on
L = RP

(16.20)

an relacionadas con las coordenadas no primadas por


Las coordenadas del sistema transformado x0 est
e 0 x = L x0
x0 = Lx x = L1 x0 x = Lx

(16.21)

nos preguntamos ahora cual es la velocidad del origen de S 0 vista por un observador en S. En el origen de S 0
tenemos que x0j = 0 y las coordenadas del origen de S 0 vistas por el observador en S se obtienen aplicando
(16.21) con x0j = 0
xj = L4j x04 ; x4 = L44 x04
(16.22)
de las Ecs. (16.22) vemos que la velocidad relativa (normalizada a unidades de c) del origen de S 0 tiene entonces
las siguientes componentes
xj
iL4j x04
iL4j
ixj
j =
=
=
(16.23)
=
0
ct
x4
L44 x4
L44
combinando las Ecs. (16.18, 16.23) se obtiene






L4j L4j
L4j
L4j
2
2
L44 1 +
= 1 L44 1 i
i
=1
L44
L44
L244
L244 (1 j j ) = 1

(16.24)

podemos ver que |j | est


a entre cero y uno usando la primera desigualdad en (16.19) aplicada a (16.23)




iL4j 2 L4j L4j 2
2



1
|j | =

L44
L44

donde en el segundo miembro de la ecuaci


on no hay suma sobre j pero s la hay en el tercero. Por otra parte,
despejando el valor de L44 en terminos de en (16.24) se obtiene4
L44 = (1 j j )1/2 =

(16.25)

por lo tanto, L44 = para cualquier trasnformaci


on de Lorentz que sea combinaci
on de un boost y una
rotaci
on. construyendo entonces una transformaci
on de Lorentz pura P () asociada al vector velocidad relativa
3

La identidad tiene L44 = 1 como se puede ver de (16.10) con v = 0. Con un argumento similar al que se us
o para transformaciones ortogonales impropias en R3 , no es de esperarse que para una transformaci
on contnua haya un cambio abrupto desde
la identidad (con L44 = 1) hasta un valor de L44 1 sin pasar por estados intermedios. Por lo tanto, las matrices con L44 1
contienen al menos una transformaci
on discreta.
4
N
otese que en (16.25) hemos asumido que L44 1 al tomar la raz cuadrada positiva.

16.2. TRANSFORMACIONES DE LORENTZ RESTRINGIDAS

419

del origen de S 0 Ec. (16.23), vemos que la transformaci


on inversa debe ser P (). Ahora teniendo en cuenta
(16.20) se encuentra entonces que la matriz R se puede despejar
L

RP () LP () = RP () P ()

R = LP ()

(16.26)

se puede demostrar formalmente que este producto entre P () y L corresponde a una rotaci
on en el espacio
usando los elementos matriciales de P () y la ortogonalidad de L. No obstante se puede ver geometricamente
que en la Ec. (16.20), el sistema intermedio de coordenadas definido por P () est
a en reposo respecto al sistema
final de ejes de modo que R solo puede girar las coordenadas. Esta descomposici
on nos permite deducir que
los par
ametros independientes siempre ser
an las tres componentes de la velocidad relativa entre los sistemas y
los tres grados de libertad de la rotaci
on espacial (por ejemplo los angulos de Euler).
Por otro lado, puede demostrarse que la composici
on de transformaciones de Lorentz puras no es en general
otra transformaci
on de Lorentz pura a menos que sean paralelas las velocidades relativas de las transformaciones
sucesivas. El caso general es muy complejo y poco ilustrativo, veamos entonces un c
alculo sencillo que posee
amplias aplicaciones en Fsica moderna dando origen al efecto llamado precesi
on de Thomas.
Tomaremos tres sistemas inerciales con orgenes O1 , O2 , O3 . El sistema O1 es el laboratorio y O2 tiene
velocidad relativa a O1 . O3 se mueve con velocidad 0 relativa a O2 . Sin perdida de generalidad se puede
tomar a en la direcci
on de x3 de O1 y a 0 lo podemos tomar sobre el plano x2 x3 de O2 de modo que y 0
definen el plano x2 x3 de O2 . Supondremos que las componentes de 0 son muy peque
nas de modo que solo
on entre O2 y O3 se puede
las conservamos hasta el menor grado no nulo. Con esto, 0 para la transformaci
sustitur por la unidad. Con base en lo anterior la matriz L que nos lleva de O1 a O2 tiene la forma dada por
(16.12) y la matriz que nos lleva de O2 a O3 se escribe usando la aproximaci
on 0
= 1 en (16.10)
L0jk = jk

L0j4 = ij0

L04k = ik0

L044 = 1

y recordando que por construcci


on 10 = 0, explcitamente queda

1
0
0
0
0
1
0
i20

L0 =
0
0
1
i30
0 i20 i30
1

on est
a dada por
siendo 20 , 30 las componentes de 0 . La matriz producto con la misma aproximaci

1
0
0
0
1 0
0
0
0 0 1

0
1
0
i
0
0
2
L00 = L0 L =
0
0

0
1
i3
0 0

i
0 i20 i30
1
0 0 i

1
0
0
0
0

1
20
i20
=

0
0
0
0
+ 3
i + i3
0 i20 i i30 + 30

1
0
0
0

1
20 i20
0

L00 = L0 L =
0
0

i
0 i20 i

(16.27)

donde se ha despreciado 30 frente a por considerar a 0 peque


na. Se puede ver que (16.27) no representa
una transformacion de Lorentz pura ya que por ejemplo los elementos L00ij de las coordenadas espaciales no son
simetricos como lo demandan las Ecs. (16.10) para transformaciones de Lorentz puras. Usando la Ec. (16.23),
podemos ver que las componentes de la velocidad relativa entre O1 y O3 se escriben en la forma
200 =

iL0042
20
=
;
L0044

300 =

100 = 0

(16.28)

CAPITULO 16. RELATIVIDAD ESPECIAL

420

dado que ( 00 )2 = (100 )2 + (200 )2 + (300 )2 ' 2 y por tanto 00 ' , podemos aproximar la transformaci
on de
Lorentz pura asociada a la velocidad relativa 00 reemplazando estas aproximaciones en (16.10)
Ljk
L4k

j00 k00

j00 k00


= jk + 002 1 = jk + 2 ( 1)

00 00
00
= ik = ik ; L44 = 00
= ;

; Lj4 = ij00 00
= ij00

00

(16.29)

y combinando las Ecs. (16.28, 16.29) podemos construr P (). Escribiremos P () que es el que nos interesa

1
0


P 00 =
0

0
1
20

20

( 1)
i20

0
i20

0
( 1)

y usando la Ec. (16.26) podemos encontrar la matriz de rotaci


on correspondiente de los ejes de O3 con respecto
a O1 . Suprimiendo los terminos de orden superior en 0 se obtiene

 0
R = L00 P 00 =
0
0 2

0
1

20

( 1)
0

0
0
( 1) 0

1
0
0

(16.30)

como esta rotacion es a primer orden en 20 se puede comparar con una rotaci
on infinitesimal5 . Comparando
entonces la submatriz 33 superior izquierda (16.30) con la matriz infinitesimal (13.42) se obtiene que (16.30)
est
a asociada a una rotaci
on alrededor del eje x1 con un angulo (peque
no) dado por
1 =

20
( 1)
( 1) = 200

este es entonces un ejemplo concreto de dos transformaciones de Lorentz a ejes paralelos sucesivas (boosts de
Lorentz) que dan como resultado la combinaci
on de un boost con una rotaci
on. Esta paradoja tiene importantes
aplicaciones especialmente en Fsica at
omica como veremos a continuaci
on.
Consideremos una partcula que se mueve en el laboratorio con una velocidad v no constante, el sistema
en el cual esta partcula est
a en reposo no es inercial y por tanto no es aplicable el formalismo anterior. Para
obviar esta dificultad, consideraremos un conjunto de sistemas inerciales todos coincidentes con el original en
t = 0 y que viajan a diferentes valores de velocidad relativa (todos los valores de velocidad que se requieran).
En consecuencia, la partcula estar
a en reposo instant
aneo con respecto a alguno de estos sistemas de referencia
en cualquier instante de tiempo.
Pensemos que O1 es el sistema del laboratorio y que O2 y O3 son sistemas en los cuales la partcula est
a en
reposo instant
aneo en dos tiempos t2 y t3 respectivamente. De acuerdo con las Ecs. (16.28), el observador O1
vera en el tiempo t = t3 t2 una variaci
on v en la velocidad de la partcula que solo tiene componente x2
00
de valor 2 c.
00 c v ( 1)
( 1)
1 = 2
= (v) v
c c v 2 /c2
v2
Dado que el eje x3 se ha tomado a lo largo de v, y que v va alo largo de x2 , la ecuaci
on anterior se puede
escribir en forma vectorial. El vector asociado a la rotacion (peque
na) durante este tiempo se puede escribir
= ( 1)
5

v v
v2

Las ecuaciones desarrolladas en la secci


on (13.8) son v
alidas para matrices infinitesimales pero tambien son aproximadamente
v
alidas para rotaciones finitas suficientemente peque
nas como para permitir mantener solo terminos de primer orden.

16.3. TRANSFORMACIONES DE LORENTZ USANDO ESPACIOS DE RIEMANN DE CUATRO DIMENSIONES


de modo que si la partcula tiene alguna direcci
on especfica asociada a ella (como un vector de espn), el
sistema del laboratorio observar
a que esta direcci
on experimenta una precesi
on de velocidad angular
= ( 1)

va
v2

(16.31)

siendo a la aceleraci
on de la partcula vista desde O1 . La Ec. (16.31) aparece con frecuencia en la literatura
en la forma que posee cuando se toma el lmite de velocidad peque
na que permite aproximar a
=

1
(a v)
2c2

es la frecuencia de precesi
on de Thomas.

16.3.

Transformaciones de Lorentz usando espacios de Riemann de cuatro


dimensiones

Una forma alternativa de trabajar el espacio en donde ocurren las transformaciones de Lorentz es asumir
que el espacio tetradimensional es real de modo que la cuarta coordenada (denominada la coordenada cero en
la notaci
on m
as usual) se escribe como x0 ct. Debemos por supuesto mantener el postulado fundamental de
que la luz se propague a la misma velocidad en todos los sistemas, lo cual se manifiesta como la invarianza de
la cantidad dada en la ecuaci
on (16.4). Para que esta cantidad siga representando el m
odulo al cuadrado de
un vector en un espacio real, es necesario que el espacio deje de ser eucldeo y se convierta en un espacio de
Riemann con tensor metrico diagonal definido por

1 0 0 0
0 1 0 0

G=
(16.32)
0 0 1 0
0 0 0 1
donde los ndices 1230 representan las tres coordenadas espaciales y la coordenada temporal. El m
odulo al
cuadrado de un vector en tal espacio viene dado por
eGx = xi xi x20 = xi xi c2 t2
x

(16.33)

que nos representa al invariante que queremos. Una transformaci


on de Lorentz homogenea es una transformaci
on lineal en este espacio real que mantiene invariante este m
odulo de los vectores. Es evidente que la matriz
asociada a estas transformaciones debe ser real en este espacio, de modo que la denotaremos por . La condici
on de invarianza del m
odulo de los vectores ante una transformaci
on de Lorentz se escribe matricialmente
en la forma
] (x) = x
e
eGx (x)G
eGx x
eGx
eGx
xe0 Gx0 = x
=x

y como esto es v
alido para un vector arbitrario en este espacio, la condici
on para las transformaciones de
Lorentz resulta
e
G
=G
(16.34)

La Ec. (16.34) es una transformaci


on de congruencia que deja invariante al tensor metrico. Haciendo la analoga
con las matrices ortogonales del espacio eucldeo (donde el tensor metrico cartesiano es 1), podemos decir que
(16.34) es la condici
on de ortogonalidad de en el espacio real de Riemann con tensor metrico G6 .
La relaci
on entre las f
ormulas expresadas en el espacio de Minkowski y las expresadas en el espacio real de
Riemann se logra con las siguientes asociaciones simples
x4 = ix0 ;
6

j0 = iLj4

0k = iL4k

Es claro que esta condici


on se reduce a la ortogonalidad usual cuando G = 1.

CAPITULO 16. RELATIVIDAD ESPECIAL

422

en tanto que los dem


as elementos no varan, lo cual es de esperarse ya que ambos contienen al subespacio R3
dotado de la misma estructura. A manera de ejemplo, la transformaci
on de Lorentz pura con velocidad relativa
a lo largo de x3 correspondiente a la Ec. (16.12), tiene la siguiente representaci
on matricial real en este espacio
de Riemann

1 0
0
0
0 1
0
0

=
0 0


0 0

el producto escalar se escribe usando el tensor metrico

eGy =e
(x, y) x
yGx = (y, x)
eGy = x g y
x

donde la igualdad entre (x, y) y (y, x) viene dada por el car


acter real de este producto interno. La condici
on
de ortogonalidad de la Ec. (16.34) garantiza la invarianza del producto escalar ante una transformaci
on de
Lorentz .
Es usual escribir estas f
ormulas de manera mas compacta mediante un conveniente cambio de notaci
on.
Supongamos que formamos un vector en el espacio de Riemann con los elementos de coordenadas dx y
estudiemos su comportamiento ante una trasnformaci
on general de coordenadas del tipo
y = f (x1 , x2 , ...)
se encuentra que las propiedades de transformaci
on de dx son
dy =

f
y
dx =
dx
x
x

(16.35)

las derivadas son los elementos de la matriz jacobiana de la transformaci


on entre (x) e (y). Cuando la transformaci
on A es lineal, seran simplemente los elementos matriciales A . Por otro lado, las componentes de un
vector gradiente se transforman de acuerdo con la ecuaci
on
x

=
y
y x

(16.36)

n
otese que en (16.36) los coeficientes corresponden a los elementos de la matriz jacobiana de la transformaci
on
inversa de (y) hacia (x). Los vectores que se transforman de acuerdo con la regla dada por la Ec. (16.35) se
denominan vectores contravariantes y se denotan con suprandices
D 0 =

y
D
x

en contraste, los vectores que transforman de la manera prescrita por la Ec. (16.36) se denominan covariantes
y se denotan con subndices
x
F0 =
F
y
El producto de las matrices jacobianas correspondientes a una transformaci
on y a su inversa debe ser la matriz
unidad ya que corresponde a pasar de (x) a (y) y volver de nuevo a (x). De aqu se desprende que la contracci
on
entre un vector contravariante y un vector covariante queda invariante ante la transformaci
on,
D 0 F0 =

y x
D F = D F = D F
x y

veremos m
as adelante que la contracci
on de un vector covariante con otro contravariante equivale al producto
interno entre dos vectores contravariantes. En el caso de espacios cartesianos, no hay diferencia entre vectores

16.3. TRANSFORMACIONES DE LORENTZ USANDO ESPACIOS DE RIEMANN DE CUATRO DIMENSIONES


covariantes y contravariantes ante transformaciones lineales ortogonales. Si la matriz ortogonal A describe la
transformaci
on, un vector contravariante en el espacio cartesiano, dicha transformaci
on se escribe en la forma
D 0 = A D
en tanto que un vector covariante transforma en la siguiente forma
 

e
F0 = A1 F = A
F = A F

de modo que no es necesario distinguir hasta ahora entre los dos tipos de comportamiento ante la transformaci
on. Un argumento similar vale para el espacio de Minkowski con eje temporal imaginario y con la metrica
usual, de modo que en dicho espacio no hay diferencia entre vectores covariantes y contravariantes.
De la misma manera en que definimos tensores cartesianos seg
un la prescripci
on (12.134) heredada de la
transformaci
on de los vectores, uno define las propiedades de transformaci
on de tensores de cualquier rango
en espacios no eucldeos. Por tanto, un tensor covariante R de segundo ordense transforma con la prescripci
on
0
= R
R

x x
y y

y se puede demostrar que la contracci


on de un tensor de segundo rango covariante con un tensor de segundo
rango contravariante (o con dos vectores contravariantes) es invariante ante la transformaci
on. Similarmente,
la contracci
on de un tensor de segundo rango covariante con un vector contravariante transforma como un
vector covariante
R H = s1
R R M = s2 ; R D = F
donde s1 y s2 son invariantes ante la transformaci
on (escalares) y F es un vector covariante. Veamos la
demostraci
on de la tercera ecuaci
on
0
F0 = R
D 0 = R

F0 = F

x x y
x
x
D = R
D = R D
y y x
y
y

x
y

En un espacio de Riemann el tensor metrico se construye a traves de un elemento diferencial de longitud


de arco
(ds)2 = g dx dx
que se construye de tal manera que sea invariante ante las transformaciones de interes. De esto se desprende
que el tensor metrico es covariante. N
otese que en el caso particular de las transformaciones de Lorentz, esto se
e 1 G1
puede ver directamente de la condici
on de ortogonalidad (16.34) si la escribimos en la forma G =
considerada como transformaci
on de congruencia en G.
Vemos entonces que en el espacio de Riemann real de cuatro dimensiones, el producto escalar de dos
vectores contravariantes A , B se puede escribir en la forma
g A B = (g A ) B = A B

(16.37)

donde hemos tenido en cuenta el car


acter covariante del tensor metrico para obtener el vector covariante A . En
este punto se puede ver con claridad que si la metrica fuera la usual i.e. , los vectores covariantes y contravariantes seran identicos. En particular, el cuadrado del m
odulo del vector cuadriposici
on en el cuadriespacio
real se puede escribir en la forma
x x
de esta forma los productos internos se pueden construir sin aluci
on directa al tensor metrico, teniendo en
cuenta que un factor del producto escalar se sustituye por el vector covariante que se obtiene al contraer
con el tensor metrico como se ve en (16.37). Si nos interesa el producto escalar de dos vectores covariantes,

CAPITULO 16. RELATIVIDAD ESPECIAL

424

debemos subir el ndice por contracci


on con el inverso del tensor metrico, el cual se puede demostrar que es
contravariante. En el caso del cuadriespacio real donde el tensor metrico es diagonal con elementos 1, el tensor
metrico coincide con su inverso y no hay diferencias entre tensores metricos covariantes y contravariantes.
Es claro que esta no es la u
nica forma de construr el tensor metrico, el cual fue dise
nado para generar el
invariante (16.33) por medio del m
odulo al cuadrado del vector posici
on en tal espacio, podemos en cambio
consturr el invariante en la forma
xG0 x x G0 x = xi xi + c2 t2
de modo que el tensor metrico queda

1 0
0 0
0 1 0 0

G0 =
0
0 1 0
0
0
0 1

(16.38)

es claro que bajo la metrica (16.38) se mantiene invariante la velocidad de la luz y las matrices que describen
a las transformaciones de Lorentz no se modifican. Todo el formalismo permanece inalterado excepto que el
producto interno cambia de signo7 . El tensor G tiene la signatura (+ + +) en tanto que el tensor G0 tiene
la signatura ( +). Tambien podemos identificarlos por sus trazas T rG = 2, T rG0 = 2.
El uso del formalismo de Minkowski o de Riemann presenta cada uno sus ventajas y desventajas. En teora
general de la relatividad ser
a necesario usar la metrica de un espacio curvo para lo cual es muy adecuado el uso
de espacios de Riemann, por otro lado en mec
anica cu
antica donde la funciones de onda o vectores de estado
son complejos, el uso de una coordenada compleja complica la operaci
on de conjugaci
on compleja. Por otro
lado, cuando nos restringimos al marco de la relatividad especial, las operaciones en el espacio de Minkowski
suelen tener analogas muy cercanas al espacio eucldeo y no es necesaria la distinci
on entre vectores covariantes
y contravariantes, debido a la trivialidad del tensor metrico. En todo caso la mayora de f
ormulas presentan
el mismo aspecto en ambos casos o su transici
on de uno a otro esquema es muy sencilla. Un aspecto com
un
en ambos formalismos es la idea de que elemento de longitud de arco tiene un car
acter indefinido, pues (ds)2
puede ser positivo, negativo o cero.

16.4.

El concepto de formulaci
on covariante en Fsica

El primer postulado de la relatividad especial nos dice que las leyes de la Fsica deben poseer la misma
forma en todos los sistemas inerciales. Por lo tanto, es de gran importancia poder verificar que las leyes de
la naturaleza sean invariantes en forma bajo las transformaciones de Lorentz. Esta verificaci
on se facilita
enormenente con la introducci
on del concepto de tensor de Minkowski.
Cuando hablamos de la invarianza ante transformaciones de Lorentz, nos referimos tanto a los boosts
como a las rotaciones en el espacio ordinario. Como la invarianza ante rotaciones tridimensionales nos es m
as
familiar podemos usar esta invarianza como modelo para establecer un metodo que se generalice a todas las
transformaciones de Lorentz.
Ya hemos definido los tensores euclidianos y su comportamiento bajo rotaciones. Para satisfacer el requerimiento de que una ley de la Fsica sea invariante ante rotaciones tridimensionales es usual escribir las
ecuaciones que expresan esa ley de modo que todos sus terminos sean escalares o todos vectoriales (en el sentido
euclidiano). M
as en general, todos los terminos deben ser tensores del mismo rango y este requisito asegura
de manera autom
atica la invarianza de la forma de la ecuaci
on ante una rotaci
on de los ejes espaciales. Por
ejemplo una relaci
on escalar tiene la forma general
a=b
7

En ambos casos el tensor G describe una pseudometrica ya que la norma de un vector en este espacio no est
a necesariamente
definida positiva.

COVARIANTE EN FISICA
16.4. EL CONCEPTO DE FORMULACION

425

y dado que los dos miembros de la igualdad por ser escalares euclidianos son invariantes ante rotaciones
espaciales de los ejes, es evidente que la relaci
on ser
a v
alida para todos los sistemas de coordenadas con origen
com
un. Una relaci
on vectorial ser
a de la forma
F=G
que se puede escribir en terminos de tres relaciones numericas entre las componentes8
Fi = Gi

(16.39)

Claramente, estas componentes no son invariantes ante rotaciones espaciales. En general, se transforman a
nuevas componentes Fi0 , G0i que son las componentes de los vectores transformados (pasivamente) F0 , G0 . Pero
como los dos miembros de las ecuaciones se transforman de igual manera, entre las componentes transformadas
se debe cumplir la misma relaci
on
Fi0 = G0i
y por tanto la relaci
on vectorial tambien se preserva con la rotaci
on espacial; en el nuevo sistema coordenado
escribimos
F0 = G0
Es importante enfatizar que la invarianza en la forma se debe a que ambos miembros de la ecuaci
on son
vectores. Decimos que los terminos de la ecuaci
on son covariantes. Es necesario aclarar que el concepto de
covarianza empleado aqu tiene un significado muy distinto al de la covarianza de vectores en el espacio de
Riemann. La covarianza en espacios de Riemann se refiere a la propiedad seg
un la cual algunos vectores
transforman bajo un cambio de coordenadas seg
un la matriz jacobiana de la transformaci
on, en este escenario
el termino se usa por contraposici
on a los vectores (o tensores) contravariantes que transforman con el inverso
de la matriz jacobiana bajo el cambio de coordenadas. En el caso que nos ocupa ahora, la covarianza se define
para los terminos de una ecuaci
on que expresa alguna ley de la Fsica, para indicar que todos los terminos
involucrados en la ecuaci
on (escalares, vectores, tensores) transforman en la misma manera de modo que se
mantiene la forma de la ecuaci
on.
La covarianza por supuesto se puede generalizar para ecuaciones que involucran tensores de orden arbitrario,
si tenemos una ecuaci
on tensorial de la forma C = D los tensores transformados implicar
an la misma igualdad
C0 = D0 siempre que los tensores de ambos miembros sean del mismo rango. Por ejemplo, si
una ecuaci
on posee terminos que son escalares, otros que son vectores etc, no se podr
a mantener invariante
ante una transformaci
on ortogonal tridimensional. Podemos concluir que la invarianza de una ley Fsica ante
una rotaci
on del sistema de coordenadas espaciales, exige la covarianza de los terminos de la ecuaci
on ante
transformaciones ortogonales tridimensionales.
Vamos ahora al espacio extendido de Minkowski o espacio de universo. El manejo all es identico una vez que
hemos caracterizado a las transformaciones ortogonales en este espacio y por ende la estructura de sus tensores
de cualquier rango. A los tensores en este espacio los llamamos tensores de Minkowski o tensores de universo,
genericamente escalares de universo, vectores de universo (cuadrivectores), etc. En consecuencia, la invarianza
de una ley Fsica ante transformaciones de Lorentz ser
a inmediata si se expresa en forma cuadridimensional
covariante, de modo que todos los terminos son tensores de universo del mismo rango. De lo anterior se
deriva que una teora Fsica en el marco de la relatividad especial solo tiene validez si es covariante ante
transformaciones de Lorentz (boosts y rotaciones espaciales).
Notemos por ejemplo que el producto de un n
umero por un cuadrivector solo ser
a otro cuadrivector si
el n
umero es un escalar de universo. Supongamos que es un n
umero que no es escalar de universo, en un
sistema S el producto de este n
umero por un cuadrivector es
F = W
8

N
otese que las Ecs. (16.39) son relaciones numericas pero no son relaciones escalares.

CAPITULO 16. RELATIVIDAD ESPECIAL

426

ante una transformaci


on de Lorentz, F y W transforman como cuadrivectores con una cierta matriz M de
transformaci
on, por otro lado 0 transforma en la forma 0 = N siendo N un operador diferente a la identidad
(ya que no es escalar de universo). Tenemos entonces
0 F0 = (N) (MF) = NM (F)

W0 = MW 0 F0 6= W0

por tanto si W es cuadrivector F no lo es y la ecuaci


on no es covariante de Lorentz. La ecuaci
on se vuelve
covariante si N = 1.
Finalmente, notemos que una ecuaci
on pude ser covariante sin ser manifiestamente covariante. Por
ejemplo, supongamos que tenemos una ecuaci
on de la forma
F + T + H = R
y supongamos que F , T , H no son tensores de universo pero que R s lo es. En general esta ecuaci
on
no ser
a covariante, pero puede ocurrir que la suma de los tres terminos no tensoriales s transforme como
un tensor gracias a ciertos efectos de cancelaci
on, ciertamente si estos terminos no son tensores ser
a mucho
m
as complejo demostrar la covarianza de la ecuaci
on (si es que es covariante). Esta anotaci
on es u
til, porque
a menudo ocurre que se construye una teora en forma manifiestamente covariante, pero luego para efectos
pr
acticos de c
alculo se transforma a una estructura en donde la covarianza no es evidente.

16.5.

Formulaciones covariantes en el espacio de Minkowski

El ejemplo mas simple de cuadrivector de Lorentz es el vector de posici


on de un punto en el espacio de
Minkowski o de universo, donde sus componentes se denotan por (x1 , x2 , x3 , x4 ). Las cuatro coordenadas de
un punto de universo nos dice cuando (tiempo) y donde (espacio) ha ocurrido un suceso, a todo punto de este
espacio se le llama entonces un suceso o un evento.
Cuando una partcula en el espacio ordinario sigue una determinada trayectoria, su punto representativo
en el espacio de Minkowski describe una trayectoria conocida como lnea de universo. El cuadrivector dx
representa la variaci
on del cuadrivector posici
on para un movimiento diferencial a lo largo de la lnea de
universo. Este termino multiplicado por s mismo es un invariante de Lorentz de modo que representa un
escalar de universo denominado d
1
(d )2 = 2 dx dx
(16.40)
c
para elucidar el significado Fsico de d evaluaremos (16.40) en un sistema inercial en el cual la partcula este en
a descrito
reposo instant
aneo. En este sistema el cuadrivector transformado dx0 asociado a esta partcula est
por (0, 0, 0, icdt0 ) y el invariante d se escribe
(d )2 =


1 0 0
0 2
dx
dx
=
dt

c2

con lo que se ve que d es el intervalo de tiempo medido por un reloj que se mueva con la partcula, que se
denomina el tiempo propio o tiempo de universo.
Ahora veamos la relaci
on entre d y el intervalo de tiempo correspondiente a un cierto sistema inercial dt,
usando la Ec. (16.40)
i
i
1 h
1 h
(d )2 = 2 (dx1 )2 + (dx2 )2 + (dx3 )2 + (dx4 )2 = 2 (dx1 )2 + (dx2 )2 + (dx3 )2 c2 (dt)2
c v
c
u
"
#





2
2
2
u
1
dx
dx
dx
1
2
3

d = (dt) t1 2
+
+
c
dt
dt
dt

que se puede escribir en la forma

dt = p

d
1 2

(16.41)

16.5. FORMULACIONES COVARIANTES EN EL ESPACIO DE MINKOWSKI

427

debemos tener en cuenta que en este caso nos est


a representando la velocidad de una partcula con respecto
a un sistema de referencia inercial S. Este es un uso diferente al que se le ha dado hasta ahora como velocidad
relativa (normalizada a c) de un cierto sistema de referencia inercial S 0 con respecto a otro sistema inercial
S. Por supuesto, se puede pensar en como la velocidad relativa del sistema S 0 (con respecto a S) de tal
modo que la partcula est
a en reposo instant
aneo con respecto a S 0 . La Ec. (16.41) nos dice que el intervalo
de tiempo medido por el sistema en el cual la partcula no est
a en reposo es siempre mayor que el intervalo de
tiempo medido en el sistema en donde la partcula est
a en reposo instant
aneo. Este fen
omeno se conoce como
dilataci
on del tiempo y ha sido comprobado experimentalmente en diversas situaciones, particularmente en
la observaci
on de las vidas medias de partculas elementales inestables. La vida media de estas partculas se
puede medir cuando estas est
an en reposo y se compara con su vida media cuando est
an en vuelo a velocidades
cercanas a la de la luz.
Hemos visto que el cuadrado del m
odulo de un cuadrivector no es necesariamente definido positivo. Los
cuadrivectores cuyo m
odulo cuadrado sean positivos se denominan del genero espacial o tambien se denominan
como de espacio o espacialoides. Cuando el m
odulo es cero (lo cual no significa necesariamente que el cuadrivector sea cero) se denominan como de luz. Finalmente, cuando su m
odulo cuadrado es negativo se dice que
es del genero temporal, como de tiempo o
temporaloide. Puesto que este m
odulo al cuadrado es un escalar de
universo, esta denominaci
on no depender
a del sistema inercial utilizado. Los nombres se deben a que el m
odulo
de un vector espacial tridimensional es definido positivo al igual que el cuadrivector del genero espacial, adicionalmente un cuadrivector de este genero siempre se puede transformar de tal forma que se anule su cuarta
componente (temporal). Por otro lado, un cuadrivector del genero temporal tiene su cuarta componente no
nula, pero se puede transformar de tal forma que se anulen todas sus tres componentes espaciales. A manera
de ilustraci
on veamos el comportamiento del vector diferencia o relativo entre dos puntos de universo. Este
vector relativo puede ser del genero espacial, temporal o de luz, definiremos a este vector relativo como
X x1 x2
donde los subndices 1 y 2 denotan los dos sucesos. El m
odulo de este cuadrivector relativo ser
a
X X = |r1 r2 |2 c2 (t1 t2 )2
de modo que X ser
a del genero espacial si los dos puntos de universo est
an separados de modo que
|r1 r2 |2 > c2 (t1 t2 )2
sera como de luz si se cumple la igualdad
|r1 r2 |2 = c2 (t1 t2 )2
y finalmente ser
a del genero temporal si
|r1 r2 |2 < c2 (t1 t2 )2
la condici
on para que el vector diferencia sea temporal equivale a decir que se puede cubrir la distancia entre
los dos eventos o sucesos mediante una se
nal luminosa (e incluso algunas se
nales m
as lentas que la luminosa),
en cuyo caso se habla de sucesos o eventos causalmente conectados. La condici
on de cuadrivector del genero
espacial equivale a que estos eventos no podr
an conectarse con ninguna onda luminosa o se
nal que viaje a
velocidad menor o igual que c, decimos que los eventos est
an causalmente desconectados. Finalmente, si el
cuadrivector diferencia es como de Luz, solo una se
nal que viaje a velocidad c podr
a conectar a estos sucesos (y
no se pueden conectar con se
nales que viajen a velocidades menores), claramente estos son eventos causalmente
conectados.
Podemos elegir el eje x3 de modo que quede alineado con los ejes espaciales r1 r2 del cuadrivector relativo.
Adicionalmente, podemos asumir sin perdida de generalidad que x3(1) x3(2) > 0. En tal caso se tiene que

CAPITULO 16. RELATIVIDAD ESPECIAL

428

|r1 r2 | = x3(1) x3(2) . Si realizamos una transformaci


on de Lorentz pura con velocidad v a lo largo de x3
podemos aplicar las transformaciones dadas en (16.1) para la cuarta componente de X




vx
vx
t1 c3(1)
t2 c3(2)
2
2
p
t01 =
; t02 = p
2
1
1 2

 



vx
vx
vx
vx
t1 c3(1)
t2 c3(2)
t1 t2 3(1)c2 3(2)
2
2
p
p
t01 t02 =
p
=
1 2
1 2
1 2



c (t1 t2 ) vc x3(1) x3(2)
p
c t01 t02 =
(16.42)
1 2

si X es del genero espacial y los sucesos son tales que t1 > t2 nos queda que
c (t1 t2 ) < x3(1) x3(2)

y ser
a posible encontrar una velocidad v < c de modo que se anule la cuarta componente ic (t01 t02 ) X40 .
Fsicamente la anulaci
on de la componente temporal significa que es posible encontrar un sistema inercial
que viaje a velocidad v < c en el cual los dos sucesos sean simult
aneos. Adicionalmente, tambien es posible
encontrar valores de v < c que haga que el miembro de la derecha en (16.42) se vuelva negativo lo cual indicara
que t02 > t01 , de modo que encontramos un sistema de referencia inercial en el cual se invierte la secuencia de
los sucesos. El que pueda invertirse la secuencia de sucesos entre eventos del genero espacial no constituye una
violaci
on de la causalidad ya que estos eventos est
an causalmente desconectados y no hay manera de que un
suceso pueda influr en el otro. Por ejemplo, nada de lo que ocurra ahora en la tierra puede afectar a la estrella
alfa centauri dentro de los siguientes cuatro a
nos en virtud de su distancia a la tierra de unos cuatro a
nos luz.
En contraste, para separaciones del genero temporal entre sucesos, no es posible encontrar una transformaci
on de Lorentz que los haga simult
aneos y menos a
un que pueda invertir el orden temporal de los sucesos.
As debe ser, puesto que estos eventos s est
an causalmente conectados y pueden influr el uno sobre el otro.
Esto implica que el antes y el despues, o la causa y el efecto, son conceptos invariantes de Lorentz y se preserva
la causalidad.
Es importante establecer la generalizaci
on relativista de las cantidades Newtonianas m
as importantes. Por
ejemplo la velocidad
dxi
vi =
dt
no puede extrapolarse de manera inmediata para construr un cuadrivector de Lorentz ya que la cantidad
v = dx /dt es el producto de un cuadrivector (dx ) con una cantidad que no es escalar (dt no es invariante de
Lorentz) de modo que el resultado no es un cuadrivector. El invariante m
as obvio asociado a dt es el diferencial
on por unidad
de tiempo propio d , de modo que resulta natural definir la cuadrivelocidad u como la variaci
de tiempo del vector de posici
on de una partcula (medida en un sistema S) con respecto al tiempo propio de
dicha partcula (invariante)
dx
dx
u =
= p
(16.43)
d
dt 1 2
cuyas componentes espacial y temporal son
ui =

dx
vi
dx4
ic
p i
=p
; u4 = p
=p
dt 1 2
1 2
dt 1 2
1 2

(16.44)

la cuadrivelocidad (o velocidad de universo) m


odulo cuadrado es invariante de Lorentz
u u =

v2
c2

= c2
1 2 1 2

(16.45)

y es adem
as del genero temporal. Por supuesto, la cuadrivelocidad no tiene un significado Fsico directo ya que
para medir dx y d se est
an usando en general sistemas de referencia diferentes. Sin embargo, la Ec. (16.44)

16.5. FORMULACIONES COVARIANTES EN EL ESPACIO DE MINKOWSKI

429

nos muestra que la cuadrivelocidad contiene toda la informaci


on sobre la velocidad Fsica y tiene la ventaja
de que si escribimos las expresiones en terminos de la cuadrivelocidad, ser
a m
as f
acil chequear la covarianza
de las ecuaciones gracias a la naturaleza cuadrivectorial de u .
Otro cuadrivector de enorme importancia es el cuadrivector j formado con la corriente electrica j unida con
la cantidad ic siendo la densidad de corriente electrica. Para obtener esta forma cuadrivectorial comenzamos
con la ecuaci
on de continuidad

=0
j+
t
que me expresa la conservaci
on de la carga, si asumimos que la conservaci
on de la carga es v
alida en todos los
sistemas de referencia inerciales, entonces esta ecuaci
on debe conservar su forma ante una transformaci
on de
Lorentz. Dado que j est
a asociado en la ecuaci
on de continuidad a derivadas en el espacio es razonable pensar
que haga parte de las componentes espaciales de un cuadrivector, similarmente dado que est
a asociado a una
derivada temporal resulta razonable pensar que hace parte de la componente temporal del cuadrivector. Para
escribir esta ecuaci
on en forma manifiestamene covariante escrib
amosla en componentes
jk

+
xk
t

j
(ic)
jk
+
=0
=0
xk
(ict)
x
j = 0 ; j (j1 , j2 , j3 , ic)
=

(16.46)

en primer lugar, es f
acil ver que el operador cuadrigradiente se transforma en el espacio de Minkowski como
un cuadrivector9
x

=
= L0
= L
x0
x0 x
x
x
donde hemos usado la ortogonalidad de L. Dado que es un cuadrivector, se tiene que j tambien debe serlo
si la ecuaci
on de continuidad ha de ser covariante, es decir si la carga se ha de conservar en todos los sistemas
inerciales. Para ver el car
acter cuadrivectorial de j basta con demostrar que j = 0 u siendo 0 la densidad
de carga en el sistema en el cual las cargas est
an en reposo, es decir es la densidad de carga propia. Se deja
esta demostraci
on como ejercicio al lector.
Vemos pues que la cantidad j es invariante ante una transformaci
on de Lorentz (escalar de universo)
ya que es la contracci
on de dos cuadrivectores. Este ejemplo nos muestra una forma de escribir una ley Fsica
en una forma manifiestamente covariante.
Veamos otro ejemplo de cuadrivector muy importante en la Fsica. Es bien conocido de la teora cl
asica
electromagnetica que los potenciales escalar y vectorial obedecen ecuaciones de onda desacopladas
1 2A
4
= j ;
c2 t2
c
siempre y cuando se imponga la condici
on de Lorentz.
2 A

1 2
= 4
c2 t2

(16.47)

1
=0
(16.48)
c t
N
otese que la condici
on de Lorentz es semejante en estructura a la ecuaci
on de continuidad, por ello usando
un argumento similar al usado para la ecuaci
on de continuidad es natural pensar que A est
a asociado a
las componentes espaciales de un cuadrivector y a la componente temporal. Esta asociaci
on parece estar
reforzada por las Ecs. (16.47) donde A tiene como fuente a j (que a su vez forma parte de la componente
espacial del cuadrivector j ) en tanto que tiene como fuente a (donde este u
ltimo es parte de la componente
temporal de j ). Comencemos por la condici
on gauge Ec. (16.48) que se puede reescribir como

 

(i)

= 0 = ,
; A (A, i)
(16.49)
i Ai +
= ,
(ict)
x4
ict
A = 0
(16.50)
A+

Recordemos que en la formulaci


on de espacios de Riemann, este operador se transforma covariantemente y la ecuaci
on (16.46)
es el producto escalar de un vector covariante con un contravariante, esto se denota como j = 0. En general los invariantes en
el espacio de Riemann son combinaciones de tensores covariantes con tensores contravariantes, de modo que deben escribirse con
ndice arriba contrado con ndice abajo e.g. j k , k p .

CAPITULO 16. RELATIVIDAD ESPECIAL

430
las Ecs. (16.47) se pueden reescribir en la forma
2 A +

2A
4
2 = c j
(ict)

2 i

1 2 i
4
= ic
2
2
c t
c

(16.51)

definimos el operador de DAlembert en la forma


1 2

= 2 +
= i i + 4 4
2
2
c t
(ict)2
2
 =
x x

 2

(16.52)

las Ecs. (16.51) en el espacio de Minkowski quedan


A =

4
j
c

 (i) =

4
ic
c

que se puede condensar en una sola ecuaci


on cuadrivectorial con j = (j, ic) y A = (A, i)
A =

4
j
c

(16.53)

Una vez que se demuestre que la cuadrupla A definida en (16.49) es un cuadrivector de Lorentz, se sigue
que las Ecs. (16.50) y (16.53) est
an escritas de manera manifiestamente covariante. Se deja esta demostraci
on
como ejercicio al lector. En (16.50) ambos miembros son escalares de universo, en tanto que en (16.53) ambos
miembros son vectores de universo, pues el operador de DAlembert es un escalar de universo. Estas ecuaciones
demuestran que la teora electromagnetica de Maxwell es covariante con respecto a las transformaciones de
Lorentz de modo que est
a descrita por la relatividad especial y no por la relatividad de Galileo. El lector puede
verificar que el uso del gauge de Coulomb A = 0 hace mucho m
as difcil el proceso de colocar las ecuaciones
de manera manifiestamente covariante.

16.6.

Fuerza y momento en relatividad especial

Las leyes de Newton son invariantes de Galileo y por tanto no son invariantes de Lorentz. En consecuencia,
es necesario encontrar una generalizaci
on adecuada de fuerza cuya ley fundamental satisfaga los requisitos
de covarianza ante transformaciones de Lorentz. Naturalmente, debemos tambien exigir que las ecuaciones
relativistas se reduzcan a la ecuaci
on din
amica fundamental de Newton en el lmite 0
d
(mvi ) = Fi
dt

(16.54)

es f
acil ver que las componentes espaciales de un cuadrivector forman un vector espacial, ya que las transformaciones de Lorentz contienen a las rotaciones espaciales (L4i = Li4 = 0 y L44 = 1). No obstante, el recproco
no es cierto, las componentes de un vector espacial no se transforman necesariamente como lo haran las
componentes espaciales de un cuadrivector. Por ejemplo, se puede multiplicar a las componentes del trivector
por una funci
on cualquiera de y sus propiedades de rotaci
on no se alteran. En cambio, esta multiplicaci
on
s alterara las propiedades de transformaci
on de las tres componentes espaciales de un cuadrivector ante una
transformaci
on de Lorentz. En
p concordancia con esto, las componentes espaciales de la cuadrivelocidad u
forman un vector espacial
v/
1 2 . Sin embargo, la v no hace parte de ning
un cuadrivector, para que lo
p
2
sea debe dividirse por 1 .
Primero buscaremos una generalizaci
on cuadrivectorial del miembro izquierdo en (16.54), es claro que la
cuadrivelocidad definida en (16.44) posee una parte espacial que se reduce a v cuando 0. Tomaremos a m
como un invariante que lo llamaremos la masa en reposo o masa propia de la partcula. En cuanto al tiempo
t, este no es un invariante relativista pero sabemos que el tiempo propio s es un invariante que adem
as se

16.6. FUERZA Y MOMENTO EN RELATIVIDAD ESPECIAL

431

reduce a t cuando 0. Los argumentos anteriores sugieren que la generalizacion de la ley de Newton (16.54)
para una partcula tenga la forma
d
(mu ) = K
(16.55)
d
donde K debe ser un cuadrivector llamado fuerza de Minkowski.
N
otese que en general las componentes espaciales de K no tienen que coincidir con las componentes de la
fuerza, salvo por supuesto en el lmite no relativista con 0. Podemos pensar por ejemplo que Ki se puede
construr como el producto de Fi con cierta funci
on h () que se reduzca a la unidad en el lmite no relativista.
Para conocer la forma de h () debemos conocer el comportamiento de la fuerza ante una transformaci
on de
Lorentz. Utilizaremos dos procedimientos.
En el primer procedimiento, tendremos en cuenta que las fuerzas fundamentales son solo cuatro: las interacciones gravitacional, electromagnetica, nuclear debil y nuclear fuerte. La idea sera expresar las leyes que
gobiernan a estas interacciones de manera covariante. No obstante, no se conoce teoras covariantes para las
fuerzas nucleares, entre otras cosas porque tales interacciones no se pueden modelar cl
asicamente en forma
satisfactoria (en la teora cu
antica la fuerza pierde su significado y es reemplazada por la energa potencial). Sin
embargo, en el caso electromagnetico cl
asico es de esperarse que podamos construr una expresi
on de la fuerza
que nos proporcione una ecuaci
on covariante, despues de todo la teora especial de la relatividad fue construda justamente para que las ecuaciones de Maxwell fueran covariantes de Lorentz. Afortunadamente, esta
construcci
on sera suficiente ya que las propiedades de transformaci
on de las fuerzas deben ser las mismas independientemente de su origen. Por ejemplo, el hecho de que una partcula este en equilibrio (suma de fuerzas
cero) debe ser independiente del sistema de referencia inercial utilizado y esto solo es posible si las fuerzas
transforman todas igual, incluso si cada una es de diferente naturaleza.
Vimos que a partir de la expresi
on para la fuerza de Lorentz escrita en terminos de potenciales en lugar
de campos, la fuerza electromagnetica que se ejerce sobre una partcula cargada viene dada por





1
1 dAi
Fi = q
vA +
xi
c
c dt
recordando la definici
on del cuadripotencial (16.49), y de la cuadrivelocidad (16.44) podemos escribir la expresi
on (1/c) v A en forma covariante
!
 p
 p
1
1p
ic
1
1
1 2
v
2
2
p i
v A = i
1 p
vi Ai = A4
1 u4
Ai
c
c
c
c
c
1 2
1 2
1
1p
1p
1p
vA =
1 2 A4 u4
1 2 ui Ai =
1 2 [A4 u4 + ui Ai ]
c
c
c
c
1
1p
vA =
1 2 u A
c
c

y las componentes Fi de las fuerzas son


"
#
 p


1
1p
dAi
2
2
Fi = q

1 u A +
1 p
xi
c
c
1 2 dt


qp

dAi
Fi =
1 2
(u A )
c
xi
d

(16.56)

una extensi
on cuadrivectorial del termino entre parentesis es de la forma
dA

(u A )
x
d

este termino es claramente un cuadrivector, pues el primer termino es la derivada (operador cuadrivectorial)
de un escalar de universo, el segundo termino es el producto de un cuadrivector dA por un escalar de universo
(d )1 . En consecuencia, la expresi
on en parentesis cuadrados en (16.56) est
a asociada a las componentes

CAPITULO 16. RELATIVIDAD ESPECIAL

432

p
espaciales de un cuadrivector. Por tanto, Fi es el producto de 1 2 por la componente espacial de un
on entre la fuerza
cuadrivector, el cual identificamos como la fuerza de Minkowski K . Por tanto la relaci
ordinaria y la de Minkowski est
a dada por
p
Fi = Ki 1 2
(16.57)
esta relaci
on debe ser general e independiente del origen de las fuerzas. Para el caso de partculas cargadas
sometidas a un campo electromagnetico, la fuerza de Minkowski se obtiene de la extrapolaci
on de la expresi
on
(16.56)


q
dA
K =
(16.58)
(u A )
c x
d

En un segundo procedimiento, se define la fuerza como la variaci


on del momento lineal por unidad de
tiempo, en todos los sistemas de Lorentz se tiene entonces que
Fi =

dpi
dt

(16.59)

pero para ello ser


a necesario redefinir el momento lineal pi de modo que en el lmite no relativista se reduzca
a mvi . Podemos hallar la forma que toma el momento y el significado de K haciendo que la Ec. (16.55)
se parezca en lo posible a (16.59). A partir de la relaci
on entre y t y de la definici
on de cuadrivelocidad,
podemos escribir las componentes espaciales de (16.55) en la forma
d
dt

mvi
1 2

= Ki

p
1 2

(16.60)

y comparando (16.60) con (16.59) vemos que el teorema de conservaci


on del momento lineal (reemplazante
m
as general que la tercera ley de Newton) ser
a invariante de Lorentz si definimos la cantidad de movimiento
en la forma
mvi
pi = p
(16.61)
1 2

y que Fi y Ki esten relacionadas como lo indica la ecuaci


on (16.57). Notese que la ecuaci
on (16.61) se reduce
a mvi cuando 0 como se esperaba. Los dos procedimientos conducen entonces a los mismos resultados.
Comparando (16.61) con la definici
on (16.44) de la cuadrivelocidad vemos que pi es la parte espacial del
llamado cuadrivector momento energa
p = mu
(16.62)
la ecuaci
on de movimiento generalizada para una partcula se escribe entonces
dp
= K
d

16.7.

(16.63)

Energa y relaci
on momento-energa en relatividad especial

Hasta ahora solo hemos estudiado la parte espacial de las ecuaciones cuadrivectoriales (16.55, 16.63). Para
obtener informaci
on de la parte temporal hagamos el producto interno de (16.55) por la cuadrivelocidad
u


d
d m
(mu ) =
u u = K u
d
d 2

de (16.45) vemos que u u = c2 y como m es tambien constante, vemos que la expresi


on de la mitad se
anula. Luego
K u Ki ui + K4 u4 = 0

MOMENTO-ENERGIA EN RELATIVIDAD ESPECIAL


16.7. ENERGIA Y RELACION

433

y usando las Ecs. (16.44, 16.57) tenemos


K u p

Fi
1 2

vi
1 2

+ K4

ic
1 2

de modo que la cuarta componente de la fuerza de Minkowski ser


a
K4 =

Fv
icK4
+p
=0
2
1
1 2

i Fv
p
c 1 2

(16.64)

la componente temporal de la Ec. (16.55) se obtiene empleando (16.44) y (16.64)


!
d
1
d
ic
i Fv
(mu4 ) = K4 p
mp
= p
2
2
d
c 1 2
1 dt
1
finalmente la cuarta componente de (16.55) queda de la forma
!
d
mc2
p
=Fv
dt
1 2

(16.65)

recordemos ahora el escenario no relativista. En este escenario F v corresponde al trabajo por unidad de
tiempo que se hace sobre la partcula dW/dt. Teniendo en cuenta adem
as el teorema fundamental del trabajo
y la energa resulta dW = dT siendo T la energa cinetica. De esto se concluye que
Fv =

dW
dT
=
(lmite no relativista)
dt
dt

Extrapolando esta definici


on al caso relativista tenemos que
dT
= F v (escenario relativista)
dt

(16.66)

Comparando (16.65) con (16.66) se obtiene la generalizacion relativista de la energa cinetica


T =p

mc2
1 2

(16.67)

en el lmite 2 << 1 esta ecuaci


on se expande como


2
1
2

T = mc 1 +
= mc2 + mv 2
2
2
Este valor no coincide con el lmite no relativista esperado. Sin embargo, el valor adicional pareciera a priori ser
irrelevante ya que se puede adicionar una constante a la derecha de (16.67) que no afectara la validez de la Ec.
(16.65). Sin embargo, es preferible mantener este valor y conservar la cantidad T en la forma dada por (16.67),
hay dos buenas razones para mantener esta cantidad: (a) En algunos casos como veremos m
as adelante mc2
puede cambiar gracias al cambio en la masa en reposo de las partculas, por ejemplo en colisiones inel
asticas.
Esto nos indica que este tipo de energa se puede intercambiar o transferir y por tanto es Fsicamente relevante
y (b) al comparar (16.62) con (16.67) vemos que iT /c es la cuarta componente del cuadrivector momento
energa
mvi
imc
iT
p = (p1 , p2 , p3 , p4 ) ; pi = mui = p
; p4 = mu4 = p
=
2
2
c
1
1

Sin embargo, para usar una terminologa consistente con la newtoniana es preferible definir la energa cinetica
como la parte de esta energa que se reduce correctamente al valor no relativista
K T mc2 = mc2 ( 1)

CAPITULO 16. RELATIVIDAD ESPECIAL

434

no existe una u
nica designaci
on para T . En ocasiones se le llama energa total (si bien esto solo sera apropiado
para partcula libre) y en otras simplemente energa. En todo caso T posee propiedades interesantes. Por
ejemplo se puede demostrar que la T dada por (16.67) se conserva siempre que se conserve el momento
lineal espacial definido en (16.61). Para verificar este teorema, podemos tener en cuenta que la conservaci
on
del momento espacial debe ser invariante ante una transformaci
on de Lorentz, en realidad esta invarianza
esta implcita en la definici
on de sistema inercial dada por Einstein. Las componentes transformadas p0j ser
an
funciones lineales de las pi pero tambien de p4 i.e. de la energa T . En consecuencia, la conservaci
on de p0j para
todos los sistemas inerciales exige la conservaci
on conjunta de todas las componentes de p . Es f
acil calcular
el valor del invariante p p
p p = (mu ) (mu ) = m2 u u = m2 c2
(16.68)
por otro lado
p p =

iT
p,
c

 

T2
iT
p,
= p2 2
c
c

(16.69)

siendo p el trimomento espacial definido en (16.61). Combinando (16.68) y (16.69) se obtiene la relaci
on
cinem
atica fundamental para la relatividad especial
T 2 = p2 c2 + m2 c4

(16.70)

la Ec. (16.70) es la an
aloga a la relaci
on no relativista T = mv 2 /2 con la diferencia de que en relatividad T
2
incluye la energa en reposo mc . La definici
on de T Ec. (16.67) muestra que la energa de una partcula con
energa en reposo finita tiende a infinito cuando v c, es decir que se requiere una energa infinita para llevar
una partcula material desde el reposo hasta una velocidad c. Por tanto la teora predice que no es posible
alcanzar o superar la velocidad de la luz en el vaco partiendo de una velocidad menor que c.
El enunciado anterior no prohbe la existencia de partculas que nazcan con velocidades mayores a las de
la luz (taquiones). De acuerdo con la Ec. (16.67) la masa asociada a esta partcula tendra que ser imaginaria
para tener p
una energa real. Esto implica que un taqui
on est
a descrito por un par
ametro real m0 de modo que
0
2
2
T = m c / 1. Las soluciones taqui
onicas y en particular sus implicaciones sobre la causalidad han sido
motivo de una amplia especulaci
on cientfica. No obstante, no se han observado partculas taqui
onicas hasta
el momento.
Ya hemos dicho que en relatividad especial la conservaci
on del trimomento conduce a la conservaci
on
de la cuarta componente del cuadrivector momento energa. Esta situaci
on contrasta con la mec
anica no
relativista, en la cual la conservaci
on del momento lineal y la conservaci
on de la energa cinetica son aspectos
independientes. Por ejemplo, en un choque inel
astico entre dos partculas se conserva el momento lineal pero no
la energa cinetica, esto se debe a cambios en la energa interna del sistema debido a reconfiguraciones internas.
En el caso relativista, la energa T debe conservarse junto con el momento espacial incluso en choques inel
asticos
debido a sus propiedades de transformaci
on como cuadrivector. Fsicamente, esto se entiende teniendo en cuenta
que T posee dos terminos, la energa cinetica y la energa en reposo mc2 . En un choque inel
astico la energa
cinetica relativista cambia tambien en virtud de reconfiguraciones internas del sistema, pero en este caso estos
cambios en la energa interna se traducen en cambios en la energa en reposo y por tanto de la masa en reposo.
Veamos un ejemplo sencillo del hecho de que la conservaci
on de T implica un cambio en la masa en reposo en
colisiones inel
asticas. Sean dos partculas identicas en masa que viajan con respecto al laboratorio a velocidades
iguales y opuestas. El momento lineal total es nulo visto por el laboratorio y el cuadrivector momento energa
viene dado por

 
 

iT
iT
2iT
P = p (1) + p (2) = p,
+ p,
= 0,
(16.71)
c
c
c
siendo T la energa de cada partcula definida por la Ec. (16.67). Supongamos que el choque es totalmente
inel
astico de modo que las dos masas quedan unidas (como dos bolas de plastilina). Puesto que en el estado
final tenemos una sola partcula y su trimomento es nulo, la partcula resultante debe estar en reposo con
respecto al laboratorio. La energa total del estado final Tf es la energa en reposo del sistema compuesto final,
la cual aplicando (16.70) resulta
Tf = M c2
(16.72)

LAGRANGIANA DE LA MECANICA

16.8. FORMULACION
RELATIVISTA

435

siendo M la masa del estado final. es conveniente parametrizar la masa del estado final en la forma
M = 2m + M

(16.73)

donde M nos da informaci


on sobre la posible perdida o ganancia de masa del estado final (de masa M ) con
respecto a la masa del sistema inicial (de masa 2m). La conservaci
on de P4 en el choque manifestada en la Ec.
(16.71) muestra que
Tf = 2T
(16.74)
la cual combinada con (16.72) nos da
2T = M c2

(16.75)

es claro que se ha perdido energa cinetica en el proceso, la energa cinetica al principio y al final del proceso
est
an dadas por
K0 = 2T 2mc2 ; Kf = 0
y usando (16.74), (16.73) y (16.75)
K0 Kf

K0 Kf

= 2T 2mc2 = M c2 2mc2 = (2m + M ) c2 2mc2


= (M ) c2

por lo tanto, el choque inel


astico ha convertido toda la energa del movimiento inicial vista por el laboratorio en
un incremento en la masa en reposo del sistema. En esta clase de choque inel
astico se suele decir que la energa
cinetica perdida en el choque se convierte en calor. La relatividad restringida nos dice que la masa en reposo o
inercia del sistema aumenta en proporci
on al calor que se produce. Este incremento de masa se podra detectar
poniendo al sistema en movimiento a traves de una fuerza conocida, no obstante para sistemas macrosc
opicos
estos cambios de masa son muy difciles de detectar ya que un joule de energa posee un equivalente de masa de
aproximadamente 1,1 1017 Kg. No es de extra
narse entonces que las evidencias sobre los cambios de la masa
en reposo se hayan visto en sistemas de escala at
omica, nuclear o subnuclear. En estos casos no podemos hablar
de producci
on de calor sino de cambios en la energa interna del sistema. A la escala subnuclear, estos cambios
en la energa en reposo suelen ser suficientes para permitir la creaci
on de una o m
as partculas adicionales.
Es de anotar adem
as que estos cambios tambien pueden ocurrir en el sentido opuesto: la energa en reposo se
puede convertir en energa en movimiento, fen
omeno particularmente visible en las explosiones nucleares, por
supuesto en estas explosiones el valor de T permanece constante durante la explosi
on. A pesar de la enorme
energa liberada en estas explosiones, la perdida de masa suele ser del orden del 0,1 % de la masa original.

16.8.

Formulaci
on Lagrangiana de la mec
anica relativista

Dado que hemos realizado la generalizaci


on adecuada de las leyes de Newton en el marco de la relatividad
restringida, podemos intentar establecer una formulaci
on Lagrangiana para la din
amica relativista. Vamos
a describir dos procedimientos. En el primero, se pretende reproducir en un sistema inercial particular las
ecuaciones de la forma (16.59), resultando en general una formulaci
on que no es manifiestamente covariante. Las fuerzas Fi podran estar o no adecuadamente relacionadas con una fuerza de Minkowski K . El otro
metodo consiste en construr un principio de Hamilton covariante a partir del cual se llega a las ecuaciones
de Lagrange en las cuales el espacio y el tiempo se tratan como coordenadas de un espacio de configuraci
on
de cuatro dimensiones. El primer metodo puede presentar problemas cuando las fuerzas no se formulan bien
relativsticamente, pero generalmente las ecuaciones de movimiento as obtenidas son correctas relativsticamente en un sistema inercial dado, aunque no sean manifiestamente covariantes. El segundo metodo aunque
formalmente m
as correcto, desemboca en grandes dificultades incluso para sistemas de una partcula. Para
sistemas de varias partculas falla casi desde el principio y no hay una formulaci
on covariante satisfactoria
para la mec
anica cl
asica relativista de muchas partculas. Este sigue siendo un tema activo de investigaci
on.

CAPITULO 16. RELATIVIDAD ESPECIAL

436

16.9.

Formulaci
on no manifiestamente covariante

La idea es encontrar una Lagrangiana que nos lleve a las ecuaciones de movimiento relativistas que constituyeron nuestra generalizaci
on de las Leyes de Newton. Estas ecuaciones ser
an obtenidas en funci
on de las
coordenadas de un determinado sistema inercial. N
otese que el principio de DAlembert resulta poco fructfero
en este caso, ya que aunque tal principio sigue siendo v
alido, las deducciones b
asicas se basaban en el hecho
de que pi = mi vi relaci
on que ya no es v
alida en relatividad restringida. Por lo tanto, elegiremos el camino de
tomar como punto de partida el principio de Hamilton
I =

t2

L dt = 0

(16.76)

t1

y obtener con base en las ecuaciones de Euler Lagrange ecuaciones de movimiento que concuerden con las
generalizaciones obtenidas para el formalismo Newtoniano Ec. (16.59). Estudiaremos el caso de una partcula
sometida a fuerzas conservativas que no dependen de la velocidad, en cuyo caso escribimos
p
L = mc2 1 2 V
(16.77)

siendo V un potencial que solo depende de la posici


on y 2 = v 2 /c2 donde v es la velocidad de la partcula en el
sistema inercial particular que se toma. Veamos que este Lagrangiano nos conduce a las ecuaciones correctas,
partiendo de las ecuaciones de Lagrange


d L
L

=0
dt vi
xi
y teniendo en cuenta la relaci
on
r


 v

L

vk vk
mc2
mvi
k
2
=
= pi
mc 1 2
= q
2 2 ki = p
vi
vi
c
c
1 2
2 1 vk 2vk

(16.78)

se obtiene

dpi
V
+
=0
dt
xi

dpi
V
=

dt
xi

dpi
= Fi
dt

que concuerda con (16.59). N


otese que el lagrangiano NO es de la forma L = T V . No obstante, la expresi
on
L/vi sigue siendo el momento lineal como ocurre en la formulaci
on no relativista con coordenadas cartesianas
y potencial independiente de las velocidades. En realidad es este hecho lo que garantiza la correcci
on adecuada
de las ecuaciones de Lagrange. Por tanto, hubieramos podido proceder hacia atr
as desde (16.78) para obtener
al menos la dependencia de la velocidad del Lagrangiano.
La generalizaci
on de (16.77) a sistemas de muchas partculas o a sistemas de coordenadas generalizadas qj
es directa. Las cantidades de movimiento can
onicas siguen definiendose en la forma
pj =

L
qj

(16.79)

de modo que se mantiene la relaci


on entre coordenadas cclicas y la conservaci
on de los momentos asociados
a ellas. Adicionalmente, si el Lagrangiano no depende explcitamente del tiempo se sigue manteniendo a la
funci
on h como constante de movimiento
h = qj pj L
(16.80)
p
hay sin embargo, una diferencia importante con el caso no relativista: debido al factor 1 2 en el Lagrangiano (16.77), dicho Lagrangiano no es una funci
on homogenea de la velocidad, de modo que la demostraci
on
realizada en el caso no relativista para llegar a que h es la energa del sistema (en el caso de potenciales
dependientes de la posici
on y coordenadas que no dependen explcitamente del tiempo) no es v
alida en el caso

NO MANIFIESTAMENTE COVARIANTE
16.9. FORMULACION

437

relativista. Veremos sin embargo que para potenciales que solo dependen de la posici
on, h contin
ua siendo la
energa total del sistema
p
mvi vi
h = x i pi L = p
+ mc2 1 2 + V
1 2
!
!
p
p
1 2
mvi
mvi
p
p
h =
+ mc2 1 2 + V
m
1 2
1 2
h
i
p
pi pi
h =
+ mc2 + V
(16.81)
1 2
m

por otro lado de la Ec. (16.70) vemos que

pi pi = p2 =

T2
m2 c2
c2

(16.82)

y reemplazando (16.82) en (16.81) resulta


 2

p
p
T
T2
2
2
2
+
V
=
h =
1 2

mc
+
mc
1

+V
mc2
mc2
p
 
1
1 2 2
T
+
V
=
T2 + V
h =
mc2
T
la funci
on energa queda entonces
h= p

mc2
1 2

+V =T +V =E

(16.83)

de modo que para el caso de potenciales dependientes solo de la posici


on, h se conserva y es la energa del
sistema (naturalmente hemos usado coordenadas cartesianas de modo que la transformaci
on de coordenadas
a las coordenadas generalizadas es trivial).
La introducci
on de potenciales dependientes de la velocidad no conlleva ninguna dificultad particular y se
puede efectuar en forma an
aloga al caso no relativista. De esta forma, para el caso de una partcula inmersa en
un campo electromagnetico, el lagrangiano se obtiene reemplazando V por el potencial de Lorentz en (16.77)
p
q
L = mc2 1 2 q + A v
(16.84)
c
puede verse que el momento can
onico ya no es mui , pues en este caso hay terminos adicionales debidos a la
parte del potencial que depende de la velocidad
q
pi = mui + Ai
c

(16.85)

esta relaci
on es an
aloga a la Ec. (5.2) obtenida para el caso no relativista. El Lagrangiano (16.84) no es
manifiestamente covariante pues no est
a escrito en terminos de tensores de Lorentz. Sin embargo, en este caso
se espera que estos resultados sean v
alidos en cualquier sistema de referencia inercial en virtud de la covarianza
relativista de la fuerza de Lorentz, de la cual proviene el potencial dependiente de la velocidad que se usa en
(16.84).
De lo anterior se desprende que muchas de las estrategias y propiedades desarrolladas para la mec
anica no
relativista se pueden aplicar en un escenario relativista como veremos en los siguientes ejemplos

16.9.1.

Movimiento bajo una fuerza constante (hiperb


olico)

Sin perdida de generalidad se puede tomar el eje x1 a lo largo de la fuerza constante. El Lagrangiano tiene
la forma
p
x
L = mc2 1 2 + max ;
c

CAPITULO 16. RELATIVIDAD ESPECIAL

438
Las ecuaciones de Lagrange quedan
"
 
d L
d
=
dt x
dt x
L
x

mc

x 2
1 2
c

!#

d
=
dt

= ma

y se obtiene
d
c
dt

m
1 2

ma = 0 ;

la primera integraci
on se escribe como

d
dt

at +
c

mx
1 2

1 2

d
=c
dt

m
1 2

a
c

siendo una constante de integraci


on. Podemos despejar de esta ecuaci
on elevando al cuadrado a ambos
lados
"
#

2
(at + )2
(at + )2
(at + )2
(at + )2
2
2
2
=
=
1 1+
=
1 2
c2
c2
c2
c2
"
#
q

2
2
(at + )2
2
2 c + (at + )
2

=

c + (at + ) = (at + )
c2
c2

=q

at +

(16.86)

c2 + (at + )2

la Ec. (16.86) ser


au
til para examinar el lmite no relativista, por el momento continuamos manipulando la
expresi
on
x
at +
at +

=q
dx = c q
dt
(16.87)
c
2
2
2
2
c + (at + )
c + (at + )

Una segunda integraci


on con t0 entre 0 y t y con x0 entre x0 y x nos da
Z x
Z t
(at0 + ) dt0
0
q
dx = c
x0
0
c2 + (at0 + )2
da la soluci
on

la velocidad se obtiene de (16.87)

c
x = x0 +
a

q

p
2
2
2
2
c + (at + ) c +

x = v =

c
a + a2 t

a 2at + c2 + 2 + a2 t2

y al evaluarla en t = 0 tenemos

(16.88)

(16.89)

c
(16.90)
+ 2
la Ec. (16.90) muestra que est
a directamente relacionado con la velocidad inicial. Si la partcula parte del
reposo en el origen las condiciones iniciales quedan x0 = v0 = = 0, y la Ec. (16.88) se puede escribir en la
forma
q

q

c
c2
c
2
2
2
2
x =
c + (at) c x +
=
c + (at)
a
a
a

2

2

c2
c2  2
c2
c4
2 2

x+
= 2 c +a t x+
c2 t2 = 2
a
a
a
a
v0 =

c2

NO MANIFIESTAMENTE COVARIANTE
16.9. FORMULACION

439

que describe la ecuaci


on de una hiperbola en el plano x t.
Veamos ahora como se recobra el lmite no relativista. La Ec. (16.86) se puede reescribir como
= r

1
c
at+

2

+1

y como el lmite no relativista corresponde a 0 se ve que esto es equivalente a la condici


on [c/ (at + )]2 >>
1, o lo que es lo mismo at + << c. Reemplazando dicho lmite en (16.88) se obtiene la par
abola tpica del
movimiento no relativista y adem
as se llega a que v0 .
Este movimiento puede describir por ejemplo, la trayectoria de electrones que se aceleran con un campo
electrico constante y uniforme. Pues las velocidades tpicas de los electrones son al menos del orden de la
velocidad de la luz en el vaco.

16.9.2.

Oscilador arm
onico unidimensional relativista

En este caso el Lagrangiano (16.77) toma la forma


L = mc2

1
1 2 kx2
2

dado que L no es funci


on explcita del tiempo entonces la funci
on energa y por tanto la energa total del
sistema es una constante de movimiento. Si despejamos la velocidad en la Ec. (16.83) teniendo en cuenta que
h es la energa, se tiene
E=p

mc2
1 2

+ V (E V )2 =
1
c2

m2 c4
m2 c4
m2 c4
2
2

=
1

2
1 2
(E V )
(E V )2
dx
dt

2

=1

m2 c4
(E V )2

(16.91)

podemos generalizar un poco antes de entrar en el potencial del oscilador arm


onico. Sea un potencial tal que
V (x) = V (x) y tal que V (0) es un mnimo local. Si la energa E est
a entre V (0) y el m
aximo de V el
movimiento ser
a oscilatorio entre los lmites x = b donde b est
a determinado por
V (b) = E
el periodo del movimiento oscilatorio se puede obtener a partir de (16.91)

  s
2
4
1 dx
m c
1
dx
= dt
q
= 1
2 c
2 4
c dt
(E V )
1 m c 2
(EV )

un periodo consistir
a en ir y volver desde b hasta b. Por simetra esto se puede escribir como cuatro veces la
integral entre 0 y b
Z
4 b
dx
q
=
(16.92)
2 4
c 0
1 m c 2
[EV (x)]

cuando (16.92) se aplica al potencial de Hooke, se puede expresar en terminos de integrales elpticas. No
obstante, ser
a m
as ilustrativo examinar las correcciones relativistas de primer orden cuando V (x) << mc2 .
Escribiremos la energa total E de la forma
E = mc2 (1 + E)

CAPITULO 16. RELATIVIDAD ESPECIAL

440
con lo cual se tiene que
E V (x)
mc2
E V (x)
mc2

mc2 (1 + E) 12 kx2
= 1 + E x2
mc2

E
= 1 + b2 x 2
; b2

k
2mc2

y el termino en el interior del radical en (16.92) resulta


m2 c4
1
[E V (x)]2

= 1

[1 + (b2 x2 )]2

2 b2 x2

1 + b2 x 2

2

[1 + (b2 x2 )]2


2
2 b2 x2 + 2 b2 x2
[1 + (b2 x2 )]2

[1 + (b2 x2 )]2

2
Donce hemos conservado terminos hasta orden b2 . El periodo es aproximadamente
4

=
c

dx

2(b2 x2 )
[1+(b2 x2 )]2

4
c

dx

2 (b2 x2 )



1 + b2 x 2

???????????????????
??????????????????
en (16.92) el periodo se escribe como
4

=
c


3 2
p
1
b x2
4
2 (b2 x2 )
dx

(16.93)

la integral (16.93) se puede evaluar con el cambio de variable x = b sin resultando


r 





2 1
m
3kb2
3 2
3kb2

= 0 1
=
1 b = 2
1
c 2
8
k
16mc2
16mc2
donde 0 es el periodo en el caso no relativista. Vemos entonces que las correcciones relativistas introducen
una dependencia con la amplitud, dada aproximadamente por

3 kb2
3
=
= E
=
2
0
0
16 mc
8

16.9.3.

(16.94)

Movimiento de partcula cargada en un campo magn


etico

Este problema se puede trabajar aplicando el Lagrangiano (16.84) usando = 0 y el potencial vectorial adecuado para un campo magnetico constante A = 1/2 (r B). No obstante, es m
as sencillo emplear
directamente el formalismo Newtoniano de fuerzas y escribir
F=

q
(v B)
c

(16.95)

con lo cual la ecuaci


on de movimiento es
dp
q
q
= (v B) =
(p B)
dt
c
mc
La expresi
on (16.95) nos garantiza que la fuerza de Lorentz magnetica no efect
ua trabajo sobre la partcula
de modo que F v = 0. Este hecho junto con las Ecs. (16.65, 16.66) nos dice que T permanece constante, en
tanto que la expresi
on (16.70) nos dice que p y tambien lo son. Adicionalmente, (16.95) nos indica que F es

16.10. FORMULACIONES LAGRANGIANAS COVARIANTES

441

perpendicular a B de modo que la componente del momento a lo largo de B se debe conservar. Finalmente,
la ortogonalidad entre F y v nos indica que la partcula no cambia su rapidez.
Por lo anterior ser
a posible sin perdida de generalidad asumir que x3 es la direcci
on de B y que el movimiento
es en el plano x1 x2 . Descompondremos a p en la forma p = p3 u3 + p . Con base en lo anterior sabemos que
p3 es constante ascomo el m
odulo de p. Por tanto, el m
odulo de p es claramente constante de modo que p
realiza una precesi
on alrededor de la direcci
on del campo magnetico con una frecuencia dada por
=

qB
mc

(16.96)

al ser constante se deduce que la proyecci


on de la velocidad en el plano x1 x2 tiene m
odulo constante y gira
con la misma frecuencia. La partcula se mueve entonces en un plano y describe una orbita circular uniforme
con velocidad angular . De esto se obtiene el m
odulo de p
p = mr
siendo r el radio de la circunferencia. Si combinamos esta ecuaci
on con (16.96) obtenemos el radio de la
circunferencia en funci
on del momento lineal
p
r=
(16.97)
qB/c
el radio de curvatura solo depende de las propiedades de esta a traves del factor pc/q (= Br), que se
conoce como la rigidez magnetica de la partcula. Se puede ver que aunque presenta correcciones relativistas
contenidas en el factor , la relaci
on entre radio y momento es la misma que en el caso no relativista (justamente
porque el momento a su vez se redefine con el mismo factor ). Debe tenerse en cuenta que aunque r solo
alculo de debe usarse tanto la componente perpendicular como la paralela a B a fin
depende de p , en el c
de calcular .

16.10.

Formulaciones lagrangianas covariantes

El metodo abordado en la secci


on anterior predice correctamente las ecuaciones de movimiento relativistas
de los problemas en cuesti
on pero no es clara la covarianza de las ecuaciones de la mec
anica. En particular
el par
ametro tiempo se ha tratado como par
ametro totalmente distinto de las coordenadas espaciales, en
tanto que una formulaci
on covariante exige que el espacio y el tiempo se traten como cordenadas an
alogas
del espacio de universo. Esto implica que en lugar del tiempo, se debe utilizar alg
un par
ametro invariante
para trazar el punto figurativo que nos muestra la evoluci
on de un sistema en el espacio de configuraci
on. Es
necesario partir de un principio de Hamilton manifiestamente covariante. Ahora, si el par
ametro de integraci
on
es un invariante de Lorentz entonces el Lagrangiano debe ser un escalar de universo en cualquier formulaci
on
covariante. Finalmente, en vez de ser funciones de xi y x i el lagrangiano debe ser funci
on de las coordenadas
del espacio de Minkowski y de sus derivadas respecto al par
ametro invariante.
Veamos el caso de un partcula. La elecci
on natural del par
ametro invariante es aparentemente el tiempo
propio de la partcula. Sin embargo, las componentes de la velocidad generalizada, deben entonces cumplir la
relaci
on
u u = c2
(16.98)

que demuestra que no todas sus componentes son independientes. Por lo tanto, supondremos que el par
ametro
invariante es m
as bien una funci
on que crece mon
otonamente a medida que el punto de universo evoluciona a
lo largo de la lnea de universo de la partcula y que es adem
as invariante de Lorentz. La derivada con respecto
al par
ametro y con respecto al par
ametro t ser
an simbolizadas en la forma
dx
dx
; x
d
dt
Un principio covariante debe ser entonces del tipo
Z 2
I =
(x , x
) d
x

(16.99)

CAPITULO 16. RELATIVIDAD ESPECIAL

442

siendo un escalar de universo. N


otese que la dependencia explcita del tiempo est
a contenida en el hecho
de que depende de x4 . Las ecuaciones de Euler Lagrange que surgen de aplicar el principio de Hamilton a
(16.99) son



=0
(16.100)
d x

x
de modo que debemos encontrar un tal que las Ecs. (16.100) sean equivalentes a las Ecs. (16.55). Una manera
de hacerlo es partir de la integral de acci
on usual con par
ametro t y transformando dicha integral de modo
que el par
ametro tiempo sea reemplazado por el par
ametro invariante y el tiempo en cambio aparezca no
como par
ametro sino como otra coordenada generalizada. Como debe ser funci
on mon
otona de t medida en
cierto sistema inercial, se tiene
dxi
dxi d
dxi /d
x
i
=
=
ic
dt
d dt
dt/d
x
4

dt =

dt
d (ict)
i dx4
i
d =
d =
d = x
4 d
d
icd
c d
c

con lo cual la integral de acci


on usual (con par
ametro t) se transforma de la manera siguiente
I=

t2
t1

L (xj , t, x j ) dt =

i
c



xj
L x , ic
x
4 d
x
4

(16.101)

esto nos muestra que una receta adecuada para el lagrangiano transformado sera de la forma
(x , x
) =



i
x4
xj
L x , ic
c
x
4

(16.102)

este lagrangiano tiene una caracterstica no vista hasta ahora en los lagragianos, depende del cociente entre
derivadas de las coordenadas generalizadas x
j /
x4 y de un factor global x
4 . La primera caracterstica hace
que sea una funci
on homogenea de primer grado de las velocidades generalizadas independientemente de la
forma funcional de L
(x , a
x ) = a (x , x
)
(16.103)
este no es un fen
omeno de la fsica relativista como tal sino de la forma en que se ampla el espacio de
configuraci
on para incluir a t como coordenada generalizada y usar otro par
ametro para seguir la evoluci
on
del punto figurativo de la partcula en el espacio de universo. Un Lagrangiano de la forma (16.103) recibe el
nombre de Lagrangiano homogeneo y el correspondiente problema homogeneo del c
alculo de variaciones exige
un tratamiento especial. La dificultad m
as seria surge en la formulaci
on Hamiltoniana, en particular puede
notarse que como consecuencia de esta homogeneidad, la funci
on energa h definida en (5.13) es identicamente
nula, como se puede apreciar aplicando el teorema de Euler Ec. (5.16). Al ser homogenea de primer grado
en x
se tiene que

=x

podemos entonces demostrar que la funci


on satisface la relaci
on


d
d

x
= 0
x

(16.104)

la cual nos indica que si se satisfacen tres de las Ecs. (16.100) entonces la cuarta se satisface autom
aticamente.
N
otese que esto es consecuencia de la homogeneidad de .
Veamos como se escribe esta transformaci
on para una partcula libre. La Ec. (16.77) nos indica la expresi
on
no covariante para el Lagrangiano de una partcula libre
p
L = mc c2 x i x i

16.10. FORMULACIONES LAGRANGIANAS COVARIANTES


y aplicando la transformaci
on (16.102) resulta una posible Lagrangian covariante10
p
= mc
x x

443

(16.105)

con la cual las ecuaciones de Euler Lagrange equivalen a




d
mc
x
=0

x x

como el par
ametro deber ser funci
on mon
onota del tiempo propio , las derivadas respecto a est
an relacionadas con las derivadas en funci
on de a traves de la expresi
on
x

dx
d dx
d
=
=
u
d
d d
d

y las ecuaciones de Lagrange quedan de la forma




d
mcu
d (mu )

=
=0
d
u u
d
que coincide con las Ecs. (16.55) aplicadas a una partcula libre. La cuarta de estas ecuaciones no es independiente lo cual tambien se vi
o anteriormente ya que esta ecuaci
on nos manifiesta la conservaci
on de la energa
cinetica lo cual puede deducirse de las tres ecuaciones anteriores.
N
otese que este metodo resulta laborioso incluso para una partcula libre. Una forma m
as directa y pr
actica
propuesta por Dirac, evita la introducci
on del par
ametro y permite trabajar con el tiempo propio . Para
ello basta con observar que la relaci
on que nos previene de usar el tiempo propio como par
ametro invariante
Ec. (16.98) no es una verdadera ligadura din
amica de movimiento sino una consecuencia geometrica del modo
de definir , esta ecuaci
on nos dice b
asicamente que hay una regi
on permitida en el espacio u y que no todos
los puntos de esta regi
on son accesibles, la regi
on accesible es una hipersuperficie de 3 dimensiones. A las
Ecs. del tipo (16.98) Dirac las denomina ecuaciones debiles. Podemos en consecuencia, trabajar las u como
cantidades sin ligaduras y solo despues de efectuar todas las operaciones de derivaci
on necesitaremos imponer
la ligadura (16.98). Este procedimiento se puede aplicar al Lagrangiano libre. En cuyo caso se podra haber
hecho igual a desde el principio y se aplica la Ec. (16.98) solo en el u
ltimo paso. De esta forma se puede
escribir directamente en funci
on de las ecuaciones de Lagrange covariantes



=0
d u
x
por otro lado, no es necesario que la integral de acci
on del principio de Hamilton deba tener el mismo valor
cuando se expresa en funci
on de t que cuando se expresa en funci
on de o de , de modo que el Lagrangiano no
tiene que estar descrito por la Ec. (16.102). Solo se le exige a que sea un escalar de universo y que conduzca
a las ecuaciones de movimiento correctas, despues de todo el principio de Hamilton se escribi
o con esta idea.
no tiene que ser necesariamente homogenea de primer grado en la velocidades generalizadas. Por ejemplo,
una Lagrangiana adecuada para partcula libre es la siguiente
1
= mu u
2

(16.106)

y m
as en general puede tener la forma mf (u u ) donde f (y) es una funci
on arbitraria con la condici
on de
que

f
1
=

y y=c2
2
10

Para llegar a (16.105) hay una ambig


uedad de signo
fijarse para que L dt tenga el mismo valor que d. El paso
qque debe
p
p
2
2
2
final se escribe en la forma = imc x
4 + x
j x
j = mc (i) x
4 + x
j x
j

= mc
x x

CAPITULO 16. RELATIVIDAD ESPECIAL

444

n
otese que las funciones f (u u ) = 12 u u y f (u u ) = c u u cumplen esta condici
on y conducen a los
Lagrangianos (16.105) y (16.106) respectivamente. De aqu en adelante, usaremos la Ec. (16.105) para la parte
de la energa cinetica del Lagrangiano.
Si la partcula no es libre, es necesario introducir terminos escalares de universo que den cuenta de la
interacci
on con el exterior correspondientes a ciertas fuerzas de Minkowski. Usualmente estos terminos ser
an
la contracci
on de un cuadrivector exterior con un cuadrivector del sistema que representan la interacci
on de la
partcula con un campo exterior. Por ejemplo, si el termino de interacci
on es de la forma x siendo un
cuadrivector exterior y si adem
as en alg
un sistema de referencia 1 = ma y las dem
as componentes son nulas,
tendramos un ejemplo de fuerza constante. La forma concreta depender
a de la formulaci
on covariante que se
utilice para la teora del campo. Ya tenemos a mano un ejemplo cual es la interacci
on de una carga puntual
con un campo electromagnetico, para el cual, un Lagrangiano adecuado es
1
q
(x , u ) = m u u + u A (x )
2
c
y las ecuaciones de Lagrange asociadas son

q dA
q
d
(mu ) =
+
u A
d
c d
x c
que corresponden a las ecuaciones de movimiento generalizadas (16.55) donde la fuerza de Minkowski K
esta dada por la Ec. (16.58). Como antes, el cuadri momento lineal p es diferente del momento can
onico
asociado a x que denotaremos por P
P =

q
q
= mu + A = p + A
u
c
c

(16.107)

las tres primeras componentes corresponden a las dadas en la Ec. (5.2). La cantidad can
onica asociada a
x4 viene dada por
iT
iq
i
P =
+
= E
c
c
c
siendo E = T + q la energa total de la partcula. Una vez m
as, el momento conjugado a la coordenada
tiempo es proporcional a la energa total11 . la relaci
on entre el m
odulo del momento lineal y la energa T sigue
estando dada por (16.70). Es notable el hecho de que dado que p y A son trivectores euclidianos entonces las
tres componentes espaciales de P dadas por
~ = p + qA
P
c
forman un trivector euclidiano (recordemos que en general los momentos can
onicos no forman vectores). Por
~
esta raz
on es u
til escribir la Ec. (16.70) en terminos del trivector can
onico P

2
~ q A + m2 c4
T 2 = P
c

(16.108)

~ El ejemplo de la carga en campo electromagnetico


relaci
on muy u
til entre la energa T y el momento can
onico P.
es un ejemplo de interacci
on con un campo vectorial. Podramos tener por ejemplo interacci
on con un campo
escalar (x ) usualmente acoplado a alguna cantidad escalar del sistema, tales como q (x ) o m (x ) siendo
m masa propia y carga respectivamente, hay por supuesto otras posibilidades como la contracci
on de dos
tensores (uno externo y otro interno) de la forma F K etc. La u
nica restricci
on es que los terminos de
interacci
on formen un escalar de universo. La forma explcita de estos terminos depende entonces de la teora
de campo especfica que se est
a considerando.
11
En el caso no relativista, esta relaci
on de conjugaci
on era mas bien artificial ya que el tiempo era un par
ametro y no una
coordenada generalizada. En el caso relativista, el tiempo se convierte en coordenada y por tanto podemos hablar en firme de su
momento conjugado.

Captulo 17

Teora can
onica de perturbaciones
Es un hecho que la mayora de problemas fsicos reales no poseen soluciones matem
aticas exactas. A
manera de ilustraci
on el problema de Kepler para dos cuerpos es soluble de manera exacta, pero para el
movimiento cl
asico de tres cuerpos puntuales bajo interacci
on gravitacional no ha sido posible una soluci
on
analtica exacta. Lo anterior nos motiva a estudiar tecnicas que permitan encontrar soluciones aproximadas
analticas o numericas.
Por otro lado, ocurre con frecuencia que el Hamiltoniano del problema que no se puede resolver de forma
exacta, difiere solo ligeramente de un Hamiltoniano que se puede resolver rigurosamente. Escribimos entonces
H (q, p, t) = H0 (q, p, t) + H (q, p, t)

(17.1)

on exacta, H es el Hamiltoniano
siendo H0 el Hamiltoniano no perturbado del cual conocemos su soluci
perturbado del cual queremos conocer una soluci
on aproximada y H es el Hamiltoniano de perturbaci
on. La hip
otesis de trabajo b
asica de la tecnica de perturbaciones es la peque
nez de H con respecto a H0 .
Genericamente decimos que el problema mas complicado es una perturbaci
on del sistema soluble.
Vale la pena tener en cuenta que incluso cuando el Hamiltoniano de perturbaci
on H sea peque
no con
respecto al Hamiltoniano no perturbado H0 , el efecto de la perturbaci
on sobre la soluci
on puede ser considerable. Por ejemplo, para un oscilador bidimensional isotropico i.e. de frecuencas iguales en x e y, la trayectoria
es una curva cerrada simple, m
as especficamente una elipse. Supongamos que aplicamos una perturbaci
on
que cambie ligeramente la constante de rigidez en la direcci
on y de tal forma que las frecuencias son ahora
diferentes e inconmesurables. Como consecuencia de esta peque
na perturbaci
on de H, la trayectoria ya no
ser
a cerrada y en el transcurso del tiempo llenar
a todo el espacio conformado por el rect
angulo que se forma
con las amplitudes en x e y. Otro ejemplo ilustrativo es el efecto gravitatorio debido al achatamiento de la
tierra visto como desviaci
on del problema no perturbado con la tierra perfectamente esferica, las peque
nas perturbaciones producidas por este achatamiento producen un cambio apreciable en la trayectoria de un satelite
puntual. En particular el campo central sin perturbar produce un movimiento en un plano en tanto que toda
perturbaci
on cuadrupolar gravitatoria por peque
na que sea hace que el movimiento se salga del plano inicial
a menos que el eje del cuadrupolo sea perpendicular a dicho plano.
La mayor parte del desarrollo formal de la teora cl
asica de perturbaciones se realiz
o para la mec
anica
celeste. Por ejemplo, el efecto gravitacional del sol sobre la luna se puede considerar una perturbaci
on con
respecto a la interacci
on gravitacional dominante debida a la tierra. La necesidad de predecir con precisi
on las
orbitas de satelites ha impulsado fuertemente el desarrollo de metodos perturbativos.
En general podemos dividir la teora de perturbaciones en dos tipos de teora: teora de perturbaciones
dependiente del tiempo e independiente del tiempo. Buena parte de las tecnicas aqu desarrolladas poseen
analoga con la teora de perturbaciones para la mec
anica cu
antica, si bien la teora de perturbaciones cl
asica es mucho m
as complicada que su contraparte cu
antica. En general, la teora de perturbaciones cl
asica se
puede tratar con cualquiera de los formalismos desarrollados hasta ahora: Newtoniano, Lagrangiano y Hamiltoniano. Sin embargo, la formulaci
on m
as conveniente es la de Hamilton Jacobi. Comenzaremos con la teora
de perturbaciones dependiente del tiempo que es la forma m
as simple
445

446

17.1.

CAPITULO 17. TEORIA CANONICA


DE PERTURBACIONES

M
etodo de variaci
on de constantes para perturbaciones dependientes del tiempo

Sea H0 (q, p, t) el Hamiltoniano no perturbado cuya soluci


on exacta se conoce. El Hamiltoniano perturbado
H (q, p, t) ser
a la suma del Hamiltoniano no perturbado H0 (q, p, t) m
as el Hamiltoniano de perturbaci
on
H (q, p, t) como se aprecia en la Ec. (17.1). Supongamos que hemos obtenido la soluci
on para el problema no
perturbado mediante la funci
on principal de Hamilton Ec. (9.5)


S
S
S
=0
H0 q1 . . . qn ;
,...,
;t +
q1
qn
t
recordemos que la soluci
on S (q, , t) de esta ecuaci
on representa la funci
on generatriz de tipo 2 que genera una
transformaci
on can
onica que nos lleva del Hamiltoniano original H0 a un Hamiltoniano nulo K0 = 0, de modo
que todas las nuevas variables can
onicas ser
an constantes. Las nuevas variables can
onicas (, ) son entonces
constantes en el problema no perturbado.
Ya se ha mencionado que el car
acter can
onico de una transformaci
on es independiente del problema i.e. de
la forma especfica del Hamiltoniano, lo cual se puede ver por ejemplo de la condici
on simplectica Ec. (7.56) la
cual solo depende de la transformaci
on en s y no del Hamiltoniano al cual se le aplique esta transformaci
on.
De lo anterior se deduce que la transformaci
on definida por
(q, p) (, )
generada por S (q, , t) sigue siendo una transformaci
on can
onica para el problema perturbado. No obstante,
en general esta transformaci
on can
onica no har
a que el nuevo Hamiltoniano perturbado sea nulo y las nuevas
variables can
onicas no ser
an constantes en el problema perturbado. Teniendo en cuenta las Ecs. (17.1) y (9.2)
el nuevo Hamiltoniano perturbado ser
a
K (, , t) = H0 + H +

S
t

(17.2)

por supuesto que H0 , H y S se deben escribir como funciones de , , t. Las ecuaciones de Hamilton para las
nuevas variables can
onicas del sistema perturbado vienen dadas por
i =

K (, )
K (, , t)
; i =
i
i

(17.3)

las ecuaciones (17.3) son formalmente exactas de modo que no hemos hecho ninguna aproximaci
on a
un. Tales
ecuaciones nos dan formalmente los valores de i , i en funci
on del tiempo. Por otro lado, las ecuaciones
de transformaci
on desde (q, p) hacia (, ) nos permitir
an a su vez encontrar a q, p en funci
on del tiempo a
traves del inverso de dicha transformaci
on, lo cual resuelve el problema completo. No obstante, la soluci
on
para el nuevo Hamiltoniano perturbado K (, , t) no es usualmente m
as sencilla que la del Hamiltoniano
perturbado original H (q, p, t), la raz
on es que aunque la transformaci
on se mantiene can
onica, ya no trivializa
las ecuaciones de Hamilton como lo haca con el Hamiltoniano no perturbado, por lo tanto no es claro que tal
transformaci
on can
onica simplifique el problema perturbado. De lo anterior se desprende que las Ecs. (17.3)
no ser
an especialmente fructferas si buscamos una soluci
on exacta.
Sin embargo, estas ecuaciones ser
an de gran utilidad para obtener soluciones aproximadas si tenemos en
cuenta que H debe ser peque
no con respecto a H0 . Es de esperarse entonces que los valores de y
en el nuevo problema no difieran significativamente de su valor constante original de modo que no varen
r
apidamente, al menos en comparaci
on con la dependencia explcita de K con respecto al tiempo. Una primera
aproximaci
on a la dependencia temporal de (, ) se obtendr
a entonces asumiendo la validez de las ecuaciones
(17.3) pero con los miembros derechos de cada ecuaci
on evaluados en los valores constantes no perturbados 0i
y 0i . Denotando 1i y 1i las soluciones de primer orden en teora de perturbaciones para i , i tenemos
que



K (, )
K
(,
,
t)

1i =
; 1i =
(17.4)


i
i
i =0i , i =0i
i =0i , i =0i

DEPENDIENTE DEL TIEMPO EN TERMINOS

17.2. TEORIA DE PERTURBACION


DE LOS PARAMETROS
D
de modo que despues de la derivaci
on se deben sustitur las variables , por sus valores constantes no
perturbados. Como estas son ecuaciones de Hamilton, se pueden escribir matricialmente en forma simplectica
como en (6.33)

K (, t)
1 = J
;
e1 (11 , 12 , . . . , 1n , 11 , 12 , . . . , 1n )
(17.5)
= 0

donde la matriz J est


a definida por la Ec. (6.31). Las Ecs. (17.4) o (17.5) se pueden integrar directamente para
obtener la dependencia temporal de las 1i , 1i en aproximaci
on de primer orden. Usando las ecuaciones de
transformaci
on se obtiene la dependencia temporal para la correspondiente aproximaci
on de primer orden en
las q, p.
Ahora bien, si queremos proceder a la aproximaci
on de segundo orden, debemos utilizar la aproximaci
on
de primer orden de la dependencia temporal de y en los miembros de la derecha de las Ecs. (17.3)


K (, )
K (, , t)

; 2i =
(17.6)
2i =


i
i
i =1i , =1i
i =1i , =1i
en general, si queremos proceder a la aproximaci
on de orden m, debemos utilizar la aproximacion de orden
m 1 de la dependencia temporal de y en los miembros de la derecha de las Ecs. (17.3), en notaci
on
matricial simplectica esto se escribe como

K (, t)
m = J
;
em (m1 , m2 , . . . , mn , m1 , m2 , . . . , mn )
(17.7)

=m1

17.2.

Teora de perturbaci
on dependiente del tiempo en t
erminos de los
par
ametros de movimiento

Las variables transformadas (, ) contienen informaci


on sobre los par
ametros del movimiento sin perturbar. En general, los par
ametros de movimiento suelen ser mas convenientes que los valores de y para
trabajar desde el punto de vista te
orico y/o experimental. A manera de ejemplo, en el problema de Kepler en
tres dimensiones sin perturbar con el formalismo de variables acci
on angulo, las variables y corresponden a
las variables de acci
on constantes Ji y las variables angulares correspondientes wi (usualmente conocidas como
variables de Delauney). Por otro lado, las variables de Delauney est
an relacionadas de manera sencilla con los
par
ametros del sistema que son m
as f
acilmente observables o medibles: semieje mayor, excentricidad, inclinaci
on etcetera (ver secci
on 10.16). La teora de perturbaci
on que se construy
o anteriormente permite encontrar
a cualquier orden las correcciones a los valores de y . Ahora bien, si pretendemos relacionar las cantidades
y perturbados con los valores de los par
ametros de movimiento perturbados, podemos encontrarnos con
la dificultad de que la perturbaci
on puede alterar no solo los valores de las y sino tambien la relaci
on
funcional de estas con los par
ametros de movimiento.
Por lo anterior, sera deseable construr una teora de perturbaciones en la cual se obtenga la aproximaci
on
a cierto orden de los par
ametros de movimiento directamente, sin recurrir a la determinaci
on de los y
como paso intermedio. Esto es posible a traves del formalismo de los corchetes de Poisson. Sea ci un conjunto
de 2n funciones de las constantes (, ) del sistema sin perturbar siendo todas las ci independienes entre s1
ci = ci (, ) ; i = 1, ..., 2n

(17.8)

las ci son arbitrarias desde el punto de vista matem


atico excepto por la exigencia de que sean independientes e
invertibles. Desde el punto de vista fsico es usualmente deseable que una o m
as de dichas funciones representen
los par
ametros de movimiento usados. Como cualquier funci
on del espacio de fase ci (, ) obedece a la ecuaci
on
de movimiento (8.25) y asumiendo que las ci no son funciones explcitas del tiempo, se tiene que
ci = [ci , K]

(17.9)

1
N
otese que las ci no se pueden interpretar en general como nuevas coordenadas can
onicas puesto que la transformaci
on (17.8)
no es necesariamente can
onica. Solo pedimos que el jacobiano de la transformaci
on sea no nulo para garantizar la independencia
de las funciones ci y la invertibilidad del sistema de ecuaciones.


CAPITULO 17. TEORIA CANONICA
DE PERTURBACIONES

448

por otro lado, las inversas de las ecuaciones (17.8) permiten a su vez considerar a K (, , t) como funci
on de
los ci y el tiempo i.e. K = K (ci , t)
ci K
ci K cj
J
=
J


cj
K
[ci , K] = [ci , cj ]
cj
[ci , K]

donde hay suma sobre el ndice repetido j. Reemplazando esta ecuaci


on en (17.9) se tiene
ci = [ci , cj ]

K
cj

(17.10)

al igual que las ecuaciones de Hamilton (17.3) las ecuaciones (17.10) son exactas y no se ha realizado todava
ninguna aproximaci
on. De manera an
aloga a la teora de perturbaciones para los , , el c
alculo de primer
orden consiste en evaluar a la derecha de la ecuaci
on (17.10) incluyendo los corchetes de Poisson con los valores
de los par
ametros correspondientes al movimiento no perturbado. En la aproximaci
on de orden m, se hacen
todas las derivadas a la derecha de (17.10) luego de lo cual se reemplazan las expresiones resultantes, por los
valores de los par
ametros obtenidos en la perturbaci
on de orden m 1.


K
cmi = [ci , cj ]
, i = 1, ..., 2n
(17.11)
cj ci =cm1,i
esta ecuaci
on es el an
alogo de (17.7). En mec
anica celeste aparece a menudo la Ec. (17.11) en terminos de
corchetes de Lagrange. Multipliquemos la Ec. (17.10) por el corchete de Lagrange {ck , ci } y sumamos sobre
ndices repetidos
K
{ck , ci } ci = {ck , ci } [ci , cj ]
(17.12)
cj
usando la propiedad (8.15) se tiene

K
= {ck , ci } ci
cj

(17.13)

de nuevo en la terminologa de la mec


anica celeste es usual definir R K de modo que la Ec. (17.13) queda
en la forma
R
= {ck , ci } ci
(17.14)
cj
las ecuaciones (17.11) o sus formas equivalentes (17.13, 17.14) se conocen como ecuaciones de perturbaci
on
de Lagrange.

17.3.

Variaci
on peri
odica y variaci
on secular de una perturbaci
on

Un aspecto implcito en la formulaci


on perturbativa es que los par
ametros de movimiento del sistema no
perturbado nos sirven para describir al sistema perturbado. En general el efecto de una perturbaci
on es hacer
variar los par
ametros del sistema con el tiempo. Si el movimiento no perturbado es peri
odico y la perturbaci
on
es peque
na, la variaci
on de los par
ametros durante un periodo del movimiento no perturbado tambien
sera peque
na2 . La teora de perturbaciones dependiente del tiempo (variaci
on de constantes) implica una
imagen en la cual el sistema perturbado se mueve en intervalos cortos de tiempo en una trayectoria de igual
forma funcional que el sistema sin perturbar, aunque los par
ametros de la trayectoria variar
an con el tiempo.
La orbita no perturbada a lo largo de la cual viaja instant
aneamente el sistema perturbado se denomina
usualmente
orbita osculatriz, la cual en posici
on y direcci
on de la tangente coincide instant
aneamente con
la trayectoria verdadera.
2

En la mayora de los casos la periodicidad exacta se perder


a con el movimiento perturbado, raz
on por la cual la cuasi
periodicidad del sistema usualmente tendr
a como referente el periodo del movimiento no perturbado.

DEPENDIENTE DEL TIEMPO 449


17.4. EJEMPLOS DEL USO DE LA TEORIA DE PERTURBACION
Hay dos maneras en las cuales pueden variar los par
ametros en una orbita osculatriz visto en el esquema
perturbativo. Es posible que haya una variaci
on peri
odica en la cual el par
ametro vuelve a su valor inicial
en un intervalo de tiempo que en primera aproximaci
on suele ser el periodo de la orbita no perturbada. En
contraste, es posible que se mantenga un incremento (o decremento) neto del valor del par
ametro al final de
cada periodo orbital sucesivo. En el primer caso hablamos de una variaci
on peri
odica en tanto que en el
segundo caso se habla de una variaci
on secular. Cuando la variaci
on de un par
ametro dado es peri
odica, su
valor promediado sobre un periodo suele ser muy similar a su valor no perturbado, y si todos los par
ametros
tienen variaci
on peri
odica la trayectoria perturbada tiene un aspecto muy similar a la no perturbada. Si en
cambio la variacion es secular, por peque
na que sea la desviaci
on en cada periodo, los valores de los par
ametros
pueden diferir fuertemente respecto a los valores no perturbados para un n
umero suficientemente grande de
periodos. Correspondientemente, la perturbaci
on llevar
a a una trayectoria muy diferente a la no perturbada
para tiempos mucho mayores al periodo. Por esta raz
on, para m
ultiples prop
ositos suele eliminarse los efectos
3
peri
odicos y quedarse solo con los efectos seculares en los c
alculos perturbativos.
Vale la pena mencionar que el uso de la orbita osculatriz requiere de rectificaciones en periodos de tiempo
determinados por el problema especfico, ya que para tiempos suficientemente grandes la orbita no perturbada
y la perturbada pueden diferir significativamente, en especial si hay efectos seculares. En consecuencia se suele
rectificar la orbita osculatriz de referencia pasando a otra orbita osculatriz y tal vez otro tipo de rectificaciones
a medida que transcurre el tiempo.

17.4.

Ejemplos del uso de la teora de perturbaci


on dependiente del tiempo

17.4.1.

Oscilador arm
onico como perturbaci
on de la partcula libre

Consideremos como sistema no perturbado el movimiento libre unidimensional de una partcula puntual m.
Aunque el ejemplo es trivial, nos permitir
a ilustrar las principales caractersticas del metodo. El Hamiltoniano
no perturbado es
p2
H0 =
(17.15)
2m
para este sistema el momento lineal p se conserva, denominaremos a su valor constante. La ecuaci
on de
Hamilton Jacobi para este sistema es
 2
S
1
S
+
=0
2m x
t
dado que x es cclica y el Hamiltoniano no depende explcitamente del tiempo, la funci
on principal de Hamilton
queda en la forma
2
S (x, , t) = W (x, ) Et = x
t
(17.16)
2m
elegiremos al nuevo momento can
onico P como la constante de integraci
on (tal como en la Ec. 9.8). La nueva
coordenada viene dada por la Ec. (9.10)
Q=

S
t
=x

que se puede escribir en la forma

t
+
(17.17)
m
que es la soluci
on bien conocida para el movimiento unidimensional libre de fuerzas. En sntesis, la transformaci
on can
onica para la partcula libre (sistema no perturbado) es
x=

(p, x) (, )
3

p= ; x=

t
+
m

(17.18)

Dependiendo del grado de aproximaci


on requerido se pueden aproximar los par
ametros de variaci
on peri
odica a su valor no
perturbado o a su promedio sobre un periodo no perturbado.


CAPITULO 17. TEORIA CANONICA
DE PERTURBACIONES

450

Aunque la soluci
on es inmediata, el uso de la tecnica de Hamilton Jacobi nos garantiza que y son variables
canonicas.
Ahora agregaremos una interacci
on tipo Hooke que consideraremos como perturbaci
on. El Hamiltoniano
de perturbaci
on ser
a entonces
m 2 x2
H =
(17.19)
2
siendo una constante. El Hamiltoniano perturbado ser
a
H = H0 + H =


1
p 2 + m 2 2 x2
2m

Debemos proceder ahora a calcular el nuevo Hamiltoniano perturbado K, en terminos de , , t, para lo


cual sustitumos las ecuaciones (17.15), (17.16), (17.19), en (17.2)
K (, , t) = H0 + H +
K (, , t) =

S
2
m 2 x2
2
=
+

t
2m
2
2m

m 2 x2
2

y usamos (17.17) para escribir el miembro derecho en terminos de , , t


m 2
K (, , t) =
2

t
+
m

2

(17.20)

para este caso muy particular es posible obtener la soluci


on exacta sustituyendo el Kamiltoniano (17.20) en
las Ecs. (17.3)




t
2 t
2

= m
+
; = t
+
(17.21)
m
m
derivando la primera de las Ecs. (17.21) con respecto al tiempo resulta


t

2
2

= m +
m

(17.22)

y sustituyendo las dos Ecs. (17.21) en (17.22) se tiene






 
t
t
t

= 2 m 2 2 t
+ m 2
+
m
m
m

= 2

lo cual nos da una variaci


on arm
onica simple con el tiempo para en el sistema perturbado. Reemplazando
(17.17) en la primera de las ecuaciones (17.21) resulta
= m 2 x x =

m 2

que f
acilmente se puede ver que conduce a la soluci
on arm
onica exacta. Es importante enfatizar en que este
es un caso excepcional en el cual se puede obtener la soluci
on exacta usando la transformaci
on can
onica
obtenida del sistema no perturbado. El punto es que aunque esta misma transformaci
on can
onica no trivializa
al Hamiltoniano perturbado, lo deja con una estructura suficientemente simple.
Veamos ahora como se obtendran las soluciones aproximadas en cada orden en teora de perturbaciones.
Vale decir que para poder tratar a esta interacci
on como perturbaci
on, es necesario que la energa potencial
arm
onica (H) sea mucho menor que la energa cinetica de la partcula (H0 ). Es claro que esto implicara que
el metodo podra fallar por ejemplo en los instantes en los cuales la elongaci
on es muy cercana a la amplitud, ya
que en estos casos la energa cinetica es muy peque
na. Veremos sin embargo que para este caso muy particular,

DEPENDIENTE DEL TIEMPO 451


17.4. EJEMPLOS DEL USO DE LA TEORIA DE PERTURBACION
la soluci
on completa se podr
a obtener via teora de perturbaciones, aunque esto constituye de nuevo un caso
excepcional.
Para la aproximaci
on de primer orden, procedemos a escribir las Ecs. (17.4)

K (, )
1 =

0 ,


K (, , t)

; 1 =

0 ,

donde los subndices 0 , 0 son los valores no perturbados. Por simplicidad tomemos x0 = 0 lo cual seg
un la
Ec. (17.17) implica que 0 = 0 4 . Para el Kamiltoniano (17.20) resulta
1 = m

1 = 2 0 t



t
+
m
0 ,
;

; 1 = 2 t
0

0 t2
1 = 2
m



t
+
m
0 ,

estas ecuaciones tienen soluciones inmediatas


1 = 10

2 0 t2
0 2 t3
; 1 =
+ 10
2
3m

(17.23)

donde 10 y 10 denotan los valores iniciales de 1 y 1 . Debemos tener en cuenta que las condiciones iniciales
son las mismas para el sistema perturbado que para el sistema sin perturbar. La diferencia es que en el sistema
sin perturbar estos valores iniciales 0 , 0 permanecen inalterados en el tiempo, en tanto que en el sistema
perturbado ellos evolucionar
an en el tiempo. En consecuencia, los valores iniciales de los y en cualquier
orden en teora de perturbaciones corresponden a los valores sin perturbar, por tanto
n0 = 0 ; n0 = 0 = 0
con lo cual la Ec. (17.23) queda
1 = 0

2 0 t2
0 2 t3
; 1 =
2
3m

(17.24)

las soluciones para x y p a primer orden se obtienen de la transformaci


on can
onica para el sistema no perturbado
(partcula libre) descrito por la Ec. (17.18). Por tanto, tenemos a primer orden
2 0 t2


0

1
; x1 =
t + 1 =
p1 = 1 = 0
2
m




2 t2
0
3 t3
p1 = 0 1
; x1 =
t
2
m
6

2 0 t2
2

t+

0 2 t3
0
2 0 t3 0 2 t3
=
t
+
3m
m
2m
3m

ahora escribamos la soluci


on de segundo orden, para lo cual usamos las ecuaciones (17.6)

2
2
2
4



K (, )
K (, , t)

=
; 2 =

1 , 1
,


 1 1


t
t
= m 2
+
; 2 = 2 t
+
m
m
,
1 ,

1 1


1 t
1 t
= m 2
+ 1
; 2 = 2 t
+ 1
m
m

(17.25)

N
otese que el subndice 0 en x0 y 0 tiene significados muy diferentes. x0 indica la posici
on del sistema en t = 0 en tanto
que 0 indica el valor de en el sistema no perturbado i.e. el valor de para la perturbaci
on de orden cero.


CAPITULO 17. TEORIA CANONICA
DE PERTURBACIONES

452

y reemplazando los valores de (17.24) en (17.25) resulta


2
2
2






2 0 t2 t
2 0 t2 t
0 2 t3
0 2 t3
2

= m
0
+
; 2 = t 0
+
2
m
3m
2
m
3m






2
3
2
3
2
2
4
2
4
t
t
0
t
t
+
; 2 =
t2
+
= 0 2 t
2
3
m
2
3




2
3
2
2
4
t
0
t
; 2 =
t2
= 0 2 t
6
m
6
2



cuyas soluciones son


2 = 0

2 0 t2 4 0 t4
+
2
24

2 =



0 2 t3 2 t5

m
3
30

para las soluciones a segundo orden en x y p recurrimos nuevamente a las transformaciones can
onicas derivadas
del Hamiltoniano no perturbado
2 t
+ 2
m
2 0 t2 4 0 t4
= 0
+
;
2
24


2 t2 4 t4
= 0 1
+
;
2
24


2 t2 4 t4
= 0 1
+
;
2!
4!

p2 = 2
p2
p2
p2

x2 =


2 0 t2 4 0 t4 t
x2 = 0
+
+
2
24
m


0
3 t3 5 t5
0
x2 =
t
+
+
m
2
24
m


0
3 t3 5 t5
x2 =
t
+
m
6
120



0 2 t3 2 t5

m
3
30
 3 3

5
5
t
t

3
30

finalmente reescribimos x y p a segundo orden en la forma


#
"
#
"
(t)3 (t)5
(t)2 (t)4
0
p2 = 0 1
+
; x2 =
t
+
2!
4!
m
3!
5!
con estos terminos es suficiente para observar la secuencia que nos lleva a la contribuci
on del termino nesimo,
aunque la demostraci
on formal debe realizarse por inducci
on. En las expresiones a segundo orden vemos que
los terminos entre corchetes para p2 y x2 son los tres primeros terminos en la expansi
on de coseno y seno
respectivamente. En el lmite de orden infinito en la perturbaci
on resulta claramente
lm pn = 0 cos t

lm xn =

0
sin t
m

que son las soluciones exactas compatibles con la condiciones iniciales.

17.4.2.

P
endulo plano con amplitud finita

Un pendulo con peque


nas oscilaciones se considera como un oscilador arm
onico simple, este sistema tiene
la propiedad de ser is
ocrono, es decir el periodo es independiente de la amplitud. No obstante, en el regimen
de amplias oscilaciones la energa potencial del sistema se aleja del valor del potencial arm
onico y puesto que
la soluci
on del sistema arm
onico simple es exacta, es l
ogico considerar que el problema no perturbado sea el
pendulo con potencial arm
onico de modo que la perturbacion correspondera a la desviaci
on del potencial del
pendulo con respecto al potencial arm
onico. Deduciremos el cambio en la frecuencia debido a esta perturbaci
on
a traves de la variaci
on temporal del angulo de fase perturbado. Un pendulo plano consistente en una masa
puntual m situado al extremo de una varilla sin peso de longitud l posee el Hamiltoniano
H=

p2
+ mgl (1 cos )
2ml2

(17.26)

DEPENDIENTE DEL TIEMPO 453


17.4. EJEMPLOS DEL USO DE LA TEORIA DE PERTURBACION
siendo p el momento conjugado a , (p tiene unidades de momento angular). Este es el Hamiltoniano perturbado
ya que incluye el efecto de amplias oscilaciones. Podemos obtener una forma simplificada aunque aproximada
del Hamiltoniano de perturbaci
on, realizando una expansi
on en serie de Taylor del cos en el Hamiltoniano


 2


p2
2 4 6

p2
4
6
H =
+ mgl 1 1
+

+ ...
=
+ mgl

+
...
2ml2
2!
4!
6!
2ml2
2
24 720


p2
mgl 2
2
4
H =
1
+
...
(17.27)
+
2ml2
2
12 360
el lmite de peque
nas oscilaciones se obtiene manteniendo solo el primer termino de la expansi
on de la energa
potencial en (17.27), con lo cual se ve claramente un potencial de tipo arm
onico. Es claro que el Hamiltoniano
es la energa del sistema incluso para el problema perturbado. En el momento de m
axima altura i.e. cuando
se alcanza el valor de la amplitud angular 1 , la energa cinetica se anula, por tanto en el regimen de peque
nas
oscilaciones se tiene que:
mgl12
H0 = E0 =
2
Lo cual sugiere que 1 se pueda usar como par
ametro adimensional para analizar el efecto de los terminos
perturbativos. Usaremos dos par
ametros para realizar dicho an
alisis
12 =

2E0
mgl

12
E0
=
6
3mgl

usando (17.28) el Hamiltoniano (17.27) se escribe entonces en la forma


"
#
 2 2
 2 2
4
p2
mgl 2
1

1
H =
+
16
+ 62
...
2ml2
2
6 1212
6
360 14
"
#
 
 
p2
mgl 2
2 2 4
H =
+
1
+
...
2ml2
2
2 1
10 1

(17.28)

(17.29)

recordemos que 1 es la amplitud angular m


axima de oscilaci
on cuando E y por tanto la amplitud son peque
nas. Por tanto el cociente /1 es del orden de uno para valores de cercanos a 1 i.e. de la amplitud
m
axima. En consecuencia, el orden de magnitud del factor ser
a el que regule la convergencia de la serie
(17.29)5 . Si conservamos solo el primer termino de correcci
on y trabajamos perturbaciones a primer orden,
solo se introducir
an en los c
alculos terminos del orden de . La perturbaci
on a segundo orden con el mismo
2
Hamiltoniano de perturbaci
on introduce terminos de orden , por lo tanto para obtener una correcci
on coherente hay que calcular una perturbaci
on de segundo orden en el termino proporcional a del Hamiltoniano y
una perturbaci
on de primer orden en el termino 2 de dicho Hamiltoniano.
A continuacion realizaremos un c
alculo perturbativo de primer orden. El Hamiltoniano no perturbado lo
podemos escribir en la forma


 p2
p2
mgl 2
p2
mgl 2
1 mgl
p2
1
2
2
H0 =
+
=
+
ml
=
+

I
=
+ 22I
2
2
2
2ml
2
2 (ml ) 2 (ml )
2I
2
I
2I
2

1 2
mgl
g
p + I 222
; I ml2 ; 2
=
(17.30)
H0 =
2I
I
l

donde I y denotan el momento de inercia del pendulo y su frecuencia angular respectivamente. Como ya
vimos en la seccion 9.9.1, un sistema adecuado de variables can
onicas que nos conduce a un K0 completamente
cclico es el sistema de variables acci
on angulo (J, w) definido por
w = vt +
5

v=

J=

2E

(17.31)

De (17.28) podemos observar que 1 y son peque


nos cuando la energa total E es mucho menor que la energa potencial
m
axima 2mgl que podra alcanzar el pendulo.


CAPITULO 17. TEORIA CANONICA
DE PERTURBACIONES

454

en el sistema no perturbado la variable can


onica J es constante y la variaci
on temporal de w es lineal, lo cual se
traduce en que las cantidades J, v, son constantes en el sistema no perturbado. Lo que hace el Hamiltoniano
de perturbaci
on es introducir una variaci
on temporal para estas cantidades. En el presente an
alisis vamos a
absorber toda la modificaci
on de la dependencia temporal de w en el par
ametro con lo cual escribiremos6
w 1 = v 1 t + v1 + 1 v + 10

(17.32)

de modo que estudiaremos la variaci


on temporal generada por la perturbaci
on de J y del termino de fase 0 ,
el cual reescribiremos de aqu en adelante como puesto que el cambio de notaci
on ya no es relevante.
Las Ecs. (9.113) nos daban la transformaci
on can
onica entre las variables originales q, p y las finales J y w
del oscilador arm
onico unidimensional. Hay no obstante una diferencia sutil entre el Hamiltoniano (9.109) y
el Hamiltoniano (17.26) ya que en el primero las coordenadas q, p tienen dimensiones de longitud y momento
lineal en tanto que en el segundo las coordenadas , p tienen unidades de angulo (adimensional) y momento
angular. Para escribir adecuadamente las transformaciones can
onicas basta con reemplazar m I = ml2
como se ve comparando los Hamiltonianos (17.26) y (17.30), de esta forma la transformaci
on can
onica (9.113)
queda
r
r
J
IJ
=
sin 2w ;
p=
cos 2w ; w = vt +
(17.33)
I

estas son ecuaciones exactas para el sistema no perturbado. Ahora bien, dentro de la filosofia de la teora de
perturbaciones dependiente del tiempo (variaci
on de constantes), la transformaci
on can
onica contin
ua siendo
v
alida pero los valores de J y w adquieren una dependencia temporal.
El nuevo Hamiltoniano no perturbado K0 se puede extraer de las Ecs. (9.111, 9.112) de modo que K0 = Jv.
Por otro lado, el nuevo Hamiltoniano perturbado coincide numericamente con el Hamiltoniano perturbado
original puesto que la funci
on generatriz W no depende explcitamente del tiempo, solo hay que escribirlo en
terminos de las nuevas variables can
onicas J, w. Usando el Hamiltoniano (17.29) hasta orden se obtiene
 
 

2
mgl
J
mgl 2 2
mgl 2 12 2
mgl 4
K = K0 + K ; K =
=
=
=
sin4 2w
2 2 1
4
6 1
24
24 I

2
J
gJ 2
gJ 2
mgl
4
4
sin
2w
=

sin
2w
=

sin4 2w
K =
24 ml2
24 2 ml3 2
24 2 ml3 (g/l)
donde hemos usado (17.28), con lo anterior queda finalmente
K = K0 + K

K0 = Jv

K =

J2
sin4 2w
24 2 ml2

; w = vt +

ahora aplicamos las Ecs. (17.4, 17.32) para obtener




K (J, w)
K (J, w)

J1 =
; w 1 = v + 1 =


w
J
J0 , w0
J0 ,

(17.34)

(17.35)
w0

con lo que obtenemos




J2
4

1 =
Jv
sin 2w
2
2
J
24 ml
J0 ,

w0


J0
4
v = v
sin 2w v
12 2 ml2

hemos usado la notaci


on J0 y 0 para enfatizar que corresponde a los valores no perturbados, la expresi
on

para 1 queda
J0
1 =
sin4 2 (vt + 0 )
(17.36)
12 2 ml2
6

Esto equivale a usar la frecuencia del sistema no perturbado para los c


alculos en el sistema perturbado.

DEPENDIENTE DEL TIEMPO 455


17.4. EJEMPLOS DEL USO DE LA TEORIA DE PERTURBACION
la ecuaci
on (17.36) nos dice que en primera aproximaci
on 1 vara a lo largo del ciclo de la oscilaci
on sin
perturbar. N
otese sin embargo que 1 posee un valor promedio no nulo a lo largo de un periodo no perturbado,
haciendo el cambio de variable x = 2vt + 20
Z 1/v
Z 2+20
J0
1
J0
1
1
4

1 =
sin 2 (vt + 0 ) dt =
sin4 x dx
12 2 ml2 (1/v) 0
12 2 ml2 (1/v) 2v 20
 
Z 2
J0
J0
3
4

sin x dx =

1 =
24 3 ml2 0
24 3 ml2 4
quedando finalmente

J0
(17.37)
32 2 ml2
por lo cual la variaci
on de 1 corresponde a una perturbaci
on secular, el incremento por periodo se da a una
razon constante dada por la Ec. (17.37). Para tiempos mucho mayores a un periodo no perturbado, la variaci
on
temporal de 1 se puede aproximar en la forma
1 =

1 ' 1 t + 0
insertando (17.38) en la Ec. (17.33) obtenemos
r


J1
'
sin 2 vt + 1 t + 0
I

p=

(17.38)



IJ1
cos 2 vt + 1 t + 0

(17.39)

con lo cual vemos que al menos en promedio la soluci


on de primer orden sigue siendo arm
onica simple con
frecuencia
(17.40)
v 0 = v + 1
on para la frecuencia, pero no para el par
ametro v. N
otese que adem
as J1 introduce
n
otese que v 0 es una correcci
una ligera modificaci
on en las amplitudes en (17.39). Usando la tercera de las Ecs. (17.31)
J0 =

2E0
E0 l
= 2
2
g

que al reemplazar en (17.37) resulta


2E0 l
E0
2vE0
v 2E0
v 2
1 =
=
=
=
= 1
2
2
32g ml
16mgl
16mgl
16 mgl
16
donde hemos usado (17.28). La variaci
on relativa de primer orden de la frecuencia para una amplitud finita 1
esta dada por
v
v0 v

2
=
= 1 = 1
(17.41)
v
v
v
16
a partir de la Ec. (17.34) y de la primera de las Ecs. (17.35), se puede obtener la variaci
on temporal de J en
primera aproximaci
on





K
(J,
w)

J2
4J02
4


J1 =
=

Jv

sin
2w
= 2
sin3 2w0 cos 2w0


2
2
2 ml2
w
w
24
ml
24
J0 , w0
J0 , w0

J02
sin3 2 (vt + 0 ) cos 2 (vt + 0 )
3ml2
se ve de inmediato que la variaci
on de J1 es peri
odica y no secular ya que su valor promedio se anula incluso
para medio periodo. Fsicamente esto era de esperarse puesto que J es una medida de la amplitud de las
oscilaciones y dado que la perturbaci
on no es de naturaleza disipativa (o donativa), esta no sera tal que
produzca una disminuci
on o aumento sistem
atico de la amplitud en cada periodo.
J1 =


CAPITULO 17. TEORIA CANONICA
DE PERTURBACIONES

456

17.4.3.

Perturbaciones en el problema de Kepler acotado

Cuando al potencial Kepleriano se le agrega un potencial proporcional a 1/r 2 puede demostrarse que la
orbita resultante es una elipse con respecto a un sistema coordenado rotante. La elipse gira y su peri
apside
presenta precesi
on. Encontraremos la velocidad de precesi
on usando teora de perturbaciones de primer orden
para potenciales de la forma 1/r n con n entero y n 2. El potencial y el Hamiltoniano de perturbaci
on se
escribir
an en la forma
H=

p2
p2r
+
+V
2m 2mr 2

k
h
V = n ;
r
r

H =

h
; n2
rn

donde h posee un valor peque


no tal que el segundo termino sea mucho menor al primero y se pueda considerar
una perturbaci
on. Nuevamente, consideremos el problema de Kepler no perturbado en el lenguaje de las
variables acci
on angulo. En el problema no perturbado la posici
on angular del peri
apside en el plano de la
orbita viene dada por la constante = 2w2 (ver Ec. 10.154). La perturbaci
on genera una dependencia
temporal para que generar
a la precesi
on del peri
apside, esta dependencia temporal se determina a traves de
las ecuaciones

1 K
K
w 2 =
=
=
2
J2 J20 ,0
2 l J20 ,0
donde hemos usado la relaci
on J2 = 2l. En la pr
actica el valor de es muy peque
no de modo que la variaci
on
de cambia de manera casi imperceptible a lo largo de un periodo. Por lo tanto, resulta m
as interesante medir
la variaci
on secular de tomada sobre muchos periodos y es de poco interes el valor instant
aneo de la variaci
on
de . De lo anterior se sigue que la cantidad de interes es el promedio de realizada sobre un periodo de la
orbita no perturbada.
Z
1 K

dt
0 l

la derivada se puede sacar de la integral puesto que solo es funci


on de J3 como se ve en las Ecs. (9.172,
9.180), en tanto que la derivaci
on es con respecto a l = J2 /2. Por tanto
 Z


1
K
=
K dt =
l 0
l
ahora bien, el promedio temporal del Hamiltoniano de perturbaci
on es
 
Z
1
h dt
H = h n =
r
0 rn

usamos ahora la conservaci


on del momento angular en la forma de la Ec. (10.100) l dt = mr 2 d escribimos
entonces la integral en terminos de


Z
Z
n2
mh 2 d
mh mk n2 2 
H =
=
1 + cos 0
d
(17.42)
n2
2
l 0 r
l
l
0

donde hemos escrito a r en funci


on de usando la ecuaci
on de la orbita (10.85). Solo los terminos que
contengan potencias pares de la excentricidad dar
an contribuciones no nulas a la integral. Vale decir adem
as
que la derivada con respecto a l tambien contiene potencias de puesto que solo es funci
on de J2 y J3 .
Hay dos casos particularmente interesantes para los posibles valores de n, el primero es el caso en el cual
n = 2. Reemplazando n = 2 en (17.42), el promedio del Hamiltoniano de perturbaci
on es
H =
y la velocidad de precesi
on secular es
=

2mh
l

2mh
l2

n=2

; n=2

INDEPENDIENTE DEL TIEMPO A PRIMER ORDEN CON UN GRADO D


17.5. TEORIA DE PERTURBACION
Otro caso de interes es n = 3 para el cual las cantidades anteriores est
an dadas por
 Z 2



mh mk
0
H =
1
+

cos

d
l
l2
0

2m2 hk
6m2 hk
;

=
(17.43)
l3
l4
este caso es de gran interes ya que la teora de la relatividad general predice una correcci
on del movimiento
Newtoniano con un potencial asociado de la forma h/r 3 . M
as especficamente, corresponde a la soluci
on
esfericamente simetrica de Schwarzchild de las ecuaciones de campo de Einstein, la cual corresponde a un
Hamiltoniano de perturbaci
on para el problema de Kepler de la forma
H =

h
r3

; h=

6k 2
l2 c2

H =

kl2
m2 c2

(17.44)

reemplazando este resultado en (17.43) se obtiene


(17.45)

veamos una estimaci


on numerica para la precesi
on secular de un cuerpo que gira alrededor del sol, en tal caso
k = GmM y utilizamos la ecuaci
on (10.96) para la elipse no perturbada

l2 = mka 1 2
con lo cual la Ec. (17.45) queda en la forma

6
=
(1 2 )

 
R
a

(17.46)

donde R es el llamado radio gravitatorio del sol


R=

GM
= 1,4766 km
c2

para el planeta Mercurio el valor numerico de (17.46) se estima en


= 42,98/siglo
la precesi
on secular de este planeta es mas de 100 veces mayor que este valor, la raz
on estriba en que el efecto
dominante es la precesi
on de los equinoccios ( 90 %), seguido por el efecto perturbativo de los otros planetas
( 10 %), el efecto aqu calculado debido a la relatividad general equivale a 1 % del efecto total.
Vale la pena aclarar que al hallar no hemos puesto a actuar sobre h la derivada con respecto a l tal como
lo sugerira la Ec. (17.44). La raz
on es que h no depende funcionalmente de l como momento can
onico, lo que
nos dice la Ec. (17.44) es como se determina el valor de la constante h en funci
on del valor del par
ametro orbital
l. El potencial de perturbaci
on es funci
on de las variables din
amicas solo a traves de r, no debe construirse de
forma dependiente de la velocidad.

17.5.

Teora de perturbaci
on independiente del tiempo a primer orden
con un grado de libertad

En la teora de perturbaci
on dependiente del tiempo, resolvemos el problema no perturbado por el metodo
de Hamilton Jacobi, generando unas constantes de movimiento. La filosofa general era tener en cuenta que en
el problema perturbado estas cantidades ser
an ahora dependientes del tiempo y se determina su dependencia
temporal.

458

CAPITULO 17. TEORIA CANONICA


DE PERTURBACIONES

En contraposici
on, la teora de perturbaci
on independiente del tiempo tiene como objetivo buscar las
cantidades que ser
an constantes en el sistema perturbado. Este formalismo es solo aplicable a sistemas que
sean conservativos, separables y peri
odicos tanto en el estado perturbado como en el no perturbado. A pesar de
estas restricciones, hay un gran n
umero de problemas que se pueden tratar con este formalismo. Por ejemplo,
las trayectorias planetarias son corregidas por las interacciones conservativas de los otros planetas y en general
no se pierde la naturaleza peri
odica del movimiento. Es frecuente que la perturbaci
on no altere la naturaleza
peri
odica del movimiento.
Por simplicidad, comenzaremos con un solo grado de libertad para la teora a primer orden. Describiremos
el sistema peri
odico no perturbado con variables acci
on angulo (w0 , J0 ) y un Hamiltoniano H0 (J0 ). Sabemos
que la frecuencia no perturbada y el valor de la variable angular est
an dadas por las ecuaciones (9.105, 9.107)
v0 =

H0 (J0 )
; w0 = v0 t + 0
J0

(17.47)

recordemos que en este formalismo cuando se completa un periodo completo, la variable w0 aumenta en la
unidad. Esta periodicidad permite desarrollar a q y a p en una expansi
on de Fourier (ver Ec. 9.132)
q=

Ak (J0 ) e2ikw0

(17.48)

k=

y similarmente para p. Agreguemos ahora una perturbaci


on de la forma
H = H0 (J0 ) + H1

(17.49)

siendo un par
ametro peque
no que podemos variar contnuamente a partir de cero. Dado que el sistema
perturbado sigue siendo peri
odico, la idea es encontrar un nuevo conjunto de variables acci
on angulo (w, J)
para tal sistema con H = H (J), que cumplan relaciones an
alogas a (17.47)
v=

H (J)
; w = vt +
J

(17.50)

debemos tener en cuenta que de todas maneras (w0 , J0 ) siguen siendo variables can
onicas para el sistema peronica independientemente de la forma particular
turbado, puesto que la transformaci
on (q, p) (w0 , J0 ) es can
del Hamiltoniano como ya se ha mencionado en varias ocasiones. No obstante J0 ya no es constante y w0 ya
no es funci
on lineal del tiempo. Sin embargo, la relaci
on (17.48) sigue siendo v
alida en el sistema perturbado
ya que esta ecuaci
on expresa la transformaci
on can
onica (q, p) (w0 , J0 ), simplemente los valores de w0 y J0
deben ser modificados apropiadamente. En conclusi
on, q sigue siendo funci
on peri
odica de w0 con lo cual se
deduce que cuando q realiza un periodo completo del movimiento tanto w como w0 deben avanzar una unidad.
El hecho de que los dos conjuntos (w0 , J0 ) y (w, J) formen variables can
onicas para el problema perturbado,
significa que deben estar conectados por una transformaci
on can
onica con funci
on generatriz W (w0 , J) que
se puede hallar mediante la ecuaci
on de Hamilton Jacobi para la funci
on caracterstica de Hamilton. El hecho
de que el Hamiltoniano de perturbaci
on sea peque
no se debe manifestar en que la transformacion can
onica
generada por W (w0 , J) solo se desve en una peque
na cantidad con respecto a la identidad, de la funci
on
generatriz tipo 2 para la identidad Ec. (7.22), podemos escribir entonces a primer orden en
W (w0 , J) = w0 J + W1 (w0 , J)

(17.51)

la frecuencia perturbada v se puede calcular simplemente encontrando H como funci


on de J y aplicando
(17.50) sin resolver el problema del movimiento completo como es caracterstico del formalismo en variables
acci
on angulo. La ecuaci
on de Hamilton Jacobi para la funci
on caracterstica de Hamilton Ec. (9.35) queda en
la forma


W
H (w0 , J0 ) = H w0 ,
=
(17.52)
w0

INDEPENDIENTE DEL TIEMPO A PRIMER ORDEN CON UN GRADO D


17.5. TEORIA DE PERTURBACION
H ser
a en general funci
on de J y de , de modo que podemos escribir a primer orden en
H = (J, ) = 0 (J) + 1 (J)

(17.53)

usando (17.49) y (17.53) en (17.52), la ecuaci


on de Hamilton Jacobi queda en la forma




W
W
+ H1 w0 ,
= 0 (J) + 1 (J)
H0
w0
w0

(17.54)

on generatriz W , como se aprecia


n
otese sin embargo, que H0 y H1 siguen dependiendo de a traves de la funci
en (17.51), es necesario tener en cuenta que si el miembro derecho de la Ec. (17.54) es una aproximaci
on a
primer orden, debemos conservar terminos hasta primer orden tambien en el miembro izquierdo, lo cual implica
expandir H0 hasta primer orden y H1 hasta orden cero en . Teniendo en cuenta (17.51) esto implica que






W
[w0 J + W1 (w0 , J)]
W1
W1 H0 (J)
H0
= H0
= H0 J +
H0 (J) +
w0
w0
w0
w0
J
W1 H0 (J0 + J1 )
W1
H0 (J) +
H0 (J) + v0
w0
J0
w0






W
[w0 J + W1 (w0 , J)]
[w0 J]
H1 w0 ,
= H1 w0 ,
H1 w0 ,
= H1 (w0 , J)
w0
w0
w0
usando estas expansiones en (17.54) se obtiene
H0 (J) + v0

W1
+ H1 (w0 , J) = 0 (J) + 1 (J)
w0

igualando potencias en resulta


H0 (J) = 0 (J)
W1
v0
+ H1 (w0 , J) = 1 (J)
w0

(17.55)
(17.56)

la ecuaci
on (17.55) se puede obtener tambien tomando el lmite cuando 0. N
otese que en la Ec. (17.56)
el miembro de la izquierda depende de J y w0 en tanto que el de la derecha depende solo de J, por lo cual
debe existir una cancelaci
on de la dependencia funcional con w0 en el miembro izquierdo. La ecuaci
on de
transformaci
on que determina a w (ver Ec. 9.104) es
w=

W
W1
= w0 +
J
J

donde hemos usado (17.51). De acuerdo con esta ecuaci


on y el requerimiento de que w y w0 avancen en la
unidad cuando se completa un periodo, es necesario que W1 sea funci
on peri
odica de w0
W1 (w0 , J) =

ak (J) e2ikw0

(17.57)

k=

en realidad la forma de W1 dada por (17.57) es la que nos garantiza que la nuevas variables (w, J) tambien
sean del tipo acci
on angulo. N
otese que de (17.57) se observa que el termino de la derivada de W1 respecto a
w0 para k = 0 es decir el termino constante debe anularse. Si denotamos por H 1 el valor de H1 promediado
sobre un periodo completo de w0 tenemos que naturalmente este promedio ya no depender
a de w0 i.e.
H1 (w0 , J) H 1 (J)
sumando y restando H 1 en (17.56) resulta
1 (J) = H1 (w0 , J)

H 1 H1

W1
v0
w0


CAPITULO 17. TEORIA CANONICA
DE PERTURBACIONES

460

la cantidad entre corchetes debe anularse si 1 es solo funci


on de J. Por lo tanto obtenemos dos relaciones
1 (J) = H1 (w0 , J)
H 1 H1
W1
=
w0
v0

(17.58)
(17.59)

teniendo en cuenta las Ecs. (17.49, 17.53), se observa que la Ec. (17.58) nos dice como completar la dependencia funcional de H con respecto a J a primer orden en . El Hamiltoniano de perturbaci
on se expresa en
funci
on de las variables sin perturbar (w0 , J0 ) y se promedia para un periodo completo de movimiento. La
restante dependencia de J0 es la misma (hasta ese orden) que la de J correspondiente a 1 . La nueva frecuencia
se escribe usando (17.50, 17.53)
1
(J)
0 (J)
1 (J)
0 (J0 )
+
=
+

J
J
J
J0
J
1
v = v0 +
J

v =

(17.60)

por otro lado, la Ec. (17.59) nos permite encontrar la funci


on generatriz y por lo tanto la transformaci
on
canonica que nos lleva de (w0 , J0 ) a (w, J) con lo cual el problema queda completamente resuelto a primer
orden en . Especficamente, la dependencia de q y p con el tiempo se hallara por medio de las Ecs. (17.48,
17.50). Recordemos sin embargo, que si solo nos interesa la frecuencia perturbada basta con solucionar la
Ec. (17.58) y no necesitamos resolver el problema completo Ec. (17.59) como es tpico en las variables acci
on
angulo. En la teora de perturbaciones para mec
anica cu
antica se encuentra un fen
omeno an
alogo ya que la
energa del sistema (valor propio de un operador Hamiltoniano) se puede calcular sin tener que encontrar la
funci
on de onda perturbada (que equivale a resolver el problema completo).

17.5.1.

P
endulo plano con oscilaci
on finita usando m
etodo de perturbaci
on independiente
del tiempo

Ya habamos escrito el Hamiltoniano de perturbaci


on de este problema en la ecuaci
on (17.34), que lo
reescribimos en la forma
J2
H1 (w0 , J) =
sin4 2w0
24 2 ml2
donde l corresponde a la longitud del pendulo. Lo m
as conveniente para la asignaci
on del par
ametro es la
2
cantidad 1 que representa el cuadrado de la amplitud angular de oscilaci
on en el caso no perturbado. El valor
medio de este Hamiltoniano promediado sobre un periodo es
 
Z 1/v0
J2
J2
3
4
1 (J) = H 1 =
sin 2 (v0 t + 0 ) dt =
2
2
2
2
2
2
8
24 1 ml 0
24 1 ml
J2
6412 2 ml2
1
J
=
J
32 2 ml2 12

1 (J) = H 1 =

(17.61)

v v0

(17.62)

con el fin de calcular v v0 hasta primer orden en , podemos sustitur J por J0 . Por otro lado, de las Ecs.
(9.111) y (17.28) se deduce que
2E
mgl12
J0 =
=
= 2 2 ml2 12 v0
0
0
con lo cual la Ec. (17.62) se escribir
a en la forma
1
v0
=
J
16

INDEPENDIENTE DEL TIEMPO PARA ORDEN SUPERIOR AL PRIMER


17.6. TEORIA DE PERTURBACION
con lo cual la variaci
on relativa de v ser
a
v
v v0
2

= 1
v0
v0
16
lo cual concuerda con la Ec. (17.41).
Por supuesto, es necesario extender el presente formalismo al caso en que hay varios grados de libertad.
Adicionalmente, las perturbaciones a orden superior a uno pueden ser de gran importancia, bien porque se
requiera una gran precisi
on en los c
alculos o bien porque las contribuciones a primer orden sean nulas (este es
el caso del oscilador anarm
onico como veremos m
as adelante). Por estas razones, procederemos a estudiar el
caso de ordenes superiores para sistemas de varios grados de libertad.

17.6.

Teora de perturbaci
on independiente del tiempo para orden superior al primero y varios grados de libertad

Las condiciones son naturalmente las mismas de la secci


on anterior: sistemas conservativos peri
odicos y
separables (en realidad la condici
on de separabilidad solo es no trivial para el caso con varios grados de
libertad). Para el sistema no perturbado tenemos el conjunto de variables acci
on angulo (w0i , J0i ) de modo
que
;
w0i = v0i t + i
H = H (J0i )
la qk debe ser funci
on peri
odica m
ultiple de las w0i lo cual en forma compacta se puede escribir en la forma
X (k)
Aj (J0 ) e2ijw0
qk =
j

siendo j, w0 , J0 vectores ndimensionales de los ndices enteros, variables acci


on y coordenadas angulares
respectivamente. Nuevamente el conjunto (w0 , J0 ) sigue siendo can
onico en el sistema perturbado. El Hamiltoniano perturbado en funci
on de estas variables se puede desarrollar en serie con respecto al par
ametro

H (w0 , J0 , ) = H0 (J0 ) + H1 (w0 , J0 ) + 2 H2 (w0 , J0 ) + . . .


(17.63)
de nuevo buscamos una transformaci
on can
onica que nos lleve desde el conjunto (w0 , J0 ) hasta el conjunto
(w, J) de modo que las J sean constantes y las w sean lineales en el tiempo. En este nuevo sistema, el
Hamiltoniano perturbado solo es funci
on de las J y
(J, ) = 0 (J) + 1 (J) + 2 2 (J) + . . .

(17.64)

con los valores de 0 , 1 , 2 etc. se pueden hallar las frecuencias perturbadas hasta un orden dado de
v = v0 +

1
2
+ 2
+ ...
J
J

(17.65)

la funci
on generatriz de la transformaci
on can
onica (w0 , J0 ) (w, J) se escribe como W (w0 , J, ) y su
desarrollo en potencias de se escribe
W (w0 , J, ) = w0 J + W1 (w0 , J) + 2 W2 (w0 , J) + . . .
esta funci
on generatriz naturalmente es soluci
on de la ecuaci
on de Hamilton Jacobi adecuada


W
H w0 ,
, = (J, )
w0

(17.66)

posteriormente se expanden los dos miembros de (17.66) en potencias de y se igualan coeficientes de las
mismas potencias en . Ilustremos el caso de segundo orden para el cual la expansion de ambos miembros en
(17.66) se escribe






W
W
W
2
H0
+ H1 w0 ,
+ H2 w0 ,
= 0 (J) + 1 (J) + 2 2 (J)
(17.67)
w0
w0
w0


CAPITULO 17. TEORIA CANONICA
DE PERTURBACIONES

462

nuevamente cada termino del miembro izquierdo depende de a traves de W/w0


J0 =

W
W1
W2
=J+
+ 2
w0
w0
w0

ahora desarrollamos los terminos Hi en serie de Taylor en torno a J0 = J conservando en H0 los terminos
hasta 2 , en H1 los terminos hasta orden y en H2 los terminos de orden cero, lo u
ltimo equivale a sustitur
on matricial
J0 J en H2 . Escribamos H0 y H1 en notaci









W
W1
H0 1
W1 2 H0
W1
2 W2
H0
= H0 (J) +
+
+ O 3
+

w0
w0
w0
J
2
w0 J J
w0



W
W1 H1
+ O 3
H1 w0 ,
= H1 (w0 , J) + 2
w0
w0 J



W
2
H2 w0 ,
= 2 H2 (w0 , J) + O 3
(17.68)
w0
reemplazando (17.68) en el miembro izquierdo de (17.67) y agrupando las potencias de se tiene

W1 H0
W2 H0
+ H1 (w0 , J) + 2
w0 J
w0 J
2
W1 H1 1 2 W1 H0 W1
+2
+
+ 2 H2 (w0 , J)
w0 J
2 w0 J J w0

H0 (w0 W ) + H1 (w0 , w0 W ) + 2 H2 (w0 , w0 W ) = H0 (J) +

Introduciendo estas expansiones en (17.67) e igualando potencias en se obtiene


0 = H0 (J)
W1
1 = v0
+ H1 (w0 , J)
w0
W2
2 = v0
+ 2 (w0 , J)
w0
W1 H1 1 W1 2 H0 W1
2 (w0 , J) H2 (w0 , J) +
+
w0 J
2 w0 J J w0

(17.69)
(17.70)
(17.71)
(17.72)

nuevamente la ecuaci
on que relaciona a w con w0 est
a dada por
w=

W
W1
W2
= w0 +
+ 2
+ ...
J
J
J

para que el sistema (q, p) tenga periodicidad m


ultiple tanto en w0 como en w con periodo 1, todos los terminos
Wk deber
an ser funciones peri
odicas de w0 por tanto
X (k)
Wk (w0 , J) =
Bj (J) e2ijw0
(17.73)
j

de modo que todas las derivadas de Wk carecer


an de termino constante y los primeros terminos a la derecha
en (17.70, 17.71) no contribuyen a la dependencia con respecto a J. Sumando y restando los promedios de
H1 , 2 sobre periodos completos de todas las w0 las Ecs. (17.69, 17.70, 17.71, 17.72) se pueden escribir en la
forma
0 = H0 (J)


W1
1 = v0
H 1 + H1 (w0 , J) + H1 (w0 , J)
w0


W2
2 = v0
2 + 2 (w0 , J) + 2 (w0 , J)
w0

(17.74)
(17.75)
(17.76)

INDEPENDIENTE DEL TIEMPO PARA ORDEN SUPERIOR AL PRIMER


17.6. TEORIA DE PERTURBACION
como antes, los terminos entre parentesis cuadrados deben anularse y se obtiene
0 (J) = H0 (J) ; 1 (J) = H1 (w0 , J) ; 2 (J) = 2 (w0 , J)
W1
W2
= H 1 H1 (w0 , J)
; v0
= 2 2 (w0 , J)
v0
w0
w0

(17.77)
(17.78)

en forma unificada, estas ecuaciones se pueden escribir en la forma


i (J) = i (w0 , J) ; 0 H0 ; 1 H1
Wi
= i i (w0 , J) ; i = 1, 2
v0
w0

(17.79)
(17.80)

las Ecs. (17.80) son peri


odicas en w0 con media nula. Observese que las ecuaciones (17.69, 17.77, 17.79) se
reducen a la forma que se obtuvo para un grado de libertad a primer orden excepto por el hecho de que
contienen todas las frecuencias del movimiento no perturbado.
La Ec. (17.65) nos muestra que la perturbaci
on de segundo orden en para la frecuencia depende de
2 . Por otro lado, 2 viene dado por las Ecs. (17.71, 17.72), tales ecuaciones poseen terminos con derivadas
de W1 con respecto a w0 multiplicados por funciones peri
odicas en w0 . Si bien las propias derivadas de W1
tienen media nula, cuando est
an multiplicadas por funciones peri
odicas en w0 la media del producto no tiene
porque anularse. Esto nos da como consecuencia que en la perturbaci
on de segundo orden los terminos en
W1 no necesariamente se anulan en la media. Por lo tanto, para hallar la correcci
on de segundo orden en las
frecuencias, ser
a necesario conocer la transformaci
on can
onica a primer orden. En principio los coeficientes
(1)
Bj que definen a W1 a traves de la ecuaci
on (17.73) se pueden hallar directamente de (17.80) con i = 1.
v0

W1
= H 1 H1 (w0 , J)
w0

(17.81)

Ahora bien, dado que W1 es funci


on peri
odica de las w0 seg
un (17.73), tenemos que w0 W1 tambien es funci
on
peri
odica de las w0 con coeficiente constante nulo como ya se discuti
o. Por tanto, el miembro derecho de (17.81)
se puede desarrollar en serie de Fourier similar a la Ec. (17.48) o a la Ec. (17.73) pero sin termino constante
X
H 1 H1 =
Cj (J) e2ijw0
(17.82)
j6=0

reemplazando la Ec. (17.73) con k = 1 en (17.81), tenemos que el producto matricial a la izquierda de (17.81)
se puede escribir como
X (1)
W1
= 2i
Bj (J) (j v0 ) e2ijw0
(17.83)
v0
w0
j6=0

de acuerdo con las Ecs. (17.81, 17.82) y (17.83), tenemos que


X
X (1)
Cj (J) e2ijw0 = 2i
Bj (J) (j v0 ) e2ijw0 ;
j6=0

j6=0

j 6= 0
(1)

y recurriendo a la independencia lineal de los exponenciales, tenemos que los coeficientes Bj


de W1 se escriben como
Cj (J)
(1)
Bj =
,
j 6= 0
2i (j v0 )

de la expansi
on
(17.84)

vemos que no hemos obtenido el termino constante i.e. con j = 0, pero en las expresiones para las i Ecs.
(17.69, 17.70, 17.71, 17.72) solo intervienen las derivadas de W1 y estas no contendr
an terminos constantes.
Para ordenes superiores al segundo el procedimiento es an
alogo, aunque las transformaciones algebr
aicas
seran m
as complejas. En general, para la transformaci
on de orden kesimo podemos escribir k en la forma
k (J) = v0

Wk
+ k (w0 , J)
w0

(17.85)


CAPITULO 17. TEORIA CANONICA
DE PERTURBACIONES

464

donde el primer termino a la derecha de (17.85) viene del termino de primera derivada del desarrollo de Taylor
de H (J0 ) alrededor de J0 = J donde todos los terminos de la diferencia J0 J se conservan hasta orden k . Wk
solo aparece en este termino de modo que k solo podr
a contener las funciones generatrices Wm para ordenes
menores que k. Por los razonamientos hechos para primer y segundo orden el primer termino del miembro
derecho en (17.85) tiene media nula cuando se promedia para ciclos completos de w0 y por tanto las Ecs.
as complicado
(17.79, 17.80) ser
an v
alidas a todos los ordenes. Es claro que para k > 2, k se vuelve mucho m
que la Ec. (17.72), y contiene a todas las funciones encontradas en los c
alculos de los ordenes precedentes.
Veremos m
as adelante que en presencia de degeneraci
on de las frecuencias del sistema no perturbado,
aparecen problemas con esta formulaci
on. De momento veamos un ejemplo sencillo.

17.6.1.

Oscilador anarm
onico unidimensional

Consideremos un termino de la forma q 3 que se agrega al potencial arm


onico. Un termino de este tipo se
encuentra cuando se expande un potencial alrededor del mnimo hasta tercer orden en serie de Taylor, y se
conoce como primer termino anarm
onico. El Hamiltoniano se escribe de la forma



1
q
2
2 2 2
H=
p + m 0 q 1 +
2m
q0

0 = 2v0 = 2

k
m

siendo 0 la frecuencia no perturbada y q0 es una amplitud de referencia que se puede fijar posteriormente y
es un par
ametro adimensional peque
no. Separando las potencias en se obtienen los terminos
H = H0 + H1

H0 =


1  2
p + m2 02 q 2
2m

H1 =

m02 q 3
2q0

Hi = 0 para i 2

usaremos como variables can


onicas las variables acci
on angulo (J0 , w0 ) del sistema sin perturbar, los terminos
no nulos de H se pueden ecribir en virtud de las Ecs. (9.113), en la forma
H0 (w0 , J0 ) = J0 v0

m02
H1 (w0 , J0 ) =
2q0

J0
m0

3/2

sin3 2w0

(17.86)

y las dos primeras Ecs. (17.77) nos dan las contribuciones de orden cero y uno para (J)
0 (J) = Jv0

m02
1 = H1 (w0 , J) =
2q0

J
m0

3/2

sin3 2w0 = 0

la anulaci
on de 1 es inmediata debido al car
acter impar del integrando. Vemos que no hay contribuci
on de
primer orden, de tal forma que la primera correcci
on con respecto al caso no perturbado aparece a segundo
orden. Para obtener la contribuci
on de segundo orden 2 (J) se tiene en cuenta que como H0 es lineal en J y
H2 se anula, el valor de 2 en la Ec. (17.72) se reduce a
2 =

W1 H1
w0 J

la anulaci
on de 1 = H 1 implica que la Ec. (17.81) adquiere la forma
W1
H1
=
w0
v0
combinando estos dos resultados se llega a
2 =

H1 H1
1 H12
=
v0 J
2v0 J

INDEPENDIENTE DEL TIEMPO PARA ORDEN SUPERIOR AL PRIMER


17.6. TEORIA DE PERTURBACION
y usando la segunda de las Ecs. (17.86)
H12 (w0 , J) =
H12 (w0 , J) =


3
m2 04
J
0 J 3
2v0 J 3
sin6 2w0
sin6 2w0 = 2 3 sin6 2w0 =
2
m0
4q0
4q0 m
4q02 3 m
v0 J 3
sin6 2w0
2 2 mq02

con lo cual se obtiene


2 (w0 , J) =

3J 2
sin6 2w0
4 2 mq02

(17.87)

reemplazando (17.87) en la tercera de las Ecs. (17.77) nos queda


2 (J) =

3J 2
sin6 2w0
4 2 mq02

y teniendo en cuenta que el valor medio de sin6 x es 15/48 se obtiene


2 (J) =

15J 2
64 2 mq02

(17.88)

y la frecuencia perturbada hasta segundo orden en se obtiene a partir de (17.65)


v = v0 +

1
2
15J
+ 2
= v0 2
J
J
32 2 mq02

(17.89)

axima que tendra el


recordando que q0 es una amplitud de referencia, es natural tomarla como la amplitud m
oscilador con una energa dada E0 en el sistema sin perturbar i.e.
m02 q02
m02 q02
J0
= E0 = H0 = Jv0
=
2
2
2
de modo que para el orden m
as bajo
mq02 =

J
0

con esta amplitud de referencia las Ecs. (17.88, 17.89) quedan


150 J 2
150 J
=
64 2 J
64
15
J
150
15 (2v0 )
0
v = v0 2
= v0 2
= v0 2
2
32 J
32
32

15
v = v0 1 2
16

2 (J) =

(17.90)

con esta amplitud de referencia, podemos decir a partir de la Ec. (17.90) que la variaci
on relativa de segundo
orden de la frecuencia est
a dada por


v0 1 2 15
v
v v0
16 v0
=
=
v0
v0
v0
quedando finalmente
v
15
= 2
v0
16

466

17.7.

CAPITULO 17. TEORIA CANONICA


DE PERTURBACIONES

Teora de perturbaciones independiente del tiempo en presencia de


degeneraci
on

En presencia de degeneraci
on, la primera dificultad obvia que aparece es la anulaci
on exacta o aproximada
de j v0 en el denominador de la Ec. (17.84). En realidad los c
alculos en presencia de degeneracion son muy
complejos y contin
uan siendo tema de investigaci
on, por tanto solo se mencionar
an los aspectos cualitativos
m
as relevantes.
Se dice que la degeneraci
on es exacta o propia cuando las frecuencias sin perturbar v0 son tales que existan
uno o m
as conjuntos de enteros j para los cuales j v0 = 0 (ver secci
on 9.10.4). En la secci
on 9.10.4 veamos
que se puede pasar del conjunto can
onico (w0 , J0 ) a otro conjunto de variables tipo acci
on angulo para el
cual las antiguas frecuencias degeneradas corresponden a nuevas frecuencias nulas y las nuevas frecuencias sin
perturbar no nulas no son degeneradas. Al introducir la perturbaci
on se remueve la degeneraci
on de manera
que las frecuencias nulas del sistema no perturbado adquirir
an un peque
no valor y por lo tanto corresponden a
periodos grandes. Las variables angulo asociadas se denominan variables lentas en contraste con las variables
angulares correspondientes a frecuencias no degeneradas que se denominan variables r
apidas. Los terminos
de periodo largo pueden aparecer como terminos seculares sobre intervalos de tiempo restringidos, a manera
de ejemplo sin 2vt se puede considerar funci
on lineal de t siempre que vt << 1.
En el caso de degeneraci
on exacta, comenzamos usando las variables can
onicas (w0 , J0 ) y el Hamiltoniano
no perturbado es funci
on solamente de las variables J0i no degeneradas, de modo que aunque la Ec. (17.63)
sigue siendo v
alida, no aparecer
an en ella las J0i degeneradas. Se realiza entonces la transformaci
on can
onica
del c
alculo de la perturbaci
on pero solo para las variables no degeneradas dejando inalteradas las variables
degeneradas. El nuevo Hamiltoniano (Ec. 17.64) tiene la forma



J, J00 , w00 , = 0 (J) + 1 J, J00 , w00 + 2 2 J, J00 , w00 + . . .

donde w00 representa las m variables degeneradas que tiene valor cero en el problema no perturbado y J00 son
naturalmente sus momentos conjugados. Las variables no primadas est
an entonces asociadas a las variables no
degeneradas. Se ve entonces que la transformaci
on can
onica elimina a las variables r
apidas de modo que todo
queda en funci
on de las variables lentas. Por otro lado, puesto que es cclica en w, los momentos transformados
J son verdaderas constantes de movimiento y se puede considerar (J, J00 , w00 , ) como un Hamiltoniano de un
sistema con m grados de libertad. Adicionalmente, dado que 0 (J) es constante, y por tanto independiente
de las dem
as variables, no ser
an necesarias las ecuaciones de movimiento de (w00 , J00 ) y se podr
an suprimir en
. En consecuencia, el nuevo Hamiltoniano efectivo es de orden , el Hamiltoniano no perturbado es

1 J, J00 , w00
y en este problema no perturbado w00 ya no consiste en valores nulos. Si solo hay una condici
on de degeneraci
on,
el problema efectivo es de un solo grado de libertad y formalmente integrable. Con la presencia de m
as de
una degeneraci
on se suele buscar una segunda transformaci
on can
onica para eliminar los terminos de variables
lentas de forma similar a como se eliminaron las variables r
apidas, este procedimiento es muy complejo en la
pr
actica.
Puede aducirse a partir de la Ec. (17.84) que incluso cuando las frecuencias no son degeneradas, aparecer
an
as grandes. Este
inevitablemente valores peque
nos del divisor j v0 a medida que los ndices j se hacen m
fenomeno se conoce como resonancia, e implica que la amplitud de uno de los terminos de Fourier se haga muy
grande. Sin embargo, esto no supone un gran problema para la mayora de Hamiltonianos de perturbaci
on que
se usan en la pr
actica. Para ver esto, notemos que en (17.84) lo que cuenta es el factor completo
Cj
j v0

(17.91)

donde Cj es el coeficiente de Fourier del Hamiltoniano de perturbaci


on H1 como se ve en (17.82). En mec
anica
celeste ocurre que la mayora de Hamiltonianos de perturbaci
on poseen la caractersitca de DAlembert
que en terminos eursticos nos dice que cuando los valores de los enteros en j son mayores que el exponente en


17.8. ALGUNOS ASPECTOS CUALITATIVOS GENERALES DE LA TEORIA CLASICA
DE PERTURBACIONE
el Hamiltoniano, las magnitudes de Cj caen r
apidamente, usualmente en forma exponencial, cuando aumentan
los valores de los ndices j. Los cocientes del tipo dado en (17.91) no crecen entonces demasiado y la expansi
on
converge cuando las frecuencias v0 satisfacen una condici
on de irracionalidad.
El comportamiento resonante cuando se tiene la caracterstica de DAlembert o en general cuando Cj / (j v0 ) <

O ( ) se conoce como resonancia superficial. Estas resonancias en general no son un problema para la ex
pansi
on perturbativa. En ocasiones sin embargo, el anterior cociente se hace grande, i.e. mayor que O ( ) en
cuyo caso hablamos de resonancias profundas. Cuando aparecen resonancias profundas se requiere de tecnicas

especiales tales como el desarrollo de Bohlin en el cual se expande en potencias de en lugar de potencias
de . Un estudio profundo de este tema requiere un tratamiento exhaustivo de los fen
omenos de resonancia en
oscilaciones alineales.

17.8.

Algunos aspectos cualitativos generales de la teora cl


asica de perturbaciones

Hemos mencionado que la teora de perturbaciones ha evolucionado junto con la mec


anica celeste desde
los tiempos de Newton. De otra parte, la exploraci
on espacial y la tecnologa desarrollada alrededor de esta,
junto con el r
apido desarrollo de los recursos computacionales, ha impulsado enormemente el desarrollo de los
metodos perturbativos. A manera de ejemplo, la correcci
on de la relatividad general estudiada en la secci
on
(17.4.3) resulta lo suficientemente grande para la precisi
on requerida en los sistemas de posicionamiento global
satelital (GPS).
A grandes rasgos se distingue entre los metodos perturbativos generales que conducen a f
ormulas analticas
y metodos de perturbaci
on especiales, que nos llevan a respuestas numericas correspondientes al sistema
perturbado. Hay tambien metodos mixtos de modo que esta clasificaci
on es en realidad aproximada. Los
metodos numericos solo alcanzaron un desarrollo considerable con el desarrollo de las calculadoras y m
as
adelante de los computadores.
Vale mencionar sin embargo, que las soluciones numericas no pueden resolver cuestiones referentes a la
estabilidad a largo plazo de los sistemas perturbados. En esa direcci
on, un debate de gran interes concierne a
la estabilidad del sistema solar. Por ejemplo, las perturbaciones podran llevar a colisiones interplanetarias o
a que un planeta abandone el sistema solar. Por esta raz
on, desde el principio del desarrollo de los metodos
perturbativos existi
o un gran interes en estudiar los terminos perturbativos seculares. Por ejemplo, si se identifica un termino de perturbaci
on secular para el semieje mayor de la trayectoria de un planeta, se concluira
que el planeta abandonar
a el sistema solar o colapsar
a hacia el sol. Si bien al principio se demostr
o que no
existan terminos seculares a primer orden, los trabajos de Poincare en donde demuestra que las series de
Fourier multiperi
odicas que aparecen a orden superior solo son semiconvergentes llev
o a una indeterminaci
on
en el problema de la estabilidad.
La cuesti
on de la estabilidad solo se aclar
o a raz de la aplicaci
on m
as bien reciente de tecnicas matem
aticas
avanzadas. Por medio del uso de la topologa diferencial es posible examinar el comportamiento global de las
posibles orbitas en el espacio de fase. Con base en estos estudios se demostr
o que es posible el movimiento
acotado estable de un sistema de n cuerpos bajo interacci
on exclusivamente gravitatoria. Especficamente un
grupo de medida finita de orbitas est
an confinadas a regiones concretas del espacio de fase y permanecen
as indefinidamente en movimiento cuasi peri
odico. Debe decirse sin embargo, que aunque algunas orbitas
(un conjunto de medida finita) mantienen un movimiento cuasiperi
odico permanente, la inmensa mayora de
condiciones iniciales conducen a movimientos erg
odicos es decir que llenan completamente una cierta regi
on
del espacio de fase, de modo que la trayectoria en el espacio de fase para por un punto dado en el interior de
esta regi
on en uno o m
as instantes de tiempo.
De lo anterior se deduce que el problema de la estabilidad no est
a del todo resuelto puesto que solo un
conjunto de condiciones iniciales permite este movimiento estable y adicionalmente las fuerzas disipativas y
otras fuerzas no gravitatorias (e.g. interaccion magneticos entre los planetas y el sol) no han sido tenidas en
cuenta en tal estudio. El sistema puede ser adem
as muy sensible a las condiciones iniciales o a efectos de
cuerpos fuera del sistema solar.

468

17.9.

CAPITULO 17. TEORIA CANONICA


DE PERTURBACIONES

Invariantes adiab
aticos

Consideremos una lenteja que se suspende de modo que la cuerda pasa por un agujero que se practica
en el techo, y le damos el impulso necesario para que forme un pendulo plano. Ahora comenzamos a tirar
de la cuerda muy lentamente hacia arriba o hacia abajo, de modo que a lo largo de un periodo hay una
ligera variaci
on de la longitud de la cuerda. La energa del pendulo no se conserva ya que el agente externo
realiza trabajo sobre el sistema (o lo extrae de el) al cambiar la longitud de la cuerda. Un an
alisis sencillo
muestra que si la variaci
on de la longitud es muy lenta (i.e. adiab
atica) el cociente entre la energa y la
frecuencia de oscilaci
on E/ permanece constante. Este cociente ser
a precisamente la variable de acci
on J de
una formulaci
on en variables acci
on angulo. Decimos entonces que J es invariante adiab
atico y extenderemos
este fen
omeno a otros sistemas Fsicos y diremos que hay invarianza adiab
atica de las variables de acci
on
cuando dicha cantidad permanece constante (al menos a primer orden) cuando ocurre una variaci
on lenta de
los par
ametros del sistema. Esta propiedad era de gran interes para los pioneros de la mec
anica cu
antica, ya
que los primeros procesos de cuantizaci
on involucraban la cuantizaci
on de la variable de acci
on para describir
estados de sistemas at
omicos. Por otro lado, ya se saba que la variaci
on lenta de perturbaciones externas,
por ejemplo de los campos electromagneticos que rodean al atomo, no inducen transiciones entre estados. La
invarianza adiab
atica resultaba entonces una propiedad muy importante para explicar este fen
omeno.
El concepto de invarianza adiab
atica tiene m
ultiples aplicaciones en temas como Fsica del plasma, aceleradores de partculas, astronoma gal
actica etc. Este constituye un tema de interes e investigaci
on actual y
aqu solo daremos los fundamentos de este desarrollo.
Consideraremos por simplicidad sistemas de un solo grado de libertad que contengan un par
ametro a que se
variar
a adiab
aticamente. Implcitamente asumimos que el sistema es inicialmente conservativo con a constante
en el tiempo. En un cierto tiempo, se enciende la variaci
on temporal de a, es necesario aclarar que a se
asumir
a como funci
on exclusivamente del tiempo y no depender
a por ejemplo de posiciones o velocidades. Una
vez encendida la variaci
on temporal de a este variar
a lentamente por mucho tiempo y llegar
a a tener de nuevo
un valor constante. Cuando a sea constante, el movimiento ser
a peri
odico y la variaci
on lenta del par
ametro
no alterar
a la naturaleza peri
odica del movimiento. Incluso si las variaciones son peque
nas en un periodo
completo, pueden haber cambios apreciables para tiempos suficientemente largos. La variaci
on temporal de a
se considera entonces una perturbaci
on y buscamos variaciones seculares del movimiento.
Cuando el par
ametro a es constante en el tiempo, el sistema se describe por variables acci
on angulo
(w0 , J0 ) y el Hamiltoniano es funci
on de J0 y a, H = H (J0 , a). Es conveniente considerar que el par (w0 , J0 ) viene de una transformaci
on can
onica a partir de (q, p) con una funci
on generatriz que denotamos por W (q, w0 , a),
esta funci
on generatriz es de tipo 1. Si la transformaci
on can
onica se obtiene por Hamilton Jacobi, lo que se
a conectada con W por
obtiene es una funci
on generatriz de tipo 2 que denotamos por W (q, J0 , a) y que est
una transformacion de Legendre Ec. (7.21)
W (q, w0 , a) = W (q, J0 , a) J0 w0

(17.92)

la conveniencia de usar una funci


on de tipo F1 en lugar de la funci
on tipo F2 que sale de la soluci
on de

Hamilton Jacobi, proviene del hecho de que W es funci


on peri
odica de w0 como veremos m
as adelante.
Cuando a vara en el tiempo (w0 , J0 ) contin
uan siendo variables can
onicas pero la funci
on generatriz ahora
depende explcitamente del tiempo por medio de la dependencia temporal de a. Por tanto el Hamiltoniano
perturbado para el sistema (w0 , J0 ) ser
a
W
a W
= H (J0 , a) +
t
t a
W
K (w0 , J0 , a) = H (J0 , a) + a
a
K (w0 , J0 , a) = H (J0 , a) +

(17.93)

n
otese que en el u
ltimo paso hemos usado el hecho de que a solo depende del tiempo. Ahora J0 no es constante
y w0 ya no es funci
on lineal del tiempo. El segundo termino a la derecha de (17.93) es un Hamiltoniano de
perturbaci
on. N
otese que hemos usado la misma transformaci
on can
onica para generar dos Hamiltonianos
diferentes a partir del mismo Hamiltoniano original H (q, p). Primero usando la transformaci
on can
onica con


17.9. INVARIANTES ADIABATICOS

469

a constante llegamos de H (q, p, a) a H (J0 , a); ambos Hamiltonianos coinciden numericamente ya que la
Funci
on caractersitica no depende explcitamente del tiempo. Posteriormente, usamos la misma transformaci
on
can
onica pero ahora con a variable en el tiempo para ir desde H (q, p, a (t)) hacia K (w0 , J0 , a (t)), en este caso
los Hamiltonianos no coinciden numericamente ya que W adquiere dependencia explcita con el tiempo7 por
medio de a (t). De lo anterior se concluye que la relaci
on entre los Hamiltonianos K (w0 , J0 , a) y H (J0 , a) en
(17.93) no proviene de una transformaci
on can
onica sino m
as bien de la diferencia entre la misma TC cuando
a se considera constante y cuando a se considera variable en el tiempo.
La dependencia temporal de J0 viene regida por una de las ecuaciones de Hamilton


K

= a
J0 =
(17.94)
w0
w0
a
y al igual que en el metodo de variaci
on de constantes, la derivada entre parentesis al igual que K se expresa
en terminos de J0 es decir del valor de J a orden cero en perturbaciones. Dentro de un desarrollo perturbativo
a primer orden buscaremos un termino secular, que sera el valor medio de J0 a lo largo de un periodo del
movimiento no perturbado para un valor apropiado de a. La variaci
on adiab
atica de a, nos permite considerar
al par
ametro a como una constante a lo largo de un periodo y el valor medio se puede escribir en la forma




Z
Z

1

W
a
W

J0 =
a
dt =
dt + O a 2 , a

(17.95)
0 w0
a
0 w0
a
De la Ec. (9.16) recordamos que W se puede ver como una acci
on abreviada indefinida
Z
W = p dq

on generatriz W aumenta en una cantidad J0 . Similarmente, J0 w0


de modo que en un periodo de w0 la funci
tambien aumenta en J0 puesto que w0 aumenta en la unidad. En consecuencia, los terminos a la derecha en
la Ec. (17.92) cancelan su variaci
on en un periodo, con lo cual se obtiene que W es funci
on peri
odica de w0
y tanto ella como su derivada con respecto a a, pueden expresarse como expansi
on de Fourier
W X
=
Ak (J0 , a) e2ikw0
a

(17.96)

con lo cual el valor medio de J0 se escribe


Z

a X

J0 =
2ik Ak (J0 , a) e2ikw0 dt + O a 2 , a

0
k6=0

la integral se anula puesto que el integrando no tiene ning


un termino constante. Se obtiene entonces finalmente
J0 = O a 2 , a

de modo que J0 no tendr


a variaci
on secular de primer orden en a,
por tanto tenemos la propiedad de invarianza
adiab
atica a primer orden.

17.9.1.

Invarianza adiab
atica del oscilador arm
onico

Veamos como se traduce el anterior formalismo para el caso del oscilador arm
onico
H=
7


1
p 2 + m2 2 q 2
2m

Podra decirse que la dependencia temporal de W es en realidad implcita por medio de a (t). No obstante, dado que a (t) no
es una variable can
onica, esta dependencia se considera explcita para efectos en las Ecuaciones de Hamilton.


CAPITULO 17. TEORIA CANONICA
DE PERTURBACIONES

470

consideraremos que puede ser funci


on del tiempo, lo cual en el ejemplo que se explic
o en la secci
on 17.9
equivale a la variaci
on de la longitud del pendulo. Por tanto, ser
a nuestro par
ametro a de variaci
on adiab
atica.
La transformaci
on can
onica que lleva desde (q, p) hasta (w0 , J0 ) viene dada por las Ecs. (9.113)
r
r
J0
mJ0
sin 2w0 ; p =
cos 2w0
q=
m

las cuales reescribiremos de forma que faciliten el c


alculo de W
J0
mq 2
sin2 2w0 J0 =
m
sin2 2w0
s


m
mq 2
p =
cos 2w0

sin2 2w0

q2 =

(17.97)
(17.98)

que finalmente se escribe en la forma


J0 = mq 2 csc2 2w0 =
p = mq cot 2w0 =

W
q

W
w0

(17.99)
(17.100)

donde hemos tenido en cuenta las ecuaciones parciales para funciones generatrices tipo 1 Ecs. (7.16). W se
puede hallar por integraci
on directa de (17.99, 17.100) excepto por constantes irrelevantes, pues recordemos
que lo que importa es hallar una soluci
on y no se necesita que tal soluci
on sea u
nica (y no lo es).
W (q, w0 , ) =
W

mq 2
cot 2w0
2
mq 2
cot 2w0
2

y reemplazando la primera de las Ecs. (17.97) obtendremos a W en funci


on de w0 , J0 y


W
m
J0
J0
cos 2w0
2
=
sin 2w0 cot 2w0 =
sin2 2w0

2 m
2
sin 2w0

W
J0
J0 sin 4w0
=
sin 2w0 cos 2w0 =

2
2
2
J0
W
=
sin 4w0
(17.101)

4
podemos obtener los coeficientes de Fourier de esta derivada reescribiendo el seno y usando la Ec. (17.96)
W

Ak (J0 , ) =

 X
J0 e4iw0 e4iw0
J0  2i(2)w0
=
e
e2(2)iw0 =
Ak (J0 , ) e2ikw0
4
2i
8i
k

J0
(k2 k,2 )
8i

es decir su expansi
on de Fourier consta de solo dos terminos. La expresi
on para J0 se obtiene reemplazando
(17.101) en la Ec. (17.94)





J0
J0 =
=
sin 4w0
w0

w0 4

J0 = J0 cos 4w0

(17.102)


17.9. INVARIANTES ADIABATICOS

471

que no posee ning


un termino constante como ya se predijo. La Ec. (17.102) es formalmente exacta. Similarmente, la depedencia temporal exacta de w0 la determina la ecuaci
on de Hamilton para w0 usando el Hamiltoniano
perturbado (17.93)




K
H

W
J0
w 0 =
=
+
= v0 +
sin 4w0
J0
J0
J0

J0 4

w 0 =
+
sin 4w0
(17.103)
2 4
si queremos calcular un valor medio de J0 que incluya una correcci
on no nula, debemos hacer algunas aproximaciones. En primer lugar, asumamos que para un periodo del movimiento perturbado el cociente definido
por

(17.104)

es constante y cumple la relaci


on << 1. La Ec. (17.104) tiene una soluci
on de la forma
= = 0 et 0 (1 + t)

(17.105)

donde t se mide desde el inicio del intervalo donde se mide el periodo y (0) = 0 . Reemplazando (17.104) y
(17.105) en (17.103) resulta
w 0 =

0 (1 + t)

+
sin 4w0
+
sin 4w0
2 4
2
4

(17.106)

cuya soluci
on a orden cero es

0
(0)
2w0 = 0 t
2
donde se ha hecho cero la constante de integraci
on a traves de una elecci
on adecuada de la fase inicial. Con
esta elecci
on de fase se tiene que
4w0 = 4v0 t = 20 t
(0)

w 0 =

Reemplazando esta expresi


on en la Ec. (17.106), obtenemos w0 a primer orden en
(1)

w 0

(1)

2 w 0
cuya soluci
on es

(1)
2w0

0 (1 + t)

+
sin 20 t
2
4

= 0 + 0 t + sin 20 t
2
=




1 cos 20 t
2
= 0 t +
0 t +
2
20

(17.107)

de nuevo hemos elegido nula la constante de integraci


on por simplicidad.
Veamos ahora la soluci
on para J0 . De la Ec. (17.102) tenemos que

J0

d ln J0
= cos 4w0
= cos 4w0
J0

dt

(17.108)

donde hemos usado (17.104). Ahora reemplazamos (17.107) en la segunda de las Ecs. (17.108) con lo cual se
obtiene
 


d ln J0
4

1 cos 20 t
2
= cos
0 t +
0 t +
dt
2
2
20
lo cual nos da la ecuaci
on a segundo orden para J0
d ln J0
dt
d ln J0
dt



1 cos 20 t
2
= cos 20 t + 0 t +
20
= cos [x + y] ; x 20 t

; y 0 t2 +

1 cos 20 t
20


CAPITULO 17. TEORIA CANONICA
DE PERTURBACIONES

472

expandiendo el coseno en serie y usando a como par


ametro peque
no de primer orden, se obtiene
d ln J0
dt
d ln J0
dt





= cos [x + y] = sin x sin (y) cos x cos (y) = ( sin x) y + O 3 cos x 1 + O 2
=


2 y sin x cos x

y recordando las definiciones de x e y se tiene que




1 cos 20 t
d ln J0
2
2
= cos 20 t + 0 t +
sin 20 t
dt
20
como se indic
o en el formalismo general, el comportamiento secular se obtiene promediando esta ecuaci
on
sobre un periodo de movimiento es decir desde t = 0 hasta 2/0 . En el miembro derecho solo sobrevive el
termino proporcional a t2 una vez que se hace el promedio.



d ln J
dt
d ln J
dt




=
=

0
2

0 2
0 t sin 20 t dt =
0
2

0 /2

t2 sin 20 t dt

2 2
( )2
0 ( )2
0 2
=
=

0 2
4
4
0 (2/0 )2

<< 1

de modo que es la variaci


on relativa de a lo largo de un periodo completo . La variaci
on secular relativa
de J se calcula en la forma
J
2
=
(17.109)
J
2
que nos dice que la variaci
on secular de la variable de accion es de segundo orden tal como se vi
o en el
2
formalismo general. Solo considerando terminos del orden 2 = (/)

podemos encontrar variaciones de J a


largo plazo.

17.9.2.

Variaci
on asint
otica de J para el oscilador arm
onico (opcional)

Una de las enormes utilidades del oscilador arm


onico consiste en que todos los fen
omenos de oscilaciones
peque
nas en torno a un punto estacionario se pueden aproximar a un oscilador arm
onico. Por lo anterior es de
mucho interes conocer la variaci
on de J para el oscilador arm
onico para variaciones lentas y no tan lentas de
un par
ametro. Esto no solo posee aplicaciones en Fsica sino incluso en la soluci
on de ecuaciones diferenciales
con coeficientes que dependen del tiempo.
ametro peque
no, es claro que
Introduzcamos una variable temporal t0 = t siendo un par
=

d
d
= 0
d (t)
dt

el par
ametro temporal reescalado nos mide si vara lenta o r
apidamente. Consideraremos el cambio de J no
sobre un periodo de movimiento sino a lo largo de su valor inicial y final asint
otico es decir desde t0 hasta
0
t . En cada estado asint
otico se asume que J adquiere valor constante. Es posible llegar al sorprendente
0
resultado de que para (t ) bien comportado, la variaci
on entre los estados asint
oticos es mucho menor de lo
que se podra esperar en la Ec. (17.109). M
as especficamente se ha demostrado que si (t0 ) es real, acotada
y analtica sobre y en torno al eje real, la variaci
on de J es exponencialmente decreciente con en la forma


J (+) J ()
O ed/
J (+)
siendo d un n
umero real positivo, que est
a relacionado con la anchura de la franja de analiticidad de en el
plano t0 complejo.


17.9. INVARIANTES ADIABATICOS

17.9.3.

473

Un invariante exacto del oscilador arm


onico con frecuencia dependiente del tiempo (opcional)

Es interesante ver que el oscilador arm


onico con frecuencia dependiente del tiempo, posee un invariante
exacto que en el lmite de variaci
on lenta se reduce a la variable de acci
on J. Supongamos un oscilador arm
onico
lineal con Lagrangiano y Hamiltoniano dados por
L=


m 2
x 2 (t) x2
2

H=

el invariante que mencionamos tiene la forma


1  2
p + m2 2 (t) x2
2m



1 x2
2
I=
+ (r x xr)

2 r2

(17.110)

(17.111)

siendo r (t) una funci


on que satisface la ecuaci
on diferencial
r + 2 (t) r r 3 = 0

(17.112)

la deducci
on matem
atica de la invarianza de I es m
as bien compleja y resulta m
as ilustrativo hacer algunas
consideraciones que nos den su significado fsico y la raz
on de porque es constante. Consideremos el movimiento del oscilador arm
onico unidimensional con frecuencia constante, como la proyecci
on sobre x de un
oscilador bidimensional is
otropo. Esta consideraci
on permanece v
alida incluso cuando depende del tiempo.
Consideremos entonces un potencial central de tipo arm
onico8 pero dependiente del tiempo
m 2
(t) r 2
2

(17.113)

i m 
 

mh 2
r + r 2 2 2 (t) r 2 =
x 2 2 (t) x2 + y 2 2 (t) y 2
2
2

(17.114)

V =
su Lagrangiano es
L=

en coordenadas cartesianas esto se desdobla en dos osciladores arm


onicos lineales independientes con la misma
frecuencia. Cada uno de ellos cumple con la estructura dada por la Ec. (17.110). En coordenadas polares planas
se ve que L es cclica en de modo que se sigue conservando el momento angular con = (t), de esto se
sigue que una de las ecuaciones de movimiento se reduce a9
r 2 =

l
h
m

(17.115)

donde hemos introducido la constante de movimiento h. Con esto podemos seguir considerando al oscilador
lineal como la proyecci
on en x de un oscilador bidimensional is
otropo donde h nos da su momento angular por
unidad de masa. La ecuaci
on radial asociada al Lagrangiano (17.114) resulta
 
d L
L
= m
r ;
= mr 2 mr 2 (t)
dt r
r
r 4 2
m
r + m 2 r mr 2 = 0 r + 2 r r 2 = 0 r + 2 r 3 = 0
r
y teniendo en cuenta la Ec. (17.115) resulta
r + 2 r
8

h2
=0
r3

(17.116)

N
otese que en nuestro invariante I la variable r (t) no se refiere a posici
on en el tiempo, es simplemente la soluci
on de la
ecuaci
on diferencial (17.112). Por otro lado, en la Ec. (17.113) s estamos considerando a r (t) como una posici
on para el problema
de la fuerza central equivalente.
9
N
otese que en este caso es independiente de (t). La primera se refiere a la variaci
on de la coordenada angular de posici
on
del problema bidimensional, la segunda se refiere al coeficiente de restituci
on que puede ser variable en nuestro problema. Mas
exactamente, el coeficiente de restituci
on es k (t) = m 2 (t) como se aprecia en la Ec. (17.113).


CAPITULO 17. TEORIA CANONICA
DE PERTURBACIONES

474

y usando la conservaci
on de h se puede construr una constante de movimiento dada por


1 h2 x2
2
I0 =
+
(r
x

x
r)

2 r2

(17.117)

para conocer el valor de esta constante hagamos x = r cos de lo cual resulta




r x xr = r r cos r sin r r cos = r 2 sin
r x xr = h sin

y reemplazando en (17.117) tenemos





1 h2 r 2 cos2
1 2
2
2
2
2
2
I0 =
+
h
sin

=
h
cos

+
h
sin

2
r2
2
2
h
I0 =
2
por otro lado, dada la arbitrariedad en la amplitud inicial de y y de la fase inicial del movimiento bidimensional
en x e y es posible escoger estos valores de tal manera que h tenga el valor numerico unidad. Para ver esto,
supongamos que durante un cierto periodo de tiempo permanece constante con valor 0 , en este intervalo
la dependencia temporal de x e y est
a dada por
x = x0 sin 0 t

y = y0 cos (0 t + )

y usando la definici
on de h
Lz
m |(r v)z |
=
= xy y x = [x0 sin 0 t] [0 y0 sin (0 t + )] [y0 cos (0 t + )] [0 x0 cos 0 t]
m
m
h = 0 y0 x0 sin 0 t [sin 0 t cos + cos 0 t sin ] 0 x0 y0 [cos 0 t cos sin 0 t sin ] cos 0 t


h = 0 y0 x0 sin2 0 t cos 0 x0 y0 cos2 0 t cos = 0 y0 x0 cos sin2 0 t + cos2 0 t
h =

h = 0 x0 y0 cos

ahora hacemos variar con el tiempo, en tal caso h conservar


a su valor inicial que se puede hacer igual a
la unidad eligiendo adecuadamente y0 o para un valor dado de x0 , es decir para un valor especfico de la
amplitud del movimiento unidimensional real. De esto se concluye que siempre es posible asociar a cualquier
oscilador unidimensional dependiente del tiempo, un oscilador is
otropo bidimensional con h = 1. N
otese que
para este problema asociado, la ecuaci
on de movimiento radial (17.116) se reduce a la Ec. (17.112) cuando
h = 1. De la misma forma I 0 de la Ec. (17.117) se convierte en el invariante I de la Ec. (17.111) cuando se
toma h = 1.
De lo anterior vemos que Fsicamente la invarianza exacta de la cantidad I asociada a un oscilador unidimensional y expresada en la Ec. (17.111), es una manifestaci
on de la conservaci
on del momento angular en
el problema del oscilador is
otropo bidimensional asociado, que tiene como proyecci
on en x al oscilador unidimensional en cuesti
on. A su vez, la conservaci
on del momento angular en el oscilador bidimensional is
otropo
esta relacionada con el hecho de que el car
acter central de la fuerza no se modifica cuando se introduce la
variaci
on temporal de .
Veamos ahora la relaci
on de I con la variable de acci
on J. Si es constante una soluci
on posible para
1/2
que es obviamente constante. Esto corresponde a una
la ecuaci
on radial (17.116) con h = 1 es r =
trayectoria circular en el problema bidimensional asociado. Dado que en este caso r = 0, la ecuaci
on (17.111)
nos da
"
#



2

1
x2
1
x 2
m
E
J0 v0
1/2
2
2
I =
x =
x +
=
x 2 + 2 x2 =
=
2 +
2 1/2
2

2m
m
2mv0
J0
I =
2m
de modo que en la aproximaci
on de orden cero el invariante exacto es proporcional a la variable de acci
on J,
la cual es invariante solo a primer orden en un proceso adiab
atico.


17.9. INVARIANTES ADIABATICOS

17.9.4.

475

Invariantes adiab
aticos de partculas cargadas en campos electromagn
eticos

Supongamos que tenemos un electr


on que se mueve en un campo magnetico uniforme y constante. Es bien
conocido que la partcula cargada describir
a una circunferencia o un helicoide alrededor de una lnea de campo
magnetico. Empleando segunda ley de Newton y fuerza de Lorentz resulta
dv
qB
=v
dt
mc

(17.118)

la Ec. (17.118) nos dice que v es perpendicular a su raz


on de cambio y por tanto la rapidez es constante.
En particular si v y B son perpendiculares en un instante dado, el movimiento se realizar
a en un plano
perpendicular a las lneas de campo. En tal caso veremos que el vector v gira alrededor de una lnea de campo
magnetico con velocidad angular
qB
(17.119)
c =
mc
Elijamos uz a lo largo de B y escribamos en coordenadas cilndricas



dv 
+ zu
= r r 2 ur + 2r + r u + zuz
B = Buz ; v = ru
r + r u
z ; a=
dt

la Ec. (17.118) queda






r r 2 ur + 2r + r u + zuz =

i
q h
q
q
r
+ zu
ru
r + r u
rBu
+
Br u
z Buz =
mc
mc
mc
q
q
r r 2 =
Br ; 2r + r =
rB

; z = 0
mc
mc
q
q
r r 2
Br = 0 ; 2r + r +
rB
= 0 ; z = 0
(17.120)
mc
mc

antes de analizar las soluciones veremos que el problema lo podemos plantear en el marco de la mec
anica
lagrangiana usando el siguiente Lagrangiano no relativista para el sistema
L=

mv 2
+MB
2

(17.121)

siendo M el momento dipolar magnetico de la partcula en movimiento. En terminos del momento angular
esto se escribe
qL
M=
(17.122)
2mc
usando coordenadas cilndricas con el eje z a lo largo de B, el vector M se escribe como



q
q
q
q  2
+ zu
r
M=
r + r u
z =
+ z ru
rz u
rp= rv =
(rur + zuz ) ru
r uz r zu
2mc
2c
2c
2c
la componente Mz es entonces

Mz =

qr 2
2c

(17.123)

con lo cual el Lagrangiano (17.121) queda


L =
L =


m 2
r + r 2 2 + z 2 + Mz B
2

m 2
q
r + r 2 2 + z 2 + Br 2
2
2c

es cclica de modo que se conserva su momento conjugado


p = mr 2 +

qBr 2
2c

(17.124)


CAPITULO 17. TEORIA CANONICA
DE PERTURBACIONES

476

la ecuaci
on de movimiento radial se obtiene de la ecuaci
on de Lagrange para r
 


d L
qB
L
qB
2
= m
r ;
= mr +
r m
r r m +
=0
dt r
r
c
c


qB

r r +
=0
mc

(17.125)

la cual coincide con la primera de las Ecs. (17.120). La segunda de las Ecs. (17.120) se obtiene de la ecuaci
on
de Lagrange para o combinando las Ecs. (17.124, 17.125).
Una soluci
on de movimiento estacionario para las Ecs. (17.120) consiste en tomar r constante10 , con lo cual
la segunda de las Ecs. (17.120) nos conduce a c constante. Reemplazando r y constantes en la primera
de las Ecs. (17.120) se obtiene

q
q 
Brc = 0 c +
B c = 0
rc2
mc
mc
de modo que el valor de ser
a

qB
= c
(17.126)
mc
que coincide con (17.119). De la tercera de las Ecs. (17.120), podemos ver que la ecuaci
on para la coordenada
z est
a totalmente desacoplada y que la velocidad en z es constante. Si z = 0 el movimiento es circular uniforme
con frecuencia c dada por (17.126), si z 6= 0 el movimiento ser
a un helicoide con la misma frecuencia angular
y las mismas ecuaciones para r y .
Reemplazando (17.126) en (17.124) vemos que p adquiere el valor
p = mr 2
p =

qB
qBr 2
qBr 2 1 qBr 2
+
=
+
mc
2c
c
2 c

qBr 2
2c

ahora calcularemos la variable de acci


on asociada a , como esta coordenada es cclica tiene movimiento
peri
odico de rotaci
on en el espacio de fase y su periodo natural ser
a 2 (ver discusi
on de la Ec. 9.120) con lo
cual
I
qBr 2
J = p d =
(17.127)
c

si asumimos que z = 0, el movimiento es circular y el momento angular (y por tanto el momento dipolar
magnetico) va a lo largo de z, de modo que Mz = M . Usando adem
as (17.123), podemos escribir
M=

qr 2 c
qr 2
2M

=
2c
c
c

con lo cual la variable can


onica J puede escribirse en la forma
J =

2M B
2mc
=
M
c
q

(17.128)

donde hemos usado (17.126). El teorema de invarianza adiab


atica dice que ante una variaci
on lenta del campo
magnetico, J permanece constante al menos a primer orden. La Ec. (17.128) nos dice adem
as que el momento
magnetico M tambien es un invariante adiab
atico. A partir de la Ec. (17.127), este hecho se puede enunciar de
forma alternativa diciendo que el producto del campo por el area encerrada por la orbita se mantiene constante.
Es posible que aparezca una variaci
on adiab
atica de B si permanece est
atica la configuraci
on del campo
magnetico pero este es ligeramente no uniforme. Si por ejemplo el campo depende de z y la partcula tiene una
peque
na componente z de la velocidad, esta se desplazar
a lentamente a regiones con valor diferente de B. Las
10

Esto implica que la proyecci


on de la velocidad en el plano XY es totalmente transversal.


17.9. INVARIANTES ADIABATICOS

477

Ecs. (17.122, 17.126) nos dicen que la energa cinetica transversal, es decir la correspondiente al movimiento
alrededor de las lneas de B viene dada por



1
mr 2 2
1 2 1
1 2M mc
qB
2
T = mv =
= mr = |L| |c | =
2
2
2
2
2
q
mc
T = M B

(17.129)

supongamos que la partcula cargada es llevada hacia una direcci


on en donde B crece, la Ec. (17.129) nos
dice que en tal caso la energa cinetica transversal aumenta. Ahora bien, dado que la energa cinetica total se
conserva (puesto que la rapidez es constante como se puede ver de la Ec. 17.118), es necesario que disminuya
la componente de la velocidad que va a lo largo de las lneas de fuerza i.e. la componente radial, tambien puede
haber variaci
on de la componente en z pero si asumimos que esta velocidad es muy peque
na, la mayor parte de
la variaci
on ser
a en las velocidades radial y transversal. La componente radial de la velocidad se ve entonces
disminuda hasta anularse, luego de lo cual se invierte el sentido radial del movimiento. Adicionalmente, si
hacemos que B crezca en sentido contrario, la partcula cargada quedar
a confinada, moviendose en uno y
otro sentido entre los extremos, fen
omeno que se conoce como confinamiento especular. Hay en realidad
varios efectos adicionales debidos por ejemplo a la radiaci
on de ciclotr
on y a efectos inductivos debido a la
no uniformidad y posible variaci
on temporal de los campos. Sin embargo, esta descripci
on simplificada da un
buena idea de las implicaciones Fsicas de la invarianza adiab
atica de M .

Captulo 18

Formulaci
on Lagrangiana y Hamiltoniana
para Sistemas Contnuos y Campos
La formulaci
on que se ha trabajado hasta el momento inclua un n
umero finito (o a lo mas infinito numerable
y discreto) de grados de libertad. No obstante, algunos problemas mec
anicos como la vibraci
on de un s
olido
el
astico, involucran sistemas contnuos. Cada punto del s
olido toma parte en la oscilaci
on, y el movimiento
completo puede ser descrito solo si especificamos los desplazamientos de las partculas con respecto al equilibrio
en todos los puntos. La extensi
on a un sistema contnuo se puede realizar partiendo de un sistema discreto,
resolviendo el problema para luego hacer un paso al lmite apropiado. El paso al contnuo nos lleva de manera
natural al concepto de campo y a la teora de campos, siendo un campo una funci
on que asigna a cada punto
del espacio tiempo una cantidad escalar, vectorial, tensorial, etc. con lo cual hablamos de campos escalares,
vectoriales, tensoriales etc. Vale decir adem
as que el concepto de campo es de gran utilidad en muchas ramas de
la Fsica incluso en escenarios m
as all
a de la mec
anica, quiz
as el lector ya este familiarizado con campos tales
como la densidad de carga, la densidad de masa, el potencial electrico, campos de temperaturas, de presiones
etc. los cuales son campos escalares, entre los campos vectoriales se destacan el campo gravitacional, el campo
electrico, el campo magnetico, el potencial vectorial magnetico, la densidad de corriente electrica etc.
Antes de hacer un estudio detallado del paso al contnuo que nos lleva a la teora de campos, es conveniente
recapitular algunos aspectos de la ecuaci
on de continuidad, la cual jugar
a un papel vital en esta formulaci
on.

18.1.

Ecuaci
on de continuidad

Existen muchos principios de conservacion que nos son u


tiles en la comprensi
on de la naturaleza. No obstante, en general es deseable que estos principios de conservaci
on se puedan expresar en la forma de ecuaciones
diferenciales. Asumiremos la existencia de un principio de conservaci
on para una carga generalizada que es
simplemente una cantidad escalar a la cual le podemos asociar una densidad (cantidad de carga generalizada
por unidad de volumen) y una propiedad de transporte que se manifiesta en una densidad de corriente
generalizada (carga generalizada por unidad de area por unidad de tiempo, en la direcci
on de propagaci
on
de la carga generalizada). Hay muchas cantidades escalares a las cuales se les puede asociar un principio de
conservaci
on as como una densidad y una densidad de corriente, los ejemplos m
as comunes son: carga electrica, energa, masa de un fludo etc. De aqu en adelante usaremos simplemente los terminos carga, densidad
de carga y densidad de corriente, sobreentendiendo que estamos trabajando con estos conceptos en forma
generalizada.
Si tenemos una regi
on cerrada la carga que sale (entra) se debe manifestar como una disminuci
on (aumento)
de la carga en el interior, de no ser as significa que se est
a creando o destruyendo carga neta de manera
espont
anea. Queremos en primer lugar calcular la carga que sale por unidad de tiempo del volumen V . Para
ello necesitamos conocer el flujo sobre la superficie S que delimita a V . Veamos primero el flujo definido sobre
un elemento diferencial de superficie dS. Definimos dS como un vector normal al elemento de superficie dS que
apunta hacia afuera y cuya magnitud es el area dS del elemento diferencial, denotando los vectores unitarios
478

DE CONTINUIDAD
18.1. ECUACION

479

normal y tangencial a la superficie como uN , uT se tiene que


dS = dS uN ; J = JN uN + JT uT
n
otese que la componente normal de J es la u
nica que cruza la superficie, ya que la componente tangencial
va a lo largo de esta. En particular si la corriente es puramente tangencial, la carga se propagar
a a lo largo
de la superficie pero sin cruzarla y por lo tanto esta carga no abandonar
a el volumen. De lo anterior es claro
que la cantidad de carga que sale del volumen en la unidad de tiempo estar
a definida por la componente de la
densidad de corriente que cruza dicha superficie, es decir la componente normal de J. Dado que J es la cantidad
de carga por unidad de tiempo que cruza una superficie unidad perpendicular a la direcci
on de propagaci
on,
se tiene que la cantidad de carga por unidad de tiempo que cruza la superficie dS estar
a dada por
JN dS = J dS
N
otese que si esta cantidad es negativa, significa que la componente normal de J va en direcci
on uN es
decir, est
a entrando al volumen. Por tanto, la carga neta que sale por unidad de tiempo del volumen V que
est
a delimitado por la superficie cerrada S es1
I
J dS
S

y esta cantidad debe ser igual a la disminuci


on de carga en el interior por unidad de tiempo
I
dqint
J dS =
dt

(18.1)

siendo J la densidad de corriente y qint la carga contenida en el volumen V . El signo menos se puede entender
teniendo en cuenta que cuando la carga sale (entra) el signo de la integral de superficie es positivo (negativo),
esto implica que la carga en el interior debe disminuir (aumentar) es decir debe ser una funci
on decreciente
(creciente) del tiempo y por lo tanto su derivada debe ser negativa (positiva). Por tanto, el signo menos
garantiza que ambos miembros tengan el mismo signo en ambas circunstancias. La carga en el interior se
puede escribir en la forma
Z
d
dqint

=
(r, t) dV
dt
dt

siendo (r, t) la densidad de carga en el punto r y en el instante t. La integral de volumen se realiza en un


instante fijo de tiempo y la derivada depende de este valor evaluado en t y en t + dt. Sin embargo, el volumen
y un cierto punto x, y, z dentro de este son fijos en el proceso, de modo que esta es realmente una derivada
parcial en el tiempo.
Z
I
Z
I
Z
dqint

=
dV J dS =
dV J dS +
dV = 0
dt
t
t
t
S

y aplicando el teorema de la divergencia se obtiene



Z 

J+
dV = 0
t
como el volumen en cuesti
on es arbitrario en forma tama
no y ubicaci
on, llegamos a la ecuaci
on diferencial
J+

=0
t

(18.2)

1
Por supuesto los signos de JdS pueden ser diferentes en cada elemento diferencial. Cuando la integral cerrada es positiva
(negativa) es porque sale (entra) m
as carga de la que entra (sale) en la unidad de tiempo, de modo que el flujo neto es hacia afuera
(adentro).

LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C


480CAPITULO 18. FORMULACION
esta ecuaci
on diferencial se conoce como ecuaci
on de continuidad y expresa la conservaci
on de la carga
generalizada en procesos donde existen corrientes que pueden incluso depender del tiempo. Cuando fluye una
cierta cantidad de carga hacia afuera (adentro) del volumen, la cantidad de carga disminuye (aumenta) a la
misma rata en que tal carga sale (entra). Vale la pena reiterar que la ecuaci
on diferencial (18.2) es v
alida para
expresar la conservaci
on de muchas cantidades escalares a las que se les pueda definir una densidad y una
densidad de corriente.
Por otro lado, tambien existen principios de conservaci
on asociados a cargas vectoriales generalizadas,
la conservaci
on del momento es quiz
as el mayor ejemplo en esta direcci
on. En tal caso definimos las componentes
de esta carga vectorial en coordenadas cartesianas de la forma
q = (q1 , q2 , q3 )
y cada componente se debe conservar por separado, es decir habr
a una ecuaci
on de continuidad para cada
escalar qi por separado. Para ello es necesario definir una densidad para la componente iesima de la carga
on de continuidad se escribe para
vectorial generalizada i y una densidad de corriente asociada Ji . La ecuaci
cada i en la forma
i
Ji +
=0
t
on en componentes,
y denotando la componente kesima de Ji en la forma Ji k podemos escribir esta ecuaci
con lo cual queda (suma sobre ndices repetidos)
k Ji k +

i
=0
t

(18.3)

n
otese entonces que hay en total tres corrientes, una por cada componente conservada. Podemos formar un
tensor Ji k que nos da cuenta de las tres corrientes (denotadas por el ndice i) y sus componentes (denotadas
por k). Por ejemplo J1 2 denota que la cantidad escalar conservada q1 se puede propagar en la direcci
on x2 .
En otras palabras, cuando el vector q se propaga en la direcci
on x2 su primera componente q1 puede cambiar.
Puede formularse la conservaci
on de un tensor de un rango arbitrario n y las corrientes asociadas se pueden
organizar en un tensor de rango n + 1. Por ejemplo, es m
as u
til organizar al momento angular en un tensor
antisimetrico de segundo rango que en un vector.
Debemos observar que el n
umero de componentes del vector es arbitrario en realidad. Por ejemplo, ocurre
con frecuencia que tenemos un vector y un escalar conservados y resulta c
omodo construir un vector de 4
componentes que de cuenta de todas las cargas conservadas
q = (q0 , q1 , q2 , q3 )

(18.4)

tendremos cuatro ecuaciones de continuidad


k J k +

= 0 ; = 0, 1, 2, 3 ; k = 1, 2, 3
t

(18.5)

esta ecuaci
on se puede escribir en una notaci
on m
as compacta si definimos

(t , 1 , 2 , 3 ) ; J , J 1 , J 2 , J 3
= 0 ; , = 0, 1, 2, 3

(18.6)
(18.7)

esta formulaci
on es c
omoda por ejemplo para inclur la conservaci
on de la energa y el momento lineal en un solo
arreglo. Por supuesto, la Ec. (18.7) tambien puede estarme expresando la conservaci
on de cuatro cantidades
escalares independientes que no forman ning
un vector. En ese sentido la cantidad J no necesariamente
expresa un tensor, aunque para la mayora de casos pr
acticos, se buscar
an cantidades vectoriales y tensoriales
para construr ecuaciones de continuidad.
Si una cantidad escalar determinada se conserva, entonces es claro que si definimos un volumen V delimitado
por una superficie S tal que la carga generalizada no cruza la superficie i.e. esta completamente contenida en

DE CONTINUIDAD
18.1. ECUACION

481

el volumen, entonces la carga total dentro del volumen qint se conserva ya que no hay perdidas por radiaci
on
dentro de este volumen. Similarmente ocurre para cada componente de un arreglo vectorial que se conserve,
esto se escribe en la forma
Z
dV = K (constante)
(18.8)
q =
V

Vale la pena observar que la conservaci


on de esta cantidad tambien se puede ver invirtiendo los pasos que
hemos seguido hasta ahora, es decir partimos de la formulaci
on diferencial y llegamos a la forma integral.
Integrando la Ec. (18.5) sobre el volumen V resulta

Z 
Z
Z

k
dV = 0
dV = 0
k J +
J dV +
t
V
V
V t
Z
Z
d
J dS +
dV = 0
(18.9)

dt V
S
donde hemos usado el teorema de la divergencia. Ahora bien, dado que la carga generalizada no cruza la
superficie, el valor del flujo J dS sobre cada elemento diferencial de area se anula2 , con lo cual la integral de
superficie se anula de modo que
Z
Z
d
dV = 0
dV = cte
(18.10)
dt V
V
una anotaci
on de terminologa es pertinente en este punto, hemos visto que si tenemos una carga generalizada
q que se conserva en el sentido de que no se puede crear espont
aneamente, la ecuaci
on de continuidad se puede
escribir en forma sintetica usando una configuraci
on de cuatro componentes
J (, J) J = 0

es usual llamar a la configuraci


on J una corriente conservada. No obstante, este es un termino un tanto
desafortunado ya que lo que se conserva es una propiedad global cual es la carga total cuando se encierra en
una superificie donde la carga generalizada no cruza la frontera. El termino corriente conservada parece sugerir
en forma err
onea que las densidades de carga y corriente son constantes de movimiento. Con esta aclaraci
on
utilizaremos el termino corriente conservada de aqu en adelante.
Por otro lado, ocurre con frecuencia que la carga y corriente generalizadas est
an presentes en todo el espacio
pero tienden a cero en el infinito. En tal caso ser
a necesario calcular la integral de volumen de la densidad
de carga generalizada en todo el espacio para asegurar que la carga generalizada total dentro del volumen se
conserva. Sin embargo, a
un integrando sobre todo el espacio puede ocurrir que la integral de superficie en 18.9
no se anule, ya que aunque J tienda a cero la superficie crece como el cuadrado de la distancia, si J decrece
m
as r
apido que 1/r 2 la integral de superficie tender
a a cero, pero si por ejemplo J decrece como 1/r 2 la integral
puede dar un valor finito incluso si se integra sobre todo el espacio. Esto implica que la carga generalizada no
se conserva para ning
un volumen y que por tanto se presenta perdida de carga generalizada por radiaci
on.
Un ejemplo notable del fen
omeno de radiaci
on ocurre en electrodin
amica cuando tenemos cargas electricas
aceleradas. Tomemos a la densidad de energa asociada al campo electromagnetico como nuestra densidad
de carga generalizada, la densidad de corriente generalizada ser
a entonces la cantidad de energa por unidad
de area por unidad de tiempo en la direccion de propagaci
on de la onda electromagnetica, que ser
a tambien
la direcci
on de propagaci
on de la energa transportada por el campo, esta densidad de corriente de energa
asociada al campo se conoce como vector de Poynting. Puede demostrarse que para sistemas de cargas
electricas aceleradas la integral de superficie del vector de Poynting en el infinito no es nula. Esto significa que
parte de la energa asociada al campo se aleja indefinidamente de la carga electrica sin regresar, hay tambien
una fracci
on de la energa asociada al campo que se transporta junto con la carga sin alejarse indefinidamente
de ella, es decir solo una fracci
on de la energa electromagnetica se pierde por radiaci
on. Es importante enfatizar
que en este caso hemos considerado que la carga generalizada es la energa asociada al campo y NO la carga
electrica. Efectivamente si la carga electrica est
a en un volumen finito, dicha carga se conserva aunque no se
conserve nuestra carga generalizada.
2
Esto no significa necesariamente que no haya corriente sobre la superficie, pero si tal corriente existe, es totalmente tangencial
de modo que la corriente evaluada en la superficie va a lo largo de esta sin cruzarla y por
a la superficie en todos los puntos de S,
tanto sin abandonar el volumen, de modo que el flujo es nulo.

LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C


482CAPITULO 18. FORMULACION

18.2.

Transici
on de un sistema discreto a un sistema contnuo

Figura 18.1: Sistema discreto de masas identicas puntuales conectadas por resortes identicos. Utilizaremos este
sistema para estudiar el paso al contnuo en una vara el
astica.
Utilizaremos como ejemplo ilustrativo, las vibraciones longitudinales de una varilla infinita. Partiremos
entonces del sistema discreto que consiste en una cadena infinita de masas iguales espaciadas una distancia
a, y conectadas a traves de resortes sin masa y uniformes (ver Fig. 18.1), todos con la misma constante de
restituci
on k, la infinitud de la cadena nos evita por el momento trabajar el problema de las condiciones en
los extremos. Asumiremos que las masas puntuales solo se pueden mover a lo largo de la cadena, en peque
nas
oscilaciones alrededor del equilibrio. Denotando i al desplazamiento de la iesima partcula a partir de su
posici
on de equilibrio, la energa cinetica es

T =

1X
m i2
2
i

donde m es la masa de cada partcula. La energa potencial correspondiente, resulta ser la suma de las energas
potenciales de cada resorte, que surgen como resultado del estiramiento o compresi
on de los resortes

V =

1X
k (i+1 i )2
2
i

el Lagrangiano queda entonces

L=T V =

i
1 Xh 2
m i k (i+1 i )2
2
i

que tambien se puede escribir como


"

 # X
1X
m 2
i+1 i 2
L=
a
ka
=
aLi
2
a i
a
i

(18.11)

donde a es la distancia entre los puntos de equilibrio. Obtengamos las ecuaciones de movimiento de Lagrange

DE UN SISTEMA DISCRETO A UN SISTEMA CONTINUO


18.2. TRANSICION

483

correspondientes a las coordenadas i




L
d L
= m k
= m
k
k
dt k
(
)
(
)
X
X


L
1
k

2
2
=
m i2 k i+1
+ i2 2i+1 i
=
i+1
+ i2 2i+1 i
k
2 k
2 k
i
i


X
k

2i+1 i+1,k + 2i ik 2
=
(i+1 i )
2
k
i


i
i+1
kX
=
2i+1 i+1,k + 2i ik 2i+1
2i
2
k
k
i
kX
[2i+1 i+1,k + 2i ik 2i+1 ik 2i i+1,k ]
=
2
i
X
= k
[(i+1 i ) i+1,k + (i i+1 ) ik ] = k [(k k1 ) + (k k+1 )]
i

usando las ecuaciones de Lagrange para las coordenadas generalizadas k se tiene




d L
L

= 0 m
k + k [(k k1 ) + (k k+1 )] = 0
dt k
k
m
k k (k+1 k ) + k (k k1 ) = 0
y dividiendo por a esta ecuaci
on, las ecuaciones de movimiento de Lagrange correspondientes a las coordenadas
i son




i+1 i
i i1
m
i ka
+ ka
=0
(18.12)
a
a2
a2
las ecuaciones (18.11, 18.12) se escogieron de esa forma con el fin de obtener una f
acil interpretaci
on de los
par
ametros en el lmite cuando a 0. Es claro por ejemplo, que m/a se reduce en el contnuo a la densidad
lineal de masa que denotaremos por . No obstante, el lmite de ka no es tan directo. Para una varilla el
astica
que obedece la ley de Hooke, la elongaci
on de la varilla por unidad de longitud es proporcional a la fuerza o
tensi
on ejercida a lo largo de esta, lo cual de puede escribir como
F =Y
donde es la elongaci
on por unidad de longitud y Y es el m
odulo de Young. Por otro lado, la elongaci
on de
un segmento a, por unidad de longitud del sistema discreto en cuesti
on, se escribe como
=

(i+1 i )
a

la fuerza necesaria para estirar el resorte en esta cantidad es




i+1 i
F = k (i+1 i ) = ka
a
con lo cual se ve que ka debe corresponder al m
odulo de Young de la varilla contnua. Al ir del sistema
discreto al contnuo, el ndice i, que identifica a una masa puntual especfica, se convierte en una coordenada
contnua de posici
on x; en vez de la variable discreta i ahora tendramos una variable de campo contnua
(x). Adicionalmente, la cantidad
lm

a0

i+1 i
(x + a) (x)
d
= lm
=
a0
a
a
dx

LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C


484CAPITULO 18. FORMULACION
de modo que a hace el rol de dx. Finalmente, la suma sobre el ndice discreto i se convierte en una integral
sobre x a lo largo de la longitud de la varilla. El Lagrangiano (18.11) queda
"
 2 # Z
Z
1
d
L=
dx 2 Y
dx L
(18.13)
2
dx
en el lmite cuando a 0, los u
ltimos dos terminos de (18.12) quedan





 

i i1
i+1 i
Y
i i1
i+1 i
Y
Y
=

a2
a2
a
a
a

 

Y
(x) (x a)
(x + a) (x)

a
a
a
escribiendo explcitamente el lmite resulta
 
  
Y
d
d
0 (x) 0 (x a)
d2
= Y 2
lm

= Y lm
a0 a
a0
dx xa
dx x
a
dx
por lo tanto, la extensi
on al contnuo de (18.12), es decir la ecuaci
on de movimiento para la varilla el
astica
contnua es
d2
d2
2 Y 2 =0
(18.14)
dt
dx
es decir la ecuacion de onda unidimensional, correspondiente a una velocidad de propagaci
on
s
Y
v=
(18.15)

la Ec. (18.15) corresponde a la bien conocida expresi


on para la velocidad de las ondas longitudinales el
asticas.
Este ejemplo sencillo ilustra la mayor parte de las caractersticas generales que presenta el paso al contnuo.
Un aspecto muy relevante es el papel de la coordenada de posici
on x. Esta variable no representa una
coordenada generalizada, es simplemente el ndice contnuo que reemplaza a i. As como cada diferente
valor de i corresponde a una coordenada generalizada diferente i del sistema discreto, de la misma forma hay
una coordenada generalizada (x) por cada valor de x en el sistema contnuo. Dado que tambien es en general
funci
on del par
ametro contnuo tiempo debemos escribir (x, t), esto indica que x al igual que el tiempo se
puede considerar como un par
ametro que entra en el Lagrangiano. Si el sistema contnuo fuera tridimensional
en lugar de unidimensional, las coordenadas generalizadas se rotularan con tres ndices contnuos x, y, z, y las
coordenadas generalizadas se escribiran como (x, y, z, t).
Vale la pena enfatizar que en la formulaci
on en el contnuo, las cantidades x, y, z, t son completamente
independientes unas de otras, y solo aparecen como variables explcitas en . Por lo tanto, las derivadas de
con respecto a cualquiera de ellas se pueden escribir como derivadas totales sin ninguna ambig
uedad3 . Por
otro lado la Ec. (18.13) nos muestra que el Lagrangiano aparece como una integral sobre el ndice contnuo
x, hemos denotado al integrando como L, en el correspondiente caso tridimensional el Lagrangiano tendra la
forma
Z Z Z
Z
L=
L dx dy dz = L dV
(18.16)
donde L es conocido como densidad Lagrangiana. De acuerdo con (18.13), la densidad Lagrangiana asociada
a las vibraciones longitudinales de la varilla viene dada por
"  
 2 #
1
d 2
d
L=

Y
(18.17)
2
dt
dx

que corresponde al paso al lmite contnuo de la cantidad Li que aparece en la Ec. (18.11). Como veremos m
as
adelante, para los sistemas contnuos la densidad Lagrangiana ser
a de mucha m
as utilidad que el Lagrangiano.
3
La independencia de los par
ametros x, y, z, t se puede ver teniendo en cuenta que ellos representan lugares geometricos (espacio
temporales) en el espacio euclidiano, y no posiciones de una determinada partcula. Es decir las variables de posici
on no tienen
ninguna din
amica en esta formulaci
on.

LAGRANGIANA EN UNA DIMENSION


PARA SISTEMAS CONTINUOS CON UNA SOL
18.3. FORMULACION

18.3.

Formulaci
on Lagrangiana en una dimensi
on para sistemas contnuos
con una sola variable de campo

De la Ec. (18.17) se observa que L para la varilla el


astica depende de /t, pero tambien de /x.
Esto indica que x y t juegan un rol similar como par
ametros de la densidad Lagrangiana. Si hubiera fuerzas
locales presentes adem
as de las interacciones entre vecinos, podemos tener un L que dependa de como tal,
adem
as del gradiente espacial de y su derivada temporal. En el caso m
as general la densidad Lagrangiana
puede ser tambien funci
on explcita de x, t por ejemplo si hay un campo externo que no sea constante ni
uniforme. De tal manera que la densidad Lagrangiana para un sistema contnuo unidimensional aparece como
una funci
on de la variable de campo en la forma


d d
L = L , , , x, t
dx dt

(18.18)

el Lagrangiano total es de acuerdo con (18.16), la integral de L sobre el rango de x que define al sistema. Por
otra parte, el principio de Hamilton Ec. (4.2) en el lmite de sistemas contnuos unidimensionales se escribe
como
Z Z
t2

x2

I =

t1

x1

L dx dt = 0

(18.19)

Si el principio de Hamilton para un sistema contnuo ha de ser de alguna utilidad, entonces debe ser posible
obtener el lmite contnuo de las ecuaciones de movimiento a partir de dicho principio, como por ejemplo la
Ec. (18.14). Las ecuaciones de movimiento deben obtenerse haciendo una variaci
on de la integral (ahora doble)
de L en (18.19). El procedimiento es muy similar al caso discreto. La variaci
on se hace solo sobre y sus
derivadas; los par
ametros x, t no son afectados por la variaci
on ni directamente ni a traves de los lmites de
integraci
on4 . As como la variaci
on de se toma como nula en los extremos temporales t1 y t2 , as mismo la
variaci
on de en los extremos x1 , x2 de la integraci
on en x tambien se tomar
a como cero, en otras palabras
tenemos condicion de extremo fijo en los par
ametros. Al igual que en la secci
on 3.2 una familia de caminos
variados muy conveniente en el espacio de las se obtiene escogiendo a a partir de una familia uniparametrica
de posibles funciones
(x, t; ) = (x, t; 0) + (x, t)
(18.20)
donde (x, t; 0) denota la funci
on correcta que satisface el principo de Hamilton, y es cualquier funci
on bien
comportada que se anula en los puntos extremos de x y t. Si I se considera una funci
on de , de tal modo que
tenga un extremo en (x, t; 0) la derivada de I con respecto a se anula en = 0. A traves de la diferenciaci
on
directa se obtiene5

 
 
Z t2 Z x2
dI
L

d
L

=
dx dt
+  
+  
(18.21)
d
d dt
t1
x1
d dx
dt

dx

puede verse que a pesar de que L puede depender tambien explcitamente de x y t, estos terminos no aparecen
en (18.21) en virtud de que x/ = t/ = 0 ya que los par
ametros no cambian cuando se hace una
variaci
on de la coordenada (x, t). Ahora bien, debido a que la variaci
on de es decir , se anula en los
extremos de ambos par
ametros, una integraci
on por partes en x y t nos da las relaciones
Z

t2
t1

L
 
d
dt

d
dt

dt =

t2

t1

d L
 
dt
dt d

dt

4
Recordemos que los par
ametros espaciales son solo lugares geometricos de modo que no se ven afectados por la variaci
on de
una coordenada , adem
as al igual que en el caso discreto el camino variado no implica variaci
on en el par
ametro temporal.
5
N
otese que este es un problema variacional multiparametrico, ya que involucra a los par
ametros x y t.

LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C


486CAPITULO 18. FORMULACION
y
Z

x2
x1

L
 
d
dx

d
dx

dx =

x2

x1

d L
 
dx
dx d

dx

el principio de Hamilton se puede escribir entonces

 
Z t2 Z x2
L
d
L
d
L
 
dx dt
 
=0

dt d
dx d
0
t1
x1
dt
dx

y por los mismos argumentos usados en la secci


on 3.2 la naturaleza arbitraria de los caminos variados implica
que el termino entre parentesis cuadrados debe anularse

d L
d L L
  +
 
=0
(18.22)
dt d
dx d

dt

dx

las ecuaciones de Euler Lagrange definidas por (18.22) corresponden a las ecuaciones de movimiento que se
derivan del principio de Hamilton Ec. (18.19).
Un sistema de n grados de libertad posee n ecuaciones de Lagrange, sin embargo, pareciera que para un
sistema contnuo solo tuvieramos una ecuaci
on de Lagrange!. Debe recordarse sin embargo que en el discreto
on diferencial que solo involucra al tiempo, en tal sentido
la ecuaci
on de movimiento para cada i es una ecuaci
la Ec. (18.22) nos da una ecuaci
on de movimiento para cada valor del ndice contnuo x. La naturaleza
contnua de x se manifiesta en que la Ec. (18.22) es una ecuaci
on diferencial parcial en x y t, cuya soluci
on
es de la forma (x, t). De lo anterior se desprende adem
as que la dimensi
on del espacio de configuraciones
corresponde a la cardinalidad del espacio real (en una dos o tres dimensiones) ya que cada ndice contnuo x
corresponde a un eje en el espacio de configuraciones.
Para el ejemplo especfico de las vibraciones longitudinales de la varilla el
astica, la forma de la densidad
Lagragiana (18.17) conduce a las relaciones

L  = d ; L  = Y d ; L = 0
(18.23)
dt
dx

d
d
dt

dx

de modo que se obtiene la consistencia deseada puesto que al reemplazar (18.23) en las Ecs. (18.22) llegamos
efectivamente a las relaciones (18.14).

18.4.

Formulaci
on Lagrangiana en tres dimensiones para sistemas contnuos
con un n
umero arbitrario de variables de campo (Teora cl
asica de
campos)

La formulaci
on Lagrangiana desarrollada aqu debe ser extendida a situaciones en dos y tres dimensiones,
como es el caso de un s
olido el
astico tridimensional. Adicionalmente, en lugar de un solo campo podramos
tener varias de estas cantidades. A manera de ejemplo, en tres dimensiones un desplazamiento arbitrario con
respecto a la posici
on de equilibrio se describira por un vector espacial de campo con tres componentes, en
la formulaci
on de Lagrange esto implica tres campos ya que las coordenadas generalizadas deben ser escalares.
La extensi
on a m
as dimensiones o m
as campos no presenta dificultades significativas. Sin embargo, la
notaci
on se vuelve altamente engorrosa cuando pasamos por ejemplo a tres dimensiones. Podemos notar sin
embargo que el principio de Hamilton (18.19) y las ecuaciones de Euler Lagrange (18.22) presentan una alta
simetra con respecto a las variables de espacio y tiempo, las variables espaciales y el tiempo parecen cumplir
el mismo rol y los campos son funciones tanto de las coordenadas espaciales como del tiempo y todas ellas

LAGRANGIANA EN TRES DIMENSIONES PARA SISTEMAS CONTINUOS CON UN N


18.4. FORMULACION
deben ser tratadas como variables independientes. No hay por ejemplo, variaci
on de los campos en los lmites
de integraci
on en el principio de Hamilton tanto sobre el espacio como sobre el tiempo. Debe tenerse en cuenta
sin embargo, que aunque en esta formulaci
on las coordenadas espaciales y temporales entran en forma m
as
simetrica, el tiempo NO corresponde a un ndice para la coordenada generalizada (r, t), esto se puede ver
del hecho de que en el sistema discreto el campo i (t) est
a rotulado por el ndice i pero no por la variable
temporal, la cual simplemente mide la evoluci
on de una coordenada generalizada especfica i .
En consecuencia de lo anterior, es conveniente introducir una notaci
on en terminos de un espacio de cuatro
0
1
2
3
dimensiones con coordenadas x = ct, x = x, x = y, x = z. Esta notaci
on no tiene ning
un significado
Fsico adicional. El factor c en x0 es la velocidad de la luz en el vaco y es usada solo con el fin de que x0
tenga las mismas unidades que xi . El tensor metrico g es el correspondiente a una geometra Euclidiana,
donde las transformaciones del grupo de Galileo son las transformaciones de coordenadas permitidas sobre las
componentes del espacio con el tensor metrico restringido por gij = ij . Las letras latinas en los suprandices
indicar
an ndices que involucran solo a las variables espaciales en tanto que las letras griegas como subndices
o suprandices se referir
an a todas las cuatro coordenadas. Se retomar
a la convenci
on de suma sobre ndices
repetidos. Las variables de campo se rotular
an con el subndice , que puede barrer una multitud de formas.
En algunas ocasiones simbolizar
a un ndice simple de dos tres, cuatro o m
as valores, pero tambien puede
simbolizar un conjunto de m
ultiples ndices. Por ejemplo, si la variable de campo es un tensor espacial de
segundo rango, entonces realmente se refiere a dos subndices. Finalmente, una derivada de las variables de
a por el subndice separado de
campo con respecto a cualquiera de las cuatro coordenadas x se denotar
por una coma. Si solo hay una variable de campo, el ndice no aparecer
a. Algunos ejemplos son los siguientes
,

d
dx

,j

d
dxj

i, =

d2 i
dx dx

solo las derivadas de las variables de campo ser


an simbolizadas de esta manera. En esta notaci
on la densidad
Lagrangiana m
as general que consideraremos se escribe como
L = L ( , , , x )
el Lagrangiano es una integral sobre el espacio tridimensional de la forma
Z
L = L ( , , , x ) dxi ; dxi dx1 dx2 dx3
y el principio de Hamilton se escribe como una integral en el espacio tiempo
Z
I = L ( , , , x ) dx = 0 ; dx dx0 dx1 dx2 dx3

(18.24)

donde la variacion de se anula sobre la hipersuperficie que delimita a la regi


on de integraci
on en el
espacio y el tiempo. La derivaci
on de las ecuaciones de Euler Lagrange se obtiene haciendo las extensiones
adecuadas. Se considera un conjunto uniparametrico de funciones variadas que se reducen al valor correcto de
(x ) cuando va a cero. Una familia de estas funciones se puede construr como
(x , ) = (x , 0) + (x )
las funciones (x ) son funciones de clase C 2 en todos los par
ametros. Dichas funciones se deben anular sobre
la hipersuperficie que delimita a la regi
on de integraci
on. La anulaci
on del variacional de I, es equivalente
a establecer que la derivada de I con respecto a sea cero.

Z 
dI
L
L ,
=
+
(dx )
d

,
integrando por partes se obtiene




Z 
Z
dI
L
d
L

d
L

(dx ) + (dx )
d
dx ,

dx
,

(18.25)

LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C


488CAPITULO 18. FORMULACION
la segunda integral se elimina cuando se va para cero, lo cual se puede ver de varias formas: si miramos
termino a termino, al realizar la integraci
on para el x particular para cada termino de derivada, se ve que
estos terminos se tienen que ir porque la derivada con respecto a es cero en los extremos. Por otro lado,
la integral se puede transformar por medio de un teorema de la divergencia en 4 dimensiones en una integral
sobre la hipersuperficie que delimita la regi
on de integraci
on en el cuadriespacio (euclidiano). La integral de
on de campo correcta es cero
superficie tambien se anula porque la variaci
on de en la vecindad de la funci
sobre la superficie. Para ver esto calculemos la segunda integral a la derecha en (18.25). Recordando que la
derivada total en x es equivalente a una derivada parcial podemos escribir el segundo termino en la forma

 Z

 Z


Z
d
L

L
L

(dx )
= (dx )
(dx )
dx
,
x
,
,
lo cual es b
asicamente una cuadridivergencia del termino entre parentesis. La aplicaci
on del teorema de la
divergencia en el espacio de 4 dimensiones convierte la integral de volumen en una integral sobre la hipersuperficie delimitadora donde la variaci
on del termino entre parentesis es cero. En smbolos, la variacion relevante
se escribe como



Z
Z 
d
L
L

(dx )
=
d = 0
dx
,
,
donde d representa las componentes de un elemento de hipersuperficie (en el espacio Euclidiano de cuatro
dimensiones) orientado a lo largo de la direcci
on de la normal hacia afuera (para las tres dimensiones espaciales).
Por lo anterior, en el lmite 0, la Ec. (18.25) se reduce a
 

 

Z 
dI
L
d
L

(dx ) = 0
(18.26)
d 0
dx ,
0

nuevamente, la naturaleza arbitraria de la variaci


on de cada significa que la Ec. (18.26) se satisface solo si
se anula el termino entre parentesis cuadrados.


d
L
L
=0
(18.27)

dx ,

la Ec. (18.27) representa un conjunto de ecuaciones diferenciales parciales para las variables de campo, el
n
umero de ecuaciones est
a determinado por los valores posibles de . Vale la pena enfatizar de nuevo que dado
que cada xi corresponde a un ndice para las variables de campo, cada una de las Ecs. (18.27) para fijo,
corresponde a un conjunto completo de ecuaciones diferenciales de movimiento de Lagrange en el caso discreto.
Es sencillo ver que las Ecs. (18.27) se reducen al caso particular (18.22) en el caso unidimensional (es decir
con un solo par
ametro espacial x), con una sola variable de campo (i.e. = 1). Comparando las dos ecuaciones
se puede apreciar la ventaja de la notaci
on introducida (y a
un m
as si se introducen las tres dimensiones). Es
necesario insistir que a pesar de la similitud de la notaci
on con aquella usada en relatividad especial, en este
caso estamos trabajando en el regimen no relativista con espacio y metrica Euclidianos.
En sistemas discretos, el Lagrangiano tiene un grado de arbitrariedad ya que se puede adicionar una
derivada total en el tiempo de una funci
on arbitraria de las coordenadas generalizadas y el tiempo sin alterar
las ecuaciones de movimiento. Con sistemas contnuos, la densidad Lagrangiana posee una simetra gauge
similar bajo la adici
on de un termino de la forma
L0 = L +

dF ( , x )
dx

(18.28)

recordando de nuevo que la derivada total en x es equivalente a una derivada parcial, podemos escribir el
segundo termino en (18.28) en la forma
dF ( , x )
F ( , x )
=
F
dx
x
con convenci
on de suma sobre ndices repetidos. Este termino se puede ver como la extensi
on de una divergencia
en 4 dimensiones (en tres dimensiones la divergencia es i Fi ). F son cuatro funciones arbitrarias de las variables

ASOCIADOS
18.5. EL TENSOR ESFUERZO ENERGIA Y TEOREMAS DE CONSERVACION

489

de campo y las coordenadas x . La aplicaci


on del teorema de la divergencia en el espacio de 4 dimensiones
on de F es
convierte la integral de hipervolumen en una integral sobre la hipersuperficie donde la variaci
nula
Z
Z

dF ( , x )
(dx )
= F ( , x ) d = 0
dx
Con lo cual el segundo termino a la derecha en (18.28) no contribuye a la variaci
on de la acci
on y por
tanto, tampoco contribuye a las ecuaciones de movimiento. Esto nos indica que la expresi
on (18.28) es una
transformaci
on gauge para la densidad Lagrangiana. N
otese adem
as que esta es una extensi
on natural del

gauge (2.25) para el discreto, con las asignaciones qi (t) (x ) , L L, F , t x la u


ltima
asignaci
on tiene que ver con el hecho de que el problema discreto es uniparametrico (solo el tiempo es un
par
ametro) y el problema en el contnuo es multiparametrico (con par
ametros t, xi ).
La formulaci
on Lagrangiana para un conjunto contnuo de coordenadas ha sido desarrollado con el fin de
trabajar sistemas mec
anicos contnuos tales como s
olidos el
asticos en oscilaci
on longitudinal, o un gas vibrando
de tal forma que se formen ondas ac
usticas. Lo interesante consiste en que la formulaci
on se puede emplear
para trabajar sistemas no mec
anicos que describan ecuaciones que gobiernan a un campo o campos. Matem
aticamente un campo es simplemente un conjunto de una o m
as funciones del espacio y el tiempo que
son independientes entre s, observese que esta definicion es compatible con la de coordenada generalizada,
simplemente extendiendo la posibilidad de que dichas coordenadas puedan depender de m
as de un par
ametro
(par
ametros espacio temporales en vez de solo el par
ametro temporal). No es necesario el requerimiento de que
el campo este relacionado con alg
un sistema mec
anico. Este rompimiento de conecci
on entre la formulaci
on Lagrangiana en el contnuo y la descripci
on de campos puramente mec
anicos es semejante al proceso hist
orico que
ocurri
o con la descripci
on de las ondas electromagneticas que originalmente fueron descritas como oscilaciones
el
asticas del misterioso eter. M
as adelante, se hace una formulaci
on de campos que permite la ondulaci
on sin
la presencia del medio el
astico. De la misma manera reconocemos que los procedimientos variacionales desarrollados aqu se pueden independizar de la noci
on de campos asociados a medios mec
anicos contnuos. Los
campos pueden entonces describir cualquier funci
on del espacio y el tiempo que pueda ser u
til en Fsica (e.g.
campos electromagneticos, potenciales, campos termicos, campos de presi
on, densidades generalizadas etc.).
En efecto, el principio de Hamilton es una descripci
on compacta y conveniente para describir la din
amica de
los campos generalizados que nos lleva a ecuaciones de campo.
Adicionalmente a las ecuaciones para los campos, la densidad Lagrangiana nos puede dar mas informaci
on
sobre la naturaleza de los campos. Hemos visto que en los sistemas discretos la estructura del Lagrangiano
esta fuertemente ligada a las cantidades conservadas asociadas al sistema. An
alogamente, veremos que en la
mec
anica del contnuo hay algunos teoremas de conservaci
on asociados a la densidad Lagrangiana.

18.5.

El tensor esfuerzo energa y teoremas de conservaci


on asociados

Un an
alogo a la conservaci
on de la integral de Jacobi (funci
on energa) para mec
anica puntual estudiada
en la secci
on (5.1) se puede derivar para medios contnuos. El factor adicional que aparece es que adem
as del
i
tiempo, aparecen las coordenadas x como par
ametros en la formulaci
on, ya que todos ellos son par
ametros
independientes en L. Por tanto en vez de comenzar con un derivada temporal en L, usaremos una derivada
total con respecto a x
dL
L
L
L
=
, +
, +
dx

,
x
usando las ecuaciones de movimiento (18.27), esta derivada se escribe
dL
dx
dL
dx

=
=



d
L
L d,
L
, +
+

dx
,
, dx
x


d
L
L
, +

dx
,
x

LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C


490CAPITULO 18. FORMULACION
despejando L/x , esto se puede escribir


d
L
L
, L =

dx
,
x

(18.29)

supongamos ahora que L no depende explcitamente de x . Esto usualmente significa que L representa un
sistema de campos libres, es decir que no contiene fuentes o sumideros de interacci
on con campos o partculas
externas al sistema en un punto explcito del espacio y con una dependencia temporal dada. Por ejemplo si
mi sistema es tal que incluye a todos los campos que intervienen en el problema, esto significa no interacci
on
entre los campos y las partculas puntuales que se mueven en el espacio y el tiempo a traves de tales campos,
tambien puede por supuesto significar la ausencia de dichas partculas. Bajo estas condiciones, la Ec. (18.29)
toma la forma de un conjunto de condiciones de divergencia.
dT
= T T , = 0
dx
donde hemos definido
T

L
, L
,

(18.30)

(18.31)

el cual tiene la forma de un 4-tensor de segundo rango, n


otese que dado que T tiene la forma de un tensor
de segundo rango, la divergencia sera de la forma de un vector en el 4-espacio. Enfatizamos en que la expresi
on tiene la forma de un tensor de segundo rango pero no necesariamente lo es, dado que el 4-espacio
no tiene todava propiedades de transformaci
on, el espacio y el tiempo son todava distintos y no tenemos

requerimientos para la transformaci


on de T . Sin embargo, las porciones espaciales de estas cantidades se
comportan como vectores y tensores en el espacio ordinario (Euclidiano), es decir Tij son componentes de un
tensor tridimensional de segundo rango. Antes de considerar las transformaciones posibles, determinemos el
significado Fsico de T . Para ello podemos notar que la Ec. (18.30) se puede comparar en forma directa con
la ecuaci
on de continuidad para cargas generalizadas vectoriales Ecs. (18.6, 18.7)
J = 0

(18.32)

y teniendo en cuenta las Ecs. (18.4, 18.6) vemos que J0 0 es 0 , es decir la densidad del escalar q0 que se
on de 0 . Ji 0 es i
conserva, J0 i representa la iesima componente de la corriente asociada con la propagaci
k
i.e. la densidad de una de las componentes del vector que se conserva, y Ji es la kesima componente del
vector densidad de corriente asociado a i .
De lo anterior es claro que la Ec. (18.30) me est
a expresando la conservaci
on de cuatro cantidades escalares
(posiblemente un escalar y un trivector). Veamos la interpretaci
on fsica de estas cargas generalizadas que se
conservan.

18.5.1.

Interpretaci
on fsica de T0 : densidad de energa y vector de Poynting

La similaridad entre la definici


on de T Ec. (18.31) y la integral de Jacobi (funci
on energa), Ec. (5.13) es
obvia, especialmente cuando tomamos la componente T0 0
T0 0 =

L
L

(18.33)

es l
ogico pensar entonces que esta es la densidad de funci
on energa en la mec
anica del contnuo. En muchos
sistemas mec
anicos, la densidad Lagrangiana tiene la forma L = T V, es decir la diferencia entre una densidad
de energa cinetica y una densidad de energa potencial. Adicionalmente, para muchos de ellos la funci
on energa
es la energa del sistema de modo que T + V es la densidad de energa del sistema. En consecuencia, por el
mismo argumento usado en la mec
anica discreta, T0 0 se puede identificar como la densidad de la energa total.
Veremos que en particular esta interpretaci
on es correcta cuando usamos la densidad Lagrangiana de la varilla
el
astica Ec. (18.17)

1 2
2
L=
Y ,x
(18.34)
2

ASOCIADOS
18.5. EL TENSOR ESFUERZO ENERGIA Y TEOREMAS DE CONSERVACION

491

usando (18.33) calculemos T0 0


T0 0 =
T0 0 =


L
1 2
2
L =
Y ,x

2
1 2 1
2
+ Y ,x
=T +V
2
2

Figura 18.2: Ilustraci


on de las fuerzas sobre un punto x de la varilla el
astica, con el cual se realiza el c
alculo
de la densidad de corriente de energa en la varilla.
Con base en lo anterior, es de esperarse que el vector T0 con componentes T0 i , juegue el rol de una densidad
de corriente de energa. Nuevamente recurrimos al ejemplo del campo que describe la vibraci
on longitudinal
de una varilla elastica. Dividamos la varilla por medio de un corte imaginario en el punto x (ver figura 18.2).
A partir de las consideraciones que nos llevaron al Lagrangiano (18.13) la fuerza ejercida por la parte derecha
de la varilla para alargar la parte izquierda del corte es
d
dx
por tanto hay una tensi
on en x en la porci
on izquierda de igual magnitud pero direcci
on opuesta Ften = Fder .
Adem
as, la porcion izquierda est
a siendo estirada por una cantidad que en x vale (x), y la rata a la cual esta
extensi
on cambia en el tiempo es .
Por tanto, la rata de trabajo que la tensi
on ha hecho en el corte es
Fder = Y

dW
d
= Ften = Y

(18.35)
dt
dx
la cual es en consecuencia la rata a la cual la energa est
a siendo transferida desde la izquierda hacia la derecha
por unidad de tiempo. Reemplazando (18.34) en (18.31) podemos calcular T0 1 y verificar que coincide con el
valor dado en (18.35)
L
d
T0 1
,t Ltx = Y ,x = Y

,x
dx
Lo cual nos muestra la consistencia de definir T0 i como la componente iesima de la densidad de corriente
de energa. En la mec
anica ondulatoria en tres dimensiones, el vector que representa la propagaci
on de energa
por unidad de area por unidad de tiempo se conoce como vector de Poynting. Este vector correspondera
entonces a las componentes T0 i .

18.5.2.

Interpretaci
on fsica de Ti j : densidad de momento lineal y tensor de esfuerzos

Para poder identificar las otras componentes del tensor, es conveniente escribir (18.30) de la siguiente forma
dT 0 dT j
+
=0
dt
dxj

(18.36)

LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C


492CAPITULO 18. FORMULACION
o

dT 0
+ T = 0
(18.37)
cdt
donde T cuyas componentes son T son un conjunto de 4 vectores en el 4-espacio. Ya vimos que T0 contiene la
densidad de energa y la densidad de corriente de energa. Las Ecs. (18.36, 18.37) son ecuaciones de continuidad,
que nos dicen que la rata de cambio en el tiempo de la densidad T 0 mas la divergencia de la densidad de
corriente T es nula.
Para extraer el significado Fsico de las componentes de Ti 0 examinamos de nuevo las vibraciones de la
varilla el
astica. Si las partculas en la varilla se mueven todas en la misma cantidad a lo largo de esta, el
movimiento ser
a como una traslaci
on de un cuerpo rgido, de modo que no hay oscilaciones. El cambio neto de
masa en una longitud dx de la varilla como resultado del movimiento ser
a claramente cero, dado que pasa la
misma cantidad de masa por x+dx que la que pasa por x. Habr
a sin embargo, una densidad de momento lineal
neta v para esta traslaci
on rgida, siendo v la velocidad de traslaci
on de la barra6 . Por otro lado, cuando
tiene lugar el movimiento ondulatorio, existe un cambio neto de masa en el segmento dx, que para un cierto
tiempo viene dada por
d
dm = [ (x) (x + dx)] = dx
dx
el momento adicional en el intervalo, que resulta del movimiento ondulatorio es por tanto

T,
=

dP = dm =

d
dx
dx

de modo que una densidad adicional de momento (densidad lineal en este caso), mas all
a de la que surge del
movimiento estacionario, puede ser identificada como la onda o densidad del campo de momento
p

dP
d
=
dx
dx

veamos ahora que esta cantidad es justamente T1 0 para la densidad Lagrangiana dada por (18.17).
T1 0 =

L
d
,x + Lxt =
,x =
,t
dx

Esto nos lleva a identificar Ti 0 como las componentes del campo de densidad de momento.
Las ecuaciones de continuidad, (18.37) sugieren entonces que Ti debe representar la densidad de flujo
vectorial para la iesima componente del campo de densidad de momento. Ascribimos una propiedad de
vector a Ti porque puede haber por ejemplo, un flujo en la direcci
on y de la componente x de la densidad de
momento, que se determinara por Tx y T1 2 . Una interpretaci
on alternativa de Ti j proviene de considerar
el campo de desplazamiento de un s
olido tridimensional el
astico. Es bien sabido que en un s
olido de este tipo
hay tambien fuerzas de cizalladura tangenciales a la superficie (adem
as de las fuerzas de compresi
on normales a
la superficie) a lo largo del elemento de superficie. El ensamble completo de fuerzas se puede describir diciendo
que la fuerza dF que act
ua sobre un elemento de area dA se expresa en terminos de un tensor de esfuerzos
T de modo que
dF = T dA
que explcitamente se escribe

T1 1 T1 2 T1 3
dA1
(dF1 , dF2 , dF3 ) = T2 1 T2 2 T2 3 dA2
T3 1 T3 2 T3 3
dA3

(18.38)

dAi es un elemento de area en la direcci


on de xi de modo que

|dA1 | = dx2 dx3 ; |dA2 | = dx1 dx3 ; |dA3 | = dx1 dx2


6

N
otese que en este caso no hay estiramientos ni encogimientos de los segmentos de modo que nuestros campos son todos
nulos en este caso. Por tanto, aunque el segmento dx transporta momento, este momento no est
a asociado al campo.

ASOCIADOS
18.5. EL TENSOR ESFUERZO ENERGIA Y TEOREMAS DE CONSERVACION

493

en consecuencia la fuerza neta digamos en la direcci


on x1 , sobre un elemento de volumen rectangular dx1 dx2 dx3
tiene contribuciones que provienen de las fuerzas sobre las superficies paralelas a los planos x2 x3 , x1 x3 y x1 x2 .
Calculemos primero la contribuci
on en la direcci
on x1 que proviene de las fuerzas sobre las dos superficies
paralelas al plano x2 x3 . Estos planos poseen coordenadas x1 y x1 + dx1 respectivamente (ver figura 18.3).
Para el plano asociado a la coordenada x1 el elemento de area (que apunta hacia afuera del volumen) va en la
direcci
on ux1 con lo cual tenemos que para este plano la Ec. (18.38) queda en la forma

dx2 dx3
T1 (x1 ) T1 2 (x1 ) T1 3 (x1 )

0
(dF1 (x1 ) , dF2 (x1 ) , dF3 (x1 ))(23) = T2 1 (x1 ) T2 2 (x1 ) T2 3 (x1 )
1
2
3
T3 (x1 ) T3 (x1 ) T3 (x1 )
0
(23)

dF1

(x1 ) = T1 1 (x1 ) dx2 dx3

para el plano paralelo a x2 x3 con coordenada x1 + dx1 , el elemento de area apunta hacia +ux1 de modo que
la suma de las dos contribuciones de los planos paralelos a x2 x3 nos da

Figura 18.3: Fuerza en la direcci


on x1 sobre un elemento de volumen dx1 dx2 dx3 de un s
olido el
astico.

(23)

dF1

(23)

(x1 ) + dF1



dT1 1
(x1 + dx1 ) = T1 1 (x1 + dx1 ) T1 1 (x1 ) dx2 dx3 =
dx1 dx2 dx3
dx1

(18.39)

veamos ahora las contribuciones de los dos planos paralelos a x1 x3 . Estos planos est
an asociados a las coordenadas x2 y x2 + dx2 como se aprecia en la Fig. 18.3, para el plano inferior de coordenada x2 el vector de area
es dx1 dx3 ux2 de modo que la Ec. (18.38) nos queda en la forma
(dF1 (x2 ) , dF2 (x2 ) , dF3 (x2 ))(13)
(13)

dF1

T1 1 (x2 ) T1 2 (x2 ) T1 3 (x2 )


0
= T2 1 (x2 ) T2 2 (x2 ) T2 3 (x2 ) dx1 dx3
T3 1 (x2 ) T3 2 (x2 ) T3 3 (x2 )
0

(x2 ) = T1 2 (x2 ) dx1 dx3

para la superficie paralela a x1 x3 con coordenada x2 + dx2 el vector de area es dx1 dx3 ux2 . Por tanto, la
contribuci
on proveniente de las dos superficies paralelas al plano x1 x3 da
(13)

dF1

(13)

(x2 ) + dF1



dT1 2
(x2 + dx2 ) = T1 2 (x2 + dx2 ) T1 2 (x2 ) dx1 dx3 =
dx1 dx2 dx3
dx2

(18.40)

LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C


494CAPITULO 18. FORMULACION
y similarmente para las superficies paralelas a x1 x2 .
(12)

dF1

(12)

(x3 ) + dF1



dT1 3
(x3 + dx3 ) = T1 3 (x3 + dx3 ) T1 3 (x3 ) dx1 dx2 =
dx1 dx2 dx3
dx3

(18.41)

la fuerza infinitesimal resultante es entonces la suma de los terminos en las Ecs. (18.39, 18.40, 18.41)


dT1 1 dT1 2 dT1 3
dFx1 =
dV
+
+
dx1
dx2
dx3
la densidad de fuerza resultante en la direcci
on x1 es entonces7
dFx1
dT1 1 dT1 2 dT1 3
f x1 =
+
+
dV
dx1
dx2
dx3
La segunda ley de Newton por unidad de volumen podemos escribirla como
f x1 =

dp
dt

y recordando que la densidad de momento es p = T1 0 tenemos que la segunda ley de Newton por unidad de
volumen se puede escribir como
dT1 1 dT1 2 dT1 3
dT1 0
+
+
=
dx1
dx2
dx3
c dt
o en notaci
on sintetica
T1 = 0
que es precisamente la componente x1 de la Ec. (18.37). Para este campo particular Ti j puede identificarse como
los elementos del tensor de esfuerzos tridimensional, de all el origen del termino tensor de esfuerzo-energa
para T .
En sntesis, usando consideraciones para medios contnuos mec
anicos, hemos podido asociar a cada una
de las componentes del tensor de esfuerzo-energa, una interpretaci
on fsica que se resume en el cuadro 18.1.
Adicionalmente, como se vi
o de la discusi
on que sigui
o a la Ec. (18.37), T0 y Ti forman vectores 4-espaciales
cada uno de los cuales es una corriente conservada similar a el 4- vector densidad de carga-densidad de corriente
de la teora electromagnetica, y los denominamos 4-corrientes. En casi todos los casos el tensor tridimensional
Componentes de T
T0 0
trivector T0 con componentes T0 j
Ti 0
trivector Ti con componentes Ti j
Ti j

Interpretaci
on Fsica
campo de densidad de energa dividido por c
campo de densidad de corriente de energa
componente iesima del campo
de densidad de momento
densidad de corriente para la iesima componente del campo de densidad de momento
tensor de esfuerzos tridimensional

Cuadro 18.1: Interpretaci


on fsica de las componentes del tensor de esfuerzo energa.
T es simetrico. Esto no solo es fsicamente deseable sino que es una caracterstica casi necesaria para la parte
espacial del tensor de esfuerzo energa.
Debemos recordar que aunque el ejemplo y la nomenclatura provienen de un sistema mec
anico, este formalismo es extendible a muchas configuraciones de campos sin importar su naturaleza u origen. Una teora
7

Para la contribuci
on a la fuerza a lo largo de x1 , las contribuciones de los planos paralelos a x2 x3 son de compresi
on y las
otras contribuciones son de cizalladura.

ASOCIADOS
18.5. EL TENSOR ESFUERZO ENERGIA Y TEOREMAS DE CONSERVACION

495

cl
asica de campos se puede construr para las vibraciones el
asticas de un s
olido, campos electromagneticos,
campos termicos, campos de presi
on, la funci
on de onda de Schr
odinger etc. Debe tenerse presente sin embargo,
que en el caso m
as general, las cuatro ecuaciones de continuidad dadas por (18.30) expresan la conservaci
on
de cuatro cargas generalizadas que podran ser independientes entre s. N
otese que la interpretaci
on de estas
cuatro cargas como energa y momento implican que las cuatro cargas est
an organizadas como un escalar y
un trivector euclidiano (en el caso relativista usualmente representar
an un cuadrivector de Lorentz), pero no
hay nada en el formalismo general que me garantice este nivel de organizaci
on.
Por otro lado, recordemos que en el caso m
as general la densidad Lagrangiana puede depender de los
par
ametros x en la Ec. (18.29) con lo cual la Ec. (18.32) se convierte en una ecuaci
on de continuidad con
fuentes
L
J =
x
lo cual corresponde a tener campos adicionales externos al sistema de campos en cuesti
on, o partculas puntuales
interactuando con los campos. Cuando se encuentran ecuaciones de continuidad con fuentes no se conserva
la carga generalizada asociada. No obstante, ocurre con frecuencia que es posible extender el sistema Fsico
para inclur los campos o partculas que act
uan de fuentes y sumideros a fin de llegar a una nueva ecuaci
on
de continuidad que sea homogenea y que por tanto me conduzca a una carga generalizada conservada. Este
es el caso con el campo electromagnetico (aunque para las Ecs. de Maxwell se debe usar una formulaci
on
relativista), cuando se considera la densidad lagrangiana para el sistema del campo electromagnetico se llega
a ecuaciones de continuidad para la energa y el momento con fuentes, que corresponden al hecho de que las
cargas que interact
uan con el campo pueden absorber o transferir energa y momento al campo. Sin embargo,
el sistema extendido de cargas y campos s conserva estas cantidades.

18.5.3.

Energa y momento total del sistema

Como ya se discuti
o, la ecuaci
on de continuidad implica la conservaci
on de algunas cantidades integrales
(ver Ec. 18.8) siempre que el volumen del campo sea finito, es decir la variable de campo toma valor cero por
fuera de cierto volumen acotado8 , en tal caso se definen cantidades integrales R como
Z
R = T 0 dV
(18.42)
donde el volumen de integraci
on es tal que el campo est
a completamente contenido en el, y los flujos de
los campos y de todas sus derivadas se anulan en la superficie que delimita al volumen. Es debido a estos
teoremas de conservaci
on, derivados a partir de (18.30), que los cuatro arreglos de la forma T , = 0, 1, 2, 3
se conocen como corrientes conservadas, en analoga con las ecuaciones de conservaci
on para las corrientes
electromagneticas.
Si T0 0 es una densidad de energa, entonces la cantidad R0 definida por
Z
R0 =
T 0 dV
V

se puede identificar como la energa total en el campo siempre que T0 i se anule en la superficie de delimitaci
on,
esto es si el sistema no rada energa al exterior.
Con base en la interpretaci
on de las componentes Ti 0 es claro que la conservaci
on de las otras cargas
generalizadas
Z

Ri =
Ti 0 dV
V

nos dicen que para un sistema cerrado no interactuante el momento lineal total del campo Ri se conserva
como se esperaba.
8
En realidad el volumen podra tomarse en el infinito cuando los campos no est
an acotados. Pero se requiere que los campos
y todas sus derivadas tiendan a cero en el infinito m
as r
apido de lo que crece la superficie de integraci
on, a fin de que la integral
(18.9) se anule para que sea v
alida la Ec. (18.10).

LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C


496CAPITULO 18. FORMULACION

18.5.4.

Densidad de momento angular y momento angular total

Por otro lado, debe tambien existir un teorema correspondiente a la conservaci


on del momento angular
total del campo. Es sencillo construr una cantidad que act
ue como densidad de momento angular. Dado que
el momento angular es un vector axial, se espera que las componentes de una densidad de momento angular
sean elementos de un tensor antisimetrico de segundo rango. Teniendo en cuenta la interpretaci
on de Ti 0
como la densidad de la componente iesima del momento lineal, una forma adecuada para este tensor es

Mi j = xi Tj 0 xj Ti 0
(18.43)
donde el momento angular total del campo viene dado por
Z
Mi j = Mi j dV

teniendo en cuenta que t y xi son completamente independientes, la rata de cambio de Mi j es


Z 
0
0
dMi j
i dTj
j dTi
=
x
x
dV
dt
dt
dt
o, a partir de las ecuaciones de continuidad (18.36)

Z 
dTj k
dMi j
Ti k
=
xi k xj k
dV
dt
dx
dx
una integraci
on por partes convierte esta expresi
on en
Z
Z

dMi j
d  i k
j k
=
x Tj x Ti
dV
dt
dxk

Ti j Tj i

dV

(18.44)

la primera integral a la derecha tiene la forma de una integral de volumen de una divergencia, con lo cual se
puede convertir en una integral sobre la superficie que delimita tal volumen, la cual se anula para un sistema
cerrado que no rada. Finalmente, si T ij = T ji , la segunda integral tambien es cero. Por lo tanto, el momento
angular total del sistema de campos se conserva si T es simetrico y el sistema no rada por la superficie. Por
supuesto es posible a
un que la segunda integral de volumen en (18.44) se anule sin que el tensor sea simetrico
pero sera menos ntido para demostrar.
En algunos casos resulta que el tensor de esfuerzo (tridimensional) no es simetrico. No obstante, podemos
usualmente usar la ambig
uedad en la definici
on de este tensor para restaurar esta simetra. As como en el
caso del Lagrangiano, la forma del tensor esfuerzo-energa, Ec. (18.31), se escogi
o para que satisfaciera ciertas
condiciones de divergencia (Ecs. 18.30). Por tanto T est
a indeterminado puesto que podemos agregar una
funci
on cuya 4-divergencia se anule. N
otese que esto conduce por ejemplo al hecho de que la densidad de energa
y el vector de Poynting de una onda electromagnetica esten definidas salvo cantidades que son divergencias
espaciales. La adici
on de estas cantidades no contribuye a los observables tales como la energa total o la
corriente total de energa. Un termino de cuadridivergencia nula se puede parametrizar en forma general en la
forma
d
Z
dx
donde es un conjunto de funciones de las variables de campo que cumplen la condici
on de antisimetra
=
al calcular la cuadridivergencia los smbolos y se vuelven ndices mudos y la cuadridivergencia consta de
pares de la forma (no hay convenio de suma)
Z =

d2
d2
+
dx dx dx dx

que se anulan a causa de la condici


on de antisimetra. Esta ambig
uedad nos permite usualmente simetrizar el
tensor esfuerzo energa lo cual se hace a menudo cuando se construye teoras de campos cl
asicos.

HAMILTONIANA PARA MEDIOS CONTINUOS


18.6. FORMULACION

18.6.

497

Formulaci
on Hamiltoniana para medios contnuos

Es posible obtener una formulaci


on Hamiltoniana para medios contnuos de una manera muy similar al
caso discreto. Retornaremos al ejemplo de la cadena unidimensional de masas acopladas. Partimos entonces
de la definici
on de momento can
onicamente conjugado a una variable de campo i
pi =

L
Li
=a
i
i

(18.45)

donde el Li est
a definido para la cadena de masas acopladas a traves de la Ec. (18.11). El Hamiltoniano para
el sistema es entonces
Li
H pi i L = a
i L
i

X  Li
H =
a
i Li
i
i

recordando que en el lmite a 0, que nos lleva al contnuo, se tiene que Li L, a dx, y la suma se
convierte en integral


Z
L
H = dx
L
(18.46)

Por otro lado, los momentos can
onicos individuales pi dados por (18.45), tienden a cero en el lmite contnuo,
pero podemos definir una densidad de momento que permanece finita
lm

a0

pi
L
=
a

(18.47)

la Ec. (18.46) nos muestra que el Hamiltoniano tambien viene dado por una integral de tal forma que se puede
definir una densidad Hamiltoniana H
H L
(18.48)
aunque la formulaci
on Hamiltoniana es f
acil de introducir para campos cl
asicos, es de anotar que el procedimiento le otorga a la variable tiempo, un tratamiento diferente a los par
ametros de espacio9 , en contraste con
la formulaci
on Lagrangiana en la cual los par
ametros espacio temporales aparecen en forma muy simetrica.
Por esta raz
on el formalismo Hamiltoniano al menos como se describe aqu, no es muy adecuado para trabajar
una formulaci
on covariante relativista de los campos. El metodo Hamiltoniano no es entonces tan fructfero
como el Lagrangiano para trabajar sistemas contnuos relativistas.
La ruta obvia para generalizar a campos en tres
 dimensiones, consiste en definir las densidades de momento
i
canonico (18.47) para un cierto campo x , t de la forma
(x ) =

(18.49)



las cantidades xi , t , xi , t definen el espacio de fase infinito dimensional que describe los campos
cl
asicos y su evoluci
on en el tiempo. Por otro lado, existe una ley de conservaci
on asociada a muy similar a
la que se obtiene en el caso discreto. Si el campo no est
a contenido explcitamente en L, es decir es una
variable de campo cclica, entonces la ecuaci
on de Lagrange (18.27) asociada a este campo, se asemeja a una
ecuaci
on de continuidad que describe una corriente conservada






d
L
d L
d
L
= 0
+ i
=0
dx ,
dt
dx ,i


d
d
L
+ i
= 0
dt
dx ,i
9

Esto proviene del hecho de que la definici


on de densidad de momento Ec. (18.47), solo depende de y no de las derivadas de
con respecto a las coordenadas espaciales.

LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C


498CAPITULO 18. FORMULACION
se sigue de aqu que si es cclica, hay una integral que define una cantidad conservada
Z

= dV xi , t

on
es importante enfatizar que no es el que se conserva, sino su variable global asociada . La generalizaci
de la Ec. (18.48) sera


H , ,i , , xi L
(18.50)

donde se asume que la dependencia funcional sobre se puede eliminar por inversi
on de la ecuaci
on de
definici
on (18.49) tal como en el caso discreto. A partir de la definici
on (18.50) y usando (18.49) se sigue que
L
H

= +
=

(18.51)

La otra mitad de las ecuaciones can


onicas de campo son menos directas de obtener. Cuando se expresa en
terminos de variables can
onicas, H es una funci
on de a traves de la dependencia explcita de L, as como a
traves de , (n
otese que al despejar la Ec. 18.49 tenemos como funci
on de , , ,i y x ). Por tanto,
H

L
L
L
=

(18.52)

donde hemos usado (18.49). Ahora usando las Ecuaciones de Lagrange en el contnuo Ecs. (18.27) esto queda




H
d
L
d
L

=
= i
(18.53)

dx
,
dx ,i
debido a la presencia de L esta forma no es todava u
til. No obstante una derivaci
on paralela de (18.50) muestra
que
H

L
L
L
=

=
(18.54)
,i
,i ,i ,i
,i
donde de nuevo hemos usado (18.49). Podemos escribir entonces la segunda mitad de ecuaciones de campo
reemplazando (18.54) en (18.53) resultando


H
d
H
i
=
(18.55)
dx ,i
las Ecs. (18.51) y (18.55) se pueden colocar en una notaci
on en la cual su apariencia se asemeja mas a la de
las ecuaciones de Hamilton en el discreto. Para ello introducimos la noci
on de funcional derivativa definida
por

i
(18.56)

dx ,i
y teniendo en cuenta que H no es funci
on de ,i , las Ecs. (18.51) y (18.55) se pueden escribir como
=

H
H
; =

(18.57)

n
otese que en esta notaci
on las Ecuaciones de Lagrange en el contnuo (18.27), quedan de la forma


d L
L

=0
dt

la u
nica ventaja de la funcional derivativa sin embargo es la similaridad de las ecuaciones (tanto de Hamilton
como de Lagrange) con respecto a aquellas en el discreto. Sin embargo, en el caso de las Ecs. de Lagrange, esta
notaci
on destruye la simetra con la que las coordenadas del espacio y el tiempo aparecan en esta formulaci
on.

HAMILTONIANA PARA MEDIOS CONTINUOS


18.6. FORMULACION

18.6.1.

499

Propiedades b
asicas de H

Podemos obtener otras propiedades de H haciendo la derivada con respecto al tiempo de (18.50), teniendo
en cuenta que hay que considerar a como funciones de , , ,i y x , con lo cual se obtiene
d
dH
d
L d
L d
L d,i L
=
+

dt
dt
dt
dt
dt
,i dt
t
el segundo y cuarto termino a la derecha se cancelan entre s en virtud de la definici
on (18.49) quedando
L
L d,i L
dH

=

dt

,i dt
t

(18.58)

por otra parte cuando consideramos H en terminos de sus momentos can


onicos, en cuyo caso los argumentos
de H son , , ,i y x la derivada temporal total adquiere la forma
dH
H H
H d,i H
=
+
+
+

dt

,i dt
t

(18.59)

comparando (18.58) con (18.59), se ve que los primeros terminos a la derecha de estas, son iguales en virtud del
primer conjunto de ecuaciones de Hamilton Ecs. (18.51), los segundos terminos a la derecha tambien coinciden
debido a (18.52), finalmente los terceros terminos coinciden en virtud de (18.54). Por lo tanto, los u
ltimos
terminos deben coincidir
L
H
=
(18.60)
t
t
que es el equivalente de (6.11) cuando el medio es discreto, y nos dice que cuando L no contenga explcitamente
al tiempo tampoco lo contendr
a H y viceversa.
Por otro lado, la an
aloga de la ecuaci
on (6.38) no se cumple, es decir, las derivadas temporales parcial y
total de la densidad Hamiltoniana no coinciden. Para calcular la relaci
on que hay entre ellas partimos de la
Ec. (18.59) y usamos las Ecuaciones de movimiento de Hamilton (18.51, 18.55)








d
dH
H d
H
H
H
H H
H d
=
+

+
+
dt
dxi ,i


,i dxi dt
t



dH
H d
H
H d H
=
+
+

i
dt
dx ,i
,i dxi
t
hemos intercambiado las derivadas sobre el campo en xi y el tiempo dado que las derivadas totales del campo
con respecto a los par
ametros coinciden con las derivadas parciales. Usando de nuevo (18.51) resulta



dH
d
H
H d H
=
+
+
i
dt
dx ,i
,i dxi
t


dH
d
H
H
=

+
(18.61)
dt
dxi
,i
t
de modo que las derivadas temporales total y parcial de H no coinciden como se predijo10 . Recordando que el
elemento T0 0 del tensor de esfuerzo energa se interpretaba como densidad de la funci
on energa (y por tanto
con la densidad Hamiltoniana) podemos identificar a H con T0 0 . Por otro lado, usando la Ec. (18.54) se deduce
que
H
L

=
= T0 i
,i
,i
10

Es importante notar que las derivadas parciales y totales con respecto a x solo coinciden para funciones que solo dependan de
x como ocurre con los campos y sus derivadas. En contraste, cantidades tales como las densidades Lagrangiana y Hamiltoniana
dependen no solo de x sino tambien de campos y derivadas de los campos, de modo que sus derivadas totales y parciales con
respecto a x no coinciden en general.

LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C


500CAPITULO 18. FORMULACION
Si asumimos que H no depende explcitamente del tiempo, la Ec. (18.61) se reduce a

dT0 0 dT0 i
+
=0
dt
dt
que es la ecuaci
on asociada a la conservaci
on de la corriente T0 . Ya vimos que la existencia de una corriente
conservada implica la conservaci
on de una cantidad integral que es la integral de volumen de la componente
cero de la 4-corriente (que corresponde a una densidad). En este caso
Z
P0 H = H dV

observese que a
un en el caso en el cual H no depende explcitamente del tiempo, la cantidad que se conserva
es H y no H. N
otese que al contrario del caso Lagragiano, aqu primero definimos las densidades y luego las
cantidades totales. Debe tenerse presente que el volumen de integraci
on debe contener a todos los campos.
Finalmente, notemos que en el caso en el cual el Hamiltoniano no sea la energa del sistema, lo que se conserva
es el Hamiltoniano y no la energa, pues T0 0 realmente corresponde a la densidad de la funci
on energa que
numericamente es el Hamiltoniano.

18.6.2.

Densidades generalizadas y corchetes de Poisson

El Hamiltoniano total H es solo un caso particular de funciones que se obtienen integrando densidades
en el volumen. Veamos entonces el formalismo general para estas cantidades integrales. Consideremos cierta
densidad U que sea funci
on de las coordenadas (, ) del espacio de fase as como de sus gradientes espaciales
y posiblemente x
U = U ( , ,i , , ,i , x )
la cantidad integral correspondiente la denotamos por U
Z
U (t) = U dV

(18.62)

donde la integral se realiza sobre un volumen fuera del cual y se deben anular (tambien deben ser nulas
estas cantidades en el contorno que define al volumen). Derivando U respecto al tiempo resulta


Z
U
U
U
U
dU
U
= dV
+
,i +
+
,i +
(18.63)
dt

,i

,i
t
consideremos un termino tal como

integrando por partes

dV

U
,i =
,i

dxi

U d
,i dxi

U
d
; dv = dxi i
,i
dx



Z
Z

d
U
U
i U d
i

dx
=
dx
,i dxi
,i S
dxi ,i
u=

y recordando que y las derivadas se anulan en la superfice del contorno, tenemos




Z
Z
U
d
U
dV
,i = dV
,i
dxi ,i

y para el termino con ,i se hace una reducci


on an
aloga. Con lo cual la Ec. (18.63) queda en la forma






Z
dU
U
d
U
U
U
U
d
=
dV

+

+
dt

dxi ,i

dxi ,i
t







Z
dU
U
d
U
U
d
U
U

=
dV

+
(18.64)
dt
dxi ,i
dxi ,i
t

HAMILTONIANA PARA MEDIOS CONTINUOS


18.6. FORMULACION

501

ahora introduciendo la notaci


on de derivada funcional descrita por (18.56), la Ec. (18.64) se reduce a


Z
dU
U U
U
= dV
+ +
(18.65)
dt

t
por u
ltimo introducimos las ecuaciones de Hamilton en notaci
on de derivadas funcionales Ecs. (18.57), con lo
cual la Ec. (18.65) queda
 Z

Z
H U
U
dU
U H
= dV

+ dV
(18.66)

dt


t
La primera integral tiene la forma de un corchete de Poisson aunque reemplazando al operador derivada
ordinaria por la derivada funcional. Si U y W son dos funciones densidad cualquiera, lo anterior nos sugiere
definir como los corchetes de Poisson a las siguientes cantidades integrales


Z
W U
U W

(18.67)
[U, W ] dV


definimos el significado de la derivada parcial en el tiempo de U en la forma evidente
Z
U
U
= dV
t
t
con lo cual la Ec. (18.66) se puede escribir en la forma
dU
U
= [U, H] +
dt
t

(18.68)

que es el an
alogo a la Ec. (8.25) para sistemas discretos, aunque debe tenerse en cuenta que los corchetes de
Poisson han sido redefinidos en forma integral y con la derivada funcional. Haciendo U = H en (18.68) y teniendo en cuenta que por definici
on el corchete de Poisson de H consigo mismo es nulo, se obtiene inmediatamente
que
dH
H
=
(18.69)
dt
t
que es la forma integral de (18.61)11 y la versi
on en teora de campos de (6.38). N
otese que aunque las derivadas
total y parcial no coinciden para la densidad Hamiltoniana, s coinciden para el Hamiltoniano total.
Se ve entonces que el formalismo de los corchetes de Poisson aparece como consecuencia de la formulaci
on
de Hamilton. Sin embargo, no se puede desarrollar una teora de campos en terminos de corchetes de Poisson
de tal manera que guarde una analoga pasa a paso con la de los sistemas discretos. Por ejemplo, aqu definimos
los corchetes de Poisson solo en funci
on de un par de densidades. Por tanto no se puede con facilidad plantear
corchetes de Poisson fundamentales como lo hacamos en sistemas discretos. Esto se debe a que aunque es
una densidad, no lo es. Adem
as si xi desempe
na el papel de ndices contnuos de las variables mec
anicas,
los corchetes de Poisson fundamentales contendran funciones para diferentes valores de xi , lo cual no se
introduce f
acilmente en la presente formulaci
on. Por esta raz
on las transformaciones can
onicas no son muy
usadas en teoras de campos cl
asicos a pesar de ser tan fructferas en sistemas discretos. Tambien es difcil
en este formalismo seguir los pasos de la cuantizaci
on, que requieren cambiar los corchetes de Poisson por
conmutadores cuanticos.

18.6.3.

Formulaci
on por corchetes de Poisson utilizando descomposici
on de Fourier

Hay una forma alternativa que nos va a permitir trabajar casi todo el formalismo de Hamilton y de corchetes
de Poisson para campos cl
asicos, que ya conocemos para el caso discreto. La idea de este tratamiento consiste
en sustituir la variable espacial contnua o el ndice contnuo, por un ndice discreto numerable. Retomemos
11

La integraci
on del primer termino a la derecha de la Ec. (18.61) se anula al tomar un volumen que contenga todos los campos
y derivadas, como se puede ver aplicando el teorema de la divergencia.

LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C


502CAPITULO 18. FORMULACION
una vez m
as el ejemplo de la varilla el
astica. Supongamos que dicha varilla posee una longitud L = x2 x1 .
Pondremos como condici
on de contorno que se anule en los extremos, lo cual se logra colocando a la varilla
con sus extremos en contacto con dos paredes rgidas. La amplitud de la oscilaci
on se podr
a escribir en una
descomposici
on de Fourier discreta

X
2n (x x1 )
(18.70)
(x) =
qn sin
2L
n=0

en lugar del ndice contnuo x aqu tenemos el ndice discreto n. Esta representaci
on solo es v
alida si (x) es
una funci
on regular, lo cual usualmente se cumple.
Para el caso general, supondremos por simplicidad, que hay solo una cantidad de campo real que se puede
desarrollar en serie de Fourier tridimensional
1 X
(r, t) =
qk (t) eikr
(18.71)
V k

donde k es un vector de onda que solo puede tomar m


odulos y direcciones discretos de modo que en una
dimensi
on lineal dada solo encaje un n
umero entero (o tal vez semientero) de longitudes de onda. Decimos
que k tiene un espectro discreto. El ndice escalar k representa entonces una ordenaci
on del sistema de ndices
enteros que se utiliza para enumerar los valores discretos de k, y V es el volumen del sistema que act
ua como

un factor de normalizaci
on. Como este factor es real se tiene que qk = qk .
La ortogonalidad de las exponenciales en el volumen se manifiesta como
Z
1
0
(18.72)
ei(kk )r dV = k,k0
V
en realidad los valores permitidos de k son aquellos para los que se cumple la condici
on de ortogonalidad. Los
coeficientes de la expansi
on se pueden calcular con base en la ortonormalidad de la siguiente forma
Z
Z
1
1
ikr
qk (t) =
e
(r, t) dV e (k, r, t) dV ; e (k, r, t) eikr (r, t)
V
V

donde e (k, r, t) es la funci


on densidad correspondiente a la variable global qk , como se puede ver por comparaci
on con la Ec. (18.62). De manera an
aloga, la densidad de cantidad de movimiento se puede escribir
como
1 X
(r, t) =
pk (t) eikr
(18.73)
V k
donde tambien se cumple que pk = pk . Los coeficientes pk (t) tambien se obtienen por ortonormalidad
Z
Z
1
1
ikr
pk (t) =
e (r, t) dV
e (k, r, t) dV ;
e (k, r, t) eikr (r, t)
V
V

siendo
e (k, r, t) la funci
on densidad asociada a pk (t). Tanto qk como pk son cantidades integrales de la
forma descrita por (18.62). Podemos entonces calcular los corchetes de Poisson de dichas cantidades. Como
las exponenciales no contienen variables de campo, tenemos en virtud de la definici
on (18.67)


Z
e
(k, r, t) e
(k0 , r, t) e
(k0 , r, t) e
(k, r, t)
[qk , pk0 ] =
dV



Z

1
0
[qk , pk0 ] =
dV ei(k k)r

V


Z
1
0
[qk , pk0 ] =
dV ei(k k)r
V

y usando la ortonormalidad (18.72)


[qk , pk0 ] = kk0

(18.74)

HAMILTONIANA PARA MEDIOS CONTINUOS


18.6. FORMULACION

503

usando la definici
on de corchetes de Poisson, se puede verificar que
[qk , qk0 ] = [pk , pk0 ] = 0

(18.75)

por tanto, los corchetes de Poisson de qk , pk forman un conjunto de corchetes fundamentales con las mismas
propiedades que aparecen en el discreto Ecs. (8.3). Esto nos sugiere considerar a estas cantidades como coordenadas can
onicamente conjugadas. Vale la pena entonces estudiar las ecuaciones de movimiento que surgen
para estas coordenadas. Empleando la Ec. (18.68), la evoluci
on temporal de qk (t) se escribe como




Z
Z
e
(k, r, t) H H e
(k, r, t)
1
H H
dV eikr
qk (t) = [qk , H] = dV



V
Z
1
H
dV eikr
qk (t) =
(18.76)

V
por otra parte, tenemos

Z
Z
H
H
H
= dV
= dV
(18.77)
pk
pk
pk
donde hemos tenido en cuenta que H no es funci
on del gradiente de y por tanto su derivada parcial con
respecto a coincide con su derivada funcional. Teniendo en cuenta (18.73) resulta

1
= eikr
pk
V
con lo cual (18.77) coincide con (18.76) resultando
qk =

H
pk

(18.78)

veamos ahora como se obtiene la ecuaci


on de movimiento para pk . Los pasos son similares


Z
1
H H
p k (t) = [pk , H] =
dV eikr



V
Z
1
H
p k (t) =
dV eikr

V
y calculamos
H
=
qk

dV

H
H ,j
+
qk ,j qk

(18.79)

(18.80)

la diferencia fundamental con el c


alculo anterior es que H no depende del gradiente de pero s depende del
gradiente de . El termino que contiene las componentes del gradiente de se integra por partes,





Z
Z
H ,j
H d

j
dV
=
dx
,j qk
,j dxj qk


H
d

u =
; dv = dxj j
,j
dx
qk





Z
Z
H ,j
H
H
j d
dV
=
dx
,j qk
,j qk S
qk dxj ,j
la integral de superficie se anula de modo que la integral (18.80) queda


 Z



Z
H
H
d
H
H
H

d
= dV

=
dV

qk
qk qk dxj ,j

dxj ,j
qk
la cual se puede reducir a otra que contenga la derivada funcional
Z
H
H
= dV
qk
qk

LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C


504CAPITULO 18. FORMULACION
y teniendo en cuenta (18.71)

1
= eikr
qk
V
quedando finalmente
H
1
=
qk
V

dV

H ikr
e

(18.81)

igualando (18.79) con (18.81) se encuentra que


p k (t) =

H
qk

(18.82)

las cantidades qk y pk obedecen entonces las ecuaciones de movimiento de Hamilton. En general k denota un
conjunto de ndices enteros.
N
otese que en el captulo se comenz
o con un sistema discreto (coordenadas generalizadas numerables)
para el cual se estudi
o el paso al contnuo (coordenadas generalizadas no numerables). Posteriormente, hemos
descrito al sistema contnuo mediante un sistema de coordenadas discreto y numerable que posee una estrucutra
matem
atica similar a la del sistema discreto del cual se parti
o. Debido a esta correspondencia entre qk , pk
con las variables can
onicamente conjugadas en el discreto, estas cantidades son buenos candidatos para la
cuantizaci
on cuando pasemos a una teora cu
antica de campos. Las qk corresponden a lo que se denomina
n
umero de ocupaci
on para el campo.
La raz
on por la cual se pudo describir el sistema contnuo por medio de coordenadas discretas, es que
el tama
no finito del sistema y las condiciones de contorno permiten un desarrollo de Fourier discreto12 . El
desarrollo presente se efectu
o sobre un espectro discreto de ondas planas. Dado que el vector de onda k es
en mecanica cu
antica directamente proporcional a la cantidad de movimientode la partcula asociada a la
onda plana, los desarrollos que hemos utilizado reciben a veces el nombre de representaci
on por cantidad de
movimiento. Sin embargo, este desarrollo se puede realizar en cualquier conjunto ortonormalizable y numerable
de funciones que cumplan la propiedad de completez en el volumen en cuesti
on. Las ondas planas son solo un
caso particular de estas funciones. El empleo de otras bases para estas expansiones puede ser mas conveniente,
dependiendo del problema a estudiar, pero el procedimiento es an
alogo al aqu expuesto.

18.7.

Ejemplos de teoras de campos

18.7.1.

Un modelo juguete

Consideremos un campo de dos componentes 1 y 2 cuyas ecuaciones de movimiento fuesen


d1
d2 1
c 2
dt
dt
d2
d2 2
a2 2 b
c 2
dt
dt

a2 1 + b

= f 2
= g1

(18.83)

el siguiente paso natural es encontrar una densidad Lagrangiana que a traves de las ecuaciones de EulerLagrange Ecs. (18.27) me genere las ecuaciones de campo (18.83), recordemos que esta densidad Lagrangiana
no es u
nica, una de ellas es
L = c 1 2 +


b
1
( 1 2 1 2 ) a1 2
f 22 + g12
2
2

12
Por ejemplo, si el sistema no es acotado la descomposici
on de Fourier se vuelve en general contnua. Por otro lado, la anulaci
on
del campo en los extremos permiti
o que las sumatorias fueran desde n = 0 hasta . En general estas sumatorias ir
an desde
hasta .

18.7. EJEMPLOS DE TEORIAS DE CAMPOS

505

para esta densidad Lagrangiana, las componentes del tensor esfuerzo energa son

1
T00 = c 1 2 + a1 2 +
f 22 + g12

2
d2
d1
T0i = a 1
+ 2
dxi
dxi




d2
d1
b
d1
d2
Ti0 = c 1
+ 2
2
1
+
dxi
dxi
2
dxi
dxi


d1 d2
d1 d2
Lij
Tij = a
+
dxi dxj
dxj dxi
observese que en este ejemplo, el tensor tridimensional Tij es simetrico.

Hagamos los c
alculos explcitos. Podemos escribir la densidad lagrangiana en una notaci
on m
as conveniente

b
1
( 1 2 1 2 ) a (i 1 ) (i 2 )
f 22 + g12
2
2

b
1
L = c 1 2 + ( 1 2 1 2 ) a1,i 2,i
f 22 + g12
2
2
L = c 1 2 +

Usando las ecuaciones de Lagrange para el contnuo




d
L
L

=0

dx
,

tenemos que para el campo 1

L
1
L
1,k
L

d
dt

L
1

d
+ k
dx

L
1,k

L
=0
1






b
b
d L
b
c 1 2 + 1 2 = c 2 + 2
= c
2 + 2
1
2
2
dt 1
2


L

d
= a2,kk
=
[a1,i 2,i ] = aik 2,i = a2,k k
1,k
dx
1,k



b
1 2
b
=
(1 2 ) g1 = 2 + g1
1
2
2
2
=

la ecuaci
on de Lagrange es
b
b
c
2 + 2 a2,kk + 2 + g1 = 0
2
2
d2 2
d2
a2 2 + c 2 + b
+ g1 = 0
dt
dt
similarmente se obtiene la ecuaci
on de Lagrange para 2




d L
d
L
L
+ k

=0
dt 2
dx
2,k
2
L
2
L
2,k
L






b
b
d L
b
=
c 1 2 (1 2 ) = c 1 1
= c
1 1
2
2
2
dt 2
2



d
L
=
[a1,i 2,i ] = aik 1,i = a1,k k
= a1,kk
2,k
dx
2,k


b
1 2
b
=
1 2 f 2 = 1 + f 2
2 2
2
2

LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C


506CAPITULO 18. FORMULACION
la ecuaci
on de Lagrange es
b
b
c
1 1 a1,kk 1 + f 2 = 0
2
2
2
d
d
1
1
+ f 2 = 0
a2 1 + c 2 b
dt
dt
finalmente la densidad de energa se obtiene recordando la definici
on del tensor esfuerzo energa
T
T0 0
T0 0

L
L
L
, L T0 0
,0 L00 =
L
,
,0

L
L
=
1 +
2 L

2
 1






b
b
b
1
2
2
=
c 2 + 2 1 + c 1 1 2 c 1 2 + ( 1 2 1 2 ) a1,i 2,i
f 2 + g1
2
2
2
2

b
b
T0 0 = c 2 1 + 2 1 + c 1 2 1 2 c 1 2
2
2
b
b
T0 0 = c 2 1 c 1 2 + c 1 2 + 2 1 1 2
2
2


b
1
( 1 2 1 2 ) + a1,i 2,i +
f 22 + g12
2
2

b
1
( 1 2 1 2 ) + a1 2 +
f 22 + g12
2
2


1
f 22 + g12
2
De la misma forma se pueden calcular los otros elementos del tensor esfuerzo energa. N
otese que si podemos
encerrar todos los campos y sus derivadas en un volumen, podemos garantizar que
Z
R0 = T0 0 dV = cte
T0 0 = c 2 1 + a1 2 +

para saber que volumen es adecuado para incluir la carga conservada generalizada (hay cuatro estrictamente),
ser
a necesario conocer el comportamiento del campo y sus condiciones de frontera. Por otro lado, para esta
teora de campo es posible que T0 0 no este asociado a una densidad de energa, ni que las otras cargas
conservadas esten asociadas a momentos. Todo lo que podemos afirmar es que hay cuatro cargas generalizadas
conservadas que incluso pueden ser totalmente independientes unas de otras. Cualquier interpretaci
on adicional
depende del modelo de campo especfico.

18.8.

Teora de campos relativista

Hemos visto en la secci


on 16.10 que una formulaci
on Lagrangiana o Hamiltoniana manifiestamente covariante de Lorentz resulta particularmente difcil de implementar en la mec
anica de partculas puntuales. Esta
dificultad est
a principalmente relacionada con el hecho de que la formulaci
on no relativista de la mec
anica
del punto es muy asimetrica en su tratamiento de la variable espacial y la temporal. Las variables espaciales
son cantidades mec
anicas en tanto que el tiempo es un par
ametro que se recorre en forma mon
otona. En
contraste, la mecanica no relativista de medios contnuos presenta las coordenadas de espacio tiempo de una
forma mucho m
as simetrica, al menos en la formulaci
on Lagrangiana. Ello permitir
a realizar una formulaci
on
que sea manifiestamente covariante de Lorentz con algunos peque
nos cambios de la versi
on no relativista.
Hay tres aspectos que deben trabajarse para llegar a esta formulaci
on manifiestamente covariante de Lorentz
(1) la estructura y metrica del espacio tiempo, (2) las propiedades de transformaci
on de los campos, densidades
lagragianas etc. cuando se realiza una transformaci
on de Lorentz, (3) la descripci
on covariante de los lmites
de integraci
on.
En lo que respecta al primer punto, es posible trabajar en el espacio tiempo usando la metrica usual pero
con coordenada temporal imaginaria (espacio de Minkowski) o por otro lado, trabajar con el espacio tiempo

18.8. TEORIA DE CAMPOS RELATIVISTA

507

usual pero con metrica no trivial (metrica de Minkowski, ver cap. 16). Al igual que en el cap. 16 trabajaremos
en el espacio de Minkowski con la metrica usual. Como hasta ahora, los ndices latinos indican coordenadas
espaciales y los ndices griegos nos denotan las coordenadas espacio temporales, pero en este caso la coordenada
temporal se escribir
a como x4 = ict. En primer lugar vemos que las Ecuaciones 18.27 de Lagrange en el contnuo
no se afectan por este cambio, ya que el termino


d
L
dx ,
queda invariante ante un cambio de escala de cualquiera de los par
ametros x , poe ejemplo para x4 tenemos
que





d
L
d L
d
L


=
= 0
dx4 ,4
idx0 d
dx
,0
idx0

y por otro lado el otro termino en las ecuaciones de Lagrange no contiene coordenadas. En lo que respecta
al principio de Hamilton, el cambio de espacio no lo afecta dado que simplemente se introduce una constante
multiplicativa.
Z
I = L ( , , , x ) dx = 0 ; dx dx0 dx1 dx2 dx3 = idx4 dx1 dx2 dx3
Z ix4,2 Z
I = i
L ( , , , x ) dx0 = 0 ; dx0 dx4 dx1 dx2 dx3
ix4,1

el cambio de variable x04 = ix4 saca otra constante multiplicativa de modo que el principio variacional
permanece inmodificado.
Los campos y las cantidades relacionadas con estos deben formar tensores de Lorentz de determinado rango
para que se puedan escribir ecuaciones de campo manifiestamente covariantes. Si tenemos varios campos cada
uno de ellos puede ser un tensor de rango diferente, lo imporante es que las ecuaciones de movimiento sean
manifiestamente covariantes. Las densidades lagrangiana y Hamiltoniana tambien deben ser covariantes. En
el principio de Hamilton el elemento de cuadrivolumen es invariante de Lorentz. Si hemos de asumir que la
acci
on es escalar de Lorentz (ya que es un escalar euclidiano en el regimen no relativista) esto implica que las
densidades Lagrangiana y Hamiltoniana sean escalares de Lorentz. De lo anterior se desprende que el tensor
de esfuerzo energa en la Ec. (18.31) debe ser un tensor de Lorentz de segundo rango. No obstante, el cambio
de espacio implica que las componentes de tal tensor pueden cambiar su valor. Es claro que para la misma
densidad Lagrangiana, el cambio de (t, x1 , x2 , x3 ) a (x1 , x2 , x3 , ict) no altera a las componentes Ti j . Para las
otras componentes el cambio en su valor se puede obtener de las Ecs. (18.31, 18.33)
T

T0

Tj 0

L
, L
,





d
d
L
L
L

L =  
L= 
L
d
d

dt
d (ict)
dt
d(ict)


L
d
 
L T4 4
4
d
dx
dx4

L
L d
L
d
L
d
T 4

 j =
  j = j
,j =   j =
d
d
d

dx
ic
dt dx
ic d(ict)
ic dx4 dx

icTj 0 = Tj 4

LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C


508CAPITULO 18. FORMULACION
T0 j =

d
L d
L
  = ic  
= icT4 j
d
d

dt
d
(ict)

dxj

dxj

en resumen las equivalencias quedan en la forma13

i
T4 j T0 j
(18.84)
c
la densidad lagrangiana est
a definida excepto por una constante multiplicativa. Este factor multiplicativo suele
tomarse de tal manera que T44 o su forma simetrizada coincidan con la densidad de energa del campo. En el
cuadriespacio de Minkowski las cantidades conservadas de la Ec. (18.8) que aqu denotamos como R , quedan
en la forma
Z
R = T 4 dV
(18.85)
Ti j Ti j ; T4 4 T0 0 ; Tj 4 icTj 0

definamos ahora los factores P asociados a estas cantidades como


Z
i
i
P R =
T 4 dV
c
c

(18.86)

de (18.84) y de la interpretaci
on de Ti 0 como la componente iesima de la densidad de momento del campo,
se concluye que Pi son las componentes del momento total del campo y P4 es iE/c, siendo E la energa
total del campo. Esto sugiere que el arreglo P puede representar al cuadrivector energa momento definido
en la secci
on 16.7. Para esto es necesario demostrar que R y por tanto P se transforman como vectores
de universo (cuadrivectores) bajo una transformaci
on de Lorentz. Como estas expresiones son integrales en
tres dimensiones, requeriremos examinar el significado de la integraci
on tridimensional en una formulaci
on
covariante y estudiar la forma en que se deben tratar los lmites de integraci
on.
La covarianza en los lmites de integraci
on ser
a de particular importancia en el principio de Hamilton
Z
I = L ( , , , x ) dx = 0 ; dx dx0 dx1 dx2 dx3
(18.87)
si la densidad Lagrangiana es un escalar de universo, la integral (18.87) ser
a claramente covariante de Lorentz
pero no as los lmites de integraci
on. La integraci
on espacial se realiza sobre un volumen fijo del espacio
tridimensional seguido de una integraci
on en el tiempo entre los lmites t1 y t2 . Pero la integraci
on sobre
un volumen extendido para tiempo fijo no es un concepto covariante puesto que la simultaneidad no es un
concepto invariante de Lorentz. Por otro lado, si tenemos en cuenta que la conexi
on causal s es un invariante de
Lorentz (eventos del genero espacial del genero temporal y como de luz), una descripci
on covariante adecuada
sera decir que la integraci
on se hace sobre una hipersuperficie de tres dimensiones del g
enero espacial, es
decir una superficie en la cual todos los vectores de universo contenidos en ella sean del genero espacial. Los
vectores normales a dicha superficie son del genero temporal. En particular, los vectores que unan dos puntos
de universo en una superficie de tiempo constante ser
an del genero espacial ya que se anula su componente
x4 . Aunque la anulaci
on de x4 no permanece cuando se hace una transformaci
on de Lorentz (no se conserva la
simultaneidad) el vector continuar
a siendo del genero espacial. Por tanto, una superficie de tres dimensiones a
tiempo constante es un tipo particular de superficie del genero espacial. An
alogamente, lo que en un sistema
especfico es una integraci
on en el tiempo para un punto espacial fijo, se puede describir covariantemente por
una integraci
on extendida a una superficie del genero temporal.
En un sistema unidimensional en el espacio fsico, la integraci
on en el principio de Hamilton descrita en
(18.19) se extiende al rect
angulo que se ilustra en la Fig. 18.4a. Una transformaci
on de Lorentz es una rotaci
on
en el espacio de Minkowski y los lados paralelos a los ejes originales ya no lo ser
an en los ejes del sistema
transformado, pero los lados horizontales seguir
an siendo del genero espacial y los lados verticales seguir
an
siendo del genero temporal. Por tanto, en todos los sistemas de Lorentz podremos describir la integraci
on como
extendida a una regi
on del cuadriespacio contenida entre dos hipersuperficies del genero espacial limitadas por
superficies del genero temporal que cortan a las anteriores.
13

En algunas ocasiones se usa en el regimen no relativista la coordenada x0 ct. En tal caso las equivalencias son las indicadas
en (18.84) pero omitiendo el factor c.

18.8. TEORIA DE CAMPOS RELATIVISTA

509

Figura 18.4: (a) Regi


on de integraci
on para el principio de Hamilton en un sistema unidimensional relativista.
(b) Volumen de integraci
on esquem
atico en el espacio tiempo de Minkowski.
Veamos ahora la descripci
on covariante de cantidades del tipo P descritas por las Ecs. (18.85, 18.86). Una
forma apropiada para esta descripci
on covariante es de la forma
Z
i
P =
T dS
(18.88)
c S
en donde la integraci
on se realiza sobre una hipersuperficie del genero espacial para la cual los vectores que
describen los elementos de superficie y que son normales a esta son los dS . T debe ser un tensor de universo de
segundo orden para garantizar la covarianza de P es decir que P defina un vector de universo o cuadrivector.
Veremos a continuaci
on que las componentes de P en (18.88) se reducen a integrales de volumen en el espacio
ordinario tridimensional del tipo descrito en (18.86) siempre que la divergencia del tensor T sea nula
T = 0
para ilustrarlo tomemos una regi
on volumetrica V4 del cuadriespacio definida por tres superficies (ver Fig.
18.4b); S1 y S2 son del genero espacial y S3 es del genero temporal. Usando el teorema de la divergencia en
cautro dimensiones, podemos escribir

Z 
Z
dT

dx =
T dS
(18.89)

dx
V4
S1 +S2 +S3
la integral sobre S3 es con respecto al tiempo a r constante. Tomando el volumen suficientemente grande, la
integral extendida a esta superficie mantendr
a a r fuera del sistema, en donde se anulan todas las cantidades
de campo. Por tanto

Z 
Z
dT

T dS
(18.90)
dx =

dx
V4
S1 +S2

Nuestra hip
otesis de nulidad de la divergencia de T hace que tambien se anule el miembro izquierdo de
(18.90). Por tanto, si tomamos en el mismo sentido las normales a la superficie del genero espacial resulta
Z
Z
T dS =
T dS
(18.91)
S1

S2

en la Fig. 18.4b, hemos tomado a S1 como una superficie del genero espacial arbitraria en tanto que S2 es una
superficie con tiempo constante es decir con x4 constante. En consecuencia, el vector normal a un elemento
de superficie de S2 es un vector del genero temporal que solo tiene componente en x4 i.e. dS = 4 dS2 y
recordando que S2 es una hipersuperficie tridimensional, la integraci
on sobre esta superficie es una integral de
volumen a tiempo constante. De lo anterior, se ve que la Ec. (18.91) queda
Z
Z

T dS = T 4 dV
S1

LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C


510CAPITULO 18. FORMULACION
es claro que el miembro izquierdo se transforma como cuadrivector si T es un tensor de segundo rango, por
tanto el segundo miembro tambien transforma como vector de universo. Teniendo en cuenta (18.85) vemos por
tanto que R transforma como cuadrivector bajo la condici
on de que el tensor T tenga divergencia nula. Si
adicionalmente las dos superficies S1 y S2 son superficies a tiempos constantes t1 y t2 respectivamente la Ec.
(18.91) conduce a
R (t1 ) = R (t2 )
que corresponde a la forma covariante de demostrar que R se conserva en el tiempo.
En consecuencia, ser
a posible con un poco de cuidado utilizar las cantidades conservadas ya obtenidas en
el regimen no relativista. Sin embargo, la correspondencia detallada no siempre es posible, pero en la mayora
de los casos es suficiente que la integraci
on de volumen se refiera a un sistema de Lorentz especfico en el cual
la hipersuperficie del genero espacial sea una regi
on en el espacio de tres dimensiones a tiempo constante, ya
que siempre que tenemos eventos del genero espacial es posible encontrar un sistema de referencia en donde
los eventos son simult
aneos.
Para la densidad de momento angular, notemos que el an
alogo covariante de Mi j Ec. (18.43) es un cuadritensor de tercer rango

i
x T x T
M =
(18.92)
c
el cual es antisimetrico en , . La integral conservada es
Z
(18.93)
M = M dS
y la integraci
on se extiende a lo largo de una hipersuperficie del genero espacial. Si en particular se toma un
sistema de Lorentz en el cual la hipersuperficie sea a t constante se obtiene
Z
M M 4 dV
que corresponde a la definici
on en el regimen no relativista. Por tanto, el razonamiento hecho en la secci
on 18.5.4
j
sobre la conservaci
on de Mi para tensores esfuerzo-energa simetricos (o simetrizados) puede extrapolarse
considerando el sistema de Lorentz particular con hipersuperficie a tiempo constante.
Ya mencionamos en la secci
on 18.6 que la formulaci
on Hamiltoniana distingue las coordenadas espaciales
y temporales de forma explcita. Esto no significa que no se pueda construr una teora covariante de Lorentz,
simplemente implica que la formulaci
on no ser
a manifiestamente covariante. Podemos imaginar la formulaci
on
Hamiltoniana en el tiempo como la que ve cada observador particular. Si los campos y sus derivadas transforman
adecuadamente, es posible que la formulacion sea compatible con la relatividad especial en cada sistema de
Lorentz particular.
Otro punto importante se refiere a la descripci
on de sistemas fsicos que involucran un conjunto de campos
que pueden interactuar entre s. En este caso la densidad Lagrangiana usualmente consistir
a en sumas de
densidades Lagrangianas que representan a los campos libres m
as terminos que describen la interacci
on entre
los campos. Ya habamos mencionado que parte de la dificultad para realizar una formulaci
on relativista de la
mec
anica del punto tena que ver con el hecho de que la accion a distancia no es compatible con la relatividad
especial. La ventaja de las formulaciones de campo es que las interacciones entre campos pueden ser de
naturaleza local, es decir pueden tener lugar en un punto lo cual facilita la construcci
on de una formulaci
on
covariante. M
as a
un, se puede trabajar interacciones de tipo local (en un punto del espacio tiempo) para
campos interactuando con partculas. Por tanto, tambien es factible una formulaci
on relativista de partculas
inmersas en uno o m
as campos y que interact
uan con estos. Un ejemplo notable es la interacci
on de cargas
electricas puntuales con campos electromagneticos.

18.9.

Algunas teoras de campos relativistas

Estudiaremos algunos ejemplos de teoras relativistas que forman parte de teoras reales de la naturaleza.

18.9. ALGUNAS TEORIAS DE CAMPOS RELATIVISTAS

18.9.1.

511

Campo escalar complejo

Un campo complejo est


a constitudo por dos grados de libertad independientes que se pueden tomar como
la parte real y la parte imaginaria del campo o cualquier transformaci
on de estos grados de libertad mediante
una matriz no singular, por ejemplo


 

 
 
A
1 i
Re
Re + iIm

=
=
=
B
1 i
Im
Re iIm

por tanto y se pueden tomar como variables de campo independientes. Tomando entonces a y
como las variabels independientes, la densidad Lagrangiana y todas las funciones asociadas las escribiremos en
terminos de estas dos variables de campo. Cada uno de estos campos ser
a un escalar de universo. Mas adelante
veremos que los campos complejos conducen de forma natural a una densidad asociada de carga y de corriente
y esta es la principal raz
on para considerar este tipo de campos.
Tomaremos en este caso la siguiente densidad Lagrangiana
L = c2 , , 20 c2

(18.94)

donde 0 es una constante. Observese que si los campos son escalares de universo, esta densidad Lagrangiana
tambien lo ser
a como se requiri
o en la secci
on 18.8. Expresando esta densidad Lagrangiana en terminos de
espacio y tiempo separados nos queda


2 2

2
2

=
c

c
20 c2
0
x x
x4 x4
xi xi

L = c2
c2 20 c2
(ict) (ict)

L = c2

quedando finalmente

L = c2 20 c2

encontremos la ecuaci
on de Lagrange asociada al campo


d
L
L
2
= c , ;
= c2 ,
,
dx ,

(18.95)

L
= 20 c2

, 20 = 0

(18.96)

que en notaci
on m
as explcita queda
X d2

20
dx2

=0
(ict)

(ict)

X 2
k

x2k

20 = 0

1 d2
20 = 0
(18.97)
c2 dt2
y recordando la definici
on del operador DAlembertiano Ec. (16.52) pag. 430, la ecuaci
on de campo se puede
reescribir en forma manifiestamente covariante en la forma

2 20 = 0
(18.98)
2

la ecuaci
on de Lagrange asociada al campo se puede encontrar inmediatamente en virtud de la simetra de
L con y

2 20 = 0
(18.99)

A las Ecs. (18.98, 18.99) se les conoce como ecuaciones de Klein Gordon. N
otese que estas ecuaciones se
reducen a ecuaciones de onda cuando 0 = 0. En la literatura, es usual encontrar dichas ecuaciones con un
signo positivo en el termino proporcional a 20 , esto se debe a la utilizaci
on de la metrica de Minkowski definida

LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C


512CAPITULO 18. FORMULACION
en (16.32) que produce un cambio de signo en el DAlembertiano. La ecuaci
on de Klein Gordon es en realidad
el an
alogo relativista de la ecuaci
on de Schr
odinger para una partcula cargada de espn cero y masa en reposo
0 .
Veamos la forma del tensor esfuerzo energa definido en la Ec. (18.31), explcitamente se escribe para este
caso
L
L
L
, L =
, +
L
T
,
,
, ,

= c2 , , c2 , , c2 , , 20 c2

T = c2 , , c2 , , + c2 , , + 20
(18.100)

el cual es claramente simetrico. N


otese que L no depende explcitamente de los x lo cual nos dice que esta
densidad Lagrangiana describe un campo libre sin interacci
on con el resto del universo. Adicionalmente, la no

dependencia de L con x nos dice que se cumplen los teoremas de conservaci


on expresados por la Ec. (18.30).
Formulaci
on Hamiltoniana para el campo escalar complejo
Para introducir la formulaci
on Hamiltoniana debemos distinguir entre coordenadas espaciales y temporales
en un sistema de Lorentz particular. Los momentos can
onicamente conjugados a las variables de campo est
an
dados por (18.49) que al aplicarlos a la densidad Lagrangiana 18.95 nos dan
=

L
=

L
=

(18.101)

y la densidad Hamiltoniana definida en (18.50) y que tiene la misma magnitud de T44 est
a dada por

H = + L = + c2 , , 20 c2

H = 2 + c2
+ c2 ,i ,i + 20 c2
(ict) (ict)
H = 2 + c2 + 2 c2 = 2 + c2 + 2 c2
0

H = + c +

20 c2

(18.102)

las Ecuaciones de Hamilton en el contnuo Ecs. (18.57) nos dan





d
H
H
H
H

=
=
i
H=
= ; = =
=

dx ,i





H

d
=
=
i
+ c2 ,k ,k + 20 c2

dx ,i

d
= 20 c2 + i c2 ,i = c2 ,ii 20 c2 = c2 2 20 c2
dx
H

2 2

= = c 20 c2

las ecuaciones de Hamilton nos dan entonces


=

= ; = c2 2 20 c2

= c2 2 20 c2

(18.103)

las dos primeras ecuaciones de Hamilton reproducen las Ecs. (18.101). Si derivamos las dos primeras ecuaciones
(18.103)
= ; =
y reemplazamos en las dos u
ltimas de las Ecs. (18.103)
= c2 2 20 c2 ; = c2 2 20 c2
1
1
2 + 2 20 = 0 ; 2 + 2 20 = 0
c
c

18.9. ALGUNAS TEORIAS DE CAMPOS RELATIVISTAS

513

y usando de nuevo el DAlambertiano, vemos que estas corresponden a las ecuaciones de Klein Gordon.
Veamos ahora la representaci
on de Fourier de momentos canonicos totales. Para ello se introducen las
expansiones de Fourier (18.71, 18.73)
1 X
(r, t) =
qk (t) eikr
V k

1 X
(r, t) =
pk (t) eikr
V k

en la densidad Hamiltoniana. Debe tenerse en cuenta que como el campo no es real, no se cumple la condici
on
qk = qk . En este caso qk y qk representan dos conjuntos independientes de coordenadas discretas (de la
misma forma en que y se consideran independientes). El Hamiltoniano total es la integral de volumen de
la densidad Hamiltoniana dada por (18.102)
Z

H=
+ c2 + 20 c2 dV
e introduciendo las expansiones de Fourier el Hamiltoniano queda

!
Z X
X
X
1
H =
pk (t) pj (t) eikr eijr + c2
ikqk (t) eikr
(ij) qj (t) eijr

V
k,j
k
j

X
+20 c2
qk (t) qj (t) eikr eijr dV

k,j

H =

pj (t)

pk (t)

k,j

+20 c2

1
V

qj (t)

qk (t)

k,j

i(jk)r

1
V

dV + c

k,j

i(kj)r

dV

(k

j) qk (t) qj (t)

1
V

i(kj)r

dV

y utilizando la ortonormalida de las ondas planas Ec. (18.72) se obtiene


H =

pk (t) pj (t) jk + c2

k,j

H =

pk pk

2 2

+c k

qk qk

(k j) qk (t) qj (t) jk + 20 c2

k,j
2 2
0 c qk qk

qk (t) qj (t) jk

k,j

que finalmente se puede escribir en la forma


H = pk pk + k2 qk qk

k2 c2 k2 + 20 c2

(18.104)

donde se usa suma sobre ndices repetidos. N


otese que este Hamiltoniano tiene la forma de una suma de
osciladores arm
onicos desacoplados de masa unidad y con frecuencia angular k . Esto se puede ver en forma
explcita utilizando las ecuaciones de Hamilton globales dadas por (18.78, 18.82)
qj =

H
= pj
pj

p j =

qj =

H
= j2 qj ;
qj

H
= pj
pj

p j =

H
= j2 qj
qj

derivando con respecto al tiempo las dos primeras ecuaciones resulta


qj = p j

qj = p j

(no suma)

LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C


514CAPITULO 18. FORMULACION
y reemplazando en las dos u
ltimas
qj = j2 qj ; qj = j2 qj

(no suma)

que son ecuaciones de oscilador arm


onico para cada coordenada discreta qj . Por lo tanto, en la representaci
on
por expansi
on de Fourier en ondas planas se sustituyen los campos y por sistemas discretos de osciladores
arm
onicos. Un proceso similar se realiza cuando el campo sonoro en un s
olido finito se construye como una
superposici
on discreta de fonones. El espectro discreto de vibraciones de nuestro campo cargado escalar
viene dado por la Ec. (18.104) que act
ua como una relaci
on de dispersi
on. Es muy sencillo hacer una
teora cu
antica (conocida como segunda cuantizaci
on) de estos campos cuando se trabaja con el formalismo de
expansi
on de Fourier pues en este caso cada oscilador se cuantiza como se cuantizan los osciladores arm
onicos
en la mec
anica cu
antica del discreto.

18.9.2.

Ecuaci
on de seno Gordon

Tomemos el campo anterior como real de modo que = y limitemonos al caso unidimensional. La
densidad Lagrangiana (18.95) se reduce a
"
#
 2

c2 2
2 2

0
L=
(18.105)
2 c2
x
donde se ha introducido un factor 1/2 por conveniencia, pues claramente este factor no altera las ecuaciones de
movimiento. La ecuaci
on de campo asociada (ecuaci
on de Klein Gordon unidimensional para partcula neutra)
es
1 2
2

= 20
(18.106)
x2
c2 t2
esta es una ecuaci
on lineal en el campo (x, t). Podemos considerar la densidad Lagrangiana en (18.105) como
una aproximaci
on de campo debil de la densidad Lagrangiana dada por
"
 2 #
c2 2

L=

20 2 (1 cos )
2
2 c
x
cuya ecuaci
on de campo es

1 2
2

= 20 sin
(18.107)
x2
c2 t2
a la expresi
on (18.107) se le conoce como ecuaci
on de seno Gordon. Vale resaltar que la ecuaci
on de seno
Gordon (18.107) tiene similitud al pedulo de amplias oscilaciones (por esta raz
on se le denomina tambien
ecuaci
on del pendulo) en tanto que la Ec. (18.106) se asemeja al oscilador arm
onico y por tanto, al pendulo
de peque
nas oscilaciones.
Para este escenario unidimensional el tensor esfuerzo-energa solo posee cuatro componentes. Como la
densidad Lagrangiana no depende explcitamente de los par
ametros x, t los elementos del tensor satisfacen dos
4
ecuaciones de continuidad. La densidad de energa T4 es de especial interes
( "
)
 2 #
2 2
L
c

T4 4 =
L =

20 2 (1 cos )
2 c2
x

( "
)
 2 #
1

T4 4 =
2 + c2
+ 20 2 (1 cos )
2
x

que naturalmente coincide con la magnitud de la densidad Hamiltoniana


"
 2 #
1 2

H=
+ c2
+ 20 c2 (1 cos )
; (x, t) =
2
x

18.9. ALGUNAS TEORIAS DE CAMPOS RELATIVISTAS

515

por otro lado, la representaci


on por expansi
on de Fourier en ondas planas del campo de Klein Gordon real
unidimensional conduce a la relaci
on
qk (t) = A0 (k) ei(krk t)
donde k y k estan enlazadas por la relaci
on de dispersi
on dada por la segunda de las Ecs. (18.104). Para un
campo que sea soluci
on de la ecuaci
on de seno Gordon es mucho m
as difcil construr una representaci
on por
expansi
on de Fourier debido al termino cos en la densidad Hamiltoniana. Sin emabrgo, la relaci
on de seno
Gordon se puede resolver con una estrucutra similar a una onda progresiva. Una soluci
on de la Ec. (18.107)
que tenga la forma de una perturbaci
on que se propaga con velocidad v, pero que por lo dem
as conserva su
forma, debe ser funci
on exclusiva de = t x/v (n
otese la similitud con las soluciones generales de la ecuaci
on
de onda). Con base en lo anterior la Ec. (18.107) queda en la forma
d2
A sin = 0 ;
d 2

20 c2 v 2
c2 v 2

y en funci
on de lo que resulta es la ecuaci
on de un pendulo simple con amplitud finita. Si la amplitud
es peque
na sabemos que describe un movimiento arm
onico simple en con dado por la segunda de las
Ecs. (18.104) para un n
umero separado de onda k = /v independiente de la amplitud. Si la amplitud es
finita sabemos que el pendulo deja de ser is
ocrono, es decir la frecuencia comienza a depender de la amplitud,
a
un cuando nuestra contin
ue siendo periodica. La relaci
on de dispersi
on tambien depender
a entonces de la
amplitud. Esto es caracterstico de la ecuaciones alineales, ya que en particular la ecuaci
on de seno Gordon es
no lineal. Por otro lado, la ecuaci
on de Klein Gordon s es lineal pero la relaci
on de dispersi
on en (18.104) es
alineal puesto que k no es funci
on lineal de k y solo se vuelve lineal cuando 0 se anula, es decir cuando la
ecuaci
on de Klein Gordon se convierte en la ecuaci
on de onda lineal.
De lo anterior se ve que la ecuaci
on de seno Gordon es alineal y con relaci
on de dispersi
on alineal no is
ocrona.
Un estudio m
as detallado muestra que esta ecuaci
on admite soluciones de caractersticas muy peculiares incluso
entre las ecuaciones alineales. Estas soluciones peculiares son del tipo onda progresiva que pueden interactuar
entre s atraves
andose unas a otras y que emergen sin variar su forma salvo por un posible cambio de fase.
Estas ondas solitarias que conservan su forma incluso a traves de interacciones se denominan solitones, los
cuales tienen amplias aplicaciones especialmente en Fsica de Partculas Elementales y en Fsica del Estado
S
olido.

Bibliografa
[1] Classical Mechanics (3rd edition). Herbert Goldstein, Charles P. Poole, John L. Safko. AddisonWesley (2001).
[2] Physics Vol. I-Mechanics. Marcelo Alonso, Edward Finn. Addison-Wesley Publishing Co. Inc. Massachusetts (1967).
[3] An introduction to Mechanics. Daniel Kleppner, Robert Kolenkow. McGraw-Hill International Editions, (1973).
[4] On the transformation of torques between the laboratory and center of mass reference
frames. Rodolfo A. Diaz, William J. Herrera. Revista Mexicana de Fisica, vol. E51 #2 p.112 - 115
(2005).
[5] Work and energy in inertial and noninertial reference frames. Rodolfo A. Daz, William J.
Herrera, Diego A. Manjarres. American Journal of Physics 77(3), 270-273 (2009).
[6] Normal Forces Can do Work. Diego A. Manjarres, Rodolfo A. Daz, William J. Herrera,
http://demonstrations.wolfram.com/NormalForcesCan DoWork.
[7] The physical meaning of Lagrange multipliers. Hasan Karabulut. European Journal of Physics 27,
709 (2006).
[8] Moments of inertia for solids of revolution and variational methods. Rodolfo A. Diaz, William
J. Herrera, R. Martinez. European Journal of Physics 27, 183 (2006).
[9] Classical dynamics: A contemporary approach. Jorge V. Jose, Eugene J. Saletan. Cambridge University Press (1998).
[10] Mathematical Methods of Classical Mechanics, 2nd Ed. Arnold V. I. Springer-Verlag, Berlin (1988).
[11] Classical Dynamics: A modern perspective. E. C. G. Sudarshan, N. Mukunda. John Wiley & Sons (1974).

516

Вам также может понравиться