Вы находитесь на странице: 1из 151

Una introducci

on a la Mec
anica
Cu
antica para no iniciados

Renato Alvarez
Nodarse
Departamento de Analisis Matematico,
Facultad de Matematicas, Universidad de Sevilla
30 de junio de 2015

Indice general
1. Breve introducci
on a la mec
anica cl
asica

1.1. Mecanica Hamiltoniana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.2. Dos ejemplos representativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.2.1. El oscilador armonico unidimensional . . . . . . . . . . . . . . . . . . . .

1.2.2. Movimiento en un campo central de fuerzas . . . . . . . . . . . . . . . .

1.3. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2. C
omo se gest
o la Mec
anica cu
antica?

13

2.1. La radiacion del cuerpo negro . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14


2.2. Einstein y el efecto fotoelectrico . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.3. Bohr y el modelo atomico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.4. El nacimiento de la Mecanica Cuantica . . . . . . . . . . . . . . . . . . . . . . . 21
2.4.1. La dualidad onda-partcula . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.4.2. La Mecanica matricial de Heisenberg . . . . . . . . . . . . . . . . . . . . 22
2.4.3. La Mecanica ondulatoria de Schrodinger . . . . . . . . . . . . . . . . . . 23
2.4.4. Una deduccion de la ecuacion de Schrodinger . . . . . . . . . . . . . . 25
2.5. La interpretacion de la Mecanica cuantica . . . . . . . . . . . . . . . . . . . . . 25
2.5.1. El gato de Schrodinger . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.5.2. Los universos paralelos de Everett . . . . . . . . . . . . . . . . . . . . . . 29
2.6. El principio de incertidumbre de Heisenberg . . . . . . . . . . . . . . . . . . . . 30
2.6.1. El experimento de difraccion y el principio de incertidumbre . . . . . . . 30
2.7. Las matematicas de la Mecanica Cuantica . . . . . . . . . . . . . . . . . . . . . 32
2.8. Sobre la bibliografa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
i

INDICE GENERAL

ii

3. Mec
anica Cu
antica I: Movimiento de una partcula material

35

3.1. Los postulados de la Mecanica Cuantica . . . . . . . . . . . . . . . . . . . . . . 35


3.2. El principio de incertidumbre . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.2.1. Los estados estacionarios de la ecuacion de Schrodinger . . . . . . . . . . 43
3.3. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.3.1. Una partcula en un pozo de potencial . . . . . . . . . . . . . . . . . . . 44
3.3.2. El efecto t
unel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.3.3. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4. Mec
anica Cu
antica II: Espacios de Hilbert

49

4.1. Espacios eucldeos y espacios normados . . . . . . . . . . . . . . . . . . . . . . . 49


4.2. Operadores en H . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.3. Los axiomas de la Mecanica Cuantica . . . . . . . . . . . . . . . . . . . . . . . . 59
4.4. Discusion e implicaciones de los postulados . . . . . . . . . . . . . . . . . . . . . 61
4.4.1. Los proyectores ortogonales y la teora de mediciones . . . . . . . . . . . 62
4.5. Representacion de los operadores x
bi y pbi . . . . . . . . . . . . . . . . . . . . . . 63

4.6. Las ecuaciones de Heisenberg y de Schrodinger . . . . . . . . . . . . . . . . . . . 64


4.6.1. Equivalencia de las representaciones de Heisenberg y de Schrodinger . . . 66
4.6.2. Integrales de movimiento . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4.6.3. Los estados estacionarios del sistema . . . . . . . . . . . . . . . . . . . . 68
4.6.4. Los operadores unitarios y la evolucion temporal . . . . . . . . . . . . . . 68
4.7. El principio de incertidumbre . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
4.8. La mecanica matricial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.9. La ecuacion de Schrodinger y el postulado 4.3.5 . . . . . . . . . . . . . . . . . . 70
4.10. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

5. Resolviendo la ecuaci
on de Schr
odinger

73

5.1. El metodo de Nikiforov-Uvarov . . . . . . . . . . . . . . . . . . . . . . . . . . . 73


5.1.1. La ecuacion hipergeometrica generalizada . . . . . . . . . . . . . . . . . . 73
5.1.2. La ecuacion diferencial hipergeometrica . . . . . . . . . . . . . . . . . . . 74
5.1.3. Los polinomios de Hermite, Laguerre y Jacobi . . . . . . . . . . . . . . . 82
5.2. Resolucion de la ecuacion de Schrodinger . . . . . . . . . . . . . . . . . . . . . . 85
5.2.1. El oscilador armonico cuantico unidimensional . . . . . . . . . . . . . . . 85
5.2.2. La ecuacion de Schrodinger en un potencial central . . . . . . . . . . . . 87
5.2.3. Los armonicos esfericos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
5.2.4. Resolviendo la parte radial de la ecuacion de Schrodinger . . . . . . . . . 90

INDICE GENERAL

iii

5.2.5. El oscilador armonico tridimensional . . . . . . . . . . . . . . . . . . . . 93


5.3. El metodo de factorizacion de Schrodinger . . . . . . . . . . . . . . . . . . . . . 94
5.3.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
5.3.2. El oscilador armonico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
5.3.3. El metodo de factorizacion . . . . . . . . . . . . . . . . . . . . . . . . . . 98
5.3.4. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
5.4. Factorizacion de la EDO hipergeometrica . . . . . . . . . . . . . . . . . . . . . . 109
5.4.1. El hamiltoniano y los operadores escalera

. . . . . . . . . . . . . . . . . 109

5.4.2. Factorizacion de H(x, n) . . . . . . . . . . . . . . . . . . . . . . . . . . . 110


5.4.3. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

5.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113


Bibliografa

115

Anexo A: Breve introducci


on al an
alisis funcional

119

A.1. Introduccion: Estacios metricos y espacios normados . . . . . . . . . . . . . . . . 119


A.2. Espacios de Hilbert separables . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
A.2.1. Operadores en espacios de Hilbert . . . . . . . . . . . . . . . . . . . . . . 131
A.2.2. Teora Espectral de operadores compactos autoadjuntos . . . . . . . . . . 135
Bibliografa

139

Prefacio
Estas notas contienen el contenido de un curso de introduccion a la Mecanica cuantica
impartido por el autor en la Universidad de Zaragoza en septiembre de 2005 y en Coimbra en
febrero de 2006. Las mismas estan divididas en 6 captulos que contienen tanto los conceptos
teoricos como distintos metodos de resolucion de la ecuacion de Schrodinger. Quiero agradecer
a todos los que de una forma u otra me han ayudado a que estas notas sean posibles. En primer
lugar a mi familia, a los que les he robado un tiempo precioso. Ademas agradezco a Manuel
Alfaro (Universidad de Zaragoza), Jose Luis Cardoso (Universidade de Tras-os-Montes e Alto
Douro), Mario Perez (Universidad de Zaragoza), Francisco J. (Pacho) Ruiz (Universidad de
Zaragoza), Jose Carlos Petronilho (Universidade de Coimbra) y Juan L. Varona (Universidad
de La Rioja)sus comentarios y correcciones que me han permitido mejorar notablemente la
exposicion. Tambien debo agradecer a Luis Velazquez de la Universidad de Zaragoza y Alberto
Grunbaum de la Universidad de California (Berkeley) por las interesantes discusiones que tuvieron lugar en la semana mas calurosa de mayo de 2015 en Sevilla que me permitieron corregir
e incluir mas material.

Renato Alvarez
Nodarse
Sevilla 29 de junio de 2015

Introducci
on
Estas notas corresponden a un curso de introduccion a la Mecanica cuantica. En el se
pretende dar una idea general de como surgio la Mecanica cuantica a principios del siglo pasado
(XX) y exponer algunos de sus principales principios desde un punto de vista matematico.
El trabajo estara dividido en dos partes.
En la primera se describira la evolucion de la teora cuantica desde finales del siglo XIX hasta
la aparicion de la Mecanica cuantica de Heisenberg y Schrodinger en 19261927, es decir, a partir
de la idea revolucionaria de Planck sobre los quanta, la explicacion del efecto fotoelectrico
por Einstein y la descripcion de la dualidad onda-partcula de De Broglie, hasta la aparicion
de las dos principales teoras matematicas: la mecanica matricial y la mecanica ondulatoria.
En la segunda parte introduciremos la Mecanica Cuantica de una partcula as como sus
bases axiomaticas en un espacio de Hilbert separabl e. Finalmente, veremos algunos de los
metodos usados para resolver la ecuacion de Schrodinger.

Captulo 1
Breve introducci
on a la mec
anica
cl
asica
La Fsica se basa en medidas y observaciones experimentales de la realidad que nos rodea,
es decir, en cuantificar o caracterizar los distintos fenomenos naturales mediante expresiones
cuantitativas o n
umeros.
Estas cantidades medibles u observables se denominan cantidades fsicas (e.g. longitud,
velocidad, energa, . . . ). El objeto o conjunto de objetos a estudiar se denomina sistema fsico
(e.g. una partcula, un atomo, un coche, . . . ). Cuando conocemos distintas medidas de un
sistema que lo caracterizan por completo en un momento de tiempo determinado (e.g. la posicion
y la velocidad de una partcula de masa m) decimos que el sistema se encuentra en un cierto
estado dado.
El objetivo de toda teora fsica es, por tanto:
1. Describir el estado del sistema fsico, es decir, dar una representacion cuantitativa (matematica) del estado que lo defina biunvocamente.
2. Conocer la dinamica del sistema, es decir dado un estado inicial en el momento t0 conocer
su evolucion temporal para t > t0 .
3. Predecir los resultados de las mediciones de las cantidades fsicas del sistema.
La teora fsica en s misma esta en general constituida, desde el punto de vista abstracto,
por tres apartados:
1. El formalismo: Conjunto de smbolos y reglas de deduccion a partir de los cuales se
pueden deducir proposiciones y enunciados. En general toda teora comienza fijando un
cierto n
umero de axiomas com
unmente denominados postulados.
2. Ley dinamica: Cierta relacion (o relaciones) entre algunos de los principales objetos del
formalismo que permitan predecir acontecimientos futuros.
3. Reglas de correspondencia o interpretacion fsica: Conjunto de reglas que permiten asignar
valores experimentales a algunos de los smbolos del formalismo.
1

n a la meca
nica cla
sica
Captulo 1. Breve introduccio
Como ejemplo ilustrativo vamos a describir la mecanica newtoniana.

En la mecanica newtoniana el estado de un sistema viene dado por el conjunto de trayectorias de todas las partculas que constituyen el sistema. Por ejemplo, para una partcula, el
estado estara dado por la funcion vectorial ~r(t) R3 que denota la posicion en cada instante
de tiempo t. Los observables son las cantidades medibles como la posicion ~r(t), la velocidad
~v(t) = d/dt[~r(t)], la energa cinetica T = mv 2 (t), etc.
La ley dinamica en este caso es la segunda ley de Newton:
m~a(t) = F~ (t),

d2~r(t)
~a(t) =
,
dt2

donde F~ es la fuerza resultante que act


ua sobre el sistema, i.e., es una ecuacion diferencial de
orden 2. Finalmente, las reglas de correspondencia son evidentes y consisten en los valores
numericos de las proyecciones de los vectores ~r, ~v , etc. sobre los ejes del correspondiente sistema
de coordenadas escogido.
Veamos un ejemplo de sistema fsico y algunas de sus propiedades.
Supongamos que tenemos una partcula que se mueve en R3 bajo la accion de una fuerza
F~ (x, y, z) que solo depende de las coordenadas (posicion). Supongamos ademas que existe una
funcion escalar V (x, y, z) tal que
V
V ~ V ~
F~ (x, y, z) = V (x, y, z) = ~i
k,
j
x
y
z
donde ~i, ~j y ~k, son los vectores unitarios correspondientes a los ejes x, y y z, respectivamente.
Entonces, usando el producto escalar estandar de los vectores tenemos


V
V
V
~
dx +
dy +
dz = dV (x, y, z).
F (x, y, z)d~r =
x
y
z
Luego, el trabajo de la fuerza F~ para mover nuestra partcula a lo largo de cierta curva R3
se expresa mediante la integral
Z

~b


F~ (x, y, z)d~r = V (x, y, z) ,

~a

donde ~a y ~b son los extremos de dicha curva. En particular, para cualquier curva cerrada,
Z
I
~
F (x, y, z)d~r = F~ (x, y, z)d~r = 0.

Las fuerzas con estas caractersticas se denominan conservativas y los correspondientes sistemas:
sistemas conservativos.
La razon de esta denominacion se explica por lo siguiente: Si usamos la segunda ley de
Newton
d
(m~v ) d~r = m~v d~v,
F~ (x, y, z)d~r =
dt

nica Hamiltoniana
1.1. Meca
luego

~b

1

F~ (x, y, z)d~r = m~v d~v = mv 2 .

2

~a

Juntando esta expresion con la anterior tenemos



Es decir, la cantidad

 ~b
1 2

mv + V (x, y, z) = 0,

2

v 2 = ~v ~v .

~a

E = T (~v ) + V (~r)
vale lo mismo en los extremos de la curva . Como es arbitraria deducimos que E es una
cantidad invariante en el tiempo. Esta cantidad se denomina energa mecanica del sistema.
p2
T = 21 mv 2 = 2m
se denomina energa cinetica, V , energa potencial y p = m~v , impulso.
En la mecanica cuantica el formalismo es muy distinto y es el objetivo de este curso. Antes
de pasar a discutirlo veamos brevemente otra forma de describir los sistemas mecanicos clasicos:
El formalismo canonico o hamiltoniano.

1.1.

Mec
anica Hamiltoniana

Por sencillez seguiremos considerando el movimiento de una u


nica partcula.
Vamos a suponer que el espacio fsico es un espacio de fases (~r, p~), donde ~r = (x, y, z) R3
y p~ = (px , py , pz ) denotan las componentes del vector posicion y momento, respectivamente.
Definamos una funcion H dependiente de la posicion ~r y el impulso p~
H(~r, ~p) =

1 2
(p + p2y + p2z ) + V (x, y, z),
2m x

que denominaremos hamiltoniano del sistema. Entonces, las ecuaciones dinamicas del sistema
vienen dadas por las expresiones
H
dx
,
=
dt
px
dy
H
=
,
dt
py
dz
H
=
,
t
pz

dpx
H
=
,
dt
x
dpy
H
=
,
t
y
dpz
H
=
.
t
z

(1.1.1)

Esta claro como se generaliza el problema. Supongamos que el hamiltoniano depende de


las coordenadas canonicas q1 , . . . qN y sus correspondientes momentos p1 , . . . pN . Entonces las
ecuaciones dinamicas son
H
dqi
=
,
dt
pi

dpi
H
=
,
dt
qi

i = 1, 2, . . . , N.

(1.1.2)

n a la meca
nica cla
sica
Captulo 1. Breve introduccio

De esta forma la dinamica queda determinada por 2N ecuaciones con 2N incognitas. Finalmente
debemos destacar que, en general, las ecuaciones anteriores son equivalentes a las que se obtienen
usando la segunda ley de Newton. As, si
H(~r, p~) =

1 2
(p + p2y + p2z ) + V (x, y, z),
2m x

las ecuaciones (1.1.1) nos dan (solo incluiremos las ecuaciones para la coordenada x)
H
dx
=
dt
px

vx =

px
,
m

px = mvx ,

dpx
H
dvx
V
d2 x
=
= m
=
= Fx = m 2 = Fx ,
dt
x
dt
x
dt
es decir, recuperamos las ecuaciones de Newton de la mecanica clasica.
Dentro del formalismo canonico hamiltoniano hay una operacion de especial importancia
para entender el paso de la Mecanica clasica a la cuantica: las llaves de Poisson.
Se definen las llaves de Poisson de dos cantidades fsicas A := A(q1 , . . . , qN , p1 , . . . , pN ) y
B := B(q1 , . . . , qN , p1 , . . . , pN ), funciones de las variables canonicas qi y pi , i = 1, 2, . . . , N, a la
cantidad

N 
X
A B
A B
{A, B} :=

.
(1.1.3)
q
p
k pk
k qk
k=1
Notese que las ecuaciones de Hamilton (1.1.2) se pueden escribir como
dpi
= {pi , H},
dt

dqi
= {qi , H},
dt

i = 1, 2, . . . , N.

Notese ademas que para las coordenadas canonicas se tiene


{qi , qj } = 0 = {pi , pj },

{qi , pj } = i,j ,

i, j = 1, 2, . . . , N.

(1.1.4)

En general se puede probar que la ecuacion de evolucion para cualquier cantidad fsica A
es

1.2.
1.2.1.

dA
= {A, H}.
dt

(1.1.5)

Dos ejemplos representativos


El oscilador arm
onico unidimensional

Comencemos con un sistema clasico de gran importancia: el oscilador armonico. Asumiremos que el eje de coordenadas esta situado justo en la posicion de equilibrio del oscilador, luego
por x representaremos la desviacion del sistema del punto de equilibrio. En este caso
H(x, p) =
luego

p2
1
+ kx2 ,
2m 2

(1.2.1)

1.2. Dos ejemplos representativos

11
00
00
11
00
11
00
11
00
11
00
11
00
11
00
11
m
k
00
11
00
11
00
11
00
11
000000000000000000000
111111111111111111111
000000000000000000000
111111111111111111111
000000000000000000000
111111111111111111111

Figura 1.1: El oscilador armonico

H(x, p)
dx
=
,
dt
p
dx
p
= ,
dt
m

dp
H(x, p)
=
=
dt
x

dp
= kx = mx (t) + kx(t) = 0.
dt

Sus soluciones son:

k
,
m
donde A y dependeran de las condiciones iniciales x0 = x(0), v0 = v(0) y estan dadas por
v0 = x0 tan y x0 = A cos .
x(t) = A cos(t + ),

En la figura 1.2 representamos dos soluciones correspondientes a fases iguales y amplitudes


distintas. Notese que de la solucion no se deducen ning
un tipo de restricciones para los valores
de A y .
Si calculamos la energa:
1
1
1
E = T + V = m[x(t) ]2 + kx2 = kA2 = const.
2
2
2
De lo anterior se deduce que la energa toma los valores reales E = 21 kA2 0 y es una cantidad
continua.
x

x
2

1
5

10

15

20

25

10

15

20

25

Figura 1.2: El oscilador armonico: soluciones


Obviamente este sistema es demasiado sencillo. Un caso mas realista es el oscilador amortiguado, es decir, cuando hay rozamiento. En este caso la ecuacion diferencial que se obtiene es
mx (t) + x (t) + kx(t) = 0, donde > 0 es el coeficiente de viscosidad del medio. Dejamos, al
lector que resuelva y analize la ecuacion como ejercicio.

n a la meca
nica cla
sica
Captulo 1. Breve introduccio

1.2.2.

Movimiento en un campo central de fuerzas

Veamos el caso correspondiente al potencial de una fuerza central, es decir, V (~r) = /r.
Ejemplos tpicos de dicha fuerza son la fuerza gravitatoria y la electroestatica.
z

F(r)

M
y

Figura 1.3: Fuerza central de interaccion entre dos partculas.

En este caso tenemos


H(~r, ~p) =

r=

my (t) =

y
,
r3

p2

,
2m
r

Entonces, las ecuaciones (1.1.1) nos dan


mx (t) =

x
,
r3

x2 + y 2 + z 2 .

mz (t) =

(1.2.2)

z
.
r3

Vamos a considerar el movimiento de una partcula material de masa m en un campo de


fuerzas centrales (ver figura 1.3). Sea F~ (r) la fuerza dirigida al origen de coordenadas y que
solo depende de la distancia r al origen de coordenadas. Usando la Ley de Newton tenemos las
siguientes ecuaciones para cada coordenada x, y y z:
mx (t) = Fx (r),
mz (t) = Fz (r),
Pero

my (t) = Fy (r),
p
r = x2 + y 2 + z 2 .

x
Fx (r) = F (r) cos = F (r) ,
r
y
Fy (r) = F (r) cos = F (r) ,
r
z
Fz (r) = F (r) cos = F (r) ,
r
luego las ecuaciones del movimiento de nuestra partcula son
x
mx (t) = F (r) ,
r

y
my (t) = F (r) ,
r

z
mz (t) = F (r) .
r

(1.2.3)

1.2. Dos ejemplos representativos

Vamos a probar que el movimiento de la partcula es plano. Para ello multiplicamos la


primera ecuacion en (1.2.3) por y, la segunda por x y las sumamos. Ello nos da
m(xy yx ) = 0

xy yx = 0.

Si ahora multiplicamos la segunda por z, la tercera por y y sumamos tenemos


m(yz zy ) = 0

yz zy = 0.

Finalmente, multiplicando la primera por z, la tercera por x y sumando, obtenemos


m(zx xz ) = 0

zx xz = 0.

Ahora bien, integrando por partes en la primera de las tres u


ltimas ecuaciones vemos
Z
Z
Z

c1 = (xy yx )dt = xy x y dt yx + y x dt = xy yx .
Analogamente tenemos, para las otras dos,
yz zy = c2 ,

zx xz = c3 .

Si multiplicamos la primera de las tres u


ltimas ecuaciones por z, la segunda por x y la tercera
por y y las sumamos obtenemos
c1 z + c2 x + c3 y = 0,
que es precisamente la ecuacion de un plano que pasa por el origen. As pues, tenemos la
siguiente propiedad:
Propiedad 0. El movimiento de una partcula sometida a una fuerza central es plano, o sea,
su trayectoria esta contenida en un plano que pasa por el origen (hacia donde apunta dicha
fuerza central).
y

Fr
r
F(r)

j
u
ur
0

F
x

Figura 1.4: Componentes radial y angular de un vector.


Dado un vector cualquiera en el plano, siempre podemos descomponerlo en sus respectivas
componentes. Todo vector se puede escribir en funcion de los vectores unitarios ~i y ~j que definen
a los ejes x e y, respectivamente. En particular, los vectores unitarios de las direcciones radial
~ur y angular ~u (ver figura 1.4)
~ur = ~i cos + ~j sen ,

~u = ~i sen + ~j cos .

n a la meca
nica cla
sica
Captulo 1. Breve introduccio

8
Notese que entonces

d~ur
d~u
= ~u ,
= ~ur .
(1.2.4)
d
d
Ademas, F~ = Fr ~ur + F ~u , pero si la fuerza es radial entonces F = 0. Escribamos ahora las
leyes de Newton para nuestra partcula en coordenadas polares. Comenzamos calculando el
vector velocidad
~v =

d(r~ur )
d~ur dr
d~ur d dr
d
dr
=r
+ ~ur = r
+ ~ur = r ~u + ~ur ,
dt
dt
dt
d dt
dt
dt
dt

(1.2.5)

donde hemos usado (1.2.4). Analogamente


~a =

dr d
d2
d d~u d2 r
dr d~ur
d~v
=
~u + r 2 ~u + r
+ 2 ~ur +
dt
dt dt
dt
dt dt
dt
dt dt
"
#
 2

 2
d
dr d
d2 r
d
= r 2 +2
~u +
~ur .
r
2
dt
dt dt
dt
dt

Luego, usando la Ley de Newton, tenemos



dr d
d2
=
0 = F = ma = m r 2 + 2
dt
dt dt


d2
dr d
d 2 d
r 2 +2
r
= 0.
=
dt
dt dt
dt
dt


Es decir, r 2 (t) = c, con c cierta constante. La propiedad anterior se conoce como Ley de las
areas pues el area que barre el radio vector ~r es tal que dA(t) = r 2 /2d = r 2 /2 (t)dt, por tanto
A (t) = r 2 /2 (t) = c/2. As, hemos probado la siguiente propiedad1
Propiedad 1. El movimiento de una partcula sometida a una fuerza central es tal que el radio
vector ~r recorre areas iguales en intervalos de tiempo iguales, i.e., dA(t)/dt = r 2 (t) = c.
Supongamos ahora que la fuerza es de la forma
m
F~ (r) = 2 ~ur ,
r

(1.2.6)

es decir, una ley del inverso del cuadrado de la distancia.


Nuevamente usando la ley de Newton, para la componente radial obtenemos
 2

d
d2 r
= 2.
r
Fr (r) = mar =
2
dt
dt
r

(1.2.7)

Vamos a intentar resolver esta ecuacion diferencial. Obviamente es una ecuacion diferencial no
lineal as que intentaremos convertirla en una ecuacion lineal. Para ello haremos el cambio de
variable r = 1/u() y pasaremos de la variable t a , es decir, intentaremos dar con la ecuacion
de la trayectoria de nuestra partcula. Notese que en las nuevas variables, la propiedad 1 de las
areas se escribe como (t) = cu2 . Tenemos
dr
dr d
u()
=
= 2 cu2() = cu (),
dt
d dt
u ()
1
Esta propiedad se conoce como segunda Ley de Kepler, en honor al matematico y astronomo J. Kepler
quien la descubri
o en la segunda mitad del siglo XVII cuando estudiaba la orbita del planeta Marte.

1.2. Dos ejemplos representativos


du()
d2 r
=
c
= cu () (t) = c2 u2 ()u (),
dt2
dt
luego (1.2.7) se transforma en

u () + u() = 2 ,
c
que es lineal. La solucion de la ecuacion anterior la escribiremos en la forma
u() = c1 cos() + c2 sen() +

= 2 [1 + e cos( )] ,
2
c
c

luego, si escogemos los ejes coordenados de forma que


= 0 o lo que es lo mismo, que r sea mnimo cuando
= 0, i.e., c1 > 0 y c2 = 0 obtenemos la ecuacion para
la trayectoria
c2 /
.
r() =
1 + e cos()

P
D
r

Que figura geometrica define la ecuacion anterior?


Para ello recordemos que el lugar geometrico de los puntos P (x, y) tales que la distancia OP de P a un punto fijo O (foco) es igual a la distancia P D de p a
una recta r dada (directriz) viene dado por la formula r = pe/(1 + e cos ) (ver figura 1.5) siendo e cierta
p
constante (excentricidad). Es conocido que si e < 1 la
curva es una elipse, si e = 1 una parabola, y si e > 1
Figura 1.5: Propiedad de las seccio- una hiperbola. As pues, hemos demostrado la siguiente
nes conicas.
propiedad:
0

Propiedad 2. La trayectoria de una partcula sometida a una fuerza central es una secci
on
c
onica, es decir, una elipse, una parabola o una hiperbola.
Es facil comprobar que si una fuerza es central entonces existe una funcion U(x, y, z) tal
que
Fx =

U
,
x

Fy =

U
,
y

Fz =

U
.
z

En nuestro caso, ademas, U(x, y, z) = U(r) = /r. Sumando las tres ecuaciones anteriores y
usando la ley de Newton tenemos
U
U
U
dx +
dy +
dz = m(x dx + y dy + z dz)
x
y
z


m 2
2
2
= 0.
d U + (x + y + z
2
En otras palabras, la funcion energa
dU =

E(t) = U +

m 2
m
v = + v2
2
r
2

(1.2.8)

es constante. Esto es, como ya hemos visto, la Ley de Conservacion de la Energa. Si aplicamos
esta ley a nuestro sistema tenemos, usando (1.2.5),
E=

m
m
m
m
m 2 m
v
= (v2 + vr2 )
= [(r (t))2 + (r (t))2 ]
.
2
r
2
r
2
r

10

n a la meca
nica cla
sica
Captulo 1. Breve introduccio

Escojamos el momento de tiempo cuando = 0. Usando la propiedad 1 tenemos (r (t))2 =


c2 /r 2 , pero, seg
un nuestra eleccion, r = 0 (es mnimo) y r = c2 [(1 + e)]1 , luego
r
m2 (e2 1)
2c2
E=
=
e
=
.
1
+
E
2c2
m2

b
a

rm

Figura 1.6: Movimiento de un planeta P alrededor del sol S.


En el caso de los planetas (ver figura 1.6), al pasar el planeta por el punto mas cercano al
foco (donde esta el sol) se tiene, por la ley de Newton,
ma =

m
2
rm

v2 =

,
rm

pero entonces para la energa E obtenemos el valor

m
m
< 0,
E = v2 =
2
r
2rm
y por tanto e < 1, o sea, los planetas se mueven siguiendo orbitas elpticas. Esta es la conocida
primera Ley de Kepler.
Finalmente, tenemos que rm = ae, y (1 e2 ) = b2 /a2 , donde a y b son los semiejes mayor y
menor de la elipse, respectivamente. Entonces, como a es la semisuma de las distancias maxima
y mnima de nuestra partcula (planeta) al foco,


1 c2 /
c2
c2 /
a=
= a =
+
,
2 1 + e 1 e cos
(1 e2 )
de donde deducimos que b2 = c2 a/. Si ahora usamos que el area de la elipse es A = ab, y la
propiedad 1, obtenemos que ab = cT /2 donde T es el tiempo que tarda la partcula en dar
una vuelta entera sobre la orbita. Sustituyendo el valor de b en la expresion anterior obtenemos
T2
4
=
,
a3

(1.2.9)

es decir, el cuadrado del perodo de revolucion de los planetas es proporcional al cubo de sus
distancias medias. La propiedad anterior se conoce como tercera Ley de Kepler. Notese que la
constante de proporcionalidad no depende para nada del planeta, solo de , que seg
un la Ley
de Gravitacion Universal es GMs , donde G es la constante de gravitacion universal y Ms la
masa del sol.

1.3. Problemas

1.3.

11

Problemas

Problema 1.3.1 Estudia como se comporta una partcula material que se mueve en un campo
potencial definido por las siguientes funciones potencial:

U0 , x < 0,
0, x < 0,
0, 0 < x < L,
U0 , 0 < x < L,
V (x) =
V (x) =

U0 , x > L,
0, x > L,
conocidas como pozo potencial y barrera de potencial.

Problema 1.3.2 Discutir lo que ocurre si en vez de dos masas interactuando seg
un la ley de
gravitacion universal, lo que tenemos es un atomo de hidr
ogeno. En este caso la formula (1.2.6)
se convierte en
ke2
F~ (r) = 2 ~ur .
(1.3.1)
r
Para terminar con este apartado y pasar a discutir lo que ocurre en el mundo cuantico tenemos
que recordar que en el caso del atomo de hidrogeno hay un problema a
nadido y es que al ser
el electron una partcula cargada en movimiento, esta continuamente emitiendo ondas electromagneticas por lo que su energa va disminuyendo. Esto implica que el electron va cayendo en
espiral al n
ucleo. Este hecho contradice todos los experimentos conocidos.

12

n a la meca
nica cla
sica
Captulo 1. Breve introduccio

Captulo 2
C
omo se gest
o la Mec
anica cu
antica?
Antes de entrar a discutir el formalismo y las leyes dinamicas de la Mecanica Cuantica no
relativista vamos a dar un bosquejo historico de la misma.
William Thomson o, como era conocido, Lord Kelvin, pronuncio una
conferencia el 27 de abril de 1900 1 que contena la siguiente, hoy celebre,
frase:
Hoy da la ciencia fsica forma, esencialmente, un conjunto
perfectamente armonioso, Un conjunto practicamente acabado! Solo quedan dos nubecillas: la primera, el resultado negativo del experimento de Michelson-Morley. La segunda, las
profundas discrepancias de la ley de Rayleigh-Jeans.
Nadie, en aquel momento, poda imaginar que esas dos nubecillas
desembocaran en la Teora de la Relatividad de Einstein y la Mecanica
Cuantica, teoras que iban a cambiar radicalmente nuestra concepcion de
los fenomenos naturales y que representaron una Revolucion comparable, en cierta forma, a la Revolucion Copernicana y la aparicion de los
Principia de Newton.

William Thomson

En estas notas nos dedicaremos a estudiar las bases de la segunda de estas dos grandes
teoras. Antes de entrar es los detalles vamos a dar una breve introduccion historica, necesaria
para entender como el problema planteado por Lord Kelvin su segunda nubecilla y su
resolucion termino en la moderna teora cuantica.
1

Esta frase atribuida a Lord Kelvin tiene cierta polemica. Lo que es un hecho es que un a
no mas tarde Lord
Kelvin public
o su discurso ampliandolo considerablemente con el ttulo Nineteenth-Century Clouds over the
Dynamical Theory of Heat and Light que aparecio en la Phil. Mag. S. 6. Vol. 2. No. 7. July 1901, p
ags. 140.
Al inicio de dicho trabajo podemos leer
The beauty and clearness of the dynamical theory, which asserts heat and light to be modes of
motion, is at present obscured by two clouds. I. The first came into existence with the undulatory
theory of light, and was dealt with by Fresnel and Dr. Thomas Young; it involved the question,
How could the earth move through an elastic solid, such as essentially is the luminiferous ether ?
II. The second is the Maxwell-Boltzmann doctrine regarding the partition of energy.
que esencialmente viene a decir lo mismo que la cita inicial.

13

14

2.1.

mo se gesto
la Meca
nica cua
ntica?
Captulo 2. Co

La radiaci
on del cuerpo negro

La ley de Rayleigh-Jeans es una formula que describe la radiacion de un cuerpo negro.


Todos sabemos que al calentar un cuerpo este cambia de color quien no ha calentado de
peque
no un clavo o un tornillo en el fogon de casa o ha visto el color que toma una parrilla al
hacer una parrillada. Probablemente nuestra curiosidad nos llevo a preguntarnos al menos
todo fsico lo debera haber hecho como emiten la luz los cuerpos al calentarse?

Figura 2.1: Metal caliente (izquierda) y modelo de cuerpo negro (derecha).

Para resolver estas dudas, los fsicos de finales del siglo XIX idealizaron un cuerpo cualquiera
y construyeron un modelo que llamaron cuerpo negro tambien, cavidad, etc. La idealizacion
consista en que el cuerpo negro tena que absorber y por tanto emitir ondas electromagneticas
en todo el espectro de frecuencias. De hecho, era un hecho bien conocido a finales del XIX que
la luz visible estaba constituidda por ondas electromagneticas dentro de un cierto rango de
frecuencias.

Figura 2.2: Representacion esquematica de una onda plana unidimensional: Si v es la velocidad


de la onda, T el periodo y la longitud de onda, entonces = vT , la frecuencia angular es
= 2/T , y la frecuencia = 1/T .

El primero en establecer una ley emprica para la radiacion del cuerpo negro fue Wien quien
obtuvo la formula 3e/T , y parametros experimentales, pero esta solo corresponda a
la parte ultravioleta altas frecuencias, o equivalentemente, longitudes de onda peque
nas del
espectro y fallaba en la banda infrarroja bajas frecuencias, o equivalentemente, longitudes de
onda grandes. Por otro lado, dos fsicos ingleses, Rayleigh y Jeans, dedujeron una formula
para la banda infrarroja pero que no era compatible con la formula de Wien.
Definamos la densidad de energa (cantidad de energa por unidad de volumen) mediante U(T ). Obviamente esta dependera de la temperatura T . Ademas, cada longitud de onda

n del cuerpo negro


2.1. La radiacio

15

Figura 2.3: Diagrama del espectro electromagnetico, mostrando el tipo, longitud de onda con
ejemplos, frecuencia y temperatura de emision de cuerpo negro (tomado de wikipedia). La luz
visible esta en el rango de 400-790 terahercios (1012 Hz)

frecuencia aportara su granito de arena, esta densidad por unidad de frecuencia la denotaremos por u(, T ), as
Z
U(T ) =
u(, T )d.
(2.1.1)
0

La formula de Rayleigh-Jeans estableca que


u(, T ) =

2
kT,
2 c3

donde c es la velocidad de la luz y k es la constante de Ludwig Boltzmann. En particular,


para frecuencias muy altas (zona de frecuencias ultravioletas) es muy grande lo cual esta en
contradiccion con las mediciones experimentales. Esta es la llamada catastrofe ultravioleta y no
es mas que la segunda nubecilla de Lord Kelvin (ver figura 2.4). Notese que al sustituir u(, T )
en (2.1.1) obtenemos U(T ) = lo cual no tiene sentido.
La manera de obtener esta formula es muy sencilla. Era un hecho establecido en el siglo
XIX que el n
umero de ondas estacionarias con frecuencias por unidad de volumen en el interior
2
de un cuerpo en el intervalo [, + ] era dn = 2 3 . La suposicion de Rayleigh y Jeans
c
consista en que a cada oscilacion electromagnetica le corresponda, en media, una energa hi
igual a kT . As
2
(2.1.2)
u(, T ) = hidn = 2 3 kT.
c
El proximo paso lo dio Max Planck. Desde el punto de vista de la fsica clasica la deduccion
de Rayleigh y Jeans era impecable, por tanto Planck asumio que deba haber alguna ley
importante sin descubrir. En octubre de 1900 Planck encontro empricamente una formula que
describa perfectamente la ley experimental para la radiacion del cuerpo negro. Dicha formula

mo se gesto
la Meca
nica cua
ntica?
Captulo 2. Co

16
u(, T )

Curva experimental
Ley de Rayleigh-Jeans
Ley de Wien

Figura 2.4: Grafica de la intensidad u(, T ) contra la frecuencia de onda .

para la energa media de la onda era la siguiente:


hi =

exp

~

,
~
1
kT

donde ~ era cierta constante desconocida. Si ~/kT 1, entonces la formula de Planck daba
hi kT . Ademas, si ~/kT 1, Planck recuperaba la formula de Wien.
Para explicar su formula Plank, rompiendo la concepcion clasica,
lanza la idea de que los osciladores que componen los atomos absorben o emiten luz no de forma continua, como era habitual en la fsica
clasica, sino mediante porciones aisladas proporcionales a la frecuencia,
es decir la energa se emita o absorba mediante quantas de energa
E = ~.
Hay varias razones que justifican su audacia. La primera es que
Planck considero su hipotesis como un artificio matematico pues le permita deducir su formula emprica. En efecto, a
nos antes en gran fsico
austriaco Ludwig Boltzmann haba demostrado que la probabilidad de
Max Planck
que un sistema enequilibrio
 tuviese una energa E era proporcional
E
a la cantidad exp
. Si E solo puede tomar valores que sean
kT
m
ultiplos enteros de ~,
n~, entonces la probabilidad pn de cada uno de estos valores
 En = 
n~
de energa es pn = exp
y por tanto la energa media es
kT


n~
n~ exp

kT
X
~
n=0
 
=
,
hi =
pn En =



X
~
n~
n=0
1
exp
exp
kT
kT
n=0

que es justamente la formula que Plank haba encontrado empricamente. Si ahora multiplica-

n del cuerpo negro


2.1. La radiacio
mos por dn =

17

2
obtenemos
2 c3
u(, T ) = hidn =

~ 3
4 2 c2

exp

1

,
~
1
kT

(2.1.3)

conocida como formula de Planck para la densidad de energa de un cuerpo negro.


La segunda razon fue que los quanta de Planck eran absorbidos o emitidos por la materia
que compona al cuerpo negro: es decir sus atomos. Y la estructura atomica era algo desconocido
a principios del siglo XX, incluso muchos modelos de la materia consideraban a esta como un
conjunto de osciladores, por lo que no era del todo descabellada la idea de Planck de que estos
osciladores solo pudiesen absorber la energa o emitirla mediante porciones individuales podra
ser una especie de resonancia, o algo parecido. No obstante para Planck la luz segua siendo
una onda perfectamente continua y perfectamente descrita por las leyes de Maxwell.
Antes de continuar nuestra historia debemos hacer un breve parentesis para explicar cuales
fueron las principales causas de que la hipotesis de Planck calara tan hondo el la fsica de
principios de siglo.
El primer hecho importante es que, como ya hemos mencionado, la formula de Planck se
corresponda exactamente con la curva experimental para el cuerpo negro obtenida en los laboratorios. Pero ademas permita resolver una de las paradojas de la fsica clasica: la denominada
catastrofe ultravioleta, consecuencia de la formula de Rayleigh-Jeans. Si la formula (2.1.2)
era correcta entonces la densidad de equilibrio de la energa u(T ) de la radiacion (2.1.1) daba infinito, es decir que nunca se alcanzara el equilibrio termodinamico entre la materia y la
radiacion. Si usamos (2.1.3) tenemos
Z
2k4 4
U(T ) =
u(, T )d =
T = T 4 ,
2 ~3
60c
0
donde es una constante conocida tambien como constante de Boltzmann para la densidad
o luminosidad de la energa de radiacion. Planck calculo ademas el valor de la constante ~
en su formula para que se correspondiera con los valores experimentales obteniendo el valor
aproximado 1,05 1034 Jules por segundo2 . Cuando sustituyo este valor el la formula para
obtuvo exactamente el valor numerico de esta. Es decir, Planck resolvio de forma brillante la
segunda de las nubecillas de Lord Kelvin.
Estos resultados fueron publicados por Planck el 14 de octubre
de 1900, da oficial del nacimiento de la teora cuantica. Quien iba a
imaginar que este trabajo iba a revolucionar la fsica por completo!
El segundo hecho, que ademas fue crucial en la historia de la
mecanica cuantica, fue la prueba de Henri Poincare (en el oto
no de
1911) de que la distribucion
hi =
Henri Poincaire
2

exp

~

,
~
1
kT

Muchas veces en vez de ~ se usa el valor h = 2~ = 6,62 1034 juliosradianes por segundos.

18

mo se gesto
la Meca
nica cua
ntica?
Captulo 2. Co

Figura 2.5: Efecto fotoelectrico

solo se poda obtener bajo la suposicion de que la energa esta cuantizada (vease el magnfico artculo de Hendrik Lorentz Deux Memoires
de Henri Poincare sur la Physique Mathematique escrito en 1914 y
publicado en Acta Mathematica Vol. 38, (1921) pags. 293-308), es decir desde el punto de
vista matematico la formula de Planck solo puede ser deducida bajo la suposicion de que la
energa se emite y absorbe en porciones discretas de energa algo que era totalmente distinto a
la concepcion clasica del mundo que se tena hasta la fecha.

2.2.

Einstein y el efecto fotoel


ectrico

El siguiente paso lo dio Einstein en 1905 en un ensayo titulado Sobre un punto de vista
heurstico acerca de la produccion y la transformacion de la luz que recibio el mismo Max Planck
para su publicacion en los Annalen der Physik.
Einstein, totalmente seducido por los quanta de Planck, lanza la
hipotesis de que no solo los osciladores materiales emitan energa
cuantificadamente, sino tambien los osciladores lumnicos. Einstein
retomando las ideas corpusculares sobre la luz Newton ya haba desarrollado una teora corpuscular a finales del siglo XVII considera la
luz formada por partculas de masa cero y energa ~: los fotones.
Utilizando estas hipotesis dio una explicacion sencillsima al efecto fotoelectrico que haba descubierto Hertz en 1887 y que segua sin tener
una explicacion satisfactoria.
Hertz haba descubierto que una placa metalica sometida a una luz
ultravioleta altas frecuencias emita electrones. A
nos mas tarde se
comprobo que el n
umero de dichos electrones aumentaba proporcionalmente a la intensidad de la radiacion pero incomprensiblemente la
Albert Einstein
velocidad de estos no dependa de la intensidad sino de la frecuencia
de luz: a mayor frecuencia, mayor velocidad. Ademas si la frecuencia
era lo suficientemente baja o la longitud de onda muy grande ya no se emitan electrones
independientemente de lo intensa que fuese la luz incidente.
Para resolver el problema Einstein razono como sigue: Supongamos que usamos una luz
monocromatica compuesta por quantas de energa luminosa ~, es decir que estamos bombardeando la lamina metalica con partculas luminosas cada una de las cuales tiene una energa

mico
2.3. Bohr y el modelo ato

19

~. Si denotamos por W la energa necesaria para extraer un electron del metal, entonces la
energa cinetica de los electrones, Ec , se expresara mediante la formula
Ec = ~ W.

(2.2.1)

Todas las observaciones descritas anteriormente son una consecuencia de la formula anterior!
A
nos mas tarde, el fsico estadounidense Robert Millikan comprueba experimentalmente la
formula de Einstein (2.2.1) y encuentra que ~ es la misma ~ de Planck. Esta fue la gota que
colmo el vaso, pues al parecer la luz, que era aceptada unanimemente por todos como un
fenomeno continuo, tena al parecer cierta naturaleza corpuscular.

2.3.

Bohr y el modelo at
omico

El proximo paso en la historia lo dio el danes Niels Bohr.


Era un hecho aceptado en 1913 que el atomo estaba constituido por un n
ucleo pesado
y denso que contena toda la materia del atomo y electrones girando a su alrededor. Este modelo, una especie de sistema solar en miniatura, sencillo y funcional fue propuesto por
Rutherford a partir de los resultados de experimentos de dispersion.3 Solo tena un peque
no
problema: como toda carga en movimiento acelerado emite ondas electromagneticas, los electrones que giraban alrededor del n
ucleo deban perder energa y caer al n
ucleo ademas en un
tiempo record: 105 segundos. Por tanto, tena que haber alguna forma de poder retener a
los electrones en sus orbitas.
Otro hecho curioso tiene que ver con la forma en que radian energa los elementos qumicos.
Ya sabemos que al calentar un cuerpo este emite energa en todo el espectro electromagnetico.
Sin embargo, al observar la luz que pasa a traves de ciertos elementos en estado gaseoso se
vean ciertas franjas negras muy finas (lneas de absorcion) en el espectro de la misma, es
decir como si faltaran ciertas frecuencias (o longitudes de onda). Algo similar ocurra al excitar
ciertos elementos y observar la luz que desprendan: aparecan ciertas lneas brillantes (lneas
de emision) en determinadas longitudes de onda. De hecho para cada elemento haba una
u
nica secuencia de dichas lneas. Ese es el principio basico de la espectroscopa y es lo que ha
permitido, entre otras cosas, saber la composicion qumica de las estrellas, que de otra forma
sera imposible de determinar.
En el caso del Hidrogeno era un hecho conocido experimentalmente sus lneas espectrales
respondan a una formula conocida como formula de Balmer (para k = 2 se tiene la conocida
serie de Balmer en el espectro visible) y sus generalizaciones que estableca la siguiente expresion
para el inverso de la longitud de onda


1
1
1
,
n, k = 1, 2, 3, . . . , n 6= k,
= RH

k 2 n2
siendo RH la constante de Rydberg que tomaba el valor 1,0976776534 107 1/metros. Llamaba
tremendamente la atencion de que los valores que n y k eran n
umeros enteros.
3
Rutherford bombardeaba
atomos de oro con n
ucleos de helio (partculas alpha) cuando descubri
o que para
ngulos muy bajos (es decir cuando se disparaban las partculas alpha frontalmente contra los n
a
ucleos de oro)
haba una gran cantidad de ellas que rebotaban en sentido contrario, como cuando una bola peque
na ligera
contra una muy pesada. Eso llev
o a Rutherford a deducir que la estructura del atomo era parecida a un sistema
solar en miniatura: un n
ucleo muy denso y pesado en el centro con electrones ligeros girando a su alrededor.

mo se gesto
la Meca
nica cua
ntica?
Captulo 2. Co

20

Figura 2.6: La serie de Balmer del atomo de hidrogeno

El razonamiento de Bohr fue bastante logico: obligar al electron que


se mantuviera en ciertas orbitas permitidas (estables) y para pasar de una
de estas orbitas a otra este debera saltar por encima de todas aquellas
no permitidas. Dichas orbitas, que Bohr considero circulares, deban ser
tales que

Niels Bohr

De todas las infinitas orbitas posibles solo son posibles aquellas en


la que su momento angular L = mvr, siendo m la masa del electron,
v, su velocidad y r el radio de la orbita, fuesen m
ultiplos enteros de
~, i.e. mrv = n~.

La energa que absorbe o emite un atomo al saltar un electron de


una orbita permitida a otra es igual a ~, es decir para saltar de
una orbita a otra el atomo absorbe o emite un quanta de luz.
Veamos las consecuencias de las hipotesis cuanticas de Bohr.
Si usamos la ley de Newton F = ma, tenemos
m

ke e2
v2
= 2 .
r
r

Utilicemos que L = mvr = n~ para eliminar la velocidad v. Ello


nos da el valor de los radios rn de las orbitas permitidas
rn =

000000000000000
111111111111111
111111111111111
000000000000000
000000000
000000000000000 111111111
111111111111111
000000000
111111111
000000000000000
111111111111111
000000000
000000000000000 111111111
111111111111111
000000000
111111111
000000000000000
111111111111111
000000000
000000000000000 111111111
111111111111111
000000000
111111111
000000000000000
111111111111111
000000000
000000000000000 111111111
111111111111111
000000000
111111111
000000000000000
111111111111111
000000000
000000000000000 111111111
111111111111111
000000000
111111111
00000
11111
000000000000000
111111111111111
000000000
00000
11111
000000000000000 111111111
111111111111111
00000
11111
00000
11111

~r

~v

~2 n2
.
mke e2

La energa de la orbita es, por tanto4 ,


1
ke e2
ke e2
mk 2 e4 1
En = mv 2
=
= e2 2 .
2
r
2r
2~ n

Figura 2.7: El atomo de


Bohr
(2.3.1)

Entonces, el salto entre dos orbitas daba para la frecuencia del foton emitido el valor:


En Em
mke2 e4 1
1
=
,
n, k = 1, 2, 3, . . . .
=

~
2~3
k 2 n2
Cuando Bohr sustituyo en su formula el valor de m, e y ~, tomando para esta u
ltima el valor
de encontro Planck, obtuvo justamente el valor de la constante de Rydberg RH (recordemos
4

Hemos sustituido el valor de v que nos da la ley de Newton.

nica Cua
ntica
2.4. El nacimiento de la Meca

21

que = (2c/) donde c es la velocidad de la luz. Es decir, ~ era mas que una simple constante introducida artificialmente por Planck: era una de las constantes mas importantes de la
naturaleza.
Aunque el modelo de Bohr era muy funcional y explicaba muchos fenomenos, este continuaba siendo muy incompleto y ademas tena demasiados interrogantes. De donde sala ese
extra
no postulado sobre las orbitas? Este era quiza el punto mas obscuro de toda la teora.
No obstante, en su artculo Bohr sienta las bases de lo que luego se denomino el Principio de
correspondencia de Bohr. El dicho trabajo Bohr postula como deba ser la teora cuantica: esta
tena que ser tal que, para n
umeros cuanticos grandes, por ejemplo n en las formulas anteriores,
se transformase en la teora clasica.
A
nos mas tarde, Bohr junto a Sommerfeld mejoran mucho el modelo atomico inicial incluyendo orbitas elpticas, entre otras cosas. Pero no es hasta 1925-1926 que no nace la nueva
teora cuantica a manos de un joven fsico aleman: Werner Heisenberg y un fsico austriaco:
Erwin Schrodinger.

2.4.
2.4.1.

El nacimiento de la Mec
anica Cu
antica
La dualidad onda-partcula

Antes de poder describir los fundamentos de la Mecanica Cuantica tenemos que detenernos
en un personaje singular: el frances Louis de Broglie. Luis de Broglie era el hermano peque
no
del Marques Maurice De Broglie, un afamado fsico experimental frances que dedicaba gran
parte de su tiempo y dinero a la investigacion experimental varias veces fue propuesto para el
Nobel de Fsicas. Un da de 1923 Louis, influenciado por el trabajo de Einstein sobre el efecto
fotoelectrico, postula que la dualidad onda-partcula que Einstein haba proclamado para la luz
tambien haba de ser cierta para las partculas materiales, como por ejemplo, el electron: Sus
palabras fueron

En la Optica
durante siglos ha sido demasiado despreciado el metodo corpuscular de
estudio en comparacion con el ondulatorio. No se habra cometido el error inverso
en la teora sobre la materia? .

Louis de Broglie

Las orbitas del atomo de Bohr seg


un De Broglie

22

mo se gesto
la Meca
nica cua
ntica?
Captulo 2. Co

Si Einstein haba recuperado la propiedad corpuscular para la luz, De Broglie la postulo la


propiedad ondulatoria para la materia. Al enterarse Einstein de las afirmaciones y trabajos
de De Broglie afirmo: De Broglie ha levantado un extremo del gran velo. Aunque Louis no
consiguio convencer a ninguno de los fsicos del laboratorio de su hermano para que verificase
su hipotesis estos estaban enfrascados en otros muchos proyectos, como los rayos X, en 1927
C. Davisson y L. Germer5 publicaron un artculo donde explicaban el descubrimiento de una
figura de difraccion al estudiar la dispersion de electrones en un cristal de nquel que luego fue
corroborada independientemente por G.P. Thompson y por P. Tartakovsky.
La genialidad de De Broglie fue equiparar un electron a una onda plana. Por ejemplo, si
tenemos un electron de masa m y velocidad v, De Broglie postulo que el momento (impulso) p
del electron era
E
~
~2
2
p = mv =
=
=
=~ ,
v
v
vT

de esta forma De Broglie daba un significado fsico a las orbitas de Bohr: estas eran justo
aquellas orbitas tales que el cociente entre su longitud y la longitud de onda del electron era
un n
umero entero, es decir era una analoga completa a las ondas estacionarias sobre un anillo
(crculo).

2.4.2.

La Mec
anica matricial de Heisenberg

La hipotesis de De Broglie fue la clave para una de las dos formulaciones de la Mecanica
cuantica: La mecanica ondulatoria de Schrodinger. Pero antes debemos comentar la primera
version de la Mecanica cuantica, la mecanica matricial, nacida en 1925 de la mano del joven
fsico aleman Werner Heisenberg.
En opinion de Heisenberg, una teora fsica correcta ha de hacer uso
u
nica y exclusivamente de cantidades o magnitudes observables. Luego haciendo uso del principio de correspondencia de Bohr se lanzo a entender los
estados estacionarios del atomo. Su razonamiento era, aproximadamente
el siguiente: Una carga en movimiento con una determinada frecuencia
deba emitir radiacion con dicha frecuencia como en la teora clasica.
Este hecho era una consecuencia matematica del analisis de Fourier que
Heisenberg aplicaba al mundo cuantico. Como las frecuencias del espectro
dependan de dos ndices n,m (vease la formula de Balmer), Heisenberg
postulaba que deba haber tantos ndices como estados estacionarios no
solo como niveles de energa, pues se saba que las series espectrales se
Werner Heisenberg modificaban al introducir los atomos en fuertes campos magneticos. A
continuacion da un salto cualitativo al afirmar que toda magnitud fsica
clasica a(t) debe transformarse en el conjunto Anm (t). As, por ejemplo la posicion del electron
x(t) deba ser sustituida por una tabla Xnm (t). A continuacion Heisenberg razona como habra
2
de calcularse Xnm
(t) hasta obtener la formula
X
2
Xnm
(t) =
Xnk (t)Xkm (t),
k

5
Curiosamente Davisson y Germer llevaban haciendo experimentos con electrones desde 1921. En 1925 de
forma casual descubrieron al bombardear con electrones cristales de nquel un cuadro de difracci
on que probaba
la dualidad onda partcula.

nica Cua
ntica
2.4. El nacimiento de la Meca

23

es decir, las cantidades Xnm eran matrices. Finalmente, deduce, siempre razonando sobre el
principio de correspondencia de Bohr que la dinamica que rige las magnitudes cuanticas ha de
ser:

dX
i
i
(2.4.1)
= (HX XH) = [H, X], i = 1,
dt
~
~
donde H representaba la matriz del Hamiltoniano del sistema. Como H, representa el Hamiltoniano, es decir la energa, y obviamente [H, H] = 0, entonces, de (2.4.1) se tena la conservacion
de la energa. En particular Heisenberg, junto a dos colegas alemanes de Gotinga, M. Born y P.
Jordan, desarrollan toda una Mecanica matricial que se ajustaba muy bien a las observaciones
pocas, por cierto de la epoca. Aparte de sus aberrantes matrices como les llamaban los
fsicos de la epoca, especialmente Schrodinger Heisenberg descubrio, o mas bien postulo, un
principio tremendamente polemico: el principio de incertidumbre de Heisenberg. De hecho en
sus primeros razonamientos para construir la mecanica matricial Heisenberg descubre la imposibilidad de conocer al mismo tiempo y con una precision arbitraria la posicion y la velocidad
del electron.
Obviamente ese cambio radical no fue bien recibido por la mayora de los fsicos. En primer
lugar representaba un cambio drastico de pensamiento no se poda medir con presicion arbitraria al mismo tiempo ciertas cantidades como la posicion y la velocidad de una partcula
en segundo, su aparato matematico esas aberrantes matrices era lo suficientemente complicado para que no estuviera al alcance de cualquier fsico en aquella epoca. Por eso no es de
extra
nar que pronto apareciera una formulacion alternativa.

2.4.3.

La Mec
anica ondulatoria de Schr
odinger

En efecto, en 1926, Erwin Schrodinger andaba buscando una teora que acabase con esa
aberracion de las matrices que Heisenberg intentaba introducir en la fsica, cuando, a sugerencia de P. Debije, estudia el trabajo de De Broglie publicado 1924. Seg
un el mismo Schrodinger,
un simple vistazo le fue suficiente para dar con la idea: asociar a cada partcula una onda y
construir la ecuacion diferencial que gobierna dicha onda. Al principio Schrodinger intento construir una teora ondulatoria para un electron atrapado en un atomo. Comienza con un modelo
relativista pero no le sale bien y decide estudiar que ocurre en el caso no relativista.
La idea de Schrodinger era muy simple: Supongamos que tenemos una
onda (x, t) asociada a un sistema clasico cuya energa viene dada por
la funcion de Hamilton, el Hamiltoniano, H(x, p), siendo x la coordenada
y p el impulso. Entonces, despues de un largo proceso de prueba y
error, y usando el principio de correspondencia de Bohr as como distintos
elementos de la mecanica analticalas ecuaciones de Hamilton-Jacobi,
por ejemplo, Schrodinger postul
o que la ecuacion para una onda (x, t)
deba ser, en el caso estacionario, es decir cuando no hay dependencia del
tiempo,

H (x, p) (x, t) = E(x, t), p = i~ ,


x
Erwin Schrodinger donde E era la energa del sistema asociado a la onda . Es decir, en el
caso cuando tenemos un Hamiltoniano estandar,
H(x, p) =

p2
+ V (x),
2m

mo se gesto
la Meca
nica cua
ntica?
Captulo 2. Co

24

siendo V (x) la funcion potencial (energa potencial), se tiene la ecuacion de diferencial


~2 2
+ V (x)(x, t) = E(x, t).
(2.4.2)
2m x2
Una de las pruebas de fuego de su ecuacion fue el caso V (x) = 0, es decir cuando se tena el
movimiento de una partcula libre. Si consideramos el caso unidimensional, y hacemos V (x) = 0,
la solucion deba ser una onda plana del tipo
2
(x, t) = A cos(kx + t),
k=
.

Si sustituimos este valor en la ecuacion de Schrodinger tenemos el valor

~2 k 2
,
2m
que igualado con el valor de la energa cinetica recordemos que V (x) = 0 nos da
E=

2~
,

que justamente era la formula que haba postulado De Broglie.


p = ~k =

Pero su mayor exito estaba por llegar. Schrodinger decidio aplicar su ecuacion al atomo de
hidrogeno. Como en este caso el potencial era
p
e2
r = x2 + y 2 + z 2 ,
V (r) = ,
r
obtuvo la ecuacion
 2


2
2
e2
~2
+
+
(x,
y,
z)

(x, y, z) = E(x, y, z).


(2.4.3)

2m x2 y 2 z 2
r

A esta ecuacion volveremos mas adelante. Lo importante era que Schrodinger saba como tratar
este tipo de ecuaciones y la resolvio. Primero la escribio en coordenadas esfericas y luego aplico la
2
2
2
separacion de variables. La parte angular del laplaciano, := x
2 + y 2 + z 2 , en coordenadas
esfericas era muy sencilla de resolver apareciendo las funciones o armonicos esfericos de Laplace.
En particular Schrodinger obtuvo para los valores de la energa en el estado estacionario del
atomo de hidrogeno la formula
me4 1
En = 2 2 ,
2~ n
que era la misma de Bohr (2.3.1).
Finalmente Schrodinger, igual que hizo Heisenberg, dedujo una ecuacion para la dinamica
de un sistema, que en el caso unidimensional tiene la forma



(x, t) = i~ (x, t).


H x, i~
x
t
Si tenemos un Hamiltoniano estandar, esta se transforma en

~2 2

(x,
t)
+
V
(x)(x,
t)
=
i~
(x, t).
(2.4.4)
2m x2
t
En particular, de (2.4.4) se poda deducir facilmente la ecuacion (2.4.2), para los sistemas
estacionarios, introduciendo la factorizacion


iEt
(x, t) = (x) exp
.
~

n de la Meca
nica cua
ntica
2.5. La interpretacio

2.4.4.

25

Una deducci
on de la ecuaci
on de Schr
odinger

La ecuacion de Schrodinger no se puede deducir, es sencillamente un postulado impuesto,


o mejor, descubierto. No obstante, existe un razonamiento muy sencillo que permite dar con la
forma de esta ecuacion.
Supongamos que tenemos una partcula libre y le asociamos cierta onda plana
(x, t) = Aei(kxt) ,

k=

2
.

Seg
un De Broglie p = 2~/, as que k = p/~, y ademas, usando la formula de Planck = E/~,
i

(x, t) = Ae ~ (pxEt) .
Ahora hacemos,
p2
2
(x,
t)
=

(x, t),
x2
~2

por tanto p2 =

~2 2
(x, t),
(x, t) x2

pero
E=

p2
~2
2
E=
(x, t),
2m
2m(x, t) x2

~2 2
(x, t) = E(x, t).
2m x2

Si en vez de una partcula libre tenemos una ligada mediante un potencial V (x), entonces
E=

p2
+ V (x),
2m

E=

~2
2
(x, t) + V (x),
2m(x, t) x2

o, equivalentemente,
~2 2
(x, t) + V (x)(x, t) = E(x, t).
2m x2
Del razonamiento anterior en particular se deduce que al momento p de una partcula le corresponde el operador

p = i~ .
x

2.5.

La interpretaci
on de la Mec
anica cu
antica

La ecuacion de Schrodinger trajo cierta paz y tranquilidad a la Fsica Teorica pues aparentemente dejaba de lado la nfamemecanica matricial de Heisenberg as que no es de estra
nar
que la serie de trabajos que publico Schrodinger en 1926 calaron muy hondo en los fsicos de la
epoca. En particular, aparentemente se perda la cualidad discreta del modelo de Bohr al aparecer nuevamente las ondas, en este caso la onda . En problema ahora era que significado
fsico tena esta nueva funcion? El mismo Schrodinger intento darle un significado a la onda
de su ecuacion usando ciertas analogas con la mecanica de fluidos ecuacion de continuidad
para el fluido electronico, pero no tuvo exito en su intento.

mo se gesto
la Meca
nica cua
ntica?
Captulo 2. Co

26

Fue Max Born, colega y amigo de Heisenberg el mismo ayudo a


Heisenberg a construir la Mecanica matricial, quien rapidamente intuyo una interpretacion plausible. Basandose en los resultados experimentales sobre la dispersion de ondas planas recordemos que el
electron libre se consideraba como tal en la mecanica ondulatoria de
Schrodinger Born aseguro que la funcion de onda (x) daba la probabilidad de que una partcula fuese detectada en la posicion x y que
dicha probabilidad era proporcional a |(x)|2 , es decir la Mecanica ondulatoria, al igual que la matricial como se vera mas tarde, era una
teora estadstica incluso para describir una u
nica partcula.
Max Born

Este trabajo publicado en julio de 1926, apenas un mes despues del


artculo de Schrodinger sobre la ecuacion no estacionaria abrio una de
las polemicas mas grandes de la historia de la ciencia en los u
ltimos 100 a
nos: La fsica cuantica
es, por principio, no determinista. El mismo Born escribio al final de su artculo:
Aunque el problema del determinismo ha aparecido [. . . ] yo mismo me inclino a
dejar a un lado el determinismo en el mundo de los atomos. Pero esto es una
cuestion filosofica para la cual los argumentos fsicos no son concluyentes.
El problema filosofico de Born se agudizo todava mas cuando Dirac por un lado, y el
mismo Schrodinger por el otro probaban que las dos formulaciones de la Mecanica cuantica, la
matricial y la ondulatoria, eran equivalentes:
A cada funcion de la posicion y el momento [en la mecanica ondulatoria] se le
puede hacer corresponder una matriz de forma que en cada caso dichas matrices
satisfacen las reglas formales de calculo de Born y Heisenberg [. . . ]. La solucion
del problema de contorno de la ecuacion diferencial [en la mecanica ondulatoria] es
completamente equivalente a la solucion del problema algebraico de Heisenberg
escribio Schrodinger en 1926.
El problema de la interpretacion de la Mecanica Cuantica termino en una pelea abierta
entre los que la defendan y la consideraban una teora completa Bohr, Heisenberg, Born,
Pauli, etc y la que la consideraban incompleta Schrodinger, Einstein, etc. Como ejemplo de
esta polemica es representativa la carta que escribe Einstein a Born el 7 de septiembre de 1944:
Nuestras expectativas cientficas nos han conducido a cada uno a las antpodas del
otro. T
u crees en un Dios que juega a los dados, y yo en el valor u
nico de las leyes
en un universo en el que cada cosa existe objetivamente [. . . ]. El gran exito de la
teora de los quanta desde sus comienzos no puede hacerme creer en el caracter
fundamental de ese juego de dados [. . . ]. Alg
un da se descubrira cual de estas dos
actitudes instintivas es la buena.
Parte importante para entender esta polemica viene del hecho de ambas teoras, la mecanica
matricial y la ondulatoria, describan rigurosamente muchos de los fenomenos del micromundo,
pero ambas tenan un gran problema Como definir si una partcula cuantica estaba en un
estado determinado o en otro?

n de la Meca
nica cua
ntica
2.5. La interpretacio

1 , E1

27

2 , E2

= a1 1 + a2 2 , E =?
Figura 2.8: Como sabemos en que estado cuantico se encuentra una partcula?

Un sencillo ejemplo de lo que ocurre es lo siguiente. Imaginemos que definimos los estados
mediante la funcion usando la ecuacion de Schrodinger y supongamos que nuestro sistema
puede encontrarse en dos estados A y B definidos por la funcion 1 y 2 , respectivamente, y
que al primero le corresponde una energa E1 y al segundo E2 , entonces siempre tenemos que
un estado posible es el estado = a1 1 + a2 2 (pues la ecuacion de Schrodinger es lineal).
Resulta entonces que si tenemos un instrumento que nos mide la energa de nuestro sistema
este nos dara unas veces E1 y otras E2 , y justo la probabilidad de que nos de una u otra es
proporcional a |a1 |2 y |a2 |2 , respectivamente. Esta era la interpretacion probabilstica que tan
poco gustaba a Einstein.

2.5.1.

El gato de Schr
odinger

Para explicar problema descrito al final del apartado anterior (y apoyar la interpretacion
de Born), Bohr junto a otros propuso lo que hoy da se conoce como la interpretacion de
Copenhagen y que consiste en la suposicion de que al hacer la medicion la funcion de onda
colapsa y el estado queda determinado por la medicion. Por ejemplo, cuando medimos la
energa en nuestro sistema representado 2.8 la interaccion del aparato con el sistema se decanta
por una de las dos posibilidades.
Von Neumann intento dar una explicacion logica a la interpretacion de Bohr de la Mecanica
Cuantica introduciendo una teora de mediciones. Como ejemplo, supongamos que tenemos dos
posibles estados A y B de un sistema definidos por las funciones de onda 1 y 2 , respectivamente. Como saber en cual de los estados esta el sistema? Este dilema se resolva al hacer
el experimento. De la interaccion del aparato de medicion con el sistema se conclua en que
estado estaba (o mas bien, se quedaba) el sistema (ver figura 2.9)6 .
Esta teora estaba plagada de efectos curiosos. Uno de los mas famosos es el hecho de
que al medir una cantidad fsica f (a) de un sistema fsico microscopico (cuantico) A debemos
usar un instrumento que es, en s mismo otro sistema fsico M y que obviamente es clasico,
es decir, su comportamiento se puede explicar con las leyes de la fsica clasica. Pero entonces
puede ocurrir que la interaccion entre A y M, necesaria para poder saber el valor de f (a) cree
una interferencia que se transfiera al mundo macroscopico. Es decir, si tenemos un sistema en
el estado
= c1 1 + c2 2 ,
entonces, al realizar la medicion en vez de tener el sistema A + M en un estado donde
no se mezcle el estado de nuestro sistema cuantico con el estado de nuestro instrumento
6

Este efecto se denomina com


unmente el colapso de la funci
on de onda.

28

mo se gesto
la Meca
nica cua
ntica?
Captulo 2. Co
A 1

B 2

A+B = a1 1 + a2 2

A+B = a1 1 + a2 2
A

Figura 2.9: Las mediciones selectivas. Un sistema que originalmente puede estar en dos estados
A y B (izquierda), se decanta por uno de ellos al realizar la medicion (derecha). El aparato de
medicion interfiere en el sistema acabando con la incertidumbre del mismo.
clasico, tendremos una superposicion mas complicada
A+M = c1 1 1 + c2 2 2 ,
donde se han mezclado estados cuanticos y clasicos. Esto no esta de acuerdo con el principio
de correspondencia de Bohr, ya que este insista que la fsica cuantica deba estar aparte de la
clasica. Obviamente podemos pensar que para resolverlo basta con usar otro aparato M que
mida lo que mide M, pero entonces la interferencia pasa a M y as sucesivamente terminamos
en una cadena infinita. Von Neumann intento resolver esta paradoja introduciendo en la cadena
al observador humano que no se deja interferir por el sistema cuantico.

Figura 2.10: La paradoja del Gato de Schrodinger. Arriba se muestra lo que ocurre a puerda
cerrada: una dualidad gato vivo-gato muerto que solo se resuelva al abrir la caja cuando el
observador descubre o que el gato esta vivo (1), o que esta muerto (2).
Esto llevo Schrodinger en 1935 a proponer su famosa paradoja del gato (ver figura 2.10),
conocida hoy da como el Gato de Schrodinger. En ella Schrodinger usa como fenomeno cuantico
la desintegracion radioactiva. Las posibilidades son dos: tiene lugar la desintegracion del atomo
o no tiene lugar. El instrumento de medicion es un detector que activa un diabolico martillo
que, en caso de que ocurra la desintegracion, golpea un recipiente de cristal con veneno y lo
rompe. Y ahora Schrodinger mete su instrumento dentro de una caja negra sin ventanas ni
puertas, junto con . . . un pobre gato. La funcion de onda A+M representara entonces una

n de la Meca
nica cua
ntica
2.5. La interpretacio

29

superposicion de los estados gato vivogato muerto y solo un observador humano sobre el
cual no interferira el estado cuantico del atomo sera capaz de resolver esa paradoja de gato vivomuerto al mismo tiempo pues al abrir la caja se encontrara con una apacible o cruda realidad
en funcion del amor que profese a los gatos. Hemos traspasado una propiedad microscopica (la
superpocision de estados aomo desintegradono desintegrado) de la desintegracion radioactiva,
cuantica, al mundo macroscopico, clasico, lo cual esta en abierta contradiccion con el principio
de correspondencia del que ya hemos hablado. Lo que esta claro de todo lo anterior es que la
interpretacion de Copenhagen7 de la Mecanica Cuantica es algo para meditar y pensar: es una
cuestion filosofica para la cual los argumentos fsicos no son concluyentes, como dijo Born en
su ya mencionado artculo.

2.5.2.

Los universos paralelos de Everett

La interpretacion de Copenhagen de la Mecanica Cuantica implica el colapso de la funcion


de onda al interaccionar con el aparato de medicion lo que, como hemos comentado, conduce
a no pocas paradojas. Entre los muchos intentos de remediar estos problemas se propusieron
una infinidad de teoras como las famosas variables ocultas. No es el objetivo de estas notas
tratar aqu de todo ello. El lector interesado puede consultar la bibliografa clasica al respecto,
en particular [5].

Figura 2.11: Los universos paralelos de Everett. Cada decision que tomamos o medicion que
hacemos desdobla nuestro universo en dos o mas, de forma que siempre hay alguno donde ocurre
cada uno de los sucesos probables.

Por supuesto que existen otras posibles interpretaciones. Una de ellas, que ademas a dado
lugar a muchsimas novelas de ciencia ficcion (por ejemplo La llegada de los gatos cuanticos, de
Frederik Pohl) es la de los universos paralelos propuesta por Hugh Everett en 1957. La idea,
grosso modo, es la siguiente: Al hacer la medicion (o simplemente al haber mas de una opcion)
hay dos posibilidades (aqu estamos considerando de nuevo el ejemplo de dos mediciones de
la figura 2.9), entonces en el momento de la medicion no hay colapso de la funcion de onda
sino que de forma continua en el tiempo, en ese instante en universo se divide en dos, en uno
el resultado ha sido el univesro donde ha pevalecido la medicion A (como en la figura 2.9), y
en el otro, por el contrario, ha sido la medicion B la que ha prevalecido. Aunque esto parezca
una broma pesada no lo es. En [23, 3.7] hay varios ejemplos donde se muestra como esta
interpretacion es plausible y nada descabellada.
7
Hoy da no hay unanimidad en como interpretar la teora cuantica. Un magnfico libro sobre el tema es Lo
decible y lo indecible en mec
anica cu
antica de John S. Bell (Alianza Universidad, 1990).

mo se gesto
la Meca
nica cua
ntica?
Captulo 2. Co

30

2.6.

El principio de incertidumbre de Heisenberg

Uno de las consecuencias mas importantes y controvertidas de la Mecanica Cuantica fue


el principio de incertidumbre descubierto por Heisenberg descubre en 1926 (aparentemente
descubierto durante una de sus tantas visitas a Borh en Copenhagen cuando paseaba por los
bosques de las afueras de la ciudad).
Usando el formalismo ondulatorio, Heisenberg comprobo que deba existir un principio de
incertidumbre al medir ciertas cantidades fsicas como la posicion y el momento. En 1926,
Heisenberg considero una onda gaussiana normalizada del tipo
Z
(xx )2
(xx0 )2
i
1 2b20
p0 x
2
~
(x, 0) = kk e
e
,
kk =
e b2 dx,
R

es decir8

(x, 0)(x, 0)dx =


R

|(x, 0)|2 dx = 1.

Si una partcula vena descrita por dicha onda, entonces usando la idea de Born, el valor
medio para la posicion de la partcula era
Z
Z
x|(x, 0)|2 dx = x0 ,
hxi =
(x, 0)x(x, 0) =
R

y para la posicion, usando que el operador correspondiente al momento era p = i~ , tenemos


x
Z
hpi =
(x, 0)
p(x, 0) = p0 ,
R

es decir que nuestra partcula tiene un momento p0 y esta en la posicion x0 . Si ahora intentamos
determinar con que precision estamos calculando los valores de estas dos magnitudes tenemos
que calcular las varianzas x y p ,
Z
Z
b2
~2
2
p =
(x, 0)(
p p0 )2 (x, 0) = 2 ,
x =
(x, 0)(x x0 ) (x, 0) = ,
2
2b
R
R

de forma que

~2
x p = , o, equivalentemente, xp =
4

con x = x y p = p . Es decir, no podemos nunca medir con

~
,
2
una precision tan grande
~
como se quiera las dos magnitudes x y p. De hecho, resulta ser que xp , es decir,
2
Heisenberg descubrio justo la onda que minimizaba el principio que lleva su nombre.
De donde sale esta incertidumbre que no existe en la mecanica clasica?

2.6.1.

El experimento de difracci
on y el principio de incertidumbre

Consideremos el siguiente experimento imaginario. Supongamos que tenemos una pared con
un agujero en el centro de diametro d y lanzamos un electron cuya trayectoria es perpendicular
a la pared y que pasa por dicho orificio.
8

La operaci
on a denota el complejo conjugado de a.

31

2.6. El principio de incertidumbre de Heisenberg

Figura 2.12: Esquema de difraccion de rayos X y electrones (izquierda) y de luz monocromatica


(derecha)

Supongamos que el electron efectivamente se comporta como una onda monocromatica


de longitud . Entonces al pasar el electron por el agujero obtendremos la conocida figura
de difraccion9 (ver figura 2.12) formada por crculos concentricos alrededor del punto O. Nos
interesa estimar el radio del primer crculo de dicho patron.

11
00
00
11
00
11
00
11
00
11
00
11
00111
11
10000
000

10111
d 111
10111
000
000
10111
000
111
000
2 111
000
10111
000
10 d2 sen

0110
A
0000000000000000000000000
1111111111111111111111111
1010
0000000000000000000000000
1111111111111111111111111
0000000000000000000000000
1111111111111111111111111
1010
0000000000000000000000000
1111111111111111111111111
0000000000000000000000000
1111111111111111111111111
1010
0000000000000000000000000
1111111111111111111111111
0000000000000000000000000
1111111111111111111111111
1010
0000000000000000000000000
1111111111111111111111111
0000000000000000000000000
1111111111111111111111111

10
0000000000000000000000000
1111111111111111111111111
0000000000000000000000000 O
1111111111111111111111111
1010 d
1010 2
1010
1010
1010
1010

11
00
00
11
00
11
00
11
00
11
00
11

Figura 2.13: Esquema de difraccion (izquierda) y detalle del mismo (derecha)


Para ello vamos a utilizar la representacion esquematica del experimento que se puede
ver en la figura 2.13. Para describir la difraccion se suele dividir la rendija en 2N partes
iguales. Nos interesa conocer donde aparece el primer mnimo por lo que escogerenos N = 1,
i.e., dividiremos el agujero a la mitad y consideraremos los rayos que salen del centro y los
extremos, respectivamente, tal y como se representan en la figura 2.13 (cualesquiera otros dos
que escojamos nos dan un resultado similar). De la figura 2.13 se deduce que en el punto A
habra un mnimo si la diferencia del camino recorrido por ambos rayos (el que sale del extremo
superior y el del medio del agujero) es un n
umero entero m de veces la mitad de la longitud de
onda de la misma (tendran una interferencia negativa), luego
d

sen = m
2
2

d sen = m,

y por tanto el primer mnimo se obtendra cuando d sen = .


9
Vamos a asumir que tanto la fuente de electrones como el plano donde aparece la figura de difracci
on est
an
lo suficientemente alejados del agujero y de esta forma usaremos el metodo de Fraunhofer

mo se gesto
la Meca
nica cua
ntica?
Captulo 2. Co

32

El experimento de la difraccion de electrones nos permite comprobar la veracidad del principio de incertidumbre de Heisenberg. Ante todo notemos que para nuestro electron py es
cero ya que el electron se mueve en el eje de las x. Ahora bien, cuando pasa por la ranura
sabemos que se difracta, es decir que puede cambiar su trayectoria inicial ya que vemos su
grafica de dispersion. Por tanto, la indeterminacion y del electron en el momento de pasar
por el orificio es del orden y = d (pues sabemos que el electron ha pasado). Ahora bien, como
tenemos una grafica de dispersion, resulta que el electron tiene que haber ganado cierto impulso
py en la direccion perpendicular a su eje, eso nos da una cierta indeterminacion del orden py .
Para calcularla usamos la teora ondulatoria de de Broglie para el electron, py = px sen ,
px = 2~/.
Para calcular asumiremos que el electron va a
parar dentro del crculo que define el primer mnimo
en la grafica de dispersion los otros cculos los despreciamos al ser la intensidad de estos bastante mas
peque
na que la del primero tal y como se ve en la
figura de la izquierda. Ahora bien, como sabemos,
el primer mnimo tiene lugar cuando d sen = , de
donde se deduce sen = /d, y por tanto
Intensidad normalizada del cuadro de difraccion



2~
~
py y = px
y =
d = 2~ > 0.
d
d
2
El principio de incertidumbre como ya hemos dicho es un pilar de la Mecanica cuantica.
Por ejemplo, es el causante de que los electrones no caigan al n
ucleo pues en ese caso tanto p
como x valdran cero. Otra consecuencia del principio de incertidumbre es la desaparicion del
concepto clasico de trayectoria.

2.7.

Las matem
aticas de la Mec
anica Cu
antica

Las matematicas de la Mecanica Cuantica estan estrechamente ligadas al problema de la


interpretacion. La principal razon se debe a que una misma teora no puede contener dos tipos
de postulados, principios o axiomas: los clasicos y los cuanticos. Por tanto los principios de
la fsica clasica deben obtenerse de los axiomas de la Mecanica cuantica al pasar al mundo
macroscopico donde la fsica clasica es aplicable.
La construccion matematica impuso el orden en el aparente caos de la interpretacion. Los
principales axiomas o postulados de la Mecanica Cuantica se pueden resumir en los siguientes:
I. Cualquier magnitud fsica se describe a traves de un operador lineal hermtico Ab definido sobre un espacio de Hilbert H, cuyos vectores definen los posibles estados del
sistema fsico.
II. Los valores f (a ) que puede tomar una magnitud fsica son aquellos que corresponden al
espectro del operador lineal hermtico Ab que caracteriza dicha magnitud.

2.8. Sobre la bibliografa

33

III. El valor esperado de una magnitud fsica x cualquiera de un sistema en el estado , es


h|xi, donde h|i representa el producto escalar en el espacio de Hilbert.
b =
IV. La funcion de onda del sistema esta gobernada por la ecuacion de Schrodinger H

b es el operador de Hamilton del sistema.


i~
, donde H
t

Un espacio de Hilbert que denotaremos aqu por H es un espacio lineal donde esta definido
10
un producto escalar ha|bi, cualesquiera sean los vectores
pa, b H y que es completo respecto a
11
la norma kxk inducida por el producto escalar kxk = hx|xi. Los operadores lineales definidos
sobre H se pueden representar mediante matrices finitas o infinitas de forma que las matrices
de Heisenberg, Born y Jordan se pueden identificar como ciertos operadores lineales sobre H.
Ademas, las funciones de onda de Schrodinger pertenecen al espacio de Hilbert L2 , el espacio
b = hAa|bi.
b
de las funciones de cuadrado integrable. Un operador Ab se dice hermtico si ha|Abi
Una propiedad fundamental de estos operadores hermticos era que para ellos exista una base
ortonormal de autovectores y ademas los correspondientes autovalores eran reales. En especial
esta u
ltima propiedad era decisiva a la hora de identificar los operadores con las magnitudes
fsicas medibles, que son cantidades reales.

Es decir, la matematica de la Mecanica Cuantica, es la matematica de los operadores en


los espacios de Hilbert. Parte de esa teora era conocida a principios del siglo XX pero gran
parte de la misma se desarrollo en Gotinga impulsada por David Hilbert pero fundamentalmente desarrollada por John Von Neumann cuya obra quedara plasmada en el magnfico libro
Fundamentos Matematicos de la Mecanica Cuantica publicado en 1932.

2.8.

Sobre la bibliografa

Mas detalles historicos los puedes encontrar en [3, 8, 12, 15, 18, 24].
Como introduccion a nivel elemental de fsica cuantica se pueden consultar [10, 19, 25].
Textos mas avanzados lo constituyen [4, 9, 15, 17, 20, 22, 23]. Una magnfica introduccion de
lo que pretende la fsica y de su interaccion con las matematicas se tiene en [11].

10
11

Es decir que toda sucesion de Cauchy en H es convergente.


Para el que usaremos la notaci
on de Dirac: el producto escalar de x e y se denotara por hx|yi.

34

mo se gesto
la Meca
nica cua
ntica?
Captulo 2. Co

Captulo 3
Mec
anica Cu
antica I: Movimiento de
una partcula material
Vamos a comenzar describiendo el sistema cuantico mas sencillo: una u
nica partcula sometida a un potencial externo V (~r). Comenzaremos describiendo los principales postulados. Una
magnfica introduccion se puede consultar en [4].

3.1.

Los postulados de la Mec


anica Cu
antica

Postulado 3.1.1 El estado de una partcula de masa m en el instante de tiempo t viene biunvocamente determinado por la funcion de onda (~r, t). La densidad de probabilidad de encontrar
la partcula en el instante t en la region del espacio de volumen d3~r alrededor del punto ~r es
d3 P (~r) = |(~r, t)|2 d3~r.
Proceden algunos comentarios.
1. Para que el postulado 3.1.1 tenga sentido debe ocurrir que para cada t fijo
Z
|(~r, t)|2 d3~r = 1,

donde es aquella region accesible a la partcula, es decir, la region donde con certeza absoluta
puede estar la partcula (en general dicha region sera R3 ). Lo anterior indica que, para cada t,
la funcion es de cuadrado integrable y esta normalizada a la unidad. Al espacio vectorial de
las funciones de cuadrado integrable lo denotaremos por L2 () o simplemente L2 .
Mas a
un, como veremos mas adelante, ha de satisfacer una ecuacion dinamica, as que es
natural que (~r, t) sea una funcion continua y diferenciable (al menos). Luego, ha de ser tal
que (~r, t) tiende a cero si ~r en caso contrario no sera de cuadrado integrable en R3 .
Obviamente si es finito, del postulado 3.1.1 se sigue que (~r, t) = 0 en la frontera y fuera de
, ya que en caso contrario existira una probabilidad finita de que la partcula estuviese en el
exterior de lo cual sera una contradiccion.
2. Obviamente el estado de una partcula en cada instante t queda determinado a excepcion
de una fase ei , R. Es decir, las funciones de onda (~r, t) y (~r, t)ei describen el mismo
estado del sistema. De lo anterior se sigue ademas que la fase no es un observable.
35

nica Cua
ntica I: partcula material
Captulo 3. Meca

36

Una cuestion fsica de vital importante que surge inmediatamente es: Como vamos a medir
nuestros observables?
Supongamos que vamos a medir la posicion ~r de la partcula. Para ello asumimos que
1. La medicion se hace con un aparato clasico, i.e., el aparato no precisa una descripcion
cuantica (por ejemplo una regla o un metro).
2. La precision del aparato es, en principio, tan alta como se quiera.
3. El resultado de la medicion es: En el instante t la partcula estaba en la posicion ~r ~r
donde ~r es el error del aparato.
Como entender entonces la descripcion probabilstica del postulado 3.1.1?
Para ello imaginemos que tenemos N cajas identicas y N partculas identicas de forma que
en cada caja hay una u
nica partcula. Asumamos ademas que todas las partculas estan en el
mismo estado, i.e., (~r, t) es la misma para cada una de ellas en el instante de la medicion. Si
medimos las posiciones de cada partcula independientemente obtendremos los valores ~r1 , ~r2 ,
. . . , ~rN , no necesariamente iguales, que estaran distribuidos de acuerdo a la ley de probabilidad
|(~r, t)|2 d3~r. El valor esperado de r es, por tanto
Z
Z
2 3
h~ri =
~r|(~r, t)| d ~r, hxi i =
xi |(~r, t)|2 d3~r,

xi = x, y, z para i = 1, 2, 3, respectivamente. Su dispersion es


sZ
q
xi = hx2i i hxi i2 =
(xi hxi i)2 |(~r, t)|2 d3~r.

La dispersion x tiene un significado muy preciso: si x es peque


no, entonces |(~r, t)|2
esta muy concentrada alrededor de su valor medio hxi, lo que indica que la partcula se encuentra con probabilidad alta muy cerca de la posicion hxi. Por el contrario, si x, entonces
|(~r, t)|2 esta muy dispersa y la partcula tiene una probabilidad baja de estar cerca de hxi.1

Para explicar los fenomenos de interferencia y difraccion de electrones que mencionamos en


el apartado anterior se ha de introducir un segundo postulado fundamental.

Postulado 3.1.2 Para cada t el espacio de las funciones de estado es un subespacio vectorial
del espacio L2 (). Es decir, para cada t, si 1 y 2 son funciones de onda, entonces
1 , 2 C,

= 1 1 + 2 2 ,

es una posible funci


on de onda, es decir, puede representar un posible estado del sistema.2
1

Un ejemplo muy ilustrativo es el siguiente. Supongamos que (~r, t) = [a,b] (x)/(b a), donde [a,b] (x) es la
funci
on caracterstica del intervalo [a, b], i.e., vale 1 si x [a, b] y 0 en otro caso. Entonces, hxi = a+b
2 y x =
(b a)2 /12. Como vemos si a y b est
an cercanos entonces la dispersi
on es peque
na y tenemos que la partcula
est
a muy cerca de la posicion media. Por el contrario si a y b difieren mucho la partcula est
a equiprobablemente
dispersa en el intervalo [a, b] (muy grande). Este ejemplo se lo debo a de Francisco J. (Pacho) Ruiz Blasco de la
Universidad de Zaragoza.
2
N
otese que si 1 = 2 = 0, se tiene 0, es decir la partcula no est
a en ning
un sitio. Aunque formalmente
esta es una posibilidad en la practica se asume que 6= 0 en todo ( es la region donde podra estar la
partcula, luego en alg
un punto de la funci
on ha de ser distinta de cero). Si 1 y 2 est
an normalizadas a
la unidad, entonces para que lo este basta que |1 |2 + |2 |2 = 1.

nica Cua
ntica
3.1. Los postulados de la Meca

37

Lo anterior indica que, para cada t, cualquier combinacion lineal de funciones es una (posible)
funcion de onda. Ello implica ademas que la ecuacion de evolucion que gobierne o determine
las funciones de onda ha de ser lineal.
Postulado 3.1.3 (Ecuaci
on din
amica) La funcion de onda viene determinada por la ecuacion de Schrodinger
(~r, t)
~2
i~
=
(~r, t) + V (~r, t)(~r, t),
(3.1.1)
t
2m
donde es el laplaciano3 en R3 , y V es el potencial al que esta sometida la partcula.
La ecuacion anterior se suele escribir de la forma
i~

(~r, t)
b r , t),
= H(~
t

(3.1.2)

b es el operador correspondiente al hamiltoniano del sistema. En nuestro caso esta claro


donde H
que es
2
b := ~ + V (~r, t)I.
b
H
2m
Antes de continuar debemos destacar que aqu solo trataremos el caso cuando el potencial V
es independiente del tiempo.
Nuevamente proceden una serie de comentarios.
En primer lugar si V := 0 (partcula libre) una solucion de la ecuacion viene dada mediante
una onda viajera
~

(~r, t) = 0 ei(k~rt) ,
donde ~k es el vector de onda. Sustituyendo dicha onda en (3.1.1) y usando que la energa de
una onda es, seg
un ya vimos, E = ~, obtenemos
~ =

~2 k 2
2m

E=

~2 k 2
,
2m

de donde, al no haber (energa) potencial E = T = p2 /2m, por tanto se sigue que p = ~k, que
es precisamente la formula de De Broglie para expresar la dualidad onda-partcula. Es decir, la
ecuacion de Schrodinger tiene como solucion posible la onda de materia de De Broglie.
Un simple vistazo a la expresion para la onda de De Broglie nos revela un problema:
esta funcion no es de cuadrado integrable y por tanto no puede describir de acuerdo con el
postulado 3.1.1 ning
un estado real de una partcula. Para resolver esta aparente contradiccion
se introducen los paquetes de ondas.
Formalmente un paquete de ondas es un conjunto de ondas planas monocromaticas superpuestas. Usando que p = ~k y E = ~ tenemos, para cada onda la ecuacion
i

p (~r, t) = (~p)e ~ (~p~rEt) ,


3

En coordenadas cartesianas es =

2
2
2
+
+
.
x2
y 2
z 2

nica Cua
ntica I: partcula material
Captulo 3. Meca

38

luego la superposicion de todas sera


Z
i
(~r, t) =
(~p)e ~ (~p~rEt)
R3

d3 ~p
=
(2~)3/2

R3

e p, t)e ~i p~~r
(~

d3 p~
,
(2~)3/2

(3.1.3)

e es la transformada de Fourier de . Ademas, para que


e p, t) = (~p)e ~i Et . Es decir,
donde (~
lo anterior tenga sentido ha de ser tal que sea de cuadrado integrable. Lo anterior implica
e p, t) son funciones de cuadrado integrable para todo t.
que ambas (~r, t) y (~
e p, t) como transformada de Fourier una de la otra tiene una
La relacion de (~r, t) y (~
implicacion interesante:
Z
i
d3~r
e
(~p, t) =
(~r, t)e ~ p~~r
,
(2~)3/2
R3
y
Z
Z
2 3
e p, t)|2 d3 p~.
|(~r, t)| d ~r =
|(~
R3

R3

e p, t) valdran para describir el estado de nuestro


Es decir, en principio tanto (~r, t) como (~
sistema.

Ademas, de la teora de las transformadas de Fourier tenemos que, si definimos la media y


varianza de las componentes del vector de impulso (pi = px , py , pz para i = 1, 2, 3, respectivamente)
Z
q
2 3
e
hpi i =
pi |(~p, t)| d ~p, pi = hp2 i hpi i2 ,
(3.1.4)
R3

entonces xi pi ~/2, y la igualdad solo tiene lugar cuando (~r, t) es proporcional a una
gaussiana en ~r, es decir el principio de incertidumbre de Heisenberg.

Para nuestro caso de la partcula libre ello implica que si (~r, t) esta muy dispersa en el
espacio, entonces el valor del impulso ~p esta muy concentrado y si (~r, t) esta muy dispersa
entonces p~ esta muy disperso.
En la figura 3.1 se muestra lo que ocurre para el caso unidimensional cuando tomamos en
(3.1.3)
(pp0 )2
1

2(~)2
(p) =
1 e
~ 4
para los valores ~ = p0 /2 (p disperso, figura superior) y ~ = p0 /10 (p concentrado, figura
inferior).
Antes de continuar debemos destacar la media y la varianza definidas en (3.1.4) no tienen
por que corresponder con la media y varianza del impulso real p~ de nuestra partcula. Para
poder hablar de la cantidad observable p~ necesitaremos introducir otro postulado, pero antes
de ello vamos a probar que los postulados hasta ahora introducidos son consistentes.
Test de consistencia
Un test de consistencia de la teora hasta ahora descrita consiste en probar que la norma de (~r, t) es independiente del tiempo (en otro caso no podra definir una densidad de
probabilidad). Para ello escribimos la ecuacion de Schrodinger (3.1.1) para
i~

~2
(~r, t)
=
(~r, t) + V (~r, t)(~r, t)
t
2m

nica Cua
ntica
3.1. Los postulados de la Meca
e t)|
|(p,

|(x, t)|

-20

39

0.5

0.5

0.4

0.4

0.3

0.3

0.2

0.2

0.1

0.1

-10

10

20

-2

-1

e t)|
|(p,

|(x, t)|
0.05

0.04

1.5
0.03
1

0.02

0.5

0.01
-20

-10

10

20

-2

-1

e t) (~ = 1)
Figura 3.1: Distribucion de (x, t) y (p,

y su complejo conjugado4 . (se entiende que V es un potencial real)


i~

(~r, t)
~2
=
(~r, t) + V (~r, t)(~r, t),
t
2m

multiplicamos la primera por , la segunda por , las restamos y tomamos la integral en toda
la region (ver postulado 3.1.1)
Z

i~
|(~r, t)|2 d3~r =
t
!
Z
(~r, t)
(~r, t)
d3~r
+ (~r, t)
= i~
(~r, t)
t
t



Z
~2
=
(~r, t)(~r, t) (~r, t)(~r, t) d3~r.
2m

Si ahora en la u
ltima de las integrales usamos la formula de Green obtenemos
Z 

~2

(~r, t)(~r, t) (~r, t)(~r, t) d3~r


2m
!
Z
~2
(~r, t)
(~r, t)
=
dS,
(~r, t)
(~r, t)
2m
~n
~n
r)
donde dS es el elemento de area de la superficie y f~(~
denota la derivada direccional de f
n
en la direccion del vector normal al elemento de superficie dS.5 Si ahora hacemos ~r la
4
5

umero complejo z
Como antes denotaremos por z al complejo conjugado del n
En una dimensi
on vale simplemente la integraci
on por partes.

nica Cua
ntica I: partcula material
Captulo 3. Meca

40

u
ltima integral se anula pues (~r, t) (y por consiguiente (~r, t)) se anulan cuando ~r (ver
comentario 1 del postulado 3.1.1). Luego
Z

|(~r, t)|2 d3~r = 0.


t
Esto tiene una implicacion fsica inmediata: Dado un estado inicial (~r, t0 ) L2 (), este
evoluciona seg
un la ecuacion de Schrodinger, i.e., en cada momento de tiempo viene descrito
por la funcion (~r, t) solucion de (3.1.1) y ademas,
Z
Z
2 3
|(~r, t)| d ~r =
|(~r, t0 )|2 d3~r = 1,

es decir, (~r, t) es normalizada a la unidad. Luego la ecuacion de Schrodinger es consistente


con los postulados 3.1.1 y 3.1.2.
Vamos ahora a intentar convencernos de que para los momentos p~ se tienen las formulas
(3.1.4). Para ello, como ya comentamos, necesitamos varios postulados que complementen a los
anteriores.
Postulado 3.1.4 A cualquier cantidad fsica medible A le asociaremos un operador hermtico
Ab que act
ua sobre el espacio de las funciones de cuadrado integrable L2 () a las que pertenecen
las funciones de estado (~r, t). i.e., Ab : L2 () L2 (). Ademas, dado un estado definido por
una funcion de onda (~r, t) que define cierto estado del sistema, el valor medio de las medidas
de A viene dado por6
Z


b r, t) d3~r
(~r, t) A(~
hAi(t) =

Un operador Ab : L2 () L2 () es hermtico7 si
Z
Z 



3
b
b 1 (~r, t) 2 (~r, t)d3~r.
1 (~r, t) A2 (~r, t) d ~r =
A

Notese que si Ab es hermtico entonces


Z

Z 



3
b
b r , t) (~r, t)d3~r
(~r, t) A(~r, t) d ~r =
A(~

Z 

b
=
A(~r, t) (~r, t)d3~r,

i.e., hAi(t) R.

Vamos a definir el operador r por

b
~r := ~rI,

(3.1.5)

6
Aunque el valor hAi(t) depende de la funci
on de onda , no lo vamos a reflejar en la notacion para hacer
esta lo menos engorrosa posible.
7
Sobre estos operadores hablaremos con mas detalle en el proximo apartado dedicado a la Mecanica cuantica
en espacios de Hilbert.

nica Cua
ntica
3.1. Los postulados de la Meca

41

donde Ib es el operador identidad. Entonces


Z
Z
3
h~ri(t) =
(~r, t)~r (~r, t)d ~r =
~r|(~r, t)|2 d3~r,

que esta en concordancia con el postulado 3.1.1.


Definiremos el operador impulso p~ por la expresion
p~ := i~,

(3.1.6)

donde denota al operador gradiente8 de R3 .

Es facil comprobar que ambos operadores son hermticos.


Otros operadores importantes son

~2
, donde es, como antes, el laplaciano en R3 .
1. El operador energa cinetica Tb := 2m

b
2. El operador energa potencial Vb (~r) := V (~r)I.

b := Tb + Vb (~r). Este ademas constituye el operador de Hamilton


3. El operador energa total E
o hamiltoniano del sistema.

4. El operador momento angular Lb = b


~r b
~p := i~ rot, donde rot denota el vector rotor en
3
R.
Postulado 3.1.5 El resultado de cualquier medicion de una cantidad fsica medible A debe ser
un autovalor del operador asociado Ab y el estado correspondiente a dicha medicion estar
a definido por su correspondiente autofuncion.
Es decir, tenemos la ecuacion
b r , t) = a(~r, t).
A(~

Entonces, por el postulado 3.1.4,


Z
Z


3
b r, t) d ~r = a |(~r, t)|2 d3~r = a,
(~r, t) A(~
hAi =

que, como ya hemos visto, es real9 Ademas,


Z


2
b A(~
b r, t)) d3~r = a2
hA i =
(~r, t) A(

q
A2 := hA2 i hAi2 = 0, es decir, el resultado de la medicion, en caso de que el sistema
se encuentre en el estado a (~r, t) correspondiente al autovalor a, es exacto. Este resultado lo
discutiremos con mas detalle en el marco de los espacios de Hilbert.
f (~r)~ f (~r)~ f (~r) ~
k.
i+
j+
x
y
z
9
b como veremos mas adelante.
Esta propiedad es en realidad una consecuencia de la hermiticidad de A,
8

En coordenadas cartesianas es el operador f (~r) =

nica Cua
ntica I: partcula material
Captulo 3. Meca

42

3.2.

El principio de incertidumbre

Notese que los operadores ~r y p~ cumplen con las siguientes relaciones:


b
[b
xi , x
bj ] = 0 = [b
pi , pbj ], [b
xi , pbj ] = i~i,j I,

b B]
b es el conmutador de los operadores Ab y Bb definido por [A, B] = AB BA.
donde [A,

Lo curioso es que a partir de esta relacion de conmutacion se puede probar que si definimos
las varianzas de x
bi y pbi mediante las expresiones (acordes con los postulados descritos), i.e.,
q
q
2
b
b 2 i,
xi = h(b
xi hxi iI) i, pi = h(b
pi hpi iI)

entonces

~
,
2
es decir, obtenemos el principio de incertidumbre de Heisenberg que ya vimos antes.
xi pi

Demostremos la formula anterior. Por simplicidad escogeremos el caso unidimensional (o


equivalentemente nos restringiremos a probar el principio para las componentes en el eje x, por
ejemplo).
Definamos los operadores
b
b
x := x
b hxiIb y b
p := pb hpiI.

Dichos operadores cumplen con la propiedad

b
[b
x, b
p] = [b
x, pb] = i~I.
p
Obviamente x = h(b
x)2 i y p = h(b
p)2 i, ahora bien, por la desigualdad de CauchySchwarz
sZ
sZ
Z



|b
p(x)|2 dx b
x(x) b
p(x)dx
|b
x(x)|2 dx
p

Z

Z



b

x(x) b
p(x)dx
b
x(x) b
p(x)dx = Ixp ,

i.e.,

xi pi Ixp .

Pero
Ixp

Luego

Z

Z
1
(b
=
x(x))(b
p(x))dx (b
x(x))(b
p(x))dx
2i

Z

Z
1
(b
x(x))(b
p(x))dx (b
x(x))(b
p(x))dx
=
2i

Z

Z
1
=
((x))(b
xb
p(x))dx ((x))(b
pb
x(x))dx
2i

Z
Z
1
~
1
b
((x))([b
((x))(i~I(x))dx
x, b
p](x))dx =
= .
=
2i
2i
2
x p

que es justo lo que queramos probar.

~
,
2

43

3.3. Ejemplos

3.2.1.

Los estados estacionarios de la ecuaci


on de Schr
odinger

Supongamos que V no depende del tiempo. Entonces si hacemos el cambio


i

(~r, t) = (~r)e ~ E t

(3.2.1)

lo sustituimos en (3.1.2) obtenemos la ecuacion


b (~r) = E (~r).
H

(3.2.2)

b correspondientes a los autovalores E , que por el


Es decir, son las autofunciones de H
postulado 3.1.5 corresponden a los posibles valores de energa del sistema.

Notese que los estados definidos por (3.2.1) son estados con una energa constante (conservada) en el tiempo, ademas, la funcion (~r, t) es periodica en el tiempo con una frecuencia
= E /~. Los estados con estas caractersticas se denominan estados estacionarios.
Los estados estacionarios cumplen dos propiedades muy importantes (que los hacen de
especial relevancia):
1. La densidad de probabilidad es independiente del tiempo: |(~r, t)|2 = | (~r)|2 .
2. Si cierto observable A no depende el tiempo, entonces su media
Z
Z




3
b
b
hAi =
(~r, t) A(~r, t) d ~r =
(~r) A (~r) d3~r,

tampoco depende del tiempo.

Es decir, los estados estacionarios tienen la energa prefijada y ademas no evolucionan en el


tiempo. Lo anterior es muy u
til para resolver la ecuacion de Schrodinger general.
Supongamos que
(~r, t = 0) =

c (~r),

(3.2.3)

entonces, la funcion de onda (estado) se escribe como


(~r, t) =

c e ~ Et (~r).

La pregunta de cuando el desarrollo (3.2.3) tiene lugar y como calcular los coeficientes c lo
vamos a dejar para mas adelante. En realidad lo que tiene que ocurrir es que las autofunciones
b constituyan un conjunto completo (y a ser posible ortonormal) de L2 ().
del hamiltoniano H

3.3.

Ejemplos

Vamos a estudiar dos ejemplos representativos unidimensionales.

nica Cua
ntica I: partcula material
Captulo 3. Meca

44

V (x)

U0

Figura 3.2: Pozo potencial.

3.3.1.

Una partcula en un pozo de potencial

Sea una partcula que se encuentra en un pozo potencial como el que se muestra en la figura
3.2.
La solucion de la ecuacion de Schrodinger estacionaria
2

~
(x) + V (x)(x) = E(x),
2m x2

U0 , x < 0,
0, 0 < x < L,
V (x) =

U0 , x > L,

para E < U0 la buscamos de la forma

1 (x) = A1 ekx + A2 ekx , x < 0,


2 (x) = B1 eiqx + B2 eiqx , 0 < x < L,
(x) =

3 (x) = C1 ekx + C2 ekx , x > L,


donde k =

1
~

2m(U0 E), q =

1
~

2mE.

Como ha de ser de cuadrado integrable, entonces A2 = C2 = 0.


Ademas, y han de ser continuas en R as que tenemos las siguientes condiciones
1 (0) = 2 (0),

1 (0) = 2 (0),

2 (L) = 3 (L),

2 (L) = 3 (L),

que nos conducen al sistema

A1 = B1 + B2 ,
kA1 = iq(B1 B2 ),

B1 eiqL + B2 eiqL = C1 ekL ,

iq(B1 eiqL B2 eiqL ) = kC1 ekL .

De las dos primeras ecuaciones eliminamos A1 y de las dos segundas C1 , as


(k iq)B1 + (k + iq)B2 = 0,

(k + iq)eiqL B1 + (k iq)eiqL B2 = 0.

45

3.3. Ejemplos
Para que este sistema homogeneo tenga solucion su determinante ha de anularse


k iq
k + iq
det
(k + iq)eiqL (k iq)eiqL

Como



k iq


k + iq = 1,
cos =



=0

k iq
k + iq

ei =

k2 q2
,
k2 + q2

2iqL

sen =

k iq
k + iq

2

(3.3.1)

=
2kq
.
+ q2

k2

Combinando lo anterior con (3.3.1) se tiene = qL, de donde se sigue que los valores de energa
E permitidos corresponden a la solucion de la ecuacion trascendental
cos qL =

k2 q2
k2 + q2

sen qL =

2kq
,
+ q2

k2

o, equivalentemente,
tan qL =
Sea x =

E/U0 y =

2kq
.
q2

(3.3.2)

k2

2mU0 L/~, entonces la ecuacion anterior se escribe como


tan x = 2

x(1 x)
.
1 2x

(3.3.3)

Es facil comprobar que para todo esta ecuacion tiene al menos una raz real en (0, 1) por lo
que nuestro sistema tiene al menos un estado estacionario. A medida que es mas grande el
n
umero de estados aumenta (vease la figura 3.3).
6
6
3
3
6
9

6
6
3
0,2

0,4

0,6

0,8

3
6
9

0,2

0,4

0,6

0,8

Figura 3.3: Soluciones de la ecuacion (3.3.3) para = 1 (derecha) y = 10 (izquierda).


Notese que si tomamos el lmite U0 en (3.3.2) obtenemos los valores de energa
E=

~2 2 n2
,
2mL2

que coinciden con los valores de energa para un pozo infinito (ver problema 3.3.1).

(3.3.4)

nica Cua
ntica I: partcula material
Captulo 3. Meca

46

V (x)

U0

Figura 3.4: Pozo potencial.

3.3.2.

El efecto t
unel

Consideremos ahora el movimiento de una partcula en un potencial del tipo de la figura


3.4
La solucion de la ecuacion de Schrodinger estacionaria
2

~
(x) + V (x)(x) = E(x),
2m x2

0, x < 0,
U0 , 0 < x < L,
V (x) =

0, x > L.

(3.3.5)

Vamos a comenzar considerando el caso E > U0 . La solucion tiene la forma

1 (x) = A1 eikx + A2 eikx , x < 0,


2 (x) = B1 eiqx + B2 eiqx , 0 < x < L,
(x) =

3 (x) = C1 eikx + C2 eikx , x > L,


donde q =

1
~

2m(E U0 ) y k = ~1 2mE.

Ante todo notemos que esta solucion es de tipo onda viajera, similar a la de una partcula
libre, por lo que no es de cuadrado integrable y por tanto no puede describir ning
un estado
real (vease la discusion del postulado 3.1.3) por lo que habra que definir los correspondientes
paquetes de ondas. No obstante podemos considerar nuestra partcula como una onda descrita
por la ecuacion (3.3.5) y determinar su comportamiento en funcion de las amplitudes A1 , . . . ,
C2 de las mismas. Ante todo notemos que si es una solucion correspondiente a la energa E,
tambien lo es. Dado un valor de energa podemos considerar dos tipos de soluciones: una +
cuando C2 = 0 (la onda incidente va de izquierda a derecha) y la otra cuando A1 = 0 (la
onda incidente va de derecha a izquierda). La solucion general sera una combinacion lineal de
ambas. As pues nos centraremos en la solucion10

x < 0,
1 (x) = eikx + Aeikx ,
iqx
iqx
2 (x) = B1 e + B2 e
, 0 < x < L,
+ (x) =

3 (x) = Ceikx ,
x > L.
10

Por la linealidad podemos tomar sin perdida de generalidad A1 = 1.

47

3.3. Ejemplos

Los valores R(E) = |A|2 y T (E) = |C|2 definen los coeficientes de reflexion y transporte (o
paso) de la onda. Usando la continuidad de y obtenemos las siguientes condiciones
1 (0) = 2 (0),

1 (0) = 2 (0),

2 (L) = 3 (L),

2 (L) = 3 (L),

que nos conducen al sistema

1 + A = B1 + B2 ,
k(1 A) = q(B1 B2 ),

(3.3.6)

B1 eiqL + B2 eiqL = C1 eikL ,

q(B1 eiqL B2 eiqL ) = kC1 eikL .

Multiplicando por k la tercera y sumandole y restandole la cuarta se obtienen, respectivamente,


las ecuaciones
(k + q)eiL(kq)
(q k)eiL(k+q)
B1 =
C, B2 =
C.
2q
2q
Multiplicando por k la primera ecuacion de (3.3.6) y sumandole y restandole la segunda obtenemos
(k + q)B1 + (k q)B2 = 2k, (k q)B1 + (k + q)B2 = 2kA.
Si sustituimos en la primera de estas ecuaciones los valores de B1 y B2 anteriores obtenemos
para C el valor
C=

4kqeikL
4kqeikL
=
.
(k + q)2 eiqL (k q)2 eiqL
(k 2 + q 2 ) sen(qL) + 2kqi cos(qL)

(3.3.7)

Resolviendo respecto a A obtenemos


(k 2 q 2 ) sen(qL)
.
A= 2
(k + q 2 ) sen(qL) + 2kqi cos(qL)

(3.3.8)

De lo anterior se deduce que


T (E) =

4k 2 q 2
=
(k 2 + q 2 )2 sen2 (qL) + 4k 2 q 2 cos2 (qL)

1+

1
(k 2 q 2 ) sen(qL)
2kq

2 ,

y R(E) = 1 T (E).

De la expresion anterior se deduce que T (E) 0. Ademas, si sen(qL) = 0, entonces T (E) =


1 y R(E) = 0, es decir, la partcula pasa como si no existiese la barrera:
p la barrera es transpa1
rente. Esto ocurre para los valores de qL = n, por tanto como q = ~ 2m(E U0 ) =
E = U0 +

~2 2 n2
.
2mL2

Supongamos ahora que E < U0 . Para obtener el resultado basta hacer el cambio q i.
As, obtenemos
1
T (E) =
2 ,
 2
(k + 2 ) senh(L)
1+
2k

nica Cua
ntica I: partcula material
Captulo 3. Meca

48

Notese que T (E) 0, es decir, la partcula siempre traspasa la barrera!

Este efecto, imposible en la mecanica clasica, se conoce como efecto t


unel. Su gran importancia quedo reflejada en el hecho de que en 1973 L. Esaki, I. Giaever y B.D. Josephson
recibieron el premio nobel de fsica por sus descubrimientos relacionados con este efecto y mas
trade en 1986 G. Binnig y H. Rohrer por su dise
no de un microscopio electronico basado en el
efecto t
unel.
Para terminar este apartado notemos que, para E < U0 , en el lmite L 1
T (E)

16k 2 q 2 L
e ,
(k 2 + q 2 )2

es decir, el coeficiente
de transporte decae exponencialmente a cero con L. Este lmite corresp
ponde al caso 2m(U0 E)/~ 1, i.e.,
1. m ~2 /(2(U0 E)L2 ), masas muy grandes (lmite de la mecanica clasica),

2. L2 ~2 /(2(U0 E)m), barrera muy ancha,


3. U0 E ~2 /(2mL2 ), barrera muy alta.

3.3.3.

Problemas

Problema 3.3.1 Encuentra los autoestados de


un pozo potencial infinito

,
0,
V (x) =

la ecuacion de Schrodinger estacionaria para


x < 0,
0 < x < L,
x > L,

y compara el resultado con los valores obtenidos en (3.3.4).


Problema 3.3.2 Resuelve la ecuacion de Schrodinger estacionaria para el potencial escalon

0, x < 0,
V (x) =
U0 , x > L.
Compara el resultado con el del caso de la barrera potencial de anchura infinita.

Captulo 4
Mec
anica Cu
antica II: Espacios de
Hilbert
En este captulo desarrollaremos la Mecanica Cuantica sobre un espacio de Hilbert general. Aunque el captulo es autocontenido, es recomendable consultar el Anexo A donde se da
una breve introduccion a la teora de espacios funcionales (metricos y normados), as como se
desarrolla con mas detalles las propiedades de los espacios de Hilbert separables.

4.1.

Espacios eucldeos y espacios normados

Comenzaremos este apartado recordando algunas definiciones generales.


En adelante asumiremos que E es un espacio vectorial complejo1 .
Definici
on 4.1.1 Se dice que un espacio vectorial E es un espacio eucldeo si dados dos elementos cualesquiera x, y E existe un n
umero denominado producto escalar y que denotaremos
por hx, yi tal que
1. Para todo x, y E, hx, yi = hy, xi.
2. Para todo x, y, z E, hx, y + zi = hx, yi + hx, zi.
3. Para todo x, y E y C, hx, yi = hx, yi
4. Para todo x E, x 6= 0, hx, xi > 0 y si hx, xi = 0, entonces x = 0.
Una consecuencia de la definicion anterior es que
1. Para todos x, y, z E, hx + y, zi = hx, zi + hy, zi.
2. Para todos x, y E y C, hx, yi = hx, yi
1

En adelante denotaremos por z al complejo conjugado del n


umero complejo z

49

nica Cua
ntica II: Espacios de Hilbert
Captulo 4. Meca

50

El ejemplo mas sencillo de espacio eucldeo es el espacio Cn con el producto escalar estandar.
Otro ejemplo sencillo es el espacio C[a, b] de las funciones continuas en [a, b] cerrado y acotado
con el siguiente producto escalar
Z b
hf, gi =
f (x)g(x)dx.
(4.1.1)
a

Una propiedad importante de los espacios eucldeos es la desigualdad de Cauchy-Schwarz


|hf, gi|2 hf, f ihg, gi.

(4.1.2)

Para demostrarla basta usar que para todo C y f, g E, hf + g, f + gi 0, o equivalentemente,


||2 hf, f i + hf, gi + hg, f i + hg, gi = ||2 hf, f i + 2(hf, gi) + hg, gi 0.
Escojamos = hf, gi/|hg, f i|, R. Entonces, como
0 ||2hf, f i + 2(hf, gi) + hg, gi = ||2 hf, f i + 2|||hf, gi| + hg, gi,
el discriminante de la ecuacion cuadratica en , ||2 hf, f i + 2|||hf, gi| + hg, gi = 0, ha de ser
negativo, luego se tiene |hf, gi|2 hf, f ihg, gi 0, de donde se sigue (4.1.2).
Definici
on 4.1.2 Un espacio vectorial X se denomina espacio normado si para todo x X
existe un n
umero real denominado norma, que denotaremos por kxk, que cumple con las condiciones
1. Para todo x X, kxk 0 y si kxk = 0 entonces x = 0.
2. Para todo x X y C, kxk = ||kxk.
3. Para todo x, y X se tiene la desigualdad triangular
kx + yk kxk + kyk.

(4.1.3)

Teorema 4.1.3pTodo espacio eucldeo E es normado si en el definimos la norma mediante la


f
ormula kxk = hf, f i. Ademas, kf k kgk |hf, gi|.

La demostracion se deja como ejercicio.2 Por ejemplo, en el espacio C[a, b] podemos definir la
norma por
s
Z b
|f (x)|2 dx.
kf k =
a

Definici
on 4.1.4 Un espacio eucldeo E completo3 respecto a la norma inducida por un producto escalar se denomina espacio de Hilbert y lo denotaremos por H.
p
p
Es suficiente ver que kf + gk2 = hf + g, f + gi = hf, f i + 2hf, gi + hg, gi hf, f i + 2 hf, f i hg, gi + hg, gi
= (hf, f i + hg, gi)2 = (kf k + kgk)2 . El resto de los axiomas es inmediato.
3
Un espacio E es completo si cualquier sucesion de Cauchy en E converge a un vector de E.
2

4.1. Espacios eucldeos y espacios normados

51

En adelante nos interesaran los espacios de Hilbert H separables, es decir, aquellos espacios
de Hilbert que contienen un subconjunto numerable denso.
Definici
on 4.1.5 Sea el sistema de vectores {n }
n=1 de H linealmente independiente es decir, que cualquier subsistema finito es linealmente independiente. Diremos que {n }
n=1 es un
sistema ortogonal dos a dos si
hn , m i = n,m kn k2 ,

n, m N.

(4.1.4)

Si ademas kn k = 1 para todo n diremos que el sistema es ortonormal.


Por ejemplo, el sistema de funciones {1} {sen nx, cos nx}
n=1 es un sistema ortogonal dos a
dos respecto al producto escalar
Z
hf, gi =
f (x)g(x)dx.

Definici
on 4.1.6 Dado un vector x
definiremos la serie de Fourier respecto al sistema
PH

ortonormal {n }
a
la
serie
s
:=
n=1
n=1 cn n , donde los coeficientes vienen dados por las
expresiones cn = hx, n i, para todo n 1.
Definici
on 4.1.7 Dada f H y una sucesion sn , se dice que sn converge en norma a f si
lm kf sn k = 0.

Es facil ver que si los vectores (no nulos) 1 , . . . , n de un espacio eucldeo son ortogonales,
entonces son linealmente independientes.
Teorema 4.1.8 En un espacio de Hilbert H de cualquier conjunto de vectores linealmente
independiente se puede construir un conjunto de vectores ortogonales (ortonormales).
Demostracion: Para probar el teorema tomamos un sistema de vectores linealmente independiente (n )n de H cualquiera y definimos un nuevo sistema de vectores (n )
n=1 de la siguiente
forma:
1. Tomamos 1 = 1 /k1 k.

2. A continuacion escogemos 2 de la forma


2 = 2 + 2,1 1 ,
donde 2,1 es tal que 2 sea ortogonal al vector 1 , i.e. h1 , 2 i = 0, de donde se deduce que
2,1 = h1 , 2i. Entonces 2 = 2 /k2 k es ortonormal a 1 .
3. Paso n. Escogemos k , k 3, de la forma
n = n +

n1
X
k=1

n,k k ,

nica Cua
ntica II: Espacios de Hilbert
Captulo 4. Meca

52

donde los coeficientes n,k , n N, k = 1, . . . , n 1 son tales que n sea ortogonal a todos
los vectores k , k = 1, 2, . . . , n 1, anteriores. Usando la ortogonalidad es facil comprobar que
n,k = hk , n i, k = 1, 2, . . . , n 1. Finalmente definimos n = n /kn k que es ortonormal a
todos los vectores anteriores k , k = 1, 2, . . . , n 1. Y as sucesivamente.

El proceso anterior se denomina proceso de ortogonalizacion de Gram-Schmidt.


Notese que del proceso anterior se sigue ademas que, para cada n 1,
n = n +

n1
X

n,k k = n = n +

hk , n i = 0,

k = 0, 1, . . . n 1

Usando lo anterior es facil ver que



h1 , 1 i

h2 , 1 i

n =
..

.

hn , 1 i

n,k k .

k=1

k=1

Luego,

n1
X

hk , n i = 0,

k = 0, 1, . . . n 1.

n admite la siguiente expresion explcita:



h1 , 2 i h1 , n1i 1
h2 , 2 i h2 , n1i 2
..
..
.. .
..
.
.
.
.
hn , 2 i hn , n1i n

(4.1.5)

Para ello basta notar que el producto escalar hk , n i = 0, k = 1, 2, . . . , n 1, ya que el


determinante resultante tiene dos columnas iguales. Notese ademas que
hn , n i = n ,
donde n son los determinantes de Gram

h1 , 1 i h1 , 2 i

h2 , 1 i h2 , 2 i

n =
..
..

.
.

hn , 1 i hn , 2 i

..
.

h1 , n1i h1 , n i
h2 , n1i h2 , n i
..
..
.
.
hn , n1i hn , n i

De lo anterior deducimos tambien que los n son un conjunto linealmente independiente de H


si y solo si los n 6= 0 (en nuestro caso n > 0), para todo n N.
Notese que los subespacios generados por los vectores (n )n y (n )n coinciden.
Teorema 4.1.9 Si el espacio eucldeo E es separable, entonces cualquier sistema ortogonal
(ortonormal) de E es numerable.

Demostracion: Asumamos
sin perdida de generalidad que el sistema (n )n es ortonormal. En
tonces kn m k = 2 si n 6= m. Sea el conjunto de las bolas de radio 1/2 y centro en cada
n , B(n , 1/2). Estas bolas no se interceptan, luego en casa bola hay un u
nico vector n de
nuestro sistema ortonormal. Sea ahora (k )k un conjunto numerable denso en E (pues este es
separable). Entonces, en cada bola B(n , 1/2) habra al menos un k , luego el n
umero de bolas
y por tanto de elementos n es numerable.

53

4.2. Operadores en H

4.2.

Operadores en H

Definici
on 4.2.1 Un operador Lb es una aplicacion de H en H1 , dos espacios de Hilbert, Lb :
H 7 H1 .

Definici
on 4.2.2 El operador b
0 se denomina operador nulo si H, b
0 = 0. El operador
b
b = .
I se denomina operador identidad si H, I
En adelante asumiremos que H1 H.

Definici
on 4.2.3 Un operador Lb es lineal si 1 , 2 C, y 1 , 2 H,
b 1 1 + 2 2 ) = 1 L
b 1 + 2 L
b 2.
L(

Definici
on 4.2.4 Definiremos el producto Lb = AbBb de dos operadores Ab y Bb al operador Lb que
b i.e.,
obtiene al actuar consecutivamente los operadores Bb y luego A,
b
= B,

b = A
b
L

b = A(
b B).
b
L

b i.e., la multiplicacion de operadores no es conmutativa.


En general AbBb =
6 BbA,

Definici
on 4.2.5 Llamaremos conmutador de dos operadores Ab y Bb al operador
b B]
b := AbBb BbA.
b
[A,

As pues, dos operadores conmutan si y solo si su conmutador es el operador nulo.


Definici
on 4.2.6 El operador Lb1 se denomina operador inverso de Lb si
b
LbLb1 = Lb1 Lb = I.

En adelante vamos a usar la notacion de Dirac para los vectores, los operadores y los
productos escalares.
As, un vector de H lo denotaremos por |i (ket vector) y su correspondiente conjugado
h| (brac vector)4 . As, denotaremos el producto escalar h, i porh|i y ademas
b
b
h|L|i
:= h|Li.

b En adelanA los productos anteriores les denominaremos elementos matriciales del operador L.
te, a no ser que se especifique, asumiremos que los vectores estan normalizados a la unidad,
i.e., kk = 1.
Definici
on 4.2.7 El operador Lb+ se denomina conjugado o adjunto de Lb si,
b = hLb+ |i = h|Lb+ i
i.e., h|Li
4

b
h|L|i
= h|Lb+ |i,

Estos nombres vienen de la palabra inglesa bracket.

(4.2.1)

nica Cua
ntica II: Espacios de Hilbert
Captulo 4. Meca

54

De la definicion anterior se deduce facilmente que


b
1. (Lb+ )+ = L,

b + = Lb+ , C,
2. (L)

b )+ = N
b + Lb+ y
3. (LbN

b |i = hLb+ |N
b i, , H.
4. h|LbN

Un ejemplo especialmente importante es el caso cuando H es de dimension finita. En este


caso si (n )N
n=1 es una base (en particular, una base ortogonal) de H, entonces
b n=
L

N
X

Ln,k k ,

k=1

+
y por tanto a Lb se le puede hacer corresponder una matriz (Li,j )N
i,j=1 . Si denotamos por Li,j la
matriz asociada al operador Lb+ , entonces L+
i,j = Lj,i .

Otro ejemplo son los Lb que admiten una representacion integral. Por ejemplo, supongamos
que H = L2 (R) y
Z
b
L(x) =
L(x, y)(y)dy,
R

b
donde L(x, y) es el n
ucleo del operador, entonces, si denotamos por L+ (x, y) al n
ucleo de L,
+
L (x, y) = L(y, x).
Definici
on 4.2.8 Si Lb = Lb+ , se dice que el operador es hermtico o autoadjunto.

Por ejemplo, si H es de dimension finita, Lb es hermtico si su correspondiente matriz satisface


Li,j = Lj,i . Si H = L2 (R), los operadores definidos por
x
b(x) = x(x),

pb(x) = i~

d(x)
,
dx

Pb(x) = (x),

son hermticos. En el caso de operadores con representacion integral, estos seran hermticos si
su n
ucleo es tal que L(x, y) = L(y, x).
Proposici
on 4.2.9 El producto Lb = AbBb de dos operadores Ab y Bb hermticos es hermtico si
b B]
b = 0.
y solo si Ab y Bb conmutan, i.e., [A,

b Entonces Lb+ = Bb+ Ab+ = BbA,


b luego Lb = Lb+ si y solo si AbBb = BbA,
b
Demostracion: Sea Lb = AbB.
b B]
b = 0.
i.e., [A,

b B]
b de dos operadores hermticos Ab y Bb es tal que
Proposici
on 4.2.10 El conmutador [A,
con Lb hermtico.

b B]
b = iL,
b
[A,

55

4.2. Operadores en H
b B]
b =N
b . Entonces
Demostracion: Supongamos que [A,

b + = ([A,
b B])
b + = [A,
b B]
b = N
b
N

b + = iLb+ = iL).
b
con Lb hermtico ((iL)

b = iL,
b
N

Definici
on 4.2.11 Sea |i H con k|ik =
6 0. Si existe C tal que
b
L|i
= |i,

entonces se dice que |i es un autovector de Lb y es su correspondiente autovalor.

Nota: En ocasiones es comodo denotar a un autovector asociado a por | i (suponiendo que


es un autovalor simple). Si ademas el conjunto de autovalores es numerable entonces se suele
simplificar a
un mas la notacion: |ni := |n i.
Proposici
on 4.2.12 Si Lb es hermtico, entonces sus autovalores son reales.
Demostracion:

b
L|i
= |i

Por otro lado de (4.2.1) se sigue que

b
h|L|i
= h|i = .

b
h|Lb+ |i = h|L|i
= h|i = ,

luego, como Lb es hermtico Lb = Lb+ por tanto = .

Proposici
on 4.2.13 Si Lb es hermtico, entonces los autovectores correspondientes a autovalores distintos son ortogonales.
b 1 i = 1 |1 i, L|
b 2 i = 2 |2 i, entonces
Demostracion: Sea L|
b 1 i =1 h2 |1 i =
h2 |L|

b 2 i = 2 h1 |2 i = 2 h2 |1 i,
h2 |Lb+ |1 i =h1 |L|

i.e. (1 2 )h2 |1 i = 0, luego como 1 6= 2 , h2 |1 i = 0.

Definici
on 4.2.14 Un operador Ub se denomina unitario si
b
UbUb+ = Ub+ Ub = I.

Proposici
on 4.2.15 Si Ub es unitario, entonces todos sus autovalores son tales que || = 1.
b
Demostracion: Sea U|i
= |i, entonces

b
1 = h|Ub+ Ub|i = h|Ub+ |i = h|U|i
= h|i = ||2

nica Cua
ntica II: Espacios de Hilbert
Captulo 4. Meca

56

Definici
on 4.2.16 Sea Ub un operador unitario. La transformacion
|i 7 |i = Ub+ |i,

b
Lb 7 b = Ub+ LbU,

la denominaremos transformacion unitaria de |i y Lb y la denotaremos por {U}.

Proposici
on 4.2.17 Las transformaciones unitarias conservan
1. Las relaciones de conmutacion de los operadores.
2. La propiedad de hermiticidad de un operador.
3. Los autovalores.

4. Los productos escalares y elementos matriciales de un operador.


b Bb y Lb tres operadores tales que [A,
b B]
b = Lb y sea {U} una transforDemostracion: 1. Sean A,
b Bb y Lb despues
macion unitaria. Denotemos por b
a, bb y b los operadores correspondientes a A,
b B]
b = Lb =
de la transformacion. Entonces como [A,
pero

AbBb BbAb = Lb

b
Ub+ AbBbUb Ub+ BbAbUb = Ub+ LbUb = ,

b Ub+ BbU)
b (Ub+ BbUb)(Ub+ AbUb) = b
(Ub+ AbU)(
abb bbb
a

b entonces
2. Sea Lb = Lb+ . Sea b = Ub+ LbU,

b
[b
a, bb] = .

b
b + = Ub+ Lb+ Ub = Ub+ LbUb = .
b+ = (Ub+ LbU)

b
3. Sea L|i
= |i, entonces

b Ub+ )|i = (Ub+ |i)


(Ub+ LbU)(

b = |i.
|i

b 2 i.
b 2 i = h1 |UbUb+ LbUbUb+ |2 i = hUb+ 1 |Ub+ LbU|
b Ub+ 2 i = h1 ||
4. h1 |L|

Definici
on 4.2.18 Sea F (z) una funcion analtica en un entorno de z = 0 y sea F (z) =
P
n
b
n0 fn z su desarrollo en serie de potencias. Definiremos al operador F (L) mediante la serie
b =
F (L)

X
n0

fn Lbn .

b Lb es el operador que se obtiene mediante


Definici
on 4.2.19 La derivada operacional F (L)/
la formula
b
b F (L)
b
F (L)
F (Lb + I)
.
(4.2.2)
= lm
0

Lb

57

4.2. Operadores en H
Por ejemplo

Lbn
= nLbn1 .
b
L

b Ab+ ] = I.
b Entonces es facil comprobar que
Sean Ab y Ab+ tales que [A,
b (Ab+ )k ] = k(Ab+ )k1 ,
[A,

k 1.

(4.2.3)

Proposici
on 4.2.20 Si F (z) es una funcion analtica en un entorno de z = 0 y sean Ab y Ab+
b Ab+ ] = I.
b Entonces
tales que [A,
b+
b F (Ab+ )] = dF (A ) .
[A,
dAb+

Demostracion: Basta escribir la serie de potencias de F y usar la propiedad (4.2.3).

Nota: Si F admite un desarrollo en serie de Laurent el resultado tambien es valido.


Antes de continuar con nuestro analisis procede hacer un breve comentario sobre un tipo
especial de operadores unitarios: los operadores unitarios cercanos a la unidad. Sea > 0 tan
peque
no como se quiera, y supongamos que Ub admite el desarrollo
Ub = Ib + iAb + O(2 ).

Entonces su conjugado es, a primer orden,

Ub+ = Ib iAb+ + O(2 ).

Como Ib = Ub+ Ub = Ib + i(Ab Ab+ ) + O(2 ), deducimos que Ab = Ab+ , es decir Ab ha de ser un
operador hermtico. Si elegimos = /N, con N N entonces se puede comprobar que
UbN =

iAb
Ib +
N

!N

b
b
eiA = U().

b
Se dice entonces que Ab es un generador de la transformacion U.

Los operadores que nos van a interesar son aquellos operadores hermticos cuyo conjunto
de autovectores constituyan un sistema completo de H, es decir que todo vector |i H
se puede expresar biunvocamente en funcion de dicho sistema. Este problema (de encontrar
dichos operadores y el conjunto de sus autovalores y autovectores y comprobar que constituyen
un sistema completo) es muy complicado y requiere de la potente maquinaria de la teora de
operadores en espacio de Hilbert, el teorema espectral de Riesz, etc. Basta mencionar que si H es
separable, entonces en H existe una base ortonormal completa y si Lb es un operador autoadjunto
(hermtico) y compacto, entonces sus autovectores constituyen un sistema ortogonal completo.
Para mas detalles vease el Apendice A. Conviene no obstante destacar que muchos operadores
importantes de la mecanica cuantica no son siquiera acotados.
En adelante, por sencillez, nos vamos a restringir a considerar aquellos operadores que
tengan asociados un conjunto numerable de autovectores y que dicho conjunto sea un sistema
completo.

58

nica Cua
ntica II: Espacios de Hilbert
Captulo 4. Meca

Supongamos que Lb es uno de tales operadores y denotemos por (|n i)n su conjunto completo de autovectores. Si todos los autovalores son simples entonces, como ya hemos visto, los
correspondientes autovectores son ortogonales. En el caso de que tengamos autovalores m
ultiples
sus correspondientes autovectores se pueden ortogonalizar usando el metodo de Gram-Schmidt
que describimos antes. As pues asumiremos que (|n i)n es un sistema ortonormal (ortogonal
con k|n ik = 1).
Sea |i un vector cualquiera de H, entonces |i se puede desarrollar en serie de Fourier
respecto (|n i)n
X
|i =
fn |n i, fn = hn |i.
n

En otras palabras, (|n i)n es una base ortonormal completa de H.

Las bases juegan un papel fundamental. En particular, las bases asociadas a operadores
hermticos.
Sea (|n i)n una base ortonormal completa de H y sea Ab un operador lineal, entonces
X
b n i H = A|
b ni =
b n i.
A|
Am,n |m i = Am,n = hm |A|
m

b n i la denominaremos elemento matricial del operador Ab en la base


A la cantidad hm |A|
(|n i)n .
Si (|n i)n es la base asociada a cierto operador hermtico Lb se dice que la matriz A = (Am,n )
b
es la matriz del operador Ab en la L-representaci
on. Notese que la matriz del operador Lb en
b
su propia representacion (la L-representaci
on) es una matriz diagonal con los autovalores en la
diagonal.

Mas a
un, as como el conjunto de n
umeros (fn )n define biunvocamente el vector |i, la
matriz A define biunvocamente al operador Ab (en la base correspondiente se sobrentiende).
As pues, el operador Ab sera hermtico si su P
matriz A es autoconjugada, i.e., Am,n = An,m , Ab
sera unitario si su matriz A es unitaria, i.e., k Am,k An,k = m,n , etc.

Nota: Notese que si H es de dimension finita, las correspondientes matrices son matrices
cuadradas N N donde N es la dimension de H, pero si H es de dimension infinita, entonces
las correspondientes matrices son infinitas.

b tienen un sistema completo de autovectores


Proposici
on 4.2.21 Si dos operadores Lb y N
b
b
(|n i)n com
un, entonces [L, N ] = 0.

Demostracion: Sean n los autovalores de Lb correspondientes a los autovectores |n i y n los del


b correspondientes al mismo autovector (son comunes). En las premisas del teorema
operador N
tenemos
b |n i = n L|
b n i = n n |n i = n N
b |n i = N
b (n |n i) = N
b L|
b n i.
LbN

Sea |i H cualquiera. Entonces


X
X
X
b |i =LbN
b
b |n i =
b L|
b ni
LbN
fn |n i =
fn LbN
fn N
n

b Lb
=N

X
n

b L|i
b
bN
b ] = 0.
fn |n i = N
= [L,

nica Cua
ntica
4.3. Los axiomas de la Meca

59

El recproco tambien es cierto:


b con sistemas completos de autovectores conmuProposici
on 4.2.22 Si dos operadores Lb y N
bN
b ] = 0), entonces tienen un sistema completo de autovectores (|n i)n com
tan ([L,
un.
Demostracion: Para demostrarlo vamos a probar que ambos se pueden diagonalizar al mismo
b En esa base la
tiempo. Supongamos que conocemos el conjunto (|n i)n de los autovectores de L.
bN
b ] = 0 entonces las matrices correspondientes
matriz de Lb es diagonal: Lm,n = n m,n . Como [L,
b yN
b Lb son iguales
a LbN
X
X
(LN)m,n = (NL)m,n =
Lm,k Nk,n =
Nm,k Lk,n =
k

X
k

m m,k Nk,n =

X
k

Nm,k n k,n

Nm,n (n m ) = 0.

b es
Si todos los autovalores son distintos, entonces Nm,n = 0 si m 6= n, es decir la matriz de N
diagonal. Resta probar que ocurre si hay autovalores m
ultiples. Lo que dejaremos como ejercicio
al lector5 .

En adelante asumiremos que el espacio de Hilbert H es separable.

4.3.

Los axiomas de la Mec


anica Cu
antica

Postulado 4.3.1 A cada sistema fsico se le hace corresponder un espacio de Hilbert separable
H apropiado. Ademas, para cada t R (parametro correspondiente al tiempo) el estado queda
completamente caracterizado por un vector |i normalizado a la unidad de H.
Es decir, para cada t el estado esta determinado por un vector de H tal que kk = 1. De
aqu tambien se sigue que, dados los estados |1 i, . . . , |k i, la combinacion lineal |i =
P
n
en es un (posible) estado6 .
k=1 k |k i tambi

Postulado 4.3.2 A cada magnitud fsica medible (observable) L se le hace corresponder un


operador linear hermtico Lb que act
ua en H.

Postulado 4.3.3 Sea |i el estado del sistema en el momento t justo antes de la medici
on de
b
la magnitud (observable) L (asociada al operador L). Independientemente de cual sea el estado
b
original |i, el resultado de la medicion solo puede ser un autovalor de L.
5

Supongamos que la multiplicidad de cierto autovalor k es g y sean k,j , j = 1, 2, . . . , g, los correspondientes


autovectores asociados. Entonces, como mucho hay g(g 1) elementos matriciales Nm,n no diagonales distintos
b |k,j i, donde i 6= j, i, j = 1, 2, . . . , g. Basta probar que existen ciertas
de cero, los correspondientes a hk,i |N
b |k,j i =
combinaciones lineales k,j de los correspondientes autovectores |k,j i, j = 1, 2, . . . , g, tales que hk,i |N
0.
6
Para cada t R el vector |i siempre se puede normalizar a la unidad (a no ser |i = 0).

60

nica Cua
ntica II: Espacios de Hilbert
Captulo 4. Meca

Este postulado requiere una aclaracion y es que al hacer una medicion de Lb el sistema cambia
(las mediciones interfieren en el sistema). As pues, antes de medir L el sistema puede estar en
cualquier estado , pero al realizar la medicion, esta cambia al sistema y lo deja en el estado
determinado por el vector | i que pertenece al autoespacio de Lb correspondiente al autovalor
.7
Postulado 4.3.4 El valor esperado hLi de una cantidad fsica L cuando el sistema se encuentra
en el estado |i viene dado por el elemento matricial
b
hLi = h|L|i.

Notese que, como Lb es hermtico, entonces

b
b
h|L|i
= h|Lb+ |i = h|L|i

hLi R.

Postulado 4.3.5 Los elementos matriciales de los operadores x


bi de la posicion (coordenadas)
xi y pbi de los momentos pi , i = 1, 2, 3, donde los ndices i = 1, 2, 3 corresponden a las proyecciones en los ejes x, y y z, respectivamente, definidos por h|b
xi |i y h|b
pi |i, cualquiera sean
|i y |i de H satisfacen las ecuaciones de evolucion
+
+
*
*


H
H
b
b
d
d



,
(4.3.1)
h|b
xi |i =
h|b
p
|i
=


,

i
b
b
dt
pi
dt
xi
b es el operador asociado a la funcion de Hamilton del correspondiente sistema clasico
donde H
(si es que lo hay).

Este postulado tiene un significado fsico evidente pues nos indica que el promedio de las cantidades medibles posicion, impulso y energa (hamiltoniano) satisfacen las ecuaciones dinamicas
de la mecanica hamiltoniana (1.1.1), i.e, en el lmite apropiado (~ 0) la Mecanica cuantica
se transforma en la clasica (principio de correspondencia de Bohr).
Proceden unas aclaraciones. En general el Hamiltoniano H de un sistema clasico depende de
b se obtiene cambiando
las coordenadas xi y los impulsos pi , i = 1, 2, 3, por lo que el operador H
las xi por los correspondientes operadores x
bi y pi por pbi . Esto, aunque en apariencia es trivial,
b
en general no lo es pues H debe ser hermtico (ya que corresponde a la magnitud fsica energa).
A esto regresaremos en breve, pero antes introduciremos nuestro u
ltimo postulado.
Postulado 4.3.6 Los operadores posicion x
bi e impulso pbi , i = 1, 2, 3, satisfacen las relaciones
de conmutacion
b
[b
xk , x
bj ] = 0 = [b
pk , pbj ], [b
xk , pbj ] = i~k,j I,
(4.3.2)

donde ~ es una constante e i = 1.


En particular, de lo anterior se sigue que los operadores x
bk y pbk no pueden tener un conjunto
completo de autovectores comunes. Este postulado es el analogo de las relaciones (1.1.4) (llaves
de Poisson).
7
Los operadores cuanticos se postulan en la teora. En el captulo 3 vimos varios ejemplos de los mismos.
Tres operadores esenciales son el operador posicion o coordenadas x
bk , impulso pbk , y el hamiltoniano del sistema
b
H.

n e implicaciones de los postulados


4.4. Discusio

4.4.

61

Discusi
on e implicaciones de los postulados

1. Supongamos que tenemos una magnitud fsica clasica L que depende en general de xi y pi .
Para construir el operador mecano-cuantico correspondiente solo tenemos que cambiar los xi
por los correspondientes operadores x
bi y pi por pbi . Por ejemplo, la energa cinetica viene dada
por
p2 + p22 + p23
pb1 2 + pb2 2 + pb3 2
T = 1
= Tb =
,
2m
2m
y la potencial V (x1 , x2 , x3 ) por Vb = V (b
x1 , x
b2 , x
b3 ), donde en ambos casos los operadores son
hermticos. Esto no siempre ocurre. Por ejemplo imaginemos que el hamiltoniano clasico conci = x
tiene el termino Wi = xi pi . Entonces, el operador W
bi pbi no puede representar al correspondiente operador cuantico ya que no es hermtico (ver Proposicion 4.2.9) pues x
bi y pbi no
c
conmutan. En este caso hay que definir Wi por
ci = 1 (b
W
xi pbi + pbi x
bi ).
2
2. Supongamos el sistema fsico se encuentra en el estado definido por |n i, autovector correspondiente al autovalor n de cierto operador Lb asociado a la magnitud fsica L. Entonces8
b n i = n ,
hn |L|

hn |Lbk |n i = kn .

Supongamos ahora que el sistema se encuentra en el estado


P |i que es en una superposicion de
los estados |k i, k = 1, 2, . . . , N, entonces como |i = k fk |k i tenemos
X
b
h|L|i
=
|fk |2 k .
k

Lo anterior indica, en virtud de postulado 4.3.4, que la cantidad |fk |2 es la probabilidad con que
se observa el valor k al hacer una medicion. Lo anterior implica ademas que tras la medicion
el sistema va a parar al estado definido por un vector del espacio generado por los autovectores
correspondientes a k . As pues, en el caso de que el autovalor k sea simple la probabilidad
de que el sistema estando en un estado original definido por el vector |i termine en el estado
definido por |k i es
Prob(|i 7 |k i) = |fk |2 = |hk |i|2 .

Notese que esta probabilidad es por tanto invariante ante transformaciones unitarias: k 7
pues Prob(|i 7 |k i) = Prob(|i
7 |
b k=
k , |i 7 U|i
b
k i). Luego el sistema
U
= |i
fsico es invariante frente a cualquier transformacion unitaria.
3. Dada cualquier cantidad fsica clasica L le podemos adicionar la cantidad xi pj pj xi sin
cambiarla. Si transformamos L en su operador Lb ya no le podemos adicionar el correspondiente
operador x
bi pbj pbj x
bi pues este no es nulo (ver postulado 4.3.6).
Ahora bien, tomando las derivadas funcionales

(b
xi pbj pbj x
bi ) =
(b
xi pbj pbj x
bi ) = 0,
b
xi
b
pi

b Si ademas x
i.e., x
bi pbj pbj x
bi es proporcional al operador identidad x
bi pbj pbj x
bi = I.
bi y pbj son
hermticos entonces, necesariamente, = i~ (ver la Proposicion 4.2.10) donde ~ R que no es
mas que la relacion de conmutacion del postulado 4.3.6.
8

Recuerdese que los estados est


an normalizados a la unidad.

nica Cua
ntica II: Espacios de Hilbert
Captulo 4. Meca

62

4.4.1.

Los proyectores ortogonales y la teora de mediciones

Como hemos visto en el punto 2 del apartado anterior cuando en un sistema en cierto estado
|i hacemos una medicion para saber el valor de cierto observable L asociado un operador
hermtico Lb el resultado es uno de los autovalores k de dicho operador y el estado despues de
la medicion pasa a ser un vector |k i del autoespacio (recordemos que todos los autovectores
estan normalizados a la unidad) asociado al autovalor k . Ademas en el caso de que k sea
simple sabemos que la probabilidad de que ello ocurra es |fk |2 = |hk |i|2. Todo lo podemos
escribir usando los proyectores ortogonales.
Para ello comenzaremos asumiendo el caso mas simple. Imaginemos que tenemos la magnitud L y que el resultado de la medicion es en valor k que asumiremos simple. Tras la medicion
el sistema estara en el estado |k i, donde |k i es el autovector asociado a k .

Definamos el operador de proyeccion Pk sobre el subestacio generado por |k i de la siguiente


forma
bk |i = hk |i|k i,
Pbk : H 7 H, P
bk = |k ihk |.
el cual formalmente podemos escribir como P

b2 := Pbk P
bk = P
bk y que P
bk es hermtico, i.e.,
De la definicion anterior es evidente que P
k
b+ = Pbk 9 . Ademas, claramente sus autovalores son o bien 0 o bien 1. En efecto
P
k
Pbk |i = |i

Pbk2 |i = 2 |i

bk )|i = (2 )|i = 0,
(Pbk2 P

bk |i es un autovector asociado
luego 2 = 0 de donde se sigue el resultado. Por otro lado P
bk (P
bk |i) = 1(P
bk |i)) mientras que (Ib Pbk )|i es el autovector asociado al
al autovalor 1 (P
bk )|i son
autovalor 0. Luego cualquiera sea el vector |i H, los vectores Pbk |i y (Ib P
ortogonales (por que?).

Que ocurre si el autovector k es degenerado, i.e., tiene asociado un subespacio de dimension K > 1?
En ese caso el projector Pbk es la suma de los proyectores asociados a cada uno de los
vectores de la base ortonormal (k,j )K
j=1 del autoespacio asociado a k . Es decir,
bk =
P

K
X
j=1

|k,j ihk,j |

Es facil comprobar que en este caso se tiene las mismas propiedades que en el caso cuando K = 1.
Tambien es facil comprobar que en este caso la probabilidad de obtener el valor k vuelve a ser
|hk |i|2 donde ahora k es el projector ortogonal sobre todo el subespacio asociado a k .

Supongamos que tenemos dos autovalores distintos k y k . Entonces los autoespacios


correspondientes Lk y Lk son ortogonales, luego
Pbk Pbk = 0,

k 6= k .

Si ademas el operador Lb asociado a la magnitud L tiene un sistema de autovectores que conforman una base de H entonces el operador
X
bk = I.
b
PbL :=
P
k

bk |i = h|k ihk |i = hk |i h|k i = h|Pbk |i.


h|P

n de los operadores x
4.5. Representacio
bi y pbi

63

La identidad anterior se denomina descomposicion de la identidad. Ademas de dicha identidad


se sigue que para todo |i H se tiene
X
X
|i =
Pbk |i =
hk |i|k i.
k

bk = k P
bk , de donde se sigue que (Lb k I)
b P
bk = 0. Entonces, usando la
Por otro lado, Lb P
descomposicion de la identidad, tenemos que
X
X
Lb =
Lb Pbk =
k Pbk .
k

Es decir, todo operador hermtico cuyo conjunto de autovectores es completo esta completamente determinado por sus autovalores y autovectores. Este es el conocido Teorema espectral
de operadores hermticos en espacios de Hilbert.

As pues, si tenemos un sistema en cierto estado y sobre el medidimos el valor de cierta


magnitud L obtendremos como resultado un autovalor del operador Lb asociado a la magnitud
bk |ik2 siendo el estado final del sistema el definido
L con probabilidad Prob(|i 7 |k i) = kP
bk es el projector ortogonal al subespacio asociado al autovalor k
por el vector Pbk |i, donde P
obtenido.

4.5.

Representaci
on de los operadores x
bi y pbi

Escojamos como espacio de Hilbert de nuestro sistema el conjunto de las funciones de


cuadrado integrable H = L2 (), |i = (x). Definiremos el operador x
bi en L2 () como el
b Luego x
operador x
bi := xi I.
bk (x) = xk (x).

Quien es pbj ? Por simplicidad vamos a trabajar solamente en dimension 1 (solo la proyeccion
en el eje de las x). Nuestro objetivo es encontrar un operador pb tal que cumpla las relaciones
de conmutacion (4.3.2).
Del postulado 4.3.6 se sigue que

b
1. [b
p, x
b] = pbx
bx
bpb = i~I,

2. [b
p, x
b2 ] = pbx
b2 x
b2 pb = 2i~b
x,
..
.
3. [b
p, x
bn ] = pbx
bn x
bn pb = ni~b
xn1 = i~

b
xn
.
b
x

Luego, para cualquier funcion analtica F (z) tenemos


[b
p, F (b
x)] = i~

F (b
x)
,
b
x

que en nuestra representacion se puede reescribir como


pbF (b
x)(x) F (b
x)b
p(x) = i~

F (b
x)
(x),
b
x

(4.5.1)

nica Cua
ntica II: Espacios de Hilbert
Captulo 4. Meca

64

o equivalentemente, usando que x


bk (x) = xk (x),

pb[F (x)(x)] F (x)b


p(x) = i~

F (x)
(x),
x

de donde escogiendo10 (x) = 1 obtenemos, sustituyendo pb1 = (x) la expresion


pbF (x) = i~

En general

pbk F (x1 , x2 , x3 ) = i~

F (x)
+ F (x)(x).
x

F (x1 , x2 , x3 )
+ F (x1 , x2 , x3 )k (x1 , x2 , x3 ).
xk

Pero [b
pk , pbj ] = 0, k = 1, 2, 3, luego

3 2
1 3
2 1

= 0.
x1
x2
x2
x3
x3
x1

Las ecuaciones anteriores son ciertas si k =


temente buena.

,
xk

k = 1, 2, 3, siendo una funcion lo suficien-

As pues, los operadores pbk deben tener la forma


pbk = i~

Hagamos ahora la transformacion unitaria


pbk Ub+ pbk Ub,

+
I.
xk xk

b
Ub = exp(i(x1 , x2 , x3 )/~)I,

Ub+ = exp(i(x1 , x2 , x3 )/~)Ib

que, como sabemos, no cambia ni los elementos matriciales, ni las relaciones de conmutacion, ni
los autovalores, ni la hermiticidad de los operadores (i.e., estos mantendran el mismo significado
fsico de antes):



b i/~ b

i/~
I e
I = i~
+
.
i~
pbk = e
xk xk
xk
Como ejercicio al lector dejamos que pruebe la identidad
[b
x, F (b
p)] = i~

4.6.

F (b
p)
.
b
p

(4.5.2)

Las ecuaciones de Heisenberg y de Schr


odinger

En este apartado vamos a discutir las representaciones de Heisenberg y de Schrodinger


para las ecuaciones dinamicas de la Mecanica cuantica. Supongamos que tenemos el sistema
en cierto estado |i y sea b el operador de cierta magnitud fsica que queremos estudiar. Si,

10
Por el momento solo nos interesa encontrar la expresion del operador independientemente de que luego este
vaya actuar en el espacio L2 ().

dinger
4.6. Las ecuaciones de Heisenberg y de Schro

65

en general, |i es independiente del tiempo y b no lo es diremos que estamos trabajando con


la representacion de Heisenberg. Si por el contrario, |i depende de tiempo y b no, entonces
diremos que estamos considerando la representacion Schrodinger de la Mecanica cuantica.
Por sencillez, en adelante asumiremos que el Hamiltoniano del sistema se expresa mediante
la formula
3
X
pb2k
b
b
b
b
H = T +V, T =
,
2m
i=1
y Vb = V (b
x1 , x
b2 , x
b3 ) = V (x1 , x2 , x3 )Ib solo depende de las coordenadas x, y, z.11
Por simplicidad trabajaremos solo con la proyeccion en el eje OX.
Como [b
p, Tb] = 0, tenemos, usando (4.5.1) que
b = [b
[b
p, H]
p, V (b
x)] = i~

b
V (b
x)
H
= i~
b
x
b
x

(4.6.1)

Supongamos ahora que los vectores de estado no dependen del tiempo pero los operadores
s que pueden, en principio, depender del tiempo (es decir consideremos la representacion de
Heisenberg). Entonces del postulado 4.3.5 se tiene que

de donde se sigue que

b
H
db
p
=
,
dt
b
x

i
db
p
b
= [b
p, H].
dt
~
De forma analoga, pero usando (4.5.2), se deduce la segunda ecuacion de Heisenberg
i
db
x
b
= [b
x, H].
dt
~

(4.6.2)

(4.6.3)

Las ecuaciones anteriores se conocen como ecuaciones dinamicas de la Mecanica cuantica en la representacion de Heisenberg: es decir, cuando las funciones de onda son vectores
independientes del tiempo pero los operadores dependen del tiempo.
Obviamente hay otra posibilidad y es que los operadores no dependan del tiempo y las
b
H
b
funciones de onda s. En este caso usando el postulado 4.3.5 y la formula (4.6.1) ( b
= i/~[b
p, H]),
x
obtenemos
+
*

H
b
i
d


b
h|b
p|i =
p, H]|i.
= h|[b
b
dt
x
~
Luego, por un lado,

 
   




pb + pb
pb + pb
=
t
t
t
t

11
Recordemos que estamos usando indistintamente la notaci
on x1 , x2 , x3 y x, y, z para denotar las coordenadas
espaciales.

nica Cua
ntica II: Espacios de Hilbert
Captulo 4. Meca

66
y, por otro,


 

  i

i
i
i
b
b p|i = pb H
b
b pb ,
b
h|b
pH|i
h|Hb
+
H
h|[b
p, H]|i
=
~

~
~
~

de donde se sigue que



 

i
i
b
b pb = 0,
+
+ H
+ H
pb

t
~
t
~

cualquiera sean los vectores y . Por tanto, necesariamente tenemos la ecuacion


i~

|i
b
= H|i.
t

(4.6.4)

La ecuacion anterior se denomina ecuacion de Schrodinger y es la ecuacion de evolucion de la


Mecanica cuantica.
Veamos ahora como se relacionan las representaciones de Heisenberg y de Schrodinger.

4.6.1.

Equivalencia de las representaciones de Heisenberg y de Schr


odinger

Las ecuaciones dinamicas del postulado 4.3.5 han de cumplirse independientemente de que
escojamos la representacion de Schrodinger (S) o la de Heisenberg (H) discutidas en el apartado
anterior. Ademas, los observables que medimos deben tener los mismos valores medios en ambas
representaciones. Eso implica que ha de existir una transformacion unitaria {U} que pase de S
a H y viceversa.
Sean |i y b la funcion de estado y el observable en la representacion de Heisenberg y |i
y Lb en la de Schrodinger. Entonces entre ambas existe la relacion:
|i = Ub+ |i,

b
Lb = Ub+ bU,

b
Ub+ = eiHt/~ ,

b es el operador hamiltoniano del sistema que se asume independiente del tiempo.


donde H
En efecto, si |i no depende del tiempo, entonces

i b
Ub+
i b iHt/~
|i
b
|i = H|i,
=
|i = He
t
t
~
~

i.e., la ecuacion de Schrodinger (4.6.4).


Supongamos que ahora Lb no depende de t (estamos en la representacion de Schrodinger).
Entonces,
b Ub b b+ b Lb b+ b b Ub+
i bb bb
i b b
LU + U
=
= (H
H) = [H,
].
(4.6.5)
U + UL
t
t
t
t
~
~
|{z}
=b
0

Si escogemos b como el operador pb y x


b recuperamos las ecuaciones de Heisenberg (4.6.2) y
(4.6.3), respectivamente.

dinger
4.6. Las ecuaciones de Heisenberg y de Schro

4.6.2.

67

Integrales de movimiento

De lo anterior se sigue que en la representacion de Heisenberg una cantidad fsica es independiente del tiempo si el operador asociado a dicha magnitud conmuta con el Hamiltoniano.
Esta propiedad es ademas muy significativa desde el punto de vista fsico como veremos a
continuacion.
Definici
on 4.6.1 Se dice que una cantidad observable Ab es una integral de movimiento si
d
d
b
hai = h|A|i
= 0.
dt
dt

Es decir, una magnitud es una integral de movimiento si dicha magnitud se conserva en media.
Calculamos la derivada del elemento matricial
 
 


Ab

b
d



b

b
A +
+ A
.
h|A|i =
dt
t
t
t

Supongamos ahora que estamos en la representacion de Schrodinger, i.e., A no depende de


t y |i satisface la ecuacion de Schrodinger (4.6.4). Entonces, usando (4.6.4) tenemos


i

d
b

b
b
h|A|i = [H, A] .
(4.6.6)
dt
~
Entonces,

d
b
h|A|i
dt

b H]
b = 0.
= 0 si y solo si [A,

Si ahora escogemos la representacion de Heisenberg entonces (|i no depende del tiempo,


pero Ab si puede) tenemos
 b 
A
d
= i h|[H,
b
b A]|i,
b
h|A|i
=
dt
t
~
donde hemos usado la ecuacion de Heisenberg (4.6.5). Es decir, tambien en la representacion
b
b H]
b = 0.
de Heisenberg dtd h|A|i
= 0 si y solo si [A,

El test de consistencia

Probemos que tambien tenemos aqu el test de consistencia d/dt(k|ik2 ) = 0. Sea la ecuacion de Schrodinger (4.6.4) y sea su conjugada
h|
b+.
= h|H
t
Tomando el producto escalar de esta u
ltima por |i (por la derecha) y de (4.6.4) por h| (por
la izquierda) obtenemos, respectivamente





+
, h|H|i
b
b |i = i~
= i~
,
h|H
t
t
i~

b tenemos
de donde, restando ambas y usando la hermiticidad de H
 



k|ik2


= h|i =
.
+
0=
t
t
t
t

nica Cua
ntica II: Espacios de Hilbert
Captulo 4. Meca

68

4.6.3.

Los estados estacionarios del sistema

Toda la discusion anterior nos conduce a que el estado de un sistema viene dado por un
vector de estado |i que evoluciona seg
un la ecuacion de Schrodinger. Vamos a suponer que el
b es independiente del tiempo y tiene un conjunto
operador hamiltoniano (que es hermtico) H
de autovectores |n i (independientes de t) completo en H, i.e.,
b n i = En |n i,
H|

b representan los posibles valores de la energa del


donde los autovalores En del hamiltoniano H
sistema.

Supongamos ahora que tenemos un estado del sistema correspondiente a la energa En , que
b n i = En |n i. Como los |n i son estados del
tiene la forma |n i = (t)|n i. Notese que H|
sistema, entonces han de satisfacer la ecuacion de Schrodinger, i.e.,
i~

|n i
b n i = En |n i.
= H|
t

Resolviendo con respecto al tiempo la ecuacion anterior tenemos


|n i = eiEn t/~ |n i,
donde |n i no depende explcitamente del tiempo.

Com
unmente a los estados |n i anteriores se les denominan estados estacionarios del sistema. Ademas, de lo anterior se deduce que la u
nica dependencia del tiempo de los estados
estacionarios es el factor eiEn t/~ .

4.6.4.

Los operadores unitarios y la evoluci


on temporal

La discusion del apartado anterior nos da una pista de una transformacion unitaria de
b
especial interes. Concretamente la trasformacion que define el operador U(t) = eiHt/~ , donde
H es el Hamiltoniano del sistema.
Como los sistemas son invariantes frente a las transformaciones unitarias ello implica que
si definimos el estado |(t)i = U(t)|(0)i, ambos han de describir el mismo estado. De lo
anterior se deduce que para todo t0 , |(t + t0 )i = U(t)|(t0 )i, es decir, que los estados fsicos
son invariantes frente a las traslaciones temporales. Como tomado derivadas respecto a t en
|(t)i = U(t)|(0)i nos conduce a la ecuacion de Schrodinger podemos deducir que esta es una
consecuencia de la invarianza respecto a las traslaciones temporales de los sistemas fsicos.

4.7.

El principio de incertidumbre

b Definamos los operadores


Sean dos operadores hermticos Ab y B.
b
Ab = Ab hAiI,

b
Bb = Bb hBiI,

b B]
b = iL,
b
donde hAi y hBi son los valores medios de Ab y Bb en el estado |i. Entonces, como [A,
b B]
b = iL.
b
con Lb hermtico, se sigue que [A,

nica matricial
4.8. La meca

69

Las dispersiones de las cantidades A y B en el estado |i vendran dadas por


q
q
2
b
b
b 2 |i = kBk.
b
A := h|(A) |i = kAk, B := h|(B)

Si usamos la desigualdad de Cauchy-Schwarz (4.1.2)

b
b |hA|
b
b
b
b
kA|k
Bk
Bi|
|hA|
Bi|

Calculemos la parte imaginaria de

b
b = h|A
b B|i
b
hA|
Bi

recordemos que A es hermtico, luego Ab tambien lo es pues hAi es real. Obtenemos



1 
b
b
b
b
b
b
h|AB|i h|AB|i
h|AB|i =
2i


1
+
+
b
b
b
b
h|AB|i h|B A |i
=
2i


1
b B|i
b
b A|i
b
=
h|A
h|B
2i
1
1
b B]|i
b
b
= h|L|i.
= h|[A,
2i
2
b
Como Lb es hermtico, h|L|i
es un n
umero real que denotaremos por l; as,
AB

|l|
.
2

Lo anterior aplicado a los operadores pb y x


b (ver postulado 4.3.6) nos conduce al principio
de incertidumbre de Heisenberg
~
xp .
2

4.8.

La mec
anica matricial

Supongamos que tenemos una base (|n i)n completa de vectores de H. Entonces, todo
vector |i de H lo podemos escribir, como ya hemos visto, de la forma
X
|i =
fn |n i,
fn = hn |i.
n

Es decir, a cada vector de H le podemos hacer corresponder su vector f = (f1 , f2 , . . . )T .


Analogamente, a cada operador Lb le podemos hacer corresponder una matriz L con entrab n i. Luego la ecuacion (4.6.5) se puede escribir en la forma
das Lm,n = hm |L|
L
i
= [H, L].
t
~

donde H es la matriz correspondiente al hamiltoniano del sistema, i.e., recuperamos la tambien


antes mencionada mecanica matricial de Heisenberg.

nica Cua
ntica II: Espacios de Hilbert
Captulo 4. Meca

70

4.9.

La ecuaci
on de Schr
odinger y el postulado 4.3.5

Supongamos que la cantidad observable L es independiente del tiempo y |i es la solucion


b es el operador hamiltoniano
de la ecuacion de Schrodinger (4.6.4), donde H
2
2
2
b = pb1 + pb2 + pb3 + V (b
H
x1 , x
b2 , x
b3 ) = Tb + Vb .
2m

Entonces, la ecuacion (4.6.6) nos da

i b b
d
hLi = h[H,
L]i.
dt
~

(4.9.1)

Sea Lb = x
bk . Entonces, usando (4.5.2) tenemos

b
H
b x
[H,
bk ] = [Tb, x
bk ] = i~
.
b
pk

Sustituyendo lo anterior en (4.9.1) obtenemos

d
hxk i =
dt

b
H
b
pk

Sea Lb = pbk . Entonces, usando (4.5.1) tenemos

b pbk ] = [Vb , xk ] = i~
[H,

de donde, usando (4.9.1), se sigue que

d
hpk i =
dt

b
H
b
xk

b
H
,
b
xk

Es decir, si la funcion de estado evoluciona seg


un la ecuacion de Schrodinger (4.6.4), entonces
las medias de las coordenadas e impulsos se comportan como en la mecanica hamiltoniana
clasica.
En las mismas condiciones de antes se puede probar (de forma totalmente analoga) que,
partiendo de la cantidad
d
b
h|L|i,
dt
se obtienen las formulas de evolucion del postulado 4.3.5.

4.10.

Problemas

Problema 4.10.1 Dado tres operadores pb, qb y rb, prueba la identidad de Jacobi
[[b
p, qb], rb] + [[b
q , rb], pb] + [[b
r , pb], qb] = 0.

71

4.10. Problemas
Problema 4.10.2 Probar que
b

aeL = b
a+
eLb

1 b
1 b b
[L, b
a] + [L,
[L, b
a]] +
1!
2!

Ayuda: Encuentra la EDO que satisface el operador a(t) definido por b


a(t) = etL b
aetL , donde b
a no
depende del tiempo y desarrolla la funci
on b
a(t) en potencias de t.

Problema 4.10.3 Para el caso unidimensional encuentra los operadores hermticos conjugados
a los siguientes operadores:
d
d
d
d
, x , pbx , x .
dx
dx
dx
dx

b es hermtico, entonces eiLb es unitario.


Problema 4.10.4 Prueba que si L

b y M
c siempre se
Problema 4.10.5 Prueba que el producto de dos operadores hermticos L
puede escribir como
bM
c=A
b + B,
b
L
b es hermtico y B
b es antihermtico: B
b + = B.
b
donde A

72

nica Cua
ntica II: Espacios de Hilbert
Captulo 4. Meca

Captulo 5
Resolviendo la ecuaci
on de Schr
odinger
5.1.
5.1.1.

El m
etodo de Nikiforov-Uvarov
La ecuaci
on hipergeom
etrica generalizada

La ecuacion hipergeometrica generalizada es una ecuacion lineal de segundo orden de la


forma

e(z)
e(z)
u (z) + 2 u(z) = 0,
(5.1.1)
u (z) +
(z)
(z)
siendo e(z) un polinomio de grado a lo mas uno y (z) y
e(z) polinomios de grado a lo mas
dos.
Hagamos el cambio u(z) = (z)y(z),




(z) e(z)
(z) (z)e
(z)

e(z)

y (z) + 2
y (z) +
y(z) = 0.
+
+
+ 2
(z)
(z)
(z)
(z)(z)
(z)

El objetivo del cambio es convertir la ecuacion anterior en una mas sencilla o por lo menos
menos complicada que (5.1.1), as que al menos debemos tener
(z)
(z) e(z)
+
=
,
2
(z)
(z)
(z)

(z)
(z) e(z)
(z)
=
=
,
(z)
2(z)
(z)

(5.1.2)

siendo un polinomio de grado a lo mas uno y, por tanto, polinomio de grado a lo mas uno.
Lo anterior transforma nuestra ecuacion original (5.1.1) en la siguiente
y (z) +

(z)
(z)
y (z) + 2 y(z) = 0,
(z)
(z)

(z) = e(z) + 2(z),

(z) =
e(z) + 2 (z) + (z)[e
(z) (z)] + (z)(z).

(5.1.3)

Como es un polinomio de grado dos a lo sumo, impongamos que sea proporcional al propio
, es decir que (z) = (z). Ello es posible pues tiene dos coeficientes indeterminados
los coeficientes del polinomio y es una constante a determinar, lo que nos conduce a
73

n de Schro
dinger
Captulo 5. Resolviendo la ecuacio

74

tres ecuaciones al igualar los coeficientes de y con tres incognitas. Hecho esto, nuestra
ecuacion se transforma en la ecuacion hipergeometrica
(z)y + (z)y + y = 0.

(5.1.4)

Pasemos a calcular y . Como = (z), entonces

e(z) + 2 (z) + (z)[e


(z) (z)] + (z)(z) = (z),

o, equivalentemente,

2 (z) + [e
(z) (z)](z) + {e
(z) [ (z)](z)} = 0.
Supongamos que k = (z) es conocido, entonces tenemos una ecuacion de segundo orden
para (z), luego
s
2

(z) e(z)
(z) e(z)
(z) =

e(z) + k(z),
(5.1.5)
2
2

pero (z) ha de ser un polinomio de grado a lo sumo uno, por tanto el polinomio
(z) =

(z) e(z)
2

2

e(z) + k(z)

(5.1.6)

ha de ser un cuadrado perfecto, es decir su discriminante debe ser cero, lo que nos conduce a
una ecuacion para encontrar k. El k encontrado lo sustituimos en (5.1.5) y obtenemos (z), el
cual nos conduce directamente a = (z) + k.
Obviamente el metodo anterior da distintas soluciones en funcion del k que escojamos y del
convenio de signos en (5.1.5).

5.1.2.

La ecuaci
on diferencial hipergeom
etrica

Como hemos visto en el apartado anterior el estudio de la ecuacion (5.1.1) se puede reducir
al de la ecuacion hipergeometrica (5.1.4) por lo que nos centraremos en el estudio de esta u
ltima.
Aqu nos restringiremos a estudiar las soluciones polinomicas de (5.1.4). Para el caso general
remitimos al lector [16].
La propiedad de hipergeometricidad y la f
ormula de Rodrigues
Pasemos a continuacion a estudiar la ecuacion diferencial
(x)y + (x)y + y = 0,

(5.1.7)

donde y son polinomios de grados a lo sumo 2 y 1, respectivamente.


La ecuacion (5.1.7) usualmente se denomina ecuacion diferencial hipergeometrica. La razon
fundamental de esta denominacion esta en la denominada propiedad de hipergeometricidad que
consiste en que las soluciones y de la ecuacion (5.1.7) son tales que sus m-esimas derivadas

5.1. El m
etodo de Nikiforov-Uvarov

75

y (m) := ym satisfacen una ecuacion del mismo tipo. En efecto, si derivamos (5.1.7) m veces
obtenemos que ym satisface una ecuacion de la forma

(x)ym
+ m (x)ym
+ m ym = 0,

m (x) = (x) + m (x),


m = +

m1
X
i=0

i (x) = + m (x) + m(m 1)

(5.1.8)
(x)
.
2

Es evidente que grado m 1 y que m es una constante. Ademas, toda solucion de (5.1.8)
es necesariamente de la forma ym = y (m) siendo y solucion de (5.1.7). La demostracion es por
induccion y la omitiremos.
Vamos a intentar encontrar las soluciones polinomicas de (5.1.7). Para encontrarlas comenzaremos escribiendo (5.1.7) y (5.1.8) en su forma simetrica o autoconjugada
[(x)(x)y ] + (x)y = 0,

[(x)m (x)ym
] + m m (x)ym = 0,

(5.1.9)

donde y m son funciones de simetrizacion que satisfacen las ecuaciones diferenciales de primer
orden (conocidas como ecuaciones de Pearson)
[(x)(x)] = (x)(x),
[(x)m (x)] = m (x)m (x).

(5.1.10)

Si es conocida entonces, utilizando las ecuaciones anteriores, obtenemos para m la expresion


m (x) = m (x)(x).

(5.1.11)

Teorema 5.1.1 Las soluciones polinomicas de la ecuacion (5.1.8) se expresan mediante la


f
ormula de Rodrigues
Anm Bn dnm
Pn(m) (x) =
[n (x)],
(5.1.12)
m (x) dxnm
donde Bn = Pn(n) /Ann y
Anm



= Am ()

=n

m1
Y
n!
=
[ + 12 (n + k 1) ].
(n m)! k=0

(5.1.13)

Ademas, el autovalor m de (5.1.8) es


m = m (n ) = (n m)[ + 21 (n + m 1) ].

(5.1.14)

Demostracion: Para demostrar el teorema vamos a escribir la ecuacion autoconjugada para las
derivadas de la siguiente forma
m (x)ym =

1
[m+1 (x)ym+1 ] ,
m

n de Schro
dinger
Captulo 5. Resolviendo la ecuacio

76
luego

Am dnm
m (x)ym =
[n (x)yn ] ,
An dxnm

Am = (1)

m1
Y

k ,

A0 = 1.

k=0

(n)

Como estamos buscando soluciones polinomicas, y := Pn , tenemos que Pn


(m)
por tanto, para las derivadas de orden m, Pn , obtenemos la expresion
Pn(m) (x) =


donde Anm = Am ()

Anm Bn dnm
[n (x)],
m (x) dxnm
(n)

=n

es una constante;

y Bn = Pn(n) /Ann . Como Pn

es una constante, de (5.1.8) obtenemos

que n = 0, luego, usando la expresion (5.1.8)


n = n + n (x) + n(n 1) (x)/2 = 0,

deducimos que el valor de n en (5.1.7) se expresa mediante la formula1


:= n = n

n(n 1)
.
2

(5.1.15)

Sustituyendo (5.1.15) en (5.1.8) obtenemos el valor de nm = m (n )


nm = m (n ) = (n m)[ + 12 (n + m 1) ],
de donde, usando que Anm = Am (n ) = (1)m
Anm .

Qm1
k=0

(5.1.16)

nk , deducimos el valor de la constante

En la prueba hemos asumido que nk 6= 0 para k = 0, 1, . . . , n 1. De la expresion explcita


(5.1.16) deducimos que para que ello ocurra es suficiente que + n /2 6= 0 para todo n =
0, 1, 2, . . . . Notese que esta condicion es equivalente a n 6= 0 para todo n N. Ademas, de ella
se deduce que n 6= 0 para todo n N. Esta condicion se conoce como condicion de regularidad
o de admisibilidad. Notese ademas que nk = n k , luego nk 6= 0 para k = 0, 1, . . . , n 1
implica que n 6= k si n 6= k.
Cuando m = 0 la formula (5.1.12) se convierte en la conocida formula de Rodrigues para
los polinomios clasicos
Pn (x) =

Bn dn n
[ (x)(x)],
(x) dxn

n = 0, 1, 2, . . .

(5.1.17)

La formula (5.1.15) determina los autovalores n de (5.1.7) y es conocida como condicion de


hipergeometricidad.
Ortogonalidad y relaci
on de recurrencia
Veamos ahora como a partir de las ecuaciones diferenciales simetrizadas (5.1.9) podemos
demostrar la ortogonalidad de las soluciones polinomicas respecto a la funcion peso .
1

Usando la expresion (5.1.15) podemos obtener una expresion alternativa Anm = (n)m

Qm1

n+k
k=0 (n+k) .

5.1. El m
etodo de Nikiforov-Uvarov

77

Teorema 5.1.2 Supongamos que


b

xk (x)(x) = 0,

para todo k 0.

(5.1.18)

Entonces las soluciones polinomicas Pn de la ecuacion (5.1.7) constituyen una sucesion de


polinomios ortogonales (SPO) respecto a la funcion peso definida por la ecuacion [(x)(x)] =
(x)(x), o sea, se cumple que
Z b
Pn (x)Pm (x)(x)dx = n,m d2n ,
(5.1.19)
a

donde n,m es el smbolo de Kronecker y dn denota la norma de los polinomios Pn .


Demostracion: Sean Pn y Pm dos de las soluciones polinomicas de (5.1.7). Partiremos de las
ecuaciones simetrizadas para Pn y Pm ,
[(x)(x)Pn (x)] + n (x)Pn (x) = 0,
[(x)(x)Pm (x)] + m (x)Pm (x) = 0.
Multiplicando la primera por Pm y la segunda por Pn , restando ambas e integrando en [a, b]
obtenemos
Z b
(n m )
Pn (x)Pm (x)(x)dx =
=

Z b
a


[(x)(x)Pm (x)] Pn (x) [(x)(x)Pn (x)] Pm (x) dx

(x)(x)[Pn (x)Pm (x)

Pn (x)Pm (x)]
a
b


= (x)(x)W [Pn (x), Pm (x)] .
a

Pero el Wronskiano W (Pn , Pm ) es un polinomio en x; por tanto, si imponemos la condicion


(5.1.18) obtendremos (n 6= m ) que los polinomios Pn y Pm son ortogonales respecto a la
funcion peso . Usualmente los valores de a y b se escogen de forma que sea positiva en el
intervalo [a, b]. Una eleccion puede ser tomar a y b como las races de (x) = 0, si estas existen.

(k)

De forma analoga, utilizando la ecuacion (5.1.9) para las derivadas yk := Pn , se puede


demostrar que las kesimas derivadas de los polinomios hipergeometricos tambien son ortogonales, es decir, que
Z
b

Pn(k) (x)Pm(k) (x)k (x)dx = n,m d2kn .

(5.1.20)

Finalmente, para calcular la norma dn de los polinomios podemos utilizar la formula de


Rodrigues. En efecto, sustituyendo (5.1.17) en (5.1.19) tenemos
Z b
dn
2
dn = Bn
Pn (x) n [ n (x)(x)]dx,
dx
a
(n)

de donde integrando por partes y usando que Pn = n!an concluimos que


Z b
2
n
dn = Bn (1) n!an
n (x)(x)dx.
a

(5.1.21)

n de Schro
dinger
Captulo 5. Resolviendo la ecuacio

78

Teorema 5.1.3 Los polinomios ortogonales satisfacen una relacion de recurrencia a tres terminos de la forma
xPn (x) = n Pn+1 (x) + n Pn (x) + n Pn1 (x),
(5.1.22)
donde
n =

an
,
an+1

n =

bn
bn+1

,
an an+1

n =

cn n cn+1
bn
an1 d2n
,

n =
an1
an1
an d2n1

(5.1.23)

donde an , bn y cn son los coeficientes del desarrollo Pn (x) = an xn + bn xn1 + cn xn2 + , y


dn es la norma de los polinomios.
Generalmente se impone que P1 (x) = 0 y P0 (x) = 1, con lo que la sucesion de polinomios
ortogonales queda determinada de forma u
nica conocidas las sucesiones (n )n , (n )n y (n )n .
Demostracion: Utilizando que la sucesion (Pn )n es una base del espacio de los polinomios,
tenemos que el polinomio xPn (x) de grado n + 1 se puede desarrollar en la base (Pn )n
xPn (x) =

n+1
X

cnk Pk (x),

k=0

cnk =

Rb
a

Pn (x) [xPk (x)] (x)dx


.
d2n

Pero como el grado de xPk (x) es k + 1, entonces cnk = 0 para todo 0 k < n 1, de donde
se concluye que la SPO satisface una relacion (5.1.22). Ademas, los coeficientes n , n , y n se
expresan mediante las formulas:
n =
n =

1
d2n+1
1
d2n1

xPn (x)Pn+1 (x)(x)dx,


a

1
n = 2
dn

xPn (x)Pn (x)(x)dx,

(5.1.24)

xPn (x)Pn1 (x)(x)dx.

Para probar (5.1.23) basta sustituir la expresion Pn (x) = an xn +bn xn1 +cn xn2 + en (5.1.22)
e igualar las potencias xn+1 , xn y xn1 . Finalmente como xPn1 = n1 Pn +n1 Pn1 +n1Pn2 ,
n =

1
d2n1

Pn (x)[xPn1 (x)](x)dx =
a

1
d2n1

n1

b
a

Pn2 (x)(x)dx,

de donde se sigue el resultado.


Notese que del resultado anterior se deduce que n 6= 0 para todo nN {0} as como que
n 6= para todo N. Ademas, si (x) 0 en (a, b), entonces n1 n > 0 para todo n N.
Resulta que el recproco tambien es cierto.

Teorema 5.1.4 Sea (n )


umeros reales con n >
n=0 y (n )n=0 dos sucesiones cualesquiera de n
0 para todo n N y sea (Pn )
una
sucesi
o
n
de
polinomios
m
o
nicos
definidos mediante la
n=0
relacion
Pn (x) = (x n )Pn (x) n Pn (x), n = N,
(5.1.25)

donde P1 = 0 y P0 (x) = 1. Entonces, dichos polinomios Pn son ortonormales para cierta


medida positiva sobre la recta real.

5.1. El m
etodo de Nikiforov-Uvarov

79

El teorema anterior se conoce como Teorema de Favard, aunque haba sido demostrado antes
por O. Perron (1929), A. Wintner (1929) y M. H. Stone (1932), J. Sherman (1935) y I. P.
Natanson (1935) indistintamente.
Una consecuencia inmediata de la RRTT es el siguiente teorema cuya prueba dejamos como
ejercicio al lector
Teorema 5.1.5 Si (Pn )n es una sucesion de polinomios ortogonales que satisface la relaci
on
de recurrencia a tres terminos (5.1.22). Entonces se cumple que
Kern (x, y)

n
X
Pm (x)Pm (y)
n Pn+1 (x)Pn (y) Pn+1 (y)Pn (x)
=
,
2
2
d
d
x

y
m
n
m=0

n 1.

(5.1.26)

Si hacemos tender y x en la formula anterior obtenemos la formula confluente de ChristoffelDarboux:


n
X
Pm2 (x)
n
Ker(x, x)
= 2 [Pn+1
(x)Pn (x) Pn+1 (x)Pn (x)]
2
n
d
d
m
n
m=0

n 1.

(5.1.27)

Una propiedad muy importante de los polinomios ortogonales esta relacionada con los ceros
de los mismos. As, se tiene el siguiente teorema fundamental cuya demostracion omitiremos
(ver e.g. [1]):
Teorema 5.1.6 Supongamos que (x) es positiva en el interior del intervalo (a, b). Entonces:
1. Todos los ceros de Pn son reales, simples y estan localizados en (a, b).
2. Dos polinomios consecutivos Pn y Pn+1 no pueden tener ning
un cero en com
un.
3. Denotemos por xn,j a los ceros del polinomio Pn , (consideraremos en adelante que xn,1 <
xn,2 < < xn,n ). Entonces:
xn+1,j < xn,j < xn+1,j+1 ,
es decir, los ceros de Pn y Pn+1 entrelazan unos con otros.
Calculemos ahora la relacion de recurrencia (5.1.22) a tres que satisfacen los polinomios
clasicos. Para calcular los coeficientes usando las expresiones de (5.1.23) tenemos antes que
encontrar una expresion general para los coeficientes principales an y bn del polinomio Pn .
(n)

Para calcular an usamos que, por un lado Pn (x) = n!an y por el otro, utilizando la formula
(n)
de Rodrigues (5.1.12) Pn (x) = Bn Ann , por tanto,
n1

Y
Bn Ann
[ + 12 (n + k 1) ].
= Bn
an =
n!

(5.1.28)

k=0

Para calcular bn utilizaremos la formula de Rodrigues para la n 1-esima derivada de Pn :


(n1)
Pn
(x) = Ann1 Bn n1 (x), de donde obtenemos la igualdad
Pn(n1) (x) = n!an x + (n 1)!bn = Ann1 Bn n1 (x).

n de Schro
dinger
Captulo 5. Resolviendo la ecuacio

80
Luego,

bn =

nn1 (0)
an .

n1

(5.1.29)

Observese que, al ser n 6= 0, bn esta definido para cualquier n.

Usando las expresiones (5.1.23) as como (5.1.29) deducimos

+ (n 1) 2
an
Bn
Bn n 2n 2n + 1
n =
=
=

an+1
Bn+1 ( + (2n 1) 2 )( + (2n) 2 )
Bn+1 n 2n 2n+1
n =

nn1 (0) (n + 1)n (0)

n1
n

Vamos a dar una expresion alternativa para n sin usar la norma de los polinomios. Para
ello igualamos los coeficientes de xn2 en la ecuacion diferencial (5.1.7). Ello nos conduce a la
expresion
(n 1)[ (0) + (n 2) (0)]bn + n(n 1)(0)an
cn =

(n 2)[ + (n 3) 2 ] + n
(5.1.30)

n(n 1)[n2 (0)n1 (0) + (0)n1


]
=
an .

n1
(n n2 )
Luego nos resta sustituir la expresion anterior en la formula2 (5.1.24)
n =

bn
cn n cn+1

n .
an1
an1

Consecuencias de la f
ormula de Rodrigues
La primera consecuencia inmediata de la formula de Rodrigues es que (x) debe ser necesariamente un polinomio de grado exactamente uno. En efecto, si calculamos el polinomio de
grado 1 utilizando la formula de Rodrigues (5.1.17) obtenemos
P1 (x) =

B1
[(x)(x)] = B1 (x),
(x)

(5.1.31)

y por tanto es un polinomio de grado exactamente uno. Notese que esta formula es equivalente
a la formula de Pearson (5.1.10).
(m)

Si escribimos la formula de Rodrigues (5.1.12) para las derivadas3 Pn+m con n = 1 tenemos
(m)

P1+m (x) =

Am+1 m
Am+1 m
[m+1 (x)] =
[(x)m (x)] = Am+1 m m (x),
m (x)
m (x)
(m)

es decir, m es de grado exactamente uno (pues los polinomios Pn+m son ortogonales). Por tanto

m
6= 0 para todos m N lo cual es la condicion de regularidad (existencia de la SPO) que ya
mencionamos.
2

Recordar que Pn (x) = an xn + bn xn1 + cn xn2 + .


(m)
(m)
3
Hemos usado Pn+m en vez de Pn pues estos son polinomios de grado exactamente n en x mientras que los
u
ltimos no. Obviamente ellos tambien son solucion de la ecuaci
on (5.1.8) y satisfacen la formula de Rodrigues
(5.1.12) cambiando n por n + m.

5.1. El m
etodo de Nikiforov-Uvarov

81

Tomemos ahora m = 1 en la formula (5.1.12). Realizando unos calculos directos deducimos


que
Pn (x)

An1 Bn dn1
n Bn dn1
=
[n (x)] =
[1 (x)].
1 (x) dxn1
1 (x) dxn1 n1

Luego
Pn (x) =

n Bn
n1 Pn1 (x),
B

(5.1.32)

donde Pn1 denota al polinomio ortogonal respecto a la funcion peso 1 (x) = (x)(x). O sea,
si Pn es ortogonal Pn (x) tambien lo sera.
Si escribimos la formula de Rodrigues (5.1.12) para el polinomio de grado n + 1, utilizando
la ecuacion de Pearson [(x)n (x)] = n (x)n (x) vemos que
Bn+1 dn+1 n+1
Bn+1 dn
[
(x)(x)]
=
[n (x)n (x)]
(x) dxn+1
(x) dxn


n1
Bn+1
dn n (x)
n (x)
d
=
n (x)
+ nn
.
(x)
dxn
dxn1

Pn+1 (x) =

n Bn dn1 n (x)
Utilizando ahora que
=
, obtenemos la formula de diferenciacion,
(x)(x) dxn1
com
unmente denominada caracterizacion de Al-Salam & Chihara,


Bn
n

(x)Pn (x) = n (x)Pn (x)


Pn+1 (x) ,
(5.1.33)
nn
Bn+1
Pn (x)

o, equivalentemente,


2n
n
I (x)D Pn (x) =
n Pn+1 (x).

nn
2n

(5.1.34)

Sustituyendo (5.1.22) en (5.1.34) obtenemos





2n
2n
n
(x n I + (x)D Pn (x) =
n Pn1 (x).
+
nn
2n
2n

(5.1.35)

Si ahora en la formula (5.1.33) desarrollamos n y utilizamos la relacion de recurrencia


(5.1.22) para descomponer los sumandos de la forma xPn obtenemos el siguiente teorema
Teorema 5.1.7 Los polinomios ortogonales Pn (x), soluciones de la ecuacion (5.1.7), satisfacen
la siguiente relacion de estructura

donde

(x)Pn (x) =
en Pn+1 (x) + en Pn (x) + en Pn1 (x),



Bn
n

en = n n
nn
Bn+1

n
en = [n n + n (0)] ,
nn

en =

n 0,

n n
6= 0.
n

(5.1.36)

(5.1.37)

n de Schro
dinger
Captulo 5. Resolviendo la ecuacio

82

Las expresiones (5.1.37) anteriores para los coeficientes de la relacion de estructura pueden
reescribirse usando las formulas explcitas para los coeficientes de la relacion de recurrencia de
la siguiente forma

en = n


n ,
2

en =

n
[ (0)

n n1

(0)] =

n
n (n ),
nn

en =

n n
.
n

(5.1.38)

Finalmente enunciaremos un teorema de gran importancia en lo que sigue.

Teorema 5.1.8 Los polinomios de tipo hipergeometricos (clasicos) pn (x) son las u
nicas so

luciones de
p la ecuacion hipergeometrica (z)y + (z)y + y = 0, tales que las funciones
n (x) = (x)pn (x), donde (x) es la funcion peso con respecto a la cual los pn son ortogonales, son acotadas y de cuadrado integrable en (a, b), siendo (a, b) el soporte de la funci
on
peso.
Nota 5.1.9 Si queremos que la funcion peso sea positiva e integrable en el interior del intervalo
de ortogonalidad y suponemos que (x) > 0 en dicho intervalo se puede comprobar que el
polinomio ha de cumplir dos propiedades importantes:
1. En primer lugar la derivada de ha de ser negativa. Esto es particularmente importante
en los casos cuando = 1 y = x, que corresponden a intervalos de ortogonalidad no
acotados vease el proximo apartado,
2. ha de anularse en el interior del intervalo de ortogonalidad. Ello es consecuencia de
(5.1.31) y del teorema 5.1.6 que asegura que P1 ha de anularse en el interior del intervalo
de ortogonalidad.

5.1.3.

Los polinomios de Hermite, Laguerre y Jacobi

Par
ametros principales
Comenzaremos escribiendo los principales parametros de las sucesiones de polinomios ortogonales monicos clasicos (SPOMC). Como ya hemos visto los polinomios ortogonales en la
recta real, solucion de una ecuacion del tipo (5.1.7), se pueden clasificar en tres grandes familias
en funcion del grado del polinomio ( siempre es un polinomio de grado 1). Cuando es un
polinomio de grado cero los polinomios correspondientes se denominan polinomios de Hermite
Hn (x), cuando es de grado 1, polinomios de Laguerre Ln (x) y cuando es de grado 2 con
dos races simples, polinomios de Jacobi Pn, (x), respectivamente. En las tablas 5.1 y 5.2 estan
representados los principales parametros de dichas familias, en las cuales (a)n denota al smbolo
smbolo de Pochhammer
(a)0 = 1, (a)k = a(a + 1) (a + k 1), k = 1, 2, 3, ... .
Para los polinomios se han escogido las llamadas formas canonicas.

(5.1.39)

5.1. El m
etodo de Nikiforov-Uvarov

83

Cuadro 5.1: Clasificacion de las SPO Clasicas.


Pn (x)

Hn (x)

Ln (x)

Pn, (x)

(x)

1 x2

(x)

2x

x + + 1

( + + 2)x +

2n

n(n + + + 1)

(x)

ex

x ex

(1 x) (1 + x)

> 1
ex

n (x)

, > 1

xn+ ex

(1 x)n+ (1 + x)n+

Representaci
on hipergeom
etrica
De la formula de Rodrigues4 (5.1.12) se puede obtener la representacion de los polinomios
de Hermite, Laguerre y Jacobi en terminos de la funcion hipergeometrica de Gauss 2 F1 definida
en el caso mas general de forma
p Fq

a1 , a2 , . . . , ap
b1 , b2 , . . . , bq

X

(a1 )k (a2 )k (ap )k xk
x =
.

(b1 )k (b2 )k (bq )k k!

De esta manera encontramos que




 

2
1
m

m
x , n = 2m

(1)
F

1
1
1

2 m
2
Hn (x) =

 

2

3
m

m
x , n = 2m + 1

x 1 F1
(1)
3

2 m
2

(1)n (n + + 1)
n
=
1 F1
+1
( + 1)

2n ( + 1)n
n, n + + + 1
2 F1
+1
(n + + + 1)n

Ln (x)

Pn, (x)

(5.1.40)

k=0



x ,



1 x

.
2

(5.1.41)

(5.1.42)
(5.1.43)

Como consecuencia de las formulas anteriores podemos obtener los valores de los polinomios
en los extremos del intervalo de ortogonalidad. Estos valores pueden ser obtenidos tambien a
partir de la formula de Rodrigues (5.1.12) aplicando la regla de Leibniz para calcular la n-esima
4
usar la regla de Leibnitz para calcular la n-esima derivada de un producto (f g)(n) =
Pn Para ello(k)basta
(nk)
nkf

g
. Otra posibilidad es usar series de potencias y el metodo de coeficientes indeterminados
p
k=0 t
de Euler (ver e.g. [6, 21]).

n de Schro
dinger
Captulo 5. Resolviendo la ecuacio

84

Cuadro 5.2: Parametros de las SPO Monicas (an = 1).


Pn (x)

Hn (x)

Ln (x)

Pn, (x)

Bn

(1)n
2n

(1)n

(1)n
(n + + + 1)n

bn

n(n + )

n( )
2n + +

d2n

n!
2n

(n + + 1)n!

2++2n+1 n!(n++1)(n++1)
(n+++1)(2n+++1)(n+++1)2n

1
2 2

2n + + 1

(2n++)(2n+2++)

n
2

n(n + )

4n(n+)(n+)(n++)
(2n++1)(2n++)2 (2n+++1)

en

2( )n(n + + + 1)
(2n + + )(2n + 2 + + )

en

n(n + )

4n(n + )(n + )(n + + )(n + + + 1)


(2n + + 1)(2n + + )2 (2n + + + 1)

en

derivada de un producto de funciones.

(1)m (2m)!

, n = 2m
2m m!
2
Hn (0) =

0,
n = 2m + 1
Pn, (1)

2n ( + 1)n
,
=
(n + + + 1)n

Pn, (1)

Ln (0) =

(1)n (n + + 1)
,
( + 1)
(5.1.44)

(1)n 2n ( + 1)n
=
.
(n + + + 1)n

Casos particulares
1. Los polinomios de Legendre Pn (x) = Pn0,0 (x).
2. Los polinomios de Chebyshev de primera especie Tn (x)
12 , 21

Tn (x) = Pn

(x) =

1
2n1

cos[n arc cos(x)].

3. Los polinomios de Chebyshev de segunda especie Un (x)


1 1

Un (x) = Pn2 2 (x) =

1 sen[(n + 1) arc cos(x)]


.
2n
sen[arc cos(x)]

n de la ecuacio
n de Schro
dinger
5.2. Resolucio
12 , 12

4. Los polinomios de Gegenbauer Gn (x) = Pn

85

(x), > 21 .

Utilizando la formula (5.1.32) se obtienen las ecuaciones ( = 1, 2, 3, ..., n = 0, 1, 2, ...):


(Hn (x))() =

n!
Hn (x),
(n )!

(5.1.45)

n!
L+ (x),
(n )! n
n!
+,+
Pn
(x),
=
(n )!

(Ln (x))() =
(Pn, (x))()

(5.1.46)
(5.1.47)

donde (Pn (x))() denota la esima derivada de Pn (x).

5.2.

Resoluci
on de la ecuaci
on de Schr
odinger

Veamos ahora algunos ejemplos sencillos de como se usa el metodo de Nikiforov y Uvarov
para resolver algunas ecuaciones de la Mecanica cuantica.

5.2.1.

El oscilador arm
onico cu
antico unidimensional

Como ejemplo apliquemos la tecnica anterior al caso del oscilador armonico cuantico.
Partimos de la ecuacion de Schrodinger para el oscilador armonico
~2
1
(x) + m 2 x2 (x) = E(x),
x R.
2m
2
p
Haciendo el cambio x = x0 , x0 = ~/(m), E = ~/2, se transforma en la ecuacion

() + ( 2 )() = 0,

que obviamente es del tipo (5.1.1) con e() = 0, () = 1 y


e() = 2 . Para (), (5.1.5)
nos da
p
() = 2 + (k ).

Como el polinomio 2 + (k ) ha de ser un cuadrado perfecto, entonces k = y, por tanto,


() = , luego
() = ,

() = 1,

= + 1,

() = 2,

() = ,

() = 1,

= 1,

() = 2,

que nos conducen a las ecuaciones


y () + 2y () + ( + 1)y() = 0,

y () 2y () + ( 1)y() = 0,

respectivamente. En cada caso la funcion () es la solucion de las ecuaciones / = y


/ = , que conducen a las funciones
() = e

2 /2

() = e

2 /2

n de Schro
dinger
Captulo 5. Resolviendo la ecuacio

86

respectivamente. Finalmente, la ecuacion y () 2y () + ( 1)y() = 0 corresponde a


la ecuacion hipergeometrica de los polinomios de Hermite, por tanto tenemos 1 = 2n,
n = 0, 1, 2, . . . y las soluciones normalizadas de nuestra ecuacion original seran
() = Nn e

2 /2

Hn (),

Para calcular Nn notamos que


Z
Z
2
()()d = Nn

= 2n + 1,

2
Hn2 ()e

d =

Entonces de la condicion de normalizacion


Z
Z
2
1=
|(x)| dx = x0
luego Nn =

n = 0, 1, 2, . . . .

Nn2 d2n ,

d2n

(5.2.1)

n!
.
2n

()()d,

p
2n

, x0 = ~/(m).
x0 n!

Es facil ver que la otra ecuacion tiene como soluciones los polinomios Hn (), por lo que
2
sus soluciones () = e /2 Hn () no son de cuadrado integrable en R, y por tanto no tienen
sentido fsico (esto se poda predecir si tenemos en cuenta la nota 5.1.9 del apartado anterior).
De esta forma las u
nicas soluciones estacionarias del oscilador armonico son las funciones (5.2.1)
anteriores.
|0 |2
|1 |2
0,5

0,5

0,4

0,4

0,3

0,3

0,2

0,2

0,1

0,1

|2 |

0,5

0,5

0,4

0,4

0,3

0,3

0,2

0,2

0,1
6

|10 |

0,1
2

Figura 5.1: Estado fundamental 0 y excitados n , n = 1, 2 y 10 del oscilador armonico.


As pues, a diferencia del oscilador clasico, el oscilador cuantico tiene una energa discreta
definida por la expresion En = ~(n + 1/2), n = 0, 1, 2, . . . correspondiente al estado
s
 
 2
p
2n
x
12 xx
0

, n = 0, 1, 2, . . . , x0 = ~/(m).
(x) =
Hn
e
x0 n!
x0
Finalmente, mencionemos que las autofunciones del oscilador definen una base ortogonal
completa en el espacio de las funciones de cuadrado integrable y por tanto las podemos usar
para desarrollar en la misma cualquier funcion de este espacio.

n de la ecuacio
n de Schro
dinger
5.2. Resolucio

5.2.2.

87

La ecuaci
on de Schr
odinger en un potencial central

Partiremos de la ecuacion de Schrodinger estacionaria para el atomo de hidrogeno en coordenadas esfericas5


~2

(r, , ) + V (r)(r, , ) = E(r, , ),


(5.2.2)
2m
donde m es la masa del electron (que se supone despreciable respecto a la masa del n
ucleo),
[0, 2), [0, ], y el laplaciano en coordenadas esfericas tiene la forma






1

1 2
1
2
r
+ 2
sen
+
,
r
r
sen

sen2 2

1
= 2
r r

(5.2.3)

o bien
= r +
donde
1
r = 2
r r

r
r
2

1
,
r2

1
=
sen




1 2
sen
+

sen2 2

denotan a los laplacianos radial y angular respectivamente.


Por simplicidad vamos a reescribir la ecuacion anterior en la forma



1
r + 2 (r, , ) + [ v(r)](r, , ) = 0,
r

(5.2.4)

donde v(r) = 2m/~2 V (r) y = 2m/~2 E.


Separando las variables (r, , ) = F (r)Y (, ) obtenemos las ecuaciones
Y (, ) + Y (, ) = 0,
h
i
r F (r) + v(r) 2 F (r) = 0,
r

(5.2.5)

donde es cierta constante a determinar.


Notese ademas que la condicion de normalizacion
Z

|(r, , )|2r 2 sen dddr = 1,

se transforma en
Z

|Y (, )| sen dd = 1 y

|F (r)|2r 2 dr = 1.

(5.2.6)

5
Al ser el potencial de interacci
on V (r) un potencial central, i.e., solo depende del radio, es mas sencillo
resolver la ecuaci
on en coordenadas esfericas r, , .

n de Schro
dinger
Captulo 5. Resolviendo la ecuacio

88

5.2.3.

Los arm
onicos esf
ericos

Comencemos por la primera de las dos ecuaciones anteriores. Separando variables Y (, ) =


()() obtenemos las siguientes dos ecuaciones
() + () = 0,



()
sen
sen
+ [ sen2 ]() = 0,

(5.2.7)

donde es cierta constante.


Asumamos que la funcion es univalente, entonces, de la condicion de periodicidad ( +
2) = () se sigue que = m2 , m Z. Luego
m () = Cm eim ,

m Z.

Notese que las funciones m () son ortogonales


Z 2
m ()m ()d = n mm ,
0

2
con n = 2Cm
. Si queremos que sean normalizadas a la unidad entonces Cm = 1/ 2.
As tenemos las soluciones
1
m () = eim ,
m Z.
(5.2.8)
2
La segunda ecuacion en (5.2.7) se transforma entonces en


()

sen
+ [ sen2 m2 ]() = 0,
sen

Haciendo el cambio x = cos obtenemos6




2 (x)
2 d
(1 x )
+ [(1 x2 ) m2 ](x) = 0,
(1 x )
dx
x
o, equivalentemente,

 

m2
d
2 (x)
(1 x )
+
(x) = 0
dx
x
1 x2
(x)

(1 x2 ) m2
2x

(x)
+
(x) = 0.
1 x2
(1 x2 )2

Esta ecuacion del tipo (5.1.1) con


e(x) = 2x,

luego el polinomio (5.1.6)

es un cuadrado perfecto si:


6

e(x) = (1 x2 ) m2 ,

= 1 x2 ,

(x) = ( k)x2 + (k ) + m2

N
otese que si x = cos , entonces d/d = dx/d d/dx = sen d/dx, y sen =

1 x2 .

(5.2.9)

n de la ecuacio
n de Schro
dinger
5.2. Resolucio
1. k =

2. k = m2

(x) = m
=

89

(x) = 2(x m), m = 0, 1, 2, . . . ,

(x) = mx

(x) = 2(m + 1)x, m = 0, 1, 2, . . . .

Si ahora tenemos en cuenta la nota 5.1.9 tenemos que de las cuatro opciones debemos escoger
(x) = 2(m + 1)x correspondiente a (x) = mx, k = m2 , = k + = m(m + 1).
Para calcular7 usamos (5.1.2) que nos da

mx
=

1 x2

(x) = (1 x2 )m/2 .

La ecuacion de tipo hipergeometrico que obtenemos es, por tanto,


(1 x2 )y 2(m + 1)xy + y = 0,
que tiene soluciones polinomicas seg
un (5.1.15) cuando = n(2m + n + 1), luego
= (m + n)(n + m + 1),

n, m = 0, 1, 2, . . . .

En adelante definiremos l = m + n, l = 0, 1, 2, . . . . Entonces, n = l m 0, y por tanto8


m,m
y(x) = Plm
(x),
m,m
donde Plm
son los correspondientes polinomios de Jacobi. As. para m 0 la solucion de
(5.2.9) tiene la forma
m,m
l m (x) = Clm (1 x2 )m/2 Plm
(x).

Notese que
Z 1
Z
l m (x)l m (x)dx = Clm Cl m
1

m,m
2 m
Plm
(x)Plm,m
m (x)(1 x ) dx = 0,

l 6= l ,

ademas, si l = l , y haciendo n = l m
Z 1
Z 1
22l+1 (l m)!(l + m)!(l!)2
2
[l m (x)] dx =
[Pnm,m (x)]2 (1 x2 )m dx =
,
(2l + 1)!(2l)!
1
1
luego si queremos que l m (x) sean ortonormales, es decir que se cumpla la segunda condicion
de (5.2.6) basta definir
s
(2l)!
2l + 1
Clm =
.
2l+1
l!
2
(l m)!(l + m)!
As
(2l)!
l m (x) =
l!

22l+1 (l

2l + 1
m,m
(1 x2 )m/2 Plm
(x),
m)!(l + m)!

l 0,

m = 0, 1, . . . l. (5.2.10)

7
No confundir la funci
on (x) con el
angulo en coordenadas esfericas. Abusando de la paciencia del lector
y para no introducir otra notaci
on diferente hemos optado por mantener la notaci
on original de [16].
8
N
otese que l m 0. Es decir, si fijamos l, entonces m = 0, 1, 2, . . . l.

n de Schro
dinger
Captulo 5. Resolviendo la ecuacio

90

Solo nos queda pendiente analizar que ocurre si m < 0 (ver (5.2.8)). Para ello escribiremos
(m,m)
(5.2.10) usando la expresion analtica de Plm (x) mediante la formula de Rodrigues (5.1.17)
s
lm
(1)lm (2l + 1)(l + m)!
2 m/2 d
l m (x) =
(1

x
)
[(1 x2 )l ]
(5.2.11)
l!
22l+1 (l m)!
dlm x
Si ahora usamos la ecuacion (5.1.47) tenemos
(l m)! dm
Pl (x),
l!
dm x
donde Pl (x) son los polinomios de Legendre de grado l, expresados analticamente mediante la
formula de Rodrigues
(1)l l! dl
Pl (x) =
[(1 x2 )l ]
l
(2l)! d x
Combinado las dos expresiones anteriores con (5.2.10) tenemos otra representacion de las funciones l m (x)
s
l
l+m
(1) (2l + 1)(l m)!
2 m/2 d
l m (x) =
(1

x
)
[(1 x2 )l ].
(5.2.12)
2l+1
l+m
l!
2
(l + m)!
d x
m,m
Plm
(x) =

Comparando (5.2.11) y (5.2.12) se deduce que


l m (x) = (1)m l m (x),

m = 0, 1, 2, . . . , l.

La expresion anterior permite definir la funcion l m (x) para m < 0. As, para = l(l + 1),
l = 0, 1, 2, . . . y m = l, l + 1, . . . , l, tenemos que las funciones Y (, ) := Yl m (, ) se define
por la expresion
1
(5.2.13)
Yl m (, ) = eim l m (cos ), l = 0, 1, 2, . . . , m = l, l + 1, . . . , l.
2
Estas funciones se denominan armonicos esfericos.

5.2.4.

Resolviendo la parte radial de la ecuaci


on de Schr
odinger

De los resultados del apartado anterior se sigue que (5.2.5) se transforma en




l(l + 1)
r F (r) + v(r)
F (r) = 0.
r2

Para resolver esta ecuacion hacemos el cambio9 F (r) = R(r)/r que nos conduce a la ecuacion


l(l + 1)

R(r) = 0,
(5.2.14)
R (r) + v(r)
r2
donde ahora la primera de las condiciones de contorno (5.2.6) se transforma en
Z
|R(r)|2dr = 1.
0

La ecuacion (5.2.14) sera nuestro punto de partida para resolver dos casos de extrema
importancia en las aplicaciones: el atomo de hidrogeno y el oscilador armonico tridimensional.
9

La raz
on fundamental es que

1
r 2 r


r2 Fr(r) =

1 2
r r 2 [rF (r)].

n de la ecuacio
n de Schro
dinger
5.2. Resolucio

91

El
atomo de hidr
ogeno
Puesto que para el atomo de hidrogeno V (r) = /r, (5.2.14) tiene la forma


2m 
 l(l + 1)

R (r) +

E+
R(r) = 0.
~2
r
r2
Haciendo el cambio = r/a0 , donde a0 = ~2 /(m), y = a0 E/, la ecuacion anterior se
transforma en la ecuacion adimensional
 


1
l(l + 1)

R () + 2 +

R() = 0.

2
Esta ecuacion es del tipo (5.1.1) con
() = ,
Por tanto, tenemos

e() = 2 2 + 2 l(l + 1),

1
() =
2

e() = 0.

1
2 2 2r + l(l + 1) + k.
4

2
Como () = 1/4 2
2r + l(l + 1) + k a de ser un cuadrado perfecto (en la variable ),
tenemos que k = 2 2(2l + 1), luego para () tenemos las siguientes cuatro opciones




1
1
1
1
() = + 2 l +
, () = 2 l +
.
2
2
2
2

Como () = 2(), tenemos, usando la nota 5.1.9 que < 0, luego < 0 de donde eliminamos las dos primeras. De las dos posibilidades restantes para el polinomio () seleccionamos,
siguiendo nuevamente la nota 5.1.9, la que conduce a una funcion que se anule para alg
un
> 0, es decir

() = 2 + (l + 1) .

Dicha solucion corresponde a k = 2 2(2l + 1), luego la otra posibilidad, como se puede
comprobar, conduce a una funcion no integrable en (0, +)

() = 2(l + 1 2) = k + () = 2(1 (l + 1) 2).


Usando (5.1.2) tenemos

()
l + 1 2
=
()

() = l+1e

Entonces la solucion de nuestra ecuacion es del tipo R() = l+1e 2 y(), siendo y la solucion
de la ecuacion

y () + [2(l + 1) 2]y () + y() = 0.

El cambio lineal x = 2 2 nos transforma la ecuacion anterior en la ecuacion


e
xy (x) + [(2l + 1) + 1 x]y (x) + y(x)
= 0,

e = ,

2 2

n de Schro
dinger
Captulo 5. Resolviendo la ecuacio

92

quecorresponde a los polinomios de Laguerre L2l+1


(x). Ademas, como e
= n, entonces =
n

2n 2. Por otro lado, = k + (), luego


:= n,l =

1
,
2(n + l + 1)2

n, l = 0, 1, 2, . . .

As, fijados n y l, n, l = 0, 1, 2, . . . la solucion es


p
x = 2 2n,l ,

Rn l () = Nn,l xl+1 ex/2 L2l+1


(x),
n
con Nn,l tal que
Z

Rn2 l (r)dr

=1

a0

Rn2 l ()d

=1

a0 (n + l + 1)
2

Rn2 l (x)dx = 1.

|Rn,l |2
0,5
0,4

|R0,0 |2

0,3
0,2
0,1
5

15

10

20

25

|Rn,l |2

|R1,0 |2
|R1,1 |2

0,5
0,4

|R1,2 |2

0,3
0,2
0,1
10

20

30

40

50

Figura 5.2: Estado fundamental (arriba) y excitados n = 1, l = 0, 1, 2 (abajo) del atomo de


Hidrogeno.

Ahora bien,
Z
Z
2
2
Rn l (x)dx = Nn,l
0

0
2
Nn,l n d2n

2l+2 x

(L2l+1
(x))2 dx
n

2
Nn,l
2(n

2
Nn,l

(x)x(L2l+1
(x))2 dx
n

+ l + 1)n!(n + 2l + 2),

n de la ecuacio
n de Schro
dinger
5.2. Resolucio

93

donde hemos usado la relacion de recurrencia (5.1.22) para el producto x L2l+1


(x) y luego la
n
ortogonalidad. Por tanto
s
1
Nn,l =
.
2
a0 (n + l + 1) n!(n + 2l + 1)!
Entonces teniendo en cuenta que la parte radial es F (r) = R(r)/r, las autofunciones de la
ecuacion de Schrodinger para el atomo de hidrogeno (5.2.2) tienen la forma
n,l,m(r, , ) =
donde x =

2r
,
a0 (n+l+1)

2xl ex/2
p
L2l+1
(x)Yl m (, ),
n
2
a0 (n + l + 1) a0 n!(n + 2l + 1)!

n, l = 0, 1, 2, . . .

a0 = ~2 /(m) y sus correspondientes autoenergas E son por tanto

En,l =

m2 1
1
m2
=

,
2~2 (n + l + 1)2
2~2 n 2

n = 1, 2, 3, . . .

que, teniendo en cuenta que = e2 , nos conduce a la misma expresion10 de Bohr (2.3.1).

5.2.5.

El oscilador arm
onico tridimensional

Para el oscilador armonico tridimensional V (r) = 21 m 2 r 2 , as que (5.2.14) se convierte en






1
l(l + 1)
2m
2 2

E m r
R(r) = 0.
R (r) +
~2
2
r2
p
Haciendo el cambio = r/r0 , donde r0 = ~/(m), y E = (~/2) la ecuacion anterior se
transforma en la ecuacion adimensional


l(l + 1)

2
R() = 0.
R () +
2
Para convertir esta ecuacion en una del tipo (5.1.1) hacemos el cambio z = 2 , as tendremos
R (z) +

1
z z 2 l(l + 1)
R (z) +
R() = 0.
2z
4 2

donde tendremos
(z) = 2z,
Por tanto, tenemos

e(z) = z z 2 l(l + 1),

1 p
(z) = (z),
2

e() = 1.

2

1
,
(z) = z + (2k )z + l +
2
2

y para que este sea un cuadrado perfecto en z, k debe tomar los valores k = /2 l +
luego para (z) tenemos las siguientes dos opciones

1
2

(z) = z + l + 1.
10

En nuestra f
ormula n no representa al n
umero cuantico principal. Este correspondera al valor n = n+ l + 1.

n de Schro
dinger
Captulo 5. Resolviendo la ecuacio

94

Como (z) = 1 + 2(z), tenemos, usando la nota 5.1.9 que < 0, luego < 0 de donde
deducimos que
(z) = z + l + 1,

1
que corresponde a k = /2 l + 2 , luego
(z) = 2z + 2l + 3

= k + (z) =

3
l .
2
2

Usando (5.1.2) tenemos


z + l + 1
(z)
=
(z)
2z

(z) = z (l+1)/2 ez/2 .

Entonces la solucion de nuestra ecuacion es del tipo R(z) = z (l+1)/2 ez/2 y(z), siendo y la solucion
de la ecuacion

zy (z) + [z + l + 3/2]y (z) + y(z) = 0.


2
l+1/2
que corresponde a los polinomios de Laguerre Ln (z). Ademas, como /2 = n, y = k +
(z) = 2 l 23 , luego


3
,
n, l = 0, 1, 2, . . .
:= n,l = 2 2n + l +
2
As, fijados n y l, la parte radial es Fn l (r) = Rn l (r)/r donde
Rn l (z) = Nn,l z
con Nn,l tal que
pero
Z

Rn2 l ()d

(l+1)/2 z/2

Rn2 l (r)dr

2
Nn,l

=1

Ll+1/2
(z),
n

2
Nn,l
R(z)2
dz =
2z
2

z= =

r0

r
r0

5.3.1.

Rn2 l ()d = 1,

z l+1/2 ez (Ll+1/2
(z))2 dz =
n
l+1/2

donde d2n es el cuadrado de la norma de los polinomios de Laguerre Ln


l + 3/2). Luego
s
2
.
Nn,l =
r0 n!(n + l + 3/2)

5.3.

2

2
Nn,l
,
2

, i.e., d2n = n!(n +

El m
etodo de factorizaci
on de Schr
odinger
Introducci
on

El objetivo de este apartado es estudiar un metodo sencillo que permite resolver ecuaciones diferenciales de Sturm-Liuville. El metodo debe su popularidad fundamentalmente a
Schrodinger que lo uso para resolver la ecuacion de Schrodinger para muchos sistemas fsicos
reales.
Actualmente el metodo se le conoce como metodo de factorizacion de Infeld y Hull debido
al estudio detallado que estos autores hicieron en [13].

n de Schro
dinger
5.3. El m
etodo de factorizacio
PSfrag

95

|Rn,l |2

|R0,0 |2

0,8

|R1,0 |2

0,6

|R2,0 |2

0,4
0,2
1

|Rn,l |2

|R0,2 |2

0,8

|R1,2 |2

0,6

|R2,2 |2

0,4
0,2
1

Figura 5.3: Estado con l = 0, n = 0, 1, 2 (arriba) y l = 2, n = 0, 1, 2 (abajo) del oscilador


cuantico tridimensional.

5.3.2.

El oscilador arm
onico

Sea la ecuacion de Schrodinger para el oscilador armonico


H (x) := (x) + x2 (x) = (x),

(5.3.1)

que escribiremos convenientemente en la forma


(D 2 x2 I) (x) = (x),

donde D :=

d
,
dx

(5.3.2)

e I es el operador identidad.
Si operamos formalmentepodemos sustituir x2 D 2 por la correspondiente diferencia de
cuadrados (x D)(x + D) o (x + D)(x D). En la practica esto no es del todo cierto pues
x2 D 2 es un operador y obviamente no tiene por que tener lugar las expresiones anteriores
como de hecho ocurre. No obstante
(x D)(x + D) (x) =(xI D)(x (x) + (x)) = (x) + x2 (x) (x)
=H (x) (x) = ( 1) (x),
y
(x + D)(x D) (x) =(xI + D)(x (x) (x)) = (x) + x2 (x) + (x)
=H (x) + (x) = ( + 1) (x).

n de Schro
dinger
Captulo 5. Resolviendo la ecuacio

96

Lo anterior nos conduce a definir dos operadores


H+ := x + D,

H := x D

para los que se cumple


H H+ (x) = ( 1) (x),

(5.3.3)

H+ H (x) = ( + 1)(x),

(5.3.4)

H (x) = (H H+ + I) (x) = (x).

(5.3.5)

y
Aplicando H+ a (5.3.3) tenemos

(H+ H )H+ (x) = ( 1)H+ (x),


que al compararla con (5.3.4) nos conduce a11
H+ (x) = ()2 (x).

(5.3.6)

Analogamente, aplicando H a (5.3.4) tenemos


(H H+ )H (x) = ( + 1)H (x),
que al compararla con (5.3.3) nos da
H (x) = ()+2(x).

(5.3.7)

De lo anterior se deduce que H es un operador ascenso(raising) y H+ es un operador


descenso(lowering).12
Sea ahora el conjunto de las funciones (x) tales que (a) = (b) = 0 (a, b R ) y
definamos en dicho espacio el producto escalar13
Z b
h, i = (x)(x) dx.
a

Notese que H = H .
Los operadores H+ y H son uno el adjunto del otro. En efecto,
Z b
Z b
Z b
(x)H+ (x)dx = (x)x(x)dx + (x) (x)dx
a
a
a
b Z
Z b

b

= (x)x(x)dx + (x)(x) (x)(x)dx

a
a
a
Z b
Z b
= (x D)(x)(x)dx = H (x)(x)dx
a

11
N
otese que de (5.3.4) se deduce que el operador H+ H tiene como autovectores y sus correspondientes
autovalores son + 1, por tanto la expresion anterior indica que H+ son los autovectores correspondientes a
2 de donde se sigue que han de ser proporcionales a 2 .
12
Pues aumentan o disminuyen el valor del autovalor, i.e., suben o bajan por el espectro de H.
13
Aqu la operaci
on a denota al complejo conjugado de a. En general trabajaremos en el espacio de funciones
reales.

n de Schro
dinger
5.3. El m
etodo de factorizacio

97

es decir hH , i = h, H+ i.

Como consecuencia de lo anterior se sigue que H := D 2 + x2 = H H+ + I es autoadjunto


y por tanto (ver Proposicion 4.2.12) sus autovalores son reales. Ademas, si 6= entonces
es ortogonal a (ver Proposicion 4.2.13).
Supongamos que | |2 es integrable. Calculemos

k2 k2 :=h2 , 2 i = 2 ()hH+ , H+ i = 2 ()h , H H+ i


=2 ()( 1)h , i = 2 ()( 1)k k2 ,

luego
k2n k2 =

(5.3.8)

( n)
( 1) ( 2)
2
k k2 .
2
2
() ( 1)
( n + 1)

Obviamente para cada fijo, existira un n tal que n + 1 > 0, n 0, por tanto el
proceso H+ H+ debe de culminar en alg
un momento, i.e., debe existir una funcion que
denotaremos por 0 (x) tal que
H+ 0 (x) = 0,
o, equivalentemente, para cierto 0 , (0 ) = 0.
En este caso la ecuacion (5.3.5) nos da H0 = 0 0 ,
(H H+ + I)0 (x) = 0 0 (x)

0 = 1.

As pues aplicando H consecutivamente a 0 obtendremos los valores para = 1, 3, 5, . . . , 2N+


1, . . . . En general tenemos n = 2n + 1, n = 0, 1, 2, . . . .
Analogamente
k+2 k2 = 2 ()( + 1)k k2 .

(5.3.9)

Lo anterior nos indica que conviene escribir la funcion n como n (n 2 se convierte en


n1 y n +2 se convierte en n+1 ). Luego tenemos las ecuaciones
H+ 0 (x) = 0,

H+ n = n n1 ,

H n = n n+1 ,

n = 0, 1, 2, . . . ,

donde hemos denotado por n := (n ) y n := (n ).


Ademas (5.3.8) implica kn1 k2 = 2nn2 kn k2 y (5.3.9) implica kn+1 k2 = (2n+2)n2 kn k2 .
Si queremos que los operadores H+ y H mantengan invariante
la norma
de las funciones n

entonces de las formulas anteriores se deduce que n = 2n y n = 2n + 2. As tenemos

H+ n = 2n n1 ,
H n = 2n + 2 n+1 , n = 0, 1, 2, . . . .
Finalmente, usando que H+ 0 (x) = 0, k0 k = 1, obtenemos las soluciones normalizadas
x0 (x) + 0 (x) = 0
y [H ]n 0 (x) =

p
(2n)!!n (x), luego

n (x) =

1 x2 /2
e
,
0 (x) =
4

1
1
2
2
p
[H ]n ex /2 = 1 p
[xI D]n ex /2 .

(2n)!!
4 (2n)!!
1
4

Esta forma de resolver el problema del oscilador armonico cuantico es totalmente analoga
a la del apartado 5.2.1.

n de Schro
dinger
Captulo 5. Resolviendo la ecuacio

98

5.3.3.

El m
etodo de factorizaci
on

En este apartado vamos a generalizar el ejemplo anterior a ecuaciones algo mas generales.
Partiremos de la ecuacion diferencial lineal de segundo orden (de Sturm-Liouville)
y (x) + r(x, m)y(x) + y(x) = 0,

m = 0, 1, 2, . . .

(5.3.10)

o, equivalentemente14 ,
Hm y(x, m, ) = y(x, m, ),

Hm := D 2 r(x, m)I.

(5.3.11)

La funcion r(x, m) se suele denominar funcion potencial y a Hm , hamiltoniano. Aqu m es


un parametro y es el correspondiente autovalor. En adelante asumiremos que y m son
independientes.
Definici
on 5.3.1 Diremos que la ecuacion diferencial ordinaria (EDO) (5.3.10) es factorizable
si la podemos cambiar por cada una de las siguientes ecuaciones
H+m+1 Hm+1 y(x, , m) = [ L(m + 1)]y(x, , m),
Hm H+m y(x, , m) = [ L(m)]y(x, , m),

(5.3.12)
(5.3.13)

donde L(m) son ciertas constantes y

Hm = k(x, m)I

d
,
dx

H+m = k(x, m)I +

d
.
dx

(5.3.14)

Los operadores Hm se conocen como operadores escalera. Notese ademas que ambos operadores Hm son de orden 1.
Teorema 5.3.2 Si y(x, , m) es solucion de y (x) + r(x, m)y(x) + y(x) = 0, entonces
Hm+1 y(x, , m) = (, m)y(x, , m + 1),

(5.3.15)

H+m y(x, , m) = (, m)y(x, , m 1).

(5.3.16)

Demostracion: Aplicando Hm+1 a (5.3.12), obtenemos


Hm+1 H+m+1 [Hm+1 y(, m)] = [ L(m + 1)][Hm+1 y(, m)],

y comparando el resultado con (5.3.13) deducimos (5.3.15). Analogamente, si aplicamos H+m+1


a (5.3.13), obtenemos
H+m Hm [H+m y(, m)] = [ L(m)][Hm y(, m)],
que al compararlo con (5.3.12), nos conduce a (5.3.16).

En adelante, denotaremos m := (, m), m := (, m).


Como en el caso del oscilador armonico vamos a considerar el conjunto de las funciones
(x) tales que (a) = (b) = 0 (a, b R ) y en dicho espacio definiremos el producto
escalar
Z
b

h, i =

14

(x)(x)dx.

Hemos decidido mantener en la medida de lo posible la notaci


on original de [13], por lo que aqu Hm denota
d2
al operador dx2 + r(x, m)I, y no a la potencia m-esima de H.

n de Schro
dinger
5.3. El m
etodo de factorizacio

99

Teorema 5.3.3 Los operadores H+m y Hm son adjuntos entre s, i.e.,


hHm , i

Hm

dx =

H+m dx = h, H+m i

(5.3.17)

Demostracion: Ante todo notemos que si k(x, m) es una funcion real entonces Hm = Hm . En
adelante asumiremos que k(x, m) es real. Entonces
Z

(x)Hm (x)dx

(x) (x)dx
b Z
Z b

b

= (x)k(x, m)(x)dx (x)(x) + (x)(x)dx

a
a
a
Z b
Z b
= (k(x, m) + D)(x)(x)dx = H+m (x)(x)dx,
=

(x)k(x, m)(x)dx

es decir hHm , i = h, H+mi.

Notese tambien que el hamiltoniano Hm es un operador autoadjunto. Ello se deduce de las


expresiones
Hm = H+m+1 Hm+1 + L(m + 1)I = Hm H+m + L(m)I
o directamente de (5.3.11). Ademas, como es autoadjunto, entonces sus autovalores son reales
y las autofunciones correspondientes a diferentes autovalores son ortogonales.
El objetivo fundamental del metodo es poder resolver EDOs de una forma sencilla y razonable obteniendo soluciones buenas. As, sera deseable que si partiesemos de una funcion
y(x, , m) de cuadrado integrable las operaciones Hm+1 y(x, , m) y H+m y(x, , m) dieran como
resultado funciones de cuadrado integrable.
Esta condicion la asumiremos (su demostracion es bastante engorrosa), no obstante en los
ejemplos veremos facilmente que se cumple, es decir que partiendo de una y(x, , m) de cuadrado
integrable y(x, , m 1) tambien lo sera. Ademas, nos restringiremos a EDOs cuyos coeficientes
tienen singularidades a lo sumo en el extremo del intervalo (a, b) lo cual reduce el analisis de la
integrabilidad cuadratica de las soluciones a su comportamiento en dichos extremos.
Teorema 5.3.4 (Clase I) Sea L(m) una funcion creciente en 0 < m M (M puede ser
+), m Z y supongamos que
max[L(M), L(M + 1)].
Entonces para que la EDO y (x) + r(x, m)y(x) + y(x) = 0 tenga una sucesion de soluciones
integrables es necesario que exista un l N tal que
= l = L(l + 1).
l
Ademas para ese l, y denotando ym
(x) := y(x, L(l + 1), m) tenemos

Hl+1 yll (x) = 0

yll (x) = e

k(x,l+1)dx

n de Schro
dinger
Captulo 5. Resolviendo la ecuacio

100

y, entonces para m = 0, 1, . . . , l 1, l,
l
H+m ym
(x) =

y, por tanto,
"

l
Y

1
l
p
ym
(x) =
L(l + 1) L(k)
k=m+1

l
L(l + 1) L(m) ym1
(x),

H+m+1 H+m+2 H+l yll (x),

(5.3.18)

m < l.

(5.3.19)

l
Notese que, si kyll k = 1, entonces las funciones ym
son ortonormales.

Demostracion: Asumamos que y(x, , m) es de cuadrado integrable en (a, b). Entonces, y(x, , m+
1) tambien lo sera. En efecto como
Hm+1 y(x, , m) = m y(x, , m + 1),
tenemos
Z

b
2

[y(x, , m + 1)] dx

2
=m

[Hm+1 y(x, , m)]2 dx


a
Z b
2
= m
y(x, , m)H+m+1 Hm+1 y(x, , m)]dx
a
Z
L(m + 1) b
[y(x, , m)]2 dx.
=
2
m
a

Luego para l > m,


Z
Z b
L(l + 1) b
L(m + 1)
2

[y(x, , m)]2 dx.


[y(x, , l + 1)] dx =
2
2

a
a
m
m
Ahora bien, como L(m) es creciente entonces existira un l tal que L(l + 1) > , lo cual implica
que = L(l + 1) o y(x, , l + 1) 0. En caso que y(x, , l + 1) 0, usando (5.3.15) tenemos
Hl+1y(x, , l) = 0,
y por tanto, asumiendo que y(x, , l) 6= 0, (5.3.12) nos da
H+l+1 Hl+1 y(x, , l) = [ L(l + 1)] y(x, , l)
| {z }
|
{z
}
=0

L(l + 1) = 0.

6=0

Ademas, si queremos que el operador Hm+1 mantenga la normalizacion entonces m =


De forma analoga pero usando (5.3.16) y (5.3.13) tenemos que

L(l + 1) L(m)
L(m)
2
ky(x,
,
m)k
=
ky(x, , m)k2,
2
2
m
m
p
de donde se sigue que m = L(l + 1) L(m).

L(l + 1) L(m + 1

ky(x, , m 1)k2 =

l
As pues, denotando por ym
(x) := y(x, L(l + 1), m) tenemos que (5.3.15) se transforma en
p
l
l
Hm+1 ym
(x) = L(l + 1) L(m + 1) ym+1
(x), m < l,
(5.3.20)

n de Schro
dinger
5.3. El m
etodo de factorizacio

101

y, en particular,
Hl+1yll (x) = 0,
as que usando (5.3.16)
l
(x) =
H+m ym

l
L(l + 1) L(m) ym1
(x),

(5.3.21)

de donde, por induccion se deduce (5.3.19).

De forma totalmente analoga se tiene el siguiente


Teorema 5.3.5 (Clase II) Sea L(m) una funcion decreciente en 0 m M (M puede ser
+, m Z y supongamos que L(0). Entonces para que la EDO y (x) + r(x, m)y(x) +
y(x) = 0 tenga una sucesion de soluciones integrables es necesario que exista un l N tal que
:= l = L(l),
l
Ademas, denotando por ym
(x) := y(x, L(l), m), tenemos
p
l
l
H+m ym
(x) = L(l) L(m) ym1
(x),

y, en particular,

H+l yll (x) = 0

yll (x) = e

(5.3.22)

k(x,l)dx

Ademas, para m = l, l + 1, . . . tenemos


l
Hm+1 ym
(x) =

y por tanto,
l
ym
(x) =

"m1
Y
k=l

1
p
L(l) L(k + 1)

l
L(l) L(m + 1) ym+1
(x),

Hm Hm1 Hl+1 yll (x),

(5.3.23)

m > l.

(5.3.24)

La demostracion es analoga y la omitiremos.


Veamos ahora bajo que condiciones podemos factorizar la ecuacion (5.3.10).
Partimos de la expresion (5.3.12)
(k(x, m + 1) + D)(k(x, m + 1) D)y(x) = [ L(m + 1)]y(x)
(k(x, m + 1) + D)(k(x, m + 1)y(x) y (x)) = [ L(m + 1)]y(x)
k 2 (x, m + 1)y(x) + k (x, m + 1)y(x) y (x) = [ L(m + 1)]y(x).
Si eliminamos y usando la ecuacion diferencial (5.3.10) y cambiamos m por m 1 obtenemos
k 2 (x, m) + k (x, m) + L(m) = r(x, m 1).
Si ahora usamos (5.3.13)
(k(x, m) D)(k(x, m) + D)y(x) = [ L(m)]y(x)
(k(x, m) D)(k(x, m)y(x) + y (x)) = [ L(m)]y(x)
k 2 (x, m)y(x) k (x, m)y(x) y (x) = [ L(m)]y(x),

(5.3.25)

n de Schro
dinger
Captulo 5. Resolviendo la ecuacio

102

y nuevamente eliminamos y usando la ecuacion diferencial (5.3.10) obtenemos


k 2 (x, m) k (x, m) + L(m) = r(x, m).

(5.3.26)

Restando y sumando (5.3.25) y (5.3.26) obtenemos, respectivamente


L(m) =

r(x, m) + r(x, m 1)
k 2 (x, m),
2

r(x, m) r(x, m 1)
.
2
Derivando la primera de las expresiones respecto a x y sustituyendo el resultado en la segunda
deducimos que15
r (x, m) + r (x, m 1)
k(x, m) =
.
2(r(x, m) r(x, m 1))
k (x, m) =

Ahora bien, para que la EDO (5.3.10) sea factorizable L(m) ha de ser independiente de x.
As pues hemos probado el siguiente

Teorema 5.3.6 La EDO y (x) + r(x, m)y(x) + y(x) = 0 es factorizable en el sentido de la


definicion 5.3.1 si y solo si
k(x, m) =

r (x, m) + r (x, m 1)
,
2(r(x, m) r(x, m 1))

(5.3.27)

y
L(m) =

r(x, m) + r(x, m 1)
k 2 (x, m),
2

(5.3.28)

es independiente de x.

5.3.4.

Ejemplos

Antes de pasar a ver algunos ejemplos debemos destacar que el metodo descrito es valido
para una gran cantidad de ecuaciones diferenciales. Es facil comprobar que si tenemos la EDO


d
dz(t)
p(t)
+ q(t)z(t) + (t)z(t) = 0,
dt
dt
entonces el cambio
y(x) =

p
4

p(t)(t)z(t),

dx =

(t)
dt
p(t)

la transforma en una ecuacion del tipo (5.3.10)


y (x) + r(x, m)y(x) + y(x) = 0.
En el razonamiento anterior se supone que p(x)(x) 0 en el intervalo a considerar.
15

N
otese que si r(x, m) es una funci
on real, entonces k(x, m) tambien lo sera.

n de Schro
dinger
5.3. El m
etodo de factorizacio

103

Los arm
onicos esf
ericos
Comenzaremos por los armonicos esfericos Yml (). Estos satisfacen la ecuacion
1
sen

d
d



dY
m2
sen

Y + Y = 0,
d
sen2

Hacemos el cambio y(x) =

0 .

sen Y (), x = y obtenemos la forma canonica (5.3.10)

m2 41
y + y = 0,
sen2 x

= + 14 ,

por tanto


1
cot ,
k(x, m) = m
2

1
L(m) = m(m 1) + =
4

1
m
2

2

Como L(m) es creciente tenemos el caso I, as que el teorema 5.3.4 nos da


=+

1
= L(l + 1)
4

= l(l + 1),

l = 0, 1, 2, . . . ,

m = 0, 1, 2, . . . , l.

Usando (5.3.20) tenemos


Hl+1 yll ()

=0



1
l+
2


d
cot
y l () = 0
d l

yll () = C senl+1/2 .
Calculamos C para que kyll k = 1:
1=C

sen2l+1 d = C 2
0

luego
yll () =

2l+1 l!
,
(2l + 1)!!

(2l + 1)!!
senl+1/2 .
2l+1 l!

Finalmente, como L(l +1)L(m) = (l +m)(l m+1) y L(l +1)L(m+1) = (l m)(l +m+1),
entonces (5.3.20) y (5.3.21) nos dan



p
d
1
l
l
cot
ym
() = (l m)(l + m + 1) ym+1
(),
m
2
d



p
1
d
l
l
m
cot +
ym
() = (l + m)(l m + 1) ym1
(),
2
d

respectivamente.

n de Schro
dinger
Captulo 5. Resolviendo la ecuacio

104

Potencial de Poschl-Teller 1
Sea

2 (m + g)(m + g + 1) 2 (m g)(m g 1)
y +

sen2 (x x0 )
cos2 (x x0 )

y + y = 0,

con x (x0 , x0 + /(2)). Entonces el teorema 5.3.6 nos da



k(x, m) =2 g + m cos 2 (x x0 ) csc 2 (x x0 )
= (g + m) cot (x x0 ) + (g m) tan (x x0 ) ,
L(m) = 4 m2 2 .
Al ser L(m) creciente usamos el teorema 5.3.4 y por tanto
= 42 (l + 1)2 ,

l = 0, 1, 2, . . . ,

m = 0, 1, 2, . . . , l.

En este caso
Hl+1 yll (x) = 0

[k(x, l + 1) D] yll (x) = 0

yll (x) = C coslg+1 (x x0 ) senl+g+1 (x x0 ) .

Calculamos C para que kyll k = 116


1 =C

r0 + 2

r0

=C 2
luego
yll (x) =

cos2(lg+1) (x x0 ) sen2(l+g+1) (x x0 ) dx

(l g + 23 )(l + g + 23 )
.
2(2 + +3)

2(2l + 3)
lg+1
(x x0 ) senl+g+1 (x x0 ) .
3 cos
3
(l g + 2 )(l + g + 2 )

Finalmente, como
L(l + 1) L(m + 1) = 42 (l m) (l + m + 2) ,

L(l + 1) L(m) = 42 (l m + 1) (l + m + 1) ,

entonces (5.3.20) y (5.3.21) nos conducen a las expresiones




p
d
l
l
k(x, m + 1)
(x),
ym
(x) = 2 (l m) (l + m + 2) ym+1
dx


p
d
l
l
k(x, m) +
(x),
ym
(x) = 2 (l m + 1) (l + m + 1) ym1
dx

respectivamente.
16

Hemos usado que


Z

cosa x senb x dx =

b+1
( a+1
2 )( 2 )

)
2( a+b+2
2

a > 1, b > 1.

0 m l,
0 m l,

n de Schro
dinger
5.3. El m
etodo de factorizacio

105

Potencial de Poschl-Teller 2
Sea



2 (m + g)(m + g + 1) 2 (m g)(m g + 1)
y +
y + y = 0,
+
senh2 (x x0 )
cosh2 (x x0 )

con x (r0 , ). Entonces el teorema 5.3.6 nos da


k(x, m) =2 g + m cosh 2 (x x0 ) csch 2 (x x0 )
= (g + m) coth (x x0 ) + (m g) tanh (x x0 )
L(m) = 4 m2 2 .

Al ser L(m) decreciente usamos el teorema (5.3.5) y por tanto


= 42 l2 ,

l = 0, 1, 2, . . . ,

m = l, l + 1, l + 2, . . . .

En este caso
H+l yll (x) = 0

[k(x, l) + D] yll (x) = 0

y por tanto17 para todo g < 21 l


s
2(l g + 21 )
l
coshgl (x x0 ) senhlg (x x0 ) .
yl (x) =
(l g + 21 )(2l)
Finalmente, como
L(l) L(m) = 42 (m l) (m + l) ,

L(l) L(m + 1) = 42 (m + 1 l) (l + m + 1) ,
entonces (5.3.20) y (5.3.21) nos dan


p
d
l
l
k(x, m + 1)
ym
(x) = 2 (m + 1 l) (l + m + 1) ym+1
(x),
dx


p
d
l
l
(x),
ym
(x) = 2 (m l) (m + l) ym1
k(x, m) +
dx

m l,

respectivamente.

Potencial de Morse
Sea ahora la ecuacion

y + ae2u + beu y + y = 0,

a, b C,

0 u < +.

Si hacemos el cambio u = x + de forma que e2 a = 1/4, m = be


17

1
2

obtenemos

Hemos usado que


Z

cosha x senhb x dx =

b+1
( a+b
2 )( 2 )
,
2( 1a
2 )

b > 1, a + b < 0.

n de Schro
dinger
Captulo 5. Resolviendo la ecuacio

106

y + 41 e2x + m +

1
2

con x R. Entonces el teorema 5.3.6 nos da

ex
+ m,
2

k(x, m) =


ex y + y = 0,
L(m) = m2 .

Al ser L(m) decreciente usamos el teorema 5.3.5 y por tanto


= l2 ,

l = 1, 2, . . . ,

m = l, l + 1, l + 2, . . . .

En este caso
H+l yll (x) = 0

y por tanto18

yll (x) =

[k(x, l) + D] yll (x) = 0

1
eexp(x)/2lx .
(2l)

Finalmente, como
L(l) L(m) = (m l) (m + l) ,
L(l) L(m + 1) = (m + 1 l) (l + m + 1) ,
entonces usando (5.3.20) y (5.3.21) tenemos

 x
p
e
d
l
l
ym
(x) = (m + 1 l) (l + m + 1) ym+1

+m+1
(x), m l,
2
dx

 x
p
d
e
l
l
ym
(x) = (m l) (m + l) ym1
+m+
(x), m l,

2
dx
respectivamente.

La ecuaci
on de Whittaker & Watson
Sea

1 m+
W + +
4
z

1
2

1
4

+
z2

W = 0,

0 z < +.

Haciendo el cambio z = ex , W (z) = e 2 y obtenemos


 
y + 14 e2x + m + 21 ex y + y = 0,

que esencialmente la misma ecuacion diferencial del ejemplo anterior pero cambiando x por
x. Tambien corresponde al caso II con
k(x, m) =
18

Hemos usado que

ex
m,
2

L(m) = m2 ,

e exp(x)2lx dx = (2l),

l > 0.

n de Schro
dinger
5.3. El m
etodo de factorizacio

107

as que
= l2 ,
H+l yll (x) = 0

l = 0, 1, 2, . . . ,

[k(x, l) + D] yll (x) = 0

m = l, l + 1, l + 2, . . . ,
yll (x) =

1
eexp(x)/2+lx .
(2l)

Finalmente, (5.3.20) y (5.3.21) nos dan





p
ex
d
l
l
ym
(x) = (m + 1 l) (l + m + 1) ym+1
m1
(x),
2
dx


respectivamente.


p
ex
d
l
l
(x),
ym
(x) = (m l) (m + l) ym1
m+
2
dx

m l,

m l,

La ecuaci
on de Bessel
Sea
m2 14
y + y = 0,
z2

z R.

Aplicando el teorema 5.3.6 tenemos


k(x, m) =

m 12
,
x

L(m) = 0.

Como L(m) es constante no podemos usar ninguno de nuestros resultados por lo que no tenemos
ninguna expresion para . No obstante si podemos seguir usando las expresiones (5.3.20) y
(5.3.21) que en este caso dan


m+
x

1
2

m
x

1
2

d
ym (x) = ym+1 (x),

dx


d
ym (x) = ym1 (x).
+
dx

Ambas expresiones dan sendas relaciones de recurrencia para las funciones de Bessel.
Para resolver la ecuacion tenemos que usar el metodo de Frobenius (ver e.g [6, 21]). La
solucion general en este caso da
y(x) =


x c1 Jm ( x) + c2 Ym ( x) ,

donde Jm (z) y Ym (z) son las funciones de Bessel de primera y segunda especie, respectivamente.

n de Schro
dinger
Captulo 5. Resolviendo la ecuacio

108
El
atomo de hidr
ogeno

Sea la ecuacion radial de Schrodinger para el atomo de hidrogeno


2
2
m(m + 1)
R + R + R
R + R = 0,
r
r
r2
Si hacemos el cambio y(r) = rR(r), tenemos


2 m(m + 1)

y + y = 0,
y +
r
r2

r 0.

r 0.

Aplicando el teorema 5.3.6 obtenemos


k(r, m) =

1
m
,
r
m

L(m) =

1
.
m2

Como L(m) crece tenemos el caso I. As,


=

1
,
(l + 1)2

En este caso
Hl+1 yll (r)

=0

l = 0, 1, 2, . . . ,

m = 1, 2, . . . , l.


1
l+1

D yll (r) = 0

r
l+1


yll (x) = Cr l+1 e l+1 .

Calculamos C para que kyll k = 119


yll (r) =
Finalmente, como

1
(l +

1)l+3 (l

+ 1)

r l+1 e l+1 .

1
1

,
2
(m + 1)
(l + 1)2
1
1
,
L(l + 1) L(m) = 2
m
(l + 1)2

L(l + 1) L(m + 1) =

entonces de (5.3.20) y (5.3.21) obtenemos




m+1
1
d

r
m + 1 dr


1
d
m

+
r
m dr

l
ym
(r) =

l
ym
(r) =

1
1

y l (r),
2
(m + 1)
(l + 1)2 m+1

1
1

y l (r),
2
m
(l + 1)2 m1

1 m l,

respectivamente.
19

Hemos usado que

x ex dx = ( + 1)1 ,

> 0,

1 m l,

> 1.

n de la EDO hipergeom
5.4. Factorizacio
etrica

5.4.

109

Factorizaci
on de la EDO hipergeom
etrica

En este apartado vamos a probar que la ecuacion hipergeometrica (5.1.7) admite una factorizacion tipo Infeld-Hull. Vamos a seguir el trabajo de Lorente [14]

5.4.1.

El hamiltoniano y los operadores escalera

Sean las funciones


n (s) =

(s)/d2n Pn (x),

(5.4.1)

Usando (5.1.22) y (5.1.7), obtenemos las expresiones


dn1
dn+1
n+1 (s) + n
n1 (s) + (n x(s))n (s) = 0,
dn
dn

(5.4.2)

(x)n (x) + (x)n (x) + (x)n (x) + n n (x) = 0,

(5.4.3)

donde
(x) =

1 ( (x) (x))2 1
( ).
4
(x)
2

En particular la EDO anterior induce a definir el siguiente operador H(x, n) orden 2


H(x, n) := (x)D 2 + (x)D + [(x) + n ]I,

H(x, n)n (x) = 0.

(5.4.4)

En adelante diremos que H(x, n) es el hamiltoniano asociado a la EDO (5.1.7).


Si ahora usamos las expresiones (5.1.34) y (5.1.35) obtenemos
L+ (x, n)n (s) := [f (x, n) (x)D]n (x) = n
donde

2n dn+1
n+1 (x),
2n dn

 (x) 1

n n

L (x, n) =
+ ( (x) (x)) I (x)D,
n n
2
|
{z
}

(5.4.5)

(5.4.6)

f (x,n)

L (x, n)n (x) := [g(x, n) + (x)D]n (x) = n

2n dn1
n1 (x),
2n dn

(5.4.7)

donde

L (x, n) =


n n (x) 2n
1

+
(x n ) ( (x) (x)) I + (x)D.
n n
2n
2
|
{z
}

(5.4.8)

g(x,n)

Los operadores anteriores L+ (x, n) y L (x, n) constituyen los operadores escalerade ascenso
(raising) y descenso (lowering), respectivamente.
Si usamos las expresiones explcitas de n y n (ver apartado 5.1.2)



, n (x) = (x) + n (x),


n = n + (n 1)
2

n de Schro
dinger
Captulo 5. Resolviendo la ecuacio

110
y

n =

nn1 (0) (n + 1)n (0)

n1
n

se comprueba que
f (x, n 1) = g(x, n).
Ademas, para todos n, k N {0},
Z

b
+

n (x)[L (x, n)k (x)] dx =


a

(5.4.9)

[L (x, n)n (x)]k (x) dx,

en particular

n+1 (x)[L+ (x, n)n (x)] dx = n

2n dn1
,
2n dn

[L (x, n + 1)n+1 (x)]n (x) dx, = n+1


a

2n+2 dn
.
2n + 2 dn+1

De lo anterior se sigue que L+ y L son el adjunto el uno del otro respecto al producto escalar20
Z b
h, i = (x)(x) dx.
a

Notese que el operador H(x, n) es autoadjunto.

5.4.2.

Factorizaci
on de H(x, n)

Si ahora calculamos
L (x, n + 1)L+ (x, n) =g(x, n + 1)f (x, n)I + (x) [f (x, n) g(x, n + 1)] D
|
{z
}
=0

+ (x)[f (x, n) (x)D (x)D ]

o, equivalentemente,
L (x, n + 1)L+ (x, n) = [g(x, n + 1)f (x, n) + (x)(f (x, n) + (x) + n )] I
(x)H(x, n).
Ahora bien,
g(x, n + 1)f (x, n) + (x)(f (x, n) + (x) + n )



(n + 1) + n1
(0)2 2 (0) (0) + 2(0)n 2 n 2 (0) ( + n )
=
4n 2
no depende de x. Dicha cantidad la denotaremos por n . Ademas, si aplicamos el operador
L (x, n + 1)L+ (x, n) = n I (x)H(x, n)
20
Estamos usando que las funciones (n )n son una base ortonormal completa del espacio de las funciones de
cuadrado integrable y que n (a) = 0.

n de la EDO hipergeom
5.4. Factorizacio
etrica

111

a n (x) y usamos (5.4.5), (5.4.7) y (5.4.4) obtenemos la expresion


2n 2n+2
n =
n n+1 .
2n 2n + 2
Analogamente se tiene
L+ (x, n 1)L (x, n) =g(x, n)f (x, n 1)I + (x) [f (x, n 1) g(x, n)] D
{z
}
|
=0

(x)[g (x, n) + (x)D + (x)D ]

o, equivalentemente,

L+ (x, n 1)L (x, n) = [g(x, n)f (x, n 1) (x)(g (x, n) (x) n )] I


(x)H(x, n).

Ahora bien, como antes,

g(x, n)f (x, n 1) (x)(g (x, n) (x) n )





n + n2
(0)2 2 (0) (0) + 2(0)n1
(n1) 2 (0) + n1
=
2

4n1
no depende de x. Notese que la expresion anterior coincide con n1 . Otra forma de comprobarlo
es aplicar el operador
L+ (x, n 1)L (x, n) = M(n)I (x)H(x, n)

a n (x) y usar, como antes (5.4.5), (5.4.7) y (5.4.4). Lo anterior nos conduce a la expresion
2n 2n2
n1 n = n1.
M(n) =
2n 2n 2
As, hemos probado el siguiente

Teorema 5.4.1 Para la ecuacion hipergeometrica (5.1.7), haciendo el cambio (5.4.1), se obtiene la ecuacion (5.4.4), para la cual se cumple la siguiente factorizacion del tipo Infeld y
Hull
L (x, n + 1)L+ (x, n) = n I (x)H(x, n),
(5.4.10)
L+ (x, n 1)L (x, n) = n1 I (x)H(x, n),

donde los operadores L+ (x, n) y L (x, n) son los operadores de ascenso (raising) y descenso
(lowering), respectivamente definidos por
L+ (x, n) = f (x, n)I (x)D,
f (x, n) =
Ademas,

n n (x) 1
+ ( (x) (x))
n n
2

L+ n (x) = n n n+1 n+1 (x),

y, por tanto,

L (x, 0)0 (x) = 0

L (x, n) = f (x, n 1)I + (x)D,

L n (x) = n n1 n n1 (x).

 Z

0 (x) = N0 exp f (x, n 1)dx ,

k0 k2 = 1,

1
L+ (x, n 1) L+ (x, 1)L+ (x, 0)0 (x),

k=0 (k k k+1 )

n (x) = Qn1

n 1.

n de Schro
dinger
Captulo 5. Resolviendo la ecuacio

112

5.4.3.

Ejemplos

Como ejemplo consideraremos el caso correspondiente a los polinomios de Hermite y Laguerre.


Caso Hermite
En el primer caso como (x) = 1 y (x) = 2x tenemos21
2n/2
2
n (x) = p ex /2 Hn (x),
n!

H(x, n) = D 2 + (1 x2 + n )I,

n = 2n,

entonces f (x, n) = g(x, n) = x, luego


L+ (x, n)n (x) = (xI D)n (x) =

2(n + 1) n+1 (x),

L (x, n)n (x) = (xI + D)n (x) = 2n n1 (x).

De lo anterior se sigue
1 x2 /2
e
,
0 (x) =
4

1
n x2 /2

(xI

D)
e
.
n (x) =
4
2n n!

Finalmente
L+ (x, n 1)L (x, n) = 2nI H(x, n),

L (x, n + 1)L+ (x, n) = (2n + 2)I H(x, n).

Caso Laguerre
En este caso (x) = x y (x) = x + + 1 tenemos
H(x, n) = xD 2 + D +
y22

Entonces

21
22

!
1 (x )2

n I,
2
4x

n = n,

1
n (x) = p
ex/2 x/2 Ln (x)
n!( + n + 1)

x 2n
+x 2 2n
, g(x, n) =

f (x, n) =
2
2


p
x 2 2n
+
L (x, n)n (x) =
I xD n (x) = (n + 1)(n + + 1) n+1 (x),
2


p
x 2n

I + xD n (x) = n(n + ) n1 (x).


L (x, n)n (x) =
2

Estamos usando polinomios monicos de Hermite.


Estamos usando polinomios monicos de Laguerre.

113

5.5. Problemas
De lo anterior se sigue
0 (x) = p

Finalmente

1
ex/2 x/2 ,
( + 1)

1
L+ (x, n 1) L+ (x, 1)L+ (x, 0)ex/2 x/2 .
n (x) = p
n!( + n + 1)
L+ (x, n 1)L (x, n) = (n)(n + )I H(x, n),

L (x, n + 1)L+ (x, n) = (n + 1)(n + 1 + )I H(x, n).

5.5.

Problemas

Problema 5.5.1 Prueba la relacion de ortogonalidad (5.1.20) y calcula una expresion para la
(k)
norma de las derivadas Pn .
Problema 5.5.2 Calcula todas las caractersticas de los polinomios clasicos que aparecen en
la tabla 5.2.
Problema 5.5.3 Prueba que los polinomios ortogonales monicos Pn , soluciones de la ecuaci
on
(5.1.7), satisfacen la siguiente relacion de estructura
Pn (x) = Qn + n Qn1 + n Qn2 ,

(5.5.1)

donde Qn (x) Pn+1


(x)/(n + 1). Encuentra una expresion de los coeficientes en funcion de los
coeficientes calculados en el apartado 5.1.2.

Problema 5.5.4 Probar que para los polinomios clasicos se tienen las siguientes identidades.

X
2n
n=0

n!

Hn (x)t = e

X
(1)n
n=0

X
(1)n ( + + 1)n
n=0

2xtt2

n!

Pn, (x)tn =

p
con R = 1 + 4t(t + x).

n!

tx

Ln (x)tn

e 1t
=
,
(1 t)+1

2+
,
R(1 2t + R) (1 + 2t + R)

(5.5.2)

(5.5.3)

Problema 5.5.5 Sea la ecuacion de Schrodinger estacionaria unidimensional

U0
~2

= E,
2m
cosh2 (x)

x R,

con E < 0. Hacer el cambio s = tanh x y obtener la EDO


2s
2 (1 s2 ) 2

+
,
1 s2
(1 s2 )2

2 =

2mE 2 2mU0
, = 2 2,
~2 2
~

, > 0.

Resuelve la EDO anterior y calcula las soluciones estacionarias de la ecuacion. El potencial


anterior se conoce como potencial de Posch-Teller y modeliza la interaccion molecular.

n de Schro
dinger
Captulo 5. Resolviendo la ecuacio

114

Problema 5.5.6 Resolver la ecuacion de Schrodinger tridimensional

~2
+ D(e2x 2ex ) = E,
2m

x=

r r0
.
r0
2mDr 2

Pasa a unidades adimensionales y haz el cambio y = 2


ex donde 2 = ~2 0 . Resuelve

primero el caso l = 0. El potencial anterior se conoce como potencial de Morse y tambien


modeliza la interaccion molecular.
Problema 5.5.7 Para el atomo de hidrogeno calcula el valor medio de la posicion del electr
on
en el estado definido por los valores n, l y m hrin,l,m = hRn l |r|Rn l i. Prueba que si n = l = 0,
entonces hri0,0,0 = a0 = ~2 /(2). Prueba ademas que en el estado definido por los valores n, l
y m la media de la energa potencial
hV (r)in,l,m = hRn l |V (r)|Rn l i
es la mitad de la energa total En,l .
Calcula hrin,l,m y hV (r)in,l,m para el oscilador armonico tridimensional.
Problema 5.5.8 La ecuacion de Klein-Gordon


2
KG + EKG +
1 KG = 0,
r

se puede resolver usando el metodo de separacion de variables obteniendose para sus soluciones
la expresion KG (r, , ) = R(r)r 1 Yl,m (, ), siendo Yl,m los armonicos esfericos y R(r) las
soluciones de


l(l + 1)
2

R = 0.
1
R + E+
r
r2
Demuestra usando el metodo descrito al final de captulo que las soluciones se expresan mediante
la formula
s
2
r
1
1
2 +1 2+1
l+
R(x) = Nl,n e r Ln (2ar) ,
2 ,
= +
2
2
donde Ln son los polinomios de Laguerre y determina el factor de normalizacion Nl,n .

Problema 5.5.9 Aplica el metodo de factorizacion de Schrodinger para resolver las siguientes
EDOs
1. Los esfericos armonicos generalizados, definidos por la expresion y() = sen ()
donde y satisface la EDO
y

(m + )(m + 1)
y + ( + 2 )y = 0.
sen2

2. La ecuacion de onda para una peonza simetrica. La funcion de onda (, , ) =


1
()eiK eiM , donde la funcion es tal que y() = sen 2 (), e y satisface la EDO


(M 21 )(M + 21 ) + K 2 2MK cos
1
2

y = 0.
y+ +K +
y
sen2
4

115

5.5. Problemas

3. La parte radial de la ecuacion de Schrodinger para s osciladores de Plank unidimensionales




s1
n(n + s 2)

2
+

+ r + = 0, n = 0, 1, 2, . . . ,
r
r2
P
donde r 2 = sk=1 x2k . Si hacemos el cambio (r) = r (1s)/2 y(r), y satisface la EDO

(n + 2s 12 )(n + 2s 23 )
2
y
+ r y + y = 0.
r2

4. El problema de Kepler generalizado. En este caso R satisface la EDO


2
2
(l + )(l + + 1)
R + R + R
y + y = 0,
r
r
r2

r 0,

1
.
(n + )2

Problema 5.5.10 Usando el metodo de factorizacion del apartado 5.4 obten las soluciones
para el caso de los polinomios de Legendre, Gegenbauer y Jacobi.

116

n de Schro
dinger
Captulo 5. Resolviendo la ecuacio

Bibliografa

[1] R. Alvarez-Nodarse,
Polinomios hipergemetricos y q-polinomios. Monografas del Seminario
Matematico Garca de Galdeano Vol. 26. Prensas Universitarias de Zaragoza, Zaragoza,
2003.
[2] S. Albeverio (with Appendix written by P. Exner) Solvable Models In Quantum Mechanics.
AMS Chelsea Publishing, 2004.
[3] G. Auletta, Foundations and interpretation of quantum mechanics. In the light of a criticalhistorical analysis of the problems and of a synthesis of the results. World Scientific Publishing Co., Inc., River Edge, NJ, 2000.
[4] J-L. Basdevant, J. Dalibard, Quantum mechanics. Springer Verlag, 2002.
[5] J.S. Bell, Lo decible y lo indecible en mecanica cuantica. Alianza Universidad, 1991.
[6] M. Braun, Differential Ecuations and their Applications. Springer Verlag, 1993.
[7] L. Debnath y P. Mikusinsk. Introduction to Hilbert spaces with applications, Eselvier
Academic Press, 2005.
[8] S. Deligeorges (Ed.), El mundo cuantico, Alianza Universidad, 1985.
[9] P. V. Eltin, V. D. Krivqenkov Kvantova Mehanika, Nauka 1975.
[10] R. Feynman, R. B. Leighton y M. Sands, The Feynman Lectures on Physics. Vol. III.
Mecanica Cuantica. Fondo Educativo Interamericano 1971.
[11] R. Feynman, El caracter de la Ley fsica. Metatemas 65, 2000.
[12] J. Gribbin, En busca del gato de Schrodinger. La fascinante historia de la Mecanica Cu
antica. Biblioteca Cientfica Salvat, 1994.
[13] L. Infeld and T. E. Hull, The factorization method. Rev. Modern Physics 23 (1951), 2168.
[14] M. Lorente, Raising and lowering operators, factorization method and differential/difference operators of hypergeometric type. J. Phys. A: Math. Gen. 34 (2001), 569588.
[15] A. Messiah, Mecanica Cuantica. Vol. I y II. Ed. Tecnos. (Hay una edicion inglesa reciente
Quamtum Mechanics, Dover, New York, 1999)
117

118

BIBLIOGRAFIA

[16] A. F. Nikiforov y V. B. Uvarov, Special Functions of Mathematical Physics. Birkhauser


Verlag, Basilea, 1988.
[17] E. Prugovecki, Quantum Mechanics in Hilbert space. Academic Press, New York, 1971.
[18] H. Rechenberg, Quanta and Quantum Mechanics, Twentieth century physics. Vol. I, 143
248, Inst. Phys., Bristol, 1995.
[19] I. V. Saveliev, Curso de fsica general. Mir, Mosc
u, 1989.
[20] J. Schwinger, Quantum Kinematic and Dynamics, Frontiers in Physics. W.A. Benjamin
Inc. Publishers, 1970.
[21] G. F. Simmons, Ecuaciones diferenciales: con aplicaciones y notas historicas. McGrawHill, 1993.
[22] A. A. Sokolov, I. M. Ternov, V. Ch. Zhukovskii, Quantum Mechanics. Mir, Mosc
u, 1994.
[23] Steven Weinberg, Lectures on Quantum Mechanics. Cambridge University Press, 2012.
[24] Una
historia
interactiva
de
la
Mecanica
Cuantica
en
la
WWW:
http://wayback.archive-it.org/3635/20130720124405/
http://library.thinkquest.org/C005775/frameset.html
[25] Cuantica sin formulas en la WWW: http://eltamiz.com/cuantica-sin-formulas/

Anexo A: Breve introducci


on al
an
alisis funcional
A.1.

Introducci
on: Estacios m
etricos y espacios normados

Definici
on A.1.1 Un espacio metrico es un par (X, ~r) donde X es un conjunto y ~r := ~r(x, y) es una
funci
on real (univaluada) no negativa definida para todos x, y, z X tal que
1. ~r(x, y) = 0 x = y,
2. ~r(x, y) = ~r(y, x),
3. ~r(x, z) ~r(x, y) + ~r(y, z).
Normalmente se dice que X es el espacio y ~r su metrica.
Por ejemplo, el espacio X = Rn de las n-tuplas x = (x1 , x2 , . . . , xn ) con la metrica
!1/p
n
X
p
~r(x, y) =
|xk yk |
,
p 1,
k=1

es un espacio metrico. Otro ejemplo de especial importancia


es el espacio de todas las sucesiones reales
P
p
(o complejas) x = (x1 , x2 , . . . , xn , . . .) tales que k=1 |xk | < + con la metrica
!1/p

X
p
,
p 1.
|xk yk |
~r(x, y) =
k=1

lp .

Dicho espacio lo denotaremos por


Un caso particular de estos espacios corresponde al caso p = 2
2
que conduce al espacio metrico l de Hilbert.
Como u
ltimo ejemplo consideraremos el espacio X = C[a,b] , es decir, el espacio de las funciones
continuas definidas sobre el segmento [a, b]. Definamos en X la metrica
(f, g) =

Z

|f (x) g(x)|

1/p

p 1.

El par obtenido Cp ([a, b]) es un espacio metrico. Como caso particular (de especial relevancia) tenemos
el caso p = 2, i.e., X = C[a,b] y ~r es la funcion
s
Z b
|f (x) g(x)|2 .
(f, g) =
a

119

120

n al ana
lisis funcional
Anexo: Breve introduccio

El espacio L2 (a, b) de las (clase de equivalencia de las) funciones de cuadrado integrable en [a, b] que
vimos el el captulo 3 es una generalizaci
on de este espacio.
Definici
on A.1.2 Sea X un espacio metrico, x0 X y r > 0. Definiremos la bola abierta B(x0 , r) al
conjunto
B(x0 , r) = {x X; ~r(x0 , x) < r},
bola o esfera cerrada S(x0 , r) al conjunto
S(x0 , r) = {x X; ~r(x0 , x) r}.
Definici
on A.1.3 Se dice que el conjunto M X es abierto en X si todos sus puntos (elementos) se
pueden encerrar en una bola abierta contenida completamente en M . Un conjunto M X es cerrado
en X si es su complementario en X, X\M es abierto.
Las bolas abiertas B(x0 , ) se suelen denominar -vecindades (o entornos) de x0 . Es evidente que
toda -vecindad de x0 contiene al propio x0 .
Definici
on A.1.4 Un punto x0 se denomina punto interior del conjunto M X si existe un > 0
tal que B(x0 , ) M .
De lo anterior se deduce que el conjunto M X es abierto si y s
olo si todos sus puntos son interiores.
Definici
on A.1.5 Por aplicaci
on (operador) o funci
on entenderemos una regla T que le hace corresponder a cada elemento del subconjunto D(T ) X un u
nico elemento del espacio metrico Y. As,
T : X 7 Y, y = T x o y = T (x), donde x D(T ) X e y Y. Al conjunto D(T ) X se le denomina
dominio de la aplicaci
on. Si a cada x D(T ) le corresponde un valor y = T x Y diremos que T x es
la imagen de x seg
un T . Al conjunto de todas las im
agenes T x le denominaremos imagen de T y le
denotaremos por I(T ).
Definici
on A.1.6 Una aplicaci
on T : D(T ) X 7 Y se llama sobreyectiva si todo elementoy de Y
es imagen de alg
un elemento x del dominio. Una funci
on se llama inyectiva si todo elemento y de la
imagen de T es imagen a lo sumo de uno y s
olo un elemento x del dominio. Una aplicaci
on inyectiva
y sobreyectiva se denomina biyectiva.
Es decir una aplicaci
on es sobreyectiva si, para todo y Y, la ecuaci
on T x = y tiene al menos una
soluci
on, e inyectiva si la ecuaci
on anterior tiene o bien una u
nica soluci
on, o bien no tiene soluci
on.
As mismo, T es biyectiva si para todo y Y, la ecuaci
on T x = y tiene una y s
olo una soluci
on.
Para las funciones inyectivas se puede definir la aplicaci
on inversa.
Definici
on A.1.7 Sea T : D(T ) X 7 Y una aplicaci
on inyectiva. Definiremos su aplicaci
on inversa
1
1
T a la aplicaci
on T : I(T ) Y 7 D(T ) X tal que a cada elemento y I(T ) le hace corresponder
un u
nico x D(T ) tal que T x = y.
Definici
on A.1.8 La restricci
on de una aplicaci
on T : D(T ) X Y a un subconjunto B D(T )
es la aplicaci
on T |B que se obtiene de T cuando x se restringe al conjunto B D(T ).

n: Estacios m
A.1. Introduccio
etricos y espacios normados

121

Definici
on A.1.9 La extensi
on de una aplicaci
on T : D(T ) X Y a un subconjunto C D(T )
e
e
e
es la aplicaci
on T tal que T |D(T ) = T , i.e., T x = T x para todo x D(T ).

Definici
on A.1.10 Una aplicaci
on T : D(T ) X Y es continua en x0 D(T ) si para todo
> 0, existe un > 0 tal que x D(T ) con ~r(x, x0 ) < es tal que23 (T x, T x0 ) < . Se dice que T
es continua en todo M D(T ) si T es continua en todo x M .

Definici
on A.1.11 La imagen inversa de y Y es el conjunto de todas las x D(T ) tales que
T x = y. La imagen inversa de un subconjunto N Y es el conjunto de todas las x D(T ) tales que
T x = y para todos y M .
La imagen inversa de un elemento y Y puede ser el conjunto vaco, un u
nico punto (elemento) de
D(T ) o un subconjunto M D(T ).
Proposici
on A.1.12 Una aplicaci
on T : D(T ) X Y es continua si y s
olo si la imagen inversa
de cualquier subconjunto abierto (cerrado) de Y es un subconjunto abierto (cerrado) de X.
Demostraci
on: Sea T continua y sea S Y un abierto. Sea S0 la imagen inversa de S. Si S0 = la
proposici
on es trivial asi que asumiremos que S0 6= . Sea x0 S0 cualquiera y sea y0 = T x0 S su
imagen. Como S es abierto existe una bola B(y0 , ) S. Pero T es continua as que existe una bola
B(x0 , ) tal que T (B(x0 , )) B(y0 , ). Pero como B(y0 , ) S, entonces necesariamente B(x0 , )
S0 , luego x0 S0 es interior y en virtud de que x0 S0 es arbitrario, S0 es abierto.
Sea T una aplicaci
on tal que imagen inversa de cualquier subconjunto abierto de Y es un subconjunto
abierto de X. Sea x0 S0 cualquiera e y0 = T x0 S. Sea B(y0 , ) S una bola de radio
arbitrario. Sea S0 la imagen inversa de dicha bola B(y0 , ) que es un abierto. Entonces existe una bola
B(x0 , ) S0 tal que T (B(x0 , )) B(y0 , ) S, i.e., T es continua en x0 . Como x0 era arbitrario,
entonces T es continua en D(T ).

Definici
on A.1.13 Sea M X. Diremos que x X es un punto de contacto (o adherente) de M
si en cualquier bola B(x, ), > 0 hay al menos un elemento de M . As mismo, diremos que x es
un punto de acumulaci
on (o punto lmite) de M si en cualquier bola B(x, ), > 0 hay al menos un
elemento de M distinto de x, o equivalentemente, en cada bola B(x, ), > 0 hay infinitos elementos
de M . Un punto x se denomina aislado de M si existe una bola B(x, ), > 0 que no contiene ning
un
elemento M excepto el propio x.
Es facil ver que si M solo contiene puntos aislados entonces M es cerrado (pues X\M es abierto).
De lo anterior se deduce adem
as que los puntos de contacto de M o bien son puntos lmites, o bien
son aislados.
Definici
on A.1.14 Dado un subconjunto M X, se denomina clausura de M al conjunto M de los
elementos de M y sus puntos de contacto.
De lo anterior se sigue que M = M {conjunto de sus puntos lmites}.
Por ejemplo, si X = Q, entonces Q = R pues todo x R es un punto lmite de Q (por que?).
23

Aqu ~r denota la metrica de X y la de Y.

122

n al ana
lisis funcional
Anexo: Breve introduccio

Proposici
on A.1.15 Un subconjunto M X es cerrado si y s
olo si M = M . As, como M M ,
entonces M es el menor conjunto cerrado que contiene a M .
Demostraci
on: Sea M cerrado. Como M M basta probar que M M . Como M es carrado,
entonces X \ M es abierto as que para todo x X \ M existe una bola B(x, r) completamente
contenida en X \ M , i.e., B(x, r) no contiene puntos de M , luego x 6 M , es decir, x X \ M , as que
X \ M X \ M , i.e. M M .
Asumamos que M = M . Probaremos que X \ M es abierto. Sea x 6 M , entonces x 6 M . Entonces
x X \ M . Como x 6 M entonces x no es un punto adherente de M as que debe existir al menos
una bola B(x, r) que no contiene a ning
un elemento de M , es decir x X \ M es un punto interior
del conjunto X \ M . Como x es arbitrario, X \ M es abierto luego M es cerrado.

Definici
on A.1.16 Un subconjunto M X es acotado si su di
ametro d(M ) = supx,yM ~r(x, y) es es
finito.
Definici
on A.1.17 Dada una sucesi
on (xn )n de elementos de X, diremos que (xn )n es acotada si
existe un subconjunto M X acotado tal que xn M para todo n N.
Lo anterior es equivalente a que exista un x X y un n
umero K > 0 tal que ~r(x, xn ) < K para todo
n N.
Definici
on A.1.18 Una sucesi
on (xn )n de elementos de X es convergente, y lo denotaremos por
lmn xn = x, si existe un x X tal que para todo > 0 existe un N N tal que para todo n > N ,
~r(x, xn ) < . En caso contrario diremos que (xn )n es divergente.
Notese que en la propia definicion de lmite est
a explcito que el lmite ha de ser un elemento de X.
Por ejemplo, sea X el intervalo abierto (0, 1) con la metrica habitual de R. La sucesion xn = 1/(n + 1)
n
no tiene lmite en X ya que claramente 1/(n + 1) 0 pero 0 6 (0, 1).
Definici
on A.1.19 Una sucesi
on (xn )n de elementos de X se denomina de Cauchy o fundamental si
existe para todo > 0 existe un N N tal que para todo n > N y todo p N, ~r(xn , xn+p ) < .
En R toda sucesion es convergente si y s
olo si es de Cauchy. Esta propiedad fundamental de R no
es cierta para cualquier espacio metrico X. Por ejemplo, si escogemos nuevamente X como el intervalo
abierto (0, 1) con la metrica habitual de R, la sucesion xn = 1/(n + 1), que es de Cauchy (por que?)
no tiene lmite en X.
Definici
on A.1.20 Un espacio metrico X se denomina completo si y s
olo si toda sucesi
on de Cauchy
de elementos de X converge (a un elemento de X).
Por ejemplo, el espacio X = R con la metrica usual de R, es completo. Tambien lo es X = C con la
metrica usual de C. Sin embargo Q, el conjunto de los n
umeros racionales, es incompleto (por que?),
y el conjunto X = (0, 1) de antes tambien lo es. El espacio metrico (de Hilbert) l2 es completo no as el
espacio C2 ([a, b]).
Teorema A.1.21 Un subespacio M de un espacio metrico completo X es completo si y s
olo si es
cerrado en X.

n: Estacios m
A.1. Introduccio
etricos y espacios normados

123

Demostraci
on: Sea M completo. Probaremos que M = M . Sea x M cualquiera, entonces existe
(por que?) una sucesion de elementos de M que converge a x. Entonces (xn )n es de Cauchy (pues es
convergente) pero M es completo, luego x M , i.e., M = M .
Sea M cerrado (i.e., M = M ) y (xn )n una sucesion de Cauchy en M . Entonces lmn xn = x
con x X (X es completo). Pero entonces x X es un punto de acumulaci
on de M , i.e., x M y
como M es cerrado x M , i.e., toda sucesion de Cauchy en M tiene lmite en M , i.e., M es completo.

Definici
on A.1.22 Un subconjunto M X es denso en X si su clausura M = X.
De la definicion anterior se infiere que si M es denso X entonces cualquiera sea la bola B(x, ) (por
peque
no que sea > 0) siempre contiene puntos de M . En otras palabras, cualquiera sea x X,
siempre tiene elementos de M tan cerca como se quiera.
Por ejemplo Q es denso en R pues como ya hemos visto Q = R.
Definici
on A.1.23 Un espacio metrico X es separable si contiene un subespacio numerable24 M X
denso en X.
As pues, R es separable pues Q es numerable y denso en R. Usando la separabilidad de R se puede
probar que l2 tambien es separable.
Definici
on A.1.24 Un espacio metrico X se denomina compacto si cualquier sucesi
on (xn )n de elementos de X tiene una subsucesi
on convergente.
Entenderemos que M X es compacto si M es compacto como subconjunto de X, i.e., cualquier (xn )n
de elementos de M tiene una subsucesi
on convergente en M .
Lema A.1.25 Si M X es compacto, entonces M es cerrado y acotado.
Demostraci
on: Sea M compacto y sea x M cualquiera. Como x M entonces existe una sucesion
n
(xn )n en M tal que xn x X. Como M es compacto, entonces x M , luego M = M por lo que
M es cerrado.
Supongamos que M es no acotado. Entonces existe al menos una sucesion (xn )n de elementos de
M tal que, fijado un b M arbitrario, se tiene que ~r(xn , b) > n (por que?). Dicha sucesion obviamente no puede tener ninguna subsucesi
on convergente (pues caso que la tuviera esta fuese acotada)
y por tanto M no puede ser compacto.

El recproco es falso. Por ejemplo escojamos X = l2 y sea el conjunto M de los vectores ek = k,i ,
i.e., vectores que todas las coordenadas son cero excepto la k-esima que es 1. Obviamente kek k = 1.
Ademas todos los puntos de M son aislados (por que?), por tanto M es cerrado. Ahora bien, como
M solo tiene puntos aislados, M no tiene ning
un punto de acumulaci
on por lo tanto ninguna sucesion
que escojamos de elementos distintos de M contiene una subsucesi
on convergente.
24
Un conjunto M cualquiera se denomina numerable si se puede poner en correspondencia biunvoca con
N = {1, 2, 3, . . . }. Es decir, existe una correspondencia biunvoca entre los elementos de M y los n
umeros
naturales. Por ejemplo, Q es numerable, pero R no lo es.

n al ana
lisis funcional
Anexo: Breve introduccio

124

Definici
on A.1.26 Un espacio vectorial X se denomina espacio normado si para todo x X existe
un n
umero real denominado norma, y que denotaremos por kxk, que cumple con las condiciones
1. Para todo x X, kxk 0 y si kxk = 0 entonces x = 0.
2. Para todo x X y R, kxk = ||kxk,
3. Para todos x, y X se tiene la desigualdad triangular
kx + yk kxk + kyk.

(A.1.1)

Es evidente que si en un espacio normado X definimos la funcion ~r(x, y) = kx yk, esta satisface los
axiomas de la definicion A.1.1, i.e., todo espacio normado es un espacio metrico. La funcion ~r anterior
se denomina metrica inducida por la norma.
Definici
on A.1.27 Un espacio normado completo (en la metrica inducida por la norma) se denomina
espacio de Banach.
As, el espacio l2 , de todas las sucesiones x = (x1 , x2 , . . . , xn , . . .) reales (o complejas) tales que

P
P
2
2 1/2 , es un espacio de Banach, pero el espacio de
k=1 |xk | < + con la norma kxk =
k=1 |xk |
1/2
R
b
las funciones continuas en [a, b] con la norma kf k = a |f (x)|2
es un espacio normado pero no
de Banach (por que?).
Esta claro que todo espacio normado es un espacio metrico con la metrica inducida por la norma,
pero no a la inversa (construir un contra ejemplo como ejercicio).
Obviamente en los espacios normados podemos definir la convergencia de sucesiones, sucesiones
de Cauchy, etc.. Basta considerarlos como espacios metricos con la metrica ~r inducida por la norma:
~r(x, y) = kx yk.
Consideremos ahora un caso particular de las aplicaciones introducidas en la definicion A.1.5.
Definici
on A.1.28 Una aplicaci
on (operador) es lineal si
1. El dominio de T , D(T ), y la imagen de T , I(T ), son ambos espacios vectoriales sobre el mismo
cuerpo K (R o Z).
2. , K,

x, y D(T ),

T (z + y) = T (x) + T (y).

Definici
on A.1.29 Sean X e Y dos espacios normados y sea el operador T : D(T ) 7 Y lineal. T es
acotado si existe c 0 tal que25
kT xk ckxk,
25

x D(T ).

Se sobrentiende que kxk es la norma en X y kT xk es en Y.

(A.1.2)

n: Estacios m
A.1. Introduccio
etricos y espacios normados

125

De lo anterior se sigue que si T es acotado, entonces para todo x 6= 0,


kT xk
c,
kxk

x D(T ), x 6= 0.

(A.1.3)

El menor valor de c para el cual (A.1.2) se cumple lo denotaremos por kT k y se denomina norma del
operador lineal T . De hecho se tiene que
kT k =

kT xk
.
xX\{0} kxk
sup

(A.1.4)

Si T = 0 obviamente kT k = 0. Adem
as de (A.1.2), tomando nfimos en c obtenemos
y X,

kT yk
kT k
kyk

kT yk kT kkyk.

Es facil probar que kT k es una norma, es decir se cumplen los axiomas de la definicion.
Teorema A.1.30 Sea T : D(T ) X 7 Y una aplicaci
on lineal de un espacio normado X a otro
espacio normado Y. Entonces
1. T es continuo si y s
olo si T es acotado.
2. Si T es continuo en alg
un x0 D(T ), T es continuo en D(T ).
Demostraci
on: Asumiremos que T no es el operador nulo.
1. Sea T acotado y sea x0 D(T ) cualquiera. Como T es lineal y acotado, entonces
kT x T x0 k = kT (x x0 )k kT kkx x0 k.
Entonces, para todo > 0, existe un = /kT k > 0 tal que, para todo x con kx x0 k < ,
kT x T x0 k < , i.e., T es continuo en D(T ).
Sea T lineal y continuo en x0 D(T ) cualquiera. Entonces para todo > 0, existe un > 0
tal que, para todo x con kx x0 k < , kT x T x0 k < . Sea y 6= 0 en D(T ) cualquiera. Escojamos x
tal que
x = x0 +

y
2kyk

x x0 =

y
2kyk

kx x0 k <

Ademas, para dichos x tenemos, usando la linealidad de T , que






kT x T x0 k = kT (x x0 )k =
T 2kyk y = 2kyk kT yk

kT x T x0 k < .

kT yk

2
kyk,

luego T es acotado.

2. Notese que en la prueba anterior se probo que si T era continuo en un punto x0 D(T ),
entonces era acotado en D(T ). Pero entonces por 1, al ser acotado en D(T ), es continuo en D(T ).
Finalmente concluiremos con una secci
on sobre los espacios de Hilbert separables que complementa
los apartados 4.1 y 4.2.

n al ana
lisis funcional
Anexo: Breve introduccio

126

A.2.

Espacios de Hilbert separables

Definici
on A.2.1 Dado un vector x H definiremos la serie de Fourier respecto al sistema ortonormal (n )
n=1 a la serie

X
cn n ,
(A.2.1)
s :=
n=1

donde los coeficientes vienen dados por las expresiones


cn = hx, n i,

n 1.

(A.2.2)

Teorema A.2.2 Sea H el subespacio lineal de H generado por los vectores 1 , 2 . . . , n , n N, i.e.,
H = span (1 , 2 . . . , n ). Entonces
mn ||x q||2 = ||x||2
qH

n
X
k=1

|ck |2

donde ck son los coeficientes definidos en (A.2.2) y se alcanza cuando q es la suma parcial de la serie
de Fourier (A.2.1)
n
X
ck k .
q = sn :=
k=1

Pn

Demostraci
on: Sea gn =

k=1 ak k .

Calculamos
2

hx gk , x gk i = kxk

n
X
k=1

c2k kk k2

n
X
+
(ak ck )2 kk k2 .
k=1

Obviamente la expresi
on anterior es mnima si y s
olo si ak = ck para todo k N, i.e., gn = sn .

Notese que
*

kx sn k = x
+

n
X
k=1

n
X
hx, k i

k=1
n
X

kk k2

k , x

n
X
hx, k i

kk k2

k=1

= kxk 2

n
X
|hx, k i|2
k=1

kk k2
n

X |hx, k i|2
X
|hx, k i|2 hm , k i
2
2
=
kxk

=
kxk

|ck |2 .
2
2
2
k
k
k
k
k
k
m
k
k
m=1
k=1

(A.2.3)

k=1

Como corolario de lo anterior tenemos que


In = kx sn k2 = kxk2
luego

por lo que la serie

X
k=1

2
k=1 |ck |

k=1

|ck |2 0,

n N,

|ck |2 kxk2 ,

(A.2.4)

converge (por que?) y por tanto

lm |cn | = 0

n
X

lm hx, k i = lm hk , xi = 0.

(A.2.5)

127

A.2. Espacios de Hilbert separables

La desigualdad (A.2.4) se conoce como desigualdad de Bessel. Notese que una condici
on necesaria y suficiente para que la serie de Fourier (A.2.1) converja a x (en norma) es que
kxk2 =

X
k=1

|ck |2 =

X
k=1

|hx, n i|2 .

Esta igualdad se denomina com


unmente igualdad de Parseval y es, en general, muy complicada de
comprobar.
Definici
on A.2.3 Se dice que un sistema de vectores linealmente independientes (n )n es completo
en X H si para todo vector x X H y cualquiera sea > 0 existe una combinaci
on lineal
ln =

n
X

k k

tal que

k=1

kx ln k < .

En otras palabras cualquier vector x X H se puede aproximar en norma tanto como se quiera
mediante alguna combinaci
on finita de vectores del sistema (n )n . Esta definicion es equivalente a
decir que H es el menor subespacio vectorial cerrado que contiene al conjunto 1 , 2 , . . . ((n )n genera
a todo H).
Definici
on A.2.4 Un sistema ortogonal (ortonormal) completo de X H se denomina base ortogonal
(ortonormal) de X H.
Por ejemplo, los sistemas (ek )k definidos por (A.2.6) y (A.2.7) son bases ortogonales completas de Cn
y l2 , respectivamente
e1 = (1, 0, 0, . . . , 0), e2 = (0, 1, 0, . . . , 0), . . . , en = (0, 0, 0, . . . , 1),

(A.2.6)

e1 = (1, 0, 0, 0, . . . ), e2 = (0, 1, 0, 0, . . . ), en = (0, 0, 1, 0 . . . ), . . . .

(A.2.7)

Teorema A.2.5 Sea H un espacio de Hilbert y sea el sistema ortonormal de vectores (n )


n=1 de H.
Entonces las siguientes condiciones son equivalentes:
1. (n )n es completo en X H.
2. Para todo x X H, x =

X
k=1

hx, k ik .

3. Para todo x X H, se cumple la igualdad de Parseval


kxk2 =

X
k=1

|hx, k i|2 .

4. Si hx, k i = 0 para todo k N entonces x = 0.


Demostraci
on: 1) 2) Cualquiera sea x H construimos la serie de Fourier (A.2.1) y sean sn =
Pn
c

k=1 k k sus sumas parciales. Usando 1) y el teorema A.2.2 tenemos


> 0,

N N tal que kx sN k < .

n al ana
lisis funcional
Anexo: Breve introduccio

128

Pero como para todo n > N , kx sn k kx sN k (basta usar la identidad (A.2.3)), entonces para
todo n > N , kx sn k , es decir, lmn sn = x de donde se sigue 2). Obviamente 2) implica 1)
(por que?).
2)3) Tomando el lmite n en (A.2.3) y usando 2) (lmn kx sn k = 0), se sigue 3).
3)4) Si para todo k N hx, k i = 0, entonces de 3) se deduce que kxk = 0, luego x = 0.
Pn
4)2) Por sencillez consideremos que el sistema (n )n es ortonormal.PSea yn =
k=1 ck k ,

2
ck = hx, k i . Usando la desigualdad de Bessel (A.2.4) se sigue que la serie m=1 |cm | es una serie
convergente y por tanto la cantidad
kyn yn+p k2 =

n+p
X

k=n+1

|ck |2 ,

se puede hacer tan peque


na como se quiera, i.e., la sucesion yn es de Cauchy, luego es convergente.
Sea y su lmite. Probemos que y = x.
Usando la desigualdad de Cauchy-Schwarz
|hy, k i hyn , k i| = |hy yn , k i| kyn ykkk k,
deducimos que lmn hyn , k i = hy, k i para todo k N. Pero
hyn , k i =

n
X
hx, j ihk , j i = hx, k i,
j=1

k n,

luego hx yn , k i = 0 para todo k n de donde, tomando n deducimos que hx y, k i = 0 para


todo k N, luego por 4) x y = 0.

Nota A.2.6 La equivalencia entre 1 y 2, as como las implicaciones 2 3 4, son tambien ciertas
para espacios eucldeos cualesquiera (no necesariamente completos).
A partir del apartado 4 del Teorema A.2.5 se sigue el siguiente corolario:
Corolario A.2.7 Sea el sistema ortonormal completo (n )n y sean x, y X H tales que hx, k i =
hy, k i para todo k N, entonces x = y.
En otras palabras, dos elementos de H con iguales coeficientes de Fourier son iguales, por tanto
cualquier vector de H queda biunvocamente determinado por sus coeficientes de Fourier.
Definici
on A.2.8 Se dice que un sistema ortonormal (n )n es cerrado en un espacio eucldeo E si
para todo vector x E se cumple la igualdad de Parseval

X
k=1

|ck | =

X
k=1

|hx, k i|2 = kxk2 .

De la definicion anterior y el Teorema A.2.5 se sigue que un un sistema ortonormal (n )n es


completo en un espacio de Hilbert H si y s
olo si (n )n es cerrado en H.

129

A.2. Espacios de Hilbert separables


Teorema A.2.9 Todo espacio de Hilbert H separable tiene una base ortonormal.

Demostraci
on: Como H es separable, existe un conjunto numerable de vectores (n )n denso en H. Si de
dicho conjunto eliminamos aquellos vectores k que se pueden obtener como combinaci
on lineal de los
anteriores j , j < k obtenemos un sistema completo de vectores linealmente independientes de H. La
base ortonormal se obtiene al aplicar a dicho sistema el proceso de ortogonalizaci
on de Gram-Schmidt.

El teorema anterior se puede generalizar a cualquier espacio eucldeo separable.


Teorema A.2.10 (Riesz-Fischer) Sea (n )n un sistema ortonormal en un espacio de Hilbert H y
sean los n
umeros c1 , c2 , . . . , cn , . . . tales que

n=1

|cn |2 < +.

Entonces, existe un elemento x H cuyos coeficientes de Fourier son precisamente los n


umeros c1 ,
c2 , . . . , cn , . . . , i.e.,

X
|cn |2 = kxk2 ,
cn = hx, n i.
n=1

P
Demostraci
on: Sea xn = nk=1 ck k . Como vimos en la prueba del Teorema A.2.5 la sucesion anterior
n
es de Cauchy y como H es completo entonces xn x H. Probemos que entonces ck = hx, k i,
k = 1, 2, . . . . Para ello notemos que
hx, k i = hxn , k i + hx xn , k i.
Pero entonces si n k, hx xn , k i = 0 y, por tanto, ck = hx, k i = hxn , k i, de donde se sigue,
tomando el lmite n y usando la continuidad del producto escalar que para todo k = 1, 2, 3, . . . ,
n
ck = hx, k i. Adem
as, como xn x, usando (A.2.3), se tiene que
2

kxk

n
X
k=1

|ck |2 = kx xn k2 0,

de donde se sigue el teorema.

Definici
on A.2.11 Una aplicaci
on U entre dos espacios de Hilbert H y H se denomina unitaria si
U es lineal, biyectiva y preserva el producto escalar, i.e.26 ,
hx, yi = hU x, U yi = hx , y i .
Los espacios H y H son isomorfos si existe una aplicaci
on unitaria U : H 7 H tal que x = U x,
donde x H y x H .
Como consecuencia de los Teoremas A.2.5, A.2.9 y A.2.10 se tiene el siguiente resultado:
Teorema A.2.12 (del isomorfismo) Cualquier espacio de Hilbert separable H es isomorfo a Cn o
a l2 .
26

Se entiende que h, i denota el producto escalar en H que no tiene por que ser el mismo que en H.

n al ana
lisis funcional
Anexo: Breve introduccio

130

Demostraci
on: Como H es separable, en H existe una base ortonormal numerable (ver Teorema A.2.9)
que denotaremos por (n )nI , donde I es un conjunto numerable (finito o infinito). Asumiremos que
I es infinito, (I = N) i.e., probaremos el caso cuando H es isomorfo a l2 (el caso finito
P es totalmente
2

an
on U : H 7 l definida por x = U x =
kI hx, k iek =
Palogo). Sea 2x H y sea la aplicaci
2 que ya hemos visto antes. Esta
)
denota
la
base
ortonormal
can
o
nica
de
l
x
e

l
,
donde
(e
n
n
k
k
kI
claro que U es biunvoco, pues dada cualquier sucesion (xn )n de l2 por el Teorema de Riesz-Fischer
existe un x H cuyos coeficientes de Fourier coinciden con dichos valores xn y por el Corolario A.2.7
dicho elemento es u
nico. Adem
as, como el producto escalar hx, yi es linear respecto al elemento de la
izquierda (i.e., x), esta claro que U es lineal (probarlo como ejercicio). Finalmente, para probar que
U es unitario usamos, por un lado, que
+
*
X
X
X
xk y k ,
xk k ,
ym m =
hx, yi =
kI

mI

kI

y, por el otro, que el producto escalar en l2 viene dado por hx , y il2 =


que hx, yi = hx , y il2 .

kI

xk yk , de donde se sigue

Definici
on A.2.13 Sea M H un subespacio27 cerrado del espacio de Hilbert H. Denominaremos
complemento ortogonal de M , y lo denotaremos por M , al conjunto
M = {x H; hx, yi = 0, y M }.
Notese que al ser M cerrado, es completo (pues H es completo, y todo subespacio M de un
espacio metrico completo H es completo si y s
olo si es cerrado en H).
Teorema A.2.14 Sea M H un subespacio cerrado del espacio de Hilbert H y M su complemento
ortogonal. Entonces, todo vector x H admite una u
nica representaci
on de la forma x = y + y donde
y M e y M .
Demostraci
on: Como H es separable y M es cerrado en H, entonces M es completo (recordemos
nuevamente que todo subespacio M de un espacio metrico completo H es completo si y s
olo si es
cerrado en H) y separable, i.e., M es a su vez un espacio
de
Hilbert
separable
por
lo
que
existe
una
P
base orthonormal completa (n )n de M . Definamos y = n hx, n in . Obviamente y M . Definamos
P
y = x y. Entonces, para todo n hy , n i = 0. Ahora bien, cualquiera sea y M , y = n an n ,
luego hy , yi = 0, es decir y M . Luego cualquiera sea x H, existen y M y y M tales
que x = y + y . Probemos que esta descomposici
on es u
nica. Para ello supongamos que no, i.e.,

supongamos que existen un y M , y 6= y tal que x = y + y , y M (y obviamente distinta de


y ). Entonces

hy , n i = hx y , n i = hx, n i = hy, n i = y = y,
lo que es una contradicci
on.

Si todo elemento de H se puede escribir en la forma x = y + y donde y M e y M , entonces


se dice que M es suma directa de M y M y se escribe como H = M M . Es facil ver que la noci
on
de suma directa se puede extender al caso de un n
umero finito o contable de subespacios M1 , M2 , etc.
Notese adem
as que del teorema anterior se sigue que (M ) = M .
Para terminar mencionaremos un teorema sobre funcionales lineales acotados.
27

Se entender
a, como el caso de los espacios normados que M es un subespacio lineal de H.

131

A.2. Espacios de Hilbert separables

Teorema A.2.15 (Riesz) Cualquier funcional lineal acotado T : H 7 K (K es C o R) se puede


representar en terminos de un producto escalar, i.e.,
T x = hx, zi,
donde z depende de T y esta unvocamente determinado por T y su norma satisface la ecuaci
on
kzk = kT k.
La prueba de este importante teorema se puede encontrar en [E. Kreyszig. Introductory Functional
Analysis with Applications, p
ag. 188].

A.2.1.

Operadores en espacios de Hilbert

Definici
on A.2.16 Sea la aplicaci
on (operador) linear A : E 7 E , E, E espacios eucldeos. Si existe

el operador lineal A : E 7 E tal que para todo x E e y E


hAx, yi = hx, A yi,
lo denominaremos adjunto de A.
Por sencillez asumiremos E = E.
Por ejemplo sea el operador S : l2 7 l2
S(x1 , x2 , x3 , . . .) = (0, x1 , x2 , . . .),
com
unmente denominado operador desplazamiento (shift). Entonces su adjunto S es el operador
S : l2 7 l2
S (x1 , x2 , x3 , . . .) = (x2 , x3 , . . .),
Para los espacios eucldeos la existencia del operador adjunto no est
a garantizada en general, no
obstante si que lo est
a en el caso de los espacios de Hilbert. De hecho, como consecuencia del Teorema
de representaci
on de Riesz A.2.15 se tiene el siguiente resultado:
Teorema A.2.17 Sea la aplicaci
on (operador) linear A : H 7 H , H, H espacios de Hilbert. Entonces

existe un u
nico operador A : H 7 H adjunto a A. Adem
as, A es lineal y kA k = kAk.
Demostraci
on: Definimos el funcional Ty x : H 7 K, Ty x := hAx, yi . Obviamente, para cada y fijo
|Ty x| kAxkkyk kAkkxkkyk Kkxk,

y H ,

i.e., Ty es un funcional acotado, as que el teorema de Riesz A.2.15 nos asegura que existe un u
nico
vector y tal que Ty x = hx, y i, para todo x H. As, el operador A : H 7 H induce un operador
A : H 7 H con A y = y , pues hAx, yi = hx, y i = hx, A yi. La linealidad de A se sigue de la
linealidad de A. Probemos ahora que kA k = kAk. De la igualdad hAx, yi = hx, A yi y usando que A
es acotado tenemos
|hx, A yi| = |hAx, yi | kAkkxkkyk.
Escogiendo x = A y obtenemos

kA yk2 kAkkA ykkyk

kA yk
kAk
kyk

kA k kAk.

n al ana
lisis funcional
Anexo: Breve introduccio

132

De lo anterior se sigue que A es acotado. Pero entonces podemos aplicar el mismo razonamiento intercambiando A y A lo que nos conduce a la desigualdad contraria kAk kA k por tanto kAk = kA k.
En adelante asumiremos que H = H . Supongamos que H es un espacio de Hilbert de dimension
finita. Entonces como ya hemos visto, H es isomorfo a Cn . Sea (ek )k una base de H. Entonces para
todo x H
n
n
X
X
xk Aek .
xk ek = y = Ax =
x=
k=1

k=1

Si

Aek =

n
X

ai,k ei

y=

n
n
X
X
i=1

i=1

yi =

n
X

ai,k xk ,

ai,k xk

k=1

ei =

n
X

yi ei

i=1

i = 1, 2, . . . n.

k=1

Es decir, si consideramos los vectores x, y Cn con coordenadas xi , yi , i = 1, . . . , n, respectivamente,


entonces el operador A se puede representar como una matriz (ai,j )ni,j=1 , i.e., tenemos la aplicaci
on
n
n
A : C 7 C , y = Ax, donde A es una matriz n n

a1,1 a1,2 a1,3 a1,n


a2,1 a2,2 a2,3 a2,n

A = a3,1 a3,2 a3,3 a3,n .


..
..
..
.
..
..
.

.
.
.
an,1 an,2 an,3

an,n

Obviamente la matriz de la aplicaci


on identidad es la matriz identidad.
Notese que lo anterior se puede generalizar
matriz sera una matriz infinita

a1,1 a1,2
a2,1 a2,2

a3,1 a3,2

..
A=
...
.

an,1 an,2

..
..
.
.

al caso de dimension infinita, s


olo que en este caso la
a1,3
a2,3
a3,3
..
..
.
.
an,3
..
..
.
.

a1,n
a2,n
a3,n
..
.
an,n
..
.

..
.

Definici
on A.2.18 Sea el operador lineal A : X 7 Y, X e Y espacios de Banach. Diremos que A es
invertible si existe un operador B, A : Y 7 X tal que AB = IY , BA = IX .
Esta claro que para el caso de dimension finita, existira el inverso de A si dim X = dim Y y la
matriz correspondiente ser
a la matriz inversa de A. En dimension infinita la situaci
on es algo m
as
complicada. Por ejemplo, el operador desplazamiento S cumple con S S = I pero SS 6= I, luego S
no tiene inverso.
Teorema A.2.19 Sea el operador lineal A : X 7 X, X espacio de Banach. Si kAk < 1, entonces
I A es invertible y (en norma)
1

(I A)

X
k=0

Ak ,

donde A0 := I.

133

A.2. Espacios de Hilbert separables

Demostraci
on: Sea la sucesion de operadores (An )n , definida por An x := Xn = (I +A+A2 + +An )x,
x X (cualquiera). Obviamente An es un operador acotado (probarlo como ejercicio). Probemos que
(Xn )n es de Cauchy (en la norma de X):
kXn+p Xn k =kXn+1 + + Xn+p k = kAn+1 x + + An+p xk kAn+1 xk + + kAn+p xk
kxk(kAn+1 k + + kAn+p k) kxk(kAkn+1 + + kAkn+p )

kxk(kAkn+1 + + kAkn+p + ) kxk

kAkn+1 n
0.
1 kAk

Como X es completo (es de Banach) entonces, para cada x X la sucesion An x converge a un y X


que denotaremos por y = T x. As, tendremos el operador T : X 7 X bien definido. Como A es
lineal, An lo ser
a y por tanto T tambien. Para ello basta tomar el lmite cuando n en la igualdad
An (x+y) = An x+An y, , K y x, y X. Si tomamos ahora el lmite p en la desigualdad
de antes y usamos que Xn+p = An+p x T x, obtenemos
kT x An xk kxk

kAkn+1
,
1 kAk

de donde se sigue que T An es un operador lineal acotado, luego T lo ser


a (por que?). De la
desigualdad anterior se sigue adem
as que
kT x An xk
kAkn+1
kAkn+1 n
0 = lm An = T.

= kT An k
n
kxk
1 kAk
1 kAk
Probemos ahora que T = (I A)1 . Ante todo notemos que I A es un operador lineal y acotado y
por tanto continuo28 . Calculemos el producto
(I A)T x = (I A) lm An x = lm (I A)An x = lm (An x A An x) = lm (x An+1 x).
n

Pero kAn+1 xk kAkn+1 kxk 0, luego An+1 x 0, y por tanto (I A)T x = x para todo x. La
prueba de que T (I A)x = x para todo x es an
aloga y la omitiremos.

Definici
on A.2.20 Denotaremos por L(X) el conjunto de todos los operadores lineales A en X, i.e.,
A : X 7 X.
Notese que la prueba del Teorema A.2.19 se puede adaptar para probar que toda sucesion de
Cauchy de operadores Tn L(X) es convergente. Si Tn es de Cauchy entonces > 0, existe un N N
tal que n N, n > N y p N, kTn+p Tn k < . Luego la sucesion Xn := Tn x es de Cauchy
n

kTn+p x Tn xk kTn+p Tn kkxk kxk = kTn+p x Tn xk 0.


Como X es completo Tn x tendra un lmite y para cada x, i.e., podemos definir el operador T : X 7 X
por T x = y. De la misma forma que en la prueba del Teorema A.2.19 se sigue que T es lineal. Para
probar que es acotado usamos la desiguladad anterior:
kTn+p x Tn xk kTn+p Tn kkxk =

kT x Tn xk
kTn+p x Tn xk
=

kxk
kxk

donde hemos tomando el lmite p y usado la continuidad de la norma. I.e., T Tn es acotado y


por tanto T lo es (Tn es acotado). Adem
as, de lo anterior se sigue tambien, tomando el supremo en x,
n
que kT Tn k para todo n > N , i.e., Tn T . Lo anterior nos conduce al siguiente teorema:
28
Aqu usamos el hecho conocido de que toda aplicacion lineal T : D(T ) X 7 Y de un espacio normado
(Hilbert) X a otro espacio normado (Hilbert) Y tiene las propiedades: 1. T es continua si y solo si T es acotada
y 2. Si T es continua en alg
un x0 D(T ), T es continua en todo su dominio D(T ).

n al ana
lisis funcional
Anexo: Breve introduccio

134

Teorema A.2.21 El espacio L(X) es un espacio de Banach respecto a la norma de los operadores.
Una aplicaci
on directa del Teorema A.2.19 es el siguiente resultado:
Teorema A.2.22 Sea X un espacio de Banach y sea L(X) el conjunto de todos los operadores lineales
A : X 7 X. El conjunto E L(X) de los operadores invertibles en X es abierto en L(X).
Demostraci
on: Sea A L(X) un operador invertible. Definamos la bola B(A, 1/kA1 k). Cualquiera
sea B B(A, 1/kA1 k) tendremos que
kB Ak

1
= k(B A)A1 k kB AkkA1 k < 1,
kA1 k

luego el operador I + (B A)A1 = BA1 es invertible, por tanto el operador B = (BA1 )A lo ser
a,
i.e., todo operador B B(A, 1/kA1 k) es invertible, por tanto para cualquiera sea A E existe una
bola B(A, 1/kA1 k) E centrada en A, luego E es abierto.

Definici
on A.2.23 Un operador lineal A : X 7 Y, X e Y espacios de Banach es compacto si para
toda sucesi
on acotada (xn )n de X, la sucesi
on (Axn )n de Y tiene una subsucesi
on convergente.
Notese que si A es compacto, A es acotado pues en caso contrario existira una sucesion acotan
da (xn )n tal que kAxn k y entonces la sucesion (Axn )n no tendra una subsucesi
on convergente.
Se puede probar que cualquier operator A : H 7 H, siendo H un espacio de Banach de dimension
finita es compacto, no obstante la compacidad no es trivial en el caso infinito tal y como muestra el
siguiente ejemplo: El operador identidad I : H 7 H, H espacio de Hilbert de dimension infinita no
es compacto. Para probarlo, escojamos una sucesion orthonormal (xn )n en H. Como kxn xm k2 = 2
para todos n, m N, entonces la sucesion Ixn = xn no contiene subsucesiones de Cauchy y por tanto
no tiene subsucesiones convergentes.

Teorema A.2.24 Sea A L(H) un operador compacto y B L(H) uno acotado, H espacio de
Hilbert. Entonces los operadores AB y BA son compactos.

Demostraci
on: Sea (xn )n una sucesion acotada de H. Como B es acotado, entonces la sucesion (Bxn )n
es acotada y como A es compacto, de la sucesion (ABxn )n se puede extraer una subsucesi
on convergente, luego AB es compacto.
Sea ahora (xn )n una sucesion acotada de H. Como A es compacto, existe una subsucesi
on (Axnk )k
de (Axn )n que converge. Ahora bien, B es acotado, luego es continuo (ver Teorema A.1.30), por lo
que la subsucesi
on (BAxnk )k converge, luego BA es compacto.

Definici
on A.2.25 Un operador A : H 7 H, H espacio de Hilbert, se llama hermtico o autoadjunto
si A = A , i.e.,
hAx, yi = hx, A yi,
x, y H.

135

A.2. Espacios de Hilbert separables

A.2.2.

Teora Espectral de operadores compactos autoadjuntos

En un espacio de dimension finita podemos definir el espectro de un operador como el conjunto


de los autovalores de su correspondiente matriz (en alguna base29 ), i.e., es el conjunto de los n
umeros
complejos tales que
Ax = x, x 6= 0.
(A.2.8)

Puesto que para cualquier matriz n n existen n autovalores, en el caso finito es relativamente simple
de estudiar. No as el caso infinito.

Por ejemplo el operador desplazamiento ya visto antes S : l2 7 l2 , S(x1 , x2 , x3 , . . .) = (0, x1 , x2 , . . .),


no tiene autovalores pues la igualdad Sx = x implica x = 0.
As se precisa de una definicion m
as general.
Definici
on A.2.26 Sea X un espacio de Banach y A una aplicaci
on lineal A : X 7 X. El espectro de
A, que denotaremos por (A) es el conjunto de n
umeros complejos tales que el operador (I A) es
no invertible, i.e., no existe (I A)1 .
De la definicion anterior se sigue que en dimension finita (A) es el conjunto de todos los autovalores de A.
Teorema A.2.27 (A) es un compacto de C (conjunto cerrado y acotado de C) contenido en el
interior del disco cerrado D = {z; |z| kAk}.
Demostraci
on: Sea L(X) el conjunto de todos los operadores lineales de X en X, X espacio de Banach.
Definamos el operador F : C 7 L(X), F () = I A. Esta claro que F es lineal. Como para todo
, C, kF () F ()k = | |, entonces F es acotado y por el Teorema A.1.30 F es continuo (en
) en la norma de los operadores.
Sea E L(X) el espacio de las aplicaciones invertibles. Si (A), entonces I A no es
invertible, luego para (A) no existe el inverso de F , i.e., (A) es la imagen inversa F 1 de
L(X) \ E, (A) = F 1 (L(X) \ E). Como E es abierto (Teorema A.2.22) entonces L(X) \ E es cerrado,
y como F es continua entonces por la Proposici
on A.1.12, F 1 (L(X) \ E) es cerrado, luego (A) lo
ser
a. Escojamos ahora tal que || > kAk, entonces k1 Ak < 1 as que (I 1 A) es invertible y
por tanto I A lo ser
a. Entonces para dichos tendremos que 6 (A), i.e., (A) B(0, kAk). Es
decir, (A) es cerrado y acotado, por lo tanto es compacto (en dimension finita cerrado y acotado es
equivalente a compacto) contenido en el interior de la bola cerrada B(0, kAk).

Teorema A.2.28 Sea H un espacio de Hilbert y A una aplicaci


on lineal A : H
7
H hermtica
(autoadjunta). Entonces todos los autovalores de A (si los tiene) son reales. Adem
as los autovectores
correspondientes a autovalores distintos son ortogonales.
Demostraci
on: Sea un autovalor de A y x su correspondiente autovector, que sin perdida de generalidad asumiremos normalizado kxk = 1. Entonces, usando que Ax = x y que A es hermtico,
tenemos
hAx, xi = hx, Axi = kxk = kxk = = = R.

Sea Ax1 = 1 x1 y Ax2 = 2 x2 . Entonces como A es hermtico


hAx1 , x2 i = hx1 , Ax2 i

1 hx1 , x2 i = 2 hx1 , x2 i

de donde se sigue que si 1 6= 2 entonces x1 y x2 son ortogonales.


29

(1 2 )hx1 , x2 i = 0,

Es un hecho conocido del


algebra lineal que los autovalores de un operador no dependen de la base escogida.

n al ana
lisis funcional
Anexo: Breve introduccio

136

Teorema A.2.29 Sea A un operador compacto en un espacio de Hilbert y (n )n una sucesi


on ortonormal de H. Entonces lmn An = 0.
Demostraci
on: Supongamos que el teorema es falso, entonces para alg
un > 0 ha de existir una
subsucesi
on (kn )n tal que kAkn k > para todo n N. Como A es compacto y la sucesion (kn )n es
acotada, entonces hay al menos una subsucesi
on convergente (mn )n tal que lmn Amn = 6= 0.
Entonces
0 6= kk2 = h, i = lm hAmn , i = lm hmn , A i = 0,
n

, A i

pues
H y por tanto hmn
es, escencialmente, el mn coeficiente de Fourier cmn de A el
cual sabemos que tiende a cero si n (A.2.5).

Como hemos visto en dimension infinita un operador lineal A en general puede no tener autovalores. No ocurre as con los operadores compactos y autoadjuntos.
Teorema A.2.30 Sea H un espacio de Hilbert y A un operador lineal A : H 7 H autoadjunto
(hermtico) y compacto. Entonces = kAk o = kAk es un autovalor de A.
Demostraci
on: Ver, por ejemplo, L. Debnath & P. Mikusinski - Introduction to Hilbert spaces with
applications, Academic Press, 1990. Teorema 4.9.8 p
ag. 182.

Del teorema anterior se sigue que todo operador compacto y autoadjunto tiene siempre al menos
un autovalor. De hecho se tiene el siguiente teorema:
Teorema A.2.31 Sea H un espacio de Hilbert separable y A una aplicaci
on lineal A : H 7 H
autoadjunta (hermtica) y compacta. Entonces A tiene un n
umero finito de autovalores n reales
n
distintos o si es infinito, entonces, es numerable y si lo ordenamos de mayor a menor n 0.
a comDemostraci
on: Del teorema A.2.30 se sigue que el conjunto de autovalores no es vaco, luego est
puesto por un n
umero finito o infinito de elementos (que son n
umeros reales por el Teorema A.2.28).
Sea 1 tal que |1 | = kAk y sea x1 el correspondiente autovector (normalizado a la unidad, i.e.
kx1 k = 1). Sea H1 = H y definamos H2 el espacio de todos los vectores ortogonales a x1 , i.e.,
H2 = {x H | hx, x1 i = 0},
es el complemento ortogonal de x1 . Pero, para todo x H2 ,
hAx, x1 i = hx, Ax1 i = 1 hx, x1 i = 0
es decir, H2 es invariante respecto a la accion de A. Sea A|H2 la restriccion de A al espacio H2 . Si
A|H2 no es el operador nulo, entonces podremos aplicar el mismo razonamiento de antes, por lo que
existira 2 y x2 tales que |2 | = kA|H2 k, donde adem
as es obvio que |2 | |1 |. As podemos seguir
hasta que en cierto paso k A|Hk = 0 obteniendo la sucesion finita de autovalores (k )nk=1 con sus
correspondientes autovectores normalizados30 (xk )nk=1 tales que
|1 | = kA|H1 k |2 | = kA|H2 k |n | = kA|Hn k.
30

Es importante destacar que para cada k , k = 1, 2, 3, . . . puede haber mas de un autovector.

137

A.2. Espacios de Hilbert separables

Si A|Hk 6= 0 para todo k N, entonces existen infinitos autovalores distintos n con sus correspondientes autovectores xn normalizados (que pueden ser m
as de uno), que son numerables pues H es
separable (por que?). Ahora bien, por el Teorema A.2.29 tenemos
0 = lm kAxn k2 = lm hAxn , Axn i = lm |n |2 ,
n

de donde se sigue que n 0.

Existe otra forma de probar que n 0. En efecto, supongamos que hay infinitos n distintos
n

pero que n
6
0. Entonces existe un > 0 tal que infinitos nk son tales que |nk | > . Construyamos
con dichos elementos una sucesion que denotaremos por (k )k . Como todos los elementos de (k )k son
distintos, el Teorema A.2.28 garantiza que sus correspondientes autovectores son ortogonales xk , i.e.,
hxk1 , xk2 i = 0. Si calculamos ahora la norma
kAxk+p Axk k2 = kk+p xk+p k xk k2 = |k+p |2 + |k |2 > 22 ,

k, p N

es decir, la sucesion (Axk )k no contiene ninguna subsucesi


on de Cauchy y por tanto no contienne
ninguna sucesion convergente (por que?) lo que contradice que A sea un operador compacto.
Del teorema anterior se sigue adem
as que los espacios ker(k I A), para cada k , k = 1, 2, 3, . . .
n

son de dimension finita, pues en caso contrario n


6
0.

Teorema A.2.32 (Teorema espectral) Sea H un espacio de Hilbert y A una aplicaci


on lineal A :
H 7 H autoadjunta y compacta. Existe una sucesi
on numerable (finita o infinita) de autovectores
ortonormales (xn )n de H cuya correspondiente sucesi
on de autovalores denotaremos por (n )n tales
que,
X
n hx, xn ixn ,
x H,
(A.2.9)
Ax =
n

donde se tiene que:

1. En (A.2.9) aparecen todos los autovalores de A.


n

2. Si la sucesi
on (n )n es infinita se puede reordenar de forma que n 0.
3. Los correspondientes espacios ker(n I A), para todo n = 1, 2, 3, . . . son de dimensi
on finita,
siendo la dimensi
on de estos el n
umero de veces que aparece un mismo k en la f
ormula (A.2.9).
Demostraci
on: Utilizando la misma construccion que usamos en la prueba del teorema A.2.31 obtenemos una sucesion de autovalores (k )nk=1 con sus correspondientes autovectores normalizados (xk )nk=1
(para cada k puede haber m
as de un autovector, en funcion de la multiplicidad del mismo) tales que
|1 | 2 | |n |.
Durante el proceso hemos construido adem
as la cadena de subespacios invariantes respecto a A
H = H1 H2 Hn
donde Hk+1 = {x Hk | hx, xj i = 0, j = 1, 2, . . . , k}.
x

Supongamos que A|Hn+1 = 0, entonces el proceso acaba (caso finito). Sea, en este caso, yn =
P
n
k=1 hx, xk ixk . Entonces
n
X
hyn , xj i = hx, xj i
hx, xk i hxk , xj i = hx, xj i hx, xj i kxj k = 0.
|{z}
| {z }
k=1

j,k

=1

n al ana
lisis funcional
Anexo: Breve introduccio

138

Luego, yn Hn+1 y por tanto Ayn = 0, i.e.,

n
X
hx, xk iAxk
0 = Ayn = Ax

Ax =

n
X
k=1

k=1

k hx, xk ixk

como se quera probar.


El caso infinito es similar. Ante todo notemos que en este caso tenemos una sucesi
P on n tal
n
que n 0 (ver Teorema A.2.31). Definamos nuevamente el vector yn = x nk=1 hx, xk ixk .
Usando (A.2.3) se sigue que kyn k2 kxk2 . Ademas, como ya vimos yn Hn+1 , luego, usando que
Ayn = A|Hn+1 yn , y kA|Hn+1 k = |n+1 | obtenemos
n

kAyn k |n+1 |kxk 0

lm Ayn = 0,

de donde se sigue la iguladad buscada


Ax =

n=1

n hx, xn ixn ,

x H.

Comprobemos ahora que todos los autovalores de A est


an presentes en la formula (A.2.9). Esta
cuesti
on es de suma importancia pues en la prueba hemos usado los autovalores obtenidos gracias al
Teorema A.2.30 por lo que procede preguntarse si existen otros autovalores de A no nulos distintos
a los anteriores. Comprobemos que eso es imposible. Supongamos que existe un autovalor 6= 0
distinto de los autovalores k que aparecen en la suma (A.2.9), i.e., 6= k , para todo k, y sea x su
correspondiente autovector normalizado a la unidad. Por el Teorema A.2.28 x es ortogonal a todos
los xk , i.e., hx, xk i = 0 para todo k. Pero entonces, aplicando la formula (A.2.9) a dicho autovector x
tenemos

X
X
n 0 xn = 0,
n hx, xn ixn =
x = Ax =
n=1

n=1

lo que es una contradicci


on. Lo anterior tiene una implicaci
on importante: Formalmente el proceso de
encontrar los autovalores de A basado en el Teorema A.2.30 permite encontrarlos todos.

Probemos finalmente que, en caso de que k 6= 0, k = 1, 2, 3, . . ., la dimension de ker(k I A) = p,


(1)
donde p es el n
umero de veces que aparece k en la formula (A.2.9). Por simplicidad denotemos por xj ,
(p)

. . . , xj p autovectores linealmente independientes asociados a j . Supongamos que dim ker(j I A) >


(1)

p, entoces existe al menos un x ker(j I A) que es linealmente independiente de los vectores xj ,


(p)

. . . , xj y que asumiremos, sin perdida de generalidad, que ortogonal a ellos (por que?). Entonces
est
a claro que dicho x es ortogonal a todos los vectores xk que aparecen en la formula (A.2.9) (ya sea
(1)
(p)
porque los xk corresponden a autovalores distintos a j o bien sean los xj , . . . , xj de antes), i.e.,
hx, xk i = 0 para todo k, luego usando (A.2.9) obtenemos
X
X
0 6= j x = Ax =
k hx, xk ixk =
k 0 xk = 0,
k

lo cual es una contradicci


on.

Corolario A.2.33 Sea H un espacio de Hilbert separable y A una aplicaci


on lineal A : H 7 H autoadjunta y compacta. Entonces existe un sistema ortogonal completo (base ortonormal) de autovectores
ortonormales (en )n de H consistente en los correspondientes autovectores de A. Adem
as,
X
Ax =
n hx, en ien ,
x H,
n

donde (n )n es la correspondiente sucesi


on de autovalores asociados a (en )n .

Demostraci
on: Del Teorema espectral A.2.32 se sique que existe un conjunto de autovectores (finito o
infinito) (n )n tal que
X
Ax =
n hx, n in ,
x H.
(A.2.10)
n

Asumamos que n 6= 0 (si hay alg


un n = 0 este se puede omitir de la suma). Como el n
ucleo de A,
ker A H (que coincide con el subespacio vectorial generado por los autovectores correspondientes
a = 0) es a su vez un espacio de Hilbert separable (por que?) existira una sistema (numerable)
ortogonal completo que denotaremos por (n )n . Dicho sistema de vectores son autovectores correspondientes al autovalor 0. Sea ahora un autovector cualquiera m correspondiente al autovalor m 6= 0.
Entonces m ser
a ortogonal a todos los n y el sistema (m )m ser
a ortogonal a (n )n . Adem
as de
(A.2.10) se tiene que para todo x H
!
X
X
hx, m iAm = 0,
A x
hx, m im = Ax
m

i.e., x m hx, m im ker A, luego podemos desarrollarlo en serie de Fourier en la base de ker A
(n )n de forma que obtenemos
X
X
X
X
x
hx, m im =
hx, n in = x =
hx, m im +
hx, n in x H,
m

i.e., el sistema (m )m (n )n es completo (Teorema A.2.5) que podemos ortogonalizar utilizando el


metodo de Gram-Schmidt obteniendo el sistema ortonormal (numerable) (en )n (recordemos que para autovectores correspondientes a autovalores distintos ya teniamos la ortogonalidad, as que s
olo
es necesario
aplicarlo a los autovectores correspondientes a un mismo autovalor), luego tendremos
P

x = n hx, en ien de donde se sigue el teorema.


Como consecuencia del teorema anterior tenemos que todo operador lineal A : H 7 H autoadjunto
y compacto en H, espacio de Hilbert separable, se le puede puede hacer corresponder una matriz (finita
o infinita) que adem
as es diagonalizable y en cuya diagonal aparecen los correspondientes autovalores.
Ademas se tiene el siguiente resultado:
Teorema A.2.34 Sean A y B dos operadores autoadjuntos y compactos en un espacio de Hilbert
separable. Si A y B conmutan, entonces tienen un sistema completo de autovectores com
un.
Demostraci
on: Sea un autovalor de A y sea S el correspondiente subespacio lineal generado por los
autovectores de A. Para todo x S tenemos ABx = BAx = Bx, i.e., Bx es tambien es un autovector
de A correspondiente a , Bx S, as que el espacio S es un subespacio vectorial de H invariante
respecto a B y es a su vez un espacio de Hilbert. Como B es autoadjunto y compacto, el Corolario
anterior A.2.33 nos asegura que S tiene una base orthonormal de autovectores de B, que adem
as son
autovectores de A pues est
an en S. Repitiendo en proceso para cada uno de los subespacios S de A
obtenemos para cada uno de dichos subespacios la correspondiente base de autovectores. La uni
on de
todas ellas es la base com
un buscada.

Bibliografa
[1] L. Debnath y P. Mikusinsk. Introduction to Hilbert spaces with applications, Academic Press,
1990.h31
[2] Yuli Eidelman, Vitali D. Milman, Antonis Tsolomitis. Functional Analysis: An Introduction,
Graduate Studies in Mathematics Vol. 66, AMS, 2004.m,h
[3] A.N. Kolmogorov y A.V. Fomn. Elementos de la teora de funciones y del an
alisis funcional.
Editorial MIR, 1978. (Elements of the Theory of Functions and Functional Analysis. Dover,
1999.)m,h
[4] E. Kreyszig. Introductory Functional Analysis with Applications. Wiley Classics Library Edition,
1989.m,n
[5] K. Saxe. Beginning Functional Analysis. Springer, New York, 2002.h
[6] J. Tinsley Oden y L.F. Demkowicz. Applied Functional Analysis. CRC Press, 1996.m,n
[7] N. Young. An introduction to Hilbert Space. Cambridge University Press, 1988.n,h

31
Se recomienda para el tema de espacios metricos, normados y de Hilbert los libros marcados con m, n
y h, respectivamente.

141