Вы находитесь на странице: 1из 65

Cálculo Variacional

Prof. Dr. Ricardo L. Viana


Departamento de Fı́sica
Universidade Federal do Paraná
Curitiba - PR

11 de maio de 2011
2
Sumário

1 Equação de Euler 5
1.1 Uma variável independente e uma dependente . . . . . . . . . . . 5
1.1.1 Parâmetro variacional . . . . . . . . . . . . . . . . . . . . 5
1.1.2 Dedução da equação de Euler . . . . . . . . . . . . . . . . 6
1.1.3 Identidade de Beltrami . . . . . . . . . . . . . . . . . . . . 8
1.2 Aplicações da equação de Euler . . . . . . . . . . . . . . . . . . . 9
1.2.1 Menor distância entre dois pontos . . . . . . . . . . . . . 9
1.2.2 Braquistócrona . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.3 Superfı́cies de revolução e filmes de sabão . . . . . . . . . 13
1.2.4 Túnel em uma esfera . . . . . . . . . . . . . . . . . . . . . 16
1.3 Uma variável independente e várias dependentes . . . . . . . . . 19
1.3.1 Equações de Euler . . . . . . . . . . . . . . . . . . . . . . 19
1.3.2 Propagação da luz e o princı́pio de Fermat . . . . . . . . . 20
1.3.3 Princı́pio de Hamilton . . . . . . . . . . . . . . . . . . . . 23
1.4 Uma variável dependente e várias variáveis independentes . . . . 26
1.4.1 Equação de Euler . . . . . . . . . . . . . . . . . . . . . . . 26
1.4.2 Equação de Laplace . . . . . . . . . . . . . . . . . . . . . 27
1.5 Várias variáveis independentes e dependentes . . . . . . . . . . . 28
1.6 Problemas variacionais com vı́nculos . . . . . . . . . . . . . . . . 28
1.6.1 Vı́nculos e multiplicadores de Lagrange . . . . . . . . . . 28
1.6.2 Exemplos de vı́nculos . . . . . . . . . . . . . . . . . . . . 30
1.6.3 Equações de Euler com vı́nculos . . . . . . . . . . . . . . 31
1.6.4 Problemas mecânicos com vı́nculos . . . . . . . . . . . . . 35
1.7 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

2 Métodos variacionais aplicados 43


2.1 Revisão sobre a equação de Sturm-Liouville . . . . . . . . . . . . 43
2.2 A equação de Sturm-Liouville como um problema variacional . . 44
2.3 Autofunções de L como funções de base . . . . . . . . . . . . . . 46
2.4 O método de Rayleigh-Ritz . . . . . . . . . . . . . . . . . . . . . 49
2.4.1 Exemplos de aplicação do método . . . . . . . . . . . . . 50
2.5 O método da razão no cálculo variacional . . . . . . . . . . . . . 52
2.5.1 Cálculo com o sı́mbolo δ . . . . . . . . . . . . . . . . . . . 53
2.5.2 Teoria geral . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.5.3 O método da razão na mecânica quântica . . . . . . . . . 56
2.6 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

3
4 SUMÁRIO
Capı́tulo 1

Equação de Euler

1.1 Uma variável independente e uma depen-


dente
No que segue, denotaremos por x a variável independente, e por y a dependente.
Usaremos, ainda, a notação yx = dy/dx para a derivada de y(x) em relação ao
seu argumento.
O problema central do cálculo variacional pode ser expresso na seguinte
forma: desejamos encontrar uma função y(x) que possui valores fixos nos pontos
x = x1 e x = x2 , tal que a integral de linha de uma dada função f (y, yx , x)
Z x2
J= f (y, yx , x)dx (1.1)
x1

seja um extremo (máximo, mı́nimo ou ponto de inflexão). Em outras palavras,


queremos encontrar y(x) com valores fixos y1 = f (x1 ) e y2 = f (x2 ) tal que a
integral J seja estacionária.
A integral J é um funcional, pois não depende só dos valores de y e sua
derivada num dado ponto x, mas sim em todos os pontos do intervalo x1 ≤ x ≤
x2 , já que a integral (2.18) depende do caminho escolhido entre esses pontos.

1.1.1 Parâmetro variacional


Há, naturalmente, infinitas funções com valores fixos em (x1 , y1 ) e (x2 , y2 ), mas
a integral J assume valores diferentes para cada um. No plano cartesiano,
isso equivale a dizer que há infinitos caminhos ligando os pontos fixos, mas
apenas para um deles J é um extremo. Formalmente podemos rotular todos os
caminhos possı́veis entre os pontos (x1 , y1 ) e (x2 , y2 ) por meio de um parâmetro
variacional α, de modo que cada caminho seja caracterizado por y(x, α [Fig.
1.1]. Para um dado valor de α, como α = 0, o caminho “ótimo” correspondente,
denotado por y(x, 0) torna J estacionária.
Suporemos que cada caminho seja uma deformação contı́nua do caminho
ótimo no sentido de que podemos escrever

y(x, α) = y(x, 0) + αη(x), (1.2)

5
6 CAPÍTULO 1. EQUAÇÃO DE EULER

y α=α
2 2
y
2
α=α 1

α=0

y
1 1 α=α
3
x
0 x x x
1 α=α 2
2

Figura 1.1: Parametrização de caminhos ligando dois pontos fixos.

onde η(x) representa a deformação, portanto deve ser uma função continuamente
diferenciável (suave) em todos os pontos do intervalo x1 < x < x2 , anulando-se
nos seus extremos: η(x1 ) = η(x2 ) = 0.
Como um exemplo de parametrização consideremos os pontos fixos no plano
(x1 , y1 ) = (0, 0) e (x2 , y2 ) = (1, 0), onde o caminho ótimo seja o segmento de
reta que os une:
y(x, 0) = {(x, y)|y = 0, 0 ≤ x ≤ 1}.
Uma famı́lia de curvas suaves parametrizadas por α que conectam os pontos
fixos é (α ∈ R)
y(x, α) = αx(1 − x),
onde α = 0 fornece o caminho ótimo: y(x, 0) = 0. Logo η(x) = x(1 − x), que
satisfaz η(0) = η(1) = 0.
Observe que a deformação η(x) deve ser uma função suave no intervalo
[x1 , x2 ], ou seja, deve ser diferenciável em todos os seus pontos. No exemplo
anterior, isso significa que não podemos usar uma função como (α ∈ R)
(
2αx, se 0 ≤ x ≤ 1/2,
η(x) =
2α(x − 1), se 1/2 ≤ x ≤ 1,

pois ela não é diferenciável em x = 1/2.

1.1.2 Dedução da equação de Euler


O funcional integral (2.18), com o auxı́lio do parâmetro variacional α, pode ser
reescrito como Z x2
J(α) = f (y(x, α), yx (x, α), x)dx. (1.3)
x1

A condição imposta ao caminho ótimo y(x, 0) de que torne o funcional acima


estacionário implica em  
∂J
= 0. (1.4)
∂α α=0
1.1. UMA VARIÁVEL INDEPENDENTE E UMA DEPENDENTE 7

Diferenciando (2.28) em relação a α teremos


Z x2  
∂J ∂f ∂y ∂f ∂yx
= + dx. (1.5)
∂α x1 ∂y ∂α ∂yx ∂α

Integrando por partes o segundo termo do lado direito


Z x2 x Z x2  
∂f ∂yx ∂f ∂y 2 ∂y d ∂f
dx = − dx (1.6)
x1 ∂yx |∂α ∂yx ∂α x1 ∂α dx ∂yx
x1 |{z}
|{z} {z } | {z }
=u =dv =v =du

Como todas as curvas parametrizadas por α devem passar pelos pontos fixos,
   
∂y ∂y
= 0, = 0, (1.7)
∂α x1 ∂α x2

tal que a primeira parcela resultante da integração por partes é identicamente


nula, restando, então
Z x2   
∂J ∂f d ∂f ∂y
= − dx. (1.8)
∂α x1 ∂y dx ∂y x ∂α

Multiplicando por dα e calculando as derivadas em relação a α para o cami-


nho ótimo α = 0 teremos
  Z x2   
∂J ∂f d ∂f ∂y
dα = − dαdx. (1.9)
∂α α=0 x1 ∂y dx ∂y x ∂α

Vamos denominar variação da integral J a seguinte expressão


 
∂J
δJ ≡ dα, (1.10)
∂α α=0

assim como, analogamente, a variação de y será


 
∂y
δy ≡ dα, (1.11)
∂α α=0

com as quais reescrevemos (1.9) como


Z x2   
∂f d ∂f
δJ = − δydx. (1.12)
x1 ∂y dx ∂yx

A condição (1.4) para que a integral J seja estacionária é, portanto, simples-
mente
δJ = 0. (1.13)
Impondo essa condição em (1.12), como δy é arbitrário, concluimos que, neces-
sariamente, o termo entre colchetes deve anular-se, o que fornece a equação de
Euler 1  
∂f d ∂f
− = 0. (1.14)
∂y dx ∂yx
1A equação de Euler é uma condição necessária, porém não suficiente para que δJ = 0.
8 CAPÍTULO 1. EQUAÇÃO DE EULER

Leonhard Euler chegou à equação acima em 1744, no seu trabalho Método


para achar curvas planas que mostram algumas propriedades de máximos e
mı́nimos. Posteriormente, em 1760, Joseph Louis Lagrange aprofundou a análise
prévia de Euler no seu trabalho Ensaio sobre um novo método para determinar
os máximos e mı́nimos de fórmulas integrais indefinidas. Por esse motivo, den-
tro do contexto da mecânica, a expressão (1.14) é também chamada de equação
de Euler-Lagrange. A equação de Euler é uma condição necessária, porém não
suficiente, para que a integral J seja estacionária. Além disso, na dedução
que fizemos nós fizemos a suposição implı́cita de que a solução procurada y(x)
seja ao menos duas vezes diferenciável. Há situações em que soluções não-
diferenciáveis do problema variacional podem ser encontradas, e que não são
soluções da equação de Euler (como na seção 1.2.3).

1.1.3 Identidade de Beltrami


Quando a função f no funcional integral (2.18) não depende explicitamente
da variável independente x, é possı́vel reduzir a equação de Euler-Lagrange à
seguinte identidade, descoberta por Beltrami em 1868:

∂f
f − yx = C = constante. (1.15)
∂yx

Para deduzir essa identidade, consideremos primeiramente a derivada total


da função f (y, yx , x):

df ∂f dy ∂f dyx ∂f
= + +
dx ∂y dx ∂yx dx ∂x
∂f ∂f ∂f
= yx + yxx + ,
∂y ∂yx ∂x
onde podemos isolar
∂f df ∂f ∂f
yx = − yxx − . (1.16)
∂y dx ∂yx ∂x
Multiplicando a equação de Euler (1.14) por yx obtemos
 
∂f d ∂f
yx − yx = 0. (1.17)
∂y dx ∂yx

Substituindo (1.16) em (1.17),


 
df ∂f ∂f d ∂f
− yxx − − yx = 0. (1.18)
dx ∂yx ∂x dx ∂yx

Como    
d ∂f ∂f d ∂f
yx = yxx + yx , (1.19)
dx ∂yx ∂yx dx ∂yx
a expressão (1.18) fornece, após um pequeno rearranjo, uma forma alternativa
da equação de Euler:
 
∂f d ∂f
− + f − yx = 0. (1.20)
∂x dx ∂yx
1.2. APLICAÇÕES DA EQUAÇÃO DE EULER 9

∂f
Caso f não dependa explicitamente de x, então ∂x = 0 e (1.20) reduz-se a
 
d ∂f
f − yx = 0. (1.21)
dx ∂yx

que, por integração, nos leva à identidade de Beltrami (1.15).

1.2 Aplicações da equação de Euler


1.2.1 Menor distância entre dois pontos
O elemento de comprimento de um arco no plano é dado por
s  2
√ p dy p
ds = dr · dr = dx2 + dy 2 = dx 1 + = dx 1 + yx2 , (1.22)
dx

de tal sorte que o comprimento total de uma curva plana ligando os pontos de
coordenadas (x1 , y1 ) e (x2 , y2 ) é
Z 2 Z x2 p
L= ds = dx 1 + yx2 , (1.23)
1 x1

na forma de um funcional integral.


Desejamos encontrar a curva ligando os pontos 1 e 2 tal que o seu compri-
mento L seja mı́nimo. Do ponto de vista do cálculo variacional, isso implica
em achar y(x) tal que a integral L seja estacionária (um mı́nimo, na verdade,
mas essa é uma questão posterior),
p ou seja, resolver a equação de Euler (1.14)
correspondente para f = 1 + yx2 . Como f não depende explicitamente de y,
!
d yx
p = 0
dx 1 + yx2
y
p x = C
1 + yx2
r
1
yx = ± ≡ a,
1 − C2
onde a é uma outra constante.
A equação diferencial dy/dx = a é elementar e fornece a solução geral
y(x) = ax + b, onde b é uma constante de integração. Como a curva y(x) deve
passar pelos pontos (x1 , y1 ) e (x2 , y2 ), as constantes a e b são determinadas pela
resolução do seguinte sistema de equações lineares

ax1 + b = y1 ,
ax2 + b = y2 ,

isto é,
y1 − y2
a = , (1.24)
x1 − x2
y2 x 1 − y1 x 2
b = . (1.25)
x1 − x2
10 CAPÍTULO 1. EQUAÇÃO DE EULER

A solução y(x) = ax + b representa um segmento de reta entre dois pontos.


Em geral, curvas que fornecem a menor distância entre dois pontos sobre uma
superfı́cie são chamadas geodésicas dessa superfı́cie. Numa superfı́cie esférica,
por exemplo, a geodésica entre dois pontos é o menor arco de cı́rculo máximo (o
centro coincide com o centro da esfera) que conecta estes pontos. Na relatividade
geral, o espaço-tempo quadridimensional é curvo, e a geodésica generaliza a
noção de linha reta para este espaço. Uma partı́cula livre, na relatividade geral,
sempre move-se ao longo de uma geodésica do espaço-tempo curvo.

Prova de que o extremo é um mı́nimo


Observe que, rigorosamente falando, só mostramos que a curva
   
y1 − y2 y2 x 1 − y1 x 2
y(x) = x+ (1.26)
x1 − x2 x1 − x2
tem um comprimento estacionário, ou seja, pode ser um máximo, mı́nimo ou
ponto de inflexão. Para mostrar que o comprimento L é, de fato, um mı́nimo, é
necessário realizar um cálculo mais elaborado. Vamos considerar o comprimento
de uma curva não-ótima (quando α 6= 0):
Z x2 p
L[y(x, α)] = 2 ,
dx 1 + yxα (1.27)
x1

onde yxα = yx (x, α), e comparar com o comprimento da curva ótima (1.26):
Z x2 q
L[y(x, 0)] = 2 ,
dx 1 + yx0 (1.28)
x1

Pela parametrização dada por (1.2), diferenciando em relação a x temos que


yxα = yx0 + αηx (1.29)
Substituindo (1.29) em (1.27) nós computamos a diferença
∆L = L[y(x, α)] − L[y(x, 0)]
Z x2 q q 
2 2
= dx 1 + (yx0 + αηx ) − 1 + yx0
x1

onde yx0 = a. Usando o teorema binomial nós expandimos o integrando acima


em potências do parâmetro α. Após um cálculo tedioso obtemos
∆L = αI1 + α2 I2 + . . .
onde
a
I1 = √ [η(x2 ) − η(x1 )] = 0
2 1 + a2
e Z x2
1 3a2 + 4
I2 = η 2 dx ≥ 0
8 (1 + a2 )3/2 x1 x
| {z } | {z }
≥0 ≥0

donde ∆L ≥ 0, ou L[y(x, α)] ≥ L[y(x, 0)], a igualdade só valendo para o caso
onde α = 0. Em geral, L[y(x, α)] será sempre maior do que L[y(x, 0)], onde o
último é, de fato, um mı́nimo.
1.2. APLICAÇÕES DA EQUAÇÃO DE EULER 11

y
1 x

0 x

2
y

Figura 1.2: A braquistócrona.

1.2.2 Braquistócrona
O problema da braquistócrona consiste em achar a trajetória pela qual uma
partı́cula deslizando a partir do repouso, sem atrito, e acelerada unicamente
pela gravidade, vai de um ponto a outro (num plano vertical) no menor tempo
possı́vel. Ele foi formulado pela primeira vez por Johann Bernoulli em 1696, sob
a forma de um desafio lançado aos maiores matemáticos do seu tempo. Cinco
deles enviaram suas soluções: Newton, Jacob Bernoulli (irmão de Johann), Leib-
nitz, L’Hôpital, além do próprio Johann Bernoulli. Todos eles, usando diferentes
métodos geométricos, encontraram corretamente a curva como sendo um arco de
ciclóide. Os métodos usados pelos irmãos Bernoulli para resolver o problema da
braquistócrona e assemelhados levaram, anos após, Euler e Lagrange a criarem
o cálculo variacional.
Por simplicidade, vamos supor que a partı́cula de massa m parta do repouso
da origem 1 : (0, 0) e deslize sem atrito pela curva y(x) até chegar ao ponto
2 : (x, y). O tempo necessário para percorrer o caminho ligando esses pontos é

Z 2
ds
t12 = , (1.30)
1 v

onde ds é o elemento de arco dado por (1.22). Para achar a velocidade v


como√função da elevação y podemos usar conservação de energia, o que fornece
v = 2gy. Substituindo em (1.30) teremos o funcional integral

Z s
x
1 + yx2
t12 = dx. (1.31)
0 2gy

Desejamos achar a forma da curva y(x) para a qual, dados os pontos fixos
1 e 2, o tempo de percurso é mı́nimo. Este é um problema variacional para o
qual a solução é obtida resolvendo-se a equação de Euler (1.14) para a função
1/2 −1/2
f (y, yx ) = (1 + yx2 ) (2gy) . Como ela não depende explicitamente de x
12 CAPÍTULO 1. EQUAÇÃO DE EULER

podemos usar, alternativamente, a identidade de Beltrami (1.15):


∂f −1/2 −1/2 1/2 −1/2
f − yx = −yx2 (1 + yx2 ) (2gy) + (1 + yx2 ) (2gy)
∂yx
−1/2 −1/2  
C = (2gy) (1 + yx2 ) −yx2 + (1 + yx2 )
−1/2 −1/2
= (2gy) (1 + yx2 ) .

Quadrando ambos os membros obtemos a seguinte equação diferencial


1
y(1 + yx2 ) = ≡ k2 , (1.32)
2gC 2
onde k é uma nova constante. Isolando dx e tomando apenas o sinal positivo
para a raiz quadrada, obtemos
r
y
dx = 2
dy. (1.33)
k −y

Vamos introduzir um parâmetro 0 ≤ θ < 2π através da seguinte substituição


trigonométrica  
k2 θ
y(θ) = (1 − cos θ) = k 2 sin2 , (1.34)
2 2
que, substituida em (1.33), e após algumas simplificações, fornece
 
2 2 θ
dx = k sin dθ (1.35)
2
tal que a outra coordenada pode ser encontrada, sob a forma paramétrica, por
integração dessa expressão
Z Z  
2 2 θ k2
x = dx = k sin dθ = (θ − sin θ) + k12 , (1.36)
2 2

onde k12 é uma nova constante de integração, que se anula pela condição de
contorno y(0) = 0. A braquistócrona, então, é determinada pelas seguintes
equações paramétricas:

k2
x(θ) = (θ − sin θ), (1.37)
2
k2
y(θ) = (1 − cos θ), (1.38)
2
que são as equações de uma ciclóide.
A ciclóide é a curva traçada por um ponto fixo num cı́rculo de raio a = k 2 /2
que rola sem deslizar por uma linha reta. Podemos interpretar o parâmetro
θ como o ângulo que o raio vetor do ponto fixo faz com um raio vetor de
referência. Num ciclo completo, portanto, o parâmetro vai de zero a 2π. Ela
foi estudada primeiramente por Galileu em 1599, que tentou achar a sua área
experimentalmente (!) cortando e pesando pedaços de metal. A área sob a curva
após um ciclo completo, dada por 3πa2 , foi encontrada por Torricelli, Fermat e
Descartes usando métodos geométricos. O comprimento de um ciclo completo
da ciclóide é 8a.
1.2. APLICAÇÕES DA EQUAÇÃO DE EULER 13

y
y
2
ds

y y
1

0 x1 x2 x

Figura 1.3: Superfı́cies de revolução de área mı́nima.

A braquistócrona tem uma outra propriedade notável, e aparentemente pa-


radoxal: uma partı́cula colocada em qualquer posição (não necessariamente a
origem), vai alcançar o ponto final no mesmo tempo, ou seja, t12 , além de ser
mı́nimo, independe da posição inicial (ver o Problema 2)! Por esse motivo a
ciclóide é também uma tautócrona. Essa propriedade foi descoberta por 1673
por Huyghens, que a utilizou no (também sua invenção) relógio de pêndulo.
Para garantir o isocronismo das suas oscilações, ele adaptou no ponto de sus-
pensão do pêndulo duas guias na forma de arcos de ciclóide, o que fez com que o
próprio pêndulo oscilasse não em arcos de cı́rculo (aproximadamente isócronos),
mas em arcos de ciclóide (isócronos), o que melhorou bastante a precisão do
relógio.

1.2.3 Superfı́cies de revolução e filmes de sabão


O problema consiste em encontrar a curva que liga os pontos (x1 , y1 ) e (x2 , y2 )
que, ao ser girada em torno do eixo das abscissas, fornece uma superfı́cie de
revolução de mı́nima área [Fig. 1.3]. Imaginando que os pontos 1 e 2, ao serem
girados, geram dois cı́rculos de raios y1 e y2 , respectivamente, isso equivale a
perguntar qual a superfı́cie de mı́nima área limitada por esses dois aros circula-
res.
Sob esse último ponto de vista, o problema das superfı́cies de revolução
tem uma aplicação fı́sica muito interessante. Filmes lı́quidos de sabão têm uma
energia livre de Gibbs F proporcional à área A da sua superfı́cie: F = σf A, onde
σf é o coeficiente de tensão superficial do lı́quido. Se o filme de sabão estiver
em equilı́brio termodinâmico, a energia livre de Gibbs deve ser mı́nima. Como
σf só depende da temperatura do lı́quido, se esta é constante, então o filme de
sabão em equilı́brio deve sempre ter uma configuração que minimiza a sua área
superficial. Este é o famoso problema de Plateau, nomeado em homenagem ao
fı́sico francês que primeiro estudou este e outros problemas relacionados.
A superfı́cie de revolução gerada pela rotação do arco de curva plana y(x)
ligando os pontos (x1 , y1 ) e (x2 , y2 ) em torno do eixo x tem um elemento de
área p
dA = (2πy)(ds) = 2πy 1 + yx2 dx, (1.39)
14 CAPÍTULO 1. EQUAÇÃO DE EULER

onde usamos (1.22). A área total da superfı́cie será, portanto, o funcional inte-
gral Z x2 p
A = 2π y 1 + yx2 dx, (1.40)
x1

que se pretende minimizar. p


Como o integrando f = y 1 + yx2 não depende explicitamente de x podemos
usar a identidade de Beltrami (1.15) no lugar da equação de Euler (1.14):

∂f p yy 2
f − yx = y 1 + yx2 − p x = a = const. (1.41)
∂yx 1 + yx2
p
Multiplicando por 1 + yx2 obtemos
p
y(1 + yx2 ) − yx2 y = y = a 1 + yx2 .

Isolando yx2 nessa expressão teremos


dx 1 a
= =p . (1.42)
dy yx y − a2
2

A equação diferencial acima pode ser imediatamente integrada:


Z y
dy
x=a p = a cosh−1 +b (1.43)
y 2 − a2 a

onde b é uma constante de integração. Invertendo temos a equação da curva


procurada  
x−b
y(x) = a cosh , (1.44)
a
denominada catenária na literatura. As constantes a e b são determinadas
implicitamente pelas coordenadas dos pontos fixos
   
x1 − b x2 − b
y1 = a cosh , y2 = a cosh , (1.45)
a a
A superfı́cie de revolução gerada pela catenária é chamada de catenóide, e seria
também obtida se a rotação fosse feita em torno do eixo das ordenadas, ao invés
das abscissas (Problema 3). Foi Euler quem, em 1744, mostrou que a catenóide
é uma superfı́cie de mı́nima área.

Outras soluções do problema


Ocorre que a catenóide não é a única solução do problema. Para simplificar
os cálculos, vamos supor que x1 = −x2 = x0 e y1 = y2 = y0 , ou seja, a
superfı́cie mı́nima encontra dois arcos circulares de raio y0 simetricamente postos
em relação à origem. A equação da catenária será, portanto,
x
y(x) = a cosh , (1.46)
a
onde a constante é dada pela solução da equação transcendente
y0
a= , (1.47)
cosh(x0 /a)
1.2. APLICAÇÕES DA EQUAÇÃO DE EULER 15

y
o

−xo 0 xo x

−yo

Figura 1.4: Superfı́cies de revolução de área mı́nima.

Figura 1.5: Soluções do problema de área mı́nima


[http://mathworld.wolfram.com/SurfaceofRevolution.html]

Como os valores de x0 , e y0 estão “amarrados” pela condição (1.47), não


podemos especificá-los de uma forma arbitrária. Disso decorre que a solução
(1.46) não é verificada para todos os valores de x0 e y0 . Para mostrar esse fato,
vamos encontrar o valor máximo da razão x0 /y0 para o qual (1.47) é satisfeita.
Fazendo p = 1/a essa condição é reescrita como

py0 = cosh(px0 ). (1.48)

Diferenciando em relação a p ambos os membros


 
dx0
y0 = sinh(px0 ) x0 + p (1.49)
dp

Denotando o valor máximo de x0 por x∗0 , temos a condição de máximo



dx0
=0
dp x0 =x∗
0
16 CAPÍTULO 1. EQUAÇÃO DE EULER

1 2

r r
o
R θ R
φ

Figura 1.6: Túnel em uma esfera.

tal que (1.49) fique


y0 = x∗o sinh(px∗0 ). (1.50)
Pondo x∗0 em (1.48) e dividindo as equações membro a membro chegamos à
equação transcendente
px∗0 = coth(px∗0 ), (1.51)
que tem apenas uma solução positiva, que pode ser obtida (numericamente)
como px∗0 ≈ 1, 2. De (1.48) e (1.50) teremos que

x∗0
= csch1, 2 ≈ 0, 663 (1.52)
y0

donde para (x0 /y0 ) > 0, 66 a catenóide não é a solução do problema da superfı́cie
mı́nima. Há uma outra solução para o problema da superfı́cie mı́nima, devida a
Goldschmidt, que não é obtida pelo cálculo variacional, e é composta por dois
filmes circulares em cada aro [Fig. 1.5]. Como a solução de Goldschmidt é
descontı́nua, ela não satisfaz a equação de Euler (1.41). Para (x0 /y0 ) > 0, 66
apenas as soluções de Goldschmidt podem existir. Podemos encarar a situação
da seguinte forma: quando os cı́rculos estão suficientemente afastados entre si,
a solução do tipo catenóide torna-se instável, isto é, o filme de sabão se rompe.

1.2.4 Túnel em uma esfera


Um problema similar, porém mais difı́cil do que o da braquistócrona consiste
em encontrar a trajetória de menor tempo de percurso para um túnel escavado
1.2. APLICAÇÕES DA EQUAÇÃO DE EULER 17

numa esfera homogênea de massa M e raio R, para o qual o campo gravitacional


não é uniforme. Usando a Lei de Gauss para a gravitação, é fácil mostrar que
a energia potencial gravitacional para uma partı́cula de massa m situada à
distância r do centro da esfera é
mg0 r2
U (r) = , (1.53)
2R
onde g0 = GM/R2 é a aceleração da gravidade na superfı́cie da esfera (r = R),
e G é a constante Newtoniana.
Suponha que a partı́cula parta do repouso de um ponto 1 na superfı́cie da
esfera. Usando conservação de energia mecânica, o tempo necessário para ir do
ponto 1 até um ponto 2 situado a uma distância r do centro da esfera é [Figura
1.6]:
Z 2
ds
t12 = q (1.54)
2 
1 g0 R 1 − Rr 2

Introduzindo coordenadas polares (r, θ) o elemento de arco (1.22) é escrito como


q
ds = r2 + rθ2 dθ, (1.55)

de modo que o funcional a ser minimizado é


s Z s
R θ2 rθ2 + r2
t12 = dθ. (1.56)
g 0 θ1 R2 − r 2

Como o integrando não depende explicitamente de θ, podemos usar a iden-


tidade de Beltrami (1.15) para obter
r
g0  2 1/2
r2 = C (R − r2 )(rθ2 + r2 ) (1.57)
R

onde podemos exprimir a constante de integração C em termos de r0 , que é a


distância máxima aproximação ao centro da esfera. Por simetria, r = r0 deve
ser o ponto médio de uma trajetória ligando dois pontos sobre a superfı́cie da
esfera, e onde a tangente à trajetória é perpendicular ao raio. Dessa forma
podemos aplicar em (1.57) a condição de que rθ = 0 em r = r0 ,
r
g0  2 1/2
r02 = C (R − r02 )r02 (1.58)
R

Dividindo (1.57) e (1.58) membro a membro obtemos a seguinte equação


diferencial s
rR r2 − r02
rθ = , (1.59)
r0 R2 − r2
que pode ser integrada analiticamente fornecendo
 s  s
R r 2 − r2 r r2 − r02
0  0
θ(r) = arctan  2 2
− arctan , (1.60)
r0 R − r R R2 − r 2
18 CAPÍTULO 1. EQUAÇÃO DE EULER

onde θ(r0 ) = 0 corresponde ao ponto de máxima aproximação. O ângulo cen-


tral subtendido pelos dois pontos na superfı́cie da esfera pode ser encontrado
impondo r = R em (1.60), fornecendo
 r0 
2φ = π 1 − . (1.61)
R
Definindo um parâmetro Ωt pela relação
s
r2 − r02
tan(Ωt) = , (1.62)
R2 − r 2

a equação (1.60) da trajetória que minimiza o tempo de percurso é


 
R r0
θ(Ωt) = arctan tan Ωt − Ωt. (1.63)
r0 R
Fazendo uma transformação trigonométrica podemos reescrevê-la como
1 2 1
r2 (Ωt) = (R + r02 ) − (R2 − r02 ) cos(2Ωt). (1.64)
2 2
de modo que (1.62) e (1.64) são as equações paramétricas da trajetória, a qual é
uma hipociclóide, que é a curva produzida por um ponto fixo P sobre um cı́rculo
de raio b que rola sem deslizar pelo interior de um cı́rculo de raio a > b.
Para calcular analiticamente o tempo (mı́nimo) de percurso entre dois pontos
quaisquer substituimos (1.59) em (1.56)
s Z s
R r2 dr R2 (r2 − r02 ) + r02 (R2 − r2 )
t12 = √
g 0 r1 R2 − r 2 R2 (r2 − r02 )
r Z r
1 1/2 −1/2 2 −1/2
= (R2 − r02 ) r(R2 − r2 ) (r − r02 ) dr
Rg0 r0
 2 
1 −1/2 1/2 R + r02 − 2r2
= (Rg0 ) (R2 − r02 ) arccos (1.65)
2 R2 − r02
onde supusemos que, em t = 0, a partı́cula esteja no ponto de maior aproximação
do centro da esfera (r1 , θ1 ) = (r0 , 0).
Supondo, ainda, que a partı́cula “suba” o túnel até chegar na superfı́cie da
esfera em (r2 , θ2 ) = (R, θ) no tempo t = τ , de (1.65)
 2  s
2
1 −1/2 1/2 r − R π R2 − r02
τ = (Rg0 ) (R2 − r02 ) arccos 02 = , (1.66)
2 R − r02 2 Rg0
| {z }
=arccos(−1)=π

Finalmente, por simetria o tempo total de percurso entre dois pontos na su-
perfı́cie será s r
R2 − r02  r 2
0
T = 2τ = π = 1− T0 , (1.67)
Rg0 R
onde s
R
T0 ≡ π (1.68)
g0
1.3. UMA VARIÁVEL INDEPENDENTE E VÁRIAS DEPENDENTES 19

é o tempo de percurso para uma trajetória que passe pelo centro da esfera, isto
é, com r0 = 0, conectando dois pontos antipodais na sua superfı́cie. Em geral,
os tempos de trânsito para todas as cordas são idênticos, sendo o diâmetro a
maior corda possı́vel na esfera, evidentemente, Para uma hipociclóide, porém,
na medida em que r0 ≥ 0, então T ≤ T0 , significando que o tempo de percurso
por uma hipociclóide é sempre menor do que o tempo de percurso pela corda
que une os dois pontos.
Como um exemplo numérico, supondo que a Terra seja uma esfera perfeita
onde R = 6370km e g0 = 9, 8m/s2 , temos que T0 = 2, 53 × 103 s = 42, 2min.
Para uma trajetória (num hipotético túnel) onde r0 = R/2, o tempo de per-
curso será T = 0, 0625T0 = 2, 64min. Esse valor é espantosamente baixo, con-
siderando que, como o ângulo central subtendendo os pontos inicial e final é,
de (1.61), φ = π/4,
√ um cálculo simples mostra que a corda ligando esses dois
pontos mede R 2 = 9008km, e que a profundidade máxima de um túnel ao
longo da corda seria h = R(1 − cos φ) = 1865km. Além disso, a distância entre
esses pontos ao longo da superfı́cie é s = Rπ/4 = 5000km.
Este problema tem uma história curiosa. Em 1888 Collignon apresentou
perante o Congresso da Associação Francesa para o Avanço da Ciência um
trabalho com o tı́tulo De Paris ao Rio de Janeiro em 42 minutos e 11 segundos
(provavelmente referindo-se a um hipotético túnel ao longo da corda ligando as
duas cidades). De fato, na década de 1930 especulou-se muito sobre esse tipo de
possibilidade, naturalmente limitada por vários fatores tecnológicos. Na década
de 1960 esse problema foi objeto de vários artigos [7, 8].

1.3 Uma variável independente e várias depen-


dentes
1.3.1 Equações de Euler
Para generalizar o problema variacional nós consideraremos uma função de n
variáveis yi , i = 1, 2, . . . n, todas elas dependentes de x:

f = f (y1 (x), y2 (x), . . . yn (x); x),

e o funcional integral que desejamos tornar estacionário


Z x2
J= f (y1 , y2 , . . . yn ; y1x , y2x , . . . ynx ; x)dx, (1.69)
x1

onde yix = dyi /dx.


Como antes, consideramos uma infinidade de caminhos possı́veis ligando os
pontos fixos em x = x1 e x = x2 , parametrizados por α, tal que α = 0 represente
o caminho ótimo para cada variável dependente

yi (x, α) = yi (x, 0) + αηi (x), (1.70)

onde ηi (x) representam as deformações continuamente diferenciáveis para cada


i = 1, 2, . . . n, e que são independentes entre si, anulando-se nos extremos:
ηi (x1 ) = ηi (x2 ) = 0.
20 CAPÍTULO 1. EQUAÇÃO DE EULER

Diferenciando o funcional (1.69) em relação a α teremos


Z x2
∂J ∂f
=
∂α x1 ∂α
Z x2 n  
X ∂f ∂yi ∂f ∂yix
= dx +
x1 i=1
∂yi ∂α ∂yix ∂α
n Z x2  
X ∂f ∂f
= dx ηi + ηix (1.71)
i=1 x1
∂yi ∂yix

onde usamos o teorema de Schwartz para escrever


∂yix ∂ dyi d ∂yi dηi
= = = = = ηix . (1.72)
∂α ∂α dx dx ∂α dx
Integrando por partes a parcela
Z x2 x Z x2  
∂f dηi ∂f 2 d ∂f
dx = ηi − ηi dx (1.73)
x1 ∂yix dx ∂yix x1 x1 dx ∂yix
| {z }
=0

e impondo que o funcional integral será estacionário se estivermos no caminho


ótimo entre os pontos fixos  
∂J
= 0. (1.74)
∂α α=0
chegamos a
n Z x2   
X ∂f d ∂f
dxηi − =0 (1.75)
i=1 x1 ∂yi dx ∂yix
Como os ηi são todos mutuamente independentes, para que a condição acima
subsista para quaisquer deformações, cada termo entre os colchetes deve anular-
se identicamente, fornecendo uma equação de Euler para cada variável depen-
dente em separado:
 
∂f d ∂f
− = 0, (i = 1, 2, . . . n) (1.76)
∂yi dx ∂yix

1.3.2 Propagação da luz e o princı́pio de Fermat


De acordo com o princı́pio de Fermat, proposto originalmente em 1662, os raios
luminosos ligando dois pontos dados, propagam-se ao longo de trajetórias tais
que o caminho ótimo é estacionário (pode ser um mı́nimo, máximo ou ponto de
inflexão). O caminho ótico ℓ é definido como o produto da distância geométrica
d entre dois pontos pelo ı́ndice de refração n da luz nesse meio: se o meio é
homogêneo e isotrópico, então ℓ = nd. Em geral, porém, teremos que
Z
ℓ= n(s)ds,
C

onde s parametriza um caminho C entre dois pontos - é a distância medida ao


longo de C a partir de um ponto de referência. O ı́ndice de refração de um meio
1.3. UMA VARIÁVEL INDEPENDENTE E VÁRIAS DEPENDENTES 21

é a razão entre a velocidade da luz no vácuo c e a velocidade da luz v nesse meio.


Então, o princı́pio de Fermat, na sua forma mais geral, atesta que a integral
Z 2 Z 2√ 2
ds ṙ
c =c dt (1.77)
1 v 1 v
é estacionária
√ para o caminho percorrido pela luz num meio, onde escrevemos
ds = |dr| = dr · dr.
Se o meio é inomogêneo, então n depende de r. Mas, se o meio for ho-
mogêneo porém anisotrópico (como em um cristal, por exemplo), n, assim como
v, dependerá da direção de propagação, ou seja, de ṙ. Numa situação destas, a
integral estacionária será
Z 2√ 2

dt. (1.78)
1 v(ṙ)
onde t é a variável independente e as componentes do vetor posição são as
variáveis dependentes.
A trajetória da luz r(t) será,
√ portanto, a solução da Equação de Euler corres-
pondente ao integrando f = ṙ2 /v(ṙ), o que implica em três equações escalares.
Por exemplo,
∂f d ∂f ∂f
− = 0, ⇒ = Cx , (1.79)
∂x dt ∂ ẋ
|{z} ∂ ẋ
=0
e assim por diante. Definindo um vetor de constantes C = (Cx , Cy , Cz ), o
integrando de (1.78) será dado por
f (ṙ) = C · ṙ + C1
onde C1 é um vetor de constantes de integração. Como f , por outro lado,
não pode depender explicitamente de r, isso implica em que f deva ser uma
constante. Isso só é compatı́vel com a solução da equação de Euler acima, se
r(t) = C1 t + C2 ,
ou seja, a luz propaga-se ao longo de linhas retas.

Refração da luz
O princı́pio de Fermat pode ser usado, no âmbito da ótica geométrica, para
deduzir as leis da reflexão e da refração da luz. Vamos considerar a refração
da luz pela interface de dois meios com ı́ndices de refração n1 e n2 (supostos
homogêneos e isotrópicos). Os dois pontos fixos têm coordenadas (x1 , y1 ) e
(x2 , y2 ). Pela discussão precedente vimos que, em cada meio, a trajetória da luz
deverá ser uma linha reta. O caminho ótico total entre os pontos 1 e 2 é
q q
2 2
ℓ = ℓ1 + ℓ2 = n1 (x1 − x0 ) + y12 + n2 (x2 − x0 ) + y22 , (1.80)
onde (x0 , 0) são as coordenadas do ponto na interface entre os dois meios.
As trajetórias da luz em cada meio minimizam o caminho ótico, o que pode
ser obtido achando o mı́nimo de ℓ em relação a x0 :
   
∂ℓ 2(x 0 − x 1 )(+1) 2(x 2 − x 0 )(−1)
= n1  q  + n2  q =0
∂x0 2 2 2 2
2 (x1 − x0 ) + y1 2 (x2 − x0 ) + y2
n1 sin θ1 − n2 sin θ2 = 0 (1.81)
22 CAPÍTULO 1. EQUAÇÃO DE EULER

que é a lei de Snell da refração, onde θ1 e θ2 são os ângulos que os raios incidente
e refratado, respectivamente, em relação à normal à interface no ponto (x0 , 0).
Observe que essa solução em si não é diferenciável nesse ponto, então ela não
pode ser considerada, rigorosamente, uma solução da Equação de Euler.

Buraco negro

Um buraco negro é uma singularidade cosmológica. Na superfı́cie de um buraco


negro, chamada “horizonte de eventos”, a força gravitacional é tão intensa que
a velocidade da luz é nula, de tal sorte que a luz é “aprisionada”. Próximo ao
horizonte de eventos de um buraco negro, a velocidade da luz cresce proporcio-
nalmente à distância y em relação a ele, na forma v(y) = y/b, onde b > 0, tal
que v(0) = 0. Nessa situação a velocidade da luz depende da posição e o meio
não pode mais ser considerado homogêneo nem isotrópico.
O princı́pio de Fermat (1.77), nesse caso, impõe que
Z 2 Z x2
p
ds 1 + yx2
= dx
1 v x1 y/b

seja um extremo para a trajetória da luz. Como o integrando não depende da


variável independente (note que, agora, a variável independente é x, e não t!),
podemos usar a identidade de Beltrami (1.15)

∂f
f − yx = C
∂yx
p
1 + yx2 2yx
− yx p =
y 2 1 + yx2
dx 1
= q ,
dy 1
−1
C 2 y2

cuja solução é
r
1
x + C1 = − − y2 , (1.82)
C2
onde C1 é uma constante de integração. Quadrando a expressão acima chegamos
à equação de uma circunferência de raio 1/C e centro no ponto de coordenadas
(−C1 , 0).
A trajetória da luz nas proximidades do horizonte de eventos de um buraco
negro é um arco de circunferência, compatı́vel com a idéia de que a luz não
pode “escapar” do buraco negro. Um fenômeno semelhante ocorre quando há
um aquecimento desigual do ar próximo à superfı́cie. Como o ı́ndice de refração
do ar depende da temperatura local do ar, a não-uniformidade da velocidade
da luz leva, assim como no caso do buraco negro, a uma pequena curvatura
dos raios de luz próximo à superfı́cie do mar ou do gelo. Esse fenômeno leva ao
aparecimento de um certo tipo de miragem conhecido como fata morgana, carac-
terizada pelo aparecimento de imagens bastante distorcidas de objetos situados
próximo ao horizonte como ilhas ou navios, que parecem flutuar (a famosa lenda
do “holandês voador” é baseada nesse tipo de miragem).
1.3. UMA VARIÁVEL INDEPENDENTE E VÁRIAS DEPENDENTES 23

1.3.3 Princı́pio de Hamilton


Uma das consequências mais importantes dos métodos variacionais para a fı́sica
foi a construção, feita por Lagrange, de uma nova formulação para a mecânica
Newtoniana, a partir do princı́pio de mı́nima ação de Maupertuis, e finalmente
consolidada em 1788 com a publicação de sua obra Mécanique Analytique. Nesse
formalismo, a variável independente é o tempo t e trabalhamos com as coorde-
nadas generalizadas de um sistema qi , i = 1, 2, . . . n e as respectivas velocidades
generalizadas q̇i = qit = dqi /dt. Uma partı́cula no espaço, por exemplo, pode ter
como coordenadas generalizadas as componentes do seu vetor posição: q1 = x,
q2 = y, e q3 = z; mas outras escolhas são possı́veis.
A energia cinética é, em geral, uma função das velocidades generalizadas,
enquanto a energia potencial usualmente depende das coordenadas generaliza-
das e/ou do tempo. Neste formalismo ocupa papel central a Lagrangeana do
sistema, igual à diferença entre as energias cinética e potencial L(qi , q̇i , t). O
princı́pio variacional (de Hamilton) da mecânica diz que a trajetória de um sis-
tema entre dois pontos fixos em t = t1 e t = t2 , é aquela que torna estacionária
a seguinte integral de ação
Z t2
J= L(qi , q̇i , t)dt, (1.83)
t1

que é um problema variacional com uma variável independente e n dependentes,


e que implica resolvermos n equações de Euler da forma (1.76):
 
∂L d ∂L
− = 0, (i = 1, 2, . . . n) (1.84)
∂qi dt ∂ q̇i

chamadas, no presente contexto, de equações de Lagrange.

Partı́cula num campo de forças conservativas


Um problema fundamental em dinâmica consiste no movimento de uma partı́cula
de massa m no espaço tridimensional, sujeita a uma energia potencial V (x, y, z)
conhecida, a partir da qual podemos obter uma força conservativa como F =
−∇V . As coordenadas generalizadas serão x, y, z e as velocidades generalizadas
ẋ, ẏ, ż, com as quais formamos a energia cinética
1 
K= m ẋ2 + ẏ 2 + ż 2 ,
2
tal que a Lagrangeana será
1 
L(x, y, z; ẋ, ẏ, ż) = K − V = m ẋ2 + ẏ 2 + ż 2 − V (x, y, z).
2
As equações de Lagrange (1.84) serão
 
∂L d ∂L dV d
− = − − (mẋ) = Fx − mẍ = 0, (1.85)
∂x dt ∂ ẋ dx dt
 
∂L d ∂L dV d
− = − − (mẏ) = Fy − mÿ = 0, (1.86)
∂y dt ∂ ẏ dy dt
 
∂L d ∂L dV d
− = − − (mż) = Fx − mz̈ = 0, (1.87)
∂z dt ∂ ż dz dt
24 CAPÍTULO 1. EQUAÇÃO DE EULER

vertical
θ
z

y
centro de massa

Mg

ψ x
φ
linha nodal

Figura 1.7: Pião simétrico pesado.

ou seja, nada mais do que as três componentes da equação Newtoniana do


movimento F = mr̈.

Pião simétrico pesado


Um pião que executa uma rotação uniforme em torno de um eixo de simetria
que passa tanto pelo seu centro de massa como pelo seu ponto fixo de apoio
pode ser descrito por apenas três coordenadas generalizadas, que são os três
ângulos de Euler. Considerando o eixo de simetria o eixo z fixo no corpo, esses
ângulos são [Fig. 1.7]:
• q1 = θ: mede a inclinação do eixo z do corpo em relação ao eixo vertical
fixo no espaço;
• q2 = φ: mede o azimute do pião em relação à vertical
• q3 = ψ: é o ângulo de rotação do pião em relação ao seu eixo de simetria.
As velocidades generalizadas correspondentes são
• q̇1 = θ̇: velocidade de nutação, ou seja, a rapidez da oscilação do eixo de
simetria z do pião em relação ao eixo vertical fixo no espaço;
• q̇2 = φ̇: velocidade de precessão, que é a rapidez da rotação do eixo de
simetria z do pião em torno do eixo vertical fixo no espaço;
• q̇3 = ψ̇: velocidade de rotação do pião em relação ao seu eixo z de simetria.
A energia cinética de rotação do pião é dada, em geral, por
1 1 1
K= I1 ω12 + I2 ω22 + I3 ω32 ,
2 2 2
1.3. UMA VARIÁVEL INDEPENDENTE E VÁRIAS DEPENDENTES 25

onde I1 , I2 e I3 são os valores principais do tensor de inércia do pião, que definem


eixos principais do espaço, e para os quais as as componentes correspondentes
da velocidade angular de rotação são ω1 , ω2 e ω3 , respectivamente. A relação
entre elas e as velocidades generalizadas é dada por [veja [2], Cap. 4, Sec. 4.9]:

ω1 = φ̇ sin θ sin ψ + θ̇ cos ψ, (1.88)


ω2 = φ̇ sin θ cos ψ − θ̇ sin ψ, (1.89)
ω3 = φ̇ cos θ + ψ̇ (1.90)

Sendo o pião simétrico, temos que I1 = I2 6= I3 . Combinando essa in-


formação com as equações acima, obtemos para a energia cinética do pião:

I1  2  I 
3
2
K(qi , q̇i ) = θ̇ + φ̇2 sin2 θ + ψ̇ + φ̇ cos θ (1.91)
2 2
Além disso, denotando por ℓ a distância entre o centro de massa do pião de
massa M e o ponto de apoio, a sua energia potencial gravitacional é

V (q1 ) = M gz = M gℓ cos θ, (1.92)

de modo que a Lagrangeana é

I1  2  I 
3
2
L= θ̇ + φ̇2 sin2 θ + ψ̇ + φ̇ cos θ − M gℓ cos θ, (1.93)
2 2

As equações de Lagrange serão


 
∂L d ∂L
− = I1 φ̇2 sin θ cos θ − I3 φ̇ sin θ(ψ̇ + φ̇ cos θ) − I1 θ̈ = 0,
(1.94)
∂θ dt ∂ θ̇
 
∂L d ∂L d h  i
− = − I3 ψ̇ + φ̇ cos θ = 0, (1.95)
∂ψ dt ∂ ψ̇ dt
 
∂L d ∂L d h  i
− = − I1 φ̇ sin2 θ + I3 cos θ ψ̇ + φ̇ cos θ = 0, (1.96)
∂φ dt ∂ φ̇ dt

De (1.95) e (1.96) obtemos, imediatamente, que


 
I3 ψ̇ + φ̇ cos θ = a, (1.97)
I1 φ̇ sin2 θ + a cos θ = b, (1.98)

onde a e b são constantes de integração.


Podemos isolar φ̇ em (1.98) e substituir em (1.97), isolando, por sua vez,
ψ̇. Ao substituir ambas as derivadas em (1.94) podemos obter uma equação da
forma θ̈ = F(θ), onde F é uma função complicada de θ, apenas. Entretanto,
não é possı́vel efetuar a quadratura que fornece θ como função do tempo, o
que poderia fornecer posteriormente φ(t) e ψ(t). Ao invés de tentar resolver
diretamente as equações de movimento, usualmente estudamos o problema do
pião pesado simétrico usando a equação da energia do sistema para obter um
problema unidimensional reduzido. Detalhes desse procedimento podem ser
encontrados em [2], Cap. 5, Sec. 5.7.
26 CAPÍTULO 1. EQUAÇÃO DE EULER

1.4 Uma variável dependente e várias variáveis


independentes
1.4.1 Equação de Euler
Seja y uma variável dependente e n variáveis independentes x1 , x2 , · · · xn . A de-
rivada de y em relação a cada uma delas será denotada yj = ∂y/∂xj . Neste caso
não deve haver confusão com a notação correspondente quando houver várias
variáveis dependentes. Os pontos fixos em relação a cada variável independente
(1) (2) (1) (2) (1) (2)
serão indicados por (x1 , x1 ), (x2 , x2 ). . ., (xn , xn ). Para evitar uma so-
brecarga inútil na notação, indicaremos estes pontos fixos simplesmente por 1 e
2, ficando subentendido seu significado quando do seu emprego.
Dessa forma, a função f (y, yj , xj ) é o integrando do funcional que se quer
tornar estacionário
Z 2 Z 2 Z 2
J= dx1 dx1 · · · dxn f (y, yj , xj ) (1.99)
1 1 1
O problema variacional será, pois, o de encontrar a função de n variáveis
y(x1 , x2 , . . . xn ) para a qual δJ = 0, considerados os pontos fixos, onde o sı́mbolo
de variação é definido como
 
∂J
δJ = dα, (1.100)
∂α α=0
com o auxı́lio do parâmetro variacional α.
A parametrização a ser introduzida é a mesma dos casos anteriores, ou seja,
y(xj , α) = y(xj .0) + αη(xj ) (1.101)
onde y(xj , 0) indica o caminho que torna J um extremo e η é uma função
diferenciável e que se anula nos pontos fixos: η(1) = η(2) = 0.
Diferenciando o funcional (1.99) em relação a α
Z 2 Z 2 Z 2
∂J ∂f
= dx1 dx2 · · · dxn
∂α 1 1 1 ∂α
 
Z 2 Z 2 Z 2 n
∂f ∂y X ∂f ∂y j
= dx1 dx2 · · · dxn  +
1 1 1 ∂y ∂α j=1 ∂yj ∂α
 
Z 2 Z 2 Z 2 n
∂f X ∂f
= dx1 dx2 · · · dxn  η + ηj 
1 1 1 ∂y j=1
∂yj
Z 2 Z 2 Z 2
∂f
= dx1 dx2 · · · dxn η + (1.102)
1 1 1 ∂y
n Z 2 Z 2 Z 2 Z 2 Z 2
X ∂f
+ dx1 dx2 · · · dxj ηj dxj+1 · · · dxn
j=1 1 1 1 ∂yj 1 1
| {z }
=I

Integrando por partes o fator I na expressão acima temos


Z 2 Z 2 2 Z 2  
∂f ∂f ∂η ∂η d ∂f
dxj ηj = dxj = η − η dxj
1 ∂yj 1 ∂yj ∂xj ∂xj 1 dxj ∂yj
| {z }1
=0
1.4. UMA VARIÁVEL DEPENDENTE E VÁRIAS VARIÁVEIS INDEPENDENTES27

tal que
Z Z 2 Z 2
∂J 2 ∂f
dx1 dx2 · · · dxn η +
∂α 1 1 1 ∂y
n Z 2 Z 2 Z 2  
X d ∂f
+ dx1 dx2 · · · dxn η dxj
j=1 1 1 1 dxj ∂yj
 
Z 2 Z 2 Z 2 n  
∂f X d ∂f
= dx1 dx2 · · · dxn η  − .
1 1 1 ∂y j=1 dxj ∂yj

Calculando a derivada de J ao longo do caminho ótimo


 
  Z 2 Z 2 Z 2 n  
∂J ∂f X d ∂f 
= dx1 dx2 · · · dxn η  − =0
∂α α=0 1 1 1 ∂y i j=1
dx j ∂y j
| {z }
=0
(1.103)
para η(xj ) arbitrárioss, o que nos leva à equação de Euler para várias variáveis
dependentes
n  
∂f X d ∂f
− =0 (1.104)
∂y j=1 dxj ∂yj

1.4.2 Equação de Laplace


Do eletromagnetismo, sabemos que a densidade de energia num campo elétrico
no vácuo E é dada por
1
u = ǫ 0 E2 (1.105)
2
Se o campo for eletrostático, pode ser escrito como menos o gradiente de um
potencial E = −∇Φ, tal que
1 2
u(x, y, z) = ǫ0 |∇Φ| (1.106)
2
Consideremos um paralelepı́pedo de arestas x2 − x2 , y2 − y1 , e z2 − z1 .
Se impusermos que a energia eletrostática encerrada numa região fechada de
volume V seja mı́nima, isso equivale a achar um extremo do funcional
Z Z x2 Z y2 Z z 2
2
J= d3 r|∇Φ| = dx dy dz (Φ2x + Φ2y + Φ2z ), (1.107)
V x1 y1 z1 | {z }
≡f

onde Φx = ∂Φ/∂x, etc.


De (1.104), o potencial que satisfaz essa condição é a solução de
∂f d ∂f d ∂f d ∂f
− − − = 0,
∂Φ dx ∂Φ x dy ∂Φ y dz ∂Φ
|{z} | {z } | {z } | {zz}
=0 =2Φx =2Φy =2Φz

−2(Φxx + Φyy + Φzz ) = 0,


que é a equação de Laplace ∇2 Φ = 0.
28 CAPÍTULO 1. EQUAÇÃO DE EULER

1.5 Várias variáveis independentes e dependen-


tes
A generalização final do problema variacional consiste em consideraremos uma
função de n variáveis dependentes yi , i = 1, 2, . . . n, e n variáveis independentes
xj , j = 1, 2, . . . n, bem como das respectivas n2 derivadas jacobianas yij ≡
dyi /dxj :
f = f (y1 , . . . un ; y11 , . . . ynn ; x1 , . . . xn ),
que é o integrando de um funcional integral n-dimensional, sendo os pontos fixos
(1) (2) (1) (2)
(x1 , x1 ), . . ., (xn , xn ):
(2) (2)
Z x1 Z x2 Z x(2)
n
J= dx1 dx2 · · · dxn f (yi , yij , xj ). (1.108)
(1) (1) (1)
x1 x2 xn

O problema variacional consiste em encontrar as n funções yi (xj ) para


as quais J é estacionária, ou δJ = 0. O desenvolvimento matemático dessa
condição é semelhante ao efetuado no caso anterior, com a diferença que nós
consideramos agora n variáveis dependentes, e cada uma delas deverá satisfazer
uma equação de Euler. Caso as variáveis xj sejam independentes entre si, a
função f deve satisfazer o seguinte conjunto de n equações de Euler:

n  
∂f X ∂ ∂f
− = 0. (i = 1, 2, . . . n) (1.109)
∂yi j=1 ∂xj ∂yij

Esta situação bastante geral pode ocorrer em problemas variacionais com vı́nculos,
como se verá a seguir.

1.6 Problemas variacionais com vı́nculos


É comum que as variáveis xj não sejam, de fato, independentes entre si, mas
sim estejam “amarradas” por alguma relação de vı́nculo. A existência desses
vı́nculos leva à introdução dos chamados multiplicadores de Lagrange. Antes
de abordar o problema variacional propriamente dito, vamos estudar esse pro-
blema sob o ponto de vista da determinação de máximos e mı́nimos no cálculo
diferencial.

1.6.1 Vı́nculos e multiplicadores de Lagrange


Considere uma função de três variáveis independentes f (x, y, z). Se ela tem um
extremo, então
∂f ∂f ∂f
df = dx + dy + dz = 0, (1.110)
∂x ∂y ∂z
tal que é necessário e suficiente que, para dx, dy e dz arbitrários, tenhamos

∂f ∂f ∂f
= = = 0. (1.111)
∂x ∂y ∂z
1.6. PROBLEMAS VARIACIONAIS COM VÍNCULOS 29

No entanto, se x, y e z estiverem “amarrados” por uma dada relação na


forma geral
ϕ(x, y, z) = 0,
dita “vı́nculo”, então as variáveis não são mais independentes entre si, pois
podemos, em princı́pio, exprimir uma delas, como z, em função das outras
duas: z = z(x, y), de modo que, ainda que dx e dy sejam arbitrários, dz não é
mais arbitrário. Logo, a condição (1.111) para que f tenha um extremo não é
mais válida, em geral.
Para contornar esse problema, observamos que, como dϕ = 0, podemos
introduzir um escalar λ, dito multiplicador de Lagrange, tal que

df + λdϕ = 0. (1.112)

Aplicando diferenciais totais temos que a relação acima implica em


     
∂f ∂ϕ ∂f ∂ϕ ∂f ∂ϕ
+λ dx + +λ dy + +λ dz = 0 (1.113)
∂x ∂x ∂y ∂y ∂z ∂z

Até agora o multiplicador de Lagrange é um escalar qualquer. No entanto,


nós o escolhemos de tal sorte que
∂f ∂ϕ
+λ = 0, (ϕz 6= 0) (1.114)
∂z ∂z
já que, agora, dz não é mais arbitrária devido ao vı́nculo. Logo
   
∂f ∂ϕ ∂f ∂ϕ
+λ dx + +λ dy = 0 (1.115)
∂x ∂x ∂y ∂y

Lembremos, porém, que dx e dy ainda são arbitrários, de modo que a igualdade


acima vale se e somente se
∂f ∂ϕ
+λ = 0, (1.116)
∂x ∂x
∂f ∂ϕ
+λ = 0. (1.117)
∂y ∂y

Logo, se as condições (1.116)-(1.114) forem satisfeitas, então df = 0 e f é um


extremo. Por tabela, também podemos obter, se o quisermos, o multiplicador
de Lagrange (às vezes isso nem é realmente necessário).
Podemos generalizar a presente discussão para um número n qualquer de
variáveis “independentes” (x1 , x2 , . . . xn ) sujeitas a m vı́nculos, descritos pelas
equações
ϕk (x1 , x2 , . . . xn ) = 0, (k = 1, 2, . . . m). (1.118)
Neste caso, as condições (1.116)-(1.114) são generalizadas na seguinte forma

m
∂f X ∂ϕk
+ λk = 0, (i = 1, 2, . . . n) (1.119)
∂xi ∂xi
k=1

que, também, determinam os m multiplicadores de Lagrange λk , um para cada


vı́nculo do sistema.
30 CAPÍTULO 1. EQUAÇÃO DE EULER

1.6.2 Exemplos de vı́nculos


O problema da lata de leite condensado
Um fabricante de leite condensado deseja produzir uma lata cilı́ndrica de raio r
e altura h que acondicione um volume dado V0 do seu produto:

V (r, h) = (πr2 )h = V0 = constante. (1.120)

Em princı́pio, as variáveis r e h são independentes entre si, ou seja, se o fabri-


cante quiser uma lata mais estreita (r menor), então ela deverá ser necessaria-
mente mais alta (h maior), e vice-versa.
No entanto, para cada escolha que for feita de r e h a área S da superfı́cie
da lata será diferente.
S(r, h) = (2πr)h + 2(πr2 ) (1.121)
Como o custo de fabricação da lata é proporcional à área da superfı́cie, o
fabricante naturalmente deseja minimizar a função S(r, h) sujeita ao vı́nculo
V (r, h) = V0 . A condição de vı́nculo será, então

ϕ(r, h) = πr2 h − V0 = 0. (1.122)

Introduzindo o multiplicador de Lagrange λ teremos duas condições para


um extremo na forma (1.116)-(1.114), a saber:

∂S ∂ϕ
+λ = 2πh + 4πr + λ(2πr)h = 0, (1.123)
∂r ∂r
∂S ∂ϕ
+λ = 2πr + λ(πr2 ) = 0 (1.124)
∂h ∂h
De (1.124) obtemos o multiplicador de Lagrange λ = −2/r que, substituido em
(1.123), fornece h = 2r, ou seja, o cilindro de menor área superficial, para um
dado volume, tem o diâmetro igual à altura.

Elétron numa caixa tridimensional


Um problema elementar em mecânica quântica consiste em achar os nı́veis de
energia de uma partı́cula quanto-mecânica de massa m, como um elétron, dentro
de uma caixa de paredes impenetráveis, na forma de um paralelepı́pedo de
arestas a, b e c. A partir da equação de Schrödinger independente do tempo,
com as condições de contorno apropriadas (a função de onda tem nós nas paredes
da caixa), pode-se mostrar que a energia do estado fundamental é dada por
 
h2 1 1 1
E(a, b, c) = + 2+ 2 . (1.125)
8m a2 b c

Desejamos encontrar os valores de a, b e c que minimizam a energia do


elétron, sujeito ao vı́nculo de que o volume V0 da caixa seja dado:

V (a, b, c) = abc = V0 , (1.126)

de modo que a equação de vı́nculo é

ϕ(a, b, c) = abc − V0 = 0 (1.127)


1.6. PROBLEMAS VARIACIONAIS COM VÍNCULOS 31

correspondente a um multiplicador de Lagrange λ.


As condições de mı́nimo para a energia são, portanto
∂E ∂ϕ h2
+λ = − + λbc = 0, (1.128)
∂a ∂a 4ma3
∂E ∂ϕ h2
+λ = − + λac = 0, (1.129)
∂b ∂b 4mb3
∂E ∂ϕ h2
+λ = − + λab = 0. (1.130)
∂c ∂c 4mc3
Multiplicando (1.128) por a, (1.129) por b, e (1.130) por c, chegamos à
seguinte relação
h2 h2 h2
λabc = 3
= 3
= ,
4ma 4mb 4ma3
que é identicamente satisfeita se a = b = c, ou seja, o paralelepı́pedo reduz-se a
um cubo de aresta a. O multiplicador de Lagrange é λ = h2 /4ma5 .

1.6.3 Equações de Euler com vı́nculos


Vamos retornar à equação de Euler (1.109) para várias variáveis dependentes e
independentes, no caso em que haja m vı́nculos expresos pela forma geral
ϕk (y1 , y2 , . . . yn ; x1 , x2 , . . . xn ) = 0, (k = 1, 2, . . . m) (1.131)
de sorte que yi e xi não são mais mutuamente independentes, como presu-
mimos até agora. Assim como no caso dos problemas de extremos no cálculo
usual, para cada equação de vı́nculo introduzimos um multiplicador de Lagrange
λk (x1 , . . . xn ).
Multiplicando (1.131) pelos multiplicadores de Lagrange e integrando entre
os pontos fixos 1 e 2 temos
Z 2
λk (xj )ϕk (yi , xj )dxj = 0, (1.132)
1

tal que a variação correspondente seja também identicamente nula para cada
vı́nculo Z 2
δ λk (xj )ϕk (yi , xj )dxj = 0, (k = 1, 2, . . . m). (1.133)
1
Por outro lado, sabemos que também é nula a variação do funcional (1.108)
Z 2
δ f (yi , yij , xj )dxj = 0. (1.134)
1

Somando (1.134) e (1.133) para todos os m vı́nculos temos que


Z 2" m
X
#
δ f (yi , yij , xj ) + λk (xj )ϕk (yi , xj ) dxj = 0, (1.135)
1 k=1
| {z }
≡g(yi ,yij ,xj )

onde definimos
m
X
g(yi , yij , xj ) = f (yi , yij , xj ) + λk (xj )ϕk (yi , xj ). (1.136)
k=1
32 CAPÍTULO 1. EQUAÇÃO DE EULER

y(x)

−a 0 a x

Figura 1.8: O problema isoperimétrico.

Portanto, na presença dos vı́nculos, (1.135) implica em que precisamos sa-


tisfazer n equações de Euler do tipo (1.109) para a nova função (1.136):
n  
∂g X ∂ ∂g
− = 0. (i = 1, 2, . . . n) (1.137)
∂yi j=1 ∂xj ∂yij

O problema isoperimétrico
Um dos mais famosos problemas variacionais com vı́nculo é o isoperimétrico,
também chamado “problema de Dido”: dentre todas as curvas de um dado
comprimento ℓ no semi-plano superior, ligando dois pontos fixos 1 : (−a, 0) e
2 : (a, 0), encontrar a curva que, juntamente com o intevalo [−a, a], envolve a
maior área possı́vel [Figura 1.8].
A área sob a curva y(x)
Z a
A(y, x) = ydx, (1.138)
−a

é o funcional que se quer maximizar, entre os pontos fixos, sujeito à condição


de que o comprimento seja constante:
Z 2 Z ap
ds = 1 + yx2 dx = ℓ (1.139)
1 −a

onde usamos (1.23).


Este vı́nculo leva-nos a introduzir um único (m = 1) multiplicador de La-
grange λ, de modo que a condição de vı́nculo pode ser escrita na forma padrão
(1.132) desde que definamos
p ℓ
ϕ(yx ) = 1 + yx2 − , (1.140)
2a
assim como a função (1.136) é dada por
 
p
2

g = f + λϕ = y + λ 1 + yx − , (1.141)
2a
1.6. PROBLEMAS VARIACIONAIS COM VÍNCULOS 33

que satisfaz a equação de Euler (1.137):


 
∂g d ∂g
− = 0
∂y dx ∂yx
! !
d λyx d λyx
1− p = x− p = 0
dx 1 + yx2 dx 1 + yx2
λyx
p −x = C = constante.
1 + yx2
Isolando a derivada yx chegamos à seguinte equação diferencial
dy C +x
=q , (1.142)
dx 2
λ2 − (C + x)

que pode ser integrada fornecendo


2 2
(x + C) + (y + C1 ) = λ2 (1.143)
onde C1 é uma constante de integração. Essa é a equação de um cı́rculo de raio
λ e com centro no ponto de coordenadas (C, C1 ). Os pontos fixos (−a, 0) e (a, 0)
devem pertencer a esse cı́rculo. Como, por simetria, o centro do cı́rculo deve
estar na origem (veja a Fig. 1.8), temos que C = C1 = 0 e o raio do cı́rculo é
λ = a, tal que a equação do cı́rculo seja simplesmente
x 2 + y 2 = a2 . (1.144)
O problema isoperimétrico tem uma história curiosa, remontando à Grécia
antiga, quando a Rainha Dido fundou a cidade de Cartago. Por motivos belico-
sos, Dido fez uma barganha com o senhor local, que concordou (ingenuamente)
em dar a ela tanta terra quanto ela pudesse envolver com um pelego de boi. A
esperta Rainha instruiu seus seguidores a cortar o pelego em fitas muito finas
e atá-las uma à outra, de modo que ela pôde envolver uma área muito grande
de terra em frente ao Mar Mediterrâneo, que tornou-se a cidade de Cartago.
Os gregos antigos já sabiam que o arco de cı́rculo era a solução do problema
isoperimétrico.

A catenária
Uma corrente ou cabo pesado de comprimento C está suspenso num plano
vertical entre os pontos de coordenadas 1 : (0, a) e 2 : (L, b) [Fig. 1.9], tal
que sua forma seja descrita pela função y(x), escolhida de forma a minimizar a
energia potencial. Seja ρ = dm/ds a densidade de massa do cabo. A energia
potencial do cabo será
Z 2 Z 2 Z 2
V (y, yx ) = dV = dmgy = ρg yds, (1.145)
1 1 1

onde usamos (1.22), e usamos o sı́mbolo g para representar a aceleração da


gravidade, a fim de que não haja confusão notacional. Assim, o funcional que
desejamos minimizar é
Z L
V p
J= = dxy 1 + yx2 , (1.146)
ρg 0
34 CAPÍTULO 1. EQUAÇÃO DE EULER

0 x
L

Figura 1.9: Catenária.

p
cujo integrando é f = y 1 + yx2 .
O vı́nculo nesse problema é que a corda é suposta inextensı́vel, de modo que
o seu comprimento seja constante 2 :
Z 2 Z L p
ℓ= ds = dx 1 + yx2 , (1.147)
1 0

que pode ser colocada na forma (1.132) desde que


p ℓ
ϕ(yx ) = 1 + yx2 − (1.148)
L
tal que, introduzindo o multiplicador de Lagrange, a expressão (1.136) fica
p λℓ
g = f + λϕ = (y + λ) 1 + yx2 − . (1.149)
L
Como a função g não depende explicitamente da variável independente x po-
demos, ao invés da equação de Euler (1.137), empregar a identidade de Beltrami
(1.15):

∂g
g − yx = C = constante
∂y
p λℓ yx
(y + λ) 1 + yx2 − − yx (y + λ) p =
L 1 + yx2

Fazendo k ≡ CL + λℓ, um pouco de álgebra mostra que a expressão anterior


reduz-se à equação diferencial
q
dy 1 2
= L2 (y + λ) − k 2 (1.150)
dx k
2 Supondo que a densidade de massa seja constante ao longo do cabo, ρ = M/ℓ, onde M é

a sua massa total.


1.6. PROBLEMAS VARIACIONAIS COM VÍNCULOS 35

que tem como solução a equação da catenária 3


 
k L(x + K)
y(x) = cosh −λ (1.151)
L k
onde K é uma nova constante de integração. O nome catenária vem do latim
catena, que significa cadeia, ou corrente. Galileo, erroneamente, considerava
que a solução do problema seria uma parábola. Curiosamente, se uma parábola
rolar por uma reta, o foco da parábola descreverá uma catenária. Em 1691 a
equação da catenária foi obtida independentemente por Leibniz, Huyghens e
Johann Bernoulli, em resposta a um desafio (sempre ele!) de Jakob Bernoulli.
Vimos, anteriormente, que a catenária também é a solução do problema de
superfı́cies de revolução de mı́nima área.
Na solução (1.151) temos, ao todo, três constantes indeterminadas: C, K, e
o multiplicador de Lagrange λ (observe que não foi necessário determinar o valor
de λ para resolver o problema!). Para determinar essas constantes, aplicamos
(1.151) aos pontos fixos:
 
k LK
y(0) = a ⇒ a + λ = cosh , (1.152)
L k
 
k L(L + K)
y(L) = b ⇒ b + λ = cosh , (1.153)
L k
além de usarmos novamente a condição de vı́nculo (1.147):
Z L p Z L  
L(x + K)
ℓ = dx 1 + yx2 = dx cosh ,
0 0 k
   
ℓL L(L + K) LK
= sinh − sinh . (1.154)
k k k
O conjunto de equações (1.152)-(1.154) determina implicitamente as constantes
procuradas (lembrando que k = CL + λℓ).

1.6.4 Problemas mecânicos com vı́nculos


O formalismo anteriormente descrito pode ser aplicado imediatamente a siste-
mas mecânicos onde há m vı́nculos holonômicos, ou seja, vı́nculos cujas equações
podem ser escritos como
ϕk (q1 , q2 , . . . qn , t) = 0, (k = 1, 2, . . . m), (1.155)
onde qi são as coordenadas generalizadas. Por exemplo, o movimento plano de
uma partı́cula cuja trajetória é restrita a um cı́rculo de centro na origem e raio
R é caracterizado pelo seguinte vı́nculo holonômico:
x2 + y 2 = R 2 ⇒ ϕ = q12 + q22 − R2 = 0. (1.156)
Para cada equação de vı́nculo associamos um multiplicador de Lagrange
λk (t), com os quais formamos o equivalente mecânico da função (1.136), que é
m
X
g(qi , q̇i , t) = L(qi , q̇i , t) + λk (t)ϕk (qi , t), (1.157)
k=1
3 Podemos fazer a integração por meio da substituição de variáveis L(y + λ) = k cosh θ.
36 CAPÍTULO 1. EQUAÇÃO DE EULER

r
x θ

h
l−x
ψ

Figura 1.10: Aro rolando num plano inclinado.

que satisfaz a equação de Euler-Lagrange na forma (1.137):


 
∂g d ∂g
− = 0
∂qi dt ∂ q̇i
m  
∂L X ϕk (qi , t) d ∂L
− λk (t) − = 0
∂qi ∂qi dt ∂ q̇i
k=1

que podemos reescrever, definindo ϕki = ∂ϕk /∂qi , como


  m
d ∂L ∂L X
− = ϕki λk . (1.158)
dt ∂ q̇i ∂qi
k=1

Por curiosidade, se a coordenada generalizada qi tiver dimensão de comprimento,


então o produto λk ϕki representa a componente ao longo da direção qi da força
do reação correspondendo ao k-ésimo vı́nculo.

Aro rolando num plano inclinado


Um problema clássico de vı́nculo holonômico em dinâmica lagrangeana é o de
um aro de massa M e raio r rolando sem deslizar sobre um plano inclinado
de ψ em relação à horizontal. Podemos usar, como coordenadas generalizadas,
q1 = x: distância percorrida pelo aro sobre o plano inclinado, e q2 = θ: ângulo
de rotação do aro em relação ao eixo que passa pelo seu centro de massa [Fig.
1.10]. A condição de vı́nculo impõe que o elemento de arco percorrido pelo aro
é o mesmo elemento de distância ao longo do plano, ou seja rdθ = dx, que
podemos escrever como
ϕ(x, θ) = rθ − x = 0, (1.159)
Tiramos, então, os coeficientes de vı́nculo:
∂ϕ ∂ϕ
ϕx = = −1, ϕθ = = r, (1.160)
∂x ∂θ
1.6. PROBLEMAS VARIACIONAIS COM VÍNCULOS 37

ambos associados ao mesmo multiplicador de Lagrange λ.


A energia cinética do aro é igual à energia de translação do centro de massa
mais a energia cinética de rotação em torno do eixo que passa pelo centro de
massa
1 1
K(ẋ, θ̇) = M ẋ2 − I θ̇2 , (1.161)
2 2
onde o momento de inércia do aro é I = M r2 . A energia potencial gravitacional
do centro de massa do aro é
U (x) = M gh = M g[(ℓ − x) sin ψ + r cos ψ], (1.162)
onde ℓ é o comprimento total do plano inclinado [Fig. 1.10]. Como o termo
M gr cos ψ é uma constante, ele pode ser ignorado, pois representa apenas um
fator constante aditivo na energia potencial (que, lembramos, é sempre definida
a menos de uma constante aditiva). Logo, a Lagrangeana é
1 1
L=K −U = M ẋ2 − M r2 θ̇2 − M g(ℓ − x) sin ψ. (1.163)
2 2
Há duas equações de Euler-Lagrange da forma (1.158):
 
d ∂L ∂L d
− − ϕx λ = = (M ẋ) − M g sin ψ + λ = 0,
dt ∂ ẋ ∂x dt
 
d ∂L ∂L d
− − ϕθ λ = = (M r2 θ̇) − rλ = 0.
dt ∂ θ̇ ∂θ dt
Como r é constante, então há duas equações diferenciais a serem resolvidas
M ẍ − M g sin ψ = −λ, (1.164)
M r2 θ̈ = λr. (1.165)
Da equação de vı́nculo (1.159) ẍ = rθ̈ que, substituido em (1.165), fornece
M ẍ = λ. Pondo esse resultado em (1.164) temos que o multiplicador de La-
grange é
1
λ = M g sin ψ, (1.166)
2
tal que a equação do movimento sejam simplesmente
g sin ψ
ẍ = ≡ K1
2
g sin ψ K1
θ̈ = =
2r r
Supondo que, em t = 0, tenhamos as condições iniciais x(0) = 0, ẋ(0) = 0
(aro no alto do plano inclinado em repouso) e θ(0) = 0, θ̇(0) = 0 as equações
acima têm soluções triviais
1 1 K1 2
x(t) = K1 t 2 , θ(t) = t . (1.167)
2 2 r
Observe que o aro desce o plano inclindado rolando sem deslizar com aceleração
K1 , que é a metade da aceleração que ele teria se deslizasse em rolar por um
plano sem atrito (como uma partı́cula, portanto). Logo, o atrito é responsável
pelo rolamento do aro, e o multiplicador de Lagrange λ, que é a força de vı́nculo
é, na verdade, a força de atrito de rolamento.
38 CAPÍTULO 1. EQUAÇÃO DE EULER

θ R

0 x

Figura 1.11: Conta deslizando sobre uma calota hemisférica.

Conta deslizando sobre uma calota


Vamos considerar uma calota hemisférica de raio R com centro na origem [Fig.
1.11] e uma conta de massa m que desliza sobre a mesma tal que sua posição
pode ser especificada pelas coordenadas polares (r, θ) (a conta pode deixar a
calota, de modo que r não é constante), que serão as coordenadas generalizadas
do problema [[3], pg. 1068]. A Lagrangeana correspondente é
1
L(r, θ; ṙ, θ̇) = m(ṙ2 + r2 θ̇2 ) − mgr cos θ. (1.168)
2
Enquanto a conta está deslizando sobre a calota, a condição de vı́nculo é r = R,
ou ϕ(r) = r − R = 0, de sorte que os coeficientes de vı́nculo são
∂ϕ ∂ϕ
ϕr = = 1, ϕθ = = 0, (1.169)
∂r ∂θ
As equações de Euler-Lagrange (1.158) são
 
d ∂L ∂L d
− − ϕr λ = (mṙ) − mrθ̇2 + mg cos θ − λ(θ) = 0(1.170)
dt ∂ ṙ ∂r dt
 
d ∂L ∂L d
− − ϕθ λ = (mr2 θ̇) − mgr sin θ = 0 (1.171)
dt ∂ θ̇ ∂θ dt
Enquanto a conta desliza sobre a calota r = R, portanto ṙ = 0, de modo que
−mRθ̇2 + mg cos θ − λ(θ) = 0 (1.172)
mR2 θ̈ − mgR sin θ = 0 (1.173)
Derivando (1.172) em relação ao tempo

−2mRθ̇θ̈ − mg θ̇ sin θ = θ̇ (1.174)

e dividindo tudo por θ̇ obtemos
g sin θ
θ̈ = (1.175)
R
1.7. PROBLEMAS 39

que, substituido em (1.174), fornece por integração o multiplicador de Lagrange

λ(θ) = 3mg cos θ + C (1.176)

onde C é uma constante de integração.


O multiplicador de Lagrange é a componente radial da força de reação da
calota agindo sobre a conta. Quando a conta está no alto da calota (θ = 0) essa
força é igual ao peso da conta mg. Portanto a constante de integração é dada
por C = λ(0) − 3mg = −2mg, de forma que λ(θ) = mg(3 cos θ − 2). A partı́cula
permanecerá sobre a calota desde que λ(θ) > 0, ou seja, ela deixará a calota
quando cos θ = 2/3, que fornece o ângulo crı́tico θc = 48o 11′ .

1.7 Problemas
1. Encontre a função y(x) que torna a integral
Z 1
J= (2x + 3y + yx2 )dx
0

um extremo, com y(0) = y(1) = 1.

2. Mostre que o caminho no espaço tridimensional que fornece a menor distância


entre dois pontos quaisquer é um segmento de reta unindo estes dois pontos.

3. Considere o problema da braquistócrona, mas ao invés de uma partı́cula consi-


dere uma esfera de mesma massa e raio a rolando sem deslizar (mas com atrito
desprezı́vel). Ache a forma da trajetória que minimiza o tempo de percurso.

4. Mostre que a ciclóide é uma tautócrona, por meio dos seguintes passos:
p
(a) dt = a/gdθ, onde a = k2 /2;
(b) O tempo decorrido para uma partı́cula sem atrito se deslocar do ponto de
coordenadas (0, 0), ou seja, tal que θ = 0, até o ponto mais baixo da trajetória
(onde θ = π, correspondendo a meio ciclo da ciclóide), é
r
a
T12 = π;
g

(b) O tempo decorrido para uma partı́cula se deslocar do ponto genérico (x0 , y0 ),
ou seja, tal que θ = θ0 , até o ponto mais baixo da trajetória, é

sin θ2
r Z π 
a
T32 =  dθ;
g θ0
q
cos2 θ0 − cos2 θ

2 2

(c) Usando a substituição de variável u = cos(θ/2)/ cos(θ0 /2), T32 = T12 , inde-
pendentemente do valor de θ0 (ponto inicial).

5. Mostre que a superfı́cie mı́nima de revolução também é uma catenóide mesmo


quando o eixo de rotação é y ao invés de x.

6. Estude a existência das soluções de Goldschmidt para o problema da superfı́cie


mı́nima entre dois cı́rculos de raio y0 cujos centros têm coordenadas (±x0 , 0), por
meio das seguintes etapas [Veja http://mathworld.wolfram.com/SurfaceofRevolution.
html e [3], pgs. 1048 e 1049]:
40 CAPÍTULO 1. EQUAÇÃO DE EULER

(a) Substituindo (1.46) em (1.40), mostre que a área da catenóide será


   
2x0 2x0
A = πa2 sinh + ;
a a

(b) Considere, por exemplo, o caso onde x0 = 0, 5 e y0 = 1, para o qual a


razão x0 /y0 = 0, 5 < 0, 663, portanto permitindo soluções do tipo catenóide,
de acordo com (1.52). Mostre graficamente que há duas soluções possı́veis:
a1 = 0, 234 e a2 = 0, 848, correspondendo a dois valores para a área da catenóide:
A1 = 6, 845 e A2 = 5, 992. Essas soluções são ditas “curva profunda” e “curva
rasa”, respectivamente, aludindo ao perfil assumido pela catenóide.
(c) A área das soluções de Goldschmidt é AG = 2πy02 . Mostre que, se a área da
catenóide for igual a AG , vale a equação transcendente (com u = py0 = y0 /a)
p
u u2 − 1 + cosh−1 u − u2 = 0,
que tem uma solução positiva em u0 = 1, 211. Usando esse resultado em (1.48)
mostre que
x0 cosh−1 u0
= = 0, 528
y0 u0
de forma que se
• (x0 /y0 ) < 0, 528: só há a solução do tipo catenóide com “curva rasa” (pois
A2 é um mı́nimo absoluto);
• 0, 528 < (x0 /y0 ) < 0, 663: a catenóide coexiste com a solução de Goldsch-
midt (mas A2 < AG , de modo que a catenóide com curva “rasa” torna-se
um mı́nimo relativo);
• (x0 /y0 ) > 0, 663: só há a solução de Goldschmidt.
7. Além da catenóide e da solução de Goldschmidt, existe ainda uma terceira
solução para o problema de superfı́cie mı́nima, consistindo de um disco de raio
r entre os aros e suportado por duas catenóides apoiadas em cada aro circular
[[3], pg. 1051].
(a) Mostre que r = c1 cosh c3 , onde c1 e c3 são constantes;
(b) Mostre que a área dessa terceira solução é
    
x0 x0
πc21 sinh 2 + c3 + [cosh2 (c3 ) − sinh(2c3 )] + 2
c1 c1
que é maior do que a área de uma única catenóide, mas é um mı́nimo relativo;
(c) Plateau propôs que filmes de sabão sempre se conectam de três em três,
fazendo ângulos de 120o entre as respectivas tangentes. Aplicando essa regra
√ à
conexão entre as catenóides e o disco central, mostre que c3 = sinh−1 (1/ 3) =
0, 549, tal que cosh2 (c3 ) − sinh(2c3 ) = 0.
(d) Mostre que o valor máximo da razão x0 /y0 para a ocorrência dessa terceira
solução é 0, 377.
8. A hipociclóide é a curva produzida por um ponto fixo P sobre um cı́rculo de
raio b que rola sem deslizar pelo interior de um cı́rculo de raio a > b. Sendo φ
o ângulo de rotação para o segmento que une os centros dos dois cı́rculos e o
ponto P , as equações paramétricas cartesianas da hipociclóide são
   
a−b a−b
x(φ) = (a − b) cos φ − b cos φ , y(φ) = (a − b) sin φ + b sin φ ,
b b
Mostre que, em termos do problema do túnel numa esfera de raio a = R, o raio
do cı́rculo menor é b = (R − r0 )/2 e que 2Ωt = aφ/b.
1.7. PROBLEMAS 41

9. Considere uma partı́cula de massa m sob a ação de um potencial V (ρ, φ, z)


em coordenadas cilı́ndricas. Obtenha a Lagrangeana da partı́cula e escreva as
equações de Lagrange.

10. O pêndulo esférico consiste de uma massa m pendurada por um fio de compri-
mento ℓ. A massa m é livre para mover-se no espaço, cuja posição é determinada
pelos seus ângulos θ e φ (em coordenadas esféricas).
(a) Obtenha a Lagrangeana da partı́cula e escreva as equações de Lagrange.
(b) Considere o caso particular em que p o fio do pêndulo descreve um cone de
pequena abertura θ0 . Mostre que φ̇ = g/d, onde d = ℓ cos θ0 é a distância
vertical do plano de rotação abaixo do ponto de suspensão.
(c) Suponha, agora, que o movimento é quase-cônico, ou seja, que θ = θ0 + δθ,
onde δθ ≪ θ0 . Expandindo a equação de Lagrange em série de potências mostre
que  p 
θ(t) ≈ θ0 + δθ0 cos tφ̇0 1 + 3 cos2 θ0

11. Na teoria dos reatores de fissão nuclear um problema consiste em minimizar


o volume de um reator cilı́ndrico de raio R e altura H sujeito a um vı́nculo
determinado pela teoria da difusão de nêutrons:
 α  2  π 2
01
+ = C = constante,
R H
onde α01 = 2, 4048... é a menor raiz da função de Bessel J0 (R). Ache a relação
entre R e H.

12. Considere uma elipse de semi-eixos a e b, cuja equação cartesiana é


 x  2  y 2
+ = 1.
a b
Obtenha o retângulo inscrito nessa elipse cuja área seja a maior possı́vel. Mostre
que, para esse retângulo máximo, a área é 64% da área da elipse.

13. Resolva o problema isoperimétrico considerando que a curva é parametrizada


pela distância s medida ao longo da curva, tal que as equações paramétricas da
curva sejam escritas como x = x(s) e y = y(s). A área a ser maximizada é
Z ℓ
dx
A= y ds
0 ds
onde ℓ é o comprimento total da curva.

14. Um pêndulo sı́mples consiste de uma partı́cula de massa m suspensa por um


fio leve e inextensı́vel de comprimento ℓ. Ache a Lagrangeana, a condição de
vı́nculo, e as equações de Euler-Lagrange. Resolva essas equações para o caso
de pequenas oscilações, e encontre a força de tensão no fio via multiplicadores
de Lagrange.

15. Uma partı́cula de massa m está constrangida a mover-se ao longo de uma haste
sem atrito que gira com velocidade angular constante ω sobre um plano horizon-
tal. Ache a Lagrangeana, condição de vı́nculo, as equações de Euler-Lagrange.
Obtenha a posição radial em função do tempo para as condições iniciais r(0) = r0
e ṙ(0) = 0. Ache a força de vı́nculo exercida sobre a partı́cula pela haste.
42 CAPÍTULO 1. EQUAÇÃO DE EULER
Capı́tulo 2

Métodos variacionais
aplicados

2.1 Revisão sobre a equação de Sturm-Liouville


A equação de Sturm-Liouville tem a forma geral
 
d dy
p(x) − s(x)y = −λr(x)y, (2.1)
dx dx

onde y ∈ R, a ≤ x ≤ b, e as funções p(x), s(x) e r(x) (esta última denominada


função peso) assumem valores não-negativos. Definindo o operador de Sturm-
Liouville  
d d
L≡ p(x) − s(x), (2.2)
dx dx

reescrevemos a equação (2.1) na forma compacta

L[y] = −λr(x)y. (2.3)

O operador de Sturm-Liouville é linear, ou seja, se y1 e y2 forem soluções da


equação (2.3), então uma combinação linear das mesmas também o será:

L[c1 y1 + c2 y2 ] = c1 L[y1 ] + c2 L[y2 ]. (2.4)

Em consequência, as soluções da equação (2.1) formam um espaço vetorial linear


real, que é munido de um produto interno definido por
Z b
< y1 , y2 >≡ y1 (x)y2 (x)dx. (2.5)
a

e duas soluções são ortogonais se o produto interno entre elas for nulo: <
y1 , y2 >= 0.
A norma de uma solução y(x) é definida como

||y(x)|| = < y, y >. (2.6)

43
44 CAPÍTULO 2. MÉTODOS VARIACIONAIS APLICADOS

Como desejamos que a norma das soluções seja finita


Z b
[y(x)]2 dx < ∞, (2.7)
a

as soluções y(x) devem ser funções de quadrado integral, de modo que o espaço
das funções é denotado L2 [a, b]. Em geral, para funções complexas, esse espaço
é dito de Hilbert.
Para a discussão atual basta considerarmos condições de contorno de Diri-
chlet homogêneas:
y(a) = y(b) = 0 (2.8)
para as quais a equação de Sturm-Liouville só apresenta soluções aceitáveis para
determinados valores de λ = λn , denominados autovalores do operador (2.2).
A cada autovalor corresponde um e somente uma solução correspondente, dita
autofunção φn (x), e que satisfaz a equação

L[φn (x)] = −λn r(x)φn (x). (2.9)

Pode-se mostrar que o operador de Sturm-Liouville é auto-adjunto, ou seja,

< L[y1 ], y2 >=< y1 , L[y2 ] > (2.10)


∞ ∞
Em consequência, os autovalores {λn }n=1 são reais, e as autofunções {φn (x)}n=1
correspondentes a autovalores distintos são ortogonais em relação à função peso:
< φn , r(x)φj >= 0 se i 6= j. Se supusermos, adicionamente, que as autofunções
são normalizadas (norma igual a um) então temos a chamada condição de orto-
normalidade (em relação à função peso r(x)):
Z b
φi (x)φj (x)r(x)dx = δij . (2.11)
a

2.2 A equação de Sturm-Liouville como um pro-


blema variacional
Vamos mostrar que, se y(x) é uma solução da equação de Sturm-Liouville (2.1),
então o funcional
Z b  
K[y] = p(x)yx2 + s(x)y 2 − λr(x)y 2 dx (2.12)
a

é estacionário. Logo, a equação de Sturm-Liouville pode ser encarada como uma


equação de Euler para a função

f (y, yx , x) ≡ p(x)yx2 + s(x)y 2 − λr(x)y 2 (2.13)

De fato, abrindo o lado esquerdo da equação de Euler (1.14):


 
∂f d ∂f
− = 0
∂y dx ∂yx
d
2sy − 2λry − (2pyx ) = 0
dx
2.2. A EQUAÇÃO DE STURM-LIOUVILLE COMO UM PROBLEMA VARIACIONAL45

que, dividindo por −2, resulta na equação de Sturm-Liouville (2.1), como querı́amos
demonstrar.
Integrando por partes a primeira parcela do integrando do funcional K,
temos que
Z b Z b Z b
dy b d
pyx2 dx = pyx dx = pyx y|a − y (py )dx (2.14)
a a |{z} dx
| {z } a |{z} |dx {zx }
=u =v
=dv =du

Pelas condições de contorno (2.8) o primeiro termo do lado direito é nulo, pois

p(b)yx (b)y(b) − p(a)yx (a)y(a) = 0 (2.15)

Logo, o funcional (2.12) fica


  
Z b
 d




K[y] = − 
 dx (p(x)y x ) − sy 
 y − y(λr(x)y) (2.16)
a 

 | {z } 


=L[y]

que, usando a notação do produto interno (2.5), resulta em

2
K[y] = − < y, L[y] > − < y, λr(x)y >= − < y, L[y] > −λ||y|| (2.17)

Essa forma para o funcional permite-nos encarar o problema de Sturm-


Liouville também sob a forma de um problema variacional com vı́nculos: achar
a função y(x) que torna estacionário o funcional K[y] (sem restrições) equivale
a tornar estacionário o funcional

J[y] = − < y, L[y] > (2.18)

sujeito à condição de vı́nculo


2
N [y] =< y, r(x)y >= ||y|| = constante, (2.19)

onde λ passa a ser, aqui, um multiplicador de Lagrange, desde que ∂N/∂y 6= 0


ou ∂N/∂x 6= 0.
Podemos, ainda, mostrar que, se y(x) satisfaz a equação de Sturm-Liouville
sem o termo em λ:  
d dy
p(x) − s(x)y = 0 (2.20)
dx dx
então o funcional (2.18) não só é um extremo, como também é um mı́nimo. Para
mostrar esse fato, vamos supor uma função ξ(x) suave e que satisfaça as mesmas
condições de contorno de Dirichlet homogêneas da equação de Sturm-Liouville:
ξ(a) = ξ(b) = 0, mas que não seja uma solução ela própria.
Definimos a função
ψ(x) ≡ ξ(x) − y(x) (2.21)
2
tal que ξ 2 = (ψ + y) = ψ 2 + 2ψy + y 2 e
2
ξx2 = (ψx + yx ) = ψx2 + 2ψx yx + yx2 ,
46 CAPÍTULO 2. MÉTODOS VARIACIONAIS APLICADOS

donde (2.18) é
Z b
J[ξ] = (pξx2 + sξ 2 )dx
a
= [p(ψ 2 + 2ψy + y 2 ) + s(ψx2 + 2ψx yx + yx2 )]dx
Z b Z b
= 2 (pψx yx + sψy)dx + (pψx2 + sψ 2 ) + J[y].
|a {z } a
=I

A variação no funcional será, portanto, dada por


Z b
∆J ≡ J[ξ] − J[y] = 2I + (pψx2 + sψ 2 )dx. (2.22)
a

Integrando por partes, e usando as condições de contorno, temos


Z b Z b
b d
pyx ψx dx = pyx ψ|a − ψ (pyx )dx (2.23)
a | {z } a dx
=0

donde
Z b   Z b  
d d
I=− ψ (pyx ) − sψy dx = − ψ (pyx ) − sy dx = 0, (2.24)
a dx a dx
| {z }
=0

em vista de (2.20).
Logo, subsituindo em (2.22),
Z b
∆J = (pψx2 + sψ 2 )dx ≥ 0 (2.25)
a

já que p(x) ≥ 0 e s(x) ≥ 0 para todo x ∈ [a, b]. Naturalmente ∆J = 0 se e


somente se ψ = 0, ou ξ = y (isto é, se a função for mesmo uma solução da
equação diferencial). Caso contrário (ξ 6= y) então ∆J > 0, ou J[ξ] > J[y], de
forma que J tem um mı́nimo se y for a solução da equação de Sturm-Liouville,
pois qualquer outra função que não seja solução (mas que satisfaça as mesmas
condições de contorno) resultará num valor maior para o funcional J.
Em resumo, a solução da equação de Sturm-Liouville L[y] = −λr(x)y com
condições de contorno homogêneas y(a) = y(b) = 0, é uma função que minimiza
o funcional J[y] = − < y, L[y] >, sujeito ao vı́nculo de que a norma da solução
2
||y(x)|| seja constante. λ será o multiplicador de Lagrange associado a esse
vı́nculo.

2.3 Autofunções de L como funções de base


Na linguagem da álgebra linear, um conjunto de vetores é completo se podemos
exprimir um vetor arbitrário como uma combinação linear deles sem que falte
nem sobre nenhum vetor. Os vetores de um conjunto completo formam uma
base para o espaço vetorial. Por exemplo, no R3 , o conjunto de versores {î, ĵ, k̂}
é completo, mas o conjunto {î, ĵ} não é, pois “falta alguém”.
2.3. AUTOFUNÇÕES DE L COMO FUNÇÕES DE BASE 47

Essa propriedade é razoavelmente fácil de verificar em espaços de dimensão


finita, como o Rn , mas como assegurar completeza num espaço de dimensão in-
finita, como o espaço das soluções da equação de Sturm-Liouville? Essa questão
está longe de ser trivial, pois uma combinação linear de um número infinito de
vetores só é um vetor do espaço se a série infinita correspondente convergir para
o respectivo vetor.
No caso da equação de Sturm-Liouville, se o espaço vetorial das soluções

y(x) tem uma base, então existe um conjunto completo de funções {φn (x)}n=1 ,
tal que y(x) possa ser expressa como uma superposição linear das funções de
base
X∞
y(x) = cn φn (x). (2.26)
n=1

onde cn =< y(x), φn (x) > são os coeficientes de Fourier generalizados.


A propriedade de completeza significa, nesse conexto, que a série infinita
acima converge no sentido de média quadrática, ou seja,
Z N
2
b X

lim y(x) − cn φn (x) dx = 0 (2.27)
N →∞ a
n=1


de modo que {φn (x)}n=1 é dita uma sequência de Cauchy.

No momento, as funções {φn (x)}n=1 satisfazem as condições de contorno
mas não são necessariamente soluções da equação de Sturm-Liouville. O obje-
tivo dessa seção é mostrar, através de métodos variacionais, que o conjunto de
autofunções do operador de Sturm-Liouville é completo no sentido acima, ou
seja, que as autofunções servem de base para o espaço das soluções y(x).
Começamos substituindo a série infinita (2.26) no funcional (2.18):
* ∞ "∞ #+
X X X
J[y] = − cm φ m , L cn φ n =− cm cn hφm , L [φn ]i (2.28)
m=1 n=1 m,n

onde usamos a linearidade do operador de Sturm-Liouville. Definindo os coefi-


cientes
Z b  
d
Amn = − hφm , L [φn ]i = − φm (pφnx ) + sφn dx
a dx
Z b
= (pφmx φnx + sφm φn )dx (2.29)
a

onde integramos por partes para obter o resultado final, e denotamos φnx =
dφn /dx, etc. Desta forma o funcional (2.28) pode ser escrito como uma expansão
bilinear nos coeficientes cn .
X
J[y] = Amn cm cn (2.30)
m,n

Fazendo a mesma na condição de vı́nculo (2.19) chegamos a nova expansão


bilinear X X
N [y] = cm cn hφm , r(x)φn i = Rmn cm cn , (2.31)
m,n m,n
48 CAPÍTULO 2. MÉTODOS VARIACIONAIS APLICADOS

onde definimos Z b
Rmn = hφm , r(x)φn i = φm r(x)φn dx. (2.32)
a

Combinando (2.30) e (2.31) o funcional (2.17) é escrito como


X
K[y] = J[y] − λN [y] = cm cn (Amn − λRmn ). (2.33)
m,n


Sendo dado o conjunto completo de funções {φn (x)}n=1 , os coeficientes Amn
e Rmn são conhecidos a priori, de forma que os valores estacionários de K ficam
determinados pelas condições variacionais

∂K
= 0, (j = 1, 2, . . .) (2.34)
∂cj

Impondo essas condições na expansão bilinear (2.33)

∂K X
= (Amn − λRmn )(cm δnj + δmj cn )
∂cj m,n
X X
0 = (Amj − λRmj )cm + (Ajn − λRjn )cn
m n
X
0 = [(Anj + Ajn ) − λ(Rnj + Rjn )]cn
n

onde trocamos m por n, posto que são ı́ndices mudos.


Pelas definições (2.29) e (2.32) é evidente que os coeficientes são simétricos
mediante a troca dos ı́ndices, de forma que, dividindo por 2, temos

X
(Ajn − λRjn )cn = 0, (j = 1, 2, . . .) (2.35)
n=1

que é um sistema linear homogêneo com infinitas equações.



Agora vamos supor que {φn (x)}n=1 sejam as autofunções do operador de
Sturm-Liouville, com as propriedades (2.9). Nesse caso, os coeficientes serão

Amn = λn < φm , rφn >= λn δmn (2.36)


Rmn = < φm , rφn >= δmn (2.37)

onde usamos a ortonormalidade das autofunções (2.11). O sistema linear (2.35)


ficará diagonalizado

X
(λn − λ)δjn cn = (λj − λ)cj = 0, (j = 1, 2, . . .) (2.38)
n=1

Se quisermos soluções não-triviais para esse sistema, ou seja cj 6= 0, então


λj − λ = 0 para todo j, de modo que λ = λj : os multiplicadores de Lagrange
devem ser os autovalores do operador de Sturm-Liouville. Consequentemente,
o conjunto das autofunções é completo e pode ser usado como funções de base
para o espaço das soluções.
2.4. O MÉTODO DE RAYLEIGH-RITZ 49

2.4 O método de Rayleigh-Ritz


Vimos anteriormente que, se escolhermos uma função arbitrária ξ(x) no inter-
valo a ≤ x ≤ b que satisfaça as condições de contorno ξ(a) = ξ(b) = 0, o
funcional de Sturm-Liouville L[ξ] terá um valor maior do que teria para uma
solução bona fide da equação de Sturm-Liouville. Esse importante resultado
é a base do método variacional de Rayleigh-Ritz, pelo qual podemos obter in-
formações relevantes sobre o problema de Sturm-Liouville sem precisar resolvê-lo
diretamente. O método de Rayleigh-Ritz fornece soluções aproximadas para o
problema, cuja exatidão pode ser refinada de forma a termos respostas tão pre-
cisas quanto se queira. Por esse motivo, esse método é bastante usado em várias
áreas como acústica (campo onde foi originalmente proposto por Lord Rayleigh
em ), mecânica quântica, vibrações mecânicas, análise numérica, entre outras.
N
Nós partimos de um conjunto de N funções linearmente independentes {φ̂n (x)}n=1
que satisfazem as condições de contorno do problema de Sturm-Liouville mas
não são autofunções de L, de modo que o que procuramos é uma solução apro-
ximada na forma de uma combinação linear dessas funções
N
X
ŷ(x) = ĉn φ̂n (x) (2.39)
n=1

Substituindo (2.39) no funcional (2.17) e repetindo as manipulações algébricas


explicadas na seção precedente obteremos que
X X
ˆ − λ̂N̂ [ŷ] =
K̂[ŷ] = J[ŷ] m = 1N n = 1N ĉm ĉn (Âmn − λ̂R̂mn ), (2.40)

onde os chapéus foram colocados em todas as funções para denotar o caráter


aproximado da solução procurada:
D h iE
Âmn = − φ̂m , L φ̂n (2.41)
D E
R̂mn = φ̂m , r(x)φ̂n (2.42)

Aqui, como antes, a condição de que o funcional K̂ seja estacionário implica


nas seguintes condições variacionais:

∂ K̂
= 0, (j = 1, 2, . . . N ) (2.43)
∂ĉj

Substituindo (2.40) em (2.43) resultará um sistema linear homogêneo porém


finito (ao invés de infinito, como na seção anterior), com N equações e N
incógnitas, a saber, os coeficientes ĉj :
N
X
(Âjn − λ̂R̂jn )ĉn = 0, (j = 1, 2, . . . N ) (2.44)
n=1

Se desejamos que este sistema tenha soluções não-triviaix, ou seja, que ĉj 6=
0, então o determinante dos coeficientes deve ser nulo:

det(Âjn − λ̂R̂jn ) = 0, (2.45)


50 CAPÍTULO 2. MÉTODOS VARIACIONAIS APLICADOS

que é uma equação algébrica de grau N . Pelo teorema fundamental da álgebra,


N
teremos N raı́zes reais ou complexas, que são os autovalores aproximados {λ̂n (x)}n=1 .
Espera-se que este conjunto reproduza aproximadamente um certo número de
autovalores exatos do sistema λn . Veremos, por meio de alguns exemplos, que se
as funções φ̂n (x) forem “chutadas” corretamente, já com uma ou duas funções
é possı́vel obter excelentes aproximações para os autovalores.

2.4.1 Exemplos de aplicação do método


Equação de Helmholtz unidimensional
A equação de Helmholtz em uma dimensão [[1], pg. 575]

yxx + λy = 0, (−1 ≤ x ≤ 1) (2.46)

é um caso particular da equação de Sturm-Liouville para p(x) = 1, s(x) = 0 e


r(x) = 1, com a = −1 e b = 1. Supomos condições de contorno de Dirichlet
homogêneas y(−1) = y(1) = 0.
Vamos inicialmente escolher uma única função (N = 1):

φ̂1 (x) = 1 − x2 (2.47)

que satisfaz as condições de contorno φ̂1 (±1) = 0, de modo que a solução apro-
ximada é
ŷ(x) = ĉ1 φ̂1 (x) = ĉ(1 − x2 ). (2.48)
O funcional (2.40) é, em vista de (2.12), dado por
Z 1  
K̂[ŷ] = ŷx2 − λ̂ŷ 2 dx
−1
Z 1  
2
= 4ĉx2 − λ̂ĉ2 (1 − x2 ) dx
−1
 
2 8 16
= ĉ − λ̂ (2.49)
3 15

Aplicando a condição variacional (2.43)


 
∂ K̂ 8 16
= 2ĉ − λ̂ = 0, (2.50)
∂ĉ 3 15

temos que
5
= 2, 5
λ̂ =
2
Naturalmente esse problema tem uma solução exata, que é
 πx 
y(x) = cos
2
que, derivada duas vezes, fornece
 π 2  πx   πx 
yxx = − cos = −λy = −λ cos ,
2 2 2
2.4. O MÉTODO DE RAYLEIGH-RITZ 51

exata
aproximada
0,8

0,6
y(x)

0,4

0,2

0
-1 -0,5 0 0,5 1
x

Figura 2.1: Soluções exata e aproximada da equação (2.46).

que fornece o autovalor exato:


π2
λ= = 2, 467...
4
que resulta num erro relativo de apenas 1, 3%, um resultado surpreendente tendo
em vista que estamos aproximando a solução com apenas uma função. Natu-
ralmente isso ocorre pois a função que “chutamos” é, de fato, muito próxima à
solução exata [Fig. 2.1].

Menor raiz da função de Bessel com m = 3


Vamos considerar a equação de Bessel com m = 3 [[1], pg. 576]
 
1 2 32
yxx + yx + k − 2 y = 0, (0 ≤ x ≤ 1) (2.51)
x x
com a condição de contorno que y(0) < ∞ e y(1) = 0. Ela tem a forma da
equação de Sturm-Liouville se p(x) = x, s(x) = 9/x, r(x) = x, e λ = k 2 .
Sabemos, de Métodos I, que a solução de (2.51) que é regular (isto é, que
não diverge) na origem é a função de Bessel de ordem m = 3:
y(x) = AJ3 (kx). (2.52)
onde A é uma constante de integração. Impondo que y(1) = 0 temos que
AJ3 (k) = 0. Se A 6= 0, então J3 (k) = 0, ou seja, k é uma raiz da função
de Bessel de ordem m = 3. As primeiras raizes de J3 (k) são k1 = 6, 380...,
k2 = 9, 761..., k3 = 13, 015.. e assim por diante [Fig. 2.2]. Logo a solução exata
correspondendo à menor raiz da função de Bessel com m = 3 é
y(x) = AJ3 (k1 x) = AJ3 (6, 380x).
52 CAPÍTULO 2. MÉTODOS VARIACIONAIS APLICADOS

0.5

0.4

0.3

0.2

J3(x) 0.1

−0.1

−0.2

−0.3
0 2 4 6 8 10 12 14 16 18 20
x

Figura 2.2: Função de Bessel de ordem m = 3.

Usamos o método de Rayleigh-Ritz empregando, como função tentativa,

φ̂1 (x) = x3 (1 − x) (2.53)

que satisfaz as condições de contorno, pois φ̂1 (0) = 0 e φ̂1 (1) = 0; de modo que
ŷ = ĉx3 (1 − x) e montamos o funcional (2.49):
Z 1h i
K̂[ŷ] = p(x)ŷx2 + s(x)ŷ 2 − k̂ 2 r(x)ŷ 2 dx
0
Z 1 
9
= xŷx2 + ŷ 2 − k̂ 2 r(x)ŷ 2 dx
0 x
Z 1 h i 9 
2 2 2
= ĉ2 x 9x4 (1 − x) − 6x5 (1 − x) + x6 + [x6 (1 − x) − k̂ 2 x7 (1 − x) dx
x
0 
1 1 2
= ĉ2 − k̂
8 360

Aplicando
√ a condição variacional ∂ K̂/∂ĉ = 0 chegamos ao autovalor aproximado
k̂ = 45 = 6, 708.... Comparando esse resultado com a menor raiz da função
de Bessel, que é 6, 380..., vemos que o erro cometido é de 5, 14%.

2.5 O método da razão no cálculo variacional


A formulação variacional para o problema de Sturm-Liouville, que foi estudada
na seção anterior, pode ser generalizada de forma elegante para o problema da
razão entre dois funcionais lineares quaisquer num espaço vetorial apropriado.
Como veremos mais tarde, uma das aplicações do método da razão é na esti-
mativa de nı́veis de energia em problemas de mecânica quântica. Inicialmente,
porém, vamos apresentar o formalismo geral, que impõe condições bastante am-
plas.
2.5. O MÉTODO DA RAZÃO NO CÁLCULO VARIACIONAL 53

2.5.1 Cálculo com o sı́mbolo δ


Na seção 1.1. nós introduzimos o sı́mbolo δ denotando variação do funcional
J[y] da seguinte forma:  
∂J
δJ = dα (2.54)
∂α α=0
onde α é um parâmetro que rotula os vários caminhos possı́veis que conectam
os pontos fixos em relação aos quais consideramos o problema variacional. A
escolha α = 0 corresponde ao caminho que torna o funcional J[y] estacionário,
em relação a pequenas variações do argumento, também definidas como
 
∂y
δy = dα (2.55)
∂α α=0

Embora δ não seja uma diferencial autêntica, ela satisfaz às mesmas propri-
edades de cálculo de uma diferencial, de forma que podemos realizar operações
elementares sobre funcionais, como

δ(c1 J1 + c2 J2 ) = c1 δJ1 + c2 δJ2 , (2.56)


δ(J1 J2 ) = (δJ1 )J2 + J1 (δJ2 ), (2.57)
 
J1 J2 (δJ1 ) − J1 (δJ2 )
δ = 2 . (2.58)
J2 (J2 )

dentre outras, que podem ser demonstradas a partir da definição (2.54). Por
exemplo,
 
∂(c1 J1 + c2 J2 )
δ(c1 J1 + c2 J2 ) = dα
∂α α=0
   
∂J1 ∂J2
= c1 dα + c2 dα
∂α α=0 ∂α α=0
= c1 δJ1 + c2 δJ2 ,

e assim por diante.

2.5.2 Teoria geral


Vamos trabalhar com espaços vetoriais complexos, de dimensão finita ou (mais
geralmente) infinita. Nesse espaço, sejam dois vetores quaisquer y e z, e um
escalar complexo a. Valem as seguintes propriedades para o produto interno:
• < y, z >∗ =< z, y >;
• < ay, z >= a∗ < y, z >;
• < y, az >= a < y, z >
Sejam, ainda, dois operadores F e G agindo sobre vetores nesse espaço. Exigi-
mos as seguintes propriedades desses operadores
1. F e G devem ser lineares: sejam a e b dois escalares complexos, então

F [ay + bz] = aF [y] + bF [z], G[ay + bz] = aG[y] + bG[z], (2.59)


54 CAPÍTULO 2. MÉTODOS VARIACIONAIS APLICADOS

2. F e G devem ser auto-adjuntos (ou hermitianos)



< F [y], z > = < y, F [z] >= < F [z], y > , (2.60)

< G[y], z > = < y, G[z] >= < G[z], y > , (2.61)

3. G deve ser positivo-definido

< y, G[y] > ≥ 0 (2.62)

sendo que a igualdade vale se e só se y = 0


Teremos, ainda, oportunidade de trabalhar com a chamada equação de au-
tovalores generalizada
F [y] = λG[y] (2.63)
onde λ é um autovalor generalizado. Podemos mostrar que os autovalores, nas
condições acima citadas, são necessariamente reais. Para isso consideramos que

< y, F [y] >=< y, λG[y] >= λ < y, G[y] > . (2.64)

Tomando o complexo conjugado dessa expressão e usando a propriedade do


produto interno < y, z >∗ =< z, y > temos que

< F [y], y >= λ∗ < G[y], y > . (2.65)

Usando a propriedade (2.60) podemos escrever

< y, F [y] >= λ∗ < y, G[y] > . (2.66)

Substraindo (2.66) de (2.64) resulta em

0 = (λ − λ∗ ) < y, G[y] >, (2.67)


| {z }
>0


já que y 6= 0. Logo λ = λ , portanto é sempre real, como querı́amos demonstrar.
Se x e y forem funções definidas num certo intervalo I ⊆ R, podemos cons-
truir funcionais sobre esse intervalo a partir dos produtos internos e dos opera-
dores acima definidos:
Z
J[y] = < y, F [y] >= y ∗ (x)F [y(x)]dx, (2.68)
ZI
N [y] = < y, G[y] >= y ∗ (x)G[y(x)]dx, (2.69)
I

tal que podemos definir um novo funcional como a razão destes dois:
J[y]
ω[y] = . (2.70)
N [y]

Caso as condições (2.59)-(2.62) valham para todas as funções do espaço em


questão, então vale o seguinte teorema: o funcional ω[y] será estacionário para
pequenas variações do vetor y se e somente se y satisfizer a equação generali-
zada de autovalores 2.63, onde os autovalores λ são os valores estacionários do
funcional ω[y]. Observe que, no enunciado, falamos numa condição de duplo
2.5. O MÉTODO DA RAZÃO NO CÁLCULO VARIACIONAL 55

sentido: se e somente se. Isso significa que (2.63) implica em δω = 0 (condição


necessária), tanto como δω = 0 implica em (2.63) (condição suficiente) . Vamos
provar apenas a necessidade, deixando a segunda para o leitor como exercı́cio
[detalhes no [1], pg. 583].
Para mostrar que (2.63) implica em δω = 0 fazemos uma variação infinitesi-
mal de y:
y → y + δy
e computamos o efeito nos funcionais (2.68):

J[y + δy] = < y + δy, F [y + δy] >=< y + δy, F [y] + F [δy] >= (2.71)
= < y, F [y] > + < y, F [δy] > + < δy, F [y] > + < δy, F [δy] >
| {z }
=<δy,F [y]>∗

onde usamos as propriedades (2.59), (2.60) e (2.62), nessa ordem.


A variação correspondente no funcional J é, usando (2.71),

δJ = J[y + δy] − J[y]



= < y, F [y] > +< δy, F [y] > + < δy, F [y] > + < δy, F [δy] > − < y, F [y] >

= < δy, F [y] > + < δy, F [y] > + < δy, F [δy] > . (2.72)

Analogamente, para o funcional N ,



δN = < δy, G[y] > + < δy, G[y] > + < δy, G[δy] > . (2.73)

Usando (2.58) podemos calcular a variação no funcional ω:


 
J N δJ − JδN
δω = δ =
N N2
1  ∗ 
= 2 < y, G[y] > < δy, F [y] > + < δy, F [y] > + < δy, F [δy] >
< y, G[y] >
∗ 
< y, F [y] > < δy, G[y] > + < δy, G[y] > + < δy, G[δy] >

Supondo, agora, que y satisfaça a equação de autovalores generalizada (2.63),


teremos
1  ∗ 
δω = 2 < y, G[y] > λ∗ < δy, G[y] > + λ < δy, G[y] > +λ < δy, G[δy] >
< y, G[y] >
∗ 
λ < y, G[y] > < δy, G[y] > + < δy, G[y] > + < δy, G[δy] >

Finalmente, usando o fato dos autovalores λ serem reais (o que provamos há
pouco), observamos o cancelamento de todos os termos na expressão acima, de
forma que δω = 0, como querı́amos demonstrar. Juntamente com a implicação
no sentido inverso, concluimos que a razão dos funcionais J[y] e N [y] é esta-
cionária somente se λ for o autovalor correspondente à equação generalizada
(2.63).
O tratamento dado no inı́cio deste capı́tulo à equação de Sturm-Liouville
pode ser encarado como um caso particular deste teorema. Nesse caso especı́fico,
F é o operador de Sturm-Liouville L[y] e G[y] = r(y)y, cuja razão é estacionária
quando λ for o autovalor correspondente da equação de Sturm-Liouville (2.3).
56 CAPÍTULO 2. MÉTODOS VARIACIONAIS APLICADOS

2.5.3 O método da razão na mecânica quântica


A equação de Schrödinger
A função de onda ψ(x) é uma quantidade variável que descreve matematica-
mente as caracterı́sticas ondulatórias de uma partı́cula (Enciclopaedia Britta-
nica). A equação de Schrödinger independente do tempo para uma partı́cula
quanto-mecânica de massa m movendo-se em uma dimensão sob a influência de
um potencial V (x) é
~2 d 2
− ψ(x) + V (x)ψ(x) = Eψ(x), (2.74)
2m dx2
onde ~ = h/2π = 1, 05457148 × 10−34 m2 .kg/s é a constante de Planck reduzida,
e E é a energia total da partı́cula.
A equação de Schrödinger é linear. Como as funções de onda são, em geral,
complexas, elas pertencem a um espaço de funções complexas de quadrado in-
tegrável, chamado espaço de Hilbert. Nesse espaço o produto interno é definido
como 1 Z b
< ψ1 |ψ2 (x) >= ψ1∗ (x)ψ2 (x)dx. (2.75)
a
Definindo o operador Hamiltoniano
~2 d 2
H≡− + V (x), (2.76)
2m dx2
a equação de Schrödinger independente do tempo (2.74) pode ser reescrita como
2

Hψ(x) = Eψ(x), (2.77)


mostrando que, na verdade, ψ(x) são as autofunções do operador hamiltoni-
ano, cujos autovalores correspondentes são os valores da energia E da partı́cula.
Impondo condições de contorno apropriadas ao problema quanto-mecânico, sa-
bemos que só há soluções para determinados autovalores discretos da energia
∞ ∞
{En }n=1 (quantização), correspondendo às autofunções {ψn }n=1 .
O operador Hamiltoniano é auto-adjunto no espaço de Hilbert, também cha-
mado hermitiano, pois
< Hψ1 |ψ2 (x) >=< ψ1 |Hψ2 (x) > . (2.78)
Como consequência, os autovalores de energia são reais, e as autofunções cor-
respondendo a autovalores distintos são ortogonais:
< ψm |ψn (x) >= N δmn , (2.79)
onde N =< ψn |ψn (x) > é uma constante de normalização.

Supondo, ainda, que o conjunto de autofunções {ψn }n=1 é completo, ele
pode ser usado como uma base para funções de onda no espaço de Hilbert, tal
que possamos escrever (“postulado da expansão”)

X
ψ(x) = cn ψn (x), (2.80)
n=1
1 Usamosa notação bra(c)ket para o produto interno na mecânica quântica, imitando Dirac.
2 Tambémde acordo com o uso consagrado na mecânica quântica, escreveremos Hψ ao
invés de H[ψ].
2.5. O MÉTODO DA RAZÃO NO CÁLCULO VARIACIONAL 57

onde os coeficientes são dados por


< ψ|ψn (x) >
cn = (2.81)
< ψn |ψn (x) >
e, fisicamente, são amplitudes de probabilidade para os autovalores de energia
correspondentes.

O método da razão aplicado à equação de Schrödinger


As funções de onda de quadrado integrável adaptam-se sem problemas aos re-
quisitos da teoria geral para a aplicação do método da razão. Além disso, o
operador Hamiltoniano é linear e auto-adjunto, e o operador identidade (de-
finido como I[ψ] = ψ) é trivialmente linear, auto-adjunto e positivo-definido.
Nesse caso, os funcionais J e N serão, respectivamente, dados por
Z b
J[ψ] = < ψ|Hψ >= ψ ∗ (x)Hψ(x)dx =
a
Z b  
2
~ d2 ψ
ψ ∗ (x) − + V (x)ψ(x) dx (2.82)
a 2m dx2
Z b
N [ψ] = < ψ|ψ >= ψ ∗ (x)ψ(x)dx. (2.83)
a

O funcional correspondente à razão de J e N corresponde, na teoria da


mecânica quântica, ao valor esperado do operador hamiltoniano
< ψ|Hψ >
< H > [ψ] = (2.84)
< ψ|ψ >
Se empregarmos uma autofunção de energia ψn (x) o valor esperado é o próprio
autovalor, pois
< ψn |Hψn > En < ψn |ψn >
< H > [ψn ] = = = En (2.85)
< ψn |ψn > < ψn |ψn >
Pelo teorema da seção anterior, o valor esperado do Hamiltoniano é esta-
cionário (δ < H >= 0) sob variações infinitesimais da função de onda (δψ).
Além disso, esse valor esperado é, de fato, um mı́nimo [pode-se ver a prova
dessa afirmação em [4], pg. 313, por exemplo]. Portanto, usando uma outra
função ψ̂(x) que não seja a autofunção mas satisfaça às mesmas condições de
contorno, obteremos, em geral, um valor de < H > que é maior do que aquele
que seria obtido usando a autofunção correta. Esta é a base do método variaci-
onal muito frequentemente usado em mecânica quântica, e bastante usado para
determinar a energia do estado fundamental de um sistema mesmo sem conhecer
as suas autofunções. Isso é particularmente importante quando a equação de
Schrödinger não tem solução analı́tica, o que é bastante frequente nas aplicações
em fı́sica atômica e molecular.
Escolhemos uma função-tentativa ψ̂(x) (ou uma combinação linear delas)
que satisfaz as mesmas condições de contorno do problema e depende de um ou
mais parâmetros variacionais c1 , c2 , . . .. Computamos, então, o valor esperado
do hamiltoniano para essa função tentativa
< ψ̂|H ψ̂ >
< H > [ψ̂] = (2.86)
< ψ̂|ψ̂ >
58 CAPÍTULO 2. MÉTODOS VARIACIONAIS APLICADOS

V(x)

Eo

−a 0 a x

Figura 2.3: Poço de potencial quadrado infinito.

que deverá também ser uma função dos parâmetros c1 , c2 , . . .. Nós tornamos
esse funcional estacionário (na verdade, um mı́nimo) impondo as condições va-
riacionais
∂<H>
= 0, (j = 1, 2, . . .) (2.87)
∂cj
que fornecem valores ótimos que, substituidos em < H >, tornam este um
mı́nimo. Dessa forma < H > [ψ̂] é um limite superior para a energia do estado
fundamental, pois < H > [ψ̂] ≥ E0 , a igualdade só ocorrendo se a função-
tentativa for a própria autofunção do estado fundamental.

Poço de potencial quadrado infinito


Como um primeiro exemplo do método da razão na mecânica quântica, vamos
considerar uma caixa unidimensional de paredes infinitamente rı́gidas tem um
potencial dado por [Fig. 2.3]
(
0, se −a ≤ x ≤ a,
V (x) = (2.88)
∞, se x ≤ −a ou x ≥ a.

Como as paredes são impenetráveis, a função de onda do estado fundamental


deve ter nós nas paredes da caixa, ou seja, ψ(−a) = ψ(a) = 0. Para −a <
x < a o hamiltoniano de uma partı́cula de massa m é, simplesmente, H =
−~2 /2md2 /dx2 .
Usando a função-tentativa real

ψ̂(x) = c(a2 − x2 ), (2.89)

onde c é o parâmetro variacional, e que satisfaz as condições de contorno, pois


ψ̂(±a) = 0. Observe que não é necessário normalizar a função tentativa, pois
nós dividiremos posteriormente pela sua norma, de qualquer jeito.
Uma vez que
d2 ψ̂
= −2c,
dx2
2.5. O MÉTODO DA RAZÃO NO CÁLCULO VARIACIONAL 59

os funcionais (2.82) e (2.83) serão


Z a ! Z a
∗ ~2 d2 ψ̂ ~2 2 2 4c2 ~2 a3
J[ψ̂] = = ψ̂ (x) − dx = − c(−2c) (a − x )dx = (2.90)
−a 2m dx2 2m −a 3m
Z a Z a 2 5
16c a
N [ψ̂] = ψ̂ ∗ (x)ψ̂(x)dx = c2 (a2 − x2 )dx = (2.91)
−a −a 15
e o valor esperado do hamiltoniano será
< ψ̂|H ψ̂ > 4c2 ~2 a3 /3m ~2 5
< H > [ψ̂] = = = . (2.92)
< ψ̂|ψ̂ > 16c2 a5 /15 m 4a2
Observe que, como < H > não depende do parâmetro variacional não é ne-
cessário minimizar < H > em relação a ele.
O problema do poço quadrado infinito é exatamente solúvel. A autofunção
(normalizada) do estado fundamental é [veja, por exemplo, [6], pg. 47]
1  πx 
ψ(x) = √ cos ,
a 2a
correspondente ao autovalor de energia
~2 π 2
E0 = ,
m 8a2
de modo que o método variacional foi capaz de estimar esse valor com um erro
de 1, 63%. Nov
d2 ψ̂
= −2c,
dx2
os funcionais (2.82) e (2.83) serão
Z a ! Z a
~2 d2 ψ̂ ~2 4c2 ~2 a3
J[ψ̂] = = ∗
ψ̂ (x) − 2
dx = − c(−2c) (a2 − x2 )dx = (2.93)
−a 2m dx 2m −a 3m
Z a Z a
16c2 a5
N [ψ̂] = ψ̂ ∗ (x)ψ̂(x)dx = c2 (a2 − x2 )dx = (2.94)
−a −a 15
e o valor esperado do hamiltoniano será
< ψ̂|H ψ̂ > 4c2 ~2 a3 /3m ~2 5
< H > [ψ̂] = = 2 5
= . (2.95)
< ψ̂|ψ̂ > 16c a /15 m 4a2
Observe que, como < H > não depende do parâmetro variacional não é ne-
cessário minimizar < H > em relação a ele.
O problema do poço quadrado infinito é exatamente solúvel. A autofunção
(normalizada) do estado fundamental é [veja, por exemplo, ]
1  πx 
ψ(x) = √ cos ,
a 2a
correspondente ao autovalor de energia
~2 π 2
E0 = ,
m 8a2
de modo que o método variacional foi capaz de estimar esse valor com um erro
de 1, 63%. Novamente, esse bom resultado se justifica pela proximidade entre a
função de onda verdadeira e aquela usada como tentativa [veja a Fig. 2.4].
60 CAPÍTULO 2. MÉTODOS VARIACIONAIS APLICADOS

exata
aproximada
0,8

0,6

ψ
0,4

0,2

0
-1 -0,5 0 0,5 1
x

Figura 2.4: Autofunções exata e aproximada para o estado fundamental de uma


partı́cula num oço de potencial quadrado infinito, com a = 1.

Oscilador harmônico

[[5], pg. 1151]


O potencial para um oscilador harmônico unidimensional é [Fig. 2.5]

1
V (x) = mω 2 x2 , (2.96)
2

onde ω 2 = k/m é a frequência natural para uma partı́cula de massa m sujeita a


uma força restauradora onde k é a constante elástica. O operador hamiltoniano
será, portanto

~2 d 2 1
H=− 2
+ mω 2 x2 . (2.97)
2m dx 2

Como estamos procurando estados ligados, as autofunções de energia da partı́cula


para esse problema devem anular-se no infinito

ψ(x) → 0, se |x| → ∞.

Vamos usar como função-tentativa

2
ψ̂(x) = e−αx , (2.98)
2.6. PROBLEMAS 61

V(x)

Eo

0 x

Figura 2.5: Oscilador harmônico.

onde α > 0 será o parâmetro variacional. Os funcionais (2.82) e (2.83) serão


Z ∞ !
−αx2 ~2 d2 ψ̂ 1 2 2 2
J[ψ̂] = = e − 2
+ mω x e−αx dx =
−∞ 2m dx 2
 2 Z ∞
~ α 1 21 2
= + mω e−2αx , (2.99)
2m 8 α −∞
Z ∞
2
N [ψ̂] = e−2αx , (2.100)
−∞

e o valor esperado do hamiltoniano será

~2 α 1 1
< H > [ψ̂] = + mω 2 (2.101)
2m 8 α
Aplicando a condição variacional (2.87)
 
∂<H> ~2 1 1
= − mω 2 2 = 0, (2.102)
∂α α0 2m 8 α

que fornece o valor do parâmetro que minimiza < H >



α0 = , (2.103)
2~
dando
1
< H > (α0 ) = ~ω, (2.104)
2
que é igual ao valor exato da energia do estado fundamental E0 . Naturalmente
isso ocorreu pois nossa função tentativa é idêntica à autofunção exata.

2.6 Problemas
1. Mostre que o operador de Sturm-Liouville é
62 CAPÍTULO 2. MÉTODOS VARIACIONAIS APLICADOS

(a) linear: L[c1 y1 + c2 y2 ] = c1 L[y1 ] + c2 L[y2 ];


(b) auto-adjunto: < L[y1 ], y2 >=< y1 , L[y2 ] >

2. Demonstre que:
(a) os autovalores do operador L são reais;
(b) as autofunções de L correspondentes a autovalores distintos são ortogonais

3. Resolva a equação de Helmholtz unidimensional (2.46) usando o método de


Rayleigh-Ritz como uma combinação linear de duas funções-tentativa:

φ̂1 (x) = 1 − x2 , φ̂2 (x) = x2 (1 − x2 ),

Compare o valor de λ com o resultado exato e calcule o erro relativo percentual.


Interprete seu resultado em termos do caráter das funções tentativa empretadas.

4. Considere a equação de Bessel de ordem m = 0:


1
yxx + yx + λy = 0, (0 ≤ x ≤ 1)
x
com as condições de contorno y(0) < ∞ e y(1) = 0. Use o método de Rayleigh-
Ritz com a função tentativa

φ̂1 (x) = a + bx2 + cx4 ,

e mostre que o autovalor aproximado é uma solução da equação quadrática


3λ̂2 − 128λ̂ + 640 = 0. Estime o erro do autovalor “bom”, e explique o autovalor
“ruim” que também é obtido.

5. A partir da definição (2.22) mostre as propriedades (2.5) e (2.58) do sı́mbolo δ.

6. Considere o problema de uma partı́cula num poço potencial quadrado infinito.


Estime a energia do estado fundamental usando, como função tentativa,

ψ̂(x) = |a|λ − |x|λ

onde λ é um parâmetro variacional. Qual o erro percentual relativo quando se


compara com o resultado exato? [[4], pg. 315]

7. Obtenha a energia do estado fundamental do oscilador harmônico usando uma


função tentativa
1
ψ̂(x) = 2
x +a
onde a > 0 é um parâmetro variacional.

8. Você pode usar o método variacional para obter a energia do primeiro estado
excitado do oscilador harmônico (n = 2). Use a função tentativa
2
ψ̂(x) = xe−βx

9. Considere uma partı́cula sujeita ao potencial V (x) = λx4 . Use o método varia-
cional para estimar a energia do estado fundamental, usando a função tentativa
2
ψ̂(x) = e−αx
2
~
Compare seu resultado com a solução exata desse problema: E0 = 1, 06 2m k1/3 ,
2
onde k = 2mλ/~ .
2.6. PROBLEMAS 63

10. O método variacional na mecânica quântica pode ser generalizado para três
dimensões. Os funcionais (2.82) e (2.83) serão dados por
Z  2  
~
J[ψ] = < ψ(r)|Hψ(r) >= d3 r (∇ψ ∗ · ∇ψ) + V (r)ψ ∗ (r)ψ(r)
2m
Z
3 ∗
N [ψ] = < ψ(r)|ψ(r) >= d rψ (r)ψ(r)

Usando a função tentativa,


(
r

1− α
, se r ≤ α,
ψ̂(r) =
0, se r > α.

com α fazendo o papel de parâmetro variacional, estime a energia do estado


fundamental do átomo de hidrogênio, onde V = ke2 /r, com k = 1/4πǫ0 .

11. Repita o problema anterior com a função tentativa


2
ψ̂(r) = e−αr

Resposta: −11, 5eV (o valor experimental é −13, 6eV ).

12. Use o método variacional para estimar a energia de ligação de um dêuteron


(núcleo de deutério), supondo que o potencial de interação entre o próton e o
nêutron é
V (r) = Ae−r/r0
e use uma função tentativa ψ̂(x) = Ce−βr , onde A e C são constantes de nor-
malização, r0 é um comprimento caracterı́stico do potencial, e β é o parâmetro
variacional. A resposta é −2, 1M eV . O valor experimental é 2, 24M ev.
64 CAPÍTULO 2. MÉTODOS VARIACIONAIS APLICADOS
Referências Bibliográficas

[1] E. Butkov, Fı́sica Matemática (Guanabara Dois, Rio de Janeiro, 1978).

[2] H. Goldstein, C. Poole, e J. Safko, Classical Mechanics, 3rd. Ed. (Addison


Wesley, San Francisco, 2000).
[3] G. B. Arfken e H. J. Weber, Mathematical Methods for Physicists, 5a. Ed.
(Harcourt, San Diego, 2001).

[4] J. J. Sakurai, Modern Quantum Mechanics, Revised Edition, (Addison


Wesley, San Francisco, 1994).

[5] C. Cohen-Tannoudji, B. Diu, e F. Laloë, Quantum Mechanics, 2 volumes,


(Wiley, New York, 1977).

[6] S. Gasiorowicz, Quantum Physics, 3rd. Ed. (Wiley, New York, 2003)

[7] G. Venezian, Am. J. Phys. 34, 701 (1966).

[8] P. W. Cooper, Am. J. Phys. 34, 68 (1966).

65

Вам также может понравиться