Variacional - Solução Da Braquistócrona

Cálculo Variacional
Prof. Dr. Ricardo L. Viana

Departamento de Fı́sica
Universidade Federal do Paraná
Curitiba - PR
11 de maio de 2011
2
Sumário
1 Equação de Euler 5
1.1 Uma variável independente e uma dependente . . . . . . . . . . . 5
1.1.1 Parâmetro variacional . . . . . . . . . . . . . . . . . . . . 5
1.1.2 Dedução da equação de Euler . . . . . . . . . . . . . . . . 6
1.1.3 Identidade de Beltrami . . . . . . . . . . . . . . . . . . . . 8
1.2 Aplicações da equação de Euler . . . . . . . . . . . . . . . . . . . 9
1.2.1 Menor distância entre dois pontos . . . . . . . . . . . . . 9
1.2.2 Braquistócrona . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.3 Superfı́cies de revolução e filmes de sabão . . . . . . . . . 13
1.2.4 Túnel em uma esfera . . . . . . . . . . . . . . . . . . . . . 16
1.3 Uma variável independente e várias dependentes . . . . . . . . . 19
1.3.1 Equações de Euler . . . . . . . . . . . . . . . . . . . . . . 19
1.3.2 Propagação da luz e o princı́pio de Fermat . . . . . . . . . 20
1.3.3 Princı́pio de Hamilton . . . . . . . . . . . . . . . . . . . . 23
1.4 Uma variável dependente e várias variáveis independentes . . . . 26
1.4.1 Equação de Euler . . . . . . . . . . . . . . . . . . . . . . . 26
1.4.2 Equação de Laplace . . . . . . . . . . . . . . . . . . . . . 27
1.5 Várias variáveis independentes e dependentes . . . . . . . . . . . 28
1.6 Problemas variacionais com vı́nculos . . . . . . . . . . . . . . . . 28
1.6.1 Vı́nculos e multiplicadores de Lagrange . . . . . . . . . . 28
1.6.2 Exemplos de vı́nculos . . . . . . . . . . . . . . . . . . . . 30
1.6.3 Equações de Euler com vı́nculos . . . . . . . . . . . . . . 31
1.6.4 Problemas mecânicos com vı́nculos . . . . . . . . . . . . . 35
1.7 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2 Métodos variacionais aplicados 43

2.1 Revisão sobre a equação de Sturm-Liouville . . . . . . . . . . . . 43
2.2 A equação de Sturm-Liouville como um problema variacional . . 44
2.3 Autofunções de L como funções de base . . . . . . . . . . . . . . 46
2.4 O método de Rayleigh-Ritz . . . . . . . . . . . . . . . . . . . . . 49
2.4.1 Exemplos de aplicação do método . . . . . . . . . . . . . 50
2.5 O método da razão no cálculo variacional . . . . . . . . . . . . . 52
2.5.1 Cálculo com o sı́mbolo δ . . . . . . . . . . . . . . . . . . . 53
2.5.2 Teoria geral . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.5.3 O método da razão na mecânica quântica . . . . . . . . . 56
2.6 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3
4 SUMÁRIO
Capı́tulo 1
Equação de Euler
1.1 Uma variável independente e uma depen-

dente
No que segue, denotaremos por x a variável independente, e por y a dependente.
Usaremos, ainda, a notação yx = dy/dx para a derivada de y(x) em relação ao
seu argumento.
O problema central do cálculo variacional pode ser expresso na seguinte
forma: desejamos encontrar uma função y(x) que possui valores fixos nos pontos
x = x1 e x = x2 , tal que a integral de linha de uma dada função f (y, yx , x)
Z x2
J= f (y, yx , x)dx (1.1)
x1
seja um extremo (máximo, mı́nimo ou ponto de inflexão). Em outras palavras,

queremos encontrar y(x) com valores fixos y1 = f (x1 ) e y2 = f (x2 ) tal que a
integral J seja estacionária.
A integral J é um funcional, pois não depende só dos valores de y e sua
derivada num dado ponto x, mas sim em todos os pontos do intervalo x1 ≤ x ≤
x2 , já que a integral (2.18) depende do caminho escolhido entre esses pontos.
1.1.1 Parâmetro variacional

Há, naturalmente, infinitas funções com valores fixos em (x1 , y1 ) e (x2 , y2 ), mas
a integral J assume valores diferentes para cada um. No plano cartesiano,
isso equivale a dizer que há infinitos caminhos ligando os pontos fixos, mas
apenas para um deles J é um extremo. Formalmente podemos rotular todos os
caminhos possı́veis entre os pontos (x1 , y1 ) e (x2 , y2 ) por meio de um parâmetro
variacional α, de modo que cada caminho seja caracterizado por y(x, α [Fig.
1.1]. Para um dado valor de α, como α = 0, o caminho “ótimo” correspondente,
denotado por y(x, 0) torna J estacionária.
Suporemos que cada caminho seja uma deformação contı́nua do caminho
ótimo no sentido de que podemos escrever
y(x, α) = y(x, 0) + αη(x), (1.2)
5
6 CAPÍTULO 1. EQUAÇÃO DE EULER
y α=α
2 2
y
2
α=α 1
α=0
y
1 1 α=α
3
x
0 x x x
1 α=α 2
2
Figura 1.1: Parametrização de caminhos ligando dois pontos fixos.
onde η(x) representa a deformação, portanto deve ser uma função continuamente
diferenciável (suave) em todos os pontos do intervalo x1 < x < x2 , anulando-se
nos seus extremos: η(x1 ) = η(x2 ) = 0.
Como um exemplo de parametrização consideremos os pontos fixos no plano
(x1 , y1 ) = (0, 0) e (x2 , y2 ) = (1, 0), onde o caminho ótimo seja o segmento de
reta que os une:
y(x, 0) = {(x, y)|y = 0, 0 ≤ x ≤ 1}.
Uma famı́lia de curvas suaves parametrizadas por α que conectam os pontos
fixos é (α ∈ R)
y(x, α) = αx(1 − x),
onde α = 0 fornece o caminho ótimo: y(x, 0) = 0. Logo η(x) = x(1 − x), que
satisfaz η(0) = η(1) = 0.
Observe que a deformação η(x) deve ser uma função suave no intervalo
[x1 , x2 ], ou seja, deve ser diferenciável em todos os seus pontos. No exemplo
anterior, isso significa que não podemos usar uma função como (α ∈ R)
(
2αx, se 0 ≤ x ≤ 1/2,
η(x) =
2α(x − 1), se 1/2 ≤ x ≤ 1,
pois ela não é diferenciável em x = 1/2.
1.1.2 Dedução da equação de Euler

O funcional integral (2.18), com o auxı́lio do parâmetro variacional α, pode ser
reescrito como Z x2
J(α) = f (y(x, α), yx (x, α), x)dx. (1.3)
x1
A condição imposta ao caminho ótimo y(x, 0) de que torne o funcional acima

estacionário implica em
∂J
= 0. (1.4)
∂α α=0
1.1. UMA VARIÁVEL INDEPENDENTE E UMA DEPENDENTE 7
Diferenciando (2.28) em relação a α teremos

Z x2
∂J ∂f ∂y ∂f ∂yx
= + dx. (1.5)
∂α x1 ∂y ∂α ∂yx ∂α
Integrando por partes o segundo termo do lado direito

Z x2 x Z x2
∂f ∂yx ∂f ∂y 2 ∂y d ∂f
dx = − dx (1.6)
x1 ∂yx |∂α ∂yx ∂α x1 ∂α dx ∂yx
x1 |{z}
|{z} {z } | {z }
=u =dv =v =du
Como todas as curvas parametrizadas por α devem passar pelos pontos fixos,

∂y ∂y
= 0, = 0, (1.7)
∂α x1 ∂α x2
tal que a primeira parcela resultante da integração por partes é identicamente

nula, restando, então
Z x2
∂J ∂f d ∂f ∂y
= − dx. (1.8)
∂α x1 ∂y dx ∂y x ∂α
Multiplicando por dα e calculando as derivadas em relação a α para o cami-

nho ótimo α = 0 teremos
Z x2
∂J ∂f d ∂f ∂y
dα = − dαdx. (1.9)
∂α α=0 x1 ∂y dx ∂y x ∂α
Vamos denominar variação da integral J a seguinte expressão

∂J
δJ ≡ dα, (1.10)
∂α α=0
assim como, analogamente, a variação de y será

∂y
δy ≡ dα, (1.11)
∂α α=0
com as quais reescrevemos (1.9) como

Z x2
∂f d ∂f
δJ = − δydx. (1.12)
x1 ∂y dx ∂yx
A condição (1.4) para que a integral J seja estacionária é, portanto, simples-
mente
δJ = 0. (1.13)
Impondo essa condição em (1.12), como δy é arbitrário, concluimos que, neces-
sariamente, o termo entre colchetes deve anular-se, o que fornece a equação de
Euler 1
∂f d ∂f
− = 0. (1.14)
∂y dx ∂yx
1A equação de Euler é uma condição necessária, porém não suficiente para que δJ = 0.
Leonhard Euler chegou à equação acima em 1744, no seu trabalho Método

para achar curvas planas que mostram algumas propriedades de máximos e
mı́nimos. Posteriormente, em 1760, Joseph Louis Lagrange aprofundou a análise
prévia de Euler no seu trabalho Ensaio sobre um novo método para determinar
os máximos e mı́nimos de fórmulas integrais indefinidas. Por esse motivo, den-
tro do contexto da mecânica, a expressão (1.14) é também chamada de equação
de Euler-Lagrange. A equação de Euler é uma condição necessária, porém não
suficiente, para que a integral J seja estacionária. Além disso, na dedução
que fizemos nós fizemos a suposição implı́cita de que a solução procurada y(x)
seja ao menos duas vezes diferenciável. Há situações em que soluções não-
diferenciáveis do problema variacional podem ser encontradas, e que não são
soluções da equação de Euler (como na seção 1.2.3).
1.1.3 Identidade de Beltrami

Quando a função f no funcional integral (2.18) não depende explicitamente
da variável independente x, é possı́vel reduzir a equação de Euler-Lagrange à
seguinte identidade, descoberta por Beltrami em 1868:
∂f
f − yx = C = constante. (1.15)
∂yx
Para deduzir essa identidade, consideremos primeiramente a derivada total

da função f (y, yx , x):
df ∂f dy ∂f dyx ∂f
= + +
dx ∂y dx ∂yx dx ∂x
∂f ∂f ∂f
= yx + yxx + ,
∂y ∂yx ∂x
onde podemos isolar
∂f df ∂f ∂f
yx = − yxx − . (1.16)
∂y dx ∂yx ∂x
Multiplicando a equação de Euler (1.14) por yx obtemos

∂f d ∂f
yx − yx = 0. (1.17)
∂y dx ∂yx
Substituindo (1.16) em (1.17),

df ∂f ∂f d ∂f
− yxx − − yx = 0. (1.18)
dx ∂yx ∂x dx ∂yx
Como
d ∂f ∂f d ∂f
yx = yxx + yx , (1.19)
dx ∂yx ∂yx dx ∂yx
a expressão (1.18) fornece, após um pequeno rearranjo, uma forma alternativa
da equação de Euler:

∂f d ∂f
− + f − yx = 0. (1.20)
∂x dx ∂yx
1.2. APLICAÇÕES DA EQUAÇÃO DE EULER 9
∂f
Caso f não dependa explicitamente de x, então ∂x = 0 e (1.20) reduz-se a

d ∂f
f − yx = 0. (1.21)
dx ∂yx
que, por integração, nos leva à identidade de Beltrami (1.15).
1.2 Aplicações da equação de Euler

1.2.1 Menor distância entre dois pontos
O elemento de comprimento de um arco no plano é dado por
s 2
√ p dy p
ds = dr · dr = dx2 + dy 2 = dx 1 + = dx 1 + yx2 , (1.22)
dx
de tal sorte que o comprimento total de uma curva plana ligando os pontos de
coordenadas (x1 , y1 ) e (x2 , y2 ) é
Z 2 Z x2 p
L= ds = dx 1 + yx2 , (1.23)
1 x1
na forma de um funcional integral.

Desejamos encontrar a curva ligando os pontos 1 e 2 tal que o seu compri-
mento L seja mı́nimo. Do ponto de vista do cálculo variacional, isso implica
em achar y(x) tal que a integral L seja estacionária (um mı́nimo, na verdade,
mas essa é uma questão posterior),
p ou seja, resolver a equação de Euler (1.14)
correspondente para f = 1 + yx2 . Como f não depende explicitamente de y,
!
d yx
p = 0
dx 1 + yx2
y
p x = C
1 + yx2
r
1
yx = ± ≡ a,
1 − C2
onde a é uma outra constante.
A equação diferencial dy/dx = a é elementar e fornece a solução geral
y(x) = ax + b, onde b é uma constante de integração. Como a curva y(x) deve
passar pelos pontos (x1 , y1 ) e (x2 , y2 ), as constantes a e b são determinadas pela
resolução do seguinte sistema de equações lineares
ax1 + b = y1 ,
ax2 + b = y2 ,
isto é,
y1 − y2
a = , (1.24)
x1 − x2
y2 x 1 − y1 x 2
b = . (1.25)
x1 − x2
A solução y(x) = ax + b representa um segmento de reta entre dois pontos.

Em geral, curvas que fornecem a menor distância entre dois pontos sobre uma
superfı́cie são chamadas geodésicas dessa superfı́cie. Numa superfı́cie esférica,
por exemplo, a geodésica entre dois pontos é o menor arco de cı́rculo máximo (o
centro coincide com o centro da esfera) que conecta estes pontos. Na relatividade
geral, o espaço-tempo quadridimensional é curvo, e a geodésica generaliza a
noção de linha reta para este espaço. Uma partı́cula livre, na relatividade geral,
sempre move-se ao longo de uma geodésica do espaço-tempo curvo.
Prova de que o extremo é um mı́nimo

Observe que, rigorosamente falando, só mostramos que a curva

y1 − y2 y2 x 1 − y1 x 2
y(x) = x+ (1.26)
x1 − x2 x1 − x2
tem um comprimento estacionário, ou seja, pode ser um máximo, mı́nimo ou
ponto de inflexão. Para mostrar que o comprimento L é, de fato, um mı́nimo, é
necessário realizar um cálculo mais elaborado. Vamos considerar o comprimento
de uma curva não-ótima (quando α 6= 0):
Z x2 p
L[y(x, α)] = 2 ,
dx 1 + yxα (1.27)
x1
onde yxα = yx (x, α), e comparar com o comprimento da curva ótima (1.26):
Z x2 q
L[y(x, 0)] = 2 ,
dx 1 + yx0 (1.28)
x1
Pela parametrização dada por (1.2), diferenciando em relação a x temos que

yxα = yx0 + αηx (1.29)
Substituindo (1.29) em (1.27) nós computamos a diferença
∆L = L[y(x, α)] − L[y(x, 0)]
Z x2 q q
2 2
= dx 1 + (yx0 + αηx ) − 1 + yx0
x1
onde yx0 = a. Usando o teorema binomial nós expandimos o integrando acima

em potências do parâmetro α. Após um cálculo tedioso obtemos
∆L = αI1 + α2 I2 + . . .
onde
a
I1 = √ [η(x2 ) − η(x1 )] = 0
2 1 + a2
e Z x2
1 3a2 + 4
I2 = η 2 dx ≥ 0
8 (1 + a2 )3/2 x1 x
| {z } | {z }
≥0 ≥0
donde ∆L ≥ 0, ou L[y(x, α)] ≥ L[y(x, 0)], a igualdade só valendo para o caso
onde α = 0. Em geral, L[y(x, α)] será sempre maior do que L[y(x, 0)], onde o
último é, de fato, um mı́nimo.
y
1 x
0 x
2
y
Figura 1.2: A braquistócrona.
1.2.2 Braquistócrona
O problema da braquistócrona consiste em achar a trajetória pela qual uma
partı́cula deslizando a partir do repouso, sem atrito, e acelerada unicamente
pela gravidade, vai de um ponto a outro (num plano vertical) no menor tempo
possı́vel. Ele foi formulado pela primeira vez por Johann Bernoulli em 1696, sob
a forma de um desafio lançado aos maiores matemáticos do seu tempo. Cinco
deles enviaram suas soluções: Newton, Jacob Bernoulli (irmão de Johann), Leib-
nitz, L’Hôpital, além do próprio Johann Bernoulli. Todos eles, usando diferentes
métodos geométricos, encontraram corretamente a curva como sendo um arco de
ciclóide. Os métodos usados pelos irmãos Bernoulli para resolver o problema da
braquistócrona e assemelhados levaram, anos após, Euler e Lagrange a criarem
o cálculo variacional.
Por simplicidade, vamos supor que a partı́cula de massa m parta do repouso
da origem 1 : (0, 0) e deslize sem atrito pela curva y(x) até chegar ao ponto
2 : (x, y). O tempo necessário para percorrer o caminho ligando esses pontos é
Z 2
ds
t12 = , (1.30)
1 v
onde ds é o elemento de arco dado por (1.22). Para achar a velocidade v

como√função da elevação y podemos usar conservação de energia, o que fornece
v = 2gy. Substituindo em (1.30) teremos o funcional integral
Z s
x
1 + yx2
t12 = dx. (1.31)
0 2gy
Desejamos achar a forma da curva y(x) para a qual, dados os pontos fixos
1 e 2, o tempo de percurso é mı́nimo. Este é um problema variacional para o
qual a solução é obtida resolvendo-se a equação de Euler (1.14) para a função
1/2 −1/2
f (y, yx ) = (1 + yx2 ) (2gy) . Como ela não depende explicitamente de x
podemos usar, alternativamente, a identidade de Beltrami (1.15):

∂f −1/2 −1/2 1/2 −1/2
f − yx = −yx2 (1 + yx2 ) (2gy) + (1 + yx2 ) (2gy)
∂yx
−1/2 −1/2
C = (2gy) (1 + yx2 ) −yx2 + (1 + yx2 )
−1/2 −1/2
= (2gy) (1 + yx2 ) .
Quadrando ambos os membros obtemos a seguinte equação diferencial

1
y(1 + yx2 ) = ≡ k2 , (1.32)
2gC 2
onde k é uma nova constante. Isolando dx e tomando apenas o sinal positivo
para a raiz quadrada, obtemos
r
y
dx = 2
dy. (1.33)
k −y
Vamos introduzir um parâmetro 0 ≤ θ < 2π através da seguinte substituição

trigonométrica
k2 θ
y(θ) = (1 − cos θ) = k 2 sin2 , (1.34)
2 2
que, substituida em (1.33), e após algumas simplificações, fornece

2 2 θ
dx = k sin dθ (1.35)
2
tal que a outra coordenada pode ser encontrada, sob a forma paramétrica, por
integração dessa expressão
Z Z
2 2 θ k2
x = dx = k sin dθ = (θ − sin θ) + k12 , (1.36)
2 2
onde k12 é uma nova constante de integração, que se anula pela condição de
contorno y(0) = 0. A braquistócrona, então, é determinada pelas seguintes
equações paramétricas:
k2
x(θ) = (θ − sin θ), (1.37)
2
k2
y(θ) = (1 − cos θ), (1.38)
2
que são as equações de uma ciclóide.
A ciclóide é a curva traçada por um ponto fixo num cı́rculo de raio a = k 2 /2
que rola sem deslizar por uma linha reta. Podemos interpretar o parâmetro
θ como o ângulo que o raio vetor do ponto fixo faz com um raio vetor de
referência. Num ciclo completo, portanto, o parâmetro vai de zero a 2π. Ela
foi estudada primeiramente por Galileu em 1599, que tentou achar a sua área
experimentalmente (!) cortando e pesando pedaços de metal. A área sob a curva
após um ciclo completo, dada por 3πa2 , foi encontrada por Torricelli, Fermat e
Descartes usando métodos geométricos. O comprimento de um ciclo completo
da ciclóide é 8a.
y
y
2
ds
y y
1
0 x1 x2 x
Figura 1.3: Superfı́cies de revolução de área mı́nima.
A braquistócrona tem uma outra propriedade notável, e aparentemente pa-

radoxal: uma partı́cula colocada em qualquer posição (não necessariamente a
origem), vai alcançar o ponto final no mesmo tempo, ou seja, t12 , além de ser
mı́nimo, independe da posição inicial (ver o Problema 2)! Por esse motivo a
ciclóide é também uma tautócrona. Essa propriedade foi descoberta por 1673
por Huyghens, que a utilizou no (também sua invenção) relógio de pêndulo.
Para garantir o isocronismo das suas oscilações, ele adaptou no ponto de sus-
pensão do pêndulo duas guias na forma de arcos de ciclóide, o que fez com que o
próprio pêndulo oscilasse não em arcos de cı́rculo (aproximadamente isócronos),
mas em arcos de ciclóide (isócronos), o que melhorou bastante a precisão do
relógio.
1.2.3 Superfı́cies de revolução e filmes de sabão

O problema consiste em encontrar a curva que liga os pontos (x1 , y1 ) e (x2 , y2 )
que, ao ser girada em torno do eixo das abscissas, fornece uma superfı́cie de
revolução de mı́nima área [Fig. 1.3]. Imaginando que os pontos 1 e 2, ao serem
girados, geram dois cı́rculos de raios y1 e y2 , respectivamente, isso equivale a
perguntar qual a superfı́cie de mı́nima área limitada por esses dois aros circula-
res.
Sob esse último ponto de vista, o problema das superfı́cies de revolução
tem uma aplicação fı́sica muito interessante. Filmes lı́quidos de sabão têm uma
energia livre de Gibbs F proporcional à área A da sua superfı́cie: F = σf A, onde
σf é o coeficiente de tensão superficial do lı́quido. Se o filme de sabão estiver
em equilı́brio termodinâmico, a energia livre de Gibbs deve ser mı́nima. Como
σf só depende da temperatura do lı́quido, se esta é constante, então o filme de
sabão em equilı́brio deve sempre ter uma configuração que minimiza a sua área
superficial. Este é o famoso problema de Plateau, nomeado em homenagem ao
fı́sico francês que primeiro estudou este e outros problemas relacionados.
A superfı́cie de revolução gerada pela rotação do arco de curva plana y(x)
ligando os pontos (x1 , y1 ) e (x2 , y2 ) em torno do eixo x tem um elemento de
área p
dA = (2πy)(ds) = 2πy 1 + yx2 dx, (1.39)
onde usamos (1.22). A área total da superfı́cie será, portanto, o funcional inte-
gral Z x2 p
A = 2π y 1 + yx2 dx, (1.40)
x1
que se pretende minimizar. p

Como o integrando f = y 1 + yx2 não depende explicitamente de x podemos
usar a identidade de Beltrami (1.15) no lugar da equação de Euler (1.14):
∂f p yy 2
f − yx = y 1 + yx2 − p x = a = const. (1.41)
∂yx 1 + yx2
p
Multiplicando por 1 + yx2 obtemos
p
y(1 + yx2 ) − yx2 y = y = a 1 + yx2 .
Isolando yx2 nessa expressão teremos

dx 1 a
= =p . (1.42)
dy yx y − a2
2
A equação diferencial acima pode ser imediatamente integrada:

Z y
dy
x=a p = a cosh−1 +b (1.43)
y 2 − a2 a
onde b é uma constante de integração. Invertendo temos a equação da curva

procurada
x−b
y(x) = a cosh , (1.44)
a
denominada catenária na literatura. As constantes a e b são determinadas
implicitamente pelas coordenadas dos pontos fixos

x1 − b x2 − b
y1 = a cosh , y2 = a cosh , (1.45)
a a
A superfı́cie de revolução gerada pela catenária é chamada de catenóide, e seria
também obtida se a rotação fosse feita em torno do eixo das ordenadas, ao invés
das abscissas (Problema 3). Foi Euler quem, em 1744, mostrou que a catenóide
é uma superfı́cie de mı́nima área.
Outras soluções do problema

Ocorre que a catenóide não é a única solução do problema. Para simplificar
os cálculos, vamos supor que x1 = −x2 = x0 e y1 = y2 = y0 , ou seja, a
superfı́cie mı́nima encontra dois arcos circulares de raio y0 simetricamente postos
em relação à origem. A equação da catenária será, portanto,
x
y(x) = a cosh , (1.46)
a
onde a constante é dada pela solução da equação transcendente
y0
a= , (1.47)
cosh(x0 /a)
y
o
−xo 0 xo x
−yo
Figura 1.4: Superfı́cies de revolução de área mı́nima.
Figura 1.5: Soluções do problema de área mı́nima

[http://mathworld.wolfram.com/SurfaceofRevolution.html]
Como os valores de x0 , e y0 estão “amarrados” pela condição (1.47), não

podemos especificá-los de uma forma arbitrária. Disso decorre que a solução
(1.46) não é verificada para todos os valores de x0 e y0 . Para mostrar esse fato,
vamos encontrar o valor máximo da razão x0 /y0 para o qual (1.47) é satisfeita.
Fazendo p = 1/a essa condição é reescrita como
py0 = cosh(px0 ). (1.48)
Diferenciando em relação a p ambos os membros

dx0
y0 = sinh(px0 ) x0 + p (1.49)
dp
Denotando o valor máximo de x0 por x∗0 , temos a condição de máximo

dx0
=0
dp x0 =x∗
0
1 2
r r
o
R θ R
φ
Figura 1.6: Túnel em uma esfera.
tal que (1.49) fique

y0 = x∗o sinh(px∗0 ). (1.50)
Pondo x∗0 em (1.48) e dividindo as equações membro a membro chegamos à
equação transcendente
px∗0 = coth(px∗0 ), (1.51)
que tem apenas uma solução positiva, que pode ser obtida (numericamente)
como px∗0 ≈ 1, 2. De (1.48) e (1.50) teremos que
x∗0
= csch1, 2 ≈ 0, 663 (1.52)
y0
donde para (x0 /y0 ) > 0, 66 a catenóide não é a solução do problema da superfı́cie
mı́nima. Há uma outra solução para o problema da superfı́cie mı́nima, devida a
Goldschmidt, que não é obtida pelo cálculo variacional, e é composta por dois
filmes circulares em cada aro [Fig. 1.5]. Como a solução de Goldschmidt é
descontı́nua, ela não satisfaz a equação de Euler (1.41). Para (x0 /y0 ) > 0, 66
apenas as soluções de Goldschmidt podem existir. Podemos encarar a situação
da seguinte forma: quando os cı́rculos estão suficientemente afastados entre si,
a solução do tipo catenóide torna-se instável, isto é, o filme de sabão se rompe.
1.2.4 Túnel em uma esfera

Um problema similar, porém mais difı́cil do que o da braquistócrona consiste
em encontrar a trajetória de menor tempo de percurso para um túnel escavado
numa esfera homogênea de massa M e raio R, para o qual o campo gravitacional

não é uniforme. Usando a Lei de Gauss para a gravitação, é fácil mostrar que
a energia potencial gravitacional para uma partı́cula de massa m situada à
distância r do centro da esfera é
mg0 r2
U (r) = , (1.53)
2R
onde g0 = GM/R2 é a aceleração da gravidade na superfı́cie da esfera (r = R),
e G é a constante Newtoniana.
Suponha que a partı́cula parta do repouso de um ponto 1 na superfı́cie da
esfera. Usando conservação de energia mecânica, o tempo necessário para ir do
ponto 1 até um ponto 2 situado a uma distância r do centro da esfera é [Figura
1.6]:
Z 2
ds
t12 = q (1.54)
2
1 g0 R 1 − Rr 2
Introduzindo coordenadas polares (r, θ) o elemento de arco (1.22) é escrito como

q
ds = r2 + rθ2 dθ, (1.55)
de modo que o funcional a ser minimizado é

s Z s
R θ2 rθ2 + r2
t12 = dθ. (1.56)
g 0 θ1 R2 − r 2
Como o integrando não depende explicitamente de θ, podemos usar a iden-

tidade de Beltrami (1.15) para obter
r
g0 2 1/2
r2 = C (R − r2 )(rθ2 + r2 ) (1.57)
R
onde podemos exprimir a constante de integração C em termos de r0 , que é a

distância máxima aproximação ao centro da esfera. Por simetria, r = r0 deve
ser o ponto médio de uma trajetória ligando dois pontos sobre a superfı́cie da
esfera, e onde a tangente à trajetória é perpendicular ao raio. Dessa forma
podemos aplicar em (1.57) a condição de que rθ = 0 em r = r0 ,
r
g0 2 1/2
r02 = C (R − r02 )r02 (1.58)
R
Dividindo (1.57) e (1.58) membro a membro obtemos a seguinte equação

diferencial s
rR r2 − r02
rθ = , (1.59)
r0 R2 − r2
que pode ser integrada analiticamente fornecendo
 s  s
R r 2 − r2 r r2 − r02
0  0
θ(r) = arctan  2 2
− arctan , (1.60)
r0 R − r R R2 − r 2
onde θ(r0 ) = 0 corresponde ao ponto de máxima aproximação. O ângulo cen-

tral subtendido pelos dois pontos na superfı́cie da esfera pode ser encontrado
impondo r = R em (1.60), fornecendo
r0
2φ = π 1 − . (1.61)
R
Definindo um parâmetro Ωt pela relação
s
r2 − r02
tan(Ωt) = , (1.62)
R2 − r 2
a equação (1.60) da trajetória que minimiza o tempo de percurso é

R r0
θ(Ωt) = arctan tan Ωt − Ωt. (1.63)
r0 R
Fazendo uma transformação trigonométrica podemos reescrevê-la como
1 2 1
r2 (Ωt) = (R + r02 ) − (R2 − r02 ) cos(2Ωt). (1.64)
2 2
de modo que (1.62) e (1.64) são as equações paramétricas da trajetória, a qual é
uma hipociclóide, que é a curva produzida por um ponto fixo P sobre um cı́rculo
de raio b que rola sem deslizar pelo interior de um cı́rculo de raio a > b.
Para calcular analiticamente o tempo (mı́nimo) de percurso entre dois pontos
quaisquer substituimos (1.59) em (1.56)
s Z s
R r2 dr R2 (r2 − r02 ) + r02 (R2 − r2 )
t12 = √
g 0 r1 R2 − r 2 R2 (r2 − r02 )
r Z r
1 1/2 −1/2 2 −1/2
= (R2 − r02 ) r(R2 − r2 ) (r − r02 ) dr
Rg0 r0
2
1 −1/2 1/2 R + r02 − 2r2
= (Rg0 ) (R2 − r02 ) arccos (1.65)
2 R2 − r02
onde supusemos que, em t = 0, a partı́cula esteja no ponto de maior aproximação
do centro da esfera (r1 , θ1 ) = (r0 , 0).
Supondo, ainda, que a partı́cula “suba” o túnel até chegar na superfı́cie da
esfera em (r2 , θ2 ) = (R, θ) no tempo t = τ , de (1.65)
2 s
2
1 −1/2 1/2 r − R π R2 − r02
τ = (Rg0 ) (R2 − r02 ) arccos 02 = , (1.66)
2 R − r02 2 Rg0
| {z }
=arccos(−1)=π
Finalmente, por simetria o tempo total de percurso entre dois pontos na su-
perfı́cie será s r
R2 − r02 r 2
0
T = 2τ = π = 1− T0 , (1.67)
Rg0 R
onde s
R
T0 ≡ π (1.68)
g0
1.3. UMA VARIÁVEL INDEPENDENTE E VÁRIAS DEPENDENTES 19
é o tempo de percurso para uma trajetória que passe pelo centro da esfera, isto
é, com r0 = 0, conectando dois pontos antipodais na sua superfı́cie. Em geral,
os tempos de trânsito para todas as cordas são idênticos, sendo o diâmetro a
maior corda possı́vel na esfera, evidentemente, Para uma hipociclóide, porém,
na medida em que r0 ≥ 0, então T ≤ T0 , significando que o tempo de percurso
por uma hipociclóide é sempre menor do que o tempo de percurso pela corda
que une os dois pontos.
Como um exemplo numérico, supondo que a Terra seja uma esfera perfeita
onde R = 6370km e g0 = 9, 8m/s2 , temos que T0 = 2, 53 × 103 s = 42, 2min.
Para uma trajetória (num hipotético túnel) onde r0 = R/2, o tempo de per-
curso será T = 0, 0625T0 = 2, 64min. Esse valor é espantosamente baixo, con-
siderando que, como o ângulo central subtendendo os pontos inicial e final é,
de (1.61), φ = π/4,
√ um cálculo simples mostra que a corda ligando esses dois
pontos mede R 2 = 9008km, e que a profundidade máxima de um túnel ao
longo da corda seria h = R(1 − cos φ) = 1865km. Além disso, a distância entre
esses pontos ao longo da superfı́cie é s = Rπ/4 = 5000km.
Este problema tem uma história curiosa. Em 1888 Collignon apresentou
perante o Congresso da Associação Francesa para o Avanço da Ciência um
trabalho com o tı́tulo De Paris ao Rio de Janeiro em 42 minutos e 11 segundos
(provavelmente referindo-se a um hipotético túnel ao longo da corda ligando as
duas cidades). De fato, na década de 1930 especulou-se muito sobre esse tipo de
possibilidade, naturalmente limitada por vários fatores tecnológicos. Na década
de 1960 esse problema foi objeto de vários artigos [7, 8].
1.3 Uma variável independente e várias depen-

dentes
1.3.1 Equações de Euler
Para generalizar o problema variacional nós consideraremos uma função de n
variáveis yi , i = 1, 2, . . . n, todas elas dependentes de x:
f = f (y1 (x), y2 (x), . . . yn (x); x),
e o funcional integral que desejamos tornar estacionário

Z x2
J= f (y1 , y2 , . . . yn ; y1x , y2x , . . . ynx ; x)dx, (1.69)
x1
onde yix = dyi /dx.

Como antes, consideramos uma infinidade de caminhos possı́veis ligando os
pontos fixos em x = x1 e x = x2 , parametrizados por α, tal que α = 0 represente
o caminho ótimo para cada variável dependente
yi (x, α) = yi (x, 0) + αηi (x), (1.70)
onde ηi (x) representam as deformações continuamente diferenciáveis para cada

i = 1, 2, . . . n, e que são independentes entre si, anulando-se nos extremos:
ηi (x1 ) = ηi (x2 ) = 0.
Diferenciando o funcional (1.69) em relação a α teremos

Z x2
∂J ∂f
=
∂α x1 ∂α
Z x2 n
X ∂f ∂yi ∂f ∂yix
= dx +
x1 i=1
∂yi ∂α ∂yix ∂α
n Z x2
X ∂f ∂f
= dx ηi + ηix (1.71)
i=1 x1
∂yi ∂yix
onde usamos o teorema de Schwartz para escrever

∂yix ∂ dyi d ∂yi dηi
= = = = = ηix . (1.72)
∂α ∂α dx dx ∂α dx
Integrando por partes a parcela
Z x2 x Z x2
∂f dηi ∂f 2 d ∂f
dx = ηi − ηi dx (1.73)
x1 ∂yix dx ∂yix x1 x1 dx ∂yix
| {z }
=0
e impondo que o funcional integral será estacionário se estivermos no caminho

ótimo entre os pontos fixos
∂J
= 0. (1.74)
∂α α=0
chegamos a
n Z x2
X ∂f d ∂f
dxηi − =0 (1.75)
i=1 x1 ∂yi dx ∂yix
Como os ηi são todos mutuamente independentes, para que a condição acima
subsista para quaisquer deformações, cada termo entre os colchetes deve anular-
se identicamente, fornecendo uma equação de Euler para cada variável depen-
dente em separado:

∂f d ∂f
− = 0, (i = 1, 2, . . . n) (1.76)
∂yi dx ∂yix
1.3.2 Propagação da luz e o princı́pio de Fermat

De acordo com o princı́pio de Fermat, proposto originalmente em 1662, os raios
luminosos ligando dois pontos dados, propagam-se ao longo de trajetórias tais
que o caminho ótimo é estacionário (pode ser um mı́nimo, máximo ou ponto de
inflexão). O caminho ótico ℓ é definido como o produto da distância geométrica
d entre dois pontos pelo ı́ndice de refração n da luz nesse meio: se o meio é
homogêneo e isotrópico, então ℓ = nd. Em geral, porém, teremos que
Z
ℓ= n(s)ds,
C
onde s parametriza um caminho C entre dois pontos - é a distância medida ao

longo de C a partir de um ponto de referência. O ı́ndice de refração de um meio
é a razão entre a velocidade da luz no vácuo c e a velocidade da luz v nesse meio.

Então, o princı́pio de Fermat, na sua forma mais geral, atesta que a integral
Z 2 Z 2√ 2
ds ṙ
c =c dt (1.77)
1 v 1 v
é estacionária
√ para o caminho percorrido pela luz num meio, onde escrevemos
ds = |dr| = dr · dr.
Se o meio é inomogêneo, então n depende de r. Mas, se o meio for ho-
mogêneo porém anisotrópico (como em um cristal, por exemplo), n, assim como
v, dependerá da direção de propagação, ou seja, de ṙ. Numa situação destas, a
integral estacionária será
Z 2√ 2
ṙ
dt. (1.78)
1 v(ṙ)
onde t é a variável independente e as componentes do vetor posição são as
variáveis dependentes.
A trajetória da luz r(t) será,
√ portanto, a solução da Equação de Euler corres-
pondente ao integrando f = ṙ2 /v(ṙ), o que implica em três equações escalares.
Por exemplo,
∂f d ∂f ∂f
− = 0, ⇒ = Cx , (1.79)
∂x dt ∂ ẋ
|{z} ∂ ẋ
=0
e assim por diante. Definindo um vetor de constantes C = (Cx , Cy , Cz ), o
integrando de (1.78) será dado por
f (ṙ) = C · ṙ + C1
onde C1 é um vetor de constantes de integração. Como f , por outro lado,
não pode depender explicitamente de r, isso implica em que f deva ser uma
constante. Isso só é compatı́vel com a solução da equação de Euler acima, se
r(t) = C1 t + C2 ,
ou seja, a luz propaga-se ao longo de linhas retas.
Refração da luz
O princı́pio de Fermat pode ser usado, no âmbito da ótica geométrica, para
deduzir as leis da reflexão e da refração da luz. Vamos considerar a refração
da luz pela interface de dois meios com ı́ndices de refração n1 e n2 (supostos
homogêneos e isotrópicos). Os dois pontos fixos têm coordenadas (x1 , y1 ) e
(x2 , y2 ). Pela discussão precedente vimos que, em cada meio, a trajetória da luz
deverá ser uma linha reta. O caminho ótico total entre os pontos 1 e 2 é
q q
2 2
ℓ = ℓ1 + ℓ2 = n1 (x1 − x0 ) + y12 + n2 (x2 − x0 ) + y22 , (1.80)
onde (x0 , 0) são as coordenadas do ponto na interface entre os dois meios.
As trajetórias da luz em cada meio minimizam o caminho ótico, o que pode
ser obtido achando o mı́nimo de ℓ em relação a x0 :
   
∂ℓ 2(x 0 − x 1 )(+1) 2(x 2 − x 0 )(−1)
= n1  q  + n2  q =0
∂x0 2 2 2 2
2 (x1 − x0 ) + y1 2 (x2 − x0 ) + y2
n1 sin θ1 − n2 sin θ2 = 0 (1.81)
que é a lei de Snell da refração, onde θ1 e θ2 são os ângulos que os raios incidente
e refratado, respectivamente, em relação à normal à interface no ponto (x0 , 0).
Observe que essa solução em si não é diferenciável nesse ponto, então ela não
pode ser considerada, rigorosamente, uma solução da Equação de Euler.
Buraco negro
Um buraco negro é uma singularidade cosmológica. Na superfı́cie de um buraco

negro, chamada “horizonte de eventos”, a força gravitacional é tão intensa que
a velocidade da luz é nula, de tal sorte que a luz é “aprisionada”. Próximo ao
horizonte de eventos de um buraco negro, a velocidade da luz cresce proporcio-
nalmente à distância y em relação a ele, na forma v(y) = y/b, onde b > 0, tal
que v(0) = 0. Nessa situação a velocidade da luz depende da posição e o meio
não pode mais ser considerado homogêneo nem isotrópico.
O princı́pio de Fermat (1.77), nesse caso, impõe que
Z 2 Z x2
p
ds 1 + yx2
= dx
1 v x1 y/b
seja um extremo para a trajetória da luz. Como o integrando não depende da

variável independente (note que, agora, a variável independente é x, e não t!),
podemos usar a identidade de Beltrami (1.15)
∂f
f − yx = C
∂yx
p
1 + yx2 2yx
− yx p =
y 2 1 + yx2
dx 1
= q ,
dy 1
−1
C 2 y2
cuja solução é
r
1
x + C1 = − − y2 , (1.82)
C2
onde C1 é uma constante de integração. Quadrando a expressão acima chegamos
à equação de uma circunferência de raio 1/C e centro no ponto de coordenadas
(−C1 , 0).
A trajetória da luz nas proximidades do horizonte de eventos de um buraco
negro é um arco de circunferência, compatı́vel com a idéia de que a luz não
pode “escapar” do buraco negro. Um fenômeno semelhante ocorre quando há
um aquecimento desigual do ar próximo à superfı́cie. Como o ı́ndice de refração
do ar depende da temperatura local do ar, a não-uniformidade da velocidade
da luz leva, assim como no caso do buraco negro, a uma pequena curvatura
dos raios de luz próximo à superfı́cie do mar ou do gelo. Esse fenômeno leva ao
aparecimento de um certo tipo de miragem conhecido como fata morgana, carac-
terizada pelo aparecimento de imagens bastante distorcidas de objetos situados
próximo ao horizonte como ilhas ou navios, que parecem flutuar (a famosa lenda
do “holandês voador” é baseada nesse tipo de miragem).
1.3.3 Princı́pio de Hamilton

Uma das consequências mais importantes dos métodos variacionais para a fı́sica
foi a construção, feita por Lagrange, de uma nova formulação para a mecânica
Newtoniana, a partir do princı́pio de mı́nima ação de Maupertuis, e finalmente
consolidada em 1788 com a publicação de sua obra Mécanique Analytique. Nesse
formalismo, a variável independente é o tempo t e trabalhamos com as coorde-
nadas generalizadas de um sistema qi , i = 1, 2, . . . n e as respectivas velocidades
generalizadas q̇i = qit = dqi /dt. Uma partı́cula no espaço, por exemplo, pode ter
como coordenadas generalizadas as componentes do seu vetor posição: q1 = x,
q2 = y, e q3 = z; mas outras escolhas são possı́veis.
A energia cinética é, em geral, uma função das velocidades generalizadas,
enquanto a energia potencial usualmente depende das coordenadas generaliza-
das e/ou do tempo. Neste formalismo ocupa papel central a Lagrangeana do
sistema, igual à diferença entre as energias cinética e potencial L(qi , q̇i , t). O
princı́pio variacional (de Hamilton) da mecânica diz que a trajetória de um sis-
tema entre dois pontos fixos em t = t1 e t = t2 , é aquela que torna estacionária
a seguinte integral de ação
Z t2
J= L(qi , q̇i , t)dt, (1.83)
t1
que é um problema variacional com uma variável independente e n dependentes,

e que implica resolvermos n equações de Euler da forma (1.76):

∂L d ∂L
− = 0, (i = 1, 2, . . . n) (1.84)
∂qi dt ∂ q̇i
chamadas, no presente contexto, de equações de Lagrange.
Partı́cula num campo de forças conservativas

Um problema fundamental em dinâmica consiste no movimento de uma partı́cula
de massa m no espaço tridimensional, sujeita a uma energia potencial V (x, y, z)
conhecida, a partir da qual podemos obter uma força conservativa como F =
−∇V . As coordenadas generalizadas serão x, y, z e as velocidades generalizadas
ẋ, ẏ, ż, com as quais formamos a energia cinética
1
K= m ẋ2 + ẏ 2 + ż 2 ,
2
tal que a Lagrangeana será
1
L(x, y, z; ẋ, ẏ, ż) = K − V = m ẋ2 + ẏ 2 + ż 2 − V (x, y, z).
2
As equações de Lagrange (1.84) serão

∂L d ∂L dV d
− = − − (mẋ) = Fx − mẍ = 0, (1.85)
∂x dt ∂ ẋ dx dt

∂L d ∂L dV d
− = − − (mẏ) = Fy − mÿ = 0, (1.86)
∂y dt ∂ ẏ dy dt

∂L d ∂L dV d
− = − − (mż) = Fx − mz̈ = 0, (1.87)
∂z dt ∂ ż dz dt
vertical
θ
z
y
centro de massa
Mg
ψ x
φ
linha nodal
Figura 1.7: Pião simétrico pesado.
ou seja, nada mais do que as três componentes da equação Newtoniana do

movimento F = mr̈.
Pião simétrico pesado

Um pião que executa uma rotação uniforme em torno de um eixo de simetria
que passa tanto pelo seu centro de massa como pelo seu ponto fixo de apoio
pode ser descrito por apenas três coordenadas generalizadas, que são os três
ângulos de Euler. Considerando o eixo de simetria o eixo z fixo no corpo, esses
ângulos são [Fig. 1.7]:
• q1 = θ: mede a inclinação do eixo z do corpo em relação ao eixo vertical
fixo no espaço;
• q2 = φ: mede o azimute do pião em relação à vertical
• q3 = ψ: é o ângulo de rotação do pião em relação ao seu eixo de simetria.
As velocidades generalizadas correspondentes são
• q̇1 = θ̇: velocidade de nutação, ou seja, a rapidez da oscilação do eixo de
simetria z do pião em relação ao eixo vertical fixo no espaço;
• q̇2 = φ̇: velocidade de precessão, que é a rapidez da rotação do eixo de
simetria z do pião em torno do eixo vertical fixo no espaço;
• q̇3 = ψ̇: velocidade de rotação do pião em relação ao seu eixo z de simetria.
A energia cinética de rotação do pião é dada, em geral, por
1 1 1
K= I1 ω12 + I2 ω22 + I3 ω32 ,
2 2 2
onde I1 , I2 e I3 são os valores principais do tensor de inércia do pião, que definem

eixos principais do espaço, e para os quais as as componentes correspondentes
da velocidade angular de rotação são ω1 , ω2 e ω3 , respectivamente. A relação
entre elas e as velocidades generalizadas é dada por [veja [2], Cap. 4, Sec. 4.9]:
ω1 = φ̇ sin θ sin ψ + θ̇ cos ψ, (1.88)

ω2 = φ̇ sin θ cos ψ − θ̇ sin ψ, (1.89)
ω3 = φ̇ cos θ + ψ̇ (1.90)
Sendo o pião simétrico, temos que I1 = I2 6= I3 . Combinando essa in-

formação com as equações acima, obtemos para a energia cinética do pião:
I1 2 I
3
2
K(qi , q̇i ) = θ̇ + φ̇2 sin2 θ + ψ̇ + φ̇ cos θ (1.91)
2 2
Além disso, denotando por ℓ a distância entre o centro de massa do pião de
massa M e o ponto de apoio, a sua energia potencial gravitacional é
V (q1 ) = M gz = M gℓ cos θ, (1.92)
de modo que a Lagrangeana é
I1 2 I
3
2
L= θ̇ + φ̇2 sin2 θ + ψ̇ + φ̇ cos θ − M gℓ cos θ, (1.93)
2 2
As equações de Lagrange serão

∂L d ∂L
− = I1 φ̇2 sin θ cos θ − I3 φ̇ sin θ(ψ̇ + φ̇ cos θ) − I1 θ̈ = 0,
(1.94)
∂θ dt ∂ θ̇

∂L d ∂L d h i
− = − I3 ψ̇ + φ̇ cos θ = 0, (1.95)
∂ψ dt ∂ ψ̇ dt

∂L d ∂L d h i
− = − I1 φ̇ sin2 θ + I3 cos θ ψ̇ + φ̇ cos θ = 0, (1.96)
∂φ dt ∂ φ̇ dt
De (1.95) e (1.96) obtemos, imediatamente, que

I3 ψ̇ + φ̇ cos θ = a, (1.97)
I1 φ̇ sin2 θ + a cos θ = b, (1.98)
onde a e b são constantes de integração.

Podemos isolar φ̇ em (1.98) e substituir em (1.97), isolando, por sua vez,
ψ̇. Ao substituir ambas as derivadas em (1.94) podemos obter uma equação da
forma θ̈ = F(θ), onde F é uma função complicada de θ, apenas. Entretanto,
não é possı́vel efetuar a quadratura que fornece θ como função do tempo, o
que poderia fornecer posteriormente φ(t) e ψ(t). Ao invés de tentar resolver
diretamente as equações de movimento, usualmente estudamos o problema do
pião pesado simétrico usando a equação da energia do sistema para obter um
problema unidimensional reduzido. Detalhes desse procedimento podem ser
encontrados em [2], Cap. 5, Sec. 5.7.
1.4 Uma variável dependente e várias variáveis

independentes
1.4.1 Equação de Euler
Seja y uma variável dependente e n variáveis independentes x1 , x2 , · · · xn . A de-
rivada de y em relação a cada uma delas será denotada yj = ∂y/∂xj . Neste caso
não deve haver confusão com a notação correspondente quando houver várias
variáveis dependentes. Os pontos fixos em relação a cada variável independente
(1) (2) (1) (2) (1) (2)
serão indicados por (x1 , x1 ), (x2 , x2 ). . ., (xn , xn ). Para evitar uma so-
brecarga inútil na notação, indicaremos estes pontos fixos simplesmente por 1 e
2, ficando subentendido seu significado quando do seu emprego.
Dessa forma, a função f (y, yj , xj ) é o integrando do funcional que se quer
tornar estacionário
Z 2 Z 2 Z 2
J= dx1 dx1 · · · dxn f (y, yj , xj ) (1.99)
1 1 1
O problema variacional será, pois, o de encontrar a função de n variáveis
y(x1 , x2 , . . . xn ) para a qual δJ = 0, considerados os pontos fixos, onde o sı́mbolo
de variação é definido como

∂J
δJ = dα, (1.100)
∂α α=0
com o auxı́lio do parâmetro variacional α.
A parametrização a ser introduzida é a mesma dos casos anteriores, ou seja,
y(xj , α) = y(xj .0) + αη(xj ) (1.101)
onde y(xj , 0) indica o caminho que torna J um extremo e η é uma função
diferenciável e que se anula nos pontos fixos: η(1) = η(2) = 0.
Diferenciando o funcional (1.99) em relação a α
Z 2 Z 2 Z 2
∂J ∂f
= dx1 dx2 · · · dxn
∂α 1 1 1 ∂α
 
Z 2 Z 2 Z 2 n
∂f ∂y X ∂f ∂y j
= dx1 dx2 · · · dxn  +
1 1 1 ∂y ∂α j=1 ∂yj ∂α
 
Z 2 Z 2 Z 2 n
∂f X ∂f
= dx1 dx2 · · · dxn  η + ηj 
1 1 1 ∂y j=1
∂yj
Z 2 Z 2 Z 2
∂f
= dx1 dx2 · · · dxn η + (1.102)
1 1 1 ∂y
n Z 2 Z 2 Z 2 Z 2 Z 2
X ∂f
+ dx1 dx2 · · · dxj ηj dxj+1 · · · dxn
j=1 1 1 1 ∂yj 1 1
| {z }
=I
Integrando por partes o fator I na expressão acima temos

Z 2 Z 2 2 Z 2
∂f ∂f ∂η ∂η d ∂f
dxj ηj = dxj = η − η dxj
1 ∂yj 1 ∂yj ∂xj ∂xj 1 dxj ∂yj
| {z }1
=0
1.4. UMA VARIÁVEL DEPENDENTE E VÁRIAS VARIÁVEIS INDEPENDENTES27
tal que
Z Z 2 Z 2
∂J 2 ∂f
dx1 dx2 · · · dxn η +
∂α 1 1 1 ∂y
n Z 2 Z 2 Z 2
X d ∂f
+ dx1 dx2 · · · dxn η dxj
j=1 1 1 1 dxj ∂yj
 
Z 2 Z 2 Z 2 n
∂f X d ∂f
= dx1 dx2 · · · dxn η  − .
1 1 1 ∂y j=1 dxj ∂yj
Calculando a derivada de J ao longo do caminho ótimo

 
Z 2 Z 2 Z 2 n
∂J ∂f X d ∂f 
= dx1 dx2 · · · dxn η  − =0
∂α α=0 1 1 1 ∂y i j=1
dx j ∂y j
| {z }
=0
(1.103)
para η(xj ) arbitrárioss, o que nos leva à equação de Euler para várias variáveis
dependentes
n
∂f X d ∂f
− =0 (1.104)
∂y j=1 dxj ∂yj
1.4.2 Equação de Laplace

Do eletromagnetismo, sabemos que a densidade de energia num campo elétrico
no vácuo E é dada por
1
u = ǫ 0 E2 (1.105)
2
Se o campo for eletrostático, pode ser escrito como menos o gradiente de um
potencial E = −∇Φ, tal que
1 2
u(x, y, z) = ǫ0 |∇Φ| (1.106)
2
Consideremos um paralelepı́pedo de arestas x2 − x2 , y2 − y1 , e z2 − z1 .
Se impusermos que a energia eletrostática encerrada numa região fechada de
volume V seja mı́nima, isso equivale a achar um extremo do funcional
Z Z x2 Z y2 Z z 2
2
J= d3 r|∇Φ| = dx dy dz (Φ2x + Φ2y + Φ2z ), (1.107)
V x1 y1 z1 | {z }
≡f
onde Φx = ∂Φ/∂x, etc.

De (1.104), o potencial que satisfaz essa condição é a solução de
∂f d ∂f d ∂f d ∂f
− − − = 0,
∂Φ dx ∂Φ x dy ∂Φ y dz ∂Φ
|{z} | {z } | {z } | {zz}
=0 =2Φx =2Φy =2Φz
−2(Φxx + Φyy + Φzz ) = 0,

que é a equação de Laplace ∇2 Φ = 0.
1.5 Várias variáveis independentes e dependen-

tes
A generalização final do problema variacional consiste em consideraremos uma
função de n variáveis dependentes yi , i = 1, 2, . . . n, e n variáveis independentes
xj , j = 1, 2, . . . n, bem como das respectivas n2 derivadas jacobianas yij ≡
dyi /dxj :
f = f (y1 , . . . un ; y11 , . . . ynn ; x1 , . . . xn ),
que é o integrando de um funcional integral n-dimensional, sendo os pontos fixos
(1) (2) (1) (2)
(x1 , x1 ), . . ., (xn , xn ):
(2) (2)
Z x1 Z x2 Z x(2)
n
J= dx1 dx2 · · · dxn f (yi , yij , xj ). (1.108)
(1) (1) (1)
x1 x2 xn
O problema variacional consiste em encontrar as n funções yi (xj ) para

as quais J é estacionária, ou δJ = 0. O desenvolvimento matemático dessa
condição é semelhante ao efetuado no caso anterior, com a diferença que nós
consideramos agora n variáveis dependentes, e cada uma delas deverá satisfazer
uma equação de Euler. Caso as variáveis xj sejam independentes entre si, a
função f deve satisfazer o seguinte conjunto de n equações de Euler:
n
∂f X ∂ ∂f
− = 0. (i = 1, 2, . . . n) (1.109)
∂yi j=1 ∂xj ∂yij
Esta situação bastante geral pode ocorrer em problemas variacionais com vı́nculos,
como se verá a seguir.
1.6 Problemas variacionais com vı́nculos

É comum que as variáveis xj não sejam, de fato, independentes entre si, mas
sim estejam “amarradas” por alguma relação de vı́nculo. A existência desses
vı́nculos leva à introdução dos chamados multiplicadores de Lagrange. Antes
de abordar o problema variacional propriamente dito, vamos estudar esse pro-
blema sob o ponto de vista da determinação de máximos e mı́nimos no cálculo
diferencial.
1.6.1 Vı́nculos e multiplicadores de Lagrange

Considere uma função de três variáveis independentes f (x, y, z). Se ela tem um
extremo, então
∂f ∂f ∂f
df = dx + dy + dz = 0, (1.110)
∂x ∂y ∂z
tal que é necessário e suficiente que, para dx, dy e dz arbitrários, tenhamos
∂f ∂f ∂f
= = = 0. (1.111)
∂x ∂y ∂z
1.6. PROBLEMAS VARIACIONAIS COM VÍNCULOS 29
No entanto, se x, y e z estiverem “amarrados” por uma dada relação na

forma geral
ϕ(x, y, z) = 0,
dita “vı́nculo”, então as variáveis não são mais independentes entre si, pois
podemos, em princı́pio, exprimir uma delas, como z, em função das outras
duas: z = z(x, y), de modo que, ainda que dx e dy sejam arbitrários, dz não é
mais arbitrário. Logo, a condição (1.111) para que f tenha um extremo não é
mais válida, em geral.
Para contornar esse problema, observamos que, como dϕ = 0, podemos
introduzir um escalar λ, dito multiplicador de Lagrange, tal que
df + λdϕ = 0. (1.112)
Aplicando diferenciais totais temos que a relação acima implica em

∂f ∂ϕ ∂f ∂ϕ ∂f ∂ϕ
+λ dx + +λ dy + +λ dz = 0 (1.113)
∂x ∂x ∂y ∂y ∂z ∂z
Até agora o multiplicador de Lagrange é um escalar qualquer. No entanto,

nós o escolhemos de tal sorte que
∂f ∂ϕ
+λ = 0, (ϕz 6= 0) (1.114)
∂z ∂z
já que, agora, dz não é mais arbitrária devido ao vı́nculo. Logo

∂f ∂ϕ ∂f ∂ϕ
+λ dx + +λ dy = 0 (1.115)
∂x ∂x ∂y ∂y
Lembremos, porém, que dx e dy ainda são arbitrários, de modo que a igualdade

acima vale se e somente se
∂f ∂ϕ
+λ = 0, (1.116)
∂x ∂x
∂f ∂ϕ
+λ = 0. (1.117)
∂y ∂y
Logo, se as condições (1.116)-(1.114) forem satisfeitas, então df = 0 e f é um

extremo. Por tabela, também podemos obter, se o quisermos, o multiplicador
de Lagrange (às vezes isso nem é realmente necessário).
Podemos generalizar a presente discussão para um número n qualquer de
variáveis “independentes” (x1 , x2 , . . . xn ) sujeitas a m vı́nculos, descritos pelas
equações
ϕk (x1 , x2 , . . . xn ) = 0, (k = 1, 2, . . . m). (1.118)
Neste caso, as condições (1.116)-(1.114) são generalizadas na seguinte forma
m
∂f X ∂ϕk
+ λk = 0, (i = 1, 2, . . . n) (1.119)
∂xi ∂xi
k=1
que, também, determinam os m multiplicadores de Lagrange λk , um para cada

vı́nculo do sistema.
1.6.2 Exemplos de vı́nculos

O problema da lata de leite condensado
Um fabricante de leite condensado deseja produzir uma lata cilı́ndrica de raio r
e altura h que acondicione um volume dado V0 do seu produto:
V (r, h) = (πr2 )h = V0 = constante. (1.120)
Em princı́pio, as variáveis r e h são independentes entre si, ou seja, se o fabri-

cante quiser uma lata mais estreita (r menor), então ela deverá ser necessaria-
mente mais alta (h maior), e vice-versa.
No entanto, para cada escolha que for feita de r e h a área S da superfı́cie
da lata será diferente.
S(r, h) = (2πr)h + 2(πr2 ) (1.121)
Como o custo de fabricação da lata é proporcional à área da superfı́cie, o
fabricante naturalmente deseja minimizar a função S(r, h) sujeita ao vı́nculo
V (r, h) = V0 . A condição de vı́nculo será, então
ϕ(r, h) = πr2 h − V0 = 0. (1.122)
Introduzindo o multiplicador de Lagrange λ teremos duas condições para

um extremo na forma (1.116)-(1.114), a saber:
∂S ∂ϕ
+λ = 2πh + 4πr + λ(2πr)h = 0, (1.123)
∂r ∂r
∂S ∂ϕ
+λ = 2πr + λ(πr2 ) = 0 (1.124)
∂h ∂h
De (1.124) obtemos o multiplicador de Lagrange λ = −2/r que, substituido em
(1.123), fornece h = 2r, ou seja, o cilindro de menor área superficial, para um
dado volume, tem o diâmetro igual à altura.
Elétron numa caixa tridimensional

Um problema elementar em mecânica quântica consiste em achar os nı́veis de
energia de uma partı́cula quanto-mecânica de massa m, como um elétron, dentro
de uma caixa de paredes impenetráveis, na forma de um paralelepı́pedo de
arestas a, b e c. A partir da equação de Schrödinger independente do tempo,
com as condições de contorno apropriadas (a função de onda tem nós nas paredes
da caixa), pode-se mostrar que a energia do estado fundamental é dada por

h2 1 1 1
E(a, b, c) = + 2+ 2 . (1.125)
8m a2 b c
Desejamos encontrar os valores de a, b e c que minimizam a energia do

elétron, sujeito ao vı́nculo de que o volume V0 da caixa seja dado:
V (a, b, c) = abc = V0 , (1.126)
de modo que a equação de vı́nculo é
ϕ(a, b, c) = abc − V0 = 0 (1.127)

correspondente a um multiplicador de Lagrange λ.

As condições de mı́nimo para a energia são, portanto
∂E ∂ϕ h2
+λ = − + λbc = 0, (1.128)
∂a ∂a 4ma3
∂E ∂ϕ h2
+λ = − + λac = 0, (1.129)
∂b ∂b 4mb3
∂E ∂ϕ h2
+λ = − + λab = 0. (1.130)
∂c ∂c 4mc3
Multiplicando (1.128) por a, (1.129) por b, e (1.130) por c, chegamos à
seguinte relação
h2 h2 h2
λabc = 3
= 3
= ,
4ma 4mb 4ma3
que é identicamente satisfeita se a = b = c, ou seja, o paralelepı́pedo reduz-se a
um cubo de aresta a. O multiplicador de Lagrange é λ = h2 /4ma5 .
1.6.3 Equações de Euler com vı́nculos

Vamos retornar à equação de Euler (1.109) para várias variáveis dependentes e
independentes, no caso em que haja m vı́nculos expresos pela forma geral
ϕk (y1 , y2 , . . . yn ; x1 , x2 , . . . xn ) = 0, (k = 1, 2, . . . m) (1.131)
de sorte que yi e xi não são mais mutuamente independentes, como presu-
mimos até agora. Assim como no caso dos problemas de extremos no cálculo
usual, para cada equação de vı́nculo introduzimos um multiplicador de Lagrange
λk (x1 , . . . xn ).
Multiplicando (1.131) pelos multiplicadores de Lagrange e integrando entre
os pontos fixos 1 e 2 temos
Z 2
λk (xj )ϕk (yi , xj )dxj = 0, (1.132)
1
tal que a variação correspondente seja também identicamente nula para cada
vı́nculo Z 2
δ λk (xj )ϕk (yi , xj )dxj = 0, (k = 1, 2, . . . m). (1.133)
1
Por outro lado, sabemos que também é nula a variação do funcional (1.108)
Z 2
δ f (yi , yij , xj )dxj = 0. (1.134)
1
Somando (1.134) e (1.133) para todos os m vı́nculos temos que

Z 2" m
X
#
δ f (yi , yij , xj ) + λk (xj )ϕk (yi , xj ) dxj = 0, (1.135)
1 k=1
| {z }
≡g(yi ,yij ,xj )
onde definimos
m
X
g(yi , yij , xj ) = f (yi , yij , xj ) + λk (xj )ϕk (yi , xj ). (1.136)
k=1
y(x)
−a 0 a x
Figura 1.8: O problema isoperimétrico.
Portanto, na presença dos vı́nculos, (1.135) implica em que precisamos sa-

tisfazer n equações de Euler do tipo (1.109) para a nova função (1.136):
n
∂g X ∂ ∂g
− = 0. (i = 1, 2, . . . n) (1.137)
∂yi j=1 ∂xj ∂yij
O problema isoperimétrico
Um dos mais famosos problemas variacionais com vı́nculo é o isoperimétrico,
também chamado “problema de Dido”: dentre todas as curvas de um dado
comprimento ℓ no semi-plano superior, ligando dois pontos fixos 1 : (−a, 0) e
2 : (a, 0), encontrar a curva que, juntamente com o intevalo [−a, a], envolve a
maior área possı́vel [Figura 1.8].
A área sob a curva y(x)
Z a
A(y, x) = ydx, (1.138)
−a
é o funcional que se quer maximizar, entre os pontos fixos, sujeito à condição

de que o comprimento seja constante:
Z 2 Z ap
ds = 1 + yx2 dx = ℓ (1.139)
1 −a
onde usamos (1.23).

Este vı́nculo leva-nos a introduzir um único (m = 1) multiplicador de La-
grange λ, de modo que a condição de vı́nculo pode ser escrita na forma padrão
(1.132) desde que definamos
p ℓ
ϕ(yx ) = 1 + yx2 − , (1.140)
2a
assim como a função (1.136) é dada por

p
2
ℓ
g = f + λϕ = y + λ 1 + yx − , (1.141)
2a
que satisfaz a equação de Euler (1.137):

∂g d ∂g
− = 0
∂y dx ∂yx
! !
d λyx d λyx
1− p = x− p = 0
dx 1 + yx2 dx 1 + yx2
λyx
p −x = C = constante.
1 + yx2
Isolando a derivada yx chegamos à seguinte equação diferencial
dy C +x
=q , (1.142)
dx 2
λ2 − (C + x)
que pode ser integrada fornecendo

2 2
(x + C) + (y + C1 ) = λ2 (1.143)
onde C1 é uma constante de integração. Essa é a equação de um cı́rculo de raio
λ e com centro no ponto de coordenadas (C, C1 ). Os pontos fixos (−a, 0) e (a, 0)
devem pertencer a esse cı́rculo. Como, por simetria, o centro do cı́rculo deve
estar na origem (veja a Fig. 1.8), temos que C = C1 = 0 e o raio do cı́rculo é
λ = a, tal que a equação do cı́rculo seja simplesmente
x 2 + y 2 = a2 . (1.144)
O problema isoperimétrico tem uma história curiosa, remontando à Grécia
antiga, quando a Rainha Dido fundou a cidade de Cartago. Por motivos belico-
sos, Dido fez uma barganha com o senhor local, que concordou (ingenuamente)
em dar a ela tanta terra quanto ela pudesse envolver com um pelego de boi. A
esperta Rainha instruiu seus seguidores a cortar o pelego em fitas muito finas
e atá-las uma à outra, de modo que ela pôde envolver uma área muito grande
de terra em frente ao Mar Mediterrâneo, que tornou-se a cidade de Cartago.
Os gregos antigos já sabiam que o arco de cı́rculo era a solução do problema
isoperimétrico.
A catenária
Uma corrente ou cabo pesado de comprimento C está suspenso num plano
vertical entre os pontos de coordenadas 1 : (0, a) e 2 : (L, b) [Fig. 1.9], tal
que sua forma seja descrita pela função y(x), escolhida de forma a minimizar a
energia potencial. Seja ρ = dm/ds a densidade de massa do cabo. A energia
potencial do cabo será
Z 2 Z 2 Z 2
V (y, yx ) = dV = dmgy = ρg yds, (1.145)
1 1 1
onde usamos (1.22), e usamos o sı́mbolo g para representar a aceleração da

gravidade, a fim de que não haja confusão notacional. Assim, o funcional que
desejamos minimizar é
Z L
V p
J= = dxy 1 + yx2 , (1.146)
ρg 0
0 x
L
Figura 1.9: Catenária.
p
cujo integrando é f = y 1 + yx2 .
O vı́nculo nesse problema é que a corda é suposta inextensı́vel, de modo que
o seu comprimento seja constante 2 :
Z 2 Z L p
ℓ= ds = dx 1 + yx2 , (1.147)
1 0
que pode ser colocada na forma (1.132) desde que

p ℓ
ϕ(yx ) = 1 + yx2 − (1.148)
L
tal que, introduzindo o multiplicador de Lagrange, a expressão (1.136) fica
p λℓ
g = f + λϕ = (y + λ) 1 + yx2 − . (1.149)
L
Como a função g não depende explicitamente da variável independente x po-
demos, ao invés da equação de Euler (1.137), empregar a identidade de Beltrami
(1.15):
∂g
g − yx = C = constante
∂y
p λℓ yx
(y + λ) 1 + yx2 − − yx (y + λ) p =
L 1 + yx2
Fazendo k ≡ CL + λℓ, um pouco de álgebra mostra que a expressão anterior

reduz-se à equação diferencial
q
dy 1 2
= L2 (y + λ) − k 2 (1.150)
dx k
2 Supondo que a densidade de massa seja constante ao longo do cabo, ρ = M/ℓ, onde M é
a sua massa total.

que tem como solução a equação da catenária 3

k L(x + K)
y(x) = cosh −λ (1.151)
L k
onde K é uma nova constante de integração. O nome catenária vem do latim
catena, que significa cadeia, ou corrente. Galileo, erroneamente, considerava
que a solução do problema seria uma parábola. Curiosamente, se uma parábola
rolar por uma reta, o foco da parábola descreverá uma catenária. Em 1691 a
equação da catenária foi obtida independentemente por Leibniz, Huyghens e
Johann Bernoulli, em resposta a um desafio (sempre ele!) de Jakob Bernoulli.
Vimos, anteriormente, que a catenária também é a solução do problema de
superfı́cies de revolução de mı́nima área.
Na solução (1.151) temos, ao todo, três constantes indeterminadas: C, K, e
o multiplicador de Lagrange λ (observe que não foi necessário determinar o valor
de λ para resolver o problema!). Para determinar essas constantes, aplicamos
(1.151) aos pontos fixos:

k LK
y(0) = a ⇒ a + λ = cosh , (1.152)
L k

k L(L + K)
y(L) = b ⇒ b + λ = cosh , (1.153)
L k
além de usarmos novamente a condição de vı́nculo (1.147):
Z L p Z L
L(x + K)
ℓ = dx 1 + yx2 = dx cosh ,
0 0 k

ℓL L(L + K) LK
= sinh − sinh . (1.154)
k k k
O conjunto de equações (1.152)-(1.154) determina implicitamente as constantes
procuradas (lembrando que k = CL + λℓ).
1.6.4 Problemas mecânicos com vı́nculos

O formalismo anteriormente descrito pode ser aplicado imediatamente a siste-
mas mecânicos onde há m vı́nculos holonômicos, ou seja, vı́nculos cujas equações
podem ser escritos como
ϕk (q1 , q2 , . . . qn , t) = 0, (k = 1, 2, . . . m), (1.155)
onde qi são as coordenadas generalizadas. Por exemplo, o movimento plano de
uma partı́cula cuja trajetória é restrita a um cı́rculo de centro na origem e raio
R é caracterizado pelo seguinte vı́nculo holonômico:
x2 + y 2 = R 2 ⇒ ϕ = q12 + q22 − R2 = 0. (1.156)
Para cada equação de vı́nculo associamos um multiplicador de Lagrange
λk (t), com os quais formamos o equivalente mecânico da função (1.136), que é
m
X
g(qi , q̇i , t) = L(qi , q̇i , t) + λk (t)ϕk (qi , t), (1.157)
k=1
3 Podemos fazer a integração por meio da substituição de variáveis L(y + λ) = k cosh θ.
r
x θ
h
l−x
ψ
Figura 1.10: Aro rolando num plano inclinado.
que satisfaz a equação de Euler-Lagrange na forma (1.137):

∂g d ∂g
− = 0
∂qi dt ∂ q̇i
m
∂L X ϕk (qi , t) d ∂L
− λk (t) − = 0
∂qi ∂qi dt ∂ q̇i
k=1
que podemos reescrever, definindo ϕki = ∂ϕk /∂qi , como

m
d ∂L ∂L X
− = ϕki λk . (1.158)
dt ∂ q̇i ∂qi
k=1
Por curiosidade, se a coordenada generalizada qi tiver dimensão de comprimento,

então o produto λk ϕki representa a componente ao longo da direção qi da força
do reação correspondendo ao k-ésimo vı́nculo.
Aro rolando num plano inclinado

Um problema clássico de vı́nculo holonômico em dinâmica lagrangeana é o de
um aro de massa M e raio r rolando sem deslizar sobre um plano inclinado
de ψ em relação à horizontal. Podemos usar, como coordenadas generalizadas,
q1 = x: distância percorrida pelo aro sobre o plano inclinado, e q2 = θ: ângulo
de rotação do aro em relação ao eixo que passa pelo seu centro de massa [Fig.
1.10]. A condição de vı́nculo impõe que o elemento de arco percorrido pelo aro
é o mesmo elemento de distância ao longo do plano, ou seja rdθ = dx, que
podemos escrever como
ϕ(x, θ) = rθ − x = 0, (1.159)
Tiramos, então, os coeficientes de vı́nculo:
∂ϕ ∂ϕ
ϕx = = −1, ϕθ = = r, (1.160)
∂x ∂θ
ambos associados ao mesmo multiplicador de Lagrange λ.

A energia cinética do aro é igual à energia de translação do centro de massa
mais a energia cinética de rotação em torno do eixo que passa pelo centro de
massa
1 1
K(ẋ, θ̇) = M ẋ2 − I θ̇2 , (1.161)
2 2
onde o momento de inércia do aro é I = M r2 . A energia potencial gravitacional
do centro de massa do aro é
U (x) = M gh = M g[(ℓ − x) sin ψ + r cos ψ], (1.162)
onde ℓ é o comprimento total do plano inclinado [Fig. 1.10]. Como o termo
M gr cos ψ é uma constante, ele pode ser ignorado, pois representa apenas um
fator constante aditivo na energia potencial (que, lembramos, é sempre definida
a menos de uma constante aditiva). Logo, a Lagrangeana é
1 1
L=K −U = M ẋ2 − M r2 θ̇2 − M g(ℓ − x) sin ψ. (1.163)
2 2
Há duas equações de Euler-Lagrange da forma (1.158):

d ∂L ∂L d
− − ϕx λ = = (M ẋ) − M g sin ψ + λ = 0,
dt ∂ ẋ ∂x dt

d ∂L ∂L d
− − ϕθ λ = = (M r2 θ̇) − rλ = 0.
dt ∂ θ̇ ∂θ dt
Como r é constante, então há duas equações diferenciais a serem resolvidas
M ẍ − M g sin ψ = −λ, (1.164)
M r2 θ̈ = λr. (1.165)
Da equação de vı́nculo (1.159) ẍ = rθ̈ que, substituido em (1.165), fornece
M ẍ = λ. Pondo esse resultado em (1.164) temos que o multiplicador de La-
grange é
1
λ = M g sin ψ, (1.166)
2
tal que a equação do movimento sejam simplesmente
g sin ψ
ẍ = ≡ K1
2
g sin ψ K1
θ̈ = =
2r r
Supondo que, em t = 0, tenhamos as condições iniciais x(0) = 0, ẋ(0) = 0
(aro no alto do plano inclinado em repouso) e θ(0) = 0, θ̇(0) = 0 as equações
acima têm soluções triviais
1 1 K1 2
x(t) = K1 t 2 , θ(t) = t . (1.167)
2 2 r
Observe que o aro desce o plano inclindado rolando sem deslizar com aceleração
K1 , que é a metade da aceleração que ele teria se deslizasse em rolar por um
plano sem atrito (como uma partı́cula, portanto). Logo, o atrito é responsável
pelo rolamento do aro, e o multiplicador de Lagrange λ, que é a força de vı́nculo
é, na verdade, a força de atrito de rolamento.
θ R
0 x
Figura 1.11: Conta deslizando sobre uma calota hemisférica.
Conta deslizando sobre uma calota

Vamos considerar uma calota hemisférica de raio R com centro na origem [Fig.
1.11] e uma conta de massa m que desliza sobre a mesma tal que sua posição
pode ser especificada pelas coordenadas polares (r, θ) (a conta pode deixar a
calota, de modo que r não é constante), que serão as coordenadas generalizadas
do problema [[3], pg. 1068]. A Lagrangeana correspondente é
1
L(r, θ; ṙ, θ̇) = m(ṙ2 + r2 θ̇2 ) − mgr cos θ. (1.168)
2
Enquanto a conta está deslizando sobre a calota, a condição de vı́nculo é r = R,
ou ϕ(r) = r − R = 0, de sorte que os coeficientes de vı́nculo são
∂ϕ ∂ϕ
ϕr = = 1, ϕθ = = 0, (1.169)
∂r ∂θ
As equações de Euler-Lagrange (1.158) são

d ∂L ∂L d
− − ϕr λ = (mṙ) − mrθ̇2 + mg cos θ − λ(θ) = 0(1.170)
dt ∂ ṙ ∂r dt

d ∂L ∂L d
− − ϕθ λ = (mr2 θ̇) − mgr sin θ = 0 (1.171)
dt ∂ θ̇ ∂θ dt
Enquanto a conta desliza sobre a calota r = R, portanto ṙ = 0, de modo que
−mRθ̇2 + mg cos θ − λ(θ) = 0 (1.172)
mR2 θ̈ − mgR sin θ = 0 (1.173)
Derivando (1.172) em relação ao tempo
dλ
−2mRθ̇θ̈ − mg θ̇ sin θ = θ̇ (1.174)
dθ
e dividindo tudo por θ̇ obtemos
g sin θ
θ̈ = (1.175)
R
1.7. PROBLEMAS 39
que, substituido em (1.174), fornece por integração o multiplicador de Lagrange
λ(θ) = 3mg cos θ + C (1.176)
onde C é uma constante de integração.

O multiplicador de Lagrange é a componente radial da força de reação da
calota agindo sobre a conta. Quando a conta está no alto da calota (θ = 0) essa
força é igual ao peso da conta mg. Portanto a constante de integração é dada
por C = λ(0) − 3mg = −2mg, de forma que λ(θ) = mg(3 cos θ − 2). A partı́cula
permanecerá sobre a calota desde que λ(θ) > 0, ou seja, ela deixará a calota
quando cos θ = 2/3, que fornece o ângulo crı́tico θc = 48o 11′ .
1.7 Problemas
1. Encontre a função y(x) que torna a integral
Z 1
J= (2x + 3y + yx2 )dx
0
um extremo, com y(0) = y(1) = 1.
2. Mostre que o caminho no espaço tridimensional que fornece a menor distância

entre dois pontos quaisquer é um segmento de reta unindo estes dois pontos.
3. Considere o problema da braquistócrona, mas ao invés de uma partı́cula consi-

dere uma esfera de mesma massa e raio a rolando sem deslizar (mas com atrito
desprezı́vel). Ache a forma da trajetória que minimiza o tempo de percurso.
4. Mostre que a ciclóide é uma tautócrona, por meio dos seguintes passos:
p
(a) dt = a/gdθ, onde a = k2 /2;
(b) O tempo decorrido para uma partı́cula sem atrito se deslocar do ponto de
coordenadas (0, 0), ou seja, tal que θ = 0, até o ponto mais baixo da trajetória
(onde θ = π, correspondendo a meio ciclo da ciclóide), é
r
a
T12 = π;
g
(b) O tempo decorrido para uma partı́cula se deslocar do ponto genérico (x0 , y0 ),
ou seja, tal que θ = θ0 , até o ponto mais baixo da trajetória, é
sin θ2
r Z π
a
T32 = dθ;
g θ0
q
cos2 θ0 − cos2 θ

2 2
(c) Usando a substituição de variável u = cos(θ/2)/ cos(θ0 /2), T32 = T12 , inde-
pendentemente do valor de θ0 (ponto inicial).
5. Mostre que a superfı́cie mı́nima de revolução também é uma catenóide mesmo

quando o eixo de rotação é y ao invés de x.
6. Estude a existência das soluções de Goldschmidt para o problema da superfı́cie

mı́nima entre dois cı́rculos de raio y0 cujos centros têm coordenadas (±x0 , 0), por
meio das seguintes etapas [Veja http://mathworld.wolfram.com/SurfaceofRevolution.
html e [3], pgs. 1048 e 1049]:
(a) Substituindo (1.46) em (1.40), mostre que a área da catenóide será

2x0 2x0
A = πa2 sinh + ;
a a
(b) Considere, por exemplo, o caso onde x0 = 0, 5 e y0 = 1, para o qual a

razão x0 /y0 = 0, 5 < 0, 663, portanto permitindo soluções do tipo catenóide,
de acordo com (1.52). Mostre graficamente que há duas soluções possı́veis:
a1 = 0, 234 e a2 = 0, 848, correspondendo a dois valores para a área da catenóide:
A1 = 6, 845 e A2 = 5, 992. Essas soluções são ditas “curva profunda” e “curva
rasa”, respectivamente, aludindo ao perfil assumido pela catenóide.
(c) A área das soluções de Goldschmidt é AG = 2πy02 . Mostre que, se a área da
catenóide for igual a AG , vale a equação transcendente (com u = py0 = y0 /a)
p
u u2 − 1 + cosh−1 u − u2 = 0,
que tem uma solução positiva em u0 = 1, 211. Usando esse resultado em (1.48)
mostre que
x0 cosh−1 u0
= = 0, 528
y0 u0
de forma que se
• (x0 /y0 ) < 0, 528: só há a solução do tipo catenóide com “curva rasa” (pois
A2 é um mı́nimo absoluto);
• 0, 528 < (x0 /y0 ) < 0, 663: a catenóide coexiste com a solução de Goldsch-
midt (mas A2 < AG , de modo que a catenóide com curva “rasa” torna-se
um mı́nimo relativo);
• (x0 /y0 ) > 0, 663: só há a solução de Goldschmidt.
7. Além da catenóide e da solução de Goldschmidt, existe ainda uma terceira
solução para o problema de superfı́cie mı́nima, consistindo de um disco de raio
r entre os aros e suportado por duas catenóides apoiadas em cada aro circular
[[3], pg. 1051].
(a) Mostre que r = c1 cosh c3 , onde c1 e c3 são constantes;
(b) Mostre que a área dessa terceira solução é

x0 x0
πc21 sinh 2 + c3 + [cosh2 (c3 ) − sinh(2c3 )] + 2
c1 c1
que é maior do que a área de uma única catenóide, mas é um mı́nimo relativo;
(c) Plateau propôs que filmes de sabão sempre se conectam de três em três,
fazendo ângulos de 120o entre as respectivas tangentes. Aplicando essa regra
√ à
conexão entre as catenóides e o disco central, mostre que c3 = sinh−1 (1/ 3) =
0, 549, tal que cosh2 (c3 ) − sinh(2c3 ) = 0.
(d) Mostre que o valor máximo da razão x0 /y0 para a ocorrência dessa terceira
solução é 0, 377.
8. A hipociclóide é a curva produzida por um ponto fixo P sobre um cı́rculo de
raio b que rola sem deslizar pelo interior de um cı́rculo de raio a > b. Sendo φ
o ângulo de rotação para o segmento que une os centros dos dois cı́rculos e o
ponto P , as equações paramétricas cartesianas da hipociclóide são

a−b a−b
x(φ) = (a − b) cos φ − b cos φ , y(φ) = (a − b) sin φ + b sin φ ,
b b
Mostre que, em termos do problema do túnel numa esfera de raio a = R, o raio
do cı́rculo menor é b = (R − r0 )/2 e que 2Ωt = aφ/b.
1.7. PROBLEMAS 41
9. Considere uma partı́cula de massa m sob a ação de um potencial V (ρ, φ, z)

em coordenadas cilı́ndricas. Obtenha a Lagrangeana da partı́cula e escreva as
equações de Lagrange.
10. O pêndulo esférico consiste de uma massa m pendurada por um fio de compri-
mento ℓ. A massa m é livre para mover-se no espaço, cuja posição é determinada
pelos seus ângulos θ e φ (em coordenadas esféricas).
(a) Obtenha a Lagrangeana da partı́cula e escreva as equações de Lagrange.
(b) Considere o caso particular em que p o fio do pêndulo descreve um cone de
pequena abertura θ0 . Mostre que φ̇ = g/d, onde d = ℓ cos θ0 é a distância
vertical do plano de rotação abaixo do ponto de suspensão.
(c) Suponha, agora, que o movimento é quase-cônico, ou seja, que θ = θ0 + δθ,
onde δθ ≪ θ0 . Expandindo a equação de Lagrange em série de potências mostre
que p
θ(t) ≈ θ0 + δθ0 cos tφ̇0 1 + 3 cos2 θ0
11. Na teoria dos reatores de fissão nuclear um problema consiste em minimizar

o volume de um reator cilı́ndrico de raio R e altura H sujeito a um vı́nculo
determinado pela teoria da difusão de nêutrons:
α 2 π 2
01
+ = C = constante,
R H
onde α01 = 2, 4048... é a menor raiz da função de Bessel J0 (R). Ache a relação
entre R e H.
12. Considere uma elipse de semi-eixos a e b, cuja equação cartesiana é

x 2 y 2
+ = 1.
a b
Obtenha o retângulo inscrito nessa elipse cuja área seja a maior possı́vel. Mostre
que, para esse retângulo máximo, a área é 64% da área da elipse.
13. Resolva o problema isoperimétrico considerando que a curva é parametrizada

pela distância s medida ao longo da curva, tal que as equações paramétricas da
curva sejam escritas como x = x(s) e y = y(s). A área a ser maximizada é
Z ℓ
dx
A= y ds
0 ds
onde ℓ é o comprimento total da curva.
14. Um pêndulo sı́mples consiste de uma partı́cula de massa m suspensa por um

fio leve e inextensı́vel de comprimento ℓ. Ache a Lagrangeana, a condição de
vı́nculo, e as equações de Euler-Lagrange. Resolva essas equações para o caso
de pequenas oscilações, e encontre a força de tensão no fio via multiplicadores
de Lagrange.
15. Uma partı́cula de massa m está constrangida a mover-se ao longo de uma haste
sem atrito que gira com velocidade angular constante ω sobre um plano horizon-
tal. Ache a Lagrangeana, condição de vı́nculo, as equações de Euler-Lagrange.
Obtenha a posição radial em função do tempo para as condições iniciais r(0) = r0
e ṙ(0) = 0. Ache a força de vı́nculo exercida sobre a partı́cula pela haste.
Capı́tulo 2
Métodos variacionais
aplicados
2.1 Revisão sobre a equação de Sturm-Liouville

A equação de Sturm-Liouville tem a forma geral

d dy
p(x) − s(x)y = −λr(x)y, (2.1)
dx dx
onde y ∈ R, a ≤ x ≤ b, e as funções p(x), s(x) e r(x) (esta última denominada

função peso) assumem valores não-negativos. Definindo o operador de Sturm-
Liouville
d d
L≡ p(x) − s(x), (2.2)
dx dx
reescrevemos a equação (2.1) na forma compacta
L[y] = −λr(x)y. (2.3)
O operador de Sturm-Liouville é linear, ou seja, se y1 e y2 forem soluções da

equação (2.3), então uma combinação linear das mesmas também o será:
L[c1 y1 + c2 y2 ] = c1 L[y1 ] + c2 L[y2 ]. (2.4)
Em consequência, as soluções da equação (2.1) formam um espaço vetorial linear

real, que é munido de um produto interno definido por
Z b
< y1 , y2 >≡ y1 (x)y2 (x)dx. (2.5)
a
e duas soluções são ortogonais se o produto interno entre elas for nulo: <
y1 , y2 >= 0.
A norma de uma solução y(x) é definida como
√
||y(x)|| = < y, y >. (2.6)
43
44 CAPÍTULO 2. MÉTODOS VARIACIONAIS APLICADOS
Como desejamos que a norma das soluções seja finita

Z b
[y(x)]2 dx < ∞, (2.7)
a
as soluções y(x) devem ser funções de quadrado integral, de modo que o espaço
das funções é denotado L2 [a, b]. Em geral, para funções complexas, esse espaço
é dito de Hilbert.
Para a discussão atual basta considerarmos condições de contorno de Diri-
chlet homogêneas:
y(a) = y(b) = 0 (2.8)
para as quais a equação de Sturm-Liouville só apresenta soluções aceitáveis para
determinados valores de λ = λn , denominados autovalores do operador (2.2).
A cada autovalor corresponde um e somente uma solução correspondente, dita
autofunção φn (x), e que satisfaz a equação
L[φn (x)] = −λn r(x)φn (x). (2.9)
Pode-se mostrar que o operador de Sturm-Liouville é auto-adjunto, ou seja,
< L[y1 ], y2 >=< y1 , L[y2 ] > (2.10)

∞ ∞
Em consequência, os autovalores {λn }n=1 são reais, e as autofunções {φn (x)}n=1
correspondentes a autovalores distintos são ortogonais em relação à função peso:
< φn , r(x)φj >= 0 se i 6= j. Se supusermos, adicionamente, que as autofunções
são normalizadas (norma igual a um) então temos a chamada condição de orto-
normalidade (em relação à função peso r(x)):
Z b
φi (x)φj (x)r(x)dx = δij . (2.11)
a
2.2 A equação de Sturm-Liouville como um pro-

blema variacional
Vamos mostrar que, se y(x) é uma solução da equação de Sturm-Liouville (2.1),
então o funcional
Z b
K[y] = p(x)yx2 + s(x)y 2 − λr(x)y 2 dx (2.12)
a
é estacionário. Logo, a equação de Sturm-Liouville pode ser encarada como uma

equação de Euler para a função
f (y, yx , x) ≡ p(x)yx2 + s(x)y 2 − λr(x)y 2 (2.13)
De fato, abrindo o lado esquerdo da equação de Euler (1.14):

∂f d ∂f
− = 0
∂y dx ∂yx
d
2sy − 2λry − (2pyx ) = 0
dx
2.2. A EQUAÇÃO DE STURM-LIOUVILLE COMO UM PROBLEMA VARIACIONAL45
que, dividindo por −2, resulta na equação de Sturm-Liouville (2.1), como querı́amos
demonstrar.
Integrando por partes a primeira parcela do integrando do funcional K,
temos que
Z b Z b Z b
dy b d
pyx2 dx = pyx dx = pyx y|a − y (py )dx (2.14)
a a |{z} dx
| {z } a |{z} |dx {zx }
=u =v
=dv =du
Pelas condições de contorno (2.8) o primeiro termo do lado direito é nulo, pois
p(b)yx (b)y(b) − p(a)yx (a)y(a) = 0 (2.15)
Logo, o funcional (2.12) fica

  
Z b
 d




K[y] = − 
 dx (p(x)y x ) − sy 
 y − y(λr(x)y) (2.16)
a 

 | {z } 


=L[y]
que, usando a notação do produto interno (2.5), resulta em
2
K[y] = − < y, L[y] > − < y, λr(x)y >= − < y, L[y] > −λ||y|| (2.17)
Essa forma para o funcional permite-nos encarar o problema de Sturm-

Liouville também sob a forma de um problema variacional com vı́nculos: achar
a função y(x) que torna estacionário o funcional K[y] (sem restrições) equivale
a tornar estacionário o funcional
J[y] = − < y, L[y] > (2.18)
sujeito à condição de vı́nculo

2
N [y] =< y, r(x)y >= ||y|| = constante, (2.19)
onde λ passa a ser, aqui, um multiplicador de Lagrange, desde que ∂N/∂y 6= 0

ou ∂N/∂x 6= 0.
Podemos, ainda, mostrar que, se y(x) satisfaz a equação de Sturm-Liouville
sem o termo em λ:
d dy
p(x) − s(x)y = 0 (2.20)
dx dx
então o funcional (2.18) não só é um extremo, como também é um mı́nimo. Para
mostrar esse fato, vamos supor uma função ξ(x) suave e que satisfaça as mesmas
condições de contorno de Dirichlet homogêneas da equação de Sturm-Liouville:
ξ(a) = ξ(b) = 0, mas que não seja uma solução ela própria.
Definimos a função
ψ(x) ≡ ξ(x) − y(x) (2.21)
2
tal que ξ 2 = (ψ + y) = ψ 2 + 2ψy + y 2 e
2
ξx2 = (ψx + yx ) = ψx2 + 2ψx yx + yx2 ,
donde (2.18) é
Z b
J[ξ] = (pξx2 + sξ 2 )dx
a
= [p(ψ 2 + 2ψy + y 2 ) + s(ψx2 + 2ψx yx + yx2 )]dx
Z b Z b
= 2 (pψx yx + sψy)dx + (pψx2 + sψ 2 ) + J[y].
|a {z } a
=I
A variação no funcional será, portanto, dada por

Z b
∆J ≡ J[ξ] − J[y] = 2I + (pψx2 + sψ 2 )dx. (2.22)
a
Integrando por partes, e usando as condições de contorno, temos

Z b Z b
b d
pyx ψx dx = pyx ψ|a − ψ (pyx )dx (2.23)
a | {z } a dx
=0
donde
Z b Z b
d d
I=− ψ (pyx ) − sψy dx = − ψ (pyx ) − sy dx = 0, (2.24)
a dx a dx
| {z }
=0
em vista de (2.20).
Logo, subsituindo em (2.22),
Z b
∆J = (pψx2 + sψ 2 )dx ≥ 0 (2.25)
a
já que p(x) ≥ 0 e s(x) ≥ 0 para todo x ∈ [a, b]. Naturalmente ∆J = 0 se e

somente se ψ = 0, ou ξ = y (isto é, se a função for mesmo uma solução da
equação diferencial). Caso contrário (ξ 6= y) então ∆J > 0, ou J[ξ] > J[y], de
forma que J tem um mı́nimo se y for a solução da equação de Sturm-Liouville,
pois qualquer outra função que não seja solução (mas que satisfaça as mesmas
condições de contorno) resultará num valor maior para o funcional J.
Em resumo, a solução da equação de Sturm-Liouville L[y] = −λr(x)y com
condições de contorno homogêneas y(a) = y(b) = 0, é uma função que minimiza
o funcional J[y] = − < y, L[y] >, sujeito ao vı́nculo de que a norma da solução
2
||y(x)|| seja constante. λ será o multiplicador de Lagrange associado a esse
vı́nculo.
2.3 Autofunções de L como funções de base

Na linguagem da álgebra linear, um conjunto de vetores é completo se podemos
exprimir um vetor arbitrário como uma combinação linear deles sem que falte
nem sobre nenhum vetor. Os vetores de um conjunto completo formam uma
base para o espaço vetorial. Por exemplo, no R3 , o conjunto de versores {î, ĵ, k̂}
é completo, mas o conjunto {î, ĵ} não é, pois “falta alguém”.
2.3. AUTOFUNÇÕES DE L COMO FUNÇÕES DE BASE 47
Essa propriedade é razoavelmente fácil de verificar em espaços de dimensão

finita, como o Rn , mas como assegurar completeza num espaço de dimensão in-
finita, como o espaço das soluções da equação de Sturm-Liouville? Essa questão
está longe de ser trivial, pois uma combinação linear de um número infinito de
vetores só é um vetor do espaço se a série infinita correspondente convergir para
o respectivo vetor.
No caso da equação de Sturm-Liouville, se o espaço vetorial das soluções
∞
y(x) tem uma base, então existe um conjunto completo de funções {φn (x)}n=1 ,
tal que y(x) possa ser expressa como uma superposição linear das funções de
base
X∞
y(x) = cn φn (x). (2.26)
n=1
onde cn =< y(x), φn (x) > são os coeficientes de Fourier generalizados.

A propriedade de completeza significa, nesse conexto, que a série infinita
acima converge no sentido de média quadrática, ou seja,
Z N
2
b X

lim y(x) − cn φn (x) dx = 0 (2.27)
N →∞ a
n=1
∞
de modo que {φn (x)}n=1 é dita uma sequência de Cauchy.
∞
No momento, as funções {φn (x)}n=1 satisfazem as condições de contorno
mas não são necessariamente soluções da equação de Sturm-Liouville. O obje-
tivo dessa seção é mostrar, através de métodos variacionais, que o conjunto de
autofunções do operador de Sturm-Liouville é completo no sentido acima, ou
seja, que as autofunções servem de base para o espaço das soluções y(x).
Começamos substituindo a série infinita (2.26) no funcional (2.18):
* ∞ "∞ #+
X X X
J[y] = − cm φ m , L cn φ n =− cm cn hφm , L [φn ]i (2.28)
m=1 n=1 m,n
onde usamos a linearidade do operador de Sturm-Liouville. Definindo os coefi-

cientes
Z b
d
Amn = − hφm , L [φn ]i = − φm (pφnx ) + sφn dx
a dx
Z b
= (pφmx φnx + sφm φn )dx (2.29)
a
onde integramos por partes para obter o resultado final, e denotamos φnx =
dφn /dx, etc. Desta forma o funcional (2.28) pode ser escrito como uma expansão
bilinear nos coeficientes cn .
X
J[y] = Amn cm cn (2.30)
m,n
Fazendo a mesma na condição de vı́nculo (2.19) chegamos a nova expansão

bilinear X X
N [y] = cm cn hφm , r(x)φn i = Rmn cm cn , (2.31)
m,n m,n
onde definimos Z b
Rmn = hφm , r(x)φn i = φm r(x)φn dx. (2.32)
a
Combinando (2.30) e (2.31) o funcional (2.17) é escrito como

X
K[y] = J[y] − λN [y] = cm cn (Amn − λRmn ). (2.33)
m,n
∞
Sendo dado o conjunto completo de funções {φn (x)}n=1 , os coeficientes Amn
e Rmn são conhecidos a priori, de forma que os valores estacionários de K ficam
determinados pelas condições variacionais
∂K
= 0, (j = 1, 2, . . .) (2.34)
∂cj
Impondo essas condições na expansão bilinear (2.33)
∂K X
= (Amn − λRmn )(cm δnj + δmj cn )
∂cj m,n
X X
0 = (Amj − λRmj )cm + (Ajn − λRjn )cn
m n
X
0 = [(Anj + Ajn ) − λ(Rnj + Rjn )]cn
n
onde trocamos m por n, posto que são ı́ndices mudos.

Pelas definições (2.29) e (2.32) é evidente que os coeficientes são simétricos
mediante a troca dos ı́ndices, de forma que, dividindo por 2, temos
∞
X
(Ajn − λRjn )cn = 0, (j = 1, 2, . . .) (2.35)
n=1
que é um sistema linear homogêneo com infinitas equações.

∞
Agora vamos supor que {φn (x)}n=1 sejam as autofunções do operador de
Sturm-Liouville, com as propriedades (2.9). Nesse caso, os coeficientes serão
Amn = λn < φm , rφn >= λn δmn (2.36)

Rmn = < φm , rφn >= δmn (2.37)
onde usamos a ortonormalidade das autofunções (2.11). O sistema linear (2.35)

ficará diagonalizado
∞
X
(λn − λ)δjn cn = (λj − λ)cj = 0, (j = 1, 2, . . .) (2.38)
n=1
Se quisermos soluções não-triviais para esse sistema, ou seja cj 6= 0, então

λj − λ = 0 para todo j, de modo que λ = λj : os multiplicadores de Lagrange
devem ser os autovalores do operador de Sturm-Liouville. Consequentemente,
o conjunto das autofunções é completo e pode ser usado como funções de base
para o espaço das soluções.
2.4. O MÉTODO DE RAYLEIGH-RITZ 49
2.4 O método de Rayleigh-Ritz

Vimos anteriormente que, se escolhermos uma função arbitrária ξ(x) no inter-
valo a ≤ x ≤ b que satisfaça as condições de contorno ξ(a) = ξ(b) = 0, o
funcional de Sturm-Liouville L[ξ] terá um valor maior do que teria para uma
solução bona fide da equação de Sturm-Liouville. Esse importante resultado
é a base do método variacional de Rayleigh-Ritz, pelo qual podemos obter in-
formações relevantes sobre o problema de Sturm-Liouville sem precisar resolvê-lo
diretamente. O método de Rayleigh-Ritz fornece soluções aproximadas para o
problema, cuja exatidão pode ser refinada de forma a termos respostas tão pre-
cisas quanto se queira. Por esse motivo, esse método é bastante usado em várias
áreas como acústica (campo onde foi originalmente proposto por Lord Rayleigh
em ), mecânica quântica, vibrações mecânicas, análise numérica, entre outras.
N
Nós partimos de um conjunto de N funções linearmente independentes {φ̂n (x)}n=1
que satisfazem as condições de contorno do problema de Sturm-Liouville mas
não são autofunções de L, de modo que o que procuramos é uma solução apro-
ximada na forma de uma combinação linear dessas funções
N
X
ŷ(x) = ĉn φ̂n (x) (2.39)
n=1
Substituindo (2.39) no funcional (2.17) e repetindo as manipulações algébricas

explicadas na seção precedente obteremos que
X X
ˆ − λ̂N̂ [ŷ] =
K̂[ŷ] = J[ŷ] m = 1N n = 1N ĉm ĉn (Âmn − λ̂R̂mn ), (2.40)
onde os chapéus foram colocados em todas as funções para denotar o caráter

aproximado da solução procurada:
D h iE
Âmn = − φ̂m , L φ̂n (2.41)
D E
R̂mn = φ̂m , r(x)φ̂n (2.42)
Aqui, como antes, a condição de que o funcional K̂ seja estacionário implica

nas seguintes condições variacionais:
∂ K̂
= 0, (j = 1, 2, . . . N ) (2.43)
∂ĉj
Substituindo (2.40) em (2.43) resultará um sistema linear homogêneo porém

finito (ao invés de infinito, como na seção anterior), com N equações e N
incógnitas, a saber, os coeficientes ĉj :
N
X
(Âjn − λ̂R̂jn )ĉn = 0, (j = 1, 2, . . . N ) (2.44)
n=1
Se desejamos que este sistema tenha soluções não-triviaix, ou seja, que ĉj 6=
0, então o determinante dos coeficientes deve ser nulo:
det(Âjn − λ̂R̂jn ) = 0, (2.45)

que é uma equação algébrica de grau N . Pelo teorema fundamental da álgebra,

N
teremos N raı́zes reais ou complexas, que são os autovalores aproximados {λ̂n (x)}n=1 .
Espera-se que este conjunto reproduza aproximadamente um certo número de
autovalores exatos do sistema λn . Veremos, por meio de alguns exemplos, que se
as funções φ̂n (x) forem “chutadas” corretamente, já com uma ou duas funções
é possı́vel obter excelentes aproximações para os autovalores.
2.4.1 Exemplos de aplicação do método

Equação de Helmholtz unidimensional
A equação de Helmholtz em uma dimensão [[1], pg. 575]
yxx + λy = 0, (−1 ≤ x ≤ 1) (2.46)
é um caso particular da equação de Sturm-Liouville para p(x) = 1, s(x) = 0 e

r(x) = 1, com a = −1 e b = 1. Supomos condições de contorno de Dirichlet
homogêneas y(−1) = y(1) = 0.
Vamos inicialmente escolher uma única função (N = 1):
φ̂1 (x) = 1 − x2 (2.47)
que satisfaz as condições de contorno φ̂1 (±1) = 0, de modo que a solução apro-
ximada é
ŷ(x) = ĉ1 φ̂1 (x) = ĉ(1 − x2 ). (2.48)
O funcional (2.40) é, em vista de (2.12), dado por
Z 1
K̂[ŷ] = ŷx2 − λ̂ŷ 2 dx
−1
Z 1
2
= 4ĉx2 − λ̂ĉ2 (1 − x2 ) dx
−1

2 8 16
= ĉ − λ̂ (2.49)
3 15
Aplicando a condição variacional (2.43)

∂ K̂ 8 16
= 2ĉ − λ̂ = 0, (2.50)
∂ĉ 3 15
temos que
5
= 2, 5
λ̂ =
2
Naturalmente esse problema tem uma solução exata, que é
πx
y(x) = cos
2
que, derivada duas vezes, fornece
π 2 πx πx
yxx = − cos = −λy = −λ cos ,
2 2 2
2.4. O MÉTODO DE RAYLEIGH-RITZ 51
exata
aproximada
0,8
0,6
y(x)
0,4
0,2
0
-1 -0,5 0 0,5 1
x
Figura 2.1: Soluções exata e aproximada da equação (2.46).
que fornece o autovalor exato:

π2
λ= = 2, 467...
4
que resulta num erro relativo de apenas 1, 3%, um resultado surpreendente tendo
em vista que estamos aproximando a solução com apenas uma função. Natu-
ralmente isso ocorre pois a função que “chutamos” é, de fato, muito próxima à
solução exata [Fig. 2.1].
Menor raiz da função de Bessel com m = 3

Vamos considerar a equação de Bessel com m = 3 [[1], pg. 576]

1 2 32
yxx + yx + k − 2 y = 0, (0 ≤ x ≤ 1) (2.51)
x x
com a condição de contorno que y(0) < ∞ e y(1) = 0. Ela tem a forma da
equação de Sturm-Liouville se p(x) = x, s(x) = 9/x, r(x) = x, e λ = k 2 .
Sabemos, de Métodos I, que a solução de (2.51) que é regular (isto é, que
não diverge) na origem é a função de Bessel de ordem m = 3:
y(x) = AJ3 (kx). (2.52)
onde A é uma constante de integração. Impondo que y(1) = 0 temos que
AJ3 (k) = 0. Se A 6= 0, então J3 (k) = 0, ou seja, k é uma raiz da função
de Bessel de ordem m = 3. As primeiras raizes de J3 (k) são k1 = 6, 380...,
k2 = 9, 761..., k3 = 13, 015.. e assim por diante [Fig. 2.2]. Logo a solução exata
correspondendo à menor raiz da função de Bessel com m = 3 é
y(x) = AJ3 (k1 x) = AJ3 (6, 380x).
0.5
0.4
0.3
0.2
J3(x) 0.1
−0.1
−0.2
−0.3
0 2 4 6 8 10 12 14 16 18 20
x
Figura 2.2: Função de Bessel de ordem m = 3.
Usamos o método de Rayleigh-Ritz empregando, como função tentativa,
φ̂1 (x) = x3 (1 − x) (2.53)
que satisfaz as condições de contorno, pois φ̂1 (0) = 0 e φ̂1 (1) = 0; de modo que
ŷ = ĉx3 (1 − x) e montamos o funcional (2.49):
Z 1h i
K̂[ŷ] = p(x)ŷx2 + s(x)ŷ 2 − k̂ 2 r(x)ŷ 2 dx
0
Z 1
9
= xŷx2 + ŷ 2 − k̂ 2 r(x)ŷ 2 dx
0 x
Z 1 h i 9
2 2 2
= ĉ2 x 9x4 (1 − x) − 6x5 (1 − x) + x6 + [x6 (1 − x) − k̂ 2 x7 (1 − x) dx
x
0
1 1 2
= ĉ2 − k̂
8 360
Aplicando
√ a condição variacional ∂ K̂/∂ĉ = 0 chegamos ao autovalor aproximado
k̂ = 45 = 6, 708.... Comparando esse resultado com a menor raiz da função
de Bessel, que é 6, 380..., vemos que o erro cometido é de 5, 14%.
2.5 O método da razão no cálculo variacional

A formulação variacional para o problema de Sturm-Liouville, que foi estudada
na seção anterior, pode ser generalizada de forma elegante para o problema da
razão entre dois funcionais lineares quaisquer num espaço vetorial apropriado.
Como veremos mais tarde, uma das aplicações do método da razão é na esti-
mativa de nı́veis de energia em problemas de mecânica quântica. Inicialmente,
porém, vamos apresentar o formalismo geral, que impõe condições bastante am-
plas.
2.5. O MÉTODO DA RAZÃO NO CÁLCULO VARIACIONAL 53
2.5.1 Cálculo com o sı́mbolo δ

Na seção 1.1. nós introduzimos o sı́mbolo δ denotando variação do funcional
J[y] da seguinte forma:
∂J
δJ = dα (2.54)
∂α α=0
onde α é um parâmetro que rotula os vários caminhos possı́veis que conectam
os pontos fixos em relação aos quais consideramos o problema variacional. A
escolha α = 0 corresponde ao caminho que torna o funcional J[y] estacionário,
em relação a pequenas variações do argumento, também definidas como

∂y
δy = dα (2.55)
∂α α=0
Embora δ não seja uma diferencial autêntica, ela satisfaz às mesmas propri-
edades de cálculo de uma diferencial, de forma que podemos realizar operações
elementares sobre funcionais, como
δ(c1 J1 + c2 J2 ) = c1 δJ1 + c2 δJ2 , (2.56)

δ(J1 J2 ) = (δJ1 )J2 + J1 (δJ2 ), (2.57)

J1 J2 (δJ1 ) − J1 (δJ2 )
δ = 2 . (2.58)
J2 (J2 )
dentre outras, que podem ser demonstradas a partir da definição (2.54). Por
exemplo,

∂(c1 J1 + c2 J2 )
δ(c1 J1 + c2 J2 ) = dα
∂α α=0

∂J1 ∂J2
= c1 dα + c2 dα
∂α α=0 ∂α α=0
= c1 δJ1 + c2 δJ2 ,
e assim por diante.
2.5.2 Teoria geral

Vamos trabalhar com espaços vetoriais complexos, de dimensão finita ou (mais
geralmente) infinita. Nesse espaço, sejam dois vetores quaisquer y e z, e um
escalar complexo a. Valem as seguintes propriedades para o produto interno:
• < y, z >∗ =< z, y >;
• < ay, z >= a∗ < y, z >;
• < y, az >= a < y, z >
Sejam, ainda, dois operadores F e G agindo sobre vetores nesse espaço. Exigi-
mos as seguintes propriedades desses operadores
1. F e G devem ser lineares: sejam a e b dois escalares complexos, então
F [ay + bz] = aF [y] + bF [z], G[ay + bz] = aG[y] + bG[z], (2.59)

2. F e G devem ser auto-adjuntos (ou hermitianos)

∗
< F [y], z > = < y, F [z] >= < F [z], y > , (2.60)
∗
< G[y], z > = < y, G[z] >= < G[z], y > , (2.61)
3. G deve ser positivo-definido
< y, G[y] > ≥ 0 (2.62)
sendo que a igualdade vale se e só se y = 0

Teremos, ainda, oportunidade de trabalhar com a chamada equação de au-
tovalores generalizada
F [y] = λG[y] (2.63)
onde λ é um autovalor generalizado. Podemos mostrar que os autovalores, nas
condições acima citadas, são necessariamente reais. Para isso consideramos que
< y, F [y] >=< y, λG[y] >= λ < y, G[y] > . (2.64)
Tomando o complexo conjugado dessa expressão e usando a propriedade do

produto interno < y, z >∗ =< z, y > temos que
< F [y], y >= λ∗ < G[y], y > . (2.65)
Usando a propriedade (2.60) podemos escrever
< y, F [y] >= λ∗ < y, G[y] > . (2.66)
Substraindo (2.66) de (2.64) resulta em
0 = (λ − λ∗ ) < y, G[y] >, (2.67)

| {z }
>0
∗
já que y 6= 0. Logo λ = λ , portanto é sempre real, como querı́amos demonstrar.
Se x e y forem funções definidas num certo intervalo I ⊆ R, podemos cons-
truir funcionais sobre esse intervalo a partir dos produtos internos e dos opera-
dores acima definidos:
Z
J[y] = < y, F [y] >= y ∗ (x)F [y(x)]dx, (2.68)
ZI
N [y] = < y, G[y] >= y ∗ (x)G[y(x)]dx, (2.69)
I
tal que podemos definir um novo funcional como a razão destes dois:
J[y]
ω[y] = . (2.70)
N [y]
Caso as condições (2.59)-(2.62) valham para todas as funções do espaço em

questão, então vale o seguinte teorema: o funcional ω[y] será estacionário para
pequenas variações do vetor y se e somente se y satisfizer a equação generali-
zada de autovalores 2.63, onde os autovalores λ são os valores estacionários do
funcional ω[y]. Observe que, no enunciado, falamos numa condição de duplo
sentido: se e somente se. Isso significa que (2.63) implica em δω = 0 (condição

necessária), tanto como δω = 0 implica em (2.63) (condição suficiente) . Vamos
provar apenas a necessidade, deixando a segunda para o leitor como exercı́cio
[detalhes no [1], pg. 583].
Para mostrar que (2.63) implica em δω = 0 fazemos uma variação infinitesi-
mal de y:
y → y + δy
e computamos o efeito nos funcionais (2.68):
J[y + δy] = < y + δy, F [y + δy] >=< y + δy, F [y] + F [δy] >= (2.71)
= < y, F [y] > + < y, F [δy] > + < δy, F [y] > + < δy, F [δy] >
| {z }
=<δy,F [y]>∗
onde usamos as propriedades (2.59), (2.60) e (2.62), nessa ordem.

A variação correspondente no funcional J é, usando (2.71),
δJ = J[y + δy] − J[y]

∗
= < y, F [y] > +< δy, F [y] > + < δy, F [y] > + < δy, F [δy] > − < y, F [y] >
∗
= < δy, F [y] > + < δy, F [y] > + < δy, F [δy] > . (2.72)
Analogamente, para o funcional N ,

∗
δN = < δy, G[y] > + < δy, G[y] > + < δy, G[δy] > . (2.73)
Usando (2.58) podemos calcular a variação no funcional ω:

J N δJ − JδN
δω = δ =
N N2
1 ∗
= 2 < y, G[y] > < δy, F [y] > + < δy, F [y] > + < δy, F [δy] >
< y, G[y] >
∗
< y, F [y] > < δy, G[y] > + < δy, G[y] > + < δy, G[δy] >
Supondo, agora, que y satisfaça a equação de autovalores generalizada (2.63),

teremos
1 ∗
δω = 2 < y, G[y] > λ∗ < δy, G[y] > + λ < δy, G[y] > +λ < δy, G[δy] >
< y, G[y] >
∗
λ < y, G[y] > < δy, G[y] > + < δy, G[y] > + < δy, G[δy] >
Finalmente, usando o fato dos autovalores λ serem reais (o que provamos há
pouco), observamos o cancelamento de todos os termos na expressão acima, de
forma que δω = 0, como querı́amos demonstrar. Juntamente com a implicação
no sentido inverso, concluimos que a razão dos funcionais J[y] e N [y] é esta-
cionária somente se λ for o autovalor correspondente à equação generalizada
(2.63).
O tratamento dado no inı́cio deste capı́tulo à equação de Sturm-Liouville
pode ser encarado como um caso particular deste teorema. Nesse caso especı́fico,
F é o operador de Sturm-Liouville L[y] e G[y] = r(y)y, cuja razão é estacionária
quando λ for o autovalor correspondente da equação de Sturm-Liouville (2.3).
2.5.3 O método da razão na mecânica quântica

A equação de Schrödinger
A função de onda ψ(x) é uma quantidade variável que descreve matematica-
mente as caracterı́sticas ondulatórias de uma partı́cula (Enciclopaedia Britta-
nica). A equação de Schrödinger independente do tempo para uma partı́cula
quanto-mecânica de massa m movendo-se em uma dimensão sob a influência de
um potencial V (x) é
~2 d 2
− ψ(x) + V (x)ψ(x) = Eψ(x), (2.74)
2m dx2
onde ~ = h/2π = 1, 05457148 × 10−34 m2 .kg/s é a constante de Planck reduzida,
e E é a energia total da partı́cula.
A equação de Schrödinger é linear. Como as funções de onda são, em geral,
complexas, elas pertencem a um espaço de funções complexas de quadrado in-
tegrável, chamado espaço de Hilbert. Nesse espaço o produto interno é definido
como 1 Z b
< ψ1 |ψ2 (x) >= ψ1∗ (x)ψ2 (x)dx. (2.75)
a
Definindo o operador Hamiltoniano
~2 d 2
H≡− + V (x), (2.76)
2m dx2
a equação de Schrödinger independente do tempo (2.74) pode ser reescrita como
2
Hψ(x) = Eψ(x), (2.77)

mostrando que, na verdade, ψ(x) são as autofunções do operador hamiltoni-
ano, cujos autovalores correspondentes são os valores da energia E da partı́cula.
Impondo condições de contorno apropriadas ao problema quanto-mecânico, sa-
bemos que só há soluções para determinados autovalores discretos da energia
∞ ∞
{En }n=1 (quantização), correspondendo às autofunções {ψn }n=1 .
O operador Hamiltoniano é auto-adjunto no espaço de Hilbert, também cha-
mado hermitiano, pois
< Hψ1 |ψ2 (x) >=< ψ1 |Hψ2 (x) > . (2.78)
Como consequência, os autovalores de energia são reais, e as autofunções cor-
respondendo a autovalores distintos são ortogonais:
< ψm |ψn (x) >= N δmn , (2.79)
onde N =< ψn |ψn (x) > é uma constante de normalização.
∞
Supondo, ainda, que o conjunto de autofunções {ψn }n=1 é completo, ele
pode ser usado como uma base para funções de onda no espaço de Hilbert, tal
que possamos escrever (“postulado da expansão”)
∞
X
ψ(x) = cn ψn (x), (2.80)
n=1
1 Usamosa notação bra(c)ket para o produto interno na mecânica quântica, imitando Dirac.
2 Tambémde acordo com o uso consagrado na mecânica quântica, escreveremos Hψ ao
invés de H[ψ].
onde os coeficientes são dados por

< ψ|ψn (x) >
cn = (2.81)
< ψn |ψn (x) >
e, fisicamente, são amplitudes de probabilidade para os autovalores de energia
correspondentes.
O método da razão aplicado à equação de Schrödinger

As funções de onda de quadrado integrável adaptam-se sem problemas aos re-
quisitos da teoria geral para a aplicação do método da razão. Além disso, o
operador Hamiltoniano é linear e auto-adjunto, e o operador identidade (de-
finido como I[ψ] = ψ) é trivialmente linear, auto-adjunto e positivo-definido.
Nesse caso, os funcionais J e N serão, respectivamente, dados por
Z b
J[ψ] = < ψ|Hψ >= ψ ∗ (x)Hψ(x)dx =
a
Z b
2
~ d2 ψ
ψ ∗ (x) − + V (x)ψ(x) dx (2.82)
a 2m dx2
Z b
N [ψ] = < ψ|ψ >= ψ ∗ (x)ψ(x)dx. (2.83)
a
O funcional correspondente à razão de J e N corresponde, na teoria da

mecânica quântica, ao valor esperado do operador hamiltoniano
< ψ|Hψ >
< H > [ψ] = (2.84)
< ψ|ψ >
Se empregarmos uma autofunção de energia ψn (x) o valor esperado é o próprio
autovalor, pois
< ψn |Hψn > En < ψn |ψn >
< H > [ψn ] = = = En (2.85)
< ψn |ψn > < ψn |ψn >
Pelo teorema da seção anterior, o valor esperado do Hamiltoniano é esta-
cionário (δ < H >= 0) sob variações infinitesimais da função de onda (δψ).
Além disso, esse valor esperado é, de fato, um mı́nimo [pode-se ver a prova
dessa afirmação em [4], pg. 313, por exemplo]. Portanto, usando uma outra
função ψ̂(x) que não seja a autofunção mas satisfaça às mesmas condições de
contorno, obteremos, em geral, um valor de < H > que é maior do que aquele
que seria obtido usando a autofunção correta. Esta é a base do método variaci-
onal muito frequentemente usado em mecânica quântica, e bastante usado para
determinar a energia do estado fundamental de um sistema mesmo sem conhecer
as suas autofunções. Isso é particularmente importante quando a equação de
Schrödinger não tem solução analı́tica, o que é bastante frequente nas aplicações
em fı́sica atômica e molecular.
Escolhemos uma função-tentativa ψ̂(x) (ou uma combinação linear delas)
que satisfaz as mesmas condições de contorno do problema e depende de um ou
mais parâmetros variacionais c1 , c2 , . . .. Computamos, então, o valor esperado
do hamiltoniano para essa função tentativa
< ψ̂|H ψ̂ >
< H > [ψ̂] = (2.86)
< ψ̂|ψ̂ >
V(x)
Eo
−a 0 a x
Figura 2.3: Poço de potencial quadrado infinito.
que deverá também ser uma função dos parâmetros c1 , c2 , . . .. Nós tornamos
esse funcional estacionário (na verdade, um mı́nimo) impondo as condições va-
riacionais
∂<H>
= 0, (j = 1, 2, . . .) (2.87)
∂cj
que fornecem valores ótimos que, substituidos em < H >, tornam este um
mı́nimo. Dessa forma < H > [ψ̂] é um limite superior para a energia do estado
fundamental, pois < H > [ψ̂] ≥ E0 , a igualdade só ocorrendo se a função-
tentativa for a própria autofunção do estado fundamental.
Poço de potencial quadrado infinito

Como um primeiro exemplo do método da razão na mecânica quântica, vamos
considerar uma caixa unidimensional de paredes infinitamente rı́gidas tem um
potencial dado por [Fig. 2.3]
(
0, se −a ≤ x ≤ a,
V (x) = (2.88)
∞, se x ≤ −a ou x ≥ a.
Como as paredes são impenetráveis, a função de onda do estado fundamental

deve ter nós nas paredes da caixa, ou seja, ψ(−a) = ψ(a) = 0. Para −a <
x < a o hamiltoniano de uma partı́cula de massa m é, simplesmente, H =
−~2 /2md2 /dx2 .
Usando a função-tentativa real
ψ̂(x) = c(a2 − x2 ), (2.89)
onde c é o parâmetro variacional, e que satisfaz as condições de contorno, pois

ψ̂(±a) = 0. Observe que não é necessário normalizar a função tentativa, pois
nós dividiremos posteriormente pela sua norma, de qualquer jeito.
Uma vez que
d2 ψ̂
= −2c,
dx2
os funcionais (2.82) e (2.83) serão

Z a ! Z a
∗ ~2 d2 ψ̂ ~2 2 2 4c2 ~2 a3
J[ψ̂] = = ψ̂ (x) − dx = − c(−2c) (a − x )dx = (2.90)
−a 2m dx2 2m −a 3m
Z a Z a 2 5
16c a
N [ψ̂] = ψ̂ ∗ (x)ψ̂(x)dx = c2 (a2 − x2 )dx = (2.91)
−a −a 15
e o valor esperado do hamiltoniano será
< ψ̂|H ψ̂ > 4c2 ~2 a3 /3m ~2 5
< H > [ψ̂] = = = . (2.92)
< ψ̂|ψ̂ > 16c2 a5 /15 m 4a2
Observe que, como < H > não depende do parâmetro variacional não é ne-
cessário minimizar < H > em relação a ele.
O problema do poço quadrado infinito é exatamente solúvel. A autofunção
(normalizada) do estado fundamental é [veja, por exemplo, [6], pg. 47]
1 πx
ψ(x) = √ cos ,
a 2a
correspondente ao autovalor de energia
~2 π 2
E0 = ,
m 8a2
de modo que o método variacional foi capaz de estimar esse valor com um erro
de 1, 63%. Nov
d2 ψ̂
= −2c,
dx2
os funcionais (2.82) e (2.83) serão
Z a ! Z a
~2 d2 ψ̂ ~2 4c2 ~2 a3
J[ψ̂] = = ∗
ψ̂ (x) − 2
dx = − c(−2c) (a2 − x2 )dx = (2.93)
−a 2m dx 2m −a 3m
Z a Z a
16c2 a5
N [ψ̂] = ψ̂ ∗ (x)ψ̂(x)dx = c2 (a2 − x2 )dx = (2.94)
−a −a 15
< ψ̂|H ψ̂ > 4c2 ~2 a3 /3m ~2 5
< H > [ψ̂] = = 2 5
= . (2.95)
< ψ̂|ψ̂ > 16c a /15 m 4a2
Observe que, como < H > não depende do parâmetro variacional não é ne-
cessário minimizar < H > em relação a ele.
O problema do poço quadrado infinito é exatamente solúvel. A autofunção
(normalizada) do estado fundamental é [veja, por exemplo, ]
1 πx
ψ(x) = √ cos ,
a 2a
correspondente ao autovalor de energia
~2 π 2
E0 = ,
m 8a2
de modo que o método variacional foi capaz de estimar esse valor com um erro
de 1, 63%. Novamente, esse bom resultado se justifica pela proximidade entre a
função de onda verdadeira e aquela usada como tentativa [veja a Fig. 2.4].
exata
aproximada
0,8
0,6
ψ
0,4
0,2
0
-1 -0,5 0 0,5 1
x
Figura 2.4: Autofunções exata e aproximada para o estado fundamental de uma

partı́cula num oço de potencial quadrado infinito, com a = 1.
Oscilador harmônico
[[5], pg. 1151]

O potencial para um oscilador harmônico unidimensional é [Fig. 2.5]
1
V (x) = mω 2 x2 , (2.96)
2
onde ω 2 = k/m é a frequência natural para uma partı́cula de massa m sujeita a

uma força restauradora onde k é a constante elástica. O operador hamiltoniano
será, portanto
~2 d 2 1
H=− 2
+ mω 2 x2 . (2.97)
2m dx 2
Como estamos procurando estados ligados, as autofunções de energia da partı́cula

para esse problema devem anular-se no infinito
ψ(x) → 0, se |x| → ∞.
Vamos usar como função-tentativa
2
ψ̂(x) = e−αx , (2.98)
2.6. PROBLEMAS 61
V(x)
Eo
0 x
Figura 2.5: Oscilador harmônico.
onde α > 0 será o parâmetro variacional. Os funcionais (2.82) e (2.83) serão

Z ∞ !
−αx2 ~2 d2 ψ̂ 1 2 2 2
J[ψ̂] = = e − 2
+ mω x e−αx dx =
−∞ 2m dx 2
2 Z ∞
~ α 1 21 2
= + mω e−2αx , (2.99)
2m 8 α −∞
Z ∞
2
N [ψ̂] = e−2αx , (2.100)
−∞
~2 α 1 1
< H > [ψ̂] = + mω 2 (2.101)
2m 8 α
Aplicando a condição variacional (2.87)

∂<H> ~2 1 1
= − mω 2 2 = 0, (2.102)
∂α α0 2m 8 α
que fornece o valor do parâmetro que minimiza < H >

mω
α0 = , (2.103)
2~
dando
1
< H > (α0 ) = ~ω, (2.104)
2
que é igual ao valor exato da energia do estado fundamental E0 . Naturalmente
isso ocorreu pois nossa função tentativa é idêntica à autofunção exata.
2.6 Problemas
1. Mostre que o operador de Sturm-Liouville é
(a) linear: L[c1 y1 + c2 y2 ] = c1 L[y1 ] + c2 L[y2 ];

(b) auto-adjunto: < L[y1 ], y2 >=< y1 , L[y2 ] >
2. Demonstre que:
(a) os autovalores do operador L são reais;
(b) as autofunções de L correspondentes a autovalores distintos são ortogonais
3. Resolva a equação de Helmholtz unidimensional (2.46) usando o método de

Rayleigh-Ritz como uma combinação linear de duas funções-tentativa:
φ̂1 (x) = 1 − x2 , φ̂2 (x) = x2 (1 − x2 ),
Compare o valor de λ com o resultado exato e calcule o erro relativo percentual.

Interprete seu resultado em termos do caráter das funções tentativa empretadas.
4. Considere a equação de Bessel de ordem m = 0:

1
yxx + yx + λy = 0, (0 ≤ x ≤ 1)
x
com as condições de contorno y(0) < ∞ e y(1) = 0. Use o método de Rayleigh-
Ritz com a função tentativa
φ̂1 (x) = a + bx2 + cx4 ,
e mostre que o autovalor aproximado é uma solução da equação quadrática

3λ̂2 − 128λ̂ + 640 = 0. Estime o erro do autovalor “bom”, e explique o autovalor
“ruim” que também é obtido.
5. A partir da definição (2.22) mostre as propriedades (2.5) e (2.58) do sı́mbolo δ.
6. Considere o problema de uma partı́cula num poço potencial quadrado infinito.

Estime a energia do estado fundamental usando, como função tentativa,
ψ̂(x) = |a|λ − |x|λ
onde λ é um parâmetro variacional. Qual o erro percentual relativo quando se

compara com o resultado exato? [[4], pg. 315]
7. Obtenha a energia do estado fundamental do oscilador harmônico usando uma

função tentativa
1
ψ̂(x) = 2
x +a
onde a > 0 é um parâmetro variacional.
8. Você pode usar o método variacional para obter a energia do primeiro estado
excitado do oscilador harmônico (n = 2). Use a função tentativa
2
ψ̂(x) = xe−βx
9. Considere uma partı́cula sujeita ao potencial V (x) = λx4 . Use o método varia-
cional para estimar a energia do estado fundamental, usando a função tentativa
2
ψ̂(x) = e−αx
2
~
Compare seu resultado com a solução exata desse problema: E0 = 1, 06 2m k1/3 ,
2
onde k = 2mλ/~ .
2.6. PROBLEMAS 63
10. O método variacional na mecânica quântica pode ser generalizado para três
dimensões. Os funcionais (2.82) e (2.83) serão dados por
Z 2
~
J[ψ] = < ψ(r)|Hψ(r) >= d3 r (∇ψ ∗ · ∇ψ) + V (r)ψ ∗ (r)ψ(r)
2m
Z
3 ∗
N [ψ] = < ψ(r)|ψ(r) >= d rψ (r)ψ(r)
Usando a função tentativa,

(
r

1− α
, se r ≤ α,
ψ̂(r) =
0, se r > α.
com α fazendo o papel de parâmetro variacional, estime a energia do estado

fundamental do átomo de hidrogênio, onde V = ke2 /r, com k = 1/4πǫ0 .
11. Repita o problema anterior com a função tentativa

2
ψ̂(r) = e−αr
Resposta: −11, 5eV (o valor experimental é −13, 6eV ).
12. Use o método variacional para estimar a energia de ligação de um dêuteron

(núcleo de deutério), supondo que o potencial de interação entre o próton e o
nêutron é
V (r) = Ae−r/r0
e use uma função tentativa ψ̂(x) = Ce−βr , onde A e C são constantes de nor-
malização, r0 é um comprimento caracterı́stico do potencial, e β é o parâmetro
variacional. A resposta é −2, 1M eV . O valor experimental é 2, 24M ev.
Referências Bibliográficas
[1] E. Butkov, Fı́sica Matemática (Guanabara Dois, Rio de Janeiro, 1978).
[2] H. Goldstein, C. Poole, e J. Safko, Classical Mechanics, 3rd. Ed. (Addison

Wesley, San Francisco, 2000).
[3] G. B. Arfken e H. J. Weber, Mathematical Methods for Physicists, 5a. Ed.
(Harcourt, San Diego, 2001).
[4] J. J. Sakurai, Modern Quantum Mechanics, Revised Edition, (Addison

Wesley, San Francisco, 1994).
[5] C. Cohen-Tannoudji, B. Diu, e F. Laloë, Quantum Mechanics, 2 volumes,

(Wiley, New York, 1977).
[6] S. Gasiorowicz, Quantum Physics, 3rd. Ed. (Wiley, New York, 2003)
[7] G. Venezian, Am. J. Phys. 34, 701 (1966).
[8] P. W. Cooper, Am. J. Phys. 34, 68 (1966).
65

Variacional - Solução Da Braquistócrona

Загружено:

Сведения о документе

Исходное описание:

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Variacional - Solução Da Braquistócrona

Загружено:

Авторское право:

Доступные форматы

Cálculo Variacional

Prof. Dr. Ricardo L. Viana

2 Métodos variacionais aplicados 43

1.1 Uma variável independente e uma depen-

seja um extremo (máximo, mı́nimo ou ponto de inflexão). Em outras palavras,

1.1.1 Parâmetro variacional

y(x, α) = y(x, 0) + αη(x), (1.2)

Figura 1.1: Parametrização de caminhos ligando dois pontos fixos.

pois ela não é diferenciável em x = 1/2.

1.1.2 Dedução da equação de Euler

A condição imposta ao caminho ótimo y(x, 0) de que torne o funcional acima

Diferenciando (2.28) em relação a α teremos

Integrando por partes o segundo termo do lado direito

tal que a primeira parcela resultante da integração por partes é identicamente

Multiplicando por dα e calculando as derivadas em relação a α para o cami-

Vamos denominar variação da integral J a seguinte expressão

assim como, analogamente, a variação de y será

com as quais reescrevemos (1.9) como

Leonhard Euler chegou à equação acima em 1744, no seu trabalho Método

1.1.3 Identidade de Beltrami

Para deduzir essa identidade, consideremos primeiramente a derivada total

Substituindo (1.16) em (1.17),

que, por integração, nos leva à identidade de Beltrami (1.15).

1.2 Aplicações da equação de Euler

na forma de um funcional integral.

A solução y(x) = ax + b representa um segmento de reta entre dois pontos.

Prova de que o extremo é um mı́nimo

Pela parametrização dada por (1.2), diferenciando em relação a x temos que

onde yx0 = a. Usando o teorema binomial nós expandimos o integrando acima

Figura 1.2: A braquistócrona.

onde ds é o elemento de arco dado por (1.22). Para achar a velocidade v

podemos usar, alternativamente, a identidade de Beltrami (1.15):

Quadrando ambos os membros obtemos a seguinte equação diferencial

Vamos introduzir um parâmetro 0 ≤ θ < 2π através da seguinte substituição

Figura 1.3: Superfı́cies de revolução de área mı́nima.

A braquistócrona tem uma outra propriedade notável, e aparentemente pa-

1.2.3 Superfı́cies de revolução e filmes de sabão

que se pretende minimizar. p

Isolando yx2 nessa expressão teremos

A equação diferencial acima pode ser imediatamente integrada:

onde b é uma constante de integração. Invertendo temos a equação da curva

Outras soluções do problema

Figura 1.4: Superfı́cies de revolução de área mı́nima.

Figura 1.5: Soluções do problema de área mı́nima

Como os valores de x0 , e y0 estão “amarrados” pela condição (1.47), não

py0 = cosh(px0 ). (1.48)

Diferenciando em relação a p ambos os membros

Denotando o valor máximo de x0 por x∗0 , temos a condição de máximo

Figura 1.6: Túnel em uma esfera.

tal que (1.49) fique

1.2.4 Túnel em uma esfera

numa esfera homogênea de massa M e raio R, para o qual o campo gravitacional

Introduzindo coordenadas polares (r, θ) o elemento de arco (1.22) é escrito como

de modo que o funcional a ser minimizado é

Como o integrando não depende explicitamente de θ, podemos usar a iden-

onde podemos exprimir a constante de integração C em termos de r0 , que é a

Dividindo (1.57) e (1.58) membro a membro obtemos a seguinte equação

onde θ(r0 ) = 0 corresponde ao ponto de máxima aproximação. O ângulo cen-

a equação (1.60) da trajetória que minimiza o tempo de percurso é

1.3 Uma variável independente e várias depen-

f = f (y1 (x), y2 (x), . . . yn (x); x),

e o funcional integral que desejamos tornar estacionário