Teoretická mechanika Jiří Podolský Studijní text k přednášce NAFY016 „Úvod do teoretické fyziky I Ústav teoretické fyziky Matematicko–fyzikální fakulta Univerzita Karlova v Praze říjen 2013 c Jiří Podolský Obsah 1 Lagrangeův formalismus 2 1.1 Popis systému . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.1.1 Zavedení zobecněných souřadnic . . . . . . . . . . . . . . . . . . . . . . . . 2 1.1.2 Konfigurační prostor a zobecněné rychlosti . . . . . . . . . . . . . . . . . . 4 1.2 Odvození Lagrangeových rovnic II. druhu . . . . . . . . . . . . . . . . . . . . . . . 4 1.2.1 Nejjednodušší situace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.2.2 Nejobecnější situace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.2.3 Potenciál a Lagrangeova funkce . . . . . . . . . . . . . . . . . . . . . . . . . 7 1.2.4 Zobecněný potenciál . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.2.5 Příklad: částice v centrálním poli . . . . . . . . . . . . . . . . . . . . . . . . 8 1.3 Metody řešení pohybových rovnic a integrály pohybu . . . . . . . . . . . . . . . . . 11 1.4 Pohyb v poli centrální síly . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 1.4.1 Pohyb planet aneb Keplerova úloha . . . . . . . . . . . . . . . . . . . . . . 15 1.4.2 Historická vsuvka z rudolfínské Prahy . . . . . . . . . . . . . . . . . . . . . 17 1.4.3 Metoda efektivního potenciálu . . . . . . . . . . . . . . . . . . . . . . . . . 18 1.4.4 Rozptyl nabitých částic . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 1.5 Problém dvou těles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 1.6 Problém tří těles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 1 Kapitola 1 Lagrangeův formalismus Tato kapitola je věnována hlavním pojmům a metodám Lagrangeova formalismu. Nejprve zavedeme efektivnější popis systému pomocí zobecněných souřadnic a potom odvodíme dynamický pohybový zákon známý jako Lagrangeovy rovnice II. druhu. Uvedeme základní věty týkající se integrálů pohybu, jimiž lze tyto rovnice řešit. Užitečnost Lagrangeova přístupu budeme ilustrovat především na významném příkladě pohybu hmotného bodu v poli centrální síly (Keplerova úloha, rozptyl elementárních částic). Závěrem se budeme zabývat problémem pohybu dvou a více vzájemně interagujících těles. Uvidíme, že Lagrangeův formalismus je velmi elegantní formulací mechaniky. Z jediné výchozí skalární Lagrangeovy funkce L dokáže přímočaře zkonstruovat pohybové rovnice v libovolných vhodných souřadnicích, a navíc implikuje některé triky umožňující nalézt jejich řešení. Neméně důležité je, že formalismus nachází četná zobecnění mimo mechaniku, například v teorii pole a v relativistických či kvantových teoriích. 1.1 Popis systému Efektivita Lagrangeova formalismu spočívá zejména v tom, že k popisu studovaného mechanického systému používá tzv. zobecněné souřadnice standardně označované symbolem qj . Jsou to vhodně zvolené libovolné parametry, které jednoznačně popisují všechny možné konfigurace systému. Velká rozmanitost mechanických úloh znemožňuje aplikaci obecně použitelných „univerzálních souřadnic, které by ideálně popisovaly vývoj každého systému. Samozřejmě, vždy lze například zavést kartézské souřadnice xi všech hmotných bodů a předepsat působící síly a vazby. Výsledné pohybové rovnice jsou ovšem velmi komplikované. Dokonce už v triviálním případě pobybu jediného hmotného bodu v poli centrální síly je použití kartézských souřadnic dosti nepraktické (příslušné diferenciální rovnice jsou složité), daleko výhodnější je užití sférických souřadnic, které přirozeně vystihují symetrii daného problému. 1.1.1 Zavedení zobecněných souřadnic Lagrangeův přístup k popisu mechanických systémů je geniálně prostý: vhodné souřadnice „ušije na míru daného problému. Přitom eklekticky kombinuje různé typy souřadnic a parametrů — zpravidla vzdálenosti a úhly. Jejich volba přitom není a priori ničím předepsána, jediným omezením je, aby zvolené zobecněné souřadnice qj jednoznačně popisovaly všechny možné polohy hmotných bodů systému, tzv. konfigurace. Je zjevné, že zobecněných souřadnic musí být tolik, kolik je stupňů volnosti daného systému, q1 , q2 , . . . , qn , (1.1) kde n = 3N − v, přičemž N je počet hmotných bodů a v je počet vazeb (viz kapitola 0.1). 2 KAPITOLA 1. LAGRANGEŮV FORMALISMUS 3 Lagrange tedy účinně používá tzv. Occamovu břitvu,1 podle které „Je zbytečné užívati více tam, kde vystačíme s méně. Opravdu, je zbytečné užívati více zobecněných souřadnic, než je nezbytně nutno (tedy než je počet stupňů volnosti). A méně jich také nelze použít, protože počet parametrů by nebyl dostatečný k popisu všech možných konfigurací systému. Jak jsme již uvedli, zobecněné souřadnice lze zavést „libovolně , a proto je naším cílem volit je vždy co nejvhodněji. To vyžaduje trochu zkušenosti a intuice. Pár následujících příkladů ukáže přirozené volby zobecněných souřadnic pro jednoduché mechanické systémy: Příklady: matematické kyvadlo q1 = ϕ ... výchylka z rovnovážné polohy eliptické kyvadlo q1 = x ... poloha horního tělesa q2 = ϕ ... výchylka dolního ze svislé polohy dvě pružiny q1 = x1 ... výchylka prvního tělesa z rovnováhy q2 = x2 ... výchylka druhého tělesa z rovnováhy činka q1 = x ... vodorovná poloha těžiště q2 = y ... svislá poloha těžiště q3 = ϑ ... natočení činky Obvykle předpokládáme, že existuje vztah mezi zobecněnými a kartézskými souřadnicemi xi (q1 , . . . , qn , t) , i = 1, . . . , 3N (1.2) a že je regulární. Jinými slovy: z hodnot zobecněných souřadnic můžeme v každém okamžiku jednoznačně stanovit polohu všech hmotných bodů v prostoru pomocí přirozených kartézských souřadnic. Příklad: pohyb mravence po povrchu koule Úloha má 2 stupně volnosti. Ideální je zavést sférické úhly (zeměpisné souřadnice) q1 = ϑ, q2 = ϕ, které jednoznačně určují polohu mravence. Má-li koule poloměr a, je vztah ke kartézským souřadnicím dán standardními rovnicemi x1 = a sin ϑ cos ϕ , x2 = a sin ϑ sin ϕ , x3 = a cos ϑ , které identicky splňují vazbu (x1 )2 + (x2 )2 + (x3 )2 = a2 . Každá hodnota zobecněných souřadnic ϑ ∈ (0, π), ϕ ∈ (0, 2π) proto odpovídá možné poloze (konfiguraci) mravence na povrchu koule. Pokud by koule byla povrchem nafukujícího se balonku, jednalo by se o rheonomní vazbu, přičemž poloměr by byl konkrétní funkcí času, neboli a(t). Pak by bylo xi (ϑ, ϕ, t) časově závislé. 1William Occam (1290–1349), anglický středověký teolog a filosof. Jeho slavný aforismus je často citován i používán. Například Bertrand Russell ve svém díle History of Western Philosophy na adresu Occamovy břitvy uvádí: „Shledal jsem toto býti nejplodnějším principem logické analýzy. KAPITOLA 1. LAGRANGEŮV FORMALISMUS 4 1.1.2 Konfigurační prostor a zobecněné rychlosti Zobecněné souřadnice (q1 , . . . , qn ) vymezují takzvaný konfigurační prostor Q všech možných poloh (konfigurací) systému. Řečeno geometricky přesněji, jedná se o tzv. konfigurační varietu, přičemž (q1 , . . . , qn ) jsou příslušné lokální souřadnice na ní. V předchozím příkladě je konfigurační varietou sféra S2 a ϑ, ϕ jsou lokální souřadnice na její obvyklé mapě, jež neobsahuje severní a jižní pól. Důležité přitom je, že konfigurační prostor není prostorem fyzikálních stavů systému, protože vypovídá pouze o konfiguracích — tedy o polohách — všech hmotných bodů. Abychom získali úplnou informaci o fyzikálním stavu, je nutné znát také jejich rychlosti. Konfigurační prostor tedy musíme doplnit o tzv. zobecněné rychlosti ( ˙q1 , . . . , ˙qn ). To jsou dodatečné rychlostní parametry, jež jsou obecně nezávislé na okamžité poloze. Formálně tedy můžeme psát ∂qi ∂qj = δi j , ∂ ˙qi ∂ ˙qj = δi j , ∂ ˙qi ∂qj = 0 , ∂qi ∂ ˙qj = 0 . (1.3) Z hlediska exaktní formulace mechaniky v jazyce diferenciální geometrie představuje konfigurační prostor varietu Q. Její libovolný bod P ∈ Q je popsán souřadnicovými parametry (q1 , . . . , qn ) určujícími polohu hmotných bodů systému. Jejich (možné) rychlosti v jsou v daném místě P tečné vektory k varietě Q, leží tedy v lineárním vektorovém tečném prostoru TP Q. Vektor rychlosti v ∈ TP Q je v dané bázi určen složkami ( ˙q1 , . . . , ˙qn ). Teprve spojením obou druhů informací o polohách i rychlostech vzniká prostor fyzikálních stavů daného systému: jedná se o tzv. tečný bandl TQ, neboli rychlostní fázový prostor, dimenze 2n parametrizovaný souřadnicemi (q1 , . . . , qn , ˙q1 , . . . , ˙qn ). Podrobnosti lze nalézt ve studijním textu k prosemináři NTMF069. Uvedená struktura rychlostního fázového prostoru poskytuje například přirozené vysvětlení tzv. Zénónova paradoxu šípu.2 Paradox podle Zénóna spočívá v tom, že nelze navzájem odlišit letící a stojící šíp, když se oba právě nacházejí na stejném místě. Opravdu: z hlediska konfiguračního prostoru Q mají oba stejné hodnoty zobecněných souřadnic qj . Přesto ale představují odlišné fyzikální stavy určené jinými hodnotami zobecněných rychlostí ˙qj : zatímco stojící šíp je určen nulovým vektorem v = 0 z TP Q, šíp letící stejným bodem P danou rychlostí je určen konkrétním nenulovým vektorem v ∈ TP Q. 1.2 Odvození Lagrangeových rovnic II. druhu Nyní již můžeme přistoupit k vlastnímu odvození pohybových rovnic soustavy, jejíž konfigurace jsou vyjádřeny vhodnými zobecněnými souřadnicemi. Takové rovnice se nazývají Lagrangeovy rovnice II. druhu. Z pedagogických důvodů je nejprve odvodíme pro nejjednodušší jednorozměrnou situaci a potom rovnice přímočaře zobecníme na libovolný počet zobecněných souřadnic. 1.2.1 Nejjednodušší situace Uvažujme pro jednoduchost nejprve jednorozměrný pohyb jediné částice hmotnosti m podél kartézské osy x. Nechť zobecněná souřadnice je q, přičemž vazba je holonomní (obecně však může 2Zénón z Eleje (490–430 př. n. l.), proslulý řecký filosof a žák Parmenidův, se proslavil zejména svými aporiemi: „letící šíp je v klidu , „Achilleus nikdy nedohoní želvu a podobně. KAPITOLA 1. LAGRANGEŮV FORMALISMUS 5 být rheonomní), tedy x(q, t). Pro konkrétní trajektorii q(t) odtud dostáváme x(t) = x(q(t), t), takže dx dt = ∂x ∂q dq dt + ∂x ∂t . (1.4) Nyní můžeme snadno spočítat kinetickou energii částice, kterou budeme označovat symbolem T : T = 1 2 m dx dt 2 = 1 2 m ∂x ∂q dq dt + ∂x ∂t 2 . (1.5) Všechny tyto funkce závisejí na čase, neboť je vyčíslujeme podél trajektorie q(t). Protože však výraz (1.5) platí pro každou trajektorii a v každém okamžiku t0, musí v t0 platit vztah T (q, ˙q, t0) = 1 2 m ∂x ∂q (q, t0) ˙q + ∂x ∂t (q, t0) 2 , (1.6) kde q = q(t0) je okamžitá poloha a ˙q = dq dt (t0) je okamžitá rychlost. Jestliže nyní budeme tuto zobecněnou souřadnici q a zobecněnou rychlost ˙q chápat jako navzájem nezávislé parametry, dostaneme parciálním derivováním (1.6) následující rovnice ∂T ∂ ˙q = m ∂x ∂q ˙q + ∂x ∂t ∂x ∂q , (1.7) ∂T ∂q = m ∂x ∂q ˙q + ∂x ∂t ∂ ∂q ∂x ∂q ˙q + ∂x ∂t , (1.8) které opět musí platit v každém okamžiku t0 libovolné trajektorie q(t). Proto můžeme získat časové vyjádření vývoje obou veličin (1.7), (1.8) prostým dosazením q = q(t) a ˙q = dq dt (t), tedy ∂T ∂ ˙q (t) = m ∂x ∂q dq dt + ∂x ∂t ∂x ∂q = m dx dt ∂x ∂q , (1.9) ∂T ∂q (t) = m ∂x ∂q dq dt + ∂x ∂t ∂ ∂q ∂x ∂q dq dt + ∂x ∂t = m dx dt ∂ ∂q dx dt , (1.10) kde v druhých rovnostech jsme uplatnili vztah (1.4). Odečteme-li nyní od úplné časové derivace prvního výrazu druhý výraz, dostaneme d dt ∂T ∂ ˙q − ∂T ∂q = m d2 x d t2 ∂x ∂q + m dx dt d dt ∂x ∂q − m dx dt ∂ ∂q dx dt = m d2 x d t2 ∂x ∂q , (1.11) protože druhý a třetí člen uprostřed se v důsledku záměnnosti pořadí derivací vůči q a t navzájem odečtou. Pravou stranu (1.11) lze pomocí Newtonova pohybového zákona již snadno vyjádřit m d2 x d t2 ∂x ∂q = F ∂x ∂q ≡ Q, (1.12) kde Q je zobecněná síla, což je průmět obvyklé síly F do tečného směru k zobecněné souřadnici q. Tím jsme odvodili, že d dt ∂T ∂ ˙q − ∂T ∂q = Q , (1.13) což je Lagrangeova rovnice II. druhu. Jedná se o vyjádření pohybového zákona klasické mechaniky v libovolných zobecněných souřadnicích. Výraz na levé straně však musíme chápat jako užitečnou zkratku pro operaci, která přesně odpovídá výše uvedenému odvození, tedy postupu: KAPITOLA 1. LAGRANGEŮV FORMALISMUS 6 • vyjdeme z obvyklého „kartézského vztahu pro kinetickou energii T = 1 2 m dx dt 2 • vyjádříme ho pomocí zobecněných souřadnic a zobecněných rychlostí, viz (1.6) • tento výraz T (q, ˙q, t0) parciálně zderivujeme podle nezávislých parametrů ˙q a q • do takto získaných vztahů dosadíme za parametr q funkci q(t) a za parametr ˙q funkci dq dt (t) • první z takto získaných funkcí ∂T ∂ ˙q (t) zderivujeme úplně podle času t • odečteme od ní druhou funkci ∂T ∂q (t) a celý výraz položíme roven zobecněné síle Q. Touto procedurou dostaneme vztah (1.13), což je z matematického hlediska obyčejná diferenciální rovnice 2. řádu pro hledanou funkci q(t). Ilustrace: kmity svislé pružiny padající v gravitačním poli g Za zobecněnou souřadnici zvolme například bezrozměrný parametr q takový, že pro kartézskou polohu konce pružiny platí x(q, t) = c q + 1 2 g t2 , kde c je konstanta. Pro trajektorii q(t) je pak kinetická energie (1.5) dána T (t) = 1 2 m (c dq dt (t) + g t)2 . Vyjádřeno pomocí parametrů q a ˙q dostáváme T = 1 2 m (c ˙q + g t)2 , takže ∂T ∂ ˙q = mc (c ˙q + g t) a ∂T ∂q = 0. Nyní za ˙q dosadíme dq dt (t) a další derivací vyčíslíme d dt ∂T ∂ ˙q − ∂T ∂q = mc c d2 q d t2 + g . To má být podle (1.13) rovno zobecněné síle Q ≡ F ∂x ∂q = c F. Když F = −kc q + mg, Lagrangeovy pohybové rovnice II. druhu vedou na diferenciální rovnici harmonického oscilátoru, d2 q d t2 + k m q = 0, jež má obecné řešení q(t) = q0 cos k m t + δ , kde q0, δ jsou integrační konstanty. 1.2.2 Nejobecnější situace Výše uvedený postup platný pro jeden hmotný bod m pohybující se podél jediné kartézské osy x lze snadno zobecnit na zcela obecnou situaci, kdy se mechanický systém skládá z N hmotných bodů, jež se pohybují v třírozměrném prostoru. Ve standardním kartézském popisu tedy máme souřadnice x1 , x2 , x3 , jež popisují polohu prvního hmotného bodu hmotnosti m1 , souřadnice x4 , x5 , x6 , jež popisují polohu druhého hmotného bodu hmotnosti m2 , atd. Je užitečné zavést soustavu 3N konstant mi předpisem m1 = m2 = m3 = m1 , m4 = m5 = m6 = m2 , atd. Díky tomuto formalizmu lze celkovou kinetickou energii soustavy hmotných bodů vyjádřit T = 1 2 3N i=1 mi dxi dt 2 . (1.14) Nechť je tato soustava podrobena celkem v holonomním vazbám (tedy na rychlosti nezávislým) tvaru φν(xi , t) = 0 , ν = 1, 2, . . . , v. Připouštíme tedy časovou závislost (rheonomní vazby). Pak lze vždy (přinejmenším lokálně) zvolit zobecněné souřadnice qj , j = 1, 2, . . ., 3N − v, tedy nezávislé parametry takové, že pro libovolnou jejich hodnotu (z vhodného definičního oboru) jsou všechny holonomní vazby φν = 0 identicky splněny. Z věty o implicitní funkci pak za předpokladu dostatečné hladkosti vazeb dostaváme, že musí existovat funkce (1.2), tedy xi = xi (qj , t) . (1.15) Odtud ihned plyne xi (t) = xi (qj (t), t) , takže dxi dt = ∂xi ∂qk dqk dt + ∂xi ∂t , (1.16) KAPITOLA 1. LAGRANGEŮV FORMALISMUS 7 kde používáme Einsteinovo sumační pravidlo v indexu k. Dosazením do výrazu (1.14) dostáváme T (qj , ˙qj , t) = 1 2 3N i=1 mi ∂xi ∂qk ˙qk + ∂xi ∂t 2 , (1.17) kde funkce ∂xi ∂qk a ∂xi ∂t závisejí dle (1.15) jen na qj a případně na t. V tomto vyjádření již vystupují zobecněné rychlosti ˙qj a zobecněné souřadnice qj jako nezávislé parametry, viz (1.3). Parciálními derivacemi (1.17) tedy dostáváme ∂T ∂ ˙qj = 3N i=1 mi ∂xi ∂qk ˙qk + ∂xi ∂t ∂xi ∂qj → 3N i=1 mi dxi dt ∂xi ∂qj , (1.18) ∂T ∂qj = 3N i=1 mi ∂xi ∂qk ˙qk + ∂xi ∂t ∂ ∂qj ∂xi ∂ql ˙ql + ∂xi ∂t → 3N i=1 mi dxi dt ∂ ∂qj dxi dt , (1.19) kde šipka naznačuje proceduru „zpětného dosazení funkcí qk (t) za parametry qk a funkcí dqk dt (t) za parametry ˙qk a pak následné využití vztahu (1.16). Odtud již snadno plyne d dt ∂T ∂ ˙qj − ∂T ∂qj = 3N i=1 mi d2 xi d t2 ∂xi ∂qj + dxi dt d dt ∂xi ∂qj − dxi dt ∂ ∂qj dxi dt = 3N i=1 mi d2 xi d t2 ∂xi ∂qj = 3N i=1 Fi ∂xi ∂qj ≡ Qj , (1.20) Tím jsme odvodili Lagrangeovy rovnice II. druhu v jejich nejobecnějším tvaru d dt ∂T ∂ ˙qj − ∂T ∂qj = Qj . (1.21) Jedná se o vyjádření pohybových rovnic soustavy v libovolných zobecněných souřadnicích qj . Matematicky jde o soustavu n obyčejných diferenciálních rovnic 2. řádu pro n neznámých funkcí qj (t), jež popisují trajektorie částic. Dynamika je přitom určena jedinou skalární veličinou, totiž celkovou kinetickou energií T soustavy, a složkami působících zobecněných sil Qj. 1.2.3 Potenciál a Lagrangeova funkce Za příhodných okolností lze Lagrangeovy rovnice ještě více zjednodušit. Především ve fyzikálně důležitých situacích, kdy na hmotné body působí jen konzervativní síly,3 lze obecně komplikované složky zobecněných sil Qj vyjádřit pomocí jediné skalární funkce, totiž potenciálu V (přesněji bychom měli říkat „potenciální energie ). Opravdu, v takovém případě je Qj ≡ 3N i=1 Fi ∂xi ∂qj = − 3N i=1 ∂V ∂xi ∂xi ∂qj = − ∂V ∂qj . (1.22) Když dosadíme toto vyjádření zobecněných sil na pravou stranu rovnice (1.21) a uvážíme-li, že členy ∂V ∂ ˙qj jsou identicky nulové (síly jsou konzervativní a potenciál V proto nemůže záviset na zobecněných rychlostech), můžeme Lagrangeovy rovnice II. druhu přepsat do jednoduchého tavru d dt ∂L ∂ ˙qj − ∂L ∂qj = 0 , (1.23) 3Připomeňme, že silové pole F je konzervativní právě tehdy, když vykonaná práce nezávisí na dráze (pouze na koncových bodech), neboli práce po libovolné uzavřené dráze je nulová. To je ekvivalentní podmínce, že rot F=0, což nastává právě tehdy, když existuje potenciál V takový, že F=–grad V . KAPITOLA 1. LAGRANGEŮV FORMALISMUS 8 kde funkce L(qj , ˙qj , t) je definována jako rozdíl kinetické a potenciální energie L ≡ T − V (1.24) a nazývá se Lagrangeova funkce daného mechanického systému. Vidíme, že pohybové rovnice lze získat přímočarou kombinací (1.23) parciálních derivací z jediné skalární funkce L. V tom je užitečnost Lagrangeova formalismu: oproti obvyklému newtonovskému postupu již není třeba provádět složité rozklady působících sil do směrů jednotlivých souřadnic. Navíc automaticky dostaneme právě tolik rovnic, kolik je stupňů volnosti studovaného systému. Lagrangeovy rovnice (1.23) lze použít ve standardních situacích s konzervativním polem, zejména v homogenním gravitačním poli (V = mgz), v centrálním gravitačním poli (V = c r ), v případě harmonického oscilátoru (V = 1 2 k(x − x0)2 ) atd. 1.2.4 Zobecněný potenciál Jednoduchý tvar (1.23) Lagrangeových rovnic II. druhu platí dokonce i v obecnějších situacích, kdy silové pole již není konzervativní, ale existuje takzvaný zobecněný potenciál. Tím myslíme situaci, kdy působící síla má takový charakter, že k ní existuje funkce V (qj , ˙qj , t) taková, že Qj ≡ d dt ∂V ∂ ˙qj − ∂V ∂qj . (1.25) Zobecnění spočívá v tom, že připouštíme také závislost na zobecněných rychlostech a čase (obyčejný potenciál smí záviset pouze na souřadnicích). Je zjevné, že dosazením (1.25) na pravou stranu obecných pohybových rovnic (1.21) opět dostaneme Lagrangeovy rovnice II. druhu ve tvaru (1.23), kde Lagrangeova fce je dána L = T − V = T (qj , ˙qj , t) − V (qj , ˙qj , t), tedy opět předpisem (1.24). Pro případ konzervativních sil se (1.25) samozřejmě redukuje na jednodušší vztah (1.22). Zdálo by se, že zde popsaný případ je umělý, neboť předpokládá platnost poměrně složitého vztahu (1.25). Podivuhodná příroda ale kupodivu takovouto speciální možnost opravdu realizuje, například ve velmi důležitém případě elektromagnetické interakce. Opravdu, přímým výpočtem lze ukázat (viz cvičení), že pro elektromagnetickou Lorentzovu sílu F = e (E + v × B) existuje zobecněný potenciál V (qj, ˙qj, t) tvaru V = e (ϕ − v · A) , (1.26) kde ϕ je skalární (elektrický) potenciál, zatímco A je vektorový potenciál. Souvislost vektorových elektomagnetických polí a příslušných potenciálů je dána známými vztahy E = −gradϕ − ∂A ∂t a B = rot A. Možnost popsat pohyb částic v obecném elektromagnetickém poli pomocí Lagrangeovy funkce je velmi vítaná po stránce teoretické i praktické a nachází své přirozené zobecnění také v relativistické či kvantové teorii. 1.2.5 Příklad: částice v centrálním poli Lagrangeova praktická „kuchařka pro sestavení pohybových rovnic tedy zní takto: 1. Určíme počet stupňů volnosti n a zavedeme vhodné zobecněné souřadnice qj , j = 1, . . . , n (tedy n parametrů qj jednoznačně popisujících pohyb soustavy v souladu s vazbami). 2. Vyjádříme kartézské souřadnice xi pomocí zobecněných souřadnic qj , t.j. určíme vztahy xi (qj , t), kde i = 1, . . . , 3N, j = 1, . . . , n. 3. Vypočteme kartézské rychlosti dxi dt ≡ d dt [xi (qj (t), t)]. 4. Dosazením do definice kinetické energie T = 1 2 3N i=1 mi dxi dt 2 získáme T (qj , ˙qj , t). 5. Dosazením xi (qj , t) do potenciální energie V (xi ) vypočteme V (qj , t) . 6. Stanovíme Lagrangeovu funkci L = T − V . 7. Jejím derivováním získáme Lagrangeovy pohybové rovnice d dt ∂L ∂ ˙qj − ∂L ∂qj = 0. KAPITOLA 1. LAGRANGEŮV FORMALISMUS 9 Ilustrace: pohyb hmotného bodu v poli centrální síly Budeme postupovat přesně podle výše uvedených bodů: 1. Máme jediný hmotný bod ve třírozměrném prostoru a žádnou vazbu, takže n = 3. Síla v centrálním poli je vždy radiální a její velikost závisí pouze na vzdálenosti od centra. Za tři zobecněné souřadnice q1 , q2 , q3 je tedy přirozené zvolit standardní sférické souřadnice r, ϑ, ϕ. 2. Vztahy xi (qj ) jsou obvyklá vyjádření kartézských souřadnic pomocí sférických, tedy x1 = r sin ϑ cos ϕ , x2 = r sin ϑ sin ϕ , (1.27) x3 = r cos ϑ . 3. Kartézské složky rychlosti získáme úplnou časovou derivací (1.27): dx1 dt = ˙r sin ϑ cos ϕ + r cos ϑ ˙ϑ cos ϕ − r sin ϑ sin ϕ ˙ϕ , dx2 dt = ˙r sin ϑ sin ϕ + r cos ϑ ˙ϑ sin ϕ + r sin ϑ cos ϕ ˙ϕ , (1.28) dx3 dt = ˙r cos ϑ − r sin ϑ ˙ϑ . 4. Dosazením (1.28) do výrazu pro kinetickou energii T = 1 2 m dx1 dt 2 + dx2 dt 2 + dx3 dt 2 zjistíme, že řada členů vypadne a zbylé se zkombinují do jednoduchého výrazu pro kinetickou energii ve sférických souřadnicích: T = 1 2 m( ˙r2 + r2 ˙ϑ2 + r2 sin2 ϑ ˙ϕ2 ) . (1.29) (Povšimněte si, že T je kvadratickou diagonální formou zobecněných rychlostí ˙qj .) 5. Centrální silové pole je sféricky symetrické, a proto příslušná potenciální energie V nemůže záviset na úhlových zobecněných souřadnicích ϑ, ϕ. Proto je V = V (r). Opravdu: provedením gradientu na tuto skalární funkci dostaneme, že příslušná síla má pouze radiální složku, přičemž její velikost závisí jen na vzdálenosti r od centra. 6. Lagrangeova funkce L ve sférických souřadnicích tedy je L = 1 2 m( ˙r2 + r2 ˙ϑ2 + r2 sin2 ϑ ˙ϕ2 ) − V (r) . (1.30) 7. Parciální derivace této Lagrangeovy funkce podle zobecněných rychlostí ˙qj a zobecněných souřadnic qj jsou ∂L ∂ ˙r = m ˙r , ∂L ∂r = mr ˙ϑ2 + mr sin2 ϑ ˙ϕ2 − dV dr , ∂L ∂ ˙ϑ = mr2 ˙ϑ , ∂L ∂ϑ = mr2 sin ϑ cos ϑ ˙ϕ2 , (1.31) ∂L ∂ ˙ϕ = mr2 sin2 ϑ ˙ϕ , ∂L ∂ϕ = 0 . Lagrangeovy rovnice II. druhu (1.23) jsou tedy explicitně: m¨r − mr ˙ϑ2 − mr sin2 ϑ ˙ϕ2 + dV dr = 0 , (mr2 ˙ϑ)˙ − mr2 sin ϑ cos ϑ ˙ϕ2 = 0 , (1.32) (mr2 sin2 ϑ ˙ϕ)˙ = 0 , kde tečka zde značí úplnou časovou derivaci příslušné funkce. Z matematického hlediska je to tedy soustava tří obyčejných diferenciálních rovnic pro tři hledané funkce r(t), ϑ(t), ϕ(t). KAPITOLA 1. LAGRANGEŮV FORMALISMUS 10 Nyní obrátíme pozornost na řešení pohybových rovnic (1.32). Soustava vypadá dosti složitě: proměnné jsou navzájem provázány a rovnice jsou nelineární. Při bližším pohledu ovšem můžeme učinit důležitý exaktní závěr: pohyb částice v libovolném centrálním poli je nutně rovinný. Důkaz této skutečnosti není těžký. Diferenciální rovnici (1.32) přepíšeme do explicitního tvaru ¨ϑ = sin ϑ cos ϑ ˙ϕ2 − 2 ˙r r ˙ϑ . (1.33) Bez újmy na obecnosti však můžeme předpokládat počáteční podmínky ϑ = π 2 a ˙ϑ = 0 v čase t = 0. (Využijeme vlastně volnosti při zavádění sférických zobecněných souřadnic: stačí na počátku orientovat kartézskou osu x3 v (1.27) tak, aby mířila kolmo na „rovníkovou rovinu definovanou vektorem polohy r částice vůči centru a vektorem rychlosti v této částice v počátečním čase t = 0.) Při této volbě pak z diferenciální rovnice (1.33) ihned plyne, že v t = 0 je ¨ϑ = 0. To znamená, že složka zrychlení částice ve směru mimo rovinu ϑ = π 2 je nulová, a proto částice nemůže tuto rovníkovou rovinu nikdy opustit. Matematicky tento fakt plyne z věty o jednoznačnosti řešení rovnice (1.33) ve tvaru ϑ(t) ≡ π 2 pro dané počáteční podmínky.4 Pohyb v poli centrální síly je tedy nutně rovinný. Přestože jsme začali obecnou možností pohybu částice ve třírozměrném prostoru, její skutečný pohyb je efektivně jen dvourozměrný: omezuje se na jedinou rovinu. Později uvidíme, že z fyzikálního pohledu je tato skutečnost důsledkem zachování momentu hybnosti l = r × mv částice v daném systému (moment síly M = r × F totiž vymizí, protože vektor F je radiální, a tedy kolineární s polohovým vektorem r). ⊠⊠⊠ Bez újmy na obecnosti se tudíž naše úloha redukuje na dvojrozměrný problém. Je přirozené v rovině pohybu za zobecněné souřadnice q1 , q2 zvolit standardní polární souřadnice r, ϕ, které s kartézskými souřadnicemi souvisejí vztahy x1 = r cos ϕ , x2 = r sin ϕ , (1.34) (je to vlastně speciální případ (1.27) pro ϑ = π 2 ). Když nyní aplikujeme kuchařku uvedenou v úvodu této části textu, dostaneme Lagrangeovu funkci ve tvaru L = 1 2 m( ˙r2 + r2 ˙ϕ2 ) − V (r) (1.35) a odtud získáme Lagrangeovy rovnice m¨r − mr ˙ϕ2 = − dV dr , (mr2 ˙ϕ)˙ = 0 . (1.36) Rozborem jejich řešení se budeme zabývat v následující části 1.4. 4Podstatou důkazu je rozvinutí funkce ϑ(t) do Taylorova rozvoje, tedy ϑ(t) = ϑ(0) + ˙ϑ(0) t + 1 2 ¨ϑ(0) t2 + . . ., kde ϑ(0) = π 2 a ˙ϑ(0) = 0. V důsledku rovnice (1.33) je ¨ϑ(0) = 0, a v důsledku derivací této rovnice také v počátečním čase t = 0 vymizí všechny vyšší derivace funkce ϑ(t). KAPITOLA 1. LAGRANGEŮV FORMALISMUS 11 1.3 Metody řešení pohybových rovnic a integrály pohybu Lagrangeovy rovnice II. druhu poskytují jasný a praktický algoritmus pro efektivní sestavení pohybových rovnic. Obecně existují tři možné přístupy, jak takto získané diferenciální rovnice vyřešit: • numerické řešení: V dnešní době velmi výkonných počítačů není problém napsat tvar příslušné soustavy obyčejných diferenciálních rovnic do vhodného programovacího prostředí (např. Mathematica, Maple, Famulus atd.) a po zvolení konkrétních počátečních podmínek odpovídající numerické řešení vykreslit. Je však třeba mít na paměti, že při numerickém řešení vyvstává problém spolehlivosti získaných výsledků. Nutně vznikají numerické chyby, které mohou v okolí nestabilních bodů rychle narůstat: získané řešení pak neodpovídá skutečnému. Vždy je proto užitečné mít teoretický vhled do charakteru řešení a výsledek pomocí něj pečlivě testovat, například vhodnými zachovávajícími se veličinami. • přibližné řešení: Soustava pohybových rovnic je obecně složitá, a tak není snadné najít její přesné řešení. Největším problémem je, když jsou diferenciální rovnice nelineární, neboť pak neplatí princip superpozice elementárních řešení. V takovém případě obvykle namísto přesného řešení hledáme jen řešení přibližné: zanedbáme nelineární členy a pak standardním postupem řešíme příslušné aproximované lineární rovnice. Provedení správné linearizace je svého druhu „umění , neboť teprve praxí lze získat zkušenost, které zanedbání členů je fyzikálně oprávněné a konzistentní. Ilustrace linearizace: matematické kyvadlo Je-li zobecněnou souřadnicí výchylka ϕ z rovnovážné polohy, má Lagrangeova funkce tvar L = 1 2 ml2 ˙ϕ2 +mgl cos ϕ. Příslušná rovnice (1.23) pak je ¨ϕ+ g l sin ϕ = 0. Tato nelineární diferenciální rovnice nemá jednoduché řešení, ale snadno můžeme provést její linearizaci pro malé výchylky ϕ ≪ 1. Taylorův rozvoj říká, že v takovém případě sin ϕ ≈ ϕ, takže ¨ϕ + g l ϕ ≈ 0. To je jednoduchá lineární rovnice známá jako rovnice harmonického oscilátoru: jejím řešením jsou harmonické kmity ϕ(t) = ϕ0 cos g l t + δ , kde ϕ0, δ jsou integrační konstanty odpovídající maximální amplitudě a fázi. Poznamenejme, že linearizovanou pohybovou rovnici lze získat předpisem (1.23) také z Lagrangeovy funkce, když ji rozvineme do druhého řádu v proměnné ϕ, tedy L ≈ 1 2 ml2 ˙ϕ2 + mgl(1 − 1 2 ϕ2 ). • přesné řešení: Je samozřejmě ideální, když se nám podaří najít exaktní řešení přesných pohybových rovnic. To je veskrze úloha matematická, při níž musíme uplatnit zručnost a zkušenosti získané v kurzech matematické analýzy. Doporučuje se použít také speciální literaturu a tabulky řešení diferenciálních rovnic. Je přitom pozoruhodné, že Lagrangeův formalismus, který umožňuje efektivně sestavit pohybové rovnice, nám současně poskytuje triky pro jejich řešení ! Jedná se především o konstruktivní postup nalezení tzv. integrálů pohybu (neboli „prvních integrálů pohybových rovnic ), což jsou speciální veličiny, které v průběhu pohybu nemění svoji hodnotu. Začněme jejich definicí a pak uvedeme několik základních vět: Integrál pohybu je výraz tvaru f(qj , ˙qj , t), který v každém okamžiku t nabývá konstantní hodnoty, když ho vyčíslíme podél libovolné trajektorie qj (t) řešící pohybové rovnice daného systému. Přesněji řečeno: jestliže do funkce f dosadíme za zobecněnou souřadnici qj funkci qj (t) popisující skutečný pohyb, a za zobecněnou rychlost ˙qj její časovou derivaci dqj (t) dt , dostaneme funkci f(t) ≡ f(qj (t), ˙qj (t), t). Hodnota této funkce je konstantní, tedy na čase nezávislá (pro různé trajektorie qj (t) je ale příslušná hodnota f(t) = konst. obecně různá). Pro integrál pohybu tedy platí f(t) ≡ f(qj (t), ˙qj (t), t) = konst. neboli df(t) dt = 0 . (1.37) KAPITOLA 1. LAGRANGEŮV FORMALISMUS 12 Uveďmě nyní dvě významné věty: Pokud Lagrangeova funkce L nezávisí na některé zobecněné souřadnici qi (v takovém případě říkáme, že qi je tzv. „cyklická souřadnice ), pak výraz ∂L ∂ ˙qi je integrálem pohybu. Důkaz je snadný: z Lagrangeových rovnic II. druhu (1.23), kde j = 1, . . . , i − 1, i, i + 1, . . . , n, vezmeme právě i-tou, tedy d dt ∂L ∂ ˙qi − ∂L ∂qi = 0. Dle předpokladů věty vymizí druhý člen, takže d dt ∂L ∂ ˙qi = 0 . Porovnáním s (1.37) ihned vidíme, že f ≡ ∂L ∂ ˙qi je integrál pohybu, čímž je důkaz dokončen. ⊠⊠⊠ Příklady: pro volnou částici je V = 0, a proto L = T, neboli v kartézských souřadnicích L = 1 2 m( ˙x2 + ˙y2 + ˙z2 ) . Všechny tři souřadnice jsou zjevně cyklické, a tak věta ihned implikuje tři integrály pohybu: ∂L ∂ ˙x = m ˙x = a , ∂L ∂ ˙y = m ˙y = b , ∂L ∂ ˙z = m ˙z = c , kde a, b, c jsou konstanty. Jedná se samozřejmě o zákon zachování hybnosti. Kdybychom uvažovali částici v homogenním gravitačním poli, měli bychom Lagrangeovu funkci L = 1 2 m( ˙x2 + ˙y2 + ˙z2 ) − mgz . V tomto případě jsou cyklické pouze souřadnice x a y. Ve svislém směru souřadnice z zákon zachování hybnosti neplatí, protože veličina m ˙z při volném pádu částice narůstá. Pokud Lagrangeova funkce L nezávisí explicitně na čase t, pak výraz h(qi , ˙qi ) = n j=1 ∂L ∂ ˙qj ˙qj − L (1.38) (tzv. „zobecněná energie ) je integrálem pohybu. Důkaz: přímo z definice dostaneme dh dt = n j=1 d dt ∂L ∂ ˙qj ˙qj + ∂L ∂ ˙qj ¨qj − ∂L ∂qj ˙qj − ∂L ∂ ˙qj ¨qj , přičemž v souladu s předpokladem věty již nepíšeme člen −∂L ∂t . Druhý a čtvrtý člen se navzájem vyruší a zbylé dva lze přepsat do tvaru dh dt = n j=1 d dt ∂L ∂ ˙qj − ∂L ∂qj ˙qj . Výraz v hranaté závorce je ovšem levá strana Lagrangeovy rovnice (1.23), která je pro skutečný pohyb rovna nule, a proto dh dt = 0, takže h je integrálem pohybu. KAPITOLA 1. LAGRANGEŮV FORMALISMUS 13 ⊠⊠⊠ Příklad: pro částici v kartézských souřadnicích je L = 1 2 m( ˙x2 + ˙y2 + ˙z2 ) − V (x, y, z) , takže h = ∂L ∂ ˙x ˙x + ∂L ∂ ˙y ˙y + ∂L ∂ ˙z ˙z − L = m( ˙x2 + ˙y2 + ˙z2 ) − 1 2 m( ˙x2 + ˙y2 + ˙z2 ) + V = T + V . V tomto případě se tedy v průběhu děje zachovává celková mechanická energie. Není ale pravda , že zachovávající se zobecněná energie h je vždy rovna součtu kinetické energie T a potenciální energie V . Například rheonomní vazby soustavě energii dodávají nebo ji odebírají (ilustrací je třeba korálek na drátu otáčejícím se konstantní úhlovou rychlostí). Můžeme však vyslovit například následující jednoduchou větu: Pokud jsou síly konzervativní a pokud jsou vazby holonomní a současně skleronomní, pak h = T + V = konst. (celková mechanická energie soustavy se tedy zachovává). Důkaz: holonomní a skleronomní vazby mají tvar φ(xi ) = 0, a tudíž xi = xi (qj ), viz (1.15). Pak T = 1 2 3N i=1 mi dxi dt 2 = 1 2 3N i=1 mi n r=1 ∂xi ∂qr ˙qr n s=1 ∂xi ∂qs ˙qs = n r,s=1 3N i=1 1 2 mi ∂xi ∂qr ∂xi ∂qs ˙qr ˙qs . Definujeme-li (symetrickou) matici Ars(qj ) ≡ 3N i=1 1 2 mi ∂xi ∂qr ∂xi ∂qs , můžeme kinetickou energii soustavy vyjádřit T = n r,s=1 Ars ˙qr ˙qs . To je zjevně kvadratická funkce ve zobecněných rychlostech, a proto n j=1 ∂T ∂ ˙qj ˙qj = n j,r,s=1 Arsδr j ˙qs + Ars ˙qr δs j ˙qj = 2 n r,s=1 Ars ˙qr ˙qs = 2T (ve skutečnosti jsme právě dokázali speciální případ tzv. Eulerovy věty o homogenních funkcích). Nyní už snadno pro potenciál nezávislý na rychlostech z definice (1.38) odvodíme, že h = n j=1 ∂T ∂ ˙qj ˙qj − L = 2T − T + V = T + V . ⊠⊠⊠ V následující části nyní ukážeme aplikaci předchozích vět, a to na příkladě pohybu hmotného bodu v centrálním poli. Jak uvidíme, jedná se o fyzikálně důležitou úlohu, která souvisí nejen s pohybem planet, ale také například s rozptylem elementárních částic. KAPITOLA 1. LAGRANGEŮV FORMALISMUS 14 1.4 Pohyb v poli centrální síly V předchozí části 1.2.5 jsme dokázali, že pohyb částice v centrálním poli je nutně rovinný, a proto postačuje zavést polární souřadnice r, ϕ v „rovině ekliptiky . V těchto zobecněných souřadnicích má Lagrangeova funkce tvar (1.35), tedy L = 1 2 m( ˙r2 + r2 ˙ϕ2 ) − V (r). K nalezení možných pohybů s výhodou použijeme integrály pohybu: • souřadnice ϕ je cyklická, takže veličina ∂L ∂ ˙ϕ je integrál pohybu. To konkrétně znamená, že mr2 ˙ϕ = l = konst. (1.39) Jedná se zjevně o zákon zachování momentu hybnosti |l| = |l| = |r × mv|. • Lagrangeova funkce nezávisí explicitně na čase, takže se zachovává zobecněná energie, která je v tomto případě rovna celkové mechanické energii T + V = E, neboli 1 2 m( ˙r2 + r2 ˙ϕ2 ) + V (r) = E = konst. (1.40) Namísto řešení pohybových rovnic 2. řádu (1.36) tedy bez újmy na obecnosti stačí řešit jen integrály pohybu (1.39) a (1.40). To jsou dvě obyčejné diferenciální rovnice 1. řádu (obsahující již dvě integrační konstanty l a E) pro hledané funkce r(t) a ϕ(t). Nabízí se z rovnice (1.39) vyjádřit ˙ϕ = l mr2 (1.41) a pak dosadit do rovnice (1.40); po úpravě tak dostaneme ˙r2 = 2 m E − V (r) + l2 2mr2 . (1.42) Po odmocnění lze tuto rovnici vyřešit separací proměnných: t − t0 = dr 2 m E − V (r) + l2 2m r−2 . (1.43) Stačí tedy najít tento jediný integrál (provést tzv. kvadraturu), a to například numericky. Pro obecný tvar potenciálu V (r) je to analyticky obtížné, explicitně se dají vyčíslit jen jisté speciální případy, a i ty obvykle nejsou v explicitním nýbrž parametrickém tvaru. Teoreticky však lze takto integrovanou a invertovanou funkci r(t) dosadit do rovnice (1.41) a po provedení další integrace separací proměnných získat funkci ϕ(t), čímž je úloha nalézt trajektorii hmotného bodu v daném centrálním poli kompletně vyřešena. Je zajímavé, že pro určení tvaru trajektorie v polárních souřadnicích r(ϕ) není často nutné úlohu nejprve dle předchozího postupu vyřešit a následně pak vyloučit časovou závislost z funkcí r(t) a ϕ(t). Můžeme postupovat přímo užitím Binetova vzorce d2 u dϕ2 + u = − m l2 dV du , (1.44) kde proměnná u je inverzní radiální vzdálenost u = 1 r . (1.45) Důkaz: Protože r = 1 u(ϕ) , dostáváme časovou derivací a užitím vztahu (1.41) ˙r = d dt 1 u(ϕ(t)) = − 1 u2 du dϕ ˙ϕ = − 1 u2 du dϕ l mr2 = − l m du dϕ . KAPITOLA 1. LAGRANGEŮV FORMALISMUS 15 Dosazením do rovnice (1.42) získáme l2 m2 du dϕ 2 + l2 m2 u2 = 2 m [E − V (u)] , (1.46) jehož derivací podle proměnné ϕ a zkrácení konstantami obdržíme du dϕ d2 u dϕ2 + u du dϕ = − m l2 dV du du dϕ . Pro případ du dϕ = 0 lze tímto společným faktorem vydělit, čímž opravdu dospějeme k (1.44). ⊠⊠⊠ Po zadání konkrétního potenciálu V (r(u)) do Binetova vzorce získáme obyčejnou diferenciální rovnici 2. řádu pro funkci u(ϕ), jejímž převrácením r(ϕ) = 1 u(ϕ) získáme hledaný tvar trajektorie. 1.4.1 Pohyb planet aneb Keplerova úloha Důležitým příkladem pohybu v centrálním poli jsou trajektorie planet a jiných astronomických těles obíhajících v gravitačním poli Slunce. Ukážeme nyní, jak z výše uvedené Lagrangeovy formulace mechaniky snadno plynou Keplerovy zákony. Gravitační pole Slunce hmotnosti M je dáno potenciálem V (r) = − α r , α = GMm je kladná konstanta. (1.47) V reciproké souřadnici (1.45) má potenciál tvar V = −αu a jeho derivace je dV du = −α, takže Binetův vzorec (1.44) je nyní explicitně d2 u dϕ2 + u = αm l2 . Ihned najdeme obecné řešení této lineární diferenciální rovnice s konstantní pravou stranou. Obecné řešení homogenní rovnice je u0 = C cos ϕ (bez újmy na obecnosti můžeme položit počáteční fázi ϕ0 = 0) a partikulární řešení úplné rovnice je zjevně up = αm l2 . Kompletní řešení tedy je 1 r = u = up + u0 = αm l2 + C cos ϕ = αm l2 (1 + ε cosϕ), kde konstanta ε nahrazuje C. Máme tedy r = p 1 + ε cosϕ , (1.48) kde konstanty jsou dány p = l2 αm = l2 GMm2 , (1.49) ε2 − 1 = 2l2 E α2m = 2l2 E G2M2m3 . (1.50) Důkaz: Dosazením kompletního řešení (1.48), tedy u = 1 p (1 + ε cos ϕ), a z něj plynoucí derivace du dϕ = −ε p sin ϕ do rovnice (1.46) dostaneme 1 p2 (ε2 sin2 ϕ + 1 + 2ε cosϕ + ε2 cos2 ϕ) = 2m l2 [E + αu] = 2m l2 [E + α p (1 + ε cos ϕ)] , což po úpravě dává 1 + ε2 + 2ε cosϕ = 2mp2 l2 E + 2(1 + ε cosϕ), a tedy ε2 − 1 = 2mp2 l2 E. Důvod, proč je integrační konstanta ε z Binetova vzorce takto jednoznačně učena, spočívá v tom, že Binetova diferenciální rovnice 2. řádu (1.44) vznikla derivací původní rovnice (1.46) 1. řádu, kde jako fyzikální parametr vystupuje integrál pohybu E, který při derivování vypadl. ⊠⊠⊠ KAPITOLA 1. LAGRANGEŮV FORMALISMUS 16 Dospěli jsme tak k pěknému výsledku: tělesa se ve sluneční soustavě pohybují po kuželosečkách, protože rovnice (1.48) není nic jiného než obvyklé vyjádření kuželoseček v polárních souřadnicích s ohniskem v počátku r = 0, kde je umístěno Slunce. V závislosti na parametru ε zvaném numerická excentricita totiž funkce (1.48) popisuje kružnici (ε = 0), elipsu (0 < ε < 1), parabolu (ε = 1) resp. hyperbolu (ε > 1). Podle (1.50) tyto čtyři možné situace odpovídají případům, kdy celková zachovávající se mechanická energie je E = Emin ≡ −G2 M2 m3 2l2 < 0, Emin < E < 0, E = 0, resp. E > 0. Druhý parametr p, který určuje velikost kuželosečky, je podle (1.49) určen (kromě hmotností Slunce a obíhajícího tělesa) zachovávajícím se momentem hybnosti l. Výše uvedeným postupem jsme tedy odvodili první z Keplerových zákonů: 1. Keplerův zákon : Planety se pohybují po elipsách se Sluncem v ohnisku. 2. Keplerův zákon : Spojnice Slunce a planety opisuje za stejné časové intervaly stejné plochy. 3. Keplerův zákon : Pro všechny planety je podíl T 2 a3 stejná konstanta. Důkaz: Celková mechanická energie E každé planety je záporná, a proto se nemůže vymanit z gravitačního potenciálu Slunce. Dle (1.50) je proto nucena obíhat kolem něj po eliptické orbitě (1.48) s ε < 1. Je to uzavřená trajektorie, která je 2π periodická.5 Perihelium (přísluní) nastává pro ϕ = 0 (odpovídající přirozené volbě počáteční fáze ϕ0 = 0) a má hodnotu rp = p 1+ε . Naopak afelium (odsluní) nastává pro ϕ = π a má hodnotu ra = p 1−ε . Geometricky je elipsa určena hlavní poloosou a a vedlejší poloosou b. Protože excentricita e je dána vztahem e ≡ εa, můžeme z jednoduchého vztahu rp = a − e případně ra = a + e odvodit, že p = a(1 − ε2 ). Dosazením z (1.49) a (1.50) tak ihned dostáváme a = GMm 2|E| . (1.51) Hlavní poloosa eliptické dráhy a je tedy (kromě konstantních hmotností) určena celkovou energií planety E a nezávisí na jejím momentu hybnosti l. Druhý Keplerův zákon je vlastně jen geometrickým vyjádřením zákona zachování momentu hybnosti (1.39). Plošná rychlost (tedy plocha opsaná spojnicí planety se Sluncem za krátký čas) je dána výrazem dS dt = 1 2 r2 ˙ϕ. Užitím vztahu (1.41) tak okamžitě dostáváme dS dt = l 2m , (1.52) což je opravdu konstanta úměrná momentu hybnosti planety. Konečně třetí Keplerův zákon získáme přímou integrací druhého. Ze vztahu (1.52) tak plyne S = dS = l 2m dt = l 2m T, kde T je doba oběhu planety. Protože plocha elipsy je určena vzorcem S = πab a díky známému vztahu a2 = e2 + b2 můžeme vyjádřit b = a √ 1 − ε2, dostáváme T 2 = 4π2 m2 l2 a4 (1 − ε2 ) = 4π2 m2 l2 p a3 = 4π2 GM a3 , neboli T 2 a3 = 4π2 GM . (1.53) 5Uzavřenost trajektorií je důsledkem newtonovského tvaru potenciálu. Pro jiné potenciály V (r) nemá příslušné řešení Binetovy rovnice periodický charakter a dochází k posuvu perihelia. Podle tzv. Bertrandova teorému pouze potenciály V ∼ 1/r a V ∼ r2 vedou na uzavřené periodické trajektorie. KAPITOLA 1. LAGRANGEŮV FORMALISMUS 17 Podíl druhé mocniny oběžné doby planety a třetí mocniny hlavní poloosy její eliptické dráhy je tedy (až na univerzální konstanty) dán pouze hmotností Slunce. Ze vzorce (1.53) lze tedy snadno stanovit hmotnost objektu budícího centrální gravitační pole: chceme-li například zjistit hmotnost Slunce, stačí do tohoto vzorce dosadit příslušné hodnoty T a a pro libovolnou planetu, chceme-li zjistit hmotnost Země, použijeme odpovídající hodnoty T a a Měsíce, chceme-li zjistit hmotnost planety, stačí dosadit oběžnou dobu a hlavní poloosu kterékoli její oběžnice (pochopitelně jen v případě, že lze zanedbat působení ostatních těles). ⊠⊠⊠ 1.4.2 Historická vsuvka z rudolfínské Prahy Keplerovy zákony bez nadsázky stojí u kolébky fyziky a moderní přírodovědy, neboť právě z nich Newton vyvodil a roku 1687 v Principiích v ucelené podobě prezentoval svůj gravitační zákon. Můžeme považovat za čest, že první dva z těchto zákonů zformuloval císařský matematik Johannes Kepler během svého plodného dvanáctiletého pobytu na dvoře císaře Rudolfa II. v Praze. Johannes Kepler (∗ 27. 12. 1571 Weil der Stadt, † 15. 11. 1630 Řezno) Osmadvacetiletý Kepler přichází do Prahy v lednu roku 1600 a stává se asistentem věhlasného císařského astronoma Tychona Brahe. Tím začala, jak praví Z. Horský ve své výtečné monografii Kepler v Praze (Mladá fronta, Praha, 1980), „osobní spolupráce nejlepšího pozorovatele dané epochy s jejím nejlepším teoretikem (byť nebyla zcela bez problémů a trvala jen krátce do Brahovy smrti 24. 10. 1601). Kepler pak postupně utřídil a vyhodnotil Brahova pečlivá pozorování pohybu planet, zejména Marsu. Na základě těchto systematických dat dosud nebývalé přesnosti odvodil po četných peripetiích své tři geometrické zákony pohybu nebeských objektů. První a druhý Keplerův zákon byl publikován v rozsáhlém díle Astronomia nova (Nová astronomie) z roku 1609, třetí Keplerův zákon pak v roce 1619 v Linci v díle Harmonice mundi (Harmonie světa). Především první Keplerův zákon přinesl podstatné vylepšení Koperníkova heliocentrického systému.6 Zásluhou Mikuláše Koperníka začal „vesmírný stroj pracovat v rozumném uspořádání, ale ještě ne dokonale. Stále bylo totiž nutné skládat kruhové pohyby epicyklů po deferentu vůči ekvantu, aby bylo dosaženo stejné přesnosti předpovědí, jaké dosahovala dosavadní Ptolemaiova geocentrická soustava. Kepler nahradil celý tento složitý systém kruhových pohybů jedinou elipsou. Inspirací mu přitom byly nejspíš jeho práce z optiky: Kepler teoreticky studoval odrazy světla na kuželosečkách a jako první zavedl pojem ohniska. Není však vyloučen ani nepřímý vliv z oboru architektury, konkrétně eliptický půdorys tzv. Vlašské kaple (dnes součást komplexu Klementina), nejstarší raně barokní stavby v Čechách budované v letech 1590–1597 italskými staviteli. 6Koperníkovo fundamentální dílo De revolutionibus orbium coelestium (O obězích nebeských sfér) vyšlo r. 1543. KAPITOLA 1. LAGRANGEŮV FORMALISMUS 18 1.4.3 Metoda efektivního potenciálu Vraťme se nyní ke vztahu (1.42), který popisuje trajektorie v obecném centrálním poli. Zavedeme užitečnou a jednoduchou metodu, pomocí níž lze provést správný kvalitativní rozbor možných pohybů, aniž bychom museli příslušnou diferenciální rovnici explicitně vyřešit. Definujme pomocnou veličinu zvanou efektivní potenciál vztahem Vef (r) = V (r) + l2 2mr2 . (1.54) Vlastně jsme jen k potenciálu centrální síly V (r) přičetli „odstředivý člen , který souvisí se zákonem zachování momentu hybnosti l, viz substituce (1.41). Potom můžeme rovnici (1.42) přepsat ˙r2 = 2 m E − Vef (r) , (1.55) kde konstanta E vyjadřuje zachovávající se celkovou mechanickou energii, zatímco ˙r je rychlost planety v radiálním směru. Podstata metody spočívá v následujícím triviálním tvrzení: Pohyb je možný jen pro taková r, kde Vef (r) ≤ E , jinak by pravá strana (1.55) byla záporná, takže by nemohla být druhou mocninou reálné veličiny. Uvedenou podmínku lze velmi dobře analyzovat graficky, jestliže vykreslíme graf efektivního potenciálu (pro daný moment hybnosti l). Například pro newtonovské gravitační pole (1.47) má efektivní potenciál tvar znázorněný na tomto obrázku (pro velké hodnoty r převládá Newtonův potenciál ∼ −1 r , zatímco pro malé hodnoty r dominuje odtředivý člen ∼ + 1 r2 ): Pod grafem funkce Vef (r) se nachází zakázaná oblast, kam se planeta nikdy nemůže dostat, protože by byla porušena výše uvedená podmínka. Pro danou hodnotu energie E, kterou má těleso stejnou pro každé r (protože se zachovává), existují body obratu určené průsečíkem vodorovné přímky E = konst. s grafem efektivního potenciálu. V bodech obratu je E = Vef (r), takže ˙r = 0, což znamená, že radiální rychlost je právě nulová: planeta (v daný okamžik) zastaví své přibližování ke Slunci anebo své vzdalování od něj (ocitne se v periheliu resp. afeliu). Počet bodů obratu a tím i kvalitativní charakter pohybu pochopitelně závisí na hodnotě E. Z obrázku vidíme, že pro E > 0 existuje jen jeden bod obratu (perihelium) a že pohyb je neomezený — těleso může odletět do nekonečna, což je v souladu se vztahem (1.50), který v takovém případě vede na hyperbolický pohyb. Mezní (parabolický) případ nastává pro E = 0. Pokud E < 0, existují dva body obratu (perihelium i afelium), což odpovídá omezenému eliptickému pohybu planet. Vidíme také, že existuje unikátní kruhový pohyb na hodnotě poloměru r0 = p, jenž je právě minimem efektivního potenciálu Vef . Protože se jedná o minimum, je kruhová dráha zjevně stabilní orbitou. Zde popsaná metoda efektivního potenciálu je velmi názorná a užitečná pro kvalitativní analýzu možných pohybů v obecných potenciálech V (r), včetně rozboru stability drah. (Například kruhový pohyb v místě maxima příslušného efektivního potenciálu je nestabilní — to nastává např. pro pohyb objektu v blízkém okolí černé díry v kontextu Einsteinovy obecné teorie relativity.) KAPITOLA 1. LAGRANGEŮV FORMALISMUS 19 1.4.4 Rozptyl nabitých částic Jiným významným případem pohybu v centrálním poli je rozptyl částic v coulombickém poli. Tento problém sehrál klíčovou roli počátkem 20. století, kdy se fyzika vydala na cestu do mikrosvěta a začala zkoumat strukturu atomů. Uvažujme dvě nabité bodové částice, které se elektrostaticky odpuzují. Coulombický potenciál V (r) = − α r , α = − Q1Q2 4πǫ0 je záporná konstanta , (1.56) má stejný tvar jako newtonovský gravitační potenciál (1.47) až na to, že konstanta α má nyní opačné znaménko. Předpokládejme, že částice s nábojem Q1 je pevná (je to těžké „jádro atomu ), zatímco na ni nalétávající částice s nábojem Q2 je mnohem lehčí (jde např. o „α-částici ). Její trajektorii v centrálním poli již známe, neboť musí mít stejný tvar jako (1.48).7 Protože E > 0, podle (1.50) je ε > 1 — jde tedy o hyperbolu. Zde nás zajímá především směr vstupní a výstupní asymptoty, které jsou dány podmínkou r → ∞, což podle (1.48) odpovídá hodnotám cos ϕa = −1 ε . Celková odchylka θ částice (úhel mezi vstupní a výstupní asymptotou) je dána podmínkou 90◦ + θ/2 = ϕa , viz obrázek: Jednoduchými úpravami a pak užitím vztahu (1.50) odtud plyne tan θ 2 = tan(ϕa − 90◦ ) = − cos ϕa sin ϕa = 1 ε 1 − 1 ε2 = 1 √ ε2 − 1 = α2m 2l2E . Když nyní dosadíme za α z (1.56) a vyjádříme zachovávající se veličiny E a l pomocí asymptotických hodnot E = 1 2 mv2 ∞ a l = bmv∞, kde b je impaktní parametr, dostaneme nakonec tan θ 2 = Q1Q2 4πǫ0 mv2 ∞ 1 b . (1.57) Tento vzorec udává velikost odchylky θ směru letu částice, jestliže nalétává na centrum „v kolmé vzdálenosti b. V limitním případě b = ∞ částice není centrálním polem vůbec ovlivněna, a tak je θ = 0. Pokud naopak nalétává na centrum přímo (tedy radiálně), je b = 0 a vychází θ = 180◦ , což odpovídá jejímu odrazu zpět. V typickém rozptylovém experimentu existuje proud mnoha nabitých částic, které při průletu terčíkem (např. tenkou kovovou fólií) individuálně interagují s příslušnými centry. Mají při tom různé impaktní parametry b, a tudíž i odpovídající úhly rozptylu θ dané vzorcem (1.57). Máli částice impaktní parametr z intervalu (b, b + db), rozptýlí se pod úhlem ležícím v intervalu (θ, θ + dθ), jak je naznačeno na tomto obrázku: 7Poznamenjme, že zde α < 0, takže dle (1.49) je p < 0. Musí proto být 1 + ε cos ϕ < 0, neboli cos ϕ < − 1 ε . KAPITOLA 1. LAGRANGEŮV FORMALISMUS 20 Obvykle definujeme tzv. účinný průřez rozptylu dσ do intervalu (θ, θ + dθ) vztahem ndσ = dN N , kde N je celkový počet nastřelených částic, dN je počet částic, které se odchýlí do intervalu (θ, θ + dθ), a n je počet rozptylových center na 1 m2 . Veličina dσ má podle obrázku evidentně rozměr plochy: je to „efektivní plocha, kterou musí částice zasáhnout, aby se odchýlila do daného elementárního mezikruží kolem úhlu θ, t.j. dσ = dS = 2πb db. Dosazením z invertované funkce (1.57), tedy b(θ) = Q1Q2 4πǫ0 mv2 ∞ cot θ 2 , dostáváme8 dσ = π Q1Q2 4πǫ0 mv2 ∞ 2 cos θ 2 sin3 θ 2 dθ . (1.58) Vyjádřeno pomocí prostorového úhlu dΩ = 2π sin θ dθ tedy platí dσ = Q1Q2 8πǫ0 mv2 ∞ 2 dΩ sin4 θ 2 , (1.59) což je slavný Rutherfordův vztah pro pružný rozptyl v coulombickém poli. Rutherford ho nejprve odvodil teoreticky a poté (v roce 1911) se svými spolupracovníky experimentálně ověřil rozptylem α-částice na atomech zlata. Experiment jasně prokázal, že dochází ke coulombickému rozptylu na bodovém kladně nabitém centru (nikoli například na rozptýleném nábojovém oblaku), čímž byl učiněn objev atomového jádra o velikosti řádově 10−15 m. 1.5 Problém dvou těles Uvažujme nyní dva navzájem gravitačně interagující volné objekty (např. dvojhvězdný systém) o hmotnostech m1 a m2. Oproti Keplerově úloze tedy již nepředpokládáme, že centrum je pevné. Máme proto celkem 6 stupňů volnosti. Ukážeme ale, že po vhodném rozseparování na 3+3 stupně volnosti lze tuto úlohu převést na problém pohybu v poli centrální síly, který jsme již vyřešili v části 1.4. 8po vypuštění znaménka „− , což souvisí s tím, že b(θ) je klesající funkce KAPITOLA 1. LAGRANGEŮV FORMALISMUS 21 Trik spočívá v přechodu ke vhodným zobecněným souřadnicím: namísto polohových vektorů r1, r2 obou objektů zavedeme polohu těžiště R a relativní polohu r, a to vztahy R = m1r1 + m2r2 m1 + m2 , r = r1 − r2 , (1.60) t.j. inverzně r1 = R + m2 m1 + m2 r , r2 = R − m1 m1 + m2 r . (1.61) Lagrangeova funkce pak má tvar L = 1 2 m1 ˙r2 1 + 1 2 m2 ˙r2 2 + Gm1m2 |r1 − r2| = 1 2 (m1 + m2) ˙R 2 + 1 2 m1m2 m1 + m2 ˙r2 + Gm1m2 |r| . (1.62) Vidíme, že tři souřadnice (složky vektoru) R jsou cyklické, takže (m1 + m2) ˙R = konst. Platí tedy zákon zachování celkové hybnosti soustavy. Pohyb těžiště je proto rovnoměrný (bez zrychlení) a bez újmy na obecnosti můžeme přejít do těžišťového systému, kde R = 0, neboli dle (1.61) platí r1 = m2 m1+m2 r, r2 = − m1 m1+m2 r. V této těžišťové soustavě pak má Lagrangeova funkce (1.62) tvar L = 1 2 µ ˙r2 + Gm1m2 r , (1.63) kde jsme zavedli veličinu µ = m1m2 m1 + m2 (1.64) zvanou redukovaná hmotnost. Porovnáme-li nyní tvar Lagrangeovy funkce (1.63) s (1.30), vidíme, že problém dvou těles byl efektivně převeden na předchozí problém pohybu jediné (fiktivní) částice hmotnosti µ v centrálním gravitačním poli pevného centra. Z předchozích kapitol víme, že výsledný pohyb musí být nutně rovinný. Je tedy výhodné zavést polární souřadnice, ve kterých L = 1 2 µ( ˙r2 + r2 ˙ϕ2 ) + G(m1 + m2)µ r , (1.65) kde jsme využili ekvivalence Gm1m2 a G(m1 + m2)µ . Pro případ m2 ≪ m1 je zjevně µ ≈ m2 a r1 ≈ 0, r2 ≈ −r, limitně tedy dostáváme Keplerovu úlohu vyřešenou v části 1.4. V obecném případě srovnatelných hmotností obou hvězd postupujeme při řešení naprosto stejně jako v části 1.4.1, provedeme pouze formální substituci M → (m1 + m2) a m → µ. Například 3. Keplerův zákon (1.53) bude mít pro dvojhvězdy tvar T 2 a3 = 4π2 G(m1 + m2) . (1.66) Tento výraz se v astronomii používá k určování hmotností dvojhvězd. Víme, že orbity vázaného systému mohou být jen kruhové anebo eliptické. V prvním případě jsou obě hvězdy stále stejně daleko od sebe, ve druhém se navzájem přibližují a zase vzdalují dle „eliptického pravidla . Výslednou dráhu obou těles ovšem musíme vykreslit tak, aby jejich těžiště zůstávalo stále na stejném místě. Pokud mají obě hvězdy naprosto stejnou hmotnost, budou obíhat po stejně velkých kružnicích resp. elipsách. Pokud je však m1 > m2, bude první hvězda obíhat po menší dráze než druhá hvězda, jak je naznačeno na následujícím obrázku: KAPITOLA 1. LAGRANGEŮV FORMALISMUS 22 1.6 Problém tří těles Mohlo by se zdát, že přidáním dalšího hmotného bodu do gravitačně interagujícího systému se problém nalezení jeho pohybu příliš nezkomplikuje. Ukazuje se kupodivu, že tomu tak není. Problém tří těles (který má 9 stupňů volnosti) již není obecně analyticky řešitelný. Tím chceme říci, že neexistuje žádná metoda, kterou by se tato úloha dala — po vzoru předchozí kapitoly — redukovat například na tři jednočásticové situace nebo na jinou rozumnou, obecně řešitelnou soustavu rovnic. Poincaré již v roce 1889 dokázal, že neexistuje dostatečný počet integrálů pohybu umožňujících nalézt řešení kvadraturami t.j. převést problém tří těles na výpočet pouhých integrálů. Kromě některých speciálních explicitních periodických řešení nezbývá tedy jiná možnost, než integrovat příslušné pohybové rovnice numericky anebo použít sofistikované aproximativní metody. Dokonce ani tzv. omezený problém tří těles není obecně řešitelný. V něm se předpokládají dodatečné omezující podmínky: uvažuje se jen situace, kdy všechna tři tělesa obíhají ve stejné rovině, dále že dvě tělesa o hmotnostech M1 a M2 obíhají navzájem po kružnicích, a že třetí těleso má vůči nim zanedbatelnou hmotnost m, tedy že poruchy jím způsobené v pohybu obou těžkých těles jsou zanedbatelné. V takovém případě se úloha redukuje na pohyb jedné testovací částice v daném poli dvou přitažlivých center. Potenciálové pole je však netriviální a navíc se otáčí. Tím se do hry efektivně zapojují také neinerciální síly, např. Coriolisova. Výsledkem je neintegrovatelný systém, pro nějž je typické složité „chaotické chování: hovoříme o tzv. systému s deterministickým chaosem. Pohyb je sice matematicky jednoznačně určen soustavou (nelineárních) diferenciálních rovnic, příslušné řešení je ale obecně velmi komplikované. Jeho podstatnou vlastností je extrémně citlivá závislost na volbě počátečních dat. Takovýchto systémů existuje v teoretické mechanice celá řada (např. dvojkyvadlo, težký nesymetrický setrvačník atd.) a jejich studiem se zabývá rychle se rozvíjející moderní obor dynamiky nelineárních systémů. KAPITOLA 1. LAGRANGEŮV FORMALISMUS 23 Více podrobností o této problematice lze nalézt například v učebnicích: P. Andrle: Základy nebeské mechaniky, Academia, Praha, 1971; Nebeská mechanika, 1987. J. Horák, L. Krlín: Deterministický chaos, Academia, Praha, 1996. V. I. Arnold: Mathematical Methods of Classical Mechanics, Springer, New York, 1978. A. J. Lichtenberg, M. J. Lieberman: Regular and Stochastic Motion, Springer, New York, 1983. E. Ott: Chaos in dynamical systems, Cambridge University Press, Cambridge, 1993.