Teoretická fyzika - Základy speciální teorie relativity
Michal Lenc - podzim 2012
Obsah
Teoretická fyzika - Základy speciální teorie relativity...................................................1
1. Princip relativity..................................................................................................2
1.1 Galileiho princip relativity......................................................................................2
1.2 Události, interval.....................................................................................................3
1.3 Lorentzova transformace.........................................................................................4
1.4 Einsteinův princip relativity....................................................................................4
1.5 Relativistická kinematika........................................................................................5
1.6 Hybnost a energie...................................................................................................5
1.7 Více o intervalu.......................................................................................................7
2. Příklady relativistických jevů..............................................................................7
2.1 Aberace světla.........................................................................................................7
2.2 Comptonův rozptyl.................................................................................................9
2.3 Dopplerův jev.......................................................................................................10
2.4 Vstřícné svazky.....................................................................................................12
3. Ctyřvektory.......................................................................................................13
3.1 Základní pojmy.....................................................................................................13
3.2 Lorentzova grupa..................................................................................................14
3.3 Čtyřrychlo sta čtyřzrychlení..................................................................................16
3.4 Princip nejmenšího účinku....................................................................................17
4. Náboj v elektromagnetickém poli......................................................................19
4.1 Čtyřrozměrný potenciál a účinek...........................................................................19
4.2 Invarianty elektromagnetického pole.....................................................................21
4.3 Pohyb náboje v konstantním homogenním poli.....................................................22
]
4.4 Adiabatický invariant
26
1. Princip relativity
1.1 Galileiho princip relativity
Princip relativity říká, že fyzikální zákony mají stejný tvar ve všech inerciálních souřadných soustavách. Inerciální soustava je definována tak, že se v ní volná částice pohybuje rovnoměrným přímočarým pohybem, musí tedy být vzájemný pohyb dvou různých inerciálních soustav rovnoměrný přímočarý. Galileiho princip relativity předpokládá vztah mezi časem a prostorovými souřadnicemi v soustavě K a K;(ta má se soustavou stejně orientované souřadné osy)
t = r + ť , r=p + r'+Vť , (1.1) přitom obvykle ztotožníme počátek odečítání času a prostorových souřadnic, tj. pokládáme r = 0, p=0 . Porovnání druhého Newtonova pohybového zákonu v soustavách K a K7
m-
d2f
F(f,t)
m-
d2f
.12
f' ř',ť
(1.2)
dť v ' dť vede po dosazení (1.1) do druhé rovnice v (1.2) k podmínce transformace síly
F(f,t) = F/(f-Vt,t) . (1.3)
Jestliže síla splňuje podmínku (1.3), vyhovuje pohybová rovnice daná druhým Newtonovým zákonem Galileiho principu relativity. Je tomu tak například vždy, závisí-li síla na vzdálenosti částice od nějakého silového centra (nebo od jiné částice). Ale také například Lorentzova síla v homogenním elektrickém a magnetickém poli by vyhovovala Galileovu principu relativity, pokud by se pole transformovala podle vztahu
Eó = Eo+VxBo ' Bó = Bo • Pole se ale ve skutečnosti (jako řešení Maxwellových rovnic) transformují jako p/ _p ť)/ _t3
^OH ^OH ' °0|| °0|| '
J—'n i j-:- ? J^n i
(1.4)
(1.5)
■"ox
Vl-V2/c2 ' 0± Vl-V2/c2 Podívejme se, jak se při Galileiho transformaci chová vlnová rovnice
Id2 d2 d2 d2 ^
c2dt2 dx2 dy2 dz2
(1.6)
2
Pro jednoduchost předpokládejme, že se soustava K7 pohybuje vůči K podél osy x. Je pak
d _ dx d ^ dť d dx dx dx1 dx dť
d dx' d dť d f
dt dt dx dt dť
-V
v
d2 d2
dx2 dx'2
d
dx1 + —-
dť J
(1.7)
d2 ,,2 d2 d2 _ d2
—- + —^-2V-
dť dx'2 dť2 dx'dť
Máme tedy pro ďAlembertův operátor v pohybující se soustavě jiný výraz než v původní soustavě, a mohli bychom tedy principiálně odlišit privilegovanou inerciální soustavu v klidu. 1.2 Události, interval
Základním pojmem pro úvodní úvahy o Einsteinově principu relativity je událost (pro jednoduchost na chvíli dvě prostorové dimenze potlačíme), charakterizovaná časem t a bodem na ose x, kdy a kde k události došlo. Hodnoty samozřejmě závisí na volbě souřadné soustavy. Připomeňme si známou situaci, kdy poloha bodu v rovině je charakterizována kartézskými souřadnicemi x a y. Hodnoty závisí na poloze počátku a na orientaci os souřadné soustavy. Vezmeme-li však čtverec vzdálenosti dvou bodů
l2=(x2-x1)2+(y2-y1)2 , (1.8)
zjistíme snadno, že je ve všech kartézských soustavách stejný. Transformační rovnice mezi soustavami K a K7 jsou
x = a + cos^x7 + sin<^ y' , y = b — sin^x7 + cos(p y' . (1-9) Einstein předpokládal, že rychlost šíření světla ve vakuu c =299 792 458 m s-1 je ve všech inerciálních souřadných soustavách stejná. Potom pro dvě události, spojené šířením světla ve vakuu (např. první událostí je emise nějakého fotonu, druhou událostí absorpce tohoto fotonu) platí (první člen je čtverec součinu rychlosti a doby šíření, ten musí být přirozeně roven druhému členu, což je čtverec vzdálenosti, kterou světlo urazilo)
c2(t2-t1)2-(x2-x1)2=0 , c2(t£-tí)2-(^-^)2=0 • (1.10) V zobecnění pak nazveme veličinu
s2=c2(t2-t1)2-(x2-x1)2 (1.11) čtvercem intervalu mezi (libovolnými) dvěma událostmi.
Všimněme si, že invariance (1.8) vzhledem k transformaci (1.9) vychází ze vztahu cos2 <^ + sin2
cosh y/ = , , sinh y/ = , (1-13)
a výsledný vztah pro Lorentzovu transformaci (přidáme dva dosud potlačené rozměry geometrického prostoru)
cť +J3x' x'+Vť , , „ 1AS
ct= .-^—- , x= - , y=y; , z=z; . (1.14)
Vi-a2 V1-a2
1.4 Einsteinův princip relativity
Pro infinitezimálně blízké události můžeme psát interval jako
ds2=c2dt2-(dx2+dy2 + dz2) (1.15) a Lorentzovu transformaci jako
cdt +—dx , / v , /
cdt =-. c , dx= X. , dy = dy; , dz = dz; . (1.16)
Požadavek, aby rovnice vyjadřující fyzikální zákony byly invariantní vzhledem k Lorentzově transformaci, nazýváme Einsteinovým principem relativity.
Vždy jsou uváděny dva klasické příklady na použití vztahu (1.14) - kontrakce délek a dilatace času. V soustavě Kje podél osy x v klidu měřítko, jehož dvě rysky mají v této soustavě souřadnice x,,^. Vzdálenost (klidová) rysek je tedy Ax0=x2-x1. Vzdálenost v
soustavě K7 je (souřadnice jsou určovány ve stejném čase tj =ť2)
Ax' = j4-xÍ = Axg^/l-/?2 . (1.17) Protože vzdálenost zjišťovaná v pohybující se soustavě je menší než vzdálenost v klidové soustavě, mluvíme o kontrakci délky. Nyní předpokládejme, že se v soustavě K; odehrají v
4
časech tj a t, v jediném místě xj* = x^ , y[ =y'2 , t[ = t!1 dvě události (interval mezi událostmi je tedy At0 =ť2 -tj . V soustavě K je interval mezi těmito událostmi
At = t2-t= ,At° . (1.18)
Časový interval zjišťovaný v soustavě, vůči které se soustava, kde se události odehrály v jednom místě prostoru je delší, mluvíme proto o dilataci času. Je důležité uvědomit si přesný význam počítaných veličin a tedy i pojmů „kontrakce délek" a „dilatace času". 1.5 Relativistická kinematika
Pro rychlost (v = df/dt, v' =dr'/dť ) dostaneme z rovnice (1.16) transformační
vztahy
"- " v = ^,„7, , vz = /V/tt79 . (1.19)
x l + vxV/c2 ' y l + vxV/c2 ' z l + vxV/c2
Vztah pro transformaci rychlosti odvodíme také následující úvahou. Mějme v soustavě K7 částici, která se pohybuje konstantní rychlostí u, tedy platí pro ni x^uť. Z hlediska vnějšího pozorovatele v soustavě K dostaneme podle (1.14)
x = ]WJu*v£ . (L20)
pro rychlost v soustavě K máme pak
x u+V
Vx=- =-y^r . (1.21)
x t 1+uV/c2
Velikost této rychlosti už nemůže překročit velikost rychlosti světla a pro u = c dostáváme přirozeně vx =c.
1.6 Hybnost a energie
Při odvození výrazů pro hybnost a energii částice hmotnosti m musíme vycházet z již známé invariantní veličiny - to je interval (1.15). Ten můžeme použít pro konstrukci invariantního účinku pro volnou částici, který by pro malé rychlosti přecházel do klasického tvaru. Vezměme tedy za základ rozměrově správný a úměrný hmotnosti invariantní výraz
b
S = -mc J ds . (1.22)
a
Použijeme-li pro parametrizaci časovou souřadnici, dostáváme
5
b
-mc J yjc2dt2 -df2 =-mc2
|l-^dt . (1.23)
Porovnáním se standardním výrazem S = J Ldt tak dostáváme pro Lagrangeovu funkci
-mc2Jl-^ . (1.24)
Hybnost a energii získáme obvyklým postupem
^ <9L mv ^ <9L mc2
""T!!' • E=T'äv"L=T!;r ' T»-£- , T»mc2 => T«lpíc . (1.29) 2m
1.7 Více o intervalu
Mějme dvě události popsané v inerciální soustavě K souřadnicemi (t15í\) a (t2,r2).
Události jsou spojeny časupodobným intervalem a druhá událost nastala později než první
s2 = c2(At)2-(Af)2 >0 , At = t2-tj>0 , Ař = ř2-r1 . Ukážeme, že pořadí událostí vidí stejně pozorovatelé ve všech inerciálních soustavách. Osu x zvolíme jako společnou osu soustavy K a soustavy K7, která se vůči K podél této osy pohybuje rychlostí V . Lorentzova transformace (1.16) je
cAt = /(cAť +/?Ax;) , Ax = y(Ax' +V Ať) , Ay = Ay; , Az = Az; .
Máme
c Ať = ;r(cAt-/?Ax)>;r(cAt-|Ař|)>0 . Poslední nerovnost plyne z toho, že interval je časupodobný, předposlední nerovnost z toho, že odečítáme větší hodnotu, protože vždy /?<1 a Ax<|Ar|.
Jsou-li události spojeny prostorupodobným intervalem a druhá událost nastala v soustavě K později než první, můžeme najít takovou soustavu K7, kde druhá událost nastane dříve než první. Zvolíme společnou osu x tak, aby na ní ležely prostorové souřadnice obou událostí a její orientaci tak, aby Ax= Xj — x, >0. Potom máme
s2 = c2(At)2-(Ax)2<0 , At>0 , Ax>0 , Takže cAt 1 .
Pro všechny soustavy K7 s 1//? < j3 <1 je pak opravdu Ať =\!1—\!x < 0.
2. Příklady relativistických jevů 2.1 Aberace světla
Při pozorování hvězd ze Země se projevuje (mimo jiné) to, že Země obíhá kolem Slunce. Na obrázcích je znázorněn jev aberace světla, který se nejvíce projeví v bodech A a C,
7
zatímco paralaxa se nejvíce projeví při pozorování v bodech B a D. Když světelný paprsek od
pohybu
hvězdy S vstupuje do tubusu v bodě Ti, je okulár v místě Oi tak, aby při posunutí tubusu vlivem pohybu Země byl v poloze O2, kde zachytí uvažovaný paprsek. Hvězda se ovšem jeví v poloze S*. Obecný výraz pro transformaci složek vektoru rychlosti máme vztah (1.19)
vi+v _v/yyrr^ľ _<^ŕ nu Vx 1+viv/c2 ' Vy i+v:v/c2 ' Vz i+v:v/c2 •
Sledujeme-li šíření světelného paprsku v rovině x— y (vz=v^=0 při vhodné volbě úhlů 9 resp. é^tj. vx = c sin 6*, v =-ccosé? resp. v^csiné?7 , v!'=-ccosé'/)
. . sin0'+/? a cos? y]l-j32
sine/ =-——- , cose/ —
(2.2)
1 + ' l + ^sinč'
dostaneme po podělení výrazů ve (2.2) vztah mezi úhly v soustavě spojené se zdrojem vysílajícím paprsek K; a soustavě spojené s detektorem přijímajícím paprsek K (tubus dalekohledu), která se vůči K; pohybuje rychlostí -V podél osy x
f] + sin ď
tg# =
^/l -P1 cos0'
(2.3)
8
Pro 0' =0 dostaneme z (2.3)
tg# = /?/\/l-/?2 => sin# = /?
v
(2.4)
Na obrázku je případ é?7 =0 nakreslen. Pro pohyb Země kolem Slunce je maximální velikost aberace rovná 20,5". Jestliže neleží směr ke hvězdě v rovině ekliptiky, pozorujeme zdánlivou polohu hvězdy jako elipsu s velkou osou 41", jak je vidět na dalším obrázku.
H 30°
(3 = 0°
2.2 Comptonův rozptyl
Podél osy x dopadá foton rentgenového záření s energií h co na elektron v klidu, po
rozptylu pokračuje odchýlen od původního směru o úhel 9 a s nižší energií h co1. Zákony zachování nám dají (pohyb se děje v rovině)
h cd + mc2 =h co1 + -Jp2 c2 + nr c4 ,
h co h co1 _ _ h co1 . _
-=-cosc/+pcos^/ , 0 =-sine/-psin y/
c c c
(2.5)
9
Po kratším výpočtu (vyloučením „nepotřebných" neznámých paf) dojdeme k výslednému známému vztahu pro rozdíl vlnových délek (k = hco/c = 2^/A)
AA = A' - A = Ac{\ - cos é?) , Ac
mc
(2.6)
kde A^ je konstanta - Comptonova vlnová délka. 2.3 Dopplerův jev
Dopplerův jev je pozorovaná změna energie fotonu (frekvence vlnění co1), emitovaného zdrojem, který se sám pohybuje rychlostí V podél osy x vůči laboratorní soustavě ("pozorovateli") K (v ní je pozorována frekvence vlnění co). Soustava spojená se zdrojem je K;. Uvažujme rovinnou vlnu s vlnovým vektorem v rovině x— y. Například polohy míst s danou intensitou vlny musí určit stejně pozorovatelé v obou soustavách, pouze jim přiřadí různé souřadnice a frekvence, ale fáze vlny je relativistický invariant. V našem případě píšeme rovnost fází jako
co
f x' v'
ť--cos0' -^-sinč'
v c c
co\ t-— cos0—-sin<9 c c
(2.7)
Úhel mezi směrem šíření vlny a směrem pohybu zdroje (tj. osou x) jsme označili 9. Dosadíme-li do (2.7) ze vztahu pro Lorentzovu transformaci (1.14), dostáváme
f J J \
= co -, t--! ---
c
co
I I
ť -— cosč' -^sinč' c c
J
(2.8)
J
Porovnáním členů u ť dostaneme vztah vyjadřující Dopplerův jev
co = co
l-/?cos#
co
B1
1 + 0COS& + — cos2<9 2
(2.9)
10
Klasický Dopplerův jev (bez členu u 01) je rozdíl ve frekvenci přibližujícího se (<9 = 0) a
vzdalujícího se {6 = tt) zdroje, relativistický Dopplerův jev (člen u 01) pozorujeme pro
9=7t\2. Porovnáním členů u x' dostaneme vztah vyjadřující aberaci světla, ale s jiným značením a jinou situací (zde se pohybuje soustava spojená se zdrojem, v 2.1 se pohybovala laboratorní soustava).
Pokud budeme uvažovat o vzájemném pohybu zdroje a detektoru po společné přímce, můžeme si představit diagram na obrázku (nemusí se jednat jen o světlo, může jít třeba o zvukové vlnění). V obrázku je znázorněn světelný kužel, po kterém by se z bodu Osiřily světelné paprsky. Protože na osách máme souřadnice x a ct a pro světlo máme interval s2 = c212 — x2 = 0, je úhel površek kužele s osami roven 45°. Naopak přímky znázorňující
ct Ia /
\zdroj f Idetektor / světelný kužel X
O/'
pohyb zdroje OE a detektoru OA musí svírat s osou c t úhel menší jak 45°, jejich rychlost je menší jak rychlost světla. Úsečka EA svírá s osou ct úhel mnohem menší než 45°, jde-li o zvukovou vlnu, nebo úhel právě 45°, jde-li o elektromagnetické vlnění. Máme tedy pro rychlosti signálu, zdroje a detektoru
Rychlosti počítáme tak, že kladné jsou při vzdalování zdroje a detektoru. Když se zdroj a detektor potkají v O, zapne se signál. Vypnutí signálu po uplynutí jedné periody nastane u zdroje v bodě E a detektor je zaznamená v bodě A. Vlastní čas, který uplynutí periody odpovídá je pro zdroj a detektor dán vztahy
11
OE
OA
4
tl-xl/c2
Jt2A-x2Jc2 =tjl-v2jc
(2.10)
Poměr frekvencí je převrácenou hodnotou poměru period
f r
LD _ ÍZ
f ~ T Lz 'd
Poměr časových údajů získáme úpravou
XA XE t A ~~ tE
v t + v t
t A ~~ tE
l+vz/cs
takže
fD_l-vD/cs >A-vz/c2
(2.11)
fz l + vz/cs Vl-v^/c2 Pro všechny rychlosti malé ve srovnání s rychlosti světla (zvukové vlny) dostáváme klasický vztah pro Dopplerův jev - při vzdalování (vz>0,vD>0) vnímaná frekvence klesá, při
přibližování (vz <0, vD <0) vnímaná frekvence roste
l-vD/c
l + vz/c
(2.12)
Pro světlo (cs =c) můžeme (2.11) přepsat na
l-vD/c
l + vz/c
l-vz/c
U + vD/c
(2.13)
Vezme teď v úvahu vztah pro skládání rychlostí (1.21) a pro vzájemnou rychlost zdroje a detektoru máme
VZ +VD
l + vzvD/c
Roznásobením výrazů ve (2.13) a dosazením relativní rychlosti dostáváme vztah
1-v/c
(2.14)
fz \l + v/c který přirozeně souhlasí se vztahem (2.9) pro 0 = 0.
2.4 Vstřícné svazky
Při srážce dvou částic (řekněme elektronu a positronu) může vzniknout nová částice. Spočtěme maximální hmotnost vzniklé částice.
12
(a) Na elektron v klidu dopadá positron s kinetickou energií T =yjm2 c4 + p2 c2 - mc2. Zákony zachování dávají
mc2 +A/m2c4 + p2c2 =>/m2c4 + P2c2 , 0+p = P , (2.15) takže (pro T»mc2 )
Mc2«^/2mc2T .
(b) Celně se srážejí elektron a positron stejné energie. Ze zákonů zachování pak
^mV + pV +Vm2c4 + p2c2 =VM2c4 + P2c2 , p-p = P , takže (opět pro T » mc2)
Mc »2T .
(2.16)
(2.17)
(2.18)
Pro kinetickou energii v LEP T ~ 200 GeV a klidovou energii elektronu mc2 ~ 500 keV jde o vskutku propastný rozdíl v dosažitelné maximální hmotnosti částice vytvořené při srážce elektronu s positronem.
v
3. Ctyřvektory
3.1 Základní pojmy
Při značení se budeme jednak řídit Einsteinovou konvencí (přes stejné indexy nahoře i dole se sečítá), jednak latinské indexy budou nabývat hodnot pro časoprostorové veličiny (0, 1, 2, 3), řecké indexy hodnot pro prostorové veličiny (1,2, 3). Naneštěstí tato domluva bývá i opačná.
Nejprve definujeme podstatné tenzory. Metrický tenzor a jednotkový tenzor jsou
gik = g
fl 0 0 0^ (i 0 0
0 -1 0 0 0 1 0 0
0 0 -1 0 0 0 1 0
v0 0 0 -h v0 0 0 K
(3.1)
Snadno vidíme, že platí
lk ok
Úplný antisymetrický pseudotensor 4. řádu je definován pomocí vztahů
^10.(^0123 =1) %lm(%23=-l) .
Ctyřvektory souřadnic události (kontravariantní a kovariantní) zapisujeme jako x1 =(x°,x\x2,x3) = (ct,ř) , X; =(x0,x1,x2,x3) = (ct,-f) .
Pomocí metrického tenzoru převádíme složky kontravariantního vektoru na složky kovariantního vektoru a naopak
(3.2)
(3.3)
(3.4)
13
xi = gikxk , ť=gik^ (3-5) (s Einsteinovou sumační konvencí). Interval pak můžeme psát jako
s2 = xixi = gikxixk = gikxixk=c2t2-(x2 + y2 + z2) . (3.6)
Věnujme se na chvíli trojrozměrnému eukleidovskému prostoru. Tam máme polární a axiální vektory. Při záměně orientace kartézských souřadných os se změní zápis vektoru průvodiče
r = xr+yJ + zk = (-x)(-r) + (-y)(-J) + (-z)(-k) . (3.7)
Definujeme operaci zrcadlení jako
ř' = Př = -ř . (3.8)
Pro vektor rychlosti máme tedy
í
df7 df
_ df v = — , v dt
f , d(př)
dt
v
dt dt
(3.9)
Pro vektor úhlové rychlosti ale
cb = rxv , 3' = P (b = r' xv' = (-f)x(-v) = f xv = 3 . (3.10)
Vektory, které se při zrcadlení transformují stejně jako průvodič, se nazývají polární a vektory, které se transformují stejně jako úhlová rychlost, se nazývají axiální. Obecně zavádíme ve trojrozměrném prostoru axiální vektor jako pseudovektor duální k antisymetrickému tenzoru
Ca=\JLsafirCfir ' Cfir = ~ C = Äx B . (3.11)
Ve čtyřrozměrném prostoročase jsou duálními antisymetrický tenzor 2. řádu s antisymetrickým pseudotenzorem 2. řádu a antisymetrický pseudotenzor 3. řádu s vektorem
*Äk=-L^iklmAm , *Aikl = ffiklm A„ . (3.12)
3.2 Lorentzova grupa
Setkali jsme se s již s Lorentzovou transformací. Tato transformace je jednou z transformací, tvořících Lorentzovu grupu. Tak jako se skalární součin vektorů v trojrozměrném eukleidovském prostoru nemění při transformacích z grupy rotací, nebude se skalární součin čtyřvektorů měnit při transformacích z Lorentzovy grupy. Přibližně můžeme říci, že Lorentzova grupa obsahuje rotace v trojrozměrném prostoru, Lorentzovy transformace a různé operace inverse. Transformaci budeme popisovat pomocí transformační matice A (v zápisu pomocí matic je horní index řádkový a spodní sloupcový)
14
x1-> x'1 = Aj, xk , x^x' = Ax . (3.13) Skalární součin čtyřvektorů je definován jako
(x,y)=xiyi = gikxkyi . (3.14)
Lorentzova transformace je lineární zobrazení, které zobrazuje prostoročas sám na sebe a které zachovává skalární součin
glmx/n,x/n = glm^xiA^xk = gikxixk . (3.15) Podmínka pro invarianci skalárního součinu je tedy
gi-A1 Akm = gik • (3.16) Jsou-li A a M Lorentzovy transformace, jsou také A-1 a A M Lorentzovy transformace, což snadno odvodíme
g,t=g„AiAľ(A-):(A-):=gr,(A-.):(A-):, (3n)
Bík = & m m; m;1 = g„ a; a;, m; m;1 = g„ ( a m); ( a m)' .
Lorentzo vy transformace tvoří grupu. Grupa má čtyři podmnožiny, charakterizované signaturou determinantu a A[J, neboť
(detA)2=l , (A°)2-HAo)2=1
(3.18)
j=i
Máme
: detA = 1
v : detA = -1
l; : detA = 1
l: : detA = -1
sgnA°=l , IgL; sgnA°=l , IsgL!
i.t e l;
(3.19)
sgnA^=-l sgnA°=-l , It e LT .
Speciální Lorentzova grupa je tvořena transformacemi s detA = l a sgnA[J=l. Speciální
Lorentzova grupa obsahuje identickou transformaci, další podmnožiny jsou charakterizovány prvky Is (prostorová inverse), It (časová inverse) a Ist (časoprostorová inverse), definovanými pomocí vztahů
(Isx)° = x° , (Isxf=-x« ,
(Itx)°=-x° , (Itx)" = x" , (3.20) (lst*)°=-*° , (I.tx)"=-x- . Se speciální Lorentzovou grupou je spojena grupa komplexních matic druhého řádu s determinantem, rovným jedné, platí SO(3,l) = SL(2,C)/Z2.
15
Například matici Lorentzovy transformace (1.14) (tanh^/ = /?) nebo matici rotace kolem osy z o úhel /c2dt2-df2 = c>/l-/?2 dt = -dt
y
3.3 Čtyřrychlost a čtyřzrychlení
Definujeme čtyřvektor rychlosti přirozeným způsobem jako
i dx1 ; f v
u =- , u = I Y. V
ds
(3.23)
y>y—\ ' u'uí = i
(3.24)
Slovem přirozeně míníme, že máme automaticky zajištěno, že jde o čtyřvektor a prostorová část je úměrná časové změně polohy. Obdobně přirozeně definujeme čtyřvektor zrychlení
= dxŕ d2x;
w
, u' w; = 0 .
(3.25)
ds ds2
Podívejme se na relativistický popis pohybu s konstantním zrychlením. V souřadné soustavě spojené s částicí K, kde okamžitá rychlost částice je samozřejmě v = 0 (soustava nemusí být inerciální) máme
u^ =(1,0,0,0) , VK=(0,a/c2,0,0) , (3.26) kde a = dv/dt je obyčejné zrychlení. V obecné souřadné soustavě je rychlost podle (3.24)
^=^(1,^,0,0) . (3.27)
16
Všimněme si, že pro stanovení čtyřrychlosti jsme mohli také použít vztah u1 =A^u£ s maticí A ze (3.21)
u0' y Py 0 0^ ť ( \ y
u1 Py y 0 0 0 Py
u2 0 0 1 0 0 0
3 u V ) 0 v 0 0 1 0 V ) 0
Protože se jedná o zrychlený pohyb, není tento jednoduchý postup pro výpočet čtyřvektoru zrychlení použitelný, protože nejde o přechod mezi inerciálními soustavami. Musíme tedy provést přímý výpočet podle definice (3.25) a s čtyřvektorem rychlosti (3.27). S uvážením
dv v dv v d , x
— = —r v— = _r—\yv dt c2 dt c2 dtv '
dospějeme k výrazu
w
y d(/v)
(/U,0,0)
ď dt
Po malé úpravě (z rovnosti W w; = wKi) dostáváme
f \ v
(3.28)
d_ ďt
1
c2J
a
(3.29)
S počátečními podmínkami v0 =0 , x,, =0 dostáváme řešení
at
1 +
a t
1 +
a t
(3.30)
Zpočátku ve shodě s klasickými výrazy v^at, x^at2/2, po delší době se ale rychlost limitně blíží k rychlosti světla v^c a trajektorie částice je blízká dráze světelného paprsku x^ct .
3.4 Princip nejmenšího účinku
Účinek musí být invariantní a co nejjednodušší. Nabízí se integrál podél světočáry. Abychom dostali pro účinek známý nerelativistický výraz, musíme konstantu úměrnosti zvolit rovnu -mc, tedy
17
u
S = -mcjds = -mc2
(3.31)
Lagrangeova funkce a hybnost jsou
L=-mc\ 1
d L m v
(3.32)
Hamiltonova funkce je pak
H = p-v-L:
mc
V2 2 , 2 4 p c +m c
(3.33)
Z předchozích rovnic (3.32) a (3.33) vidíme, že
^ H v ^ c2 p 6>H
p = —^- , v=-=-
c2 H <9p
Pohybové rovnice dostaneme z variačního principu
JS=-mcj|ds , Sds = J^g^dx'dx1")
ky/2 gikdx'Jdxk
ds
u
p . . |b
= -mc J uk ôdx =-mcukJx| + mc
ô x—-ds . ds
(3.34)
u.ódxk ,
(3.35)
Odsud pak
du1 n dS
0 , P; =--- = mc u-
ds -i
Ctyřvektor hybnosti definujeme jako časupodobný vektor (čtverec velikosti je kladný)
i f H ^ P=—,P , pp;=mc
(3.36)
(3.37)
a ctyřvektor síly jako prostorupodobný vektor (je kolmý na časupodobný vektor hybnosti)
dpi
ds
f-v
c2^-/?2 'c^/l-/?2
g' Pí=0
(3.38)
Čtverec velikosti čtyřvektoru síly je
g gi
2/2 2
c c —v
f-v] -c2 f2
<0 .
Hamiltonova - Jacobiho rovnice volné částice je z (3.37)
18
ik dS dS 22 g —-—r = m c
dx1 dxk
rd$}2 fdsY ídSV
Kdxy
ydZj
m2c2 . (3.39)
4. Náboj v elektromagnetickém poli
4.1 Čtyřrozměrný potenciál a účinek
Elektromagnetické pole popisujeme pomocí čtyřrozměrného potenciálu
á =Í-,á] , A = K-a| , (4.1)
kde je skalární a A vektorový potenciál. Pomocí derivací ^vytvoříme antisymetrický tensor druhého řádu
F,.=^-^ • (4.2)
Ik dx1 dxk
Dimense prostoročasu je čtyři, má tedy tensor Fik šest nezávislých složek. Snadno se
přesvědčíme, že jsou to složky dvou trojrozměrných třírozměrných vektorů E a B , které jsou v třírozměrném zápisu dány vztahy
(9Ä -
-W--, B = VxA
dt
Tensor elektromagnetického pole má pomocí E a B vyjádření
( 0 Ex/c Ey/c Ez/c^
-Ejc 0
-Ey/c B2 "Ez/c
(4.3)
B.
"Bz B5 0 -E B„ 0
, Fik
0 "Ex/c -Ey/c "Ez/c^
Ex/c 0 "Bz By
Ey/c Bz 0 "Bx
Ez/c -fiy Bx 0 J
(4.4)
K účinku volné částice přidáme člen závislý na elektromagnetickém poli - nejjednodušším invariantním výrazem obsahujícím čtyřvektor A^ je skalár ^dx1. Vezmeme tedy jako účinek
S= J*(—mcds-e Adx1) .
a
Parametrizujeme-li integrál pomocí souřadnice času, dostáváme
(4.5)
-mc2,jl—- + e A v —
dt
(4.6)
Ukážeme odvození pohybových rovnic jak ve čtyřrozměrném, tak třírozměrném zápisu. Pro variaci ds jsme již odvodili vztah ve (3.35), tj. S ds=u; S dx1, takže variací (4.5) dostáváme
19
öS = -J (mcu; ödx1 +eAi ödx1 + eJAdx'
a
b
— (mou; + eAjôx1 + ^(mcdu; + eóx1dAí -eS\dxk
Infinitesimální změny potenciálu rozepíšeme
6>A
dA
„ kdxk , ^4=^^
a parametrizujeme integrál pomocí elementu ds (tedy dxk =uk ds), dostáváme tak
'd\ 6>A
JS = -(mcu; +eA)Jx; +
du; mc—- — e ds
dx1 dxk
Sx'ds
Variační princip nám tak dává jak výraz pro zobecněnou hybnost
p^mcUj+eA ,
tak pohybovou rovnici
du
mc—- = e ds
d\ ó>A
dx[ dxk
Pomocí tensoru pole (4.2) resp. jeho kontravariantních složek Flk = gllgkmF1
lm
(4.10) zapsat jako
mc-= eF uk
ds
Odvození pohybových rovnic z (4.6) vychází z Lagrangeovy funkce
L = -mc2Jl—- + eA-v-e^ .
Je pak
d L m v
■ + eA= p + eA
^ V1-a2
—(p + eÁ) = —+ e—+ e(v-V)Á dtv i dt dt 1 '
~s T
— = eV(Ä-v)-eV^ = e(v-v)Ä+evx(VxÄ)-eV^
Dosazením do Lagrangeovy rovnice dostáváme
20
Zopakujme důležité vlastnosti čtyřvektorů rychlosti a zrychlení
U = - => U; U = 1 => -í U; u ) = 0
du1 ;
U; -" = U; w =0
(4.14)
ds 1 dsv 1 ' 1 dx1
Čtyřvektor rychlosti je časupodobný, čtyřvektor zrychlení prostorupodobný. Pro časupodobný čtyřvektor hybnosti máme
p1 = mu1 = (p°, p j = (/mcjmv) , pip'=(mc)2 . (4.15)
Při časové inversi t—>■ —t je p°^p° a p^—p. Má-li zůstat pohybová rovnice (4.13)
nezměněna, musí pak být E^E a B^ — B. Ze vztahu (4.3) pak pro potenciály musí být
—^ a A^ — A. Při prostorové inversi x—^ — x je opět p°^p° a p —>■ — p. Má-li zůstat
v tomto případě pohybová rovnice (4.13) nezměněna, musí pak být E^ —E a B^B.Ze
vztahu (4.3) pak pro potenciály musí být opět —^ a A^ —A. Vidíme, že pokud jde o diskrétní transformace, je invariance zachována pouze při současném působení časové a prostorové inverse. Je to pochopitelné, uvážíme-li, že čtyřvektory mají časupodobné i prostorupodobné složky.
Přidáme-li ke čtyřvektorů A čtyřrozměrný gradient libovolné funkce, tensor elektromagnetického pole se nezmění
d
d x1
4 +
dí
dxk
d
dxk
dí
dxk
d\ č>A | č>2f č>2f dx1 dxk dx1 dxk dxk dx1
=o
Této vlastnosti říkáme kalibrační invariance. Nezmění se ani pohybová rovnice náboje v poli, protože příslušný člen v účinku je
dí
dx1
u u
dx1 =- J e Adx1 - J d(e f ^
:f(b)-ef(a)
4.2 Invarianty elektromagnetického pole
Pole je popsáno antisymetrickým tensorem Fik . Podle (3.12) k němu můžeme vytvořit
1
duální tensor *F1K = -i£-lklm Flm . Máme tedy možnost vytvořit dva invariantní výrazy (skaláry
vzhledem k transformacím z Lorentzovy grupy)
21
FikFik=inv , *FikFik=inv . (4.16) Ve vyjádření tensorů pomocí vektorů pole podle (4.4) pak máme
c2B2-Ě2=inv , ĚB = inv . (4.17) Vztah (4.17) má důležité důsledky. Pokud v nějaké soustavě platí E0B0=0, můžeme vždy najít inerciální soustavu, kdy buď E = 0 (pokud je c2Bq— E^O) nebo B = 0 (pokud je
c2Bq— E^O) Naopak, platí-li v nějaké soustavě E0B0^0, můžeme vždy najít inerciální
soustavu, kde budou obě pole rovnoběžná.
4.3 Pohyb náboje v konstantním homogenním poli
Konstantním polem nazýváme pole, které se s časem nemění. Homogenní pole má pak
v celém prostoru stejný směr i velikost. Elektrické pole intenzity E získáme ze skalárního potenciálu1
^ = -Ěf , (4.18) magnetické pole indukce B z vektorového potenciálu
A=-Bxf . (4.19) 2
K vektorovému potenciálu můžeme přidat gradient libovolné funkce. Například pro pole B = (0,0, B) přičtením nebo odečtením gradientu funkce f = x y B/2 dostáváme potenciály
^By,^Bx,0 2 2
^+)=(0,Bx,0) 4_r(-By,0,0)
Výraz £ = ^/m2 c4 + p2 c2 budeme nazývat kinetickou energií3.
Uvažujme nejprve pohyb v elektrickém poli, v jehož směru orientujeme osu x a který se odehrává v rovině x y. S pohybovými rovnicemi (tečka je derivace podle času t)
1 grad^E-f j = ^E-gradjf = E .
2 rot(Bxf) = Bdivř-(B-grad)ř = 2B.
3 Přesnější by bylo jako kinetickou energii nazývat 7~ = -y/m2 c4 + p2 c2 —mc2 , tedy celkovou energii bez
2
potenciální energie (výraz daný odmocninou) s odečtením klidové energie (mc ). Naše volba však vede k užitečným zkrácením řady výrazů.
22
a počátečními podmínkami
dostáváme
Kinetická energie je
Px(o) = o , Py(o)=Po
px = eEt , py = p0t . £ = ^/m2c4 + p2c2 =>/£02 + (ceEt)2 ,
(4.20)
(4.21)
kde jsme označili £Q=£{0). Podle vztahu (3.34) máme pro složky rychlosti
dx= pxc dt £
c2eEt
£2 + (ceEt)
dy = Pyc dt ~ £
c Po
+ (ceEt]
a integrací těchto rovnic dostáváme _^o+(ceEt)2-éľo
eE
Poc eE
ln
^2 + (ceEt)2+ceEt_ P()C
(4.22)
eE
ln
^éľ2 + (ceEt)2 -ceEt
První vyjádření pro y použijeme pro výraz exp eE y/(p0 cj , druhé pak pro
exp
■eEy^|p0c) . Sečtením obou výrazu a podělením dvěma dostaneme
eE y _ yjŽŽ
cosh-
'2 + (ceEt)2
Poc
Dosazením do výrazu pro x dostáváme rovnici trajektorie
eE
cosh eE y -1
{ PocJ
(4.23)
Pro £0^mc2a p0^mv0 a cosh[eE y/(mv0c)]^l + l/2[eE y/(mv0c)] dostáváme přirozeně
z nerelativistické teorie známou parabolickou trajektorii
eE
2mv„
y
Nyní budeme počítat pohyb v homogenním magnetickém poli, v jehož směru orientujeme osu z . Pohybová rovnice je
23
p = evxB .
Z toho že v - p = ev-(vxB*) = 0 hned vidíme, že se zachovává kinetická energie
d£ d£ + c2 ^ n
— =--p = —vp = 0 .
dt 6>p £
Pohybovou rovnici si tedy můžeme přepsat na
£ dv _ - ,Á~Á^ —— = evxB (4.24)
c2 dt
nebo ve složkách
kde
\ = covy , vy=-řyvx , vz = 0 , (4.25)
co = ^ . (4.26) £
Pro komplexní proměnnou w= x+i y získáme kombinací prvních dvou rovnic v (4.25)
w = —i<»w =>• w = v0t exp[—i(ť»t + or)] , kde v0t a a jsou reálné konstanty. Oddělíme-li reálnou a imaginární část, dostáváme
vx = v0t cos(ť»t + a) , vy = — v0t sin(řyt + a) . (4.27) Ze (4.27) vidíme, proč jsme konstantu označili v0t - je to velikost rychlosti v rovině kolmé ke směru magnetického pole. Rovnice (4.27) integrujeme a dostáváme
x= Xg + asin(ŕyt + a) , y = y0 + acos(ŕyt + a) , (4.28)
kde
a = %H=^- = _P^ . (4.29) co ec B eB
Integrace poslední z rovnic v (4.25) dává
z=Zo + v0zt . (4.30)
Je tedy pohyb v homogenním magnetickém poli pohybem po kruhové spirále, v případě v0z=0 pohybem po kružnici poloměru a v rovině z = Zq. V případě malých rychlostí bude
mít trajektorie stejný tvar, pouze ve (4.29) dosadíme nerelativistické výrazy, tedy
a = mvo,/(eB)-
Nakonec rozebereme pohyb ve zkřížených (tj. navzájem kolmých) elektrických a magnetických polích. Viděli jsme, že relativistické výrazy pro pohyb v elektrickém poli
24
nejsou příliš jednoduché, budeme proto řešit úlohu v nerelativistické aproximaci. Osu z orientujeme opět podél magnetické indukce a rovinu y z volíme tak, aby v ní ležel vektor elektrické intenzity. Pohybová rovnice
mv = e(Ě + vxBJ
je pak ve složkách
mx = eýB , mý = eEy— exB , mž = eEz . (4.31) Třetí rovnici v (4.31) můžeme hned integrovat
z = £^t2+v0zt + z0 _ (4_32) 2m
Kombinací prvních dvou rovnic ve (4.31) dostaneme
d , . \ . / . \ . e „ eB
—(x+iyj + iřy(x+iy) = i —E , co =- .
dt m m
Řešení homogenní rovnice pro proměnnou w= x+i ý známe z předchozího případu, řešením
nehomogenní rovnice je konstanta Ey/B, takže
x+i ý = aexp[—i(ot + or)] H—- .
B
Oddělení reálné a imaginární části a následná integrace rovnic vede na
x= Xg + — sm(cot + a)-\—-t , y= y0 + — cos(cot + a) . (4.33) oj B co
Konstanty zvolíme tak, aby se částice v čase t = 0 nacházela v počátku. Potom
x = — sin(ťot) + —, y = —cos(o>t)-l , z = —Lt2+v0zt . (4.34) co B co 1 2m
Označíme-li složku rychlosti podél osy x v čase t = 0 jako v0x, je parametr a dán vztahem
a = v0x — Ey/B .V rovině x y je průmět trajektorie
v E
x = -^-sin(ť»t)H--— \cot — sin(řyt) ,
co x ' coBv v n
(4.35)
y = ^[cos(«t)-l] + -^[l-cos(«t)] .
co co d
Při v0x = 0 je to rovnice cykloidy (obrázek c). Pohyb nabité částice ve zkřížených polích je docela pozoruhodný, srovnáme-li orientaci elektrického pole a střední hodnoty rychlosti
25
Z těchto hodnot také vidíme meze platnosti nerelativistického přiblížení. Uvažujeme-li jen pohyb v rovině x y, je podmínkou
Ey « c B .
U pohybu ve směru osy z zase záleží na době, po kterou se částice bude pohybovat.
y
4.4 Adiabatický invariant
Z obecné Hamiltonovy teorie můžeme odvodit existenci tzv. adiabatických invariantů, které při pomalých změnách podmínek pohybu zůstávají konstantní. Při pohybu v téměř homogenním magnetickém poli je adiabatickým invariantem
I= — £ptdr , (4.36) 2n J
kde integrační křivkou je průmět trajektorie (kružnice) v rovině kolmé k magnetickému poli a Pt je průmět zobecněné hybnosti do této roviny. Dosazení Pt = pt + e A (vektorový potenciál volíme takový, že leží celý v této rovině) do (4.36) dává
I = — £ pt df + — £ Adf . Orientace kružnice je po směru hodinových ručiček pro eB>0 a proti směru hodinových
4 112/
ručiček pro e B . Stokesova věta proto dává pro druhý integrál hodnotu — e B r 2, kde r je
4 Vzorec Stokesovy věty (j) V-fd£ = j rotV n der předpokládá, že vnější normála ke křivce C , tečna T k této křivce a normála n k ploše S tvoří pravotočivou soustavu.
26
poloměr kružnice (podle (4.29) r = pt/eB), zatímco hodnota prvního integrálu je r pt. Adiabatický invariant je tedy
2
I =—j- . (4.37) 2|eB|
Při adiabatické změně magnetické indukce se proto mění příčná složka hybnosti jako ^JC |b| ,
kde C je kladná konstanta. Této skutečnosti je s výhodou užito například při udržování vysokoteplotního plazmatu uvnitř daného objemu. Je-li v centrální části indukce poměrně malá a k okrajovým částem se zvyšuje, máme pro podélnou složku hybnosti
Pl2 = p2-pt2 = p2-C|B(f)| .
V oblasti silného pole se pohyb podél siločáry zastaví a obrátí zpět. Opačná situace, kdy jsou nabité částice uvolňovány v oblasti silného pole a pohybují se do oblasti slabšího pole je využita ve spektrometrech k vytváření téměř rovnoběžných svazků.
27