1 Lieovy grupy ve fyzice Gerardus 't Hooft1* 1. Úvod...................................................................................................................................................2 2. Kvantová mechanika a rotační invariance.......................................................................................7 3. Grupa rotací ve třech dimenzích ....................................................................................................16 4. Více o representacích......................................................................................................................24 5. Žebříkové operátory........................................................................................................................34 6. Grupa SU(2).....................................................................................................................................39 7. Spin a amplituda rozptylu...............................................................................................................47 8. Isospin..............................................................................................................................................54 9. Vodíkový atom................................................................................................................................57 10. Grupa SU(3)...................................................................................................................................64 11. Reprezentace SU(N); Youngovy diagramy .................................................................................71 A. Přehled některých vlastností matic ............................................................................................72 B. Derivování matic.........................................................................................................................74 C. Funkce matic ...............................................................................................................................75 D. Campbellova ­ Bakerova ­ Haussdorfova formule..................................................................76 E. Skalární součin, unitární a hermiteovské matice.......................................................................81 1 Tento text je založen na poznámkách M. Veltmana, později v některých částech upravených G. 't Hooftem a B. de Witem. Po roce 1987/88 byl kurs dále rozšířen. * Z textu přednášek Lie-Groepen in de Fysica pro Instituut voor Theoretische Fysica, Universiteit Utrecht, Facultateit Natuur- en Sterrenkunde přeložil Michal Lenc. 2 1. Úvod Mnoho systémů, které studujeme v přírodních vědách vykazuje určitý druh symetrie, a řada ,,přírodních zákonů", které známe, je invariantní vůči jistým transformacím. Množina všech možných transformací určité symetrie vytváří to, co matematici nazývají ,,grupa". Tak zrcadlení v rovině vytváří grupu, která má dva prvky: zrcadlení a identitu. Ale také množina trojrozměrných rotací, množina Lorentzových transformací nebo množina trojrozměrných translací jsou grupy, které ale nyní sestávají z nekonečného množství prvků. Ze zřejmých důvodů se grupy s konečným počtem prvků nazývají diskrétní; grupy transformací, které spojitě závisí na řadě parametrů se nazývají spojité grupy. Symetrie systému vede k určitým vztahům mezi pozorovatelnými veličinami, které jsou splněny s nekonečně vysokou přesností a které nezávisí na povaze sil působících v tomto systému. V atomu vodíku například zjištění, že energie některých různých stavů jsou přesně stejné je důsledkem rotační invariance tohoto systému. Často se také stává, že symetrie fyzikálního systému se realizuje pouze přibližně. Nekonečně rozlehlý krystal je například invariantní vůči translaci o násobek mřížkové vzdálenosti atomů. Ve skutečnosti má krystal konečné rozměry, což narušuje zmíněnou translační symetrii. Nicméně, obsahuje-li krystal dostatečně velký počet atomů, má toto narušení jen malý vliv na ty jeho vlastnosti, které nesouvisí právě s povrchovou strukturou. Jiné příklady symetrie, které platí pouze přibližně se najdou ve fyzice elementárních částic. Tzv. + částice, jeden z excitovaných stavů nukleonu, se rozpadá na nukleon a další částí, meson, stručně pion. Existují dva druhy nukleonů, proton a neutron, a tři druhy mesonů, elektricky nabité piony + a - a neutrální pion 0 . Protože elektrický náboj se při rozpadu + musí zachovávat, jsou možné dva různé způsoby rozpadu: 0 nebo .n p + + + (1.1) Je nápadné, že druhý způsob rozpadu se vyskytuje dvakrát častěji než první, skutečnost, kterou nelze vysvětlit rozdílem v elektrickém náboji produktů rozpadu. Přirozené vysvětlení faktoru 2 plyne ze symetrie. Není to tak podivné, jak se zdá na první pohled, protože protony a neutrony mají téměř stejnou hmotnost, stejně jako zmíněné tři druhy pionů a také čtyři druhy částic, které se vyskytují v přírodě (viz Tabulka 1). Tuto shodu hmotností, a jak uvidíme později i faktor 3 2 ve dvou způsobech rozpadu (1.1), je možno vysvětlit za předpokladu, že příroda je invariantní vůči tzv isospinové transformaci. Termín isobarický spin, zkráceně isospin, zavedl v roce 1932 Heisenberg, který byl zaujat skutečností, že proton a neutron mají skoro stejnou hmotnost a až na různý elektrický náboj jsou shodné i jejich další vlastnosti. Nukleony tedy tvoří dublet, podobně jako dvě možné orientace spinu elektronu tvoří dublet (odtud název isobarický spin). Později se ukázalo, že obecně elementární částice s téměř shodnými hmotnostmi mohou být zařazeny do tzv isospinových multipletů. Tak nukleony tvoří isospinový dublet, piony isospinový triplet a částice isospinový kvadruplet. Tabulka 1: Hmotnosti nukleonů, pionů a částic v MeV/c2 . nukleony mesony částice 2 938MeVpm c 2 140MeVm c + 2 1231MeVm c++ 2 939MeVpm c 0 2 135MeVm c 2 1232MeVm c+ 2 140MeVm c - 0 2 1233MeVm c 2 1235MeVm c- Částice v daném multipletu mají všechny přibližně stejnou hmotnost, ale různý elektrický náboj. Náboje jsou uvedeny v tabulce: žádné dvě částice v multipletu nemají stejný náboj a částice mohou být vždy seřazeny tak, že se dvě sousední částice v multipletu liší právě o jeden elementární náboj. Je zřejmé, že isospinová invariance může být přinejlepším přibližná, protože hmotnosti nukleonů, pionů a částic nějakým způsobem závisí na elektrickém náboji částic. Rozdíly hmotností uvnitř multipletu jsou pouze v řádu několika procent, což je obecně stupeň přesnosti, který očekáváme od teoretických odhadů založených na invarianci isospinu. Předchozí příklad se týká aplikace teorie grup ve fyzice elementárních částic, ale invariantní vlastnosti hrají velkou roli skoro v každé oblasti fyziky. V atomové fyzice často musíme uvažovat o důsledcích rotační invariance, v jaderné fyzice počítat s rotační a isospinovou invariancí, ve fyzice pevných látek s invariancí při diskrétních translacích a rotacích. Také v teorii pole hrají transformace symetrie velkou roli. Na zvláštní druh transformací narazíme například v elektrodynamice. Zde můžeme elektrické a magnetické pole vyjádřit pomocí tzv 4 vektorového potenciálu ( )A x , který píšeme v relativistickém čtyřvektorovém značení ( 0,1,2,3 = ) ( ), , , ,A A x ct x c = - = (1.2) kde je skalární potenciál a A je trojrozměrný vektorový potenciál; c je rychlost světla. Elektrické a magnetické pole je definováno vztahy , A E t = - - (1.3) .B A= × (1.4) Jednoduše lze ukázat, že E a B se nezmění při tzv kalibračních transformacích ( ) ( ) ( ) ,A x A x x - (1.5) ( ) ( ) ( ) , x x x t + (1.6) neboli ve čtyřvektorovém značení ( x ) ( ) ( ) ( ) .A x A x x + (1.7) Charakteristickou vlastností kalibračních transformací je, že závisí na libovolné funkci ( )x v prostoru a času. Skutečnost, že E a B se nemění při kalibračních transformacích znamená, že elektromagnetické jevy jsou kalibračně invariantní. Zapišme teď tyto transformace jinak, a to ( ) ,i i A ie i A e - - (1.8) takže dostáváme fázový faktor ( ){ }exp i x závislý na prostoru a času. Fázové faktory definují grupu nazývanou U(1): je to grupa unitárních matic dimenze 1 x 1. V tomto případě jde o prostou grupu, ale ukazuje se, že máme teorie založené na jiných (spojitých) grupách, které jsou mnohem méně prosté. Takovým teoriím říkáme kalibrační teorie a pole A se nazývá kalibrační pole. Pro obecnější grupy se ukazuje, že potřebujeme různá taková kalibrační pole. Lze ukázat, že kalibrační teorie hrají důležitou roli při sjednocení základních interakcí mezi elementárními částicemi. Elektrodynamika, kalibrační teorie U(1), je nejjednodušší variantou této třídy teorií. 5 Dosti překvapivé je, že také teorie gravitace, Einsteinova obecná teorie relativity, je kalibrační teorií, i když trochu jiného typu. Na tuto teorii můžeme nahlížet jako na kalibrační teorii obecných transformací souřadnic, daných obecnou změnou parametrizace prostoru a času ( ) .x x x + (1.9) Kalibračním polem je nyní gravitační pole, vyjádřené pomocí metriky, která umožňuje definovat vzdálenosti a úhly ve čtyřrozměrném prostoročase. Skutečnost, že kalibrační transformace jsou spojeny s abstraktní grupou a současně závisí na prostoročase, může vést k zajímavým topologickým jevům. Příklady takových jevů jsou uspořádání toku v supravodiči, Aharonovův ­ Bohmův jev v kvantové mechanice a magnetické monopóly. Abychom ilustrovali význam topologie, podíváme se ještě jednou na grupu U(1) kalibračních transformací, ale nyní v dvourozměrném prostoru (neboli na případ, který nezávisí na čase a závisí jen na dvou ze tří prostorových souřadnic). Buď ( ),x y komplexní funkce, která se transformuje vzhledem k transformacím z grupy jako ( ) ( ) ( ), , , .i x y x y e x y (1.10) Obrázek 1 Fázový úhel ( ),x y je ukázán jako šipka, jejíž délka není podstatná, ale pro určitost ji volíme jako ( ),x y . Funkce má nulovou hodnotu v počátku. Příkladem takové funkce je vlnová funkce v kvantové mechanice. Z toho, že v každém bodě lze fázi změnit pomocí kalibrační transformace by se mohlo dovodit, že fáze je ve skutečnosti pro popis systému nepodstatná. Přesto tomu tak není. Podívejme se např. na funkci, která je 6 v počátku rovna nule. Vezměme nyní uzavřenou křivku v rovině x-y a všimněme si, jak se podél této křivky mění fáze funkce ( ),x y . Po proběhnutí celé křivky nemusí fáze nabývat téže hodnoty jako počáteční, když předpokládáme jednoznačnost funkce ( ),x y , musí však být tento fázový rozdíl roven 2 n , kde n je libovolné celé číslo. Toto číslo se nazývá index bodu ke křivce (dále jen index). Příklad pro index 1n= je uveden na Obr. 1; fázový úhel se změní o 2 , když sledujeme funkci podél křivky popisující úplné obkroužení počátku v rovině x-y. Snadno si můžeme představit situaci s jiným indexem. Případ 0n = nastává tehdy, je-li fáze funkce ( ),x y konstantní. Měníme-li funkci ( ),x y spojitě, pak by měl index zůstat stejný. Proto se index bodu ke křivce nazývá topologickým invariantem. To také znamená, že se index nezmění při globálně (na celé ploše) definovaných kalibračních transformacích (1.10). Všimněme si, že hodnota indexu nezávisí na volbě uzavřené křivky kolem počátku (pokud ovšem vnitřek křivky neobsahuje další nulové body funkce ( ),x y ). Z toho všeho plyne, že ačkoliv můžeme lokálně, tedy v jednom bodě a jeho nejbližším okolí, položit fázi funkce rovnu nule, globálně to lze provést pouze tehdy, pokud je index roven nule. Taková situace se vyskytuje u vektorového potenciálu. Podívejme se znovu na dvourozměrnou rovinu a předpokládejme, že máme statické magnetické pole, které je všude nulové, až na omezenou oblast okolo počátku. V této oblasti by potenciál A neměl být roven nule vzhledem k (1.4). Naopak ve vnější oblasti, kde pole B je nulové, není žádný důvod pro to, aby i potenciál A nemohl být nulový. Můžeme ukázat, že pomocí vhodné kalibrační transformace lze položit A roven nule v libovolném bodě. Tento výsledek ale platí jen lokálně, jak můžeme vidět z následujícího křivkového integrálu [ ] ,i i C C A d x = (1.11) kde C je daná (uzavřená) křivka. Je snadné ukázat, že [ ]C se nemění při kalibrační transformaci (1.5). Na druhé straně víme z teorie magnetického pole, že [ ]C musí být rovno magnetickému toku plochou, ohraničenou křivkou C. Použijme této skutečnosti na námi diskutovaný případ. Vezměme uzavřenou křivku C kolem počátku ale vedenou v oblasti, kde B je rovno nule. Celkový magnetický tok oblastí ohraničenou křivkou C není však nutně roven 7 nule, tj. [ ]C nemusí být nutně rovno nule. Pak nemůžeme A vynulovat pomocí kalibrační transformace v celé vnější oblasti, i když to můžeme provést lokálně.2 Všimněme si, že magnetický tok zde hraje stejnou roli jako index bodu ke křivce v předchozím. Opravdu existují situace, kdy tyto dvě veličiny na sobě lineárně závisí. Pak mluvíme o kvantování toku. Příkladem tohoto jevu jsou tzv. vortexová řešení v supravodičích a magnetické monopóly. Podrobnější studium těchto jevů by nás ale zavedlo příliš daleko od našeho předmětu. V předchozím jsme alespoň naznačili roli, kterou hraje teorii grup ve fyzice. V těchto přednáškách se budeme hlavně věnovat grupě rotací, a to především v kontextu kvantové mechaniky. Na tomto případě se dá vysvětlit mnoho nejdůležitějších základních prvků, a pojednání může přitom zůstat transparentní, názorné a matematicky nepříliš komplikované. V žádném případě se nesnažíme o úplné matematické pojednání; cílem je ukázat co nejpřesvědčivěji význam teorie grup. Budeme se v dalším ve větší šířce věnovat fyzikálním aplikacím. Grupa rotací je příkladem tzv. kompaktní Lieovy grupy. Ve většině aplikací půjde o reprezentace této grupy. Teorie reprezentací takových grup je matematicky dobře prozkoumána. Pro porozumění je třeba přiměřená znalost lineární algebry (matice, skalární součin, stopa, funkce a derivace matic apod.). Pro pohodlí jsou některé nejdůležitější vlastnosti matic shrnuty v dodatcích. 2. Kvantová mechanika a rotační invariance Kvantová mechanika říká, že každý fyzikální systém je popsán (obecně komplexní) vlnovou funkcí. Tato vlnová funkce je řešením diferenciální rovnice (např. Schrödingerovy rovnice v případě, kdy můžeme použít nerelativistického přiblížení) s okrajovými podmínkami danými fyzikální situací. Nebudeme se zde zabývat obecnými problémy nalezení vlnové funkce, ale soustředíme se na ty její vlastnosti, které jsou dány symetrií popisovaného systému. Jednou za symetrií, které se v projevují v běžném životě, je invariance objektů vzhledem k rotacím v třírozměrném prostoru. Experimentátor zjišťuje, že výsledky jeho měření jsou nezávislé na orientaci měřicího zařízení v prostoru, pokud ovšem nedochází k interakci zařízení 2 Toto způsobuje zajímavý kvantově mechanický jev pro elektrony, nacházející se vně magnetického pole, tzv. Aharonovův ­ Bohmův jev. 8 s okolím. Takže časový údaj hodin není závislý na orientaci hodin v prostoru, stejně jako výsledek výpočtů počítače nezávisí na jeho natočení. Rotační symetrii proto nacházíme v základních rovnicích fyziky: Newtonovy, Maxwellovy a Schrödingerova rovnice jsou příklady rotačně invariantních vztahů. Přesněji řečeno: přírodní zákony jsou invariantní vzhledem k rotacím trojrozměrného prostoru. Teď jde o to, jaké jsou důsledky rotační invariance vlnové funkce. Z klasické mechaniky víme, že rotační invariance soustavy, která neinteraguje s okolím, vede k zachování momentu impulsu: pro takovou soustavu je vektor momentu impulsu konstantou pohybu. Zákony zachování, které nejsou závislé na konkrétním charakteru silového působení, ale plynou z velmi obecných příčin, se mohou projevovat, i když v jiné podobě, také v kvantové mechanice. Očekáváme proto, že ve vlnové funkci nalezneme nějaký obraz momentu impulsu, zachovávající se v čase. Všimneme si tedy, jak se vlnová funkce chová při rotacích a jak to souvisí s momentem impulsu. Vlnová funkce je závislá na řadě proměnných, ale obecně je vždy řešením lineární diferenciální rovnice 0 . =D (2.1) Skutečný tvar operátoru D není podstatný, pouze požadujeme, aby D byl invariantní vůči rotacím. Příkladem může být Schrödingerova rovnice pro pohyb těžiště volné částice ( ) 2 2 2 2 2 2 2 1 2 3 , 0 . 2 i x t m x x x t + + + = (2.2) Ukážeme, že je tato rovnice rotačně invariantní. Polohový vektor x přejde po rotaci soustavy do / x se souřadnicemi / ix , které jsou dány vztahem / .i i j j j x R x= (2.3) Rotace je charakterizovaná maticí 3 3× R , která je ortogonální a má determinant roven 1 (ortogonální matice s determinantem rovným 1- popisují rotaci a zrcadlení). Podmínkou ortogonality pro R je 1 neboli ; ,T T i j ik jk i j k j ik i j R R R R R R R R = = = = (2.4) kde T R je matice transponovaná k matici R. Není obtížné ukázat, že rovnice (2.2) je rotačně invariantní. Nejprve uvažme, že 9 ( ) ( ) ( ) / / / / / / , , , ,j ji j ji i j j x x t x t R x t x x x x = = (2.5) .kde jsme využili vztah (2.3). Dále pokračujme stejně, tedy ( ) ( ) ( ) / / / / , , / / / , , , , ji ki i i j ki i j k i i i x t R R x t x x x x x t x x = = (2.6) při zjednodušení jsme užili vztahu (2.4). Z tohoto výsledku plyne, že rovnice (2.2) je invariantní vzhledem k rotacím: je-li ( ),x t řešením rovnice (2.2), pak také ( )/ ,x t jejím řešením. Později budeme podrobněji studovat řadu vlastností rotací. Teď užijeme jen toho, že rotace mohou být representovány reálnými maticemi R dimenze 3 3× s determinantem rovným 1, které splňují relace ortogonality 1T R R = . Libovolné natočení ve třech rozměrech můžeme charakterizovat třemi úhly (což přesněji uvedeme ve třetí části). Jsou-li 1R a 2R matice odpovídající nějakým rotacím, pak také jejich součin, tj. matice 3 1 2R R R= představuje rotaci. Jinak řečeno: dvě po sobě následující natočení mohou být chápány jako jediné natočení. Důkaz je prostý: předpokládejme, že 1R a 2R jsou ortogonální matice s determinantem rovným 1. S použitím vztahu 1 1 1 1 2 2,T T R R R R- - = = (2.7) můžeme ukázat, že také 3 1 2R R R= je ortogonální matice: ( ) ( ) 11 1 1 3 1 2 2 1 2 1 1 2 3 . TT T T R R R R R R R R R R -- - - = = = = = (2.8) Dále platí ( )3 1 2 1 2det det det det 1 ,R R R R R= = = (2.9) a to bylo třeba dokázat. Povšimněme si, že ačkoliv součin 4 2 1R R R= je také natočení, nemusí být obecně 3R a 4R identické. Jinak řečeno: rotace v trojrozměrném prostoru nejsou komutativní; to jest operace provedené v různém pořadí nevedou obecně k témuž výsledku. Nyní ukážeme, že rotace tvoří takzvanou grupu. Grupa je G množina (v našem případě množina reálných matic R dimenze 3 3× s determinantem rovným jedné a vlastností ortogonality 10 1T R R = ), na níž je definovaná binární operace (násobení) ( )1 2 1 2,G G R R R R G× s následující vlastnostmi: (1) Násobení je asociativní: ( ) ( )1 2 3 1 2 3R R R R R R= . (2) Existuje jednotkový prvek (v našem případě jednotková matice 1) takový, že 1 1R R R= = pro všechny prvky (matice) z grupy. (3) Ke každému prvku existuje inversní prvek (v našem případě ke každé matici R z grupy inversní matice 1 R- ) takový, že 1 1 1R R R R- - = = . Vidíme, že množina reálných matic R dimenze 3 3× s determinantem rovným jedné a vlastností ortogonality 1T R R = má všechny vlastnosti grupy. Každá grupa je plně charakterizována strukturou násobení, souvislostí prvků danou pravidly násobení. Pojem ,,struktura" v dalším pojednání upřesníme a vyjádříme ve vzorcích. Teď jenom zdůrazněme, že v grupě nemáme žádné ,,sčítání" a ,,odečítání", ale pouze ,,násobení". V grupě také není žádný ,,nulový prvek". Obecně je velmi užitečné, pokud všechny možné transformace invariance soustavy tvoří grupu. Ke dvěma transformacím invariance můžeme přidat hned třetí, tak že transformace po sobě necháme působit vždy na příslušné veličiny, pomocí nichž je teorie definovaná. Vůči výsledné transformaci musí být teorie samozřejmě také invariantní. Pak je splněna první z předchozích vlastností grup, další vlastnosti jsou většinou přirozené. Nyní upřesněme způsob, jak se funkce transformuje při rotacích. Při rotaci se změní souřadnice x na nové / x , dané vztahem / 1 .i i i j j j x x R x- = (2.10) Označení 1 R- místo R je věcí konvence, neboť R zatím nijak nespecifikujeme. Rotace (2.10) může odpovídat změně fyzikální situace. Například částice, která se původně nacházela v bodě x je přemístěna do bodu / x . Rotace však také může odpovídat změně souřadné soustavy. Pevný vektor, který měl v původní soustavě souřadnice ix bude v nové soustavě popsán souřadnicemi / ix . Oba pohledy jsou komplementární, alespoň pokud neexistuje nějaký přednostní směr. My budeme rotace uvažovat ve smyslu změny souřadné soustavy.3 Taková rotace souřadné soustavy 3 Tato volba bývá nazývána pasivní transformací. 11 indukuje změnu souřadnic a tedy také funkcí souřadnic. Funkce přechází po rotaci do nové funkce / takovým způsobem, že hodnota funkce / v nových souřadnicích / ix je rovna hodnotě funkce v původních souřadnicích ix . Mezi oběma funkcemi platí tedy vztah ( ) ( )/ / .x x = (2.11) Po dosazení z (2.10) máme novou funkci vyjádřenu jako ( ) ( )/ / / .x R x = (2.12) Nyní popíšeme působení dvou po sobě následujících rotacích. První rotaci souřadné soustavy popíšeme maticí R a po ní následující rotaci maticí S. Souřadnice se po druhé rotaci změní na ( ) 1// 1 / 1 1 , .i i j j i j jk k ji j j j k j x S x S R x R S x -- - - = = = (2.13) Odpovídající změny funkcí při kombinovaném působení dvou rotací je dáno vztahem ( ) ( ) ( )// // / // // ,x S x R S x = = (2.14) přičemž věnujme pozornost tomu, že pořadí matic R a S v posledním členu je opačné oproti pořadí, ve kterém následují odpovídající rotace souřadné soustavy. Protože proměnná na obou stranách (2.14) je // x , můžeme v takovém vztahu psát místo // ix prostě ix . Dvě po sobě následující rotace, nejprve R a potom S, mění funkci ( )x nejprve na ( ) ( )/ x R x = a potom na ( ) ( )// x R S x = . Jinými slovy, při každé rotaci je ix v argumentu funkce nahrazeno i j j j R x , kde i jR je odpovídající matice rotace. Můžeme to ještě jednou přehledně znázornit jako ( ) ( ) ( ) ( ) ( )/ // . R S x x R x x R S x = = (2.15) Nyní využijeme toho, že je D , diferenciální operátor v rovnici (2.1) rotačně invariantní. To neznamená, že také řešení rovnice musí být rotačně invariantní. Jako příklad uvažme řešení, kdy vlnová funkce popisuje částici, která se pohybuje ve směru od východu na západ. Po rotaci o 2 se částice pohybuje ze severu k jihu, a to je jiná situace s jinou vlnovou funkcí. Ve skutečnosti, je-li D rotačně invariantní, musí řešení rovnice po rotaci přejít na jiné řešení / . Takže po rotaci o 2 vlnová funkce odpovídající částici, která se pohybuje ve směru od 12 východu na západ přejde na jinou vlnovou funkci, popisující částici při pohybu ze severu k jihu, ale obě vlnové funkce jsou řešením téže rovnice. Ještě jinak řečeno: možná fyzikální situace (popsaná vlnovou funkcí 1 , která je řešením uvažované rovnice) přejde po rotaci do jiné možné fyzikální situace, popsané funkcí 2 . Konkrétně, mohou-li se pohybovat částice od východu k západu, musí stejně dobře mít možnost pohybovat se od severu k jihu. Kdyby tomu tak nebylo, nebyla by fyzikální situace rotačně invariantní. Mějme různá řešení rovnice (2.1) 1 a 2 , kde jedno nevzniklo z druhého rotací, 1 20 , 0 . = =D D (2.16) Protože je rovnice (2.1) lineární v , musí být každá lineární kombinace 1 2 + také řešením, tj. ( )1 2 1 2 0 . + = + =D D D (2.17) Obecně: jsou-li 1, , n ... řešením rovnice (2.1), je také libovolná lineární kombinace 1 1 2 2 n n + + ...... (2.18) řešením této rovnice. Pokud jde o chování při rotacích, můžeme rozlišit dva případy. Buď je vlnová funkce rotačně invariantní, tj. přechází při rotaci sama na sebe ( ) ( ) ( ) ( )/ / ,x x x x = = (2.19) nebo přejde na lineární kombinaci (lineárně nezávislých) řešení 1, , n ... , které samy při rotacích přecházejí na lineární kombinace z nich vytvářené. Jako příklad druhé možnosti vezměme soubor řešení pro částici pohybující se všemi možnými směry. V tomto případě obsahuje množina 1, , n ... nekonečný počet řešení. S ohledem na to, abychom se vyvarovali komplikací souvisící s nekonečností jmenované množiny, můžeme se omezit na částice v klidu nebo alespoň se zanedbatelně malou hybností. Částice v klidu přechází při rotaci sama na sebe, ale vnitřní struktura se eventuálně může změnit. Množina vlnových funkcí, které spolu souvisí přes rotaci pak obecně obsahuje konečný počet řešení. Když se částice nachází v základním stavu, pak je příslušná vlnová funkce obvykle rotačně invariantní; množina obsahuje tedy pouze jedinou vlnovou funkci. Když se částice nachází v excitovaném stavu, pak mohou různé excitované stavy přecházet jeden do druhého pomocí rotace. 13 Vezměme tedy množinu 1, , n ... vlnových funkcí, souvisejících prostřednictvím rotace. Po rotaci tedy přechází 1 na lineární kombinaci funkcí 1, , n ... : ( ) ( ) ( ) ( ) ( )/ 1 1 11 1 12 2 1 ,n nx R x d x d x d x = + + +...... (2.20) a podobně pro 2 , , n ... . Obecně můžeme psát ( ) ( )/ , , 1, , .A AB B B x d x A B n = = ...... (2.21) Koeficienty ABd vytvářejí matici ( )D R , takže můžeme psát ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) / / 11 1 11 / / 1 , , , . n n nn nn x R x D R x d d xx x D R x d d xx = = = = = (2.22) Matice ( )D R ve (2.21) a (2.22) jsou dány nejen maticemi R, které popisují určitou rotaci v trojrozměrném prostoru, ale také volbou řešení A , ze kterých vytváříme lineární kombinace. Můžeme jít ještě dál. Určitá rotace může být provedena najednou, nebo v několika po sobě jdoucích krocích. Ve výsledku to přirozeně není vidět. Například rotace o 2 mohla vzniknout přímo, nebo jako rotace o následovaná rotací o 2- . Tato skutečnost se musí odrazit ve způsobu, jak jsou příslušné matice ( )D R násobeny. Abychom to ukázali, vezměme dvě po sobě následující rotace R a S (viz (2.15)). Ať rotaci R přísluší matice ( )D R , rotaci S matice ( )D S , tj. vyjádřeno vzorci ( ) ( ) ( ) ( ) ( ) ( ) , . R x D R x S x D S x = = (2.23) Přirozeně pak složené rotaci RS odpovídá matice ( )D RS , pro kterou platí ( ) ( ) ( ) .R S x D R S x = (2.24) Výraz ( )R S x ovšem můžeme počítat i podle (2.23) (zaměníme proměnnou x S x v první rovnici a na pravé straně pak dosadíme z druhé rovnice): ( ) ( ) ( ) ( ) ( ) ( ) .R S x D R S x D R D S x = = (2.25) Musí tedy být 14 ( ) ( ) ( ) .D R D S D R S= (2.26) Matice ( )D R musí mít tedy stejnou strukturu pravidla násobení jako samy matice R. Z tohoto důvodu říkáme, že matice ( )D R tvoří representaci grupy rotací v trojrozměrném prostoru. Obecněji: množinu matic nazýváme representací grupy, jestliže platí: (1) Každému prvku a grupy přísluší matice A. (2) Součinu dvou prvků přísluší součin odpovídajících matic, tj. přísluší-li prvkům grupy a, b, c matice A, B, C a je-li c ab= , pak C AB= . Zjistili jsme v předchozím, že při rotacích v trojrozměrném prostoru se vlnové funkce fyzikální soustavy transformují pomocí lineárního zobrazení, které tvoří representaci grupy rotací ve třech dimenzích. Jako jednoduchý příklad vezměme tři funkce ( ) ( ) ( )1 1 2 2 3 3, , .x x x x x x = = = (2.27) Při transformacích rotace se tyto tři funkce transformují maticí ( )D R , která je přímo rovna matici R. Podmínka (2.26) je přitom splněna triviálně. Avšak ne vždy jsou předchozí závěry správné. Z kvantové mechaniky víme, že nemůžeme rozlišit vlnové funkce lišící se pouze (reálným) fázovým faktorem.Proto vlnové funkce a ( )exp i popisují (při reálném ) stejnou situaci. Proto je možné, že se tato nejednoznačnost projeví při definici matic ( )D R . Vztah (2.26) by bylo možné v principu zaměnit slabším vztahem ( ) ( ) ( ){ } ( )exp , ,D R D S i R S D R S= (2.28) kde ( ),R S je (reálný) fázový faktor, závisející na R a S. Matice ( )D R s netriviálním fázovým faktorem v (2.28) představují tzv. projektivní representaci. Projektivní representace jsou ve fyzice potřebné. Mohou se vyskytnout případy, kdy každé matici R přísluší dvě matice ( )D R a ( )/ D R , které se liší fázovým faktorem, přesněji faktorem 1- . Takže platí ( ) ( )/ D R D R=- . To je přípustné, neboť vlnové funkce a - popisují tutéž situaci. Uvedená nejednoznačnost ukazuje, že vztah (2.26) platí až na znaménko, protože fázový faktor v (2.28) nabývá hodnoty 0 a . Částice popsané vlnovou funkcí, která se transformuje podle projektivní representace nemají analogii v klasické mechanice. Příkladem takových částic jsou elektron, proton a neutron. 15 Příslušné vlnové funkce se transformují jinak, než je dáno vztahem (2.12). Později se k tomu ještě vrátíme. Existuje ještě jedna podmínka, kterou musí matice ( )D R splňovat. Tato podmínka plyne z fyzikální interpretace kvantové mechaniky. V kvantové mechanice vyžadujeme existenci skalárního součinu přiřazujícímu každým dvěma vlnovým funkcím 1 a 2 komplexní číslo 1 2 . Pro skalární součin musí platit 1 1 2 2 1 1 2 2 * 1 2 2 1 0 , 0 0 , , , = = + = + = (2.29) kde 1 a 2 jsou libovolná komplexní čísla. Pro vlnové funkce závislé na jedné proměnné je skalární součin definován jako ( ) ( )* 1 2 1 2 ,x x d x - = (2.30) přesnější definici skalárního součinu nebudeme potřebovat. Podle kvantové mechaniky můžeme čtverec absolutní hodnoty skalárního součinu definovat jako pravděpodobnost. Přesněji to uvidíme na příkladu, kdy stav soustavy je popsán pomocí . Pravděpodobnost, že soustavu nalezneme ve stavu je dána výrazem 2 . Soustava i měřicí zařízení jsou podrobeny rotaci. Podle (2.22) se stavy změní na , .D D (2.31) Zmiňovaný skalární součin přejde na .D D + (2.32) Poněvadž předpokládáme rotační invarianci, nesmí se při této transformaci změnit pravděpodobnost. Protože jsou i libovolné stavy, musí matice D splňovat podmínku 1 ,D D+ = (2.33) 16 tj. musí být unitární.4 Protože každá matice ( )D R spojená s rotací v trojrozměrném prostoru tomuto požadavku vyhovuje, platí to i pro celou representaci. V tomto kontextu se budeme zabývat výhradně unitárními representacemi. 3. Grupa rotací ve třech dimenzích Rotace v trojrozměrném prostoru mohou být representovány reálnými maticemi R dimenze 3 3× . Protože při rotacích zůstávají zachovány úhly mezi vektory, musí být tyto matice ortogonální. Tyto ortogonální matice tvoří grupu ( )3O . Z podmínky 1R R+ = dostáváme det 1R = . Vybereme-li pouze ty ortogonální matice, jejichž determinant je roven 1, mluvíme o grupě ( )3SO . Rotace v trojrozměrném prostoru je plně určena osou rotace a velikostí úhlu rotace. Osa rotace může být například zadána pomocí třírozměrného vektoru ; velikost úhlu rotace může být určena délkou tohoto vektoru (úhel v radiánech). Jelikož rotace, lišící se o úhel 2 jsou identické, můžeme trojrozměrné vektory uzavřít do trojrozměrné koule s poloměrem . Tak máme přirozenou parametrizaci všech trojrozměrných rotací. Každý bod této parametrické koule odpovídá nějaké rotaci: osa je dána spojnicí tohoto bodu se středem koule a úhel natočení (daný orientací levotočivého závitu) se mění od 0 do (otočení o úhly z intervalu - do 0 jsou spojeny s vektorem na téže přímce opačně orientovaným). Dva protilehlé vektory na povrchu koule, tedy a - s = , popisují stejnou rotaci, jednu o úhel a druhou o úhel - okolo stejné osy. S výjimkou těchto dvojic určují dva různé body parametrické koule dvě různé rotace. Z předchozího je zřejmé, že rotace mohou být parametrizovány pomocí tří nezávislých parametrů, jmenovitě složek vektoru , a dále že rotace spojitě závisí na těchto parametrech. Pro další studium těchto závislostí zavedeme pojem infinitesimálních rotací, tj. rotací v okolí 0 . Popišme nejprve rotace kolem osy z, kdy ( )0,0, = . Příslušná rotace je zobrazení 4 Podmínkou je, že absolutní hodnota skalárního součinu se nezmění. Mohla by se tedy matice D D+ lišit od jednotkové společným fázovým faktorem. 17 cos sin , cos sin , . x x y y y x z z + - (3.1) Odsud dostáváme matici ( )R ve tvaru ( ) cos sin 0 sin cos 0 . 0 0 1 R = - (3.2) Otočení o úhel můžeme chápat také jako výsledek n po sobě jdoucích otočení o úhel n . Při dostatečně velkém n se bude matice otočení o velmi malý úhel n infinitesimálně lišit od jednotkové matice; zanedbáme-li členy řádu ( ) 2 n , bude příslušná matice 2 2 2 2 1 0 0 1 0 1 0 1 1 0 0 0 0 1 0 0 0 n R n O O n n n n = - + = + - + (3.3) Rotaci o úhel dostaneme, jestliže n-krát provedeme rotaci (3.3), tj. ( ) ( ) 2 2 1 , n n R R n T O n n = = + + (3.4) kde matice T je definována jako 0 1 0 1 0 0 . 0 0 0 T = - (3.5) V limitě n můžeme zanedbat členy řádu 2 1 n ; s pomocí vztahu exp lim 1 n n A A n = + (3.6) dostaneme pak ( ) { }exp .R T = (3.7) O tom, že výrazy (3.7) a (3.2) jsou stejné se teď přesvědčíme. Exponenciální funkci napíšeme ve tvaru Taylorovy řady 0 1 exp . ! n n A A n = = (3.8) 18 Dále si všimněme, že ( ) ( )2 1 0 0 1 0 1 0 , 1 , 0 0 0 nn T n = - (3.9) odkud okamžitě ( )2 1 1 nn T T+ = - pro 0n . S pomocí těchto vztahu napíšeme v řadě pro exponenciálu zvlášť liché a zvlášť sudé členy, takže { } ( ) ( ) ( ) ( ) ( ) 2 2 1 1 0 1 0 0 0 1 0 1 1 exp 1 0 1 0 1 0 0 2 ! 2 1 ! 0 0 0 0 0 0 1 0 0 0 1 0 1 cos 1 0 1 0 sin 1 0 0 , 0 0 0 0 0 0 n nn n n n T n n + = = - - = + + - = + = + - + - (3.10) což je skutečně výraz (3.2). Obrázek 2 Infinitesimální rotace vektoru r kolem osy rotace Vztah mezi konečnou a infinitesimální transformací (3.7) můžeme vyjádřit i pro obecnou rotaci. Při rotaci o malý úhel se ke každému vektoru r přičte malý vektorový přírůstek, kolmý jak k r tak k ose rotace, jehož velikost je součinem úhlu rotace a vzdálenosti r od osy (viz Obrázek 2). Tento malý vektorový přírůstek je vektorovým součinem r a vektoru osy rotace (předpokládáme, že 0 ), takže ( )2 .r r r O + × + (3.11) Pro obecný vektor rotace ( )1 2 3, , = pak máme 19 ( ) ( ) ( ) 2 3 2 2 1 3 2 2 1 , , . x x y z O y y z x O z z x y O + - + + - + + - + (3.12) Infinitesimální rotaci můžeme zapsat také takto ( ) ( ) ( )2 1 1 2 2 3 31 ,R i L L L O = + + + + (3.13) kde jsme zavedli podle zaužívaného zvyku hermiteovské matice 1L , 2L a 3L 1 2 3 0 0 0 0 0 0 0 0 0 , 0 0 0 , 0 0 . 0 0 0 0 0 0 0 i i L i L L i i i - = - = = - (3.14) Tyto matice můžeme jednoduše zapsat pomocí úplného antisymetrického tensoru ikl jako ( ) .i i jkjk L i= - (3.15) Snadno se přesvědčíme, že ( ) ( ) ( ) ( ) ( ) ( ) 1 1 12323 32 2 2 23131 13 3 3 31212 21 , , . L L i i L L i i L L i i = - = - = - = - = - = - = - = - = - (3.16) Teď vytvoříme ( )R jako n následných rotací o úhel n : ( ) ( ) ( ) 2 1 1 2 2 3 3 2 1 1 . n n R R n i L i L i L O n n = = + + + + (3.17) S využitím (3.4) máme v limitě n ( ) exp .k k k R i L = (3.18) Správnost výsledku (3.18) můžeme ověřit také jiným způsobem. Nejprve si všimněme, že při rotaci se stejnou osou rotace, ale různě velikým úhlem rotace platí ( ) ( ) ( )( ) ,R s R t R s t = + (3.19) 20 s a t jsou reálná čísla. Rotace ( )R s se stejnou osou rotace definují komutující podgrupu celé grupy rotací. Je jednoduché to ukázat: matice ( )R s definují grupu (pro pevný vektor a proměnný parametr s) pro kterou výsledek násobení nezávisí na pořadí činitelů ( ) ( ) ( ) ( ) .R s R t R t R s = (3.20) Tato podgrupa je grupa ( )2SO , grupa dvojrozměrných rotací (osa rotace je pevná, natáčí se jen složky vektoru kolmé k ose rotace). S pomocí (3.19) můžeme jednoduše odvodit následující diferenciální rovnici ( ) ( )( ) ( ) ( ) ( ) ( ) 0 0 lim 1 lim ,k k k R s R sd R s d s R R s i L R s + - = = - = (3.21) při úpravě jsme nejprve použili (3.19) a potom (3.13). Je pak už snadné uvidět, že řešením rovnice (3.21) je právě (3.18). Není snad třeba opakovat, že aby matice (3.18) representovaly rotace, musí být ortogonální a jejich determinant musí být roven 1, tj. musí být splněny vztahy ( ) ( ) ( ) ( ) 1 , det 1 . T R R R R - = = - = (3.22) Důkaz plyne z vlastností obecné matice A, pro kterou platí ( ) ( ) ( ) ( )exp exp , det exp exp Tr . T T A A A A= = (3.23) Odsud plyne, že matice (3.18) vyhovují podmínce (3.22) za předpokladu, že matice k k k i L je reálná, antisymetrická a má stopu rovnu 0. Vidíme, že tomu tak skutečně je; z definic (3.14) plyne, že matice k k k i L je ve skutečnosti nejobecnější maticí dimenze 3 3× s požadovanými vlastnostmi. Můžeme si teď položit otázku poněkud obráceně: mohou být všechny rotace vyjádřeny ve tvaru (3.18)? Nalézt odpověď není příliš snadné. V principu můžeme exponenciálu v (3.18) vyjádřit pomocí mocninné řady (3.8), a výsledek pak porovnat s nejobecnějším tvarem matice rotace. Vidíme pak, že na otázku můžeme odpovědět kladně: všechny rotace mohou být vyjádřeny ve tvaru (3.18). To zdaleka neplatí pro všechny grupy. Například nekompaktní grupy obsahují prvky, které nemohou být zapsány pomocí takového exponenciálního tvaru, ačkoliv 21 mohou být zapsány jako součin konečného počtu exponenciál. Tyto grupy se nazývají nekompaktní, poněvadž prostor jejich parametrů není kompaktní. Rotační grupa, jejíž všechny prvky jsou určeny pomocí parametrů k , které jsou uzavřeny v parametrické kouli o poloměru , je kompaktní grupa. V rámci našeho pojednání nebudeme nekompaktní grupy studovat, to ale neznamená, že nejsou ve fyzice důležité. Příkladem nekompaktní grupy je například Lorentzova grupa, tj. grupa pozůstávající z množiny všech Lorentzových transformací. Z předchozího výkladu je jistě zřejmé, že matice kL spojené s infinitesimálními transformacemi hrají významnou roli, neboť alespoň pro kompaktní grupy všechny prvky jsou popsány exponenciálou (3.18). Proto nazýváme tyto matice generátory grupy. Ačkoliv jsme zatím věnovali pozornost pouze grupě rotací, je tento závěr platný pro všechny Lieovy grupy5 : tj. grupy, jejichž prvky analyticky závisí na konečném počtu parametrů (v našem případě 1 2 3, , ). V případě, že prvky grupy jsou matice, musí platit, že každý prvek matice je diferencovatelnou funkcí parametrů6 . Počet lineárně nezávislých parametrů určuje dimensi Lieovy grupy, kterou nesmíme zaměnit s dimensí matic, které uvažujeme7 . Počet lineárně nezávislých generátorů musí být přirozeně roven dimensi grupy. Jednou z nejdůležitějších charakteristik grupy je struktura násobení, podle které určíme, jak pro rotaci vzniklou součinem dvou rotací ( )R a ( )R ( ) ( ) ( )R R R = (3.24) vyjádřit závislost na a . Znalost této závislosti pevně určuje strukturu grupového násobení. Skutečnost, že je dána závislost ( ), , určuje přirozeně pravidla násobení generátorů. Abychom to ukázali, rozvineme (3.24) podle mocnin k a k 8 5 Norský matematik Sophus Lie, 1842-1899. 6 To je případ grupy rotací. V obecném případě lze tento požadavek zeslabit: pro Lievu grupu postačuje, jsou-li prvky dvakrát diferencovatelné podle parametrů. 7 Pro grupu rotací v trojrozměrném prostoru jsou obě dimense shodně rovny 3. To je náhodná shoda: dimense grupy rotací v d-rozměrném prostoru je ( )1 2d d - . 8 Značení L užíváme pro 1 1 2 2 3 3 L L L + + . Ve vztahu (3.25) užíváme také sumační konvence: jsou-li v jednom členu stejné indexy dvakrát, sčítá se přes ně, tj. k k k k k L L . 22 { } { } ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) [ ] ( ) ( ) 2 2 2 2 2 2 exp exp 1 1 1 1 1 2 1 , . 2 k k k k k k l k lk k k lk k l k l k l i L i L i L O i L O i L L L O O i L L L L L O O = + + + + = + + - + + = + + - + + - + + (3.25) V prvních třech členech vidíme začátek Taylorova rozvoje funkce ( ){ }exp i L + . Kdyby byl čtvrtý člen roven nule, tj. kdyby kL a lL komutovaly, platilo by opravdu k k k = + . Protože pravá strana musí být vyjádřena jako mocninná řada { }exp i L , musí být možné vyjádřit komutátory generátorů jako lineární kombinace generátorů (mocninná řada má totiž tvar 1 1 2k k k l k li L L L + - -...). Jinak řečeno, musí platit [ ], ,i k l k l iL L c L= (3.26) konstanty i k lc jsou nazývány strukturními kpnstantami grupy, protože určují strukturu grupového násobení. Poznamenejme, že pro hermiteovské generátory kL jsou strukturní konstanty ryze imaginární. Strukturní konstanty jsou přirozeně antisymetrické v dolních inexech. Než pokročíme dále, ověříme nejprve, že generátory (3.14) splňují relace (3.26). Provedeme-li explicitně násobení příslušných matic, dostáváme kladnou odpověď, tj. platí [ ] [ ] [ ]1 2 3 2 3 1 3 1 2, , , , , .L L i L L L i L L L i L= = = (3.27) V kompaktním zápisu , .i j i jk kL L i L = (3.28) S pomocí (3.26) můžeme pro ( ), psát ( ) ( )2 21 . 2 k k k k mn m nc O O = + + + + (3.29) C principu lze počítat iteračním postupem do vyšších řádů, tak máme například ( )1 1 . 2 12 k k q k k k mn m n m n p m n p mq n pc c c = + + - + + ... (3.30) Skutečnost, že všechny členy v iteraci mohou být vyjádřeny pomocí strukturních konstant plyne z CBH (Campbell - Baker- Haussdorff) vztahu, který vyjadřuje logaritmus z výrazu exp expA B 23 pomocí mocninné řady opakovaných komutátorů matic A a B (viz Dodatek D). Struktura násobení v grupě bude tak určena strukturními konstantami (alespoň pro prvky grupy v konečném okolí jednotkového prvku). Představme si teď, že najdeme matice kA různé od matic kL , které ale splňují stejné komutační relace (3.26) jako kL . V takovém případě můžeme pomocí exponenciálního zobrazení definovat příslušné prvky grupy, splňující stejná pravidla násobení jako prvky původní grupy. Jinými slovy, nalezneme tímto způsobem representaci grupy. Naopak můžeme pro každou representaci grupy zkonstruovat příslušné generátory pomocí infinitesimálních transformací, které pak budou splňovat komutační relace (3.26) se stejnými strukturními konstantami. Vzniká tak přímý vztah mezi representacemi grupy a representacemi (3.26). (Matematicky přesněji: generátory kL spolu s komutačními relacemi (3.26) definují tzv. Lieovu algebru. Matice kA spolu s týmiž komutačními relacemi definují representaci Lieovy algebry.) Při studiu strukturních konstant můžeme jednoduše nalézt vztahy, které musí splňovat. Tyto vztahy jsou důsledkem Jacobiho identity, kterou splňují libovolné tři matice A, B a C: [ ] [ ] [ ], , , , , , 0 .A B C B C A C A B + + = (3.31) Tuto identitu lze jednoduše dokázat úplným rozepsáním všech komutátorů; dostáváme 12 členů, které se po dvojicích vyruší. Dosadíme-li do Jacobiho identity iA L= , jB L= a kC L= , dostaneme následující vztah pro strukturní konstanty 0 ,m n m n m n i j mk jk mi k i m jc c c c c c+ + = (3.32) při odvození jsme užili (3.26). Rovnice (3.32) bývá také nazývána Jacobiho identitou. Pro grupu rotací z ní vyplývá následující vztah mezi komponentami úplného antisymetrického tensoru 0 ,i jm mk n jk m min k im m jn + + = (3.33) který později opakovaně využijeme. Důkaz platnosti (3.33) plyne z identity ,i jm mkl ik jl il jk = - (3.34) jejíž důkaz je jednoduchý (například pevnou volbou dvou indexů). Vztah (3.32) má ještě jeden důsledek. Vytvořme n matic iC dimense n n× jako ( ) , k k i i jj C c - (3.35) n je dimense Lieovy grupy. Pak můžeme (3.32) přepsat jako 24 ( ) ( ) ( ) 0 , . nn nm k i j m j i i i i j i j kk jk c C C C C C C C c C + - = = (3.36) To jsou tytéž komutační relace, pomocí kterých jsme definovali ve (3.26) strukturní konstanty. (Matice iC tedy představují representaci Lieovy algebry dané (3.26).) Pomocí exponenciální funkce matic těchto matic tak vytvoříme grupu, která má tytéž vlastnosti násobení (alespoň v konečném okolí jednotkového prvku jako původní Lieova grupa, Jinými slovy, popsaným způsobem můžeme vytvořit representaci Lieovy grupy z matic dimense n n× , kde n je dimense Lieovy grupy. Tato representace se nazývá přidružená (adjungovaná). Jestliže zkusíme aplikovat předchozí výsledky na grupu rotací, dočkáme se jistého zklamání. Vzhledem k tomu, že strukturní konstanty jsou k i j i j kc i= , jsou matice iC přesně stejné jako matice iL (viz (3.15)) a dostáváme se tak k původním trojrozměrným rotacím. Přidružená representace je identická s původní grupou. Že je to vskutku výjimečný případ uvidíme v dalším. 4. Více o representacích V předchozí části jsme rozebírali vlastnosti grupy rotací v trojrozměrném prostoru. Nyní se budeme věnovat možným representacím této grupy. Především si všimněme, že máme-li již nějakou representaci, například matice D působící na vlnovou funkci zapsanou jako sloupcový vektor , můžeme transformací získat novou representaci. Uvažujme například transformaci .U = (4.1) Při rotacích se transformuje jako / ,D = (4.2) s maticí D danou vztahem 1 .D U DU - = (4.3) Jak původní matice D, tak nové matice D definují representaci grupy rotací, ale tyto representace se v ničem podstatném neodlišují. Budeme proto representace, které jsou spojeny vztahem (4.3) nazývat ekvivalentními representacemi. Můžeme teď formulovat jeden důležitý výsledek teorie representací: Všechny (konečněrozměrné) representace konečných kompaktních grup jsou unitární. Tím máme na mysli, že pomocí transformace (4.3) můžeme být každá representace převedena na representaci, ve které pro všechny matice D platí 1 D D+ - = . 25 Až dosud jsme rozebírali representace grupy rotací, které byly definovány prostřednictvím rotací trojrozměrného vektoru ( )1 2 3, ,x x x x= . Existuje zřejmý způsob, jak konstruovat větší representace. Vezměme dva vektory x a y , které se oba budou transformovat při rotacích. Tyto vektory mohou například představovat polohu dvou bodových částic. Vytvořme z nich šestirozměrný vektor ( )1 2 3 1 2 3, , , , ,z x x x y y y= , který se bude při rotacích transformovat jako / ,z z D z = (4.4) kde matici D vytvoříme jednoduše pomocí 3 3× matic R: 0 . 0 R D R = (4.5) Taková representace se nazývá reducibilní, protože vzhledem k rotacím je šestirozměrný prostor složen ze dvou invariantních třírozměrných podprostorů. Na tuto šestirozměrnou representaci tedy můžeme pohlížet jako na (tzv. přímý) součet dvou třírozměrných representací, což zapisujeme jako = 6 3 3 (4.6) Je jasné, že representaci, která nemá žádné invariantní podprostory, nelze zapsat v blokově diagonálním tvaru podobném (4.5); takovým representacím říkáme ireducibilní. Další representace můžeme vytvářet jako tzv. součinové representace. Vezměme například soustavu dvou (volných) částic s vlnovými funkcemi ( )1 x a ( )2 y , kde x a y jsou souřadnice těchto částic. Vlnové funkce soustavy ( ),x y pozůstávají ze všech možných součinů vlnových funkcí 1 a 2 , popisujících první resp. druhou částici. Takový objekt nazýváme tensorovým součinem a značíme ho jako 1 2 . = (4.7) Při transformacích z rotační grupy se transformují jak x a y , tak vlnová funkce , ale příslušná representace je komplikovanější, než representace daná příslušnými funkcemi 1 a 2 . Často pak součinová representace není ireducibilní a může být rozložena na řadu samostatných representací, které už jsou ireducibilní. Tento postup popíšeme později, ale teď jej ilustrujeme na jednom příkladě. Ať jsou tři možné funkce 1 dány souřadnicemi ix a tři možné funkce 2 souřadnicemi iy . Takže se jak 1 tak 2 transformují podle trojrozměrné representace rotační 26 grupy. Součinová representace obsahuje všechny možné součiny 1 a 2 , můžeme proto najít devět nezávislých funkcí ( ), ,i j i jT x y x y= (4.8) které se při rotacích transformují jako / / / / / .i j i j ii j j i j T T R R T = (4.9) Tato devítirozměrná representace skutečně není ireducibilní. Symetrická a antisymetrická část i jT , definovaná jako ( ) ( ) 2i j jii jT T T= + a [ ] ( ) 2i j jii jT T T= - se při rotacích transformuje samostatně. Plyne to bezprostředně z pohledu na (anti)symetrickou část / i jT , neboť je vidět, jak z (anti)symetrie v indexech i a j výrazu / / / / ii j j ji i j R R R R plyne (anti)symetrie v indexech / i a / j . Máme tak ( ) ( ) ( ) [ ] [ ]/ / / / / // / / / , .i j i j i j i jii j j ii j j i ji j T T R R T T T R R T = = (4.10) Antisymetrická část i jT má tři nezávislé komponenty, které se transformují podle třírozměrné representace rotační grupy. Symetrická část i jT má šest nezávislých komponent, které se netransformují podle nějaké ireducibilní representace. To vidíme okamžitě z toho, že stopa i jT definovaná jako iiT x y= (4.11) je invariantní vzhledem k rotacím. Můžeme tedy rozložit i jT na tři nezávislé tensory9 , tj. ( ) . 2 3 i j i i jk j k i j i j j i i j T x y T T x y S x y x y x y = = = + - (4.12) Všimněme si použití úplného antisymetrického tensoru v zápisu antisymetrické části jako trojrozměrného vektoru T (není to ovšem nic jiného než vektorový součin x y× ). Nulové stopy u symetrické části jsme dosáhli přidáním člene úměrného i j . Potom má i jS pouze pět nezávislých komponent. Při rotacích se transformují jednotlivé členy odděleně; tedy i pět 9 Ve druhé rovnici používáme sumační konvenci podle poznámky 8. 27 komponent i jS se transformuje mezi sebou.10 Pro součin dvou třírozměrných representací můžeme teď psát , = 3 3 1 3 5 (4.13) přičemž representace jsou označeny svou dimensí (necháváme stranou případ, kdy by existovaly dvě neekvivalentní representace stejné dimense). V popsaném příkladu jsme užili postupu, který se skládal ze dvou kroků: v prvním jsme využili vlastností symetrie tensorů, které se při transformacích nemění a ve druhém kroku jsme využili existence dvou invariantních tensorů, tj. , .i j i j i jk i jkT T = = (4.14) Jako invariantní tensory označujeme tensory, které se nemění při transformacích z grupy, tak jak jsou transformace dány působením na jednotlivé tensorové indexy / / / / / / / .i j k i jk i jkii j j k k i j k T T R R R T T = =... ... ......... (4.15) Zajisté (4.15) platí pro i j a i jk ; vztah / / / / i jii j j i j R R = (4.16) je splněn, protože matice i jR jsou ortogonální a / / / / / / det i jk i jkii j j k k i j k R R R R = = (4.17) platí, protože pro matice rotace je det 1R= . Máme-li nějaký tensor i jkT ..., můžeme pomocí invariantních tensorů provádět kontrakci indexů. Je potom možné, že takto vzniklé tensory tvoří invariantní podprostory, jinými slovy, pomocí kontrakce získáme tensory, transformující se při rotacích stejným způsobem. Jako příklad vezměme tensor, který se transformuje jako / / / / / / / .i jk i jk ii j j k k i j k T T R R R T =... ... ...... (4.18) 10 Ke každé z těchto representací můžeme zkonstruovat matice ( )D R , které byly definovány v části 2. První representaci ve (4.12) odpovídá triviální ( ) 1D R = . Pro druhou representaci máme matice ( )D R dimenze 3 3× podobné maticím R. Pro třetí representaci máme matice ( )D R dimenze 5 5× . Indexy vytváříme z bezestopých symetrických dvojic indexů ( )i j . Matice ( )D R můžeme zapsat jako ( )( )( ) ( )1 1 . 2 3 ik j l il j k i j k li j k l D R R R R R = + - 28 Vytvořme nyní tensor ,k lm i j i jk lmT T=... ... (4.19) který má o dva indexy méně. Je jednoduché se za pomoci (4.16) přesvědčit, že T se transformuje jako / / / / / / / ,k lm k lm k k ll mm k l m T T R R R T =... ... ... ... (4.20) a podobným způsobem pomocí kontrakce jedním nebo více tensory a konstruovat kontrahované tensory, které mohou vytvářet invariantní podprostory. V námi probíraném příkladu máme 1 1 2 1 , 2 2 3 3 i j i jk k lm lm i j ji i j k k i j k kT T T T T T = + + - + (4.21) přičemž první člen můžeme zapsat také jako ( ) 2i j jiT T- , protože platí identita ,i jk kl m il jm im jl = - (4.22) a druhý člen ve (4.21) je tvořen tak, aby jeho stopa byla nulová 2 0 . 3 i j i j ji i j k kT T T + - = (4.23) Podívejme se, jak vypadají symetrické tensory s nulovou stopou tvořené pomocí tensorových součinů vektoru x . Počínaje 2l budou tvořeny polynomy stupně l, první člen bude tvaru 1 li ix x... , následovat budou členy 1 2 3 2 li i i ix x x ... , 1 2 3 4 5 4 li i i i i ix x x ... atd., se všemi pro zachování symetrie potřebnými permutacemi indexů a koeficienty volenými tak, aby měl výsledný tensor nulovou stopu (tj. aby kontrakce jedním nebo více -tensory dávala nulu). Tak například máme (napíšeme pro úplnost i tensory pro 0,1l = ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) 20 1 2 23 24 4 1 1 , , , 3 1 , 5 1 7 1 , 35 l l l i i i j i j i j l i jk i j k i j k ik j jk i l i jkl i j k l i j k l ik j l il j k jk i l jl i k k l i j i j k l ik jl il jk Y x Y x x Y x x x x Y x x x x x x x x Y x x x x x x x x x x x x x x x x x x x = = = = = = = = - = - + + = - + + + + + + + + ...... (4.24) 29 Není teď pro nás tak důležitý explicitní tvar polynomů, důležitá je jejich existence pro každou hodnotu l. Protože jsou tensory 1 li iY ... symetrické a mají stopu rovnou nule, není možné konstruovat pomocí - a -tensorů invariantní podprostory (vzhledem k rotacím). Transformují se tedy tedy tensory 1 li iY ... pomocí ireducibilních reprezentací grupy rotací. Pro dané l je dimenze reprezentace je dána počtem nezávislých tensorů 1 li iY ... . Nezávislé tensory, které jsou symetrické v inexech 1 , , li i... , lze charakterizovat pomocí počtu indexů 1p nabývajících hodnotu 1 a počtu indexů 2p nabývajících hodnotu 2. Počet indexů 3p nabývajících hodnotu 3 už je dán vztahem 3 1 2p l p p= - - . Počet nezávislých tensorů je tedy11 ( )( ) 1 1 20 0 1 1 1 2 . 2 l pl l p p d l l - = = = = + + (4.25) Zatím jsem nevzali v úvahu požadavek nulové stopy, tj. že zúžení pomocí -tensoru dává nulu. Zúžení symetrického tensoru je opět symetrický tensor, který má o dva indexy méně. Má-li být zúžení nula, dostáváme tak počet podmínek, rovný počtu složek symetrického tensoru s 2l - indexy. Z toho už odvodíme, že symetrický tensor s nulovou stopou má ( )( ) ( )2 1 1 1 2 1 2 1 2 2 l l lD d d l l l l l-= - = + + - - = + (4.26) nezávislých složek. Je užitečné zapisovat tensory 1 li iY ... pomocí komplexních čísel jako (užijeme značení 1 2 3, ,x x x y x z= = = ) ( ) ( ) ( ) ( ) ( ) 2 2 2 2 2 2 , 1, , , 0 , , , , 1 m l m l lm m l m x i y P z x y pro m l Y P z x y pro m x i y P z x y pro m l - - + + = + = - + =- - (4.27) 11 Obecný výsledek je tento: symetrický tensor s l indexy, které mohou nabývat n hodnot, má 1 1 l n n + - - nezávislých složek. 30 kde ( )2 2 ,n P z x y+ jsou jisté homogenní polynomy stupně n v proměnných z a 2 2 x y+ . Odhlédneme-li od normovacího faktoru a faktoru l x , jsou l mY známé kulové funkce, které bývají často vyjádřeny pomocí úhlů a , daných kartézským vektorem x . Výše uvedené výsledky jsou odvozeny pomocí jednoduchých algebraických postupů. Působení grupy rotací na funkce lze popsat také jiným způsobem. Vzhledem k tomu, že změna funkce je indukována změnou argumentů, můžeme pomocí Taylorova rozvoje definovat diferenciální operátory, které převádějí funkci ( )x na funkci ( ) ( )/ x R x = . Prvním krokem je zavedení diferenciálního operátoru, který bude souviset s infinitesimální transformací. Při této transformaci máme ( ) ( ) ( ) ( ) ( )/ 2 ,i jk k j i x x x x x O x = + + (4.28) kde jsme využili transformačních vlastností vektoru x při infinitesimální rotaci ( ) ( ) ( )/ 2 2 .i i i j i i j k j k i j x x x i L x O x x O = + + = + + (4.29) Ze vztahu (4.28) vidíme, že diferenciální operátory i i jk j k L i x x = - (4.30) hrají roli generátorů. Toto tvrzení si potvrdíme tím, že tyto operátory splňují stejné komutační relace jako generátory grupy rotací (jinak libovolnou konstantu ve (4.30) jsem zvolili tak, aby komutační relace byly skutečně identické) , , . i j ik l jmn k m l n ik l jmn k m m k l n n l ik l jmn l m k nk m ik l jml k m n l m k i jl lk m k i jk k m L L i i x x x x x x x x x x x x x x x x x x x x x i L x = = - - = - - = - = = (4.31) Přechod od třetího ke čtvrtému řádku využívá Jacobiho identity (3.33). S definicí (4.30) můžeme zapsat (4.28) jako 31 ( ) ( ) ( ) ( ) ( )/ 2 ,i ix x x i L x O = - + (4.32) kde si povšimneme znaménka minus u posledního člene. Výsledek můžeme zobecnit na konečné rotace a psát ( ) ( )( ) ( ) ( )/ exp .x R x i L x = = - (4.33) Věnujme se teď zmíněnému znaménku minus ve vztazích (4.32) a (4.33). Nejprve definujme ( ) ( )exp ,U i L = (4.34) takže (4.33) má tvar ( ) ( ) ( )/ 1 .x U x - = (4.35) Skutečnost, že se objevuje inversní operátor k ( )U vysvětlíme tak, že pouze tímto způsobem zachováme strukturu grupového násobení. Abychom to viděli, proveďme ještě další rotaci charakterizovanou parametrem . Výsledkem je ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )( ) ( ) 1 // 1 / 1 1 .x U x U U x U U x - - - - = = = (4.36) Tato rovnice je zcela v souhlasu se zápisem ( ) ( ) ( )( )// .x R R x = (4.37) Ještě jednou se vrátíme k základní formulaci problému, popsané v části 2. Kvantově mechanická vlnová funkce je řešením rotačně symetrické diferenciální rovnice ( ) 0 ,x =D (4.38) což znamená, že pokud je ( )x řešením (4.38), je také ( )/ x řešením této rovnice. Odtud musí být ( ) ( )( )exp 0 .i ii L x - =D (4.39) Tato rovnice je splněna, když platí ( ) ( )exp expi i i ii L i L - =D D , (4.40) neboli [ ], 0 .iL =D (4.41) 32 V kvantové mechanice jsou generátory iL přiřazeny složkám momentu hybnosti (až na faktor ). Můžeme ukázat, že také celkový moment hybnosti 2 L komutuje nejen s D , ale také s každou složkou iL zvlášť: ( )2 , , , 0 .i i j j j j i i jk k j j kL L L L L L L L i L L L L = - = + = (4.42) Operátor vytvořený tak, že komutuje se všemi generátory grupy se nazývá Casimirův operátor. Podle tzv. Schurova lemmatu každý operátor, který komutuje se všemi generátory grupy, musí být úměrný identitě v nějaké ireducibilní reprezentaci grupy. Důkaz lemmatu je jednoduchý. Uvažujme o množině matic ( )D R korespondujících prvkům grupy R, která vytváří ireducibilní reprezentaci grupy. Ať je C nějaká matice, která komutuje se všemi maticemi ( )D R ( ), 0 .C D R = (4.43) Vezměme vlastní vektor x matice C s vlastní hodnotou C =x x . (4.44) Ze vztahu (4.43) plyne, že všechny vektory ( )D R x jsou vlastními vektory C s vlastní hodnotou ( ) ( ) ( )C D R D R C D R= =x x x . (4.45) Takže podprostor vytvořený vektory ( )D R x příslušejícími vlastní hodnotě je invariantní vůči transformacím z grupy. Avšak ireducibilní representace nepřipouští žádný invariantní podprostor, z čehož lze vidět, že pro vektorový prostor příslušné reprezentace musí být 1C . Nyní ukážeme, jak spočítat vlastní hodnotu Casimirova operátoru 2 L pro polynomy 1 li iY ... stupně l, které jsme dříve vytvořili (viz (4.24)) jako 2 1l + rozměrnou reprezentaci grupy rotací. Podle definice (4.30) 2 2 2 , i i i jk j imn m k n j j j k k k k j i i i i L L L x x x x x x x x x x x x x x x x x = = = - + = - + + (4.46) kde Laplaceův operátor je 33 2 . ix = (4.47) Druhý řádek v (4.46) plyne z identity (4.22); rovnost druhého a třetího nejsnáze ověříme, napíšeme-li v obou případech všechny derivace napravo. Operátor 2 L bude působit na symetrické polynomy stupně l s nulovou stopou. Laplaceův operátor působící na polynom stupně l vytvoří polynom stupně 2l - , ale stále ve všech proměnných. Indexy polynomů 1 li iY ... jsou určeny indexy souřadnic ix a indexy -tensorů. Je tedy možné zapsat 1 li iY ... pomocí výrazů úměrných alespoň jednomu -tensoru, tj. 1 1 2 3 ,l li i i i i iY Y = +... ... (4.48) kde 3 li iY ... je symetrický polynom řádu 2l - a + jsou členy, které zaručují symetrii výsledného výrazu v indexech 1 , , li i... . Výraz na levé straně (4.48) má nulovou stopu, tj. zúžení jedním nebo více -tensory dává nulu. Musí být proto všechny Y rovny nule a tedy 1 0 .li iY =... (4.49) Jednoduše se pak dá ukázat, že 1 1l li i i i i i x Y lY x = ... ... (4.50) a jako výsledek máme ( )1 1 2 1 .l li i i iL Y l l Y= +... ... (4.51) Tento výsledek je v souladu se Schurovým lemmatem: všechny polynomy 1 li iY ... patřící 2 1l + rozměrné reprezentaci jsou vlastními vektory operátoru 2 L s touže vlastní hodnotou, rovnou v tomto případě ( )1l l + . Závěrem této části ukážeme, jak vypadají generátory součinové reprezentace. Uvažujme tensorový součin vlnových funkcí ( )1 x a ( )2 y . Při infinitesimálních rotacích se tyto vlnové funkce transformují jako ( ) ( ) ( ) ( )( ) ( ) ( ) ( ) ( ) ( )( ) ( ) 1/ 2 1 1 1 2/ 2 2 2 2 1 , 1 , x x i L O x y y i L O y = - + = - + (4.52) přičemž generátory grupy rotací působící na ( )1 x a ( )2 y jsou 34 ( ) ( )1 2 , .i i jk j i i jk j k k L i x L i y x y = - = - (4.53) Pro vlnovou funkci vytvořenou jako součin ( )1 x a ( )2 y je působení infinitesimální rotace dáno vztahem ( ) ( ) ( )( ) ( )/ / 2 , , 1 , ,tot x y x y i L O x y = - + (4.54) kde tot L je definován jako ( ) ( )1 2tot L L L= + (4.55) neboli .tot i i j k j i jk j k k L i x i y x y = - - (4.56) Generátory součinové reprezentace jsou (tzv. přímým12 ) součtem generátorů působících ve dvou (různých) reprezentacích. 5. Žebříkové operátory Uvažujme o representaci grupy rotací, generované pomocí hermiteovských matic 1I , 2I a 3I , které splňují stejné komutační relace jako 1L , 2L a 3L , dané v (3.14), tj. [ ] [ ] [ ]1 2 3 2 3 1 3 1 2, , , , , ,I I i I I I i I I I i I= = = (5.1) neboli , .i j i jk kI I i I = (5.2) Požadujeme, aby matice iI byly hermiteovské, tj. ,i iI I+ = (5.3) takže matice { }exp k ki I budou unitární. Nyní určíme všechny ireducibilní matice iI daných vlastností a tak získáme všechny (konečněrozměrné, unitární) representace grupy rotací. Definujme nejprve lineární kombinace 1 2 ,I I i I = (5.4) 12 Přímý součet znamená, že ( )1 L a ( )2 L působí v různých prostorech. 35 pro které I I+ = , a dále [ ] [ ] [ ]3 1 3 2 3 2 1, , , .I I I I i I I i I I I = = - = (5.5) Pro libovolný stav bude tedy platit ( )3 3 1 .I I I I + += + (5.6) Casimirův operátor je takovou kombinací operátorů nějaké representace, že s ní všechny generátory komutují. Je-li representace ireducibilní, musí být každý Casimirův operátor násobkem jednotkové matice. V případě grupy rotací ve třech dimenzích je Casimirovým operátorem 2 2 2 2 1 2 3 .I I I I= + + (5.7) Ze vztahu (5.2) plyne 2 3, 0 .I I = (5.8) Poněvadž 2 I a 3I jsou dvě komutující hermiteovské matice, mohou být současně přivedeny k diagonálnímu tvaru s reálnými vlastními hodnotami. Zároveň musí být vlastní hodnoty 2 I kladné, protože platí 2 2 22 1 2 3 0 .I I I I = + + (5.9) Je zvykem psát vlastní hodnoty 2 I ve tvaru ( )1l l + , přičemž 0l . Uvažujme teď stav ,l m , který je vlastním stavem 2 I a 3I s vlastními hodnotami ( )1l l + a m, tedy ( )2 3, 1 , , , , .I l m l l l m I l m m l m= + = (5.10) Z (5.6) a (5.7) odvodíme, že ( ) ( )( ) ( ) ( )( ) 3 2 , 1 , , , 1 , . I I l m m I l m I I l m l l I l m + + + + = + = + (5.11) Označíme-li ,I l m + = , platí pak ( ) ( )2 3 1 , 1 ,I m I l l = + = + (5.12) jinými slovy, je nový vlastní vektor 3I a 2 I s vlastními hodnotami / 1m m= + a ( )1l l + , pokud ovšem není 36 , 0 .I l m + = (5.13) Dále máme [ ] ( ) 2 2 1 2 1 2 2 2 2 1 2 3 3 3 , , , , , , , , 1 , , l m I I l m l m I I i I I l m l m I I I l m l m I I I l m - += = + + = + - = - + (5.14) kde jsme použili I I+ + -= . S pomocí (5.10) pak ( ) ( )1 1 , , .l l m m l m l m = + - + (5.15) Předpokládáme, že stav ,l m je normovaný (tj. platí , , 1l m l m = , pak můžeme stav psát jako násobek normovaného stavu , 1l m+ , přičemž násobící faktor je dán (až na fázový faktor) vztahem (5.15). Fázový faktor ale můžeme zahrnout do definice stavu , 1l m+ , takže dostáváme ( ) ( ), 1 1 , 1 .I l m l l m m l m+ = + - + + (5.16) Operátor I+ vytváří tedy stavy s narůstající vlastní hodnotou operátoru 3I , , 1 , 2 , 3 . I I I I l m l m l m l m + + + + + + + (5.17) Z tohoto důvodu se operátoru říká žebříkový (ladder) nebo krokový (step) operátor. Zajímají nás pouze matice iI konečné dimense, proto musí být posloupnost (5.17) někde ukončena. Podle (5.16) to nastane tehdy, jestliže je v posloupnosti (5.17) stav, pro který vlastní hodnota operátoru 3I je rovna l. Tento výsledek je nezávislý na tom, se kterým stavem m jsme začali. Ostatně už z (5.15) je vidět, že z positivity výrazů a , ,l m l m plyne ( ) ( )1 1 0l l m m+ - + a tedy 1l m l- - . Abychom zajistili konečnost posloupnosti (5.17), musí být l m- kladné celé číslo. Máme pak , , 1 , , I I I l m l m l l + + + + (5.18) přitom vektor ,l l přísluší největší možné vlastní hodnotě 3I a platí , 0 .I l l+ = (5.19) Můžeme zcela obdobným způsobem ukázat, že také I- je žebříkový operátor, který vytváří stavy s klesající vlastní hodnotou operátoru 3I . Začneme-li opět ve stavu ,l m , dostáváme posloupnost 37 , 3 , 2 , 1 , . I I I I l m l m l m l m - - - - - - - (5.20) Obdobně jako jsme postupovali u I+ , zavedeme označení ,I l m - = a dostaneme ( ) ( )1 1 , , ,l l m m l m l m = + - - (5.21) takže musí platit ( ) ( )1 1 0l l m m+ - - a tedy 1l m l- + . Abychom zajistili konečnost posloupnosti (5.20), musí existovat stav s minimální hodnotou m l= - , pro který , 0 .I l l- - = (5.22) V analogii k (5.16) můžeme nyní (opět s volbou fázového faktoru v definici vektoru , 1l m - ) psát ( ) ( ), 1 1 , 1 .I l m l l m m l m- = + - - - (5.23) Vyšli jsme z daného stavu ,l m . Pomocí operátoru I+ jsme zkonstruovali l m- vlastních vektorů operátoru 3I s vlastními hodnotami 1, 2, ,m m l+ + ... a pomocí operátoru I- l m+ vlastních vektorů operátoru 3I s vlastními hodnotami 1, 2, ,m m l- - -... . Tímto způsobem máme celkem ( ) ( )1 2 1l m l m l+ - + + = + stavů. Protože počet stavů udává celé číslo, musí nabývat l a tedy i m celočíselných nebo poločíselných hodnot. Výše provedená konstrukce ještě nezaručuje, že jsme získali všechny možné stavy. V principu by bylo možné, že postupné působení operátoru I+ a I- vede ke stavu se stejnými vlastními hodnotami operátorů 2 I a 3I , který je odlišný od původního stavu ,l m . Můžeme obecně dokázat, že tomu tak není a že stavy ,l m s l m l- nejsou degenerované. Jednoduše to můžeme zkontrolovat explicitním výpočtem toho, že jsou splněny komutačních relace [ ] [ ]3 3, , , 2 .I I I I I I + -= = (5.24) Použitím (5.10), (5.16) a (5.23) máme postupně ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) 3 3 , 1 1 , 1 1 1 1 , 1 1 1 , 1 , , I I I I l m m l l m m l m m l l m m l m l l m m l m I l m - = + - - + - = + - = (5.25) 38 ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) 3 , 1 1 1 1 , 1 1 1 1 , 2 , 2 , . I I I I l m l l m m l l m m l m l l m m l l m m l m m l m I l m + - - +- = + - - + - - - + - + + - + = = (5.26) Shrneme-li teď výsledek: ireducibilní representace 1I , 2I a 3I je charakterizovaná číslem l a je vytvářena 2 1l + stavy ,l m , pro které platí ( ) ( ) ( ) 2 3 , 1 , , , , , , 1 1 , 1 , I l m l l l m I l m m l m I l m l l m m l m = + = = + - (5.27) přičemž , 1, 2, , 2, 1,m l l l l l l=- - + - + - -... . Jak l, tak m nabývají celočíselných nebo poločíselných hodnot. Uvedeme nyní jako příklad representace pro 1 2,1l = a 3 2l = . Pro 1 2l = máme jednu dvojrozměrnou representaci. Nacházíme dva různé stavy 1 2,1 2 a 1 2, 1 2- , pro které podle (5.27) platí 1 2, 1 2 1 2,1 2 , 1 2,1 2 0 , 1 2,1 2 1 2, 1 2 , 1 2, 1 2 0 . I I I I + + - - - = = = - - = (5.28) Odsud pak máme vyjádření operátorů 3 1 2 0 0 1 0 0 , , . 0 1 2 0 0 1 0 I I I+ - = = = - (5.29) Matice 1I , 2I a 3I , které nám dává tato representace jsou právě matice 1 2 i , o kterých budeme pojednávat v následující části 6. Pro 1l = máme jednu trojrozměrnou representaci. Nacházíme tři různé stavy 1,1 , 1,0 a 1, 1- , pro které podle (5.27) platí 1, 1 2 1,0 , 1,1 2 1,0 , 1,0 2 1,1 , 1,0 2 1, 1 , 1,1 0 , 1, 1 0 . I I I I I I + - + - + - - = = = = - = - = (5.30) Vyjádření operátorů je pak 39 3 0 2 0 0 0 01 0 0 0 0 0 , 0 0 2 , 2 0 0 . 0 0 1 0 0 0 0 2 0 I I I+ - = = = - (5.31) Pro 3 2l = máme jednu čtyřrozměrnou representaci. Nacházíme čtyři různé stavy 3 2,3 2 , 3 2,1 2 , 3 2, 1 2- a 3 2, 3 2- , pro které podle (5.27) platí 3 2, 3 2 3 3 2, 1 2 , 3 2,3 2 3 3 2,1 2 , 3 2, 1 2 2 3 2,1 2 , 3 2,1 2 2 3 2, 1 2 , 3 2,1 2 3 3 2,3 2 , 3 2, 1 2 3 3 2, 3 2 3 2,3 2 0 , 3 2, 3 2 0 . I I I I I I I I + - + - + - + - - = - = - = = - = - = - = - = (5.32) Operátory jsou 3 0 0 0 03 2 0 0 0 0 3 0 0 0 1 2 0 0 0 0 2 0 3 0 0 0 , , . 0 0 1 2 0 0 2 0 00 0 0 3 0 0 0 3 2 0 0 0 0 0 0 3 0 I I I+ - = = = - - (5.33) Poznamenejme, že matici I- jsme nemuseli počítat stejně pečlivě podle (5.27) jako matici I+ , ale mohli jsme využít vztahu I I+ - += . 6. Grupa SU(2) V předchozí části jsme konstruovali daným postupem representace grupy rotací ve třírozměrném prostoru (tato grupa rotací je charakterizována třemi reálnými parametry) . Nyní se podíváme, zda neexistují ještě jiné možnosti. Všimneme si nejprve vlastností unitárních matic X dimense 2 2× s determinantem rovným 1: 1 , det 1 .X X X+ - = = (6.1) Tyto matice mohou být parametrizovány pomocí dvou komplexních parametrů a a b: * * , a b X b a = - (6.2) 40 přičemž 2 2 1a b+ = . Matice tvaru (6.2) s obecnými a a b se nazývají kvaterniony. Kvaterniony tvoří okruh, podobně jako reálná nebo komplexní čísla. Kvaterniony s normou 1 (tj. s parametry a a b splňujícími 2 2 1a b+ = ) jsou prvky grupy ( )2SU , grupy unitárních matic dimense 2 2× s determinantem rovným 1.13 Není obtížné ukázat, že matice vyhovující (6.1) tvoří grupu. Dále, pokud splňují 1X a 2X (6.1), pak také 3 1 2X X X= splňuje tento vztah. Také jednotková matice a matice inversní k (6.1) patří do množiny matic (6.1), a že pravidlo násobení matic splňuje požadavky grupového násobení je zřejmé. Komplexní čísla a a b splňující podmínku 2 2 1a b+ = můžeme vyjádřit pomocí tří reálných parametrů, takže máme opět co dělat s třírozměrnou Lieovou grupou. Tato skutečnost navozuje otázku, mají-li grupy ( )2SU a grupa rotací ( )3SO nějakou souvislost. Každá matice dimense 2 2× může být vyjádřena jako kombinace 1 (jednotkové matice) a následujících tří matic14 : 1 2 3 0 1 0 1 0 , , . 1 0 0 0 1 i i - = = = - (6.3) Tyto ­ matice splňují následující pravidlo násobení 1 .i j i j i jk ki = + (6.4) Matice X můžeme vyjádřit pomocí matic 1, i jako 0 1 .i iX c ic = + (6.5) Srovnáním parametrizace (6.5) s parametrizací (6.2) vidíme, že koeficienty 0c a ic musí být reálné a že normovací podmínka 2 2 1a b+ = implikuje 2 0 1 .i ic c c+ = (6.6) Obecné matice z grupy ( )2SU mohou být zapsány ve tvaru (6.5), při přihlédnutí k podmínce (6.6). 13 V tomto smyslu tvoří komplexní čísla s normou 1 grupu ( )1U , pozůstávající ze všech faktorů ( )exp i . 14 Často se jim říká Pauliho matice a bývají značeny jako i . 41 Podívejme se nyní na infinitesimální matice ( )2SU . V okolí jednotkové matice budeme psát ( )2 1 ,X i B O B= + + (6.7) kde (infinitesimální) matici B musíme zvolit tak, aby byla splněna podmínka (6.1). To vede k následujícím omezením ( )( ) ( )( ) ( ) ( ) ( )( ) ( ) 1 2 2 2 2 2 2 1 1 1 1 , det 1 1 1 Tr 1 , i B O B i B O B i B O B i B O B i B O B B O B + - + + + = + + - + = - + + + = + + = (6.8) takže , Tr 0 .B B B+ = = (6.9) Vzhledem k tomu, že každá hermiteovská matice s nulovou stopou dimense 2 2× může být vyjádřena jako lineární kombinace ­ matic s reálnými koeficienty, můžeme infinitesimální transformace z ( )2SU zapsat ve tvaru ( ) ( )2 1 . 2 i iX i O = + + (6.10) Tyto infinitesimální transformace mohou generovat pomocí exponenciálního zobrazení konečné transformace. Limitní přechod je stejný jako v části 3, tj. ( ) lim 1 exp . 2 2 n i i i i n X i i n = + = (6.11) Vybrali jsme parametry i tak, aby generátory transformací z ( )2SU byly dány maticemi 2i . Potom totiž splňují tyto matice stejné komutační relace, jako generátory iL grupy rotací. Plyne to přímo z pravidla pro násobení (6.4): , . 2 2 2 ji k i jki = (6.12) Tyto komutační relace tedy říkají, že grupa ( )2SU má stejné strukturní konstanty a tedy stejné vlastnosti násobení jako grupa rotací v trojrozměrném prostoru. To ovšem platí pro prvky v okolí jednotky, nikoliv nutně pro grupu jako celek. Skutečně uvidíme, že striktně vzato netvoří matice grupy ( )2SU reprezentaci grupy rotací, ale pouze projektivní reprezentaci. 42 Je možné nalézt pomocí vlastností ­ matic nové vyjádření exponenciální transformace ( )X . Postupujeme následujícím způsobem ( ) ( ) ( ) 0 2 2 1 0 0 1 exp 2 ! 2 1 1 , 2 ! 2 2 1 ! 2 n i i i i n n n i i i i n n i X i n i i n n = + = = = = = + + (6.13) tedy počítáme zvlášť součet sudých a lichých mocnin 2i ii . Všimněme si teď, že ( ) 2 2 1 ,i i i j i ji = - = - (6.14) kde jsem využili (6.4) a definovali jako 2 2 2 1 2 3 . = + + (6.15) Z (6.14) pak okamžitě plyne ( ) ( ) ( ) ( ) ( ) 2 2 2 1 22 2 1 1 , 1 , n nn n i i i i i ii i i + = - = - (6.16) takže můžeme (6.13) zapsat jako ( ) ( ) ( ) ( ) ( ) 2 2 1 0 0 1 1 1 2 ! 2 2 1 ! 2 cos 1 sin . 2 2 n nn n i i n n i i i X n n i + = = - - = + = + + (6.17) Tento výsledek je přirozeně v souladu s obecným rozkladem (6.5), kde za koeficienty 0c a ic dosadíme 0 cos , sin . 2 2 i ic c = = (6.18) V části 3 jsme dospěli k závěru, že rotace mohou být parametrizovány pomocí vektorů , které vyplňují kouli o poloměru = . Směr určuje osu rotace a délka úhel, o který soustavu kolem osy otočíme. Protože otočení o a - vede k témuž výsledku, mohli jsme psát ( ) ( ) .R R = = - (6.19) Jak plyne z (6.12), mohou být prvky z ( )2SU parametrizovány těmi samými vektory , avšak abychom parametrizovali všechny prvky ( )X , musí být poloměr koule dvojnásobný, tedy 43 roven 2 . Dva protilehle orientované vektory a / v této kouli, pro které platí / 2 + = , popisují tutéž rotaci ( ) ( )/ ,R R = (6.20) protože jde o otočení kolem stejné osy o úhel otočení se liší o 2 . Odpovídající prvky ( )2SU , tj. ( )X a ( )/ X jsou však navzájem opačné ( ) ( )/ .X X = - (6.21) Plyne to z (6.17), (6.18) a ze vztahů ( ) ( )/ cos 2 cos 2 =- a ( ) ( )/ sin 2 sin 2 = . Výše uvedené znamená, že striktně vzato prvky ( )2SU netvoří reprezentaci rotační grupy, ale projektivní reprezentaci. Totiž, pro součin rotací ( ) ( ) ( )R R R = (6.22) s , , máme součin odpovídajících matic z ( )2SU ( ) ( ) ( ) ,X X X = (6.23) kde znaménko na pravé straně rovnice závisí na a .15 Věnujme se nyní reprezentacím grupy ( )2SU . Necháme matice z ( )2SU působit v abstraktním vektorovém prostoru s komplexními souřadnicemi , 1,2 = , takže16 / .X = (6.24) Komplexně sdružené vektory se transformují jako ( ) ** */ * .X = (6.25) Zavedli jsme důležité nové značení: indexy mohou být umístěny nahoře i dole. Je to proto, abychom zdůraznili, že vektory s indexy nahoře, jako např. v (6.24), se transformují odlišně od vektorů s indexem dole, jako např. v (6.25). Kromě toho ještě upravíme součtové pravidlo: přes dva stejně značené indexy se sčítá pouze tehdy, je-li jeden horní a jeden dolní, tedy 15 Na druhé straně můžeme říci, že trojrozměrné rotace tvoří reprezentaci grupy ( )2SU . 16 Souřadnice nemají bezprostřední fyzikální interpretaci. 44 2 1 . = (6.26) Ještě ukážeme, že reprezentace odpovídající maticím * X je ekvivalentní původní representaci. Platí vztah * * * 2 2 * * 0 0 . 0 0 i a b i a b X X i b a i b a - - = = = - - (6.27) Protože 2 2 1 = , jsou podle definice (4.3) reprezentace (6.24) a (6.25) ekvivalentní. Poslední výsledek snadněji pochopíme z následujícího: / / / / det .X X X = = (6.28) S využitím ( )i = můžeme (6.28) zapsat v maticové formě 2 2 .T X i X i = (6.29) Protože ( ) ( ) * *1T X X X+ - = = , plyne z (6.29) okamžitě (6.27). Všimněme si, že jsme napsali u prvků matice 2 oba indexy jako horní. Je to proto, že v (6.28) musí mít tensor oba indexy horní. Jedinými invariantními tensory jsou , a . Budeme nyní uvažovat o analytických funkcích dvou proměnných ( )1 2 ,f . Při Taylorově rozvoji těchto funkcí kolem počátku vytváříme jako členy řady N ­ tého řádu homogenní symetrické polynomy N ­ tého stupně (N bude dále označovat nějaké přirozené číslo). Označme 1 2 1 2 .N N Y =... ... (6.30) Vzhledem k ( )2SU se tyto výrazy transformují jako 1 2 1 2 1 21 / 1 /N N N Y Y X Y = =... ... ... (6.31) Na rozdíl od grupy rotací nemáme v případě ( )2SU grupově invariantní operaci kontrakce pomocí - tensorů, vzhledem k tomu, že X nejsou obecně ortogonální, ale unitární. Musíme tedy obecně uvážit, že / / / / .X X (6.32) 45 Jak jsme už uvedli, jediná delta funkce, kterou můžeme u ( )2SU uvažovat, má jeden index nahoře a jedem dole. Nebudeme se dále zabývat komplexně sdruženými souřadnicemi * , neboť jsme již zjistili, že se transformují podle reprezentací ekvivalentních k transformacím . Vzhledem k výše uvedeným skutečnostem očekáváme, že se tensory 1 2 N Y ... budou transformovat podle ireducibilních reprezentací grupy ( )2SU . Nezávislé polynomy tohoto typu jsou plně charakterizovány počtem 1p indexů, které nabývají hodnotu 1 (počet zbylých indexů, které nabývají hodnotu 2 je 2 1p N p= - ), takže máme celkem 1 0 1 1 N p N = = + (6.33) nezávislých polynomů stupně N. Dále budeme chtít zapsat působení generátorů ( )2SU na funkce souřadnic pomocí diferenciálních operátorů. To vede k ( ) ( )2 1 , 2 SU i iL = - (6.34) takže infinitesimální transformace z ( )2SU funkce ( ) můžeme zapsat jako ( ) ( ) ( ) ( )( ) ( ) ( ) ( ) ( ) ( ) 2/ 2 2 1 . 2 SU i i i i L O i O = - + = + + (6.35) Povšimněme si, že index ve výrazu považujeme za dolní index. S pomocí (6.34) můžeme také Casimirův operátor ( ) ( ) 2 2SU L zapsat jako diferenciální operátor ( ) ( ) ( ) ( ) ( ) 2 2 2 1 4 1 2 4 1 1 4 2 1 1 . 4 2 SU i i i L = = - + = - + = + (6.36) 46 Rovnost výrazů na posledních dvou řádcích (6.36) uvidíme snadno, napíšeme-li v obou diferenciální operátory napravo od souřadnic. Přechod od prvního řádku ke druhému je triviální, využijeme-li identitu ( ) ( ) 2 .i i i = - + (6.37) Tuto identitu můžeme dokázat pohodlně, vyjdeme-li z toho, že každou matici A dimenze 2 2× můžeme rozložit pomocí jednotkové matice a tří ­ matic na ( ) ( ) 1 1 Tr Tr . 2 2 i i i A A A = + (6.38) Derivujeme-li tuto rovnici, která je lineárně závislá na prvcích matice A, podle A dostaneme právě identitu (6.37). Samozřejmě můžeme také identitu ověřit postupným dosazením konkrétních hodnot indexů , , a . Nechme nyní operátor (6.36) působit na polynomy 1 2 N Y ... . Využijeme toho, že 1 2 1 2N N Y N Y = ... ... (6.39) a dostaneme tak přímo ( ) ( ) 1 2 1 2 2 2 1 . 2 2 N NSU N N L Y Y = + ... ... (6.40) Poznáváme v tom reprezentace charakterizované hodnotou l z části 5, označíme-li l s= , 2s N= . Podařilo se nám tedy zkonstruovat 2 1s+ -rozměrné reprezentace grupy ( )2SU , kde s nabývá poločíselných nebo celočíselných hodnot. Vlastní hodnoty Casimirova operátoru jsou pro tyto reprezentace podle (6.40) rovny ( )1s s + . V části 5 je ukázáno, že jsme takto nalezli všechny reprezentace ( )2SU . Očekáváme, že pro celočíselné hodnoty s budou tyto reprezentace shodné s reprezentacemi grupy rotací, které jsme studovali v předchozí části. Je to opravdu tak, což ukážeme následujícím způsobem: uvažujme tensor Y , kvadratický v souřadnicích : .Y = (6.41) Máme tři nezávislé tensory tohoto typu, které můžeme zapsat jako ( ) ,i i = (6.42) 47 což plyne z možnosti zápisu obecné symetrické matice dimenze 2 2× jako lineární kombinace nezávislých symetrických matic i .* Při transformacích z ( )2SU se veličiny i transformují jako ( ) ( ) ( ) / / / / / / / / / / / 1 , i i i i X X X X - = = (6.43) kde jsme využili toho, že je invariantní tensor, podobně jako podle (6.28). Můžeme dokázat, že platí ( ) ( ) ( )1 ,i ji j j X X R - = (6.44) takže tensory i se transformují stejně, jako souřadnice ix v části 3. Platnost (6.44) ověříme pro infinitesimální transformace. Máme ( ) ( ) ( ) ( ) ( ) ( ) 1 2 2 2 2 1 1 2 2 , . 2 i j j i k k i j i j i i jk j k i i X X O O i O O - = - + - + = + + = + + (6.45) Tedy stejná transformace jako transformace souřadnic ix (4.29). 7. Spin a amplituda rozptylu V předchozích částech jsme viděli, jak mohou být možné vlnové funkce rotačně invariantní soustavy klasifikovány podle reprezentací rotační grupy. Tyto reprezentace byly charakterizovány poločíselnými nebo celočíselnými hodnotami, značenými l nebo s. Tuto skutečnost známe z popisu atomu vodíku, kde možné vlnové funkce závisí na celočíselném l, které určuje celkový moment hybnosti daného stavu. Generátory kL , které jsme definovali v předchozím (viz (4.30)), odpovídají složkám operátoru momentu hybnosti. Vyplývá to ze souřadnicové reprezentace operátoru přiřazenému hybnosti, který působí na vlnovou funkci jako * Je ( ) ( ) ( ) ( )( )2 2 2 21 1 1 1 1 2 1 2 3, , 2i = - = + = - . 48 .p i r = (7.1) Složky operátoru přiřazenému momentu hybnosti L r p= × pak mají stejný tvar jako (4.30), odhlédneme-li od faktoru . Podle (4.51) je pak celkový (vnější) moment hybnosti dán rovnicí pro vlastní hodnoty ( )2 1 .L l l = + (7.2) Je však také možné, že částice mají nějaký vnitřní moment hybnosti, jehož příspěvek k celkovému momentu je dán vnitřní strukturou částice, nikoliv pohybem (těžiště) částice. Obrazně je možné si představit, že částice má konečné rozměry a rotace kolem těžiště přispívá k celkovému momentu, tato část momentu hybnosti se nazývá spin částice. Takovou situaci známe z klasické mechaniky (příkladem je rotující káča). Tato interpretace vnitřního momentu je jistě problematická, ale pro nás to není podstatné. Důležité pro nás je, že vnitřní moment hybnosti je přirozeným způsobem popsán formalismem probíraným v předchozích částech. Je pak věcí experimentálního zjištění, jsou-li vytvořené matematické struktury v přírodě realizovány. Pro částice se spinem nemusí vystupovat pouze reprezentace s celočíselnou hodnotou l. Skutečně existují v přírodě částice s poločíselným spinem, jako elektron, proton a neutron. Z teorie reprezentací vím, že pro částici se spinem s budeme mít 2 1s+ různých stavů.17 Má proto vlnová funkce částice 2 1s+ složek. Při rotacích se transformují složky navzájem podle příslušné reprezentace grupy rotací. Skutečnost, že se částice může nacházet v různých spinových stavech má přirozeně vliv na výsledky experimentů. Mnoho experimentů týkajících se existence spinu, jakož i vlastností se spinem spojených využívá toho, že spin indukuje magnetický moment. Známý Sternův ­ Gerlachův experiment může sloužit jako příklad. Jiný příklad, z něhož vyplývá existence různých spinových stavů je měření úhlového rozložení při rozptylových experimentech. V této části budeme výše uvedené ilustrovat na příkladu rozptylu protonu na jádře atomu uhlíku. Protony mají spin 1 2s = , takže máme dva různé ,,druhy" protonů, což je popsáno vlnovou funkcí o dvou složkách. Obvykle píšeme vlnovou funkci jako součin funkce, popisující 17 Výjimku tvoří částice s nulovou hmotností, jako je foton, které se vždy pohybují rychlostí světla. Pro takové částice existují pouze dva různé stavy; spin je v tomto případě definován jiným způsobem. 49 prostorovou část a dvousložkového spinoru. Dva různé spinové stavy protonu můžeme popsat pomocí nezávislých vlnových funkcí 1 a 2 , kde ( ) ( ) ( ) ( )1 2 1 0 , . 0 1 r f r r f r = = (7.3) Výše uvedené stavy jsou vlastními stavy generátoru ( )2 3 SU L , který je spojen s rotací kolem osy z. O prvním ze stavů říkáme, že odpovídá orientaci spinu v kladném směru osy z ( 2zS = ),o druhém pak, že odpovídá orientaci spinu v záporném směru osy z ( 2zS =- ). Při rotacích se mohou tyto stavy vzájemně zaměnit. Například rotace kolem osy x o radiánů působí na spinory jako násobení maticí (viz (6.17)) 1 0 , 0 i X i i = = (7.4) takže se opravdu dva stavy ze (7.3) vymění. Obrázek 3 Rozptyl protonu na uhlíku. Protony dopadají podél osy x a jsou odchýleny o úhel . Tento úhel je definován jako úhel, který svírá osa z s rovinou, ve které se pohybuje dopadající i rozptýlený proton. Uvažujme nyní o pokusu, kdy je proton rozptýlen na jádře atomu uhlíku ( 12 C ). Ať proton dopadá podél kladného směru osy x na jádro, umístěné v počátku souřadné soustavy. Jádro atomu uhlíku 50 je (v dobrém přiblížení) rotačně souměrné a tak můžeme srovnávat rozptyl protonů se spinem ,,nahoru" ( tedy protonů s 2zS = ) s rozptylem protonů se spinem ,,dolů", tj. s 2zS =- . Ukazuje se, že v jednom případě se protony odchylují především do směru záporné osy y, v druhém případě do směru kladné osy y. Je to důsledkem chování amplitudy rozptylu, která určuje pravděpodobnost, s jakou s proton odchýlí o úhel , v tomto případě definovaném jako úhel mezi osou z a rovinou rozptylu (tj. rovinou ve které se pohybují dopadající i rozptýlené protony, viz Obrázek 3). Ukazuje se, že amplituda rozptylu silně závisí na spinu dopadající částice (předpokládáme, že částice, na níž dochází k rozptylu, v našem případě jádro atomu uhlíku, má nulový spin a je rotačně souměrná); čím vyšší je hodnota spinu dopadající částice, tím složitější je úhlová závislost amplitudy rozptylu. Zdůrazněme zde, že amplituda rozptylu je plně (až na konstanty) určena požadavkem rotační invariance. Všimněme si teď kvantově mechanických stavů před a po srážce.18 Před srážkou je hybnost protonů určena podmínkami experimentu, zatímco spinový stav můžeme volit podle potřeby; jádro uhlíkového atomu je v základním stavu. Počáteční stavy, které můžeme rozlišit, označíme tedy jako a , budou shodné s vlnovými funkcemi (7.3). Charakterizovat možné stavy po rozptylu je už mnohem obtížnější. Změní se hybnost i orientace spinu protonu, a také jádro uhlíku se může začít pohybovat a případně se dostat do nabuzeného stavu. Avšak s výjimkou úhlu rozptylu, který je určen rovinou, ve které se pohybuje dopadající a rozptýlený proton, nemůže tento experiment všechny detaily stavu soustavy proton ­ jádro postihnout, nebo alespoň se o tyto detaily nebudeme zajímat. Možné koncové stavy budeme značit { } ( ) , kde { } značí soubor veličin, jejichž stav nemůžeme nebo nechceme v experimentu zjišťovat. Pravděpodobnost, že po rozptylu bude stav protonu v počátečním stavu se spinem ,,nahoru" charakterizován hodnotami { } a , je rovna { } ( ) 2 . Protože veličiny{ } nás nezajímají, 18 Počáteční stav je charakterizován vlnovou funkcí pro t - , tj. pro čas velmi dlouho před rozptylem. Podobně koncový stav je charakterizován vlnovou funkcí pro t , tj. pro čas velmi dlouho po rozptylu. Takto určené stavy jsou označovány jako ,,in" a ,,out". Při výpočtu skalárního součinu bychom měli uvažovat vlnové funkce ve stejném okamžiku. I když principiálně je tato otázka velmi důležitá, pro náš případ nehraje žádnou důležitou roli. 51 je pravděpodobnost rozptylu do úhlu dána vztahem19 ( ) { } ( ) { } 2 1 .f = (7.5) Obdobně spočteme pravděpodobnost, že po rozptylu nalezneme proton v počátečním stavu se spinem ,,dolů" rozptýlen do úhlu : ( ) { } ( ) { } 2 2 .f = (7.6) Při rotaci o kolem osy x přejde úhel na + , zatímco se dva spinové stavy v (7.3) vzájemně zamění. Rotační invariance tedy vyžaduje, aby platilo ( ) ( )1 2 .f f = + (7.7) Můžeme však postoupit ještě dál. Uvažujme o spinovém stavu dopadajícího protonu ( )1 2 1 2, .a a a a = + (7.8) Podobně jako v (7.5) a (7.6) odvodíme pro úhlovou závislost amplitudy rozptylu ( )f výraz ( ) { } ( ) ( ) { } { } ( ) { } ( ) { } ( ) ( ) ( ) ( ) 2 2 1 2 1 2 2 2 * * * 1 1 2 2 1 2 12 1 2 12 , , f a a a a a f a f a a f a a f = = + = + + + (7.9) kde 1f a 2f jsou definovány v (7.5) a (7.6), zatímco smíšené členy jsou dány vztahem ( ) { } ( ) { } ( ) { } * 12 .f = (7.10) Vztah (7.9) je možno zapsat v maticovém zápisu jako ( ) ( ) 1 1 2 2 1 0 , , 0 1 a f a F a a a a a + = = + = (7.11) kde ( )F je positivně definitní hermiteovská matice ( ) ( ) ( ) ( ) ( ) 1 12 * 12 2 . f f F f f = (7.12) 19 Pravděpodobnost nalezení rozptýleného protonu v úhlovém intervalu ( ), d + je rovna ( )1f d . Je pro nás nepodstatné, jak konkrétně sčítání přes { } provést. 52 Uvažujme nyní rotaci celého experimentálního uspořádání o úhel kolem osy x, takže úhel přejde na + . Při této rotaci se transformují vektory s pomocí matice ( ) ( )1 1 0 0 exp 0 cos sin , 0 sin cos R i L = = - (7.13) zatímco spinorové stavy a se transformují pomocí matice ( ) 1 cos sin 2 2exp , 2 sin cos 2 2 i X i i = = (7.14) takže totéž platí pro a: ( )/ .a a X a = (7.15) Po rotaci celého experimentálního uspořádání musí být hodnota amplitudy rozptylu pro úhel + , získaná se svazkem protonů charakterizovaným spinorem / a rovna původní hodnotě amplitudy rozptylu, tj. pro úhel a svazek charakterizovaný spinorem a. Musí tedy platit ( ) ( ) ( ) ( ) .X F X F + + = (7.16) Tato rovnice musí platit pro všechny úhly . Dosadíme-li do (7.16) hodnotu 0 = , dostáváme (užijeme unitarity X, tedy ( ) ( )1 X X + - = ) ( ) ( ) ( ) ( )1 0 .F X F X - = (7.17) Provedeme-li teď porovnání jednotlivých prvků matice, dostáváme (píšeme pro úhlovou proměnnou opět místo ) ( ) ( )2 2 * 1 1 2 12 12cos sin cos sin , 2 2 2 2 f f f i f f = + - - (7.18) ( ) ( )2 2 * 2 2 1 12 12cos sin cos sin , 2 2 2 2 f f f i f f = + + - (7.19) ( ) ( )2 * 2 12 12 12 1 2cos sin cos sin , 2 2 2 2 f f f i f f = + - - (7.20) kde ( )1 1 0f f , ( )2 2 0f f a ( )12 12 0f f . Tento výsledek můžeme zapsat také jako ( ) ( ) ( ) ( )* 1 1 2 1 2 12 12 1 1 cos sin , 2 2 2 i f f f f f f f = + + - - - (7.21) 53 ( ) ( ) ( ) ( )* 2 1 2 1 2 12 12 1 1 cos sin , 2 2 2 i f f f f f f f = + - - + - (7.22) ( ) ( ) ( ) ( )* * 12 12 12 12 12 1 2 1 1 cos sin . 2 2 2 i f f f f f f f = + + - - - (7.23) Závislost amplitudy rozptylu na úhlu jsme odvodili pouze na základě požadavku rotační invariance. Funkce ( )1f a ( )2f mají na intervalu - právě jedno maximum a jedno minimum a dávají tak vznik přednostnímu směry rozptylu, což dobře souhlasí s výše zmíněnými experimentálními výsledky. Úhlovou závislost amplitudy rozptylu můžeme ještě dále konkretizovat, užijeme-li ještě další symetrie. V dobrém přiblížení je příroda symetrická vzhledem k prostorovému zrcadlení. Při zrcadlení vzhledem k počátku (označíme tuto operaci jako P) se mění souřadnice na souřadnice s opačným znaménkem . P r r - (7.24) Dvojnásobné zrcadlení je totéž co identické, takže zde máme co dělat s konečnou grupou, která má dva prvky, zrcadlení a identitu. Přidání zrcadlení rozšíří grupu ( )3SO na ( )3O , jak jsme se již zmínili na počátku části 3. Generátory grupy rotací se zrcadlením nezmění, což je přímo vidět z (4.30): při zrcadlení se L transformuje jako pseudovektor. To plyne také z jednoduše viditelné skutečnosti, že zrcadlení vzhledem k počátku komutuje s rotacemi. Z toho pak plyne, že zrcadlení působí podle Schurova lemmatu na ireducibilních reprezentacích rotační grupy jako identita (viz diskuse následující po (4.42)). Taktéž spinový stav se při zrcadlení nemění, nanejvýš se může objevit znaménko minus. Podívejme se na vliv zrcadlení při popisu rozptylu protonů na jádře atomu uhlíku, když toto zrcadlení bude popsáno pomocí matice z ( )3O 1 0 0 0 1 0 . 0 0 1 zP = - (7.25) Po tomto zrcadlení máme stále totéž experimentální uspořádání, hybnost dopadajícího protonu se nezměnila. Pouze úhel teď přešel na - . Protože amplitudy rozptylu ( )1f a ( )2f se nezměnily, musí být 54 ( ) ( ) ( ) ( )1 1 2 2, .f f f f = - = - (7.26) To vzhledem k (7.7) vyžaduje 1 2f f= . Povšimněme si ještě, že zP z (7.25) můžeme zapsat jako součin zrcadlení vzhledem k počátku P a rotace kolem osy z o úhel . Zrcadlení nemá vliv na spinový stav, ale rotace odpovídá působení matice 3 3 0 exp . 02 i i i i = = - (7.27) Z toho plyne (stejně jako v (7.16)) ( ) ( )3 3F F - = , což vede na * 12 12f f=- . 8. Isospin Jak jsme uvedli v části 1, seskupují se elementární částice přibližně stejných hmotností do tzv. multipletů. Například ( ) ( ) ( ) 0 0 , : , , : , , , : , , , nukleony dublet p n piony triplet kvadruplet + - ++ + - (8.1) Toto uspořádání je možné vysvětlit předpokladem, že příroda je v dobrém přiblížení invariantní vzhledem k tzv. isospinovým rotacím. Isospinové rotace tvoří grupu, přičemž její prvky jsou rotacemo ,,vnitřního" trojrozměrného prostoru. Stavy popisující isospinové multiplety se transformují podle (ireducibilních) reprezentací této grupy. Pojem isospin je proto analogický pojmu spinu, který byl spojem s rotacemi ,,vnějšího" prostoru. Sílové působení, které váže nukleony do jádra atomu, tzv. silná jaderná interakce, je invariantní vzhledem k isospinovým rotacím. To však neplatí pro elektromagnetickou interakci. Proto není elektrický náboj multipletu stejný. Zákon zachování elektrického náboje je však vždy platný. To je vyjádřeno zachováním příslušné složky isospinového ,,momentu hybnosti" vzhledem k tomu, že elektrický náboj je určen Gell-Mannovým ­ Nishinovým vztahem 3 1 , 2 Q I Y= + (8.2) kde Y je ,,hypernáboj", který má pro všechny stavy multipletu stejnou hodnotu. Máme 1Y = pro nukleony, 0Y = pro piony a opět 1Y = pro -částice. 55 Podívejme se teď na rozpad ++ částice .p++ + (8.3) Pro částice účastnící se tohoto rozpadu platí 3 3 3 3 1 , , , 2 2 I I p p I ++ ++ + + = = = (8.4) takže ( ) ( ) ( )3 3 3 3 . 2 I p I p p I p + + + + = + = (8.5) Vztah (8.5) plyne z toho, že generátory iI reprezentace vzniklé součinem stavů jsou součtem generátorů, působících na jednotlivé stavy.* Totéž platí přirozeně i pro I+ a I- . -částice se rozpadají na jeden nukleon a jeden pion. Zákon zachování náboje říká, že rozpad ++ podle (8.3) je jediný možný. U jiných -částic je situace méně jednoduchá. Začněme soupisem stavů nukleonu a pionu, které jsou vlastními stavy operátoru 3I : ( ) ( ) ( ) ( ) ( ) ( ) 3 3 0 0 0 0 3 3 3 3 3 1 , , 2 2 1 1 , , 2 2 1 3 , . 2 2 I p p I n n I p p I n n I p p I n n + + + + - - - - = = = = - = - = - (8.6) -částice se však mohou rozpadat pouze do určitých lineárních kombinací těchto stavů. Souvisí to se skutečností, že součinové stavy (8.6) patří do dvou různých reprezentací isospinové grupy. To je hned vidět z vlastních hodnot 3I : vlastní hodnoty 3 2 se objevují pouze jedenkrát, zatímco vlastní hodnoty 1 2 dvakrát. Příslušné stavy patří reprezentaci s isospinem 3 2 a reprezentaci s isospinem 1 2 . Můžeme (v analogii s (4.13)) zapsat rozklad součinové reprezentace na , = 2 3 2 4 (8.7) kde ,2 3 a 4 jsou dvou-, tří- a čtyřdimenzionální reprezentace isospinu 1 2, 1 a 3 2 . * Viz poznámku 12 o působení přímého součtu generátorů. 56 Protože reakce rozpadu jsou invariantní vzhledem k isospinovým rotacím, můžeme popsat rozpad dalších -částic pomocí známého rozpadu částice ++ . Operátor I- převede stav ++ na 3 3 3 1 , 3 , 3 , 2 2 2 2 I I++ + - - = (8.8) kde jsma využili (5.32). Působení operátoru na stav, popisující nukleon a pion po rozpadu ++ zapíšeme jako ( ) ( ) ( ) 0 2 .I p I p p I n p + + + + - - -= + = + (8.9) Z isospinové invariance vyplývá, že se + , který zí skámé isospinovou rotací z ++ , rozpadá na stav, který získáme isospinovou rotací p + ; porovnáním (8.8) a (8.9) vidíme, že je to stav ( )01 2 . 3 n p + = + (8.10) Odtud vychází pro poměr pravděpodobností nalezení rozpadových stavů ( ) ( )0 1 , 2 n p + + + = (8.11) plně v souladu s experimentální skutečností. Pro popis rozpadu 0 použijeme ještě jednou stejného postupu s působením operátoru I- : ( ) ( ) ( ) ( ) 0 0 0 0 0 0 3 1 3 1 , 2 , 2 , 2 2 2 2 2 , 2 , 1 1 2 2 2 . 3 3 I I I n n I p n p I n p n p + - - + - - - + - - = - = = + + = + (8.12) Opět jsme využili vztah (5.32). Porovnání prvního a posledního řádku v (8.12) dává pro výsledný stav vyjádření ( )01 2 . 3 n p - = + (8.13) Odtud vychází pro poměr pravděpodobností nalezení rozpadových stavů ( ) ( ) 0 0 0 2 . 1 n p - = (8.14) 57 Na těchto příkladech jsme krásně viděli, jak je poměr pravděpodobností 2:1 dvou možností rozpadu dán invariancí vzhledem k transformacím z Lieovy grupy. 9. Vodíkový atom V této části ukážeme grupově ­ teoretické odvození energiového spektra atomu vodíku. Hamiltonián vodíkového atomu má tvar 2 2 , 2 p e H r = - (9.1) kde první člen představuje kinetickou energii ( je redukovaná hmotnost soustavy proton ­ elektron) a druhý člen je coulombovský potenciál. Klasické (Hamiltonovy) pohybové rovnice, které plynou z (9.1) jsou 2 3 r p e r = - (9.2) a 1 .r p = (9.3) Obrázek 4 Konstrukce Rungeho - Lenzova vektoru K Pro vodíkový atom známe celou řadu integrálů pohybu, tj. veličin zachovávajících se v čase. Nejznámější jsou energie daná výrazem (9.1) a vektor momentu hybnosti 58 .L r p= × (9.4) Skutečně plyne z (9.2) a (9.3), že 2 3 0 , d H p p r r e dt r = + = (9.5) 0 . d L r p r p dt = × + × = (9.6) Poslední vztah platí, protože podle (9.3) jsou r a p a podle (9.2) r a p rovnoběžné. Ještě však existuje jeden zachovávající se vektor. Je to tzv. Rungeho ­ Lenzův vektor, definovaný jako 2 1 . r K L p e r = × + (9.7) Zachování K přirozeně opět plyne z pohybových rovnic (9.2) a (9.3), jenom výpočet je poněkud delší. Nejprve ukážeme, že ( ) ( ) 2 3 2 3 3 1 1 1 , d K r r L p r r dt e r r r p p r rL r r r = × + - = - × - + (9.8) kde v prvním řádku jsme využili (9.6) a v druhém řádku dosadili z (9.2) a (9.3). V dalším kroku dosadíme do (9.8) definici L z (9.4), takže ( ) ( ){ }2 3 1 . d K r p r r p p r r dt r = - × × + - (9.9) S pomocí vztahu ( ) ( ) ( )a b c c a b c b a× × = - (9.10) je snadné vidět, že pravá strana (9.9) je rovna nule a vektor K se zachovává. Rungeho ­ Lenzův vektor má ještě další zajímavé vlastnosti, které vyplývají bezprostředně z jeho definice a z elementárních vztahů vektorové analýzy, zejména platí 0K L = (9.11) a 59 ( ) ( ) 2 2 2 2 2 2 2 2 2 2 2 2 4 1 2 1 1 2 2 1 1 . K L p L p r e e r H L p L L e e r e = × + × + = - + = + (9.12) Pro eliptickou trajektorii klasické částice má Rungeho ­ Lenzův vektor K směr velké poloosy elipsy, jak je zobrazeno na Obrázku 4. Délka K je rovna výstřednosti elipsy. V kvantové mechanice jsou r a p operátory, které splňují Heisenbergovy komutační relace , , , , 0 .i j i j i j i jp r i r r p p = - = = (9.13) V souřadnicové reprezentaci popisujeme stavy pomocí vlnových funkcí souřadnic ir . Operátor souřadnice působí na vlnovou funkci triviálně, násobí ji příslušnou souřadnicí, zatímco operátor hybnosti působí jako .p i r = (9.14) Přirozeně také H, L a K jsou i operátory, i když se v definici K objevuje problém daný tím, že p a L nekomutují: , .i j i jk kL p i p = (9.15) Tento výsledek plyne bezprostředně z (9.4) a (9.13), využijeme-li distribučního vztahu pro komutátor [ ] [ ] [ ], , , .A BC A B C B A C= + (9.16) Vzhledem k (9.15) záleží tedy na pořadí, v jakém píšeme operátory L a p v definici (9.7) vektoru K .20 Pro kvantově mechanickou definici K zvolíme ( )2 1 . 2 r K L p p L e r = × - × + (9.17) Je přirozené, že pokud by L a p komutovaly, přejde tato definice na klasickou (9.7). Kromě jiného je operátor K ve tvaru (9.17) hermiteovský. 20 Můžeme se snadno přesvědčit, že tento problém nenastává u H ani L , definovaných pomocí vztahů (9.1) a (9.4). 60 V kvantové mechanice platí, že zachovávající se veličiny komutují s hamiltoniánem. Ukážeme to nejprve pro operátory L . Již jsme uvedli komutační relace pro L a p . Podobně pro L a r máme , .i j i jk kL r i r = (9.18) S pomocí (9.16) můžeme jednoduše odvodit [ ], 0iL H = (9.19) a , .i j i jk kL L i L = (9.20) Rovnice (9.19) udává, že iL se zachovává. Rovnice (9.20) pak říká, že složky operátoru momentu hybnosti mají tytéž komutační relace jako generátory grupy rotací v třírozměrném prostoru. Podobným způsobem spočteme komutátory, ve kterých vystupuje operátor K . Nejprve poznamenejme, že vzhledem k (9.14) bude 3 1 1 1 , . r p i r i r r r r r = - = (9.21) Pak lze odvodit komutační relace ,i j i jk kL K i K = (9.22) (to plyne už ze skutečnosti, že iK jsou složky vektoru), ( ) ( )2 2 2 3 , ,i j i j i j i j i j i i K p p p p r r r e r = - + - (9.23) ( )2 3 1 , . 2 i i jk j k k j i K L r r L r e r = + (9.24) S pomocí těchto vztahů dojdeme pak k závěru, že K komutuje s hamiltoniánem [ ], 0 .iK H = (9.25) Nakonec můžeme s pomocí Jacobiho identity [ ] [ ] [ ], , , , , , 0A B C B C A C A B + + = (9.26) 61 ukázat, že také ,i jK K komutuje s hamiltoniánem a je tedy zachovávající se veličinou. Přímý výpočet nám však ukáže, že nejde o novou veličinu, ale o součin dvou známých zachovávajících se veličin21 4 2 , .i j i jk k H K K i L e - = (9.27) Protože kL a H komutují, není důležité, v jakém pořadí jsou operátory zapsány. Spočetli jsme všechny potřebné komutátory. Teď se můžeme podívat, zda zůstávají i v kvantovém případě v platnosti vztahy (9.11) a (9.12). Pokud jde o první rovnici, máme ( ) ( ){ }2 1 . 2 L r K L L K L L p L p L e r = = × - × + (9.28) Vzhledem k 0L r = (což se snadno ukáže i v kvantovém případě), zůstávají ve hře pouze první dva členy. Závorku píšeme jako ( ) ( )2 ,i jk i j k j k i jk i j k j kl i lL L p p L L L p i L p - = - (9.29) kde jsme pomocí (9.15) zapsali ip napravo od iL . S pomocí (9.20) můžeme první člen psát jako 0i jk i jl l kL p L p = , z podobného důvodu vymizí i druhý člen, takže nakonec máme 0 .K L = (9.30) Vztah (9.12) už pro operátory neplatí, objeví se v něm člen navíc. Uvedeme jen výsledek, který potřebuje zdlouhavější výpočet. Kvantová analogie diskutovaného vztahu má tvar ( )2 2 2 4 2 1 . H K L e = + + (9.31) V limitě 0 přejde přirozeně (9.31) na (9.12). S pomocí získaných výsledků můžeme nyní najít energiové spektrum atomu vodíku. Hledáme vlnové funkce, které vyhovují rovnici ,H E = (9.32) přičemž předpokládáme, že energie E je záporná 0E < , abychom pojednávali o vázaných stavech. Protože operátory iL a iK komutují s hamiltoniánem, jsou také stavy iL a iK 21 Obecně je možno dokázet, že pro vodíkový atom máme pouze pět nezávislých integrálů pohybu. Mohly by to být například tři složky vektoru momentu hybnosti a dvě složky Roungeho ­ Lenzova vektoru, který je na L kolmý. 62 řešeními Schrödingerovy rovnice (9.32). Pokud jde o operátory H, L a K , můžeme se proto omezit na podprostor stavů se stejnou energií E. Vytvořme nyní následující dvě lineární kombinace operátorů L a K :22 4 1 . 2 2 e L L K E = - (9.33) Tyto operátory komutují s hamiltoniánem: , 0 .iL H = (9.34) S pomocí (9.20), (9.22) a (9.27) lze dokázat následující komutační relace , ,i j i jk kL L i L+ + + = (9.35) ,i j i jk kL L i L- - - = (9.36) a , 0 .i jL L+ - = (9.37) Vzhledem k těmto komutačním relacím je možno považovat L+ a L- za generátory dvou oddělených grup rotací, které vzájemně komutují a působí na stavy jako ( ) ( )/ exp exp ,i L i L + - = (9.38) kde parametry a popisují zmíněné dvě grupy generované L+ a L- .23 Protože splňuje Schrödingerovu rovnici (9.32), splňují ji také transformované stavy / téže energie E. Všechny tyto stavy mohou být charakterizovány jako reprezentace dvou rotačních grup (tuto součinovou grupu označujeme jako ( ) ( )2 2SU SU ). Stavy se tak mohou transformovat pomocí 2 1s+ + -rozměrné (ireducibilní) reprezentace první grupy. Když působíme jedním prvkem druhé grupy na tuto reprezentaci, pak najdme identickou reprezentaci první grupy, která může být eventuelně stejná jako původní reprezentace (tím myslíme, že sobě odpovídající stavy se liší pouze určitým faktorem). Toto poslední tvrzení plyne ze Schurova 22 Skutečnost, že předpokládáme záporné E zajišťuje kladnou hodnotu pod odmocninou. 23 Ještě jednou upozorňujeme, že grupy komutují. Proto nezáleží na pořadí, v jakém píšeme exponenciály ve vztahu (9.38). 63 lemmatu. Při působení druhé grupy zůstává reprezentace první grupy zcela zachována. Totéž platí přirozeně i naopak: při působení první grupy zůstává zachována reprezentace druhé grupy. Máme tedy co dělat s tensorovým součinem reprezentace první grupy s reprezentací druhé grupy. Zvolíme-li 2 1s+ + -rozměrnou reprezentaci první grupy a 2 1s- + -rozměrnou reprezentaci druhé grupy, dostaneme takto ( )( )2 1 2 1s s+ -+ + stavů, které budeme značit ,s s+ - a které splňují rovnice pro vlastní hodnoty ( ) ( ) ( ) ( ) 2 2 2 2 , 1 , , , 1 , , L s s s s s s L s s s s s s + + - + + + - - + - - - + - = + = + (9.39) kde 0,1 2,1,3 2,s = .... Generátory L musí však splňovat ještě podmínku, která plyne z (9.30): ( ) ( ) 0 ,L L L L L K+ - + - + - = (9.40) odkud ( ) ( ) 2 2 .L L+ - = (9.41) Z rovnice (9.41) plyne rovnost vlastních hodnot v (9.39), takže můžeme psát ( ) 1 1 , 2 s s n+ -= = - (9.42) kde 1,2,n = .... Máme tak 2 n stavů ,s s+ - . Nakonec vyjádříme hamiltonián, a tedy energii E, prostřednictvím operátorů L . Podle (9.31) a definice L můžeme psát ( ) ( ) 4 4 2 2 2 2 , 2 2 e e L L K L L E E + - + - - - = = + + + (9.43) odkud ( ) ( ){ } ( ) ( ) 4 2 2 2 21 2 2 1 1 1 . 2 2 e L L n n E + - - + = - - - + = + (9.44) Vázané stavy s energiemi nE jsou tedy 2 n -krát degenerované a energie je dána vztahem 4 2 2 . 2 n e E n = - (9.45) 64 Operátor momentu hybnosti je dán součtem operátorů L L+ - + . Tato lineární kombinace působí stejným způsobem na obě reprezentace, jejichž tensorovým součinem vznikly stavy ,s s+ - . Při prostorových rotacích generovaných operátotem L L+ - + se tedy transformují stavy ,s s+ - jako tensorový součin dvou reprezentací grupy rotací v trojrozměrném prostoru. Tato součinová reprezentace už není ireducibilní, ačkoliv každá reprezentace ze součinu ireducibilní je. Z vlastností součinové reprezentace můžeme určit, jakých hodnot může při daném n nabývat moment impulzu; plyne to z rozkladu součinu dvou ireducibilních n-rozměrných reprezentací grupy rotací na ireducibilní reprezentace , = - - 2 1 2 3 3 1n n n n (9.46) kde n je n-rozměrná ireducibilní reprezentace grupy rotací (definuje tak stav se spinem ( )1 2 1n- ). Rozklad (9.46) nebudeme dokazovat, příklad jsme viděli ve (4.13). Souhrnem můžeme říci, že vázané stavy atomu vodíku jsou určeny hlavním kvantovým číslem n, které nabývá hodnot 1,2,n = .... Pro dané n existuje 2 n stavů s momentem hybnosti 0,1, , 1l n= -... a energií danou (9.45). Některé původní práce: O. Klein: Z. für Physik 22 (1924), 109; W. Lenz: Z. für Physik 24 (1924), 197; W. Pauli: Z. für Physik 36 (1926), 336. 10. Grupa SU(3) Lieova grupa SU(3) hrála významnou roli při budování kvarkové teorie. Při studiu hadronů (částice se silnou jadernou interakcí) se ukázalo, že je možné je sdružovat do multipletů, podobně jako jsme to viděli u isospinových multipletů. Různé isospinové multiplety se ovšem sdružují do širších skupin. Z toho se dalo usoudit, že zde máme co dělat s invariancí vůči působení některé další z mnoha Lieových grup. Ukazuje se, že to může být grupa SU(3). Podívejme se, proč právě tato grupa. Hluboko uvnitř subatomových částic jsou uloženy základní kameny, zvané kvarky. Jsou tři druhy kvarků, označované u, d a s. Z nich u a d tvoří isospinový dublet. Jsou tedy reprezentací 1 2I = grupy SU(2). Třetí kvark s je isotopický singlet. Vlnovou funkci kvarků píšeme jako 65 , u d s = (10.1) a (při jistém přibližení) můžeme odvodit, že fyzikální vlastnosti částic jsou invariantní vzhledem k unitárním transformacím těchto 3-vektorů. Proto chápeme (10.1) také jako fundamentální reprezentaci grupy SU(3), kde 3 značí dimenzi vektorů, U ,,unitární" a S ,,speciální": uvažujeme matice s determinantem rovným 1. Tabulka 2 Různé isospinové multiplety a jejich hmotnosti. isospinový multiplet spin parita isospin S hmotnost (MeV) piony: 0 , 0 - 1 0 139.6, 135 kaony: 0 ,K K + 0 - 1 497.7, 493.7 antikaony: 0 ,K K- 0 - -1 493.7, 497.7 eta: 0 0 - 0 0 547.3 eta/ : / 0 - 0 0 900 nukleony: n, p 1/2 + 0 939.5, 938.3 delta: 0 , , ,- + ++ 3/2 + 3/2 0 1235 sigma: 0 , ,- + 1/2 + 1 -1 1197.4, 1192.6, 1189.4 sigma*: * *0 * , ,- + 3/2 + 1 -1 1385 lambda: 0 1/2 + 0 -1 1115.7 ksi: 0 ,- 1/2 + -2 1321.3, 1315 ksi*: * *0 ,- 1/2 + -2 1530 omega: - 3/2 + 0 -3 1672.4 Vezmeme-li pouze ty transformace, které působí na u a d, zatímco s zůstává invariantní, získáme podgrupu SU(2) grupy SU(3). U grupy SU(2) jsme viděli, že pokud začneme konstruovat další reprezentace s pomocí reprezentací s celočísleným l, dostaneme opět jen reprezentace charakterizované celočíselnou hodnotou. Jsou to všechno reprezentace, které zobrazují prvek 1 0 I 0 1 - - = - (10.2) na jednotkovou matici I+ . Podobně je tomu u grupy SU(3). Tato grupa obsahuje tři význačné prvky, které komutují se všemi ostatními prvky grupy (tuto podgrupu nazýváme centrum grupy) 66 2 2 I , exp I , exp I . 3 3 i i - (10.3) Budeme rozlišovat dva druhy reprezentací SU(3): regulární a exotické reprezentace. Regulární reprezentace jsou takové, které všechny tři prvky (10.3) centra grupy zobrazují na jednotku. Exotické reprezentace tuto vlastnost nemají. Fundamentální reprezentace sama je exotická. Reprezentace vytvořená na prostoru unitárních matic 3 3× (adjungovaná reprezentace) je regulární, neboť z její definice ( )/ 1 adU U X U X U X - = (10.4) je vidět, že pro všechny tři matice X z (10.3) je / U U= . Zapíšeme-li matici U jako ( )expU iT= , pak z unitarity U plyne, že T je hermiteovská matice, tj. T T + = a podmínka det 1U = vede k požadavku Tr 0T = . Obecné matice 3 3× mají 9 komplexních prvků, které jsou určeny 18 reálnými parametry. Hermiteovská matice T má už jen 9 reálných parametrů, po splnění požadavku na nulovou stopu zbývá jen 8 nezávislých. Adjungovaná reprezentace vytváří tedy osmirozměrný reálný prostor. Podobně jako v části 6 (viz (6.41)) zapíšeme tuto reprezentaci jako Y , nyní však mohou indexy , nabývat hodnot 1, 2 a 3. Když oba indexy , jsou 1 nebo 2, máme třírozměrnou 1I = reprezentaci 3 grupy SU(2). Pro 1,2 = a 3 = máme komplexní, fundamentální 2 reprezentaci grupy SU(2, kterou získáme také při 3 = a 1,2 = ; dále máme ještě reprezentaci 1. Protože 2 reprezentace je komplexní, píšeme ji dvakrát: ( ) ( ) ( )3 2 .SU SU = + + +8 3 2 2 1 (10.5) Další reprezentace SU(3) najdeme pomocí násobení vytváření symetrických a antisymetrických kombinací při násobení fundamentální reprezentace. Získáme tak ,,tensory" 1 2 1 2 Y ... ... , které upravujeme na ireducibilní kombinace, jednak symetrizací a antisymetrizací, jednak násobením invariantními tensory. Pokud užijeme všech fundamentálních indexů (viz později), máme k disposici tři tensory: , a . Poslední dva jsou invariantní, podobně jako byly a v SU(2), protože i pro transformace X z SU(3) platí, že det 1X = . Tyto - tensory můžeme použít k tomu, aby u každé reprezentace byly všechny indexy nahoře (nebo dole), podle toho, jak budeme potřebovat. 67 Reprezentace generované a nejsou ekvivalentní, na rozdíl od SU(2). Označíme tyto fundamentální reprezentace jako 3 a 3. Reprezentaci 3 můžeme také psát jako antisymetrický ,,tensor" Y . Symetrická reprezentace Y je 6 komplexní reprezentace. První neexotická reprezentace po 8 je reprezentace 10 , vytvořená z úplně symetrických tensorů Y . Tento dekaplet je tvořen z reprezentací SU(2) jako ( ) ( ) ( )3 2 .SU SU = + + +10 4 3 2 1 (10.6) Všechny neexotické reprezentace pohodlně poznáme podle toho, že počet horních indexů minus počet dolních indexů je násobkem 3. Obrázek 5 Mesonový oktet (spin 0, parita -) a baryonový oktet (spin 1/2 a parita +). V hadronové fyzice je zvykem charakterizovat částice kromě složky isospinu 3I dalším kvantovým číslem, podivností (strangeness) S. Obrazce vzniklé vynesením multipletů do roviny s kartézskými souřadnicemi 3I S- jsou na Obrázku 5 a Obrázku 6. Na obrázcích máme dva oktety a jeden dekaplet. Zapíšeme-li si mesonový oktet jako M , je podivnost S rovna počtu spodních indexů rovných 3 minus počet horních indexů rovných 3. Vidíme, že máme co do činění s vlnovými funkcemi typu , kde odpovídá kvarkům typu a antikvarkům typu . Hodnoty indexů 1 = a 2 = patří isodubletu u a d, hodnota 3 = s-kvarku, který má podivnost 1S = - . Existuje i devátý meson M = . Je to tzv. / meson, jehož hmotnost je dosti vyšší oproti střední hmotnosti mesonů v oktupletu. Jako 68 pozoruhodné se zdá, že reprezentace SU(3) realizované v přírodě hadrony jsou vždy regulární, exotické reprezentace se nevyskytují. Obrázek 6 Baryonový dekaplet (spin 3/2 a parita +). Všechny baryony lze popsat pomocí B . Oktet je dán jako , 0B B B = = (10.7) nebo také , 0 .B B B = - = (10.8) SU(3) symetrie je v přírodě narušena více než isospinivá, proto se střední hmotnosti různých isospinových multipletů v rámci multipletu SU(3) od sebe liší víc než hmotnosti částic uvnitř isospinových multipletů (Tabulka 2). Nicméně je tato symetrie velmi významná. M. Gell- Mann například zjistil, že dekaplet není úplný a předpověděl existenci později objevené - částice. Baryonový dekaplet a baryonový oktet můžeme vzájemně propojit. Uvažujme opět jako bázi ,,kvarkové stavy", ale vezměme v úvahu i spin. Každý kvark může mít 1zS = nebo 1zS =- . Chceme-li teď najít transformační vztahy pro šest kvarkových stavů, musíme uvažovat o působení grupy SU(6). Symetrická reprezentace ABC grupy SU(6) má 56 prvků. Indexy pro SU(6) jsou tvořeny dvojicí: index pro SU(3) a index pro SU(2): 69 ( ) ( ) ( )1 2 3, , , , , .A B C = = = (10.9) Předpokládejme, že všechny prvky jsou již symetrické v indexech , a , potom musíme provést symetrizaci i ve spinových indexech 1 , 2 a 3 . To znamená spin 3/2, přesně jako u dekapletu. Každá částice dekapletu má pak čtyři spinové stavy, tj. celkem 10 4 40 = stavů. Zbývá 56 40 16- = , přesně pro oktet, kde se spinem má každá částice dva spinové stavy. Symetrie vzhledem k SU(6) je ještě méně přesně zachovávána než vzhledem k SU(3), hmotnosti části dekapletu jsou vyšší než hmotnosti částit v oktupletu. Ještě jednu otázku musíme zodpovědět. Jak je možné, že kvarky se spinem jsou popsány symetrickou vlnovou funkcí; jako částice se spinem musí být fermiony a tedy podle Pauliho principu popsány úplně antisymetrickou vlnovou funkcí. Odpověď spočívá v existenci dalšího kvantového čísla, barvy (colour), které může nabývat tří různých hodnot. Barevná teorie vysvětluje síly působící mezi kvarky a také to, proč kvarkové kombinace obsazují pouze neexotické reprezentace SU(3). K popisu generátorů transformace X z SU(3) potřebujeme hermiteovské matice a , 1, ,8a= ... : 1 exp . 2 a aX i = (10.10) Tyto matice jsou zobecněním matic i z SU(2), jejichž vložení do a zvýrazníme tím, že místo některých nul budeme psát tečky: 1 2 3 4 5 6 7 8 0 1 . 0 . 1 0 . 1 0 . , 0 . , 0 1 . , . . . . . . . . . 0 . 1 0 . . . . . . . , . . . , . 0 1 , 1 . 0 . 0 . 1 0 . . . 1 0 0 1 . 0 , 0 1 0 . 3 . 0 0 0 2 i i i i i i - = = = - - = = = = - = - (10.11) Matice a jsou normovány tak, že platí ( )Tr 2a b ab = (10.12) 70 a splňují komutační relace 1 1 1 , . 2 2 2 a b abc ci f = (10.13) Soupis strukturních konstant je 123 147 246 257 345 516 637 458 678 1 , 1 , 2 3 , 2 f f f f f f f f f = = = = = = = = = (10.14) další spočteme záměnou vzhledem k úplné antisymetrii indexů, tj. .abc bca cab bac acb cbaf f f f f f= = = - = - = - (10.15) abcf a ab nejsou jedinými invariantními tensory 8 reprezentace. Spočteme-li si antikomutátory matic a , dostaneme 1 1 1 1 , . 2 2 3 2 a b ab abc cd = + (10.16) Antikomutátor je definován jako { },A B AB B A= + . Konstanty abcd jsou zcela symetrické: abc bca cab bac acb cbad d d d d d= = = = = (10.17) a jejich soupis je 118 228 338 888 146 157 256 344 355 247 366 377 448 558 668 778 1 , 3 1 , 2 1 , 2 1 . 2 3 d d d d d d d d d d d d d d d d = = = - = = = = = = = = = - = = = = - (10.18) Tensory ab , abcf a abcd jsou jedinými nezávislými invariantními tensory 8 reprezentace. 71 11. Reprezentace SU(N); Youngovy diagramy Už jsme se trochu zmínili o grupě SU(6). Větší Lieovy grupy se také objevují ve fyzikálních úvahách. Existují obecné metody pro konstrukci jejich reprezentací. Nejprve se dohodněme, že případné dolní indexy přeměníme na horní s pomocí invariantního tensoru 1 2 N ... . Fundamentální reprezentaci SU(N), která odpovídá N-rozměrnému ,,spinoru" zobrazíme pomocí čtvereečku. Součin dvou takových reprezentací bude zobrazen pomocí dvou čtverečků, jako na Obrázku 7a. Je-li reprezentace symetrická, jsou čtverečky vedle sebe, je-li antisymetrická, jsou čtverečky pod sebou. Na Obrázku 7b je vidět, jak se tvoří větší reprezentace. Každému čtverečku je přiřazen index. U složitějších reprezentací, jako na Obrázku 7c, je příslušný tensor symetrický vzhledem ke všem permutacím indexů v jednom řádku. Ve vertikálním směru je situace komplikovanější; plyneto z požadavku, že všechny vyznačené reprezentace jsou nezávislé. Vzniká tak následující předpis: (i) Všechny nezávislé ireducibilní reprezentace se odlišují Youngovými diagramy a každý Youngův diagram reprezentuje ireducibilní reprezentaci, pokud: (ii) Každá horizontální řada Youngova diagramu nemá více čtverečků než řada nad ní a každý sloupec nemá více čtverečků než sloupec vlevo od něj. (iii) V diagramu nemůže být více než 1N - řad, sloupec tedy nemůže obsahovat více jak 1N - čtverečků. Obrázek 7 Youngovy diagramy. 72 A. Přehled některých vlastností matic Mějme matici A dimenze n n× s prvky i ja : 11 12 1 21 22 2 1 2 . n n n n nn a a a a a a A a a a = ... ... ... (A.1) Maticové prvky i ja jsou (případně komplexní) čísla. Uvažujme ještě matici B téže dimenze n n× s prvky i jb . Definice: Součinem matic A a B nazveme matici C, jejíž maticové prvky jsou dány vztahem 1 . n i j ik k j k c a b = = (A.2) Píšeme .C AB= (A.3) Poznamenejme, že (A.2) definuje maticové elementy i jc pomocí i ja a i jb . Protože i ja a i jb jsou obyčejná čísla, nezáleží na pořadí, v jakém jsou zapsána. To ale neplatí pro násobení matic. Obecně / C AB C B A= = . Matice / C je dána prvky / 1 . n i j ik k j k c b a = = (A.4) Násobení matic je nekomutativní. Je však asociativní, tj. ( ) ( )A BC AB C= . Definice: Komutátorem dvou matic nazveme [ ], .A B AB B A - (A.5) Říkáme, že matice A a B komutují, jestliže je jejich komutátor roven nule. Definice: Součtem, popřípadě rozdílem dvou matic A a B nazveme matici C, jejíž maticové prvky jsou dány vztahem , ,i j i j i jc a b C A B= + = + (A.6) popřípadě , .i j i j i jc a b C A B= - = - (A.7) 73 Z (A.6) plyne A B B A+ = + . Definice: Součinem (komplexního) čísla a matice A je matice B, pro jejíž prvky platí , .i j i jb x a B x A= = (A.8) Z (A.2) a (A.8) plyne 2 2 2 2 1 1 , . n n ik k j ik k j k k b b x a a B x A = = = = Definice: Jednotková matice 1 je definována jako 1 0 0 0 1 0 0 0 1 = 1 (A.9) a platí A A A= =1 1 (A.10) pro všechny matice A. Každé čtvercové n n× matici je přiřazeno (komplexní) číslo, determinant matice. Determinant matice je (tzv. rozvoj podle i-tého řádku) ( ) ( ) 1 det 1 det , , n i k ik k A a A i k + = = - (A.11) kde ( ),A i k je matice, která vznikne z A vyškrtnutím i-tého řádku a k-tého sloupce. Determinant matice 0 0× je definován jako 1. Řadu vlastností determinantů není obtížné odvodit. Tak pro determinant součinu matic C AB= platí ( )det det det det .C AB A B= = (A.12) Pro C x A= je ( )det det det .n C x A x A= = (A.13) Definice: Za předpokladu det 0A existuje k matici A inversní matice 1 B A- = taková, že 1 1 ,A A A A- - = =1 (A.14) jejíž maticové prvky jsou (všimněme si ( )det ,A j i , nikoliv ( )det ,A i j ) 74 ( ) ( )1 det , . det i j i j A j i b A + - = (A.15) Determinant je možné vyjádřit pomocí úplně antisymetrických -symbolů, definovaných jako 1 2 0ni i i =... , pokud mají dva nebo více indexů 1 2, , , ni i i... stejnou hodnotu, 1 2 1ni i i =... , pokud jsou všechny hodnoty indexů různé a 1 2, , , ni i i... vzniklo sudou permutací z 1,2, ,n... a konečně 1 2 1ni i i = -... , pokud jsou všechny hodnoty indexů různé a 1 2, , , ni i i... vzniklo lichou permutací z 1,2, ,n... . Determinant je potom 1 2 1 2 1 1 2 2 det .n n n ni i i j j j i j i j i jA A A A =... ... ... (A.16) (Na pravé straně sčítáme přes indexy 1 2, , , nj j j... .) Pro transponované a inversní matice součinu matic platí ( ) ( ) 1 1 1 , . T T T AB B A AB B A - - - = = (A.17) První vztah plyne z (A.2), druhý z ( )( ) 1 1 1 AB AB AB B A - - - = = =1 1. B. Derivování matic Maticové prvky mohou být funkcemi více proměnných. Tyto funkce mohou být diferencovatelné. V takovém případě lze definovat derivaci matice. Definice: Derivací matice A je matice, jejímiž prvky jsou derivace odpovídajících prvků matice A. Takže matice / A ( ) ( )/ d A x A x d x (B.1) má maticové prvky ( ) ( )/ . i j i j da x a x d x = (B.2) Derivace matice obecně nekomutuje se samotnou maticí. Ohlédneme-li od toho, jsou ostatní pravidla diferenciálního počtu zachována, což plyne z definice v (B.1) a (B.2). Například ( )d A B d A d B d x d x d x + = + (B.3) a 75 ( ) . d AB d A d B B A d x d x d x = + (B.4) Poslední vztah plyne z Leibnitzova pravidla / / 1 1 1 . n n n ik k j ik k j ik k j k k k d a b a b a b d x = = = = + (B.5) Podobně / 1 / 2 2 / 1 / . n n n n nd A A A AA A A A A A A d x - - - - = + + + + (B.6) Pouze pokud by matice A a / A komutovaly, byla by derivace n-té mocniny rovna 1 /n n A A- . Derivaci inversní matice spočteme z ( )1 1 1 0 , d A Ad d A d A A A d x d x d x d x - - - = = = + 1 odkud 1 1 1 . d A d A A A d x d x - - - = - (B.7) C. Funkce matic Funkce definované pomocí sečítání a násobení mohou být definovány také pro matice. Zejména důležitá je funkce expx. Ukážeme dvě možné definice. Mějme matici A. Matice expA je definována jako řada 0 0 1 exp , . ! k k A A A k = = = 1 (C.1) Druhá definice je pomocí limity exp lim . m m A A m = + 1 (C.2) Důkaz, že (C.1) a (C.2) jsou ekvivalentní provedeme stejně jako pro obyčejnou exponenciální funkci, tedy vyjádřením binominálního rozvoje (C.2). Vztah (C.2) vede k zajímavému výsledku při výpočtu 76 ( )det exp limdet . m m A A m = + 1 (C.3) Determinant spočteme se zanedbáním členů řádu 2 1 m a menších. Vidíme to názorně na příkladu matice 2 2× , kde 11 12 11 22 12 21 21 22 1 , det 1 1 . 1 a a a a a aA Am m a am m m m m m m m + + = + = + + - + 1 1 Protože zanedbáváme členy řádu 2 1 m a menší, můžeme zanedbat mimodiaagonální prvky a v součinu diagonálních zůstane vždy jen jeden, ostatní nahradí jednička, tj. ( )11 22 2 1 1 det 1 . A a a O m m m + = + + + 1 Obecně pak 2 1 1 det 1 Tr , A A O m m m + = + + 1 (C.4) kde jsme užili pojmu stopa matice Tr A (trace, spur, odtud někdy značení SpA) 1 Tr . n k k k A a = (C.5) Dosazení (C.4) do (C.3) ( ) 2 1 1 det exp lim 1 Tr , m m A A O m m = + + odkud ( ) ( )det exp exp Tr .A A= (C.6) D. Campbellova ­ Bakerova ­ Haussdorfova formule CBH ­ formule se týká výpočtu matice C, pro kterou exp exp exp ,A B C= (D.1) 77 kde [ ]1 2 ,C A B A B= + + + opakované komutátory A a B. Mezi těmito komutátory nacházíme výrazy [ ] [ ] [ ], , , ,A B B A B B B A B AB B B A B B AB B B A = - = - - + , [ ], , ,B A B B , [ ], , ,A B B B a další. Není zdaleka jednoduché stanovit číselné faktory, které stojí u opakovaných komutátorů. Naším cílem bude najít C ve vztahu (D.1), alespoň do členů s násobnými komutátory, obsahujícími dvě B a jedno A nebo dvě A a jedno B. Nejprve zavedeme pomocnou proměnnou x tak, že píšeme ( ) ( ) ( )( )exp exp exp .x A x B C x= (D.2) I když je závislost na x členů na levé straně (D.2) jednoduchá, může obsahovat rozvoj ( )C x podle x velmi komplikované koeficienty závislé na A a B. Pokusíme se tedy najít C jako funkci x. Rozvineme proto levou i pravou stranu (D.2) do mocninných řad vzhledem k proměnné x. Předtím ale dokážeme některé pomocné vztahy. Uvažujme ( ) ( ) ( )exp exp ,H y y F G y F= - (D.3) kde y je proměnná a F a G jsou na y nezávislé matice. H může být vyjádřeno ve tvaru mocninné řady 2 3 0 1 2 3 . 2! 3! y y H H y H H H= + + + + (D.4) Faktory 2!, 3!, ...(tj. vlastně Taylorův rozvoj) zavádíme pro zjednodušení výrazů při počítání. Nyní máme spočítat nH . Derivováním (D.3) dostáváme ( ) ( ) ( ) ( ) ( )exp exp exp exp . d H y d y F d y F G yF y F G d y d y d y - = + - (D.5) S pomocí vztahu ( ) ( ) ( ) exp exp exp d y F F y F y F F d y = = (D.6) upravíme (D.5) na ( ) ( ) ( ) ( ) ( ) [ ]exp exp exp exp , . d H y F y F G yF y F G y F F H F d y = - - + - = (D.7) S využitím vyjádření pomocí mocninné řady (D.4) máme tedy 78 [ ] [ ] [ ] 2 2 1 2 3 0 1 2, , , . 2! 2! y y H y H H H F y H F H F+ + + = + + + (D.8) Spolu s 0H G= dává porovnání členů u stejné mocniny y v (D.8) rekurentní vztah [ ]1 , , , , .n nH H F G F F F F- = = ... ... (D.9) Dosazeno do (D.4) dostáváme pro 1y = ( ) ( ) [ ] [ ] [ ] 1 exp exp , , , 2! 1 , , , . 3! F G F G G F G F F G F F F - = + + + + ... (D.10) Zavedeme zkrácené značení { }, ,n nH G F= (D.11) nebo ještě kompaktnější zápis ( ) ( ) ( ){ }exp exp ,exp ,F G F G F- = (D.12) kde předpokládáme, že ( )exp F je vyjádřeno mocninnou řadou. Uvažujme nyní případ, kdy F bude funkcí proměnné x. Spočtěme výraz ( )( ) ( )( )exp exp . d y F x y F x d x - (D.13) Stejným postupem, jako jsme užili výše, dostaneme ( )( ) ( )( ) ( ) / / / / 1 1 exp exp , , , 2! 3! exp 1 , . d F x F x F F F F F F d x F F F - = + + + = - ... (D.14) Výraz (D.14) získáme tak, že položíme G d d x= ve výrazu (D.10). Pro komutátor platí [ ], . d d G F F F d x d x = - (D.15) Počítáme tak, že d d x působí doprava a že přirozeně za komutátorem mohou být další výrazy. Podle pravidla o derivování součinu máme / , d d F d d F F F F d x d x d x d x = + = + (D.16) 79 takže pro komutátor máme [ ] / , .G F F= (D.17) Z (D.14) máme ( ) ( ) ( )/ exp 1 exp exp , . Fd F F F d x F - = (D.18) Vraťme se zpět k (D.2). Derivováním podle x dostaneme s přihlédnutím k (D.7): ( ) ( ) ( ) ( ) ( )( ) ( )/ exp 1 exp exp exp exp exp , C x A A x B x A B x B C x C C - + = (D.19) neboli ( ) ( ) ( ) ( ) ( ) ( )( ) ( )( ) ( )/ exp exp exp exp exp exp exp 1 exp , . x A x B x B A x B x B B x B C C x C C - + - = - (D.20) Členy před závorkami na obou stranách (D.20) se podle (D.2) vykrátí. Protože ( ) ( )exp expB x B x B B= , je druhý člen v závorce na levé straně roven B. První člen upravíme podle (D.12). Dostáváme tak konečně ( ) ( ){ }/ exp 1 , ,exp . C C A x B B C - = + (D.21) Z této rovnice můžeme získat C ve tvaru mocninné řady. Sílu našeho abstraktního zápisu uvidíme, označíme-li pravou stranu jako H a píšeme ( ) [ ] [ ] 2 / , ,1 exp 1 2 12 1 1 , , , , 2 12 C C C C H H C H H C H C C = = - + + = - - + + ... (D.22) kde jsme využili mocninného rozvoje ( )( ) ( )2 exp 1 1 1 2 6C C C C- = + + + .* Píšeme teď * Vztah ( ){ } ( ){ }1 , ,X f Y Z X Z f Y- = = můžeme dokázat tehdy, existuje-li k mocninné řadě ( )f Y mocninná řada inversní, tedy vztah neplatí např. pro ( )f Y Y= . 80 [ ] [ ] 2 3 0 1 2 3 2 / 1 2 3 2 2 0 1 2 , 2! 3! , 2! , , , , 2! 2! x x C C xC C C x C C xC C x x H H x H H A B x A B A B B = + + + + = + + + = + + + = + + + + (D.23) a porovnáme po dosazení (D.23) do (D.22) členy u stejných mocnin x. Nejprve však musíme uvážit podmínku ( )0 0 0 .C C x= = = (D.24) Na x nezávislé členy dávají kombinaci 1 0 ,C H A B= = + (D.25) a koeficient lineárního výrazu v x dává [ ] [ ]2 1 0 1 1 , , . 2 C H H C A B= - = (D.26) Podobně nacházíme další koeficienty nC : [ ] [ ] [ ] [ ] [ ] [ ] [ ] 3 2 0 2 1 1 3 1 1 1 1 , , , 2 2 4 2 1 , , , , , , 2 1 1 , , , , , 2 2 C H H C H C C A B B A B A B A B A B A A B A B B = - - = - + - + = + (D.27) (s využitím záměny [ ] [ ], , , ,A B A A A B - = a záměny [ ] [ ], , , ,B A B A B B - = ). Postupně tak nalezneme další koeficienty iC , které obsahují násobné komutátory, ve kterých vystupují předcházející jC , j i< . Protože jC jsou samy násobnými komutátory, platí totéž i pro iC . Dosazením (D.24), (D.25), (D.26) a (D.27) do (D.23) dostáváme pro 1x= ( ) ( ) ( ) [ ] [ ] [ ] exp exp exp 1 1 1 , , , , , . 2 12 12 A B C C A B A B A A B A B B = = + + + + + (D.28) Je krásnou výzvou obdržet pomocí zde uvedené metody další komutátory v rozvoji C. 81 E. Skalární součin, unitární a hermiteovské matice Mějme n-rozměrný vektorový prostor s ortonormální bází 1 , , ne e... . Připomeňme vlastnosti skalárního součinu: 1* symetrie ( ) ( ) * , , = (E.1) 2* první vlastnost linearity ( x ) ( ) ( ), ,x x = (E.2) 3* druhá vlastnost linearity ( ) ( ) ( ), , , + = + (E.3) 4* pozitivní definitnost ( ) ( ), 0 , , 0 0 = = (E.4) Díky symetrii skalárního součinu lze vlastnosti linearity psát také jako ( ) ( )* , ,x x = a ( ) ( ) ( ), , , + = + . Uvažujme dva vektory a , zapsané jako lineární kombinace vektorů báze: 1 1 2 2 1 1 2 2 , , n n n n e e e e e e = + + + = + + + Protože báze je ortonormální, tj. platí ( ), ,i j i je e = (E.5) platí pro skalární součin vektorů a ( ) * * * 1 1 2 2, n n = + + + (E.6) Mějme nyní matici A. Tato matice definuje zobrazení jednoho vektoru prostoru na jiný / ,A = (E.7) ve složkách je (E.7) zapsáno jako / 1 . n i ik k k a = = (E.8) 82 Jakým podmínkám musí vyhovovat matice A, aby zůstal skalární součin invariantní, tj. aby platilo ( ) ( )/ / , , = pro libovolné vektory a ? Rozepsáno ve složkách máme ( ) ( ) */ / /* / * * , .k k k l l k m m l k l k m m k k l m k lm a a a a = = = (E.9) Pro prvky transponované matice T A platí ,T ik k ia a= (E.10) a pro prvky hermiteovsky sdružené matice A+ (transponovaná a komplexně sdružená) * .ik k ia a+ = (E.11) Matice B A A+ = má prvky * ,lm lk k m k l k m k k b a a a a+ = = takže ( )/ / * , .l l m m k lm b = (E.12) Zaveď nyní vektor // // // , .l lm m m B b = = (E.13) Potom můžeme (E.12) zapsat jako skalární součin ( )// , a z požadavku invariance skalárního součinu ( ) ( ) ( )/ / // // , , , . = = = (E.14) Má-li tento vztah platit pro libovolné vektory a , musí být nutně B=1, tj. 1 .A A A A+ + - = =1 (E.15) Matice A s vlastností (E.15) se nazývá unitární. Máme-li lineární prostor nad reálnými čísly, je * A A= a tedy 1T A A A+ - = = . Stručný zápis a porovnání (E.9) a (E.12) dává ( ) ( ), , ,A A A A + = (E.16) takže můžeme pro libovolnou matici A zapsat jako vlastnost skalárního součinu ( ) ( ), , .A A + = (E.17) Vlastní vektor matice A je vektor, pro který platí 83 , ,ik k k A a = = (E.18) je vlastní hodnota matice A příslušná vektoru . Za jakých podmínek jsou vlastní hodnoty matice reálné? Vezměme skalární součin ( ) ( ), ,A = . Je-li vektor nenulový, je ( ), reálné kladné číslo. Má-li být reálné, musí být ( ), A reálné. To znamená ( ) ( ) ( ) ( )* , , , , .A A A A + = = = (E.19) Z (E.19) plyne, že musí být A A+ = , tedy matice A musí být hermiteovská. Platí tak * .A A + = = (E.20)