Matematika ve studiu molekul Skripta k přednášce C5005 Přírodovědecké fakulty Masarykovy univerzity Lukáš Žíáek 5. března 2025 ii Obsah 1 Počty 1 1.1 Stavy monosacharidů aneb sladké mámení.......................... 1 1.2 Kombinatorika aneb co mají koně společného s molekulami ................ 2 1.3 Permutace aneb čtyři ze čtyř do čtyřspřeží.......................... 2 1.4 Permutace s opakováním aneb různé barvy do čtyřspřeží.................. 5 1.5 Variace aneb čtyři z šesti do čtyřspřeží............................ 5 1.6 Variace s opakováním aneb čtyři z šesti barev do čtyřspřeží................ 6 1.7 Kombinace aned čtyři z šesti do výběhu........................... 7 1.8 Mikrostavy, makrostavy aneb statistika molekul....................... 8 2 Energie 13 2.1 Energie a počty mikrostavů.................................. 13 2.2 Logaritmy a počítání s velkými čísly............................. 14 2.3 Číslo e aneb banka snů............... ...................... 16 2.4 Malé číslo v exponentu..................................... 17 2.5 Logaritmus fž aneb zkrocení faktoriálů............................ 19 2.6 Variační počet.......................................... 21 2.7 Lagrangeova metoda....................................... 22 3 Práce 27 3.1 Vnitřní energie aneb virtuální realita v chemii........................ 27 3.2 Práce a teplo.......................................... 28 3.3 Tepelné stroje.......................................... 29 3.4 Vratné děje a malé změny................................... 30 3.5 Práce jako integrál....................................... 31 3.6 Derivace jako směrnice tečny ke grafu ............................ 34 3.7 Derivace polynomiálních funkcí................................ 36 3.8 Expanze do vakua ....................................... 37 3.9 Expanze proti konstantnímu tlaku.............................. 39 3.10 Expanze proti lineárně klesajícímu tlaku........................... 40 3.11 Expanze proti parabolicky se měnícímu tlaku........................ 40 3.12 Určité a neurčité integrály................................... 42 4 Entropie 45 4.1 Tlak plynu ........................................... 45 4.2 Rychlost molekul a teplota .................................. 46 4.3 Termodynamická teplota.................................... 47 4.4 Entropie aneb co se nemění.................................. 51 iii iv OBSAH 4.5 Práce vykonaná při isotermální expanzi ideálního plynu.................. 51 4.6 Derivace logaritmické funkce ................................. 52 4.7 Práce vykonaná při adiabatické expanzi ideálního plynu.................. 54 4.8 Derivace součinu........................................ 55 4.9 Derivace exponenciální funkce................................. 56 4.10 Derivace složené funkce .................................... 56 4.11 Derivace obecné mocniny ................................... 57 4.12 Exaktní diferenciál....................................... 58 5 Rovnováhy 61 5.1 Mikrokanonické a kanonické soubory............................. 61 5.2 Boltzmannova konstanta.................................... 62 5.3 Boltzmannův zákon jako vztah energií a teploty....................... 65 5.4 Entropie a statistika...................................... 66 5.5 Samovolné děje......................................... 68 5.6 Volná energie.......................................... 70 6 Rychlosti 71 6.1 Kinetická energie ideálního plynu............................... 71 6.2 Gaussův integrál........................................ 73 6.3 Integrování per partes..................................... 78 6.4 Počítání průměru........................................ 79 6.5 Distribuční funkce ....................................... 80 6.6 Rozdělení rychlostí....................................... 81 7 Rotace 87 7.1 Rotace bodu v rovině ..................................... 87 7.2 Počítání s vektory ....................................... 89 7.3 Součtové vzorce......................................... 91 7.4 Lineární algebra ........................................ 92 7.5 Matice a komplexní čísla.................................... 96 7.6 Goniometrické funkce a jejich derivace............................ 98 7.7 Exponenciální tvar komplexního čísla............................. 99 7.8 Rotace v 3D........................................... 101 7.9 Rotace jako děj......................................... 103 7.10 Vektorový součin........................................ 104 8 Difúze 107 8.1 Pohyb z místa na místo.................................... 107 8.2 Pohyb v přítomnosti vnější síly................................ 107 8.3 Translační difúze........................................ 108 8.4 Gradient............................................. 111 8.5 Derivace vektorových polí................................... 112 8.6 Divergence ........................................... 112 8.7 Rotace.............................................. 114 8.8 Tok vektorového pole...................................... 117 8.9 Gaussova věta.......................................... 119 8.10 Difúze v kapiláře........................................ 122 8.11 Stokesova věta ......................................... 125 OBSAH v 9 Koule 129 9.1 Gradient ve sférických souřadnicích.............................. 129 9.2 Divergence ve sférických souřadnicích............................. 132 9.3 Laplaceův operátor ve sférických souřadnicích........................ 134 9.4 Sféricky symetrická translační difúze............................. 135 9.5 Separace časové a prostorové proměnné ........................... 135 9.6 Rotační difúze ......................................... 137 9.7 Separace úhlových proměnných................................ 138 9.8 Frobeniova metoda....................................... 139 9.9 Legendrova diferenciální rovnice............. ................... 140 9.10 Sférické harmonické funkce .................................. 142 9.11 Korelační funkce........................................ 145 10 Náboje 147 10.1 Elektrické pole......................................... 147 10.2 Elektrický potenciál ...................................... 148 10.3 Coulombův zákon........................................ 149 10.4 Energie náboje a elektrického dipólu v jedné molekule................... 150 10.5 Energie dvou elektrických dipólů v jedné molekule..................... 151 10.6 Energie náboje a indukovaného elektrického dipólu..................... 155 10.7 Energie permamentního a indukovaného elektrického dipólu................ 155 10.8 Průměrování závislostí na orientaci.............................. 156 10.9 Energie náboje a dipólu v různých molekulách ....................... 157 lO.lOTaylorův rozvoj......................................... 159 10.11 Energie dvou elektrických dipólů v různých molekulách................... 162 10.12Debyeova-Húckelova teorie .................................. 164 11 Vibrace 169 11.1 Harmonický oscilátor...................................... 169 11.2 Lagrangián ........................................... 172 11.3 Pohyby molekul......................................... 174 11.4 Translační pohyby....................................... 176 11.5 Vibrační pohyby........................................ 177 11.6 Rotační pohyby......................................... 179 11.7 Gaussova eliminační metoda.................................. 179 11.8 Homogenní soustavy lineárních rovnic.......... .................. 181 11.9 Determinanty.......................................... 184 11.10Vlastní hodnoty frekvencí................................... 185 11.11 Amplitudy............................................ 186 11.12Normální vlastní vektory.................................... 187 12 Vlny 189 12.1 Elektromagnetické vlny .................................... 189 12.2 Superpozice........................................... 192 12.3 Fourierovy řady......................................... 195 12.4 Fourierova transformace.................................... 196 12.5 Konvoluce............................................ 198 12.6 Záření černého tělesa...................................... 199 12.7 Planckův zákon......................................... 201 12.8 Stefanův-Boltzmannův zákon................................. 202 vi OBSAH 13 Elektrony 205 13.1 Energie dvou indukovaných elektrických dipólů....................... 205 13.2 Rozptyl elektromagnetických vln na molekulách....................... 208 13.3 Difrakce na krystalech..................................... 210 13.4 Pattersonova funkce ...................................... 212 13.5 Tlumený signál nukleární magnetické rezonance....................... 213 13.6 Vlnová funkce volného elektronu............................... 216 13.7 Operátory jejich vlastní funkce a hodnoty.......................... 217 13.8 Schrôdingerova rovnice pro volný elektron.......................... 217 13.9 Superpozice a neurčitost.................................... 218 13.10Schrôdingerova rovnice pro atom vodíku........................... 219 13.11 Radiální část vlnové funkce.................................. 220 13.12Normalizace radiální části vlnové funkce........................... 223 Kapitola 1 Počty Die ganzen Zahlen hat der liebe Gott gemacht, alles andere ist Menschenwerk. Leopold Kronecker Matematika: Kombinatorika (permutace, variace, kombinace), faktoriály 1.1 Stavy monosacharidů aneb sladké mámení První oblastí chemie, na kterou se podíváme z pohledu matematiky, budou termodynamické rovnováhy. Jde o téma velmi základní, ale pro mnohého adepta chemie nepříliš průhledné. Přitom k pochopení rovnováh stavů molekul vede odvětví matematiky, které se může nejlépe opřít o každodenní zkušenost: počítání s přirozenými čísly. Taje chemických rovnováh si ukážeme na sladkém příkladu jednoduchých cukrů. Z látky zvané hroznový cukr, neboli fruktóza,1 se vyrábějí sladké bonbónky, které mlsáme pro zahnání únavy. Prášek, ze kterého se bonbónky lisují, je tvořen krystalky molekul, ve kterých je šest atomů uhlíku, šest atomů kyslíku a dvanáct atomů vodíku uspořádáno vždy stejným způsobem. Když ale tento prášek rozpustíme ve vodě, například tím, že si strčíme bonbónek do pusy, začnou se dít podivuhodné věci. Molekula, ve které čtyři uhlíky a jeden kyslík tvořily v krystalu uzavřený řetězec, se otevře a hned nato zase uzavře jedním ze čtyř možných způsobů ukázaných na obrázku 1.1. To se opakuje stále dokola, takže za malou chvilku se vytvoří směs pěti různých molekul, které se nacházejí v chemické rovnováze: stále vznikají a zanikají, ale celkový počet molekul fruktózy v jednotlivých stavech se nemění. Tak se nám rozplývá nejen hroznový cukr v puse, ale i jasná představa o tom, co je to chemická látka. Je rozpuštěný hroznový cukr stejná látka jako práškový? Nebo je rozpouštění hroznového cukru chemická reakce, při které vznikají další čtyři chemické látky? Abychom se vyhnuli těmto napůl filosofickým a napůl puntičkárskym úvahám,2 budeme pěti různým molekulám hroznového cukru v roztoku říkat isomerní stavy. Dva isomerní stavy se vyskytují poměrně málo (každý tvoří asi jedno procento všech molekul fruktózy). Protože je těchto molekul v roztoku tak málo, pro jednoduchost je v dalším povídání zanedbáme. Zbývající tři isomerní stavy tvoří za pokojové teploty asi 70 %, 23 % a 5 % všech molekul. Nás bude zajímat, proč jsou tyto tři isomerní stavy zastoupeny právě v těchto poměrech. Ukážeme si, jak by -'-Organický chemik by nám řekl, že se musíme vyjádřit přesněji. Hroznovému cukru se říká D-fruktosa, protože existuje také látka, které chemici říkají L-fruktosa. Za malou chviličku uvidíme, že všechno je ještě složitější a že molekuly musíme popisovat ještě přesněji. V našem povídání budeme přesnou řeč chemiků odlišovat od běžné mluvy způsobem, jak budeme psát koncovku. V přesných chemických názvech budeme psát -osa, ve vyjádření lidovém -óza. 2 Chemicky opravdu vznikají při rozpouštění krystalického hroznového cukru různé chemické látky, které se liší svými vlastnostmi (například jsou různě sladké), ale ve vodě je obtížné je oddělit. 1 2 KAPITOLA 1. POČTY byly jednotlivé isomerní stavy zastoupeny, kdyby měly stejnou energii. V tom případě by počty molekul v různých isomerních stavech vyplývaly jen a jen z možných počtů uspořádání čehokoli, co se může vyskytovat v různých variantách. Takové počty uspořádání popisuje odvětví matematiky, kterému se říká kombinatorika a které je zcela založeno na používání zdravého selského rozumu. Potom se budeme zabývat mnohem složitějším případem, kdy různé isomerní stavy mají různou energii. V tomto případě budeme kromě matematiky muset použít i fyziku, konkrétně její část zvanou termodynamika. Pro srovnání se v našem povídání trochu podíváme i na další, velmi podobný cukr. Je to glukóza, cukr, který je jako zdroj energie rozpuštěn v krvi a který se v lékárnách prodává jako sladidlo pro případ, že nás skolí střevní problémy. Glukóza se ve vodě vyskytuje jen ve dvou různých isomerních stavech v poměru přibližně 63:37 (obrázek 1.2). 1.2 Kombinatorika aneb co mají koně společného s molekulami Kombinatorika je jedno z nejzákladnějších odvětví matematiky, kde potřebujeme o málo víc, než zdravý selský rozum. Kombinatorika nám řekne, kolik existuje různých možností uspořádání daného počtu molekul, což je první krok k pochopení chemických rovnováh. Protože jsou molekuly malé a špatně se představují, zkusme nejdříve spočítat možnosti uspořádání něčeho většího a snadno představitelného, koní. Koně mají s molekulami jednu společnou vlastnost, jejich počty vyjadřujeme pomocí celých čísel. Pardubičtí odpustí, ale půl koně nebo půl molekuly nedává v praxi mnoho smyslu. Kombinatorika nám nabízí vzoreček pro výpočet možných rozdělení molekul do různých stavů. Tento vzoreček je ale na první pohled složitý. Kdybychom si jej zde uvedli, nebylo by asi jasné, z čeho vyplývá. Proto zde budeme nejdříve řešit dva jednodušší úkoly, které nám poskytnou jednodušší vzorečky, ze kterých ten složitější nakonec poskládáme. 1.3 Permutace aneb čtyři ze čtyř do čtyřspřeží Představte si, že máme čtyři koně, kteří se jmenují Alex, Blesk, Cecilka a Démon. Naším prvním úkolem je zjistit, kolik různých čtyřspřeží z nich můžeme postavit. Počítejte se mnou. Když vybírám prvního koně do čtyřspřeží, mám čtyři možnosti. Při volbě druhého koně mám už jen tři možnosti výběru. Existuje proto 4-3=12 možností jak vybrat první pár čtyřspřeží. Při volbě třetího mi zbývají již jen dva koně na výběr (4 • 3 • 2 = 24 možností), a na poslední místo musím zapřáhnout toho, který mi zbyl (4 • 3 • 2 • 1 = 24 možností). Celkový počet možností sestavit čtyřspřeží ze čtyř koní je tedy dán součinem 4-3-2-l = 24. (1.1) V tomto součinu násobíme všechna celá čísla od jedné do čtyř. Takovému součinu se v matematice říká faktoriál a zkráceně se zapisuje jako nejvyšší číslo s vykřičníkem. 4-3 • 2 • 1 =4! = 24. (1.2) Počet možností vytvořit čtyřspřeží ze čtyř koní se v kombinatorice nazývá počet permutací čtyř prvků a značí se P(4). Jak jsme zjistili, počet permutací se rovná faktoriálu počtu prvků P(N) = N\, (1.3) kde N je počet prvků. Příkladem otázky, jejíž odpovědí je permutace, může být následující problém. Izolovali jste peptid a provedli aminokyselinovou analýzu. Výsledek ukázal, že peptid obsahuje 1 leucin, 1 arginin, 1 glycin, 1 alanin, 1 histidin a 1 valin. Víte tedy, že jde o hexapeptid, peptid vzniklý spojením šesti aminokyselin. Aminokyselinová analýza vám ale neřekne, v jakém pořadí jsou spojeny. Kolika různým chemickým 1.3. PERMUTACE ANEB ČTYŘI ZE ČTYŘ DO ČTYŘSPŘEŽÍ 3 /3-D-fruktofuranosa, stav 1 a-D-fruktofuranosa, stav 2 fruktosa s otevřeným řetězcem, chemicky (3S',4i?,5i?)-l,3,4,5,6-pentahydroxyhexan-2-one /3-D-fruktopyranosa, stav 0 a-D-fraktopyranosa Obrázek 1.1: Pět různých stavů hroznového cukru (D-fruktózy). Krystalky hroznového cukru jsou tvořeny /3-D-fruktofuranosou (vlevo nahoře), která se ale ihned po rozpuštění začne otvírat a znovu uzavírat čtyřmi různými způsoby. Vznikne směs pěti zobrazených molekul, které se liší způsobem uzavření (nebo neuzavření) řetězců. Molekuly označené jako furanosa (nahoře) vytvářejí uzavřené řetězce skládající se ze čtyř uhlíků a jednoho kyslíku. Molekuly označené jako furanosa (dole) vytvářejí uzavřené řetězce obsahující pět uhlíků a jeden kyslík. V obou případech je možné uzavřít řetězec dvěma způsoby, tak aby skupina CH2OH s uhlíkem číslo jedna, která je v našem zobreazení v pravé horní části molekuly, mířila k nám (tento způsob se označuje a), nebo od nás (tento způsob se označuje 0). Po dostatečně dlouhé době se vytvoří rovnováha, ve které je asi 70 % /3-D-fruktopyranosy (vlevo dole), 23 % /3-D-fruktofuranosy, 5 % a-D-fruktofuranosy (vpravo nahoře) a nepatrné množství otevřené formy (uprostřed) a a-D-fruktopyranosy (vpravo dole). 4 KAPITOLA 1. POČTY j3- D- glukofur anosa a- D- glukofur anos a glukosa s otevřeným řetězcem, chemicky (2i?,3S',4i?,5i?)-2,3,4,5,6-pentahydroxyhexanal /3-D-glukopyranosa, stav 0 a-D-glukopyranosa, stav 1 Obrázek 1.2: Pět různých stavů krevního cukru (D-glukózy). Podobně jako D-fruktóza se může řetězec D-glukózy tvořit pyranosy i furanosy uzavřené způsobem a i fi. Uzavření a a /? se liší tím, jestli OH skupina s kyslíkem číslo jedna (pocházející z aldehydové skupiny otevřené formy, na našem obrázku v pravé horní části molekuly) míří v našem znázornění směrem od nás nebo k nám. Furanos a otevřené formy je ale v roztoku D-glukózy pouze nepatrné množství, zatímco /?-D-glukopyranosa tvoří 63 % molekul a a-D-glukopyranosa tvoří 37 % molekul. Také v krystalech se D-glukóza nachází ve formě pyranos. 1.4. PERMUTACE S OPAKOVÁNÍM ANEB RŮZNÉ BARVY DO ČTYŘSPŘEŽÍ 5 látkám, tedy kolika hexeapeptidům s různým pořadím nalezených šesti aminokyselin, může výsledek aminokyselinové analýzy odpovídat? První aminokyselinou může být jakákoli z šesti určených, druhou jakákoli z pěti zbývajících a tak dále. Jde tedy o permutaci ze šesti, neboli 6! = 6- 5- 4- 3- 2- l = 720. Vidíme, že izolovaná látka může být jeden ze 720 možných peptidů. 1.4 Permutace s opakováním aneb různé barvy do čtyřspřeží Představte si teď, že máme velké stáje s koňmi čtyř barev: bělouše, hnědáky, ryzáky a vraníky. Naším úkolem je teď zjistit, kolik různých čtyřspřeží dokážeme sestavit z koní určených barev. Pokud například má být v čtyřspřeží tři bělouši a jeden vraník, bude možností méně, než v předchozím úkolu. Je to proto, že tentokrát nám nezáleží na tom, který z běloušů je na jakém místě. Počítáme počet permutací, z nichž se jedna třikrát opakuje. Kolikrát méně bude takových permutací s opakováním? Tolikrát, kolik různých trojic tři bělouši mohou vytvořit, když dbáme na to, který z běloušů je jiný. Toto číslo je permutace tří. Abychom spočítali, počet permutací, z nichž se jedna třikrát opakuje, musíme tedy celkový počet permutací, který jsme spočítali v předchozím úkolu, podělit permutací tří. 4' -r=4. (1.4) 3! 1 ' Kdybychom například chtěli v čtyřspřeží dva bělouše a dva ryzáky, spočítáme počet takových možností tak, že celkový počet permutací dvakrát podělíme permutací dvou (poprvé za vraníky a podruhé za ryzáky). 4' 6. (1.5) 2! -2! Obecně spočítáme počet permutací z počtu N s a opakováními jednoho prvku, b opakováními druhého prvku a tak dále tak, že celkový počet permutací vydělíme součinem permutací všech opakování: P^-{N) = P(a) ■ P(b) = ' (L6) Jako příklad permutace s opakováním si opět můžeme představit úvahu nad výsledkem aminokyselinové analýzy neznámého peptidu, která tentokrát poskytla výsledek 2 glyciny a 4 alaniny. Podle našeho vzorečku je možných peptidů 6! 2T4! = 15- (L7) 1.5 Variace aneb čtyři z šesti do čtyřspřeží Představte si teď, že máme šest koní, kteří se jmenují Alex, Blesk, Cecilka, Démon, Elvíra a Ferda. Naším prvním úkolem je zjistit, kolik různých čtyřspřeží dokážeme z našich koníčků sestavit. Když zapřahám prvního koně do čtyřspřeží, vybírám ze šesti. Při volbě druhého koně mám už jen pět možností. Existuje proto 6 • 5 = 30 možností jak vybrat první pár čtyřspřeží. Při volbě třetího mi zbývají již jen čtyři koně na výběr (6 • 5 • 4 = 120 možností), a při volbě posledního vybírám už jen ze tří. Celkový počet možností sestavit čtyřspřeží ze šesti koní je tedy dán součinem 6 • 5 • 4 • 3 = 360. Tento součin si můžeme také zapsat (1.8) 6 KAPITOLA 1. POČTY 6-5.4.3=^4^ = 360. (1.9) K čemu je takový, ne první pohled zbytečně složitý, zápis našeho součinu dobrý? V čitateli i ve jmenovateli se vyskytují faktoriály, na které jsme narazili u permutací. Zkráceně můžeme proto náš součin zapsat 6.5.4.3=l±±±±i = |=360. (1.10) Ještě užitečnější, než možnost zkrácení zápisu vykřičníky, je skutečnost, že v našem zlomku je před vykřičníkem v čitateli celkový počet koní, které máme k dispozici, a ve jmenovateli rozdíl celkového počtu a počtu koní ve čtyřspřeží (6 — 4 = 2). Vidíme, že počet možností můžeme vyjádřit obecným vzorečkem V»W = (F^W' (L11) kde N je celkový počet prvků, ze kterých vybíráme a n počet prvků v uspořádané n-tici, kterou sestavujeme (v případě našeho čtyřspřeží jde o uspořádanou čtveřici, tedy n = 4). Takový vzoreček je zvlášť užitečný, když čísla N a, n jsou velká a výpočet bez vzorečku by byl zdlouhavý. Počet možností vytvořit čtyřspřeží ze šesti koní se v kombinatorice nazývá počet variací (proto jsme také ve vzorečku 1.11 použili písmenko V). Na tomto místě je užitečné udělat malou odbočku. Co kybychom chtěli řešit předchozí úkol (kolik čtyřspřeží lze sestavit ze čtyř koní) pomocí vzorečku 1.11? Očividně narazíme na problém, protože ve jmenovateli se nám vyskytne faktoriál nuly: (4 — 4)! = 0!. Jak tento problém vyřešíme? Z předchozího úkolu víme, že správný výsledek se rovná faktoriálu z počtu prvků, což je čitatel vzorečku 1.11. Jmenovatel se tedy nutně musí rovnat jedničce. To nás nutí zavést trochy podivnou definici, že faktoriál nuly je roven jedné (0! = 1). Ač to vypadá podivně, pouze s touto definicí fungují vzorečky v kombinatorice pro všechny případy. Praktická ukázka variace se může týkat zase peptidu, který tentokrát neanalyzujete, ale syntetizujete. Používáte k tomu automatický přístroj, do kterého musíte vložit lahvičku s prekurzorem každé aminokyseliny. Kolik různých hexapeptidů můžete nasyntetizovat, pokud máte právě jednu lahvičku pro každou z dvaceti aminokyselin? Odpověď je 20' 20' ^e(20) = . " ,, = 20 • 19 • 18 • 17 • 16 • 15 = — = 27907200. (1.12) (20 — 6)! 14! 1.6 Variace s opakováním aneb čtyři z šesti barev do čtyřspřeží Představte si, že máme nikoli šest konkrétních koní, ale velké stáje s koňmi šesti barev: bělouše, grošáka, hnědáka, plaváka, ryzáka a vraníka. Naším úkolem je zjistit, kolik různých čtyřspřeží dokážeme sestavit z koní různých barev. Když zapřahám prvního koně do čtyřspřeží, vybírám ze šesti, stejně jako v prvním případě. Na rozdíl od minulého příkladu máme při volbě druhého koně zase šest možností: koní všech barev mám dost, takže, když jsem jako prvního vybral bělouše, nic mi nebrání, aby druhý byl taky bílý. Totéž platí pro všechny barvy. Existuje proto 6 • 6 = 36 možností jak vybrat první pár čtyřspřeží. Při volbě třetího mám zase šest barev na výběr (6 • 6 • 6 = 216 možností), a při volbě posledního vybírám opět z šesti zbarvení. Celkový počet možností sestavit čtyřspřeží ze šesti koní je tedy dán součinem 6-6-6-6 = 1296. Tento součin si můžeme také zapsat (1.13) 1.7. KOMBINACE ANED ČTYŘI Z ŠESTI DO VÝBĚHU 7 6 • 6 • 6 • 6 = 64 = 1296. (1.14) Počet možností můžeme vyjádřit obecným vzorečkem (1.15) kde N je celkový počet prvků, ze kterých vybíráme (v našem případě šest barev) a n počet prvků v uspořádané n-tici, kterou sestavujeme (v případě našeho čtyřspřeží jde o uspořádanou čtveřici, tedy n = 4). Abychom dali najevo, že počítáme variace s opakováním, píšeme u „V" čárku: V^(N). Variaci s opakováním si můžeme také ukázat na příkladu syntézy hexapeptidů. Kolik jich můžete vyrobit, pokud budete mít tentokrát k dispozici libovolné množství lahviček prekurzoru každé aminokyseliny? Odpověď je 206, což je 64 miliónů. 1.7 Kombinace aned čtyři z šesti do výběhu U variací rozlišujeme pořadí prvků v n-tici (pořadí koní ve čtyřspřeží) V chemii tomu odpovídá řazení monomerních jednotek do řetězců lineárních polymerů, jako v případě peptidů, které jsme použili jako příklady v povídání o permutacích a variacích. U molekul volně se pohybujících například v roztoku nás ale pořadí obvykle nezajímá. Proto při počítání molekul obvykle řešíme trochu jiný úkol, který se nepodobá zapřahání koní do čtyřspřeží, ale spíše vypouštění do výběhu. Představte si, že máte výběh, ve kterém je dost místa pro čtyři koně a chcete do něj vypustit čtyři koníčky z našeho šestihlavého stáda. Kolik máme možností? Ve výběhu budou koníčci vesele pobíhat a nemá proto smysl mluvit o nějakém pořadí. Pokud nám v kombinatorice na pořadí nezáleží, mluvíme o kombinacích (na rozdíl od variací, ve kterých na pořadí záleželo). Jak už jsme si naznačili, počítání kombinací je složitější, než počítání variací. Budeme proto náš úkol řešit postupně. Vyjdeme z toho, co už umíme, počítání variací. Pak se zamyslíme, jestli bude kombinací více nebo méně. V případě čtyřspřeží (počítání variací) jsme rozlišovali, který koník je na kterém místě. Pořadí ABCD (zapsáno pomocí prvních písmen jmen našich koní) pro nás představovalo jiný případ, než BACD nebo ABDC. U kombinací (příklad výběhu) výběhu nám je pořadí jedno, čtveřice koní Alex, Blesk, Cecilka, Démon pro nás představuje jednu možnost, ať už je do výběhu pustíme v jakémkoli pořadí. Vidíme, že počet možností je u výběhu nižší, než u čtyřspřeží. Když zjistíme, kolikrát je méně kombinací než variací, můžeme tímto číslem vydělit počet variací (který už umíme spočítat) a získat tak počet kombinací (což je náš úkol). Kolikrát je variací víc než kombinací? Tolikrát, kolik různých uspořádaných čtveřic můžeme z Alexe, Bleška, Cecilky a Démona postavit. Ale to je vlastně ta samá otázka, jako když jsme měli za úkol setavit čtyřspřeží ze čtyř koní. Vidíme, že variací je 4!-krát (tedy 24-krát) více, než kombinací. Hledaný počet kombinací je tedy C4(6) 14(6) 6-5-4-3-2- 1 6! 4!2! 15. (1.16) 4! Í4-3-2- 1)(2- 1) Obecně, Cn(N) Vn(N) NI (1.17) n\(N -n)\' Aby těch vzorečků, definic a symbolů nebylo dost, používají se pro propočet kombinací Cn(N) také označení kombinační číslo nebo binomický koeficient. Pro obě tato označení se používá trochu podivný zápis, kde do závorky napíšeme nad sebe čísla N a n: 8 KAPITOLA 1. POČTY Cn(N) = ( ^ ) ■ (1-18) Vzoreček 1.17 shrnuje všechno potřebné, abychom spočítat možné kombinace výskytu molekul v různých stavech, takže bychom jím mohli vlastně skončit. Můžeme k němu ale připojit pár postřehů, které se objevují v učebnicích matematiky. Všimněme si, že když si ve vzorečku 1.17 vyjádříme počet kombinací pomocí faktoriálů, máme ve jmenovateli takové faktoriály dva. V našem případě čtyř koní z šesti to byly faktoriály 4! a (6 — 4)! = 2!. Když se na výsledný vzoreček podíváme C4(6) = ^j, (1.19) jak vlastně poznáme, že nepopisuje počet kombinací dvou koní ze šesti? Vždyť to by se ve vzorečku objevily stejné faktoriály 2! a (6 — 2)! = 4!. Odpověď je jednoduchá: nepoznáme! To znamená, že AH Cn(N) = CN-n(N) = —--ry, (1.20) n\(J\ — n)\ neboli ' N \ ( N l - \ m l ■ (L21) n J \ JS — n 1 1.8 Mikrostavy, makrostavy aneb statistika molekul Představme si, že máme nějaký počet molekul fruktózy, která se může vyskytovat ve třech isomerních stavech, které jsme si představili na začátku našeho povídání. Zkusme s pomocí vzorečku 1.17 spočítat počty možných kombinací našich molekul ve třech možných isomerních stavech. Výpočet bude trochu složitější, než pro koníky ve výběhu. Máme totiž tři možné stavy molekuly, což je, jako bychom měli tři různé výběhy a počítali celkový počet možných kombinací výskytu koní ve všech ohradách. Zkusme si uvést příklad pro naši oblíbenou šestici koní. Pokud budou například v první ohradě dva koně, bude počet kombinací koní v první ohradě podle vzorečku 1.17 C2(6) = = 15. (1.22) Pokud budou v druhé ohradě tři koně, bude počet kombinací výskytu tří ze zbylých čtyř koní v tomto výběhu rovný C3(4) = 41 = 4. (1.23) 31 ' 3!(4-3)! 1 ' Poslední kůň musí být v poslední ohradě, což už je jen jedna možná kombinace. Ale i tu můžeme pro úplnost zapsat Celkový počet všech možných kombinací koní ve všech třech výbězích bude C2(6) • C3(4) • Cl(l) = • • = 15 • 4 • 1 = 60. (1.25) 1.8. MIKROSTAVY, MAKRO STAVY ANEB STATISTIKA MOLEKUL 9 Abychom mohli rychle spočítat počty kombinací pro všechna možná rozdělení molekul do stavů (nebo koní do výběhů), vyjádříme si výpočet obecně, pomocí proměnných. Později nás bude zajímat, jak závisí počty molekul na jejich energiích. Proto si nejdříve seřadíme isomerní stavy podle energie. Nebudou nás přitom zajímat skutečné hodnoty energií různých isomerních stavů, ale jen jejich rozdíly. Toto platí v chemii a fyzice skoro vždycky. Skutečná energie je ostatně číslo, které nám ani většina fyzikálních teorií (s výjimkou Einsteinovy obecné teorie relativity) nedovolí spočítat. Proto většinou počítáme pouze rozdíly energií od nějaké domluvené hodnoty například rozdíly tíhové energie od tíhové energie na povrchu Země. V případě isomerních stavů si jako porovnávací hodnotu zvolíme energii stavu /3-D-fruktopyranosa (na obrázku 1.1 vlevo dole), protože energie tohoto stavu je (za našich podmínek) nejnižší. Pro jednoduchost budeme tomuto isomernímu stavu říkat „stav 0" (což je kratší než /3-D-fruktopyranosa). Počet molekul v tomto stavu označíme no a energii tohoto stavu Sq. O něco vyšší energii má stav /3-D-fruktofuranosa, budeme mu říkat „stav 1". Počet molekul v tomto stavu označíme n\ a budeme říkat, že tento stav má energii e\. Konečně isomerní stav a-D-fruktofuranosa bude pro nás „stav 2", s počtem molekul n2 a energií e2. Celkový počet molekul označíme N. Protože molekula musí být v nějakém stavu,3 celkový počet molekul N musí být rovný n0 + ri\ + n2. Celkový počet všech možných kombinací pro dané počty no, ni, n2 je íí = Cno (N) ■ Cni (N - n0) ■ Cn2 (N-no-m) N\ (N-n0)\ uq\(N — no)! ni\(N — uq — n{)\ n2!(./V — uq — n\ — n2)! no!ni!n2! Tak jsme získali další užitečný vzoreček, pomocí kterého snadno spočítáme počty kombinací pro všechna možná no, n\, n2. Výsledek takového výpočtu pro tři molekuly je uveden v tabulce 1.1. Každý řádek představuje jiný makroskopický stav (zkráceně makrostav) trojice molekul. Stejný makrostav mohou ale představovat různé kombinace isomerních stavů. Tyto kombinace se v chemii a fyzice nazývají mikroskopické stavy (zkráceně mikrostavy) a jejich počet, označený jako fž, je právě to, co počítáme. Označení makrostav znamená, že k popisu takových stavů postačí měření nějaké makroskopické veličiny, což je veličina, která závisí jen na číslech no, n\, n2 a kterou dokážeme měřit pro velká množství molekul, aniž bychom museli jednotlivé molekuly rozlišit. Příkladem takové veličiny je v chemii koncentrace. Naopak k rozlišení různých mikrostavů bychom potřebovali pozorovat a rozlišovat jednotlivé molekuly.4 Proč nás počet mikrostavů tolik zajímá? Pokud by byly všechny tři isomerní stavy molekuly stejně energeticky výhodné, číslo fž by nám přímo řeklo, s jakou pravděpodobností se bude naše skupina molekul (v tomto případě šestice) nacházet v příslušném makrostavu. Je to jako s kartami. Pokud bude v balíčku jedna červená karta a 99 černých, je pravděpodobnost, že vytáhneme červenou kartu jedna ku 99, tedy 0,01. Číslo fž nám tedy umožní předpovědět, s jakou pravděpodobností najdeme šestici molekul v určitém makrostavu. Zkusme se teď podívat, jak závisí rozložení hodnot fž na celkovém počtu molekul N. Tabulka 1.1 nám ukazuje, že pro N = 3 je nejvíce kombinací (Í2 = 6) pro stejný počet molekul ve všech isomerních stavech no = n\ = n2 = 1. Toto číslo je dvakrát větší, než Í2 = 3 pro rozdělení molekuly mezi isomerní stavy v poměru 2:1:0 (n0 = 2, n\ = l,n2 = 0). Spočítejme teď fž pro stejná rozdělení šesti molekul mezi tři isomerní stavy fruktózy (tabulka 1.2). Pro no = n\ = n2 = 2 je fž = 90. Pro poměr 2:1:0 (no = 4,ni = 2, n2 = 0) je Í2 = 15, tedy šestkrát menší. Zopakujme výpočet pro devět molekul. Pro no = ni = n2 = 3 je fž = 1680. Pro poměr 2:1:0 (no = 6,ni = 3,n2 = 0) je Í2 = 84, tedy dvacetkrát menší. A naposledy pro 12 molekul. Pro n0 = n\ = n2 = 4 je fž = 34650. Pro poměr 2:1:0 (n0 = 8,ni = 4,n2 = 0) je Í2 = 495, tedy sedmdesátkrát menší. Vidíme, že s rostoucím celkovým 3Připomeňme si, že pro jednoduchost budeme brát do úvahy jen isomerní stavy, kterých je v roztoku více než jedno procento. Ve skutečnosti bychom měli do čísla N započítat i asi jedno procento molekul v isomerním stavu a-D-fruktopyranosa a podobný počet molekul s otevřených řetězcem. 4Nenechme se zmást tím, že slovíčko stav používáme pro tři různé pojmy: mikrostav souboru molekul, makrostav souboru molekul a isomerní stav jedné molekuly. {N-n0-niy. NI 10 KAPITOLA 1. POČTY Tabulka 1.1: Počet mikrostavů tří molekul fruktózy pro různé počty molekul ve třech isomerních stavech. n0 ni n2 n 3 0 0 i 2 1 0 3 2 0 1 3 1 2 0 3 1 1 1 6 1 0 2 3 0 3 0 1 0 2 1 3 0 1 2 3 0 0 3 1 počtem molekul pravděpodobnost nej pravděpodobnějšího makrostavu prudce vzrůstá. Zatímco pro tři molekuly byl nej pravděpodobnější makrostav jen dvakrát pravděpodobnější než makrostav s no,ni,ri2 v poměru 2:1:0, pro 12 molekul je nej pravděpodobnější makrostav už sedmdesátkrát pravděpodobnější než makrostav s poměrem 2:1:0. A to je 12 ještě docela malé číslo. Chemika obvykle zajímají mnohem větší počty molekul, miliardy miliard. Pro tak velké počty molekul bude pravděpodobnost, že se molekuly nalézají v nejpravěpodobnějším makrostavu tolikrát větší, že se jinými makrostavy (makrostavy s výrazně odlišným poměrem no,ni,ri2) nemusíme vůbec zabývat. Zkusme si teď shrnout, co jsme se o stavech molekuly dozvěděli: 1. Pokud mají všechny stavy molekuly stejnou energii, je každá kombinace molekul v různých isomerních stavech (každý mikrostav) stejně pravděpodobná. 2. Z toho přímo vyplývá, že pravděpodobnost nalézt skupinu molekul v určitém makrostavu je přímo úměrná počtu různých mikrostavů, které tomuto makrostavu odpovídají. 3. Tabulka 1.1 napovídá, že nej pravděpodobnější makrostav je ten, ve kterém jsou stejné počty molekul v různých isomerních stavech. Zdá se tedy, že už známe odpověď na otázku, v jakých makrostavech molekuly nejspíše najdeme. Má to ale jeden háček. Zatím jsme předpokládali, že všechny isomerní stavy molekuly mají stejnou energii. To ale pro většinu molekul včetně fruktózy není pravda! K našim statistickým úvahám budeme proto muset přidat ještě úvahy o energii. 1.8. MIKROSTAVY, MAKRO STAVY ANEB STATISTIKA MOLEKUL 11 Tabulka 1.2: Počet mikrostavů N molekul fruktózy pro různé poměry počtů molekul ve třech isomerních stavech N poměr n0 ni n2 n 3 3:0:0 3 0 0 i 3 2:1:0 2 1 0 3 3 1:1:1 1 1 1 6 6 3:0:0 6 0 0 1 6 2:1:0 4 2 0 15 6 1:1:1 2 2 2 90 9 3:0:0 9 0 0 1 9 2:1:0 6 3 0 84 9 1:1:1 3 3 3 1680 12 3:0:0 12 0 0 1 12 2:1:0 8 4 0 495 12 1:1:1 4 4 4 34650 KAPITOLA 1. POČTY Kapitola 2 Energie Eleganz sei die Sache der Schuster und Schneider. Ludwig Boltzmann Matematika: Mocniny, logaritmy, limity, číslo e, exponenciální funkce, přibližné hodnoty exponenciální funkce s malým exponentem a logaritmu faktoriálu (Stirlingův vztah), variační počet, Lagrangeovy multiplikátory, střední hodnota. 2.1 Energie a počty mikrostavů V této kapitole vezmeme do úvahy, že naše molekuly mají také energii. Započítání energie do našich statistických úvah není vůbec jednoduché. Navíc molekuly fruktózy v různých isomerních stavech jsou samy o sobě složité. Ve svém základním stavu se skládají z 24 atomových jader a 96 elektronů, které se vzájemně přitahují a odpuzují. Čtyřiadvacet atomů se může vyskytovat v různých vzájemných polohách. Jedna poloha je pro každý isomerní stav nejvýhodnější. O této poloze se říká, že má nejnižší energii. Naši molekulu ale můžeme také všelijak natahovat, ohýbat a kroutit. Natahování, ohýbání a kroucení znamená, že na molekulu působíme silou. Když působíme silou, tak konáme práci. Když natáhneme molekulu silou F o rozdíl vzdáleností As, znamená to, že jsme vykonali práci W = F ■ As. Tímto jsme zvýšili energii o hodnotu, která odpovídá vykonané práci W. Víme, že energie je schopnost konat práci. Proto zvýšení energie popisuje to, že natažená molekula při smrštění na původní, nejvýhodnější délku, zase vykoná práci pro nás. Určitá práce je také potřebná k tomu, abychom otevřeli řetězec j3-D-fruktopyranosy a spojili je do řetězce /3-D-fruktofuranosy. Proto /3-D-fruktofuranosa má vyšší energii než /3-D-fruktopyranosy. Abychom si pro začátek počítání trochu zjednodušili, budeme se zatím zabývat pouze rozdíly energií jednotlivých isomerních stavů a energii spojenou s pohyby, deformacemi a jinými změnami molekuly budeme zatím ignorovat. Naším úkolem je spočítat kolik molekul fruktózy najdeme v každém z jejích isomerních stavů. Budeme opět hledat nejpravděpodobnější rozdělení molekul do jednotlivých stavů, tedy nejvyšší hodnotu čísla fž, tedy makrostav s nej vyšším počtem mikrostavů. Jak dáme do souvislosti pravděpodobnosti nalezení molekul v určitém stavu s energií molekul? Základní problém srovnání energií s pravděpodobností ukáže následující příklad. Předpokládejme, že máme dvě molekuly s různou energií. Pravděpodobnost, že první molekulu nalezneme v určitém stavu, bude 0,5. Pravděpodobnost, že druhou molekulu nalezneme v tomtéž stavu, bude také 0,5. Jaká bude pravděpodobnost, že obě molekuly budou zároveň ve zmíněném stavu? Pokud stav první molekuly nezávisí na stavu druhé molekuly (molekuly se vzájemně neovlivňují), bude taková pravděpodobnost 0,5 • 0,5 = 0,25 (polovina z poloviny, tedy čtvrtina). Jaká bude průměrná energie takových molekul? Energie molekul prostě sečteme a výsledek vydělíme dvěma. 13 14 KAPITOLA 2. ENERGIE Vidíme, že zatímco pravděpodobnosti násobíme, energie sčítáme. Tento rozdíl se proto musí projevit v tom, jak budeme porovnávat energie s pravděpodobnostmi, nebo s počty mikrostavů fž, které pravděpodobnosti určují. Dalším problémem počítání molekul v různých stavech se ukáže výpočet fž podle rovnice 1.26: n = N\___(N-n0)\___(JV-np-m)! = N\ n0l(N — n0)l ni\(N — n0 — ni)\ n2l(N — n0 — n\ — n2)! nglni!^! To nás možná překvapí. Vždyť už jsme fž podle tohoto vzorečku počítali dříve. Zatím jsme se ale zabývali poměrně malými počty molekul. Když budeme chtít popsat větší soubory molekul, počítání faktoriálů ve vzorečku 2.1 brzy přeroste možnosti našich kalkulaček. Proto se dříve, než se dostaneme k zahrnutí energie, musíme naučit počítat šikovně s astronomicky velkými čísly. 2.2 Logaritmy a počítání s velkými čísly Začněme naši školu počítání s velkými čísly příkladem ne příliš složitým, násobením čísel 128 a 1024: 128-1024 = 131072. (2.2) S trochou úsilí takový výpočet zvládneme během chvilky na papíře. Pokud ale známe mocniny dvojky, můžeme si výpočet velmi usnadnit, pokud si příklad zapíšeme v trochu jiném tvaru: 27 . 2io = 27+io = 2n (2 3) Výhoda použití mocnin je vidět na první pohled. Místo abychom pracně násobili velká čísla, jednoduše sečteme malá čísla, mocniny. Při počítání molekul jdeme ještě o krůček dále. Domluvíme se, že všechna čísla se kterými počítáme, budou mocniny dvojky a náš příklad zapíšeme jednoduše 7+10=17. (2.4) Vypadá to sice trochu divně, ale součin 128 • 1024 = 131072 je vlastně říká totéž jako součet 7+ 10 = 17. Samozřejmě sedmnáct není totéž, co 131072, ale my víme, že v druhém případě nemluvíme přímo o číslech, ale o jejich mocninách. Je to stejné, jako když řekneme „přestoupili jsme z osmičky na čtyřicítku". Také nemluvíme o počtech osmi či čtyřiceti kusů, ale zjednodušeně říkáme, že jsme přestoupili z šaliny1 jezdící po lince číslo osm na autobus jezdící po lince číslo čtyřicet. Ostatní nám budou rozumět proto, že mezi námi platí nepsaná dohoda, že dopravní linky se ve městě označují čísly. U takto jednoduchého příkladu bychom si mohli říci, že když použijeme kalkulačku, tak nám to vlastně může být jedno. U počítání molekul ale narážíme na čísla tak velká, že už je ani kalkulačka nespočítá. Použití mocnin není proto matematická hříčka, ale naprostá nezbytnost. Proč ale právě mocnina dvojky? Nemohli bychom se domluvit, že budeme vždycky používat čtyřku? Zkusme to. Náš příklad můžeme zapsat jako 2-43-45 = 2-43+5 = 2-48. (2.5) Skoro v pořádku, ale co ta dvojka? Tady nám pomůže si uvědomit, že 2 = VI (2.6) neboli 22 = 4. (2.7) Salina je dopravní prostředek, který se ve městech mimo Brno nazývá tramvaj, lokajka, električka a podobně. 2.2. LOGARITMY A POČÍTÁM S VELKÝMI ČÍSLY 15 Pokud chceme, aby se levé strany těchto rovnic rovnaly, musíme ve druhé rovnici podělit všechny mocniny dvojkou 22 = 41—>25=43, (2.8) takže vidíme, že 2 = vl = 43. (2.9) Náš příklad tedy můžeme zapsat 2 . 43 . 45 = 4§ . 43 . 45 = 40,5+3+5 _ 48,5^ (2.10) Vidíme, že s pomocí odmocnin můžeme vyjádřit jako mocninu čtyřky i číslo, které celočíselnou mocninou čtyř ve skutečnosti není. Většina z nás má na rukách deset prstů a proto lidstvo používá desítkovou soustavu.2 Zkusme proto, jestli náš příklad umíme vyjádřit i pomocí mocnin desítky. Asi víte, že fyzici místo 128 rádi píší 1,28 • 102. Když si trochu pohrajeme s odmocninami na kalkulačce, tak například zjistíme, že v/TÔ • 102 = lOra • 102 = 125,8925412, (2.11) což není o moc méně, než 128. Pokud budeme chtít být přesnější, můžeme třeba počítat lo7l0107 • 102 = 102'107 = 127,9381304, (2.12) nebo 1007^TÔŤ2 . 102 = 102,io72 ^ 127;9970617. (2.13) Spatná zpráva je, že se nám nedaří vyjádřit 128 úplně přesně. To je mrzuté. Až dosud jsme v našem povídání počítali s přesnými čísly, teď musíme zaokrouhlovat. Dobrá zpráva je, že přesnost můžeme zvyšovat přidáváním desetinných čísel tak dlouho, jak potřebujeme. To nás přivedlo k důležitému zjištění: Pomocí mocnin si můžeme vyjádřit jakékoli číslo. Výhodou je, že místo násobení velkých čísel můžeme sčítat malá čísla (mocniny). Daň, kterou za to platíme, je, že velká čísla většinou takto nenahradíme úplně přesně. Použití mocnin nám umožnilo nahradit obrovské počty mikrostavů čísly rozumně velikými. Použití mocnin ale také znamená, že místo násobení sčítáme. Mocniny tak řeší i ten první, a zásadnější, problém srovnávání energií a počtů mikrostavů: když násobíme počty mikrostavů (definujících pravděpodobnosti výskytu), sčítáme čísla v mocninách, tak jako sčítáme energie kouzelných molekul. Později si ukážeme, že energie se opravdu vyskytují v mocninách vztahů pro počty mikrostavů. Na závěr trochu nudného názvosloví. Mocninám říkají matematici také exponenty nebo logaritmy. Slovo logaritmus se používá právě tehdy, když chceme všechna čísla zapsat jako mocniny jednoho dohodnutého čísla (my jsme si to vyzkoušeli pro dvojku, čtyřku a desítku). Tomuto dohodnutému číslu se pak říká základ logaritmu. To nás vede k zvědavé otázce: který základ je nejlepší? Dvojka? Desítka? Desítka se používá často, protože jsme zvyklí na desítkovou soustavu. Pokud si kalkulačka říká scientific calculator, tak umí pomocí tlačítka log přímo spočítat, na jakou mocninu musíme umocnit desítku, abychom získali číslo, které nás zajímá. Existuje ale základ, který je šikovnější, než desítka. Kupodivu tento základ není žádné celé číslo, dokonce ani žádné racionální číslo. Nejlepším základem je trochu záhadné číslo, kterému matematici většinou říkají „e". 2 Desítková soustava vlastně moc praktická není, ale už jsme si na ni zvykli, takže nám to ani nepřijde. 16 KAPITOLA 2. ENERGIE 2.3 Číslo e aneb banka snů Podívejme se teď na příklad, který na první pohled s počítáním molekul vůbec nesouvisí. Představme si, že jsme našli banku snů, která nám nabídne stoprocentní roční úrok z vkladu. Když si uložíme tisíc korun, za rok nám banka připíše sto procent z tisíce, tady další tisíc korun. Na účtu už budeme mít 2000 Kč! A co kdyby nám banka vyplatila úrok nadvakrát? 50 % z vkladu po půl roce, a dalších 50 % z vkladu za další půlrok? Kolik budeme mít za rok na účtu? Z tisícovky dostaneme za půl roku 50%, tedy na účtu bude 1500 Kč. Na konci roku se bude vyplácet dalších 50%, ale teď z 1500 Kč, tedy 750 Kč. Budeme mít tedy po roce na účtu 2250 Kč. Vidíme, že rozdělení výplaty se nám vyplatilo. Zkusme si to zapsat matematicky. Pokud vyplácíme úrok jednou, výpočet vypadá takto 1000 • (1 + 1) = 1000 • 2 = 2000. (2.14) Pokud vyplácíme úrok dvakrát do roka, počítáme 1000 • (1 + 0,5) • (1 + 0,5) = 1000 • (1 + 0,5)2 = 1000 • 2,25 = 2250. (2.15) A kdyby nám banka platila dvanáctinu ročního úroku každý měsíc? 1000 ■(Kí + Y^j = 1000-2,613 = 2613. (2.16) Vyplatilo by se nám to ještě víc. A kdyby byla výplata každý den? / ! \365 1000-1 +- = 1000-2,715 = 2715. (2.17) V 365 / A co takhle každou hodinu? / , \ 365-24 !000 • ( 1 + ——- ) = 1000-2,718 = 2718. (2.18) \ 365 • 24 / Vidíme, že i když jsme období výplaty zkrátili 24-krát, už jsme si tolik nepolepšili. Napišme si teď náš výpočet obecně, pro jakýkoli počet výplat. Pokud si celkovou dobu (v našem případě jeden rok) označíme ŕ a období, za které počítáme úrok Ar, tak počet výplat bude ŕ/Ar. Výpočet můžeme pak zapsat / 1 \s / At\^* 1000-^1 + —J = 1000-^1 + —J . (2.19) Jacob Bernoulli si roku 1683 položil otázku, jaký je maximální možný zisk, když se doba výplaty Ar blíží nule a počet výplat t/At blíží nekonečnu. Podivná otázka, že? Na jednu stranu se zdá, že je neřešitelná: není přece možné číslo v závorce násobit do nekonečna. Na druhou stranu malý rozdíl mezi hodinovou a denní výplatou napovídá, že číslo, kterým bude vklad násoben, nebude růst donekonečna. Pokud ale neporoste donekonečna, bude se blížit k nějakému konkrétnímu reálnému číslu. A tomu číslu říkají matematici e. Matematicky se naše definice čísla e zapíše / Ar\ ^* e=|m^l + Tj , (2.20) kde značka lim znamená limita, tedy číslo, ke kterému se výraz za značkou lim blíží, když se s proměnnou ve výrazu děje to, co je napsáno pod značkou. Číslo e není racionální číslo, proto jeho 2.4. MALÉ ČÍSLO V EXPONENTU 17 přesnou hodnotu může popsat jen oklikou (například tak, jak jsme to udělali v předchozí rovnici). Zaokrouhleně na padesát desetinných míst je e = 2,71828182845904523536028747135266249775724709369995. (2.21) 2.4 Malé číslo v exponentu Při počítání molekul nás bude zajímat, co se děje s logaritmem neboli s exponentem, na který číslo e umocníme. Tento exponent si pro jednoduchost označíme písmenkem x. Občas budeme zkoumat, jak se toto číslo změní, když hodnotu x o maličko zvýšíme. Návod, jak změnu ex spočítat vypadá jednoduše. Vezmeme hodnotu naší exponenciální funkce ex pro hodnotu exponentu x a pro hodnotu exponentu větší o nepatrný kousek Ax a spočítáme jejich rozdíl, který si označíme Aex Aex = ex+Ax - ex = ex ■ eAx - ex = ex ■ (eAx - l) (2.22) K výpočtu eAx — 1 využijeme definice čísla e (rovnice 2.20) (t \ Aa- / / _t_ \ Ax |»(1 + t)") -^((o + t)") -'I- <"» Protože ani exponent Ax ani —1 na pravé straně nezávisí na At/t, můžeme limitu počítat pro celou pravou stranu (t \ Aa; / / _t_ v Aa; |»o(1 + t)"J -^í1»„(((1 + t)") -'I- <™> Zde se nám ovšem vyskytují dvě maličká čísla, At/t a Ax. Výpočet se zjednoduší, když si Ax vyjádříme jako At/t vynásobené nějakým přirozeným číslem c Ax = c-—. (2.25) Podmínkou bude, aby hodnota c nebyla příliš vysoká, aby Ax bylo dostatečně malé číslo. Pak můžeme dosadit do rovnice 2.24 --'-fr(((-¥)T-I)-fr((l+T)**1'-') = iin:„((1+f)c-1)' (2'26) Pokud bude c celé kladné číslo, tak nám tento vztah říká, že výraz v závorce musíme vynásobit c-krát 1+fy=(1+f)...c,rát...(1+f). takže eAx - 1 = hm ^1 + ^ V • • c-krát • • • + ^\ - lV (2.28) 18 KAPITOLA 2. ENERGIE Zkusíme si výraz v limitě v rovnici 2.26 počítat pro různé hodnoty c. Pro c = 1 Aí\ Aí Aí , 1 + T)-1 = 1 + T-1 = - (2.29) Pro c = 2 Aí\ / Aí\ Aí /Aí\2 Aí /Aíx 2 Pro c = 3 1 + T ľ + T 1-1 = 1+2—+ T -1=2T+ T) . (2.30) -f)(-f)(-f)-(-f+(f)2)(-f'- Aí „/Aí\2 /Aí\3 , „Aí „/Aí\2 ( At\ l + 3^ + 3(Tl + (-) 1-3—+ 3(^—1 + (-) -1. (2.31) Pro c = 4 , Aí\ / Aí\ / Aí\ / At\ , / Aí 0/Aí\2 /Aí\3\ / Aí ^tJI' + tJI' + tJI' + tJ-^^'t+Ht) +(t) J(1 + t .Aí /Aí\2 ./Aí\3 /Aí\4 . .Aí /Aí\2 ./Aí\3 /Aíx4 = 1+4t + 6vtJ +a{t) +{t) -1 = 4t+6ItJ +a{t) +{t) <2-32> Teď už začínáme tušit, jak bude výraz v limitě zhruba vypadat pro jakékoli c: , Aí\ , , / Ar\ Aí , , . . , , Aí 1 H--I • • • c-krat • • • 1 H--I — 1 = c--h výrazy s vyššími mocninami zlomku —. (2.33) Pokud je ale zlomek Aí/í opravdu malé číslo, jak limita žádá, tak budou jeho vyšší mocniny ještě mnohem menší. Pokud by bylo Aí/í jedna tisícina, tak bude druhá mocnina tohoto čísla jedna milióntina atd. Protože v rovnici 2.33 máme konečný výsledek, který už dále ničím nenásobíme, vyšší mocniny se už nemůžou nijak poskládat do větších čísel a můžeme je tedy vedle hodnoty cAí/í bezpečně zanedbat. Za hodnotu c můžeme v pravé straně rovnice 2.33 zpátky dosadit z rovnice 2.25 c = Ax ■ í/Aí a dostaneme - 1 = |,no ( (l + - ■ ■ e -faft . • • (l + f) - l) - A, • ± ■ f = ^. (2.34) Když převedeme —1 z levé strany na pravou, získáme důležitý vztah „Aí 1 + Ax. (2.35) Když se vrátíme k rovnici 2.22, vidíme, že hodnota exponenciální funkce se při nepatrném zvýšení exponentu změní o Aex^Ax-ex. (2.36) 2.5. LOGARITMUS tt ANEB ZKROCENÍ FAKTORIÁLŮ 19 2.5 Logaritmus fž aneb zkrocení faktoriálů Ukázali jsme si, jak nám logaritmy ulehčí počítání s velkými čísly: domluvíme se na určitém číslu (základu), ostatní čísla si vyjádříme jako mocniny tohoto čísla a místo násobení velkých čísel sčítáme mocniny základu. Později si ukážeme, že nejšikovnějším základem je číslo e. Protože se s takovými logaritmy počítá velmi často, používá se pro ně zvláštní zkratka ln (z latinského logarithmus naturalis, což znamená přirozený logaritmus). Zkusme tedy naše znalosti použít na vztah pro určení počtu makrostavů rozpuštěného hroznového cukru. Tímto vztahem je vzoreček 2.1: AH íí=———. (2.37) nQ!n1!n2! Převedením na logaritmy (mocniny) základu e se vzoreček změní na ln(íí) = ln(N\) - ln(n0!) - ln(ni!) - ln(n2!). (2.38) V tomto vztahu máme samé logaritmy faktoriálů. Protože faktoriál nějakého čísla n je součinem čísel od jedné po n n\ = 1 • 2 • 3 • 4 • 5 • 6 • • • (n - 2) • (n - 1) • n, (2.39) bude logarimus faktoriálů čísla n součtem logaritmů čísel od jedné po n ln(n!) = ln(l) + ln(2) + ln(3) + ln(4) + ln(5) + ln(6) + • • • + ln(n - 2) + ln(n - 1) + ln(n). (2.40) Na první pohled jsme si moc nepomohli. Místo mnoha násobení nás čeká dlouhé sčítání. Za chvilku ale uvidíme, že součet mnoha logaritmů můžeme téměř zázračně zjednodušit. K řešení nás dovede otázka, čemu se rovná rozdíl dvou sousedních logaritmů v našem dlouhém součtu. Obecně si to můžeme zapsat ln(x + 1) - ln(x) = ln (^T^j =ln{1 + ~) ' (2'41) kde x je nějaké celé číslo mezi lan. Pokud budeme rozdíl počítat pro velké x, bude naopak í/x malé číslo. Podle rovnice 2.35 pro malá čísla Ax platí l + Ax«eAl. (2.42) Když tedy dosadíme za Ax malé číslo l/x, můžeme rozdíl logaritmů počítat jako ln(x + 1) - ln(x) « ln (ei ) . (2.43) Vzpomeňme, že zápis ln(í) znamená „napiš na jakou mocninu musíme umocnit číslo e, abychom získali číslo í", neboli í = eln(t). (2.44) Pokud je ale t = ei, je výsledek vidět na první pohled: mocnina e je číslo 1 /x. Takže rozdíl logaritmů se nám ještě zjednoduší ln(x + 1) - ln(x) « ln (ei ) = ^. (2.45) Pokud se rozdíl logaritmů čísel x lišících se o jedničku rovná l/x, čemu se bude rovnat rozdíl výrazů x ■ ln(aľ), ve kterých se x liší se o jedničku? 20 KAPITOLA 2. ENERGIE 'x + 1" (x + 1) • ln (x + 1) - x ■ ln(x) = In (x + 1) + x ■ (ln (x + 1) - ln(x)) = ln (x + 1) + x • ln = ln(x+ 1) + x ■ ln ^1 + « ln(x + 1) + x • ln (e*) = ln(x + 1) + x ■ - = ln(x + 1) + 1.(2.46) Pro velmi velká x (malá l/x) můžeme výsledek vyjádřit přibližně jako ln(x + 1) + x ■ ln ^1 + « ln(x + 1) + x • ln (ei) = ln(x + 1) + x ■ - = ln(x + 1) + 1. (2.47) Tentokrát se ve výsledku už objevuje logaritmus, čehož využijeme. Zjistili jsme totiž, že jednotlivé logaritmy v součtu můžeme přesně vyjádřit podle rovnice 2.46 jako ln(x + 1) = (x + 1) • ln(x + 1) - x • ln(x) - x ■ ln ^1 + , (2.48) ale také přibližně podle rovnice 2.47 jako ln(x + 1) « (x + 1) • ln(x + 1) - x • ln(x) - 1. (2.49) K čemu je nám toto zjištění dobré? To uvidíme, když zkusíme logaritmy sečíst: x ln(x+l) (x + 1) • ln(x + 1) - x • ln(x) - x • ln (l + i) (x + 1) ■ ln(x + 1) - x ■ ln(x) - 1 1 ln(2) 2 ln(2) - 1 -ln(l) - 0,693 2 ln(2) - 1 • ln(l) - 1 2 ln(3) 3 ln(3) - 2 •ln(2) - 0,811 3 ln(3) - 2 • ln(2) - 1 3 ln(4) 4 ln(4) - 3 •ln(3) - 0,863 4 ln(4) - 3 • ln(3) - 1 4 ln(5) 5 ln(5) - 4•ln(4) - 0,893 5 ln(5) - 4 • ln(4) - 1 5 ln(6) 6 ln(6) - 5 •ln(5) - 0,912 6 ln(6) - 5 • ln(5) - 1 6 ln(7) 7 ln(7) - 6 •ln(6) - 0,925 7 ln(7) - 6 • ln(6) - 1 7 ln(8) 8 ln(8) - 7•ln(7) - 0,935 8 ln(8) - 7•ln(7) - 1 8 ln(9) 9 ln(9) - 8 •ln(8) - 0,942 9 ln(9) - 8 • ln(8) - 1 9 ln(10) 10 ln(10) - - 9 • ln(9) - 0,948 10 ln(10) - 9 • ln(9) - 1 Součet ln(10!) 10 •ln(10) - 7,922 = 15,104 10 • ln(10) - 9 = 14,026 Na první pohled jsme sčítali logaritmy čísel od 2 do 10. Ale protože ln(l) = 0, můžeme říci, že jsme sečetli logaritmy všech celých čísel od 1 do 10, tedy vypočítali ln(10!). Ve třetím sloupci jsou výsledky přesného výpočtu, přičemž hodnoty x • ln(l + 1/x) jsou vyjádřené číselně. Ve čtvrtém sloupečku jsou výsledky výpočtu se zaokrouhlením pro velké hodnoty x. A právě ten přibližný výpočet v posledním sloupečku je pro nás užitečný. K tomu, abychom spočítali výsledný ln(n!) nám totiž stačí jen poslední řádek. Hodnota 1 • ln(l) je totiž nulová (protože ln(l) = 0) hodnoty pro většinu x • ln(x) se odečtou na dalším řádku, takže zbývá jen n ■ ln(n) a jednička za každý řádek. A protože počet řádků je n — 1, máme jednoduchý vzoreček ln(n!) « n ■ ln(n) - n+ 1. (2.50) Nevadí, že je výpočet pouze přibližný? Pro deset molekul nám vyjde podle tabulky ln(n!) « 14,0 místo správného 15,1. Pro větší počty molekul je ale chyba výrazně menší, než hodnota ln(n!). Od 2.6. VARIAČNÍ POČET 21 65 molekul je chyba menší než jedno procento. Ve skutečnosti jsou počty molekul v jednotlivých stavech mnohem větší, přinejmenším miliardy (ale častěji miliardy miliard). Pro takové počty se obvykle zanedbává i jednička ve vzorci 2.50, takže počítáme jen ln(n!) « n ■ ln(n) — n. (2-51) Hodnota ln(l 000 000 000!) je totiž téměř 20 miliard, takže nehraje téměř žádnou roli, jestli k tomuto číslu jedničku přičteme nebo ne. S tímto vědomím se můžeme bezpečně vrátit k logaritmu fž a přepsat jej ln(fž) = ln(W!)—ln(no!)—ln(ni!)—ln(n2Í) ~ N-la(N)— N—no-ln(no)+no—ni-ln(ni)+ni— n2-ln(n2)+n2. (2.52) 2.6 Variační počet S nabitými matematickými znalostmi se můžeme vrátit k původní otázce. V jakém poměru nejspíše najdeme isomerní stavy fruktózy ve vodě? Znalosti o našich molekulách si můžeme shrnout do tří rovnic. ln(fž) = N ■ ln(N) - N - n0 ■ ln(n0) + n0 - nx ■ ln(ni) + nx - n2 ■ ln(n2) + n2, (2.53) N = n0 + n1+n2, (2.54) N ■ ľ = n0 ■ e0 + ni ■ Ei + n2 ■ e2. (2.55) První rovnice je výsledkem převedení vztahu pro počet mikrostavů fž do logaritmického tvaru a následného nahrazení faktoriálů výrazy, se kterými se lépe počítá.3 Druhá rovnice je prostým konstatováním, že sečtením počtů molekul v jednotlivých isomerních stavech musíme získat celkový počet molekul. Třetí rovnice je definicí celkové energie, tedy průměrné energie, kterou jsme si označili ě, vynásobené počtem molekul. Naším cílem je nalézt počty uq, n\, n2, pro které je fž (a tedy také ln(fž)) největší. Na první pohled by se mohlo zdát, že hledáme maximum funkce / = ln(fž), která závisí na nezávislých proměnných n0, ni, n2. Později si ukážeme, že k tomuto účelu dobře poslouží analýza derivací zkoumané funkce. Ve skutečnosti je ale naše úloha jiná. Potřebujeme najít vztah mezi proměnnými no,ni,n2, který povede k nejvyšší hodnotě ln(fž). K tomu využijeme úplně jinou oblast matematiky, než počítání derivací. Využijeme odvětví matematiky, kterému se říká variační počet. Soustavu tří rovnic často řešíme tak, že dvě rovnice vynásobíme nějakými čísly a všechny rovnice pak sečteme.4 Zkusme to provést i s rovnicemi 2.53-2.55. Protože nevíme, jakým číslem rovnice násobit, zapíšeme si obecně, že rovnici 2.54 vynásobíme nějakým číslem a a rovnici 2.55 vynásobíme nějakou konstantou5 f3 3Pokud budeme počítat molekuly, měli bychom, přísně vzato, místo znaménka = používat R2, protože vztah platí jen přibližně. Pro obrovské počty molekul, se kterými se setkáváme v kádinkách a zkumavkách, je ale chyba zanedbatelná. 4Například ze soustavy 3x + 2y + z = 1 —x + z = 1 -y + z=l můžeme hodnotu z vypočítat tak, že druhou rovnici vynásobíme třemi, třetí rovnici vynásobíme dvěma a všechny rovnice sečteme. Získáme tak jednoduchou rovnici 6z = 6, ze které snadno spočítáme, že z = 1. 5Nemůžeme sčítat veličiny s různými jednotkami. Protože ln(Af) je bezrozměrné číslo, ale N ■ e je energie, musíme N ■ e vynásobit nějakou konstantou s jednotkou J~1. 22 KAPITOLA 2. ENERGIE ln(fž) = N ■ hi(N) — N — uq ■ In (no) + no — n\ ■ ln(ni) + n\ — n2 ■ ln(n2) + n2, a ■ N = a ■ (n0 + n\ + n2), ß-N-s = ß ■ (n0 ■ £0+ni ■ £i + n2 ■ £2), (2.56) takže součet se rovná ln(íí) + a ■ N + ß ■ N ■ £ N-ln(N) — N—no-ln(no)+no—ni-ln(ni)+ni—n2-ln(n2)+n2+a-(no+ni+n2)+(3-(no-£o+ni-£i+n2-£2)- (2-57) Všechny výrazy násobené a a j3 si převedeme na levou stranu ln(fž) + a ■ (N — n0 — n\ — n2) + /? • (N ■ £ — n0 ■ £0 — n\ ■ £\ — n2 ■ £2) = N ■ \ti{N) — N — no ■ ln(no) + no — n\ ■ ln(ni) + n\ — 712 ■ ln(n2) + n2. (2.58) Levou stranu této rovnice6 si označíme písmenkem L. L = ln(fž) + a ■ (N — n0 — n\ — n2) + /? • (N ■ £ — n0 ■ £0 — n\ ■ £\ — n2 • e2). (2.59) Na první pohled se zdá, že jsme nic nezískali. Tři rovnice jsme sečetli, a ve výsledku máme stále tři proměnné. Ve skutečnosti jsme se ale připravili na hledání nej pravděpodobnějších počtů molekul úplně jiným přístupem, než je řešení soustavy tří rovnic pro tři neznámé. Ten jiný způsob nám dokonce umožní spočítat z našich tří rovnic počty molekul v libovolném množství isomerních (nebo jiných) stavů. 2.7 Lagrangeova metoda Slíbený postup řešení je spojen se jménem italsko-francouzského matematika Josepha-Louise Lagrange. Začneme otázkou, co se stane s L, když malinko změníme počet molekul v jednotlivých isomerních stavech. Tedy když čísla no, ni, n2 změníme o maličké hodnoty, které si označíme Suq, Sni, Sri2, zatímco písmeny no,n1;n2 budeme značit takové počty molekul, pro které je fž nej větší. Čísla L a ln(fž) se tím změní o maličké hodnoty SL a t)ln(fž) L + SL = ln(fž) + t)ln(fž) + a ■ (N — n0 — Sn0 — n\ — 5n\ — n2 — 5n2) + j3 ■ (N ■£ — no • £q — ôno ■ £0 — ni ■ £1 — Sni • £i — n2 • e2 — t)n2 • e2). (2.60) Když od rovnice 2.60 odečteme rovnici 2.59, získáme SL = Sln(fí) — a ■ (Sno + Sni + ^2) — P ■ (Sno ■ £0 + Sni ■ £1 + ^2 ■ £2)- (2-61) Abychom mohli rovnici 2.61 využít, musíme zjistit, jak závisí t)m(fž) na změně Sno + Sni + Sn2-Zjistíme to tak, že ve vztahu definujícím ln(fž) zvýšíme no,i ,2 o maličké hodnoty Sno, Sni, Sn2, podíváme se, o kolik v důsledku toho vzroste ln(fž) a tento rozdíl nazveme t)ln(fž). Podle rovnice 2.53, definující ln(íí), ln(fž) = N ■ ]n(N) - N - n0 ■ ln(n0) + n0 - nx ■ ln(ni) + nx - n2 • ln(n2) + n2, (2.62) 6Z rovnic 2.54 a 2.55 vyplývá, že výrazy v závorkách za řeckými písmenky a a j3 se rovnají nule. Pro další postup ale bude vhodné tyto nulové členy v rovnici zachovat. 2.7. LAGRANGEOVA METODA 23 takže ln(íí) + S ln(íí) = iV • ln(N) - N — n0 ■ ln(n0) — S(n0 ■ ln(n0)) + n0 + Sn0 — ni ■ ln(ni) — 5{n\ ■ ln(ni)) + n\ + Sni — n2 ■ ln(n2) - S(n2 ■ ln(n2)) + n2 + Sn2. (2.63) Odečtením rovnice 2.62 od 2.63 získáme t)ln(fž) = — S(no ■ ln(no)) + Sno — S(ni ■ ln(ni)) + Sni — S(n2 ■ ln(n2)) + Sn2. (2.64) V rovnici 2.64 potřebujeme vyjádřit hodnoty změn 6(rii ■ ln(nj)), kde jsme si písmenkem i označili obecně jeden ze stavů 0, 1, 2, abychom nemuseli rozepisovat postup třikrát. Nejde o nic jiného, než o variantu výpočtu v rovnici 2.47, kde jsme hledali rozdíl mezi součinem x ■ ln(x) a podobným součinem pro x o jedničku vyšším. Jediný rozdíl je, že teď neporovnáváme výrazy pro x zvýšené o jedničku, ale pro rii zvýšené o malou hodnotu Sríi. Rovnici 2.47 proto musíme trochu přepsat: S(rii ■ ln(n^)) = (ni + Sríi) ■ ln(n^ + Sríi) — rii ■ ln(n^) = Sríi ■ ln(n^ + Sríi) + rii ■ (ln(n^ + Sríi) — ln(n^)) / yí —|— Stí \ / Stí = Sríi ■ ln(rii + Srn) + • ln —--- ) = Srn ■ ln(n^ + Srn) + • ln 1 H--- V n% ) V ni (^ní\ Sn ■ e ni ) = Srn ■ ln(n^ + Srn) + t^í • —- = Srn • ln(n^ + Srn) + Srn. (2.65) Při úpravě na exponenciální tvar jsme využili jsme toho, že vzniklý zlomek Sríi/rii je velmi malé číslo. Výsledek dosadíme za výrazy —6(rii ■ ln(n^)) + Sríi z rovnice 2.64 —6(rii ■ ln(nj)) + Sríi = —Sríi ■ ln(n^ + Sríi) — Sríi + Sríi = —Sríi ■ ln(n^ + Sríi). (2.66) Z výrazu ve výsledném logaritmu můžeme vytknout -Sn, • ln [n, (l + ^ = -Sn, • ^ln(n,) + ln ^1 + ■ (2.67) Opět využijeme toho, že vzniklý zlomek Sni/ni je velmi malé číslo —Sni • ^ln(nj) + ln ^e ^ = —Sni • ^ln(nj) H--= —Sni • ln(n^) — rii ■ ^—. (2.68) Pokud je zlomek Sni/ni opravdu malé číslo, bude jeho druhá mocnina ještě mnohem menší a můžeme ji zanedbat. Získáme tak t)ln(fž) kí —Sn0 ■ ln(n0) — Sni ' ln(ni) — Sn2 ■ ln(n2), (2.69) což můžeme dosadit do rovnice 2.61 SL = —Sno ■ ln(no) — Sni ■ ln(ni) — Sn2 ■ ln(n2) —a ■ (Sno + Sni + Sn2) — j3 ■ (Sno ■ £o + Sni ■ £i + Sn2 ■ e2). (2.70) 24 KAPITOLA 2. ENERGIE V této rovnici máme už jen změny počtů molekul Sno , Sni, Sn2, které si můžeme vytknout před závorky a získáme SL = — ôno • (m(no) + Ol + j3 ■ e o) — Sni ■ (ln(ni) + a + j3 ■ e±) - ón2-(ln(n2)+a + p-e2). (2.71) Vraťme se opět k původnímu tvaru rovnice 2.61 SL = Sln(fí) — a ■ (Sno + Sni + Sn2) — /3 ■ (Sno ■ eo + Sni ■ £i + Sn2 ■ e2) (2.72) a podívejme se na ni trochu jinýma očima. Nebudeme teď provádět matematické úpravy, ale zamyslíme se, čemu se musí rovnat jednotlivé členy na pravé straně. Čemu se rovná člen násobený číslem al K rovnici 2.61 jsme se dostali tak, že jsme vzali počty molekul ve stavech 0, 1,2, pro které je fž největší a změnili je o hodnoty Sno, Sni, Sn2. Celkový počet molekul po této změně je no+Sno+ni+Sni+n2+Sn2. Ale pozor! Celkový počet molekul je pořád konstantní, rovný číslu N. Tomuto číslu se tedy musí rovnat nejen počet molekul před změnou N = n0+ni+n2 (2.73) ale i počet molekul po změně N = no + Sno + ni + Sni + n2 + Sn2. (2.74) Z toho vyplývá, že Sn0 + Sni + Sn2 = 0. (2-75) Podobně je tomu i s energií. Energie při počtech molekul s nejvyšším fž i energie při jiných počtech molekul je rovna N ■ ~ě. Proto musí platit Sno ■ £o + Sni • £i + Sn2 ■ e2 = 0. (2.76) Teď už nám zbývá určit jen t)m(fž). Protože nás nakonec zajímá největší ln(fž), tak kýženou hodnotu t)ln(fž) vlastně známe. Chceme, aby ln(fž) byla největší, tedy aby odchylka od této hodnoty byla nulová. Hledání největšího ln(fž) je totéž, jako hledání nulové změny t)ln(fž) (při maličkých změnách Sno, Sni, Sn2). Vidíme, že pro největší fž budou všechny členy pravé strany rovnice 2.61 rovné nule SL = áln(fž) -a ■ (Sn0 + Sni + Sn2) -j3 ■ (Sn0 ■ s0 + Sni ■ £i + Sn2 ■ e2) = 0. (2.77) oo o Pokud se ale rovná nule SL, musí se (pro největší Í2) rovnat nule i pravá strana rovnice 2.71 SL = 0 = — Sno • (m(no) + Ol + P • £o) — Sni ■ (hi(ni) + a + j3 ■ e±) - Sn2 ■ (ln(n2) + a +/3 -e2). (2.78) Mezi hodnotami Sno, Sni, Sn2 přitom nejsou žádné jiné vztahy kromě těch, které jsme už do našich úvah zahrnuli, když jsme došli k závěru, že poslední dva členy označené svorkou v rovnici 2.77 jsou nulové. Aby se levá strana rovnice 2.71 rovnala nule pro různé nenulové hodnoty Sno, Sni, Sn2, musí se nule rovnat i všechny závorky násobící Sno, Sni, Sn2 na pravé straně. 2.7. LAGRANGEOVA METODA 25 O = ln(n0) + a + (3 ■ e0, O = ln(ni) + a + (3 ■ e\, O = ln(n2) + a + j3 ■ e2. (2.79) (2.80) (2.81) Obecně můžeme místo uq, n i a n2 psát n^. Když si převedeme ln(n^) na levou stranu, můžeme pro každý isomerní stav psát -ln(n4) = a + j3-el. (2.82) Díky vzorečku 2.44 můžeme vyjádřit přímo počty molekul v jednotlivých isomerních stavech (2.83) Tento vztah přitom platí obecně. Ať už je isomerních stavů kolik chce, musí být všechny závorky násobící Srii v rovnici 2.71 rovny nule. Můžeme tak spočítat počty molekul v jednotlivých stavech, ať už je možných stavů libovolné množství, tedy pro jakýkoli počet proměnných n^. Tak můžeme například pro náš roztok hroznového cukru spočítat funkce všech pěti isomerních stavů (včetně a-D-fruktopyranosy a otevřeného řetězce, kterým budeme říkat „stav 3" a „stav 4"): n0 = e~ (a+/3-eo) ni = e~ (a+iS-ei) n2 = e~ {a+l3-e2) n-i = e~ (a+/3-e3) 714 = e~ {a+13-64.) = e = e" = e" = e" = e" 3-/3-ei (2.84) (2.85) (2.86) (2.87) (2.88) Protože naše rovnice obsahují kromě počtů molekul v jednotlivých stavech také zatím neznámé parametry a a /?, musíme si soustavu pěti rovnic 2.84-2.87 rozšířit ještě o další dvě rovnice. Použijeme rovnice 2.54 a 2.55. N = n0 + n± + n2 + n3 + n4 N ■ ľ = n0 ■ e0 + ni ■ ei + n2 ■ e2 + n3 ■ e3 + n4 • e4 (2.89) (2.90) Parametru a se můžeme zbavit docela snadno tak, že rovnice 2.84-2.88 sečteme. Na obou stranách rovnice získáme součty uq + n\ + n2 + n3 + n4, které se vzájemně odečtou a zbude nám N -a ■ (e -/3-eo N Z (2.91) (2.92) kde jsme si součet exponenciálních členů s energiemi označili písmenkem z. Výsledek rovnice 2.92 můžeme dosadit do rovnic 2.84-2.90. Navíc je praktičtější počítat ne přímo počty molekul, ale poměry udávající kolik molekul z celkového počtu je v daném stavu: 26 KAPITOLA 2. ENERGIE n0 e-/3-eo e -ß-E0 N e—/3-eo - ^Q-ß-El _ f g-/3-£2 - \-e-ß-E3 - |_ Q-ß-Ei Z ni e-/3-£i e -ß-ei N Q-ß-Eo - \-e-ß-£-L - f g-/3-£2 - \-e-P-£a - |_ Q-ß-Si Z e-ß-E2 e -ß-E2 N Q-ß-EQ _ ^Q-ß-El _ \rQ-ß-E2 - \-e-ß-ea - |_ g-/3-£4 Z n-i e-ß-E3 e -ß-E3 N Q-ß-EQ _ ^Q-ß-El _ \rQ-ß-E2 - \-e-ß-ea - |_ g-/3-£4 Z ri4 Q-ß-Ei e -ß-Ei ~N Q-ß-EQ _ \rQ-ß-E2 - \-e-ß-ea - |_ g-/3-£4 Z (2.93) (2.94) (2.95) (2.96) (2.97) Dospěli jsme k důležitému vztahu, který platí nejen pro isomerní stavy fruktózy, ale jakékoli stavy, které se liší energií. Zcela obecně můžeme výsledek našeho odvození zapsat Ti' e ^ = —— neboli ]n(ni) =]n(N) - P-ei-]n(z). (2.98) Otázku, jak závisí počty molekul v jednotlivých stavech na jejich energii, poprvé zodpověděl Ludwig Boltzmann, který roku 1868 dospěl k závislosti popsané vztahem 2.98. Této závislosti se proto říká Boltzmannův distribuční zákon (popisuje rozdělení neboli distribuci počtů molekul podle jejich energií). Jediné, co nám dosud chybí k výpočtu konkrétních počtů molekul v našich isomerních stavech podle vztahu 2.98, je dosud neurčená hodnota parametru j3. Na první pohled můžeme k výpočtu posledního neznámého parametru j3 využít rovnici 2.90. Po dosazení za uq, n\, ri2, n^, a vydělení obou stran rovnice celkovým počtem molekul získáme výraz pro střední hodnotu energie e=-. (2.99) Praktickým problémem ale je, odkud získat nezávislý výraz pro hodnotu střední energie ě. K tomu nám pomohou úvahy o něčem, co na první pohled nemá s isomerními stavy nic společného. Úvahy o tepelných strojích. Kapitola 3 Práce It is important to realize that in physics today, we have no knowledge what energy is. Richard P. Feynman Matematika: Integrál určitý a neurčitý, diferenciál, derivace jako limita, směrnice tečny, derivace při hledání extrémů, derivace mocninné funkce. 3.1 Vnitřní energie aneb virtuální realita v chemii Naše další úvahy o energiích molekul nebudeme omezovat na rozdíly mezi isomerními stavy, ale vezmeme do úvahy i energii spojenou s pohyby, deformacemi a jinými změnami molekuly, kterou jsme zmínili na začátku části 2.1. To ovšem nároky na fyzikálně správný popis souborů molekul dramatický zvýší. Na první pohled by se nám mohlo dokonce zdát, že snaha spočítat změny celkové energie obrovských množství molekul, se kterými v chemii pracujeme, je naprosto beznadějná. Takový pesimismus ale není na místě. Je možná získat velmi dobré odhady změny energie, pokud použijeme pár zjednodušujících úvah. Nejdříve se musíme domluvit, co považujeme za „celkovou energii molekul". Pokud zvedneme kádinku s jedním litrem roztoku hroznového cukru o jeden metr, vykonáme práci přibližně 10 J. Energie kádinky s roztokem bude o 10 J vyšší. Dá rozum, že v chemii nám o tento druh energie nejde. Nás zajímají jiné změny energií, související s tím, co se děje s molekulami, ať už kádinka stojí na zemi nebo na skříni. Takové energii říkáme vnitřní energie a budeme ji značit U. Dále budeme potřebovat konkrétní představu o souboru molekul, jejichž energie počítáme. Obsah kádinky s roztokem hroznového cukru si můžeme v mysli rozdělit na malé kousky obsahující vždycky jednu molekulu fruktózy a větší počet molekul vody. My ale nebudeme počítat energie těchto skutečných „kousků roztoku", které se od sebe vždy trochu liší. Místo toho se ponoříme do virtuální reality a představíme si, že se náš roztok skládá z velkého počtu kopií kouzelných skříněk s neviditelnými stěnami a v těchto skříňkách sedí molekuly fruktózy obklopené vodou. V každé skříňce by mohla být uzamčena jedna molekula. Fyzikálně správnější postup je zavřít do kouzelné skříňky mnoho molekul a vyrobit obrovské množství kopií takových skříněk. Počet kopií můžeme v případě potřeby zvyšovat až do nekonečna, což nám v naší virtuální realitě usnadní některé výpočty a úvahy. Nic nám například nebrání v tom, aby se počty skříněk libovolně přiblížily nekonečnu a ln(n!) se rovnal n • ln(n) — n přesně. Velký počet molekul v jedné skříňce nám zase umožní zacházet se skříňkami jako s makroskopickými objekty, zatímco jednotlivé molekuly bychom měli správně popisovat pomocí kvantové mechaniky. Tím se například vyhneme problému nerozlišitelných částic. Kouzelné skříňky přitom budou mít takové vlastnosti, aby se jejich soubor choval stejně, jako roztok hroznového cukru. Bude to, jako bychom hráli 27 28 KAPITOLA 3. PRÁCE počítačovou hru, ale naprogramovanou podle skutečných fyzikálních zákonů. Každá z našich virtuálních kouzelných skříněk má nějakou vnitřní energii. O kolik se změní celková vnitřní energie, když ovlivníme energie jednotlivých skříněk? Je změna celkové vnitřní energie prostě součtem změn vnitřních energií jednotlivých skříněk? Někdy ano, někdy ne. Záleží na tom, jak silně na sebe sousední skříňky působí. V plynném stavu se molekuly jen málokdy dostanou k sobě tak blízko, aby na sebe působily velkou silou. V roztoku jsou molekuly neustále v kontaktu s okolními molekulami. Molekuly vody na molekulu fruktózy působí silami tak velkými, že to energii fruktózy výrazně ovlivní. Tyto síly ale ovlivní energii všech kouzelných skříněk podobně a nemusí mít velký vliv na změnu celkové vnitřní energie po vnějším zásahu. Na čem tedy přesně záleží? Představme si, že molekuly /3-D-fruktopyranosy ve dvou sousedních kouzelných skříňkách jsou si tak blízko, že na sebe působí velkou silou. My vynaložíme na každou molekulu práci W, abychom z ní udělali /3-D-fruktofuranosu. Tím změníme energii molekul v každé skříňce o nějakou hodnotu. Označme si změnu energie skříňky vlevo A£l a skříňky vpravo AEp.1 Kromě toho se ale také změní síly, kterými na sebe molekuly fruktózy působí, protože teď jde o jiné molekuly (místo /3-D-fruktopyranos máme /3-D-fruktofuranosy). Síly mezi molekulami /3-D-fruktopyranos, které byly ve skříňkách před vnějším zásahem, by byly schopné vykonat jinou práci, než síly mezi molekulami /3-D-fruktofuranos, které máme ve skříňkách po zásahu. Tento rozdíl ve schopnosti vykonat práci také představuje rozdíl energie (označme si jej A4,p), o který se změní celková vnitřní energie. Jakou celkovou změnu vnitřní energie naše vynaložená práce způsobila? Pro dvě kouzelné skříňky je to A£l + A£p + A£l,p- Vidíme, že v tomto případě není změna celkové vnitřní energie součtem změn vnitřních energií jednotlivých kouzelných skříněk. Kdybychom ale stejným způsobem vynaložili práci na změny isomerních stavů molekul fruktózy, které jsou od sebe tak daleko, že na sebe působí jenom zanedbatelnými silami, tak můžeme zanedbat rozdíl energie A£lp způsobený změnou vzájemných sil mezi molekulami různých isomerních stavů. V tomto případě je změna celkové vnitřní energie součtem změn vnitřních energií jednotlivých kouzelných skříněk AE-^ + AEp. A právě pro takové případy, kdy vnější práce mění jen maličko síly mezi sousedními kouzelnými skříňkami, budeme změny vnitřní energie počítat. Nebylo by pro nás nejlepší, kdyby vnější změny neměly vůbec žádný vliv na síly mezi sousedními kouzelnými skříňkami? Kupodivu ne. Proč, to nám ukáže úvaha o tepelné rovnováze. 3.2 Práce a teplo Zatím jsme předpokládali, že všechna naše vynaložená práce se využije na zvýšení vnitřní energie. To by ale platilo jen tehdy, kdyby byl obsah naší kádinky dokonale izolován od okolí. Ve virtuální realitě lze něco takového snadno naprogramovat. Ve skutečném světě se ale část vynaložené práce přemění na teplo. A také naopak, při zahřátí kádinky část tepla zvýší vnitřní energii a část vykoná práci. Anebo ještě jinak, slovy první věty termodynamiky: zvýšení vnitřní energie AU se rovná součtu dodaného tepla Q a práce W AU = Q + W. (3.1) Chceme, aby naše virtuální realita popisovala, co se děje se skutečnými molekulami. Proto bude užitečné, když ji naprogramujeme tak, aby si roztok hroznového cukru mohl vyměňovat s okolím teplo. Přesněji řečeno tak, aby výměna tepla byl jediný způsob, jakým na sebe sousední kouzelné skříňky působí. Pojem teplota dobře známe z běžného života. Když si chceme v létě ochladit unavené nohy, ponoříme je do vody, která je studená. Když si chceme naopak v zimě po běžkách promrzlé nohy zahřát, strčíme je do vody, která je teplá. Vlastnost, která popisuje, jestli je něco teplé nebo studené, se jmenuje teplota. 1Pro náš konkrétní příklad změny /3-D-fruktopyranosy na /3-D-fruktofuranosu se bude A£l i A£p rovnat hodnotě, kterou jsme si označili e±. 3.3. TEPELNÉ STROJE 29 Teplota je nejen obecná vlastnost, ale přímo fyzikální veličina. Je to ale veličina mnohem tajemnější, než třeba délka. Když ve starých dobách chtěli lidé nějakým číslem popsat vzdálenost, mohli ji jednoduše porovnat s nějakým tělesným rozměrem. Říkalo se, že most je dlouhý šedesát stop nebo šedesát loktů. To si každý dokázal představit, protože chodidla i předloktí různých dospělých lidí jsou přibližně stejně dlouhá (asi 30cm). Teplotu věcí kolem nás sice můžeme také porovnávat s naší tělesnou teplotou (podle toho jim říkáme studené a teplé), co ale znamená, že teplota je dvakrát větší? Můžeme mít dojem, že možná dříve bylo těžké určit, kolikrát je teplota jednoho tělesa větší než teplota druhého, ale dnes to není žádný problém. Máme přece teploměry. Říkají nám ale naše teploměry, kolikrát je například větší naše tělesná teplota než teplota vzduchu kolem nás? Řekněme, si strčíme lékařský teploměr pod paží a naměříme teplotu 36 °C. Pak se podíváme za okno na venkovní teploměr, který ukazuje 9 °C. Jednoduchý výpočet nám říká, že 36 : 9 = 4. Znamená to, že naše teplota je čtyřikrát větší, než teplota venku? Představme si, že bychom použili americké teploměry, které neukazují stupně Celsia, ale stupně Fahrenheita. Pak bychom pod paží naměřili 97 °F a za oknem 48,5 °F. Teď to zase vypadá, že naše teplota je dvakrát větší, než teplota venku, protože 97 : 48,5 = 2. Zjistili jsme hroznou věc: ani moderní teploměry nám neříkají, kolikrát je jedna teplota větší, než druhá. Přesně umíme říci jenom to, jestli jsou dvě teploty stejné, nebo různé. A s tím si budeme muset na chvíli vystačit. Cestu ke stavu, ve kterém mají dva předměty stejnou teplotu, ukazuje nultá věty termodynamiky: pokud dva předměty ponecháme dostatečnou (v naší virtuální realitě nekonečnou) dobu v kontaktu, budou mít stejnou teplotu. V tomto případě víme, že teplo nemá důvod přecházet z jednoho předmětu na druhý. Tomuto zvláštnímu případu říkáme tepelná rovnováha. A právě pro tento případ budeme počítat vnitřní energie virtuálních kouzelných skříněk. V našich výpočtech budeme předpokládat, že různé kouzelné skříňky jsou pořád v tepelné rovnováze, mají stále stejnou teplotu. Proto potřebujeme, aby se vzájemně ovlivňovaly, přesněji řečeno, aby si byly schopny vzájemně vyměňovat teplo. Když se v jedné skříňce na okamžik teplota nepatrně zvýší, tato skříňka ihned předá trochu tepla okolním skříňkám. To by mělo samozřejmě způsobit zvýšení teploty v okolí. V naší virtuální realitě ale umíme zahřátí okolí zabránit. Jak je to možné? Představme si, že naše kouzelné skříňky mají tvar krychle. Každá krychle se dotýká každou svou stěnou šesti dalších krychlí, kterým předá teplo. Do každé sousední krychle tak přejde jen šestina tepla uvolněného z prostřední krychle. Ale i okolní krychle jsou obklopeny dalšími krychlemi, kterým mohou předat nadbytečné teplo. Takto se teplo rozšíří do všech krychlí, které popisují náš virtuální roztok. Protože naše výpočty chceme provádět pro obrovská množství kouzelných skříněk, každá z nich se ohřeje jen zcela zanedbatelně. Okolní skříňky tak slouží jako tepelná lázeň. 3.3 Tepelné stroje V kapitole 3.2 jsme si řekli, že práce, kterou konáme, když na molekuly působíme silou, se může částečně přeměnit na teplo. Platí to ale i naopak. Molekuly, kterým dodáme zahřátím teplo, pro nás mohou nějakou práci vykonat. Molekuly, nebo lépe kouzelné skříňky s molekulami, se tedy mohou chovat jako tepelné stroje. Zdá se, že jsme se od chemické rovnováhy dostali hodně daleko, někam k turbínám a parním strojům. Tato odbočka nám ale umožní pochopit, co se vlastně skrývá za tajemnou veličinou, které říkáme teplota a kterou vlastně ani teploměrem neumíme pořádně změřit. A právě teplota bude nakonec tím posledním dílkem, který nám umožní složit hlavolam chemické rovnováhy. Jakým způsobem můžeme zkoumat kouzelnou skříňku chovající se jako tepelný stroj? Představme si, že skříňka má tvar hranolu, jehož jedna stěna může volně klouzat jako píst (obrázek 3.1A). Dva rozměry skříňky jsou tedy pevně dané, třetí se mění s polohou pístu. Dovnitř skříňky nevidíme, ale víme, že molekuly občas narazí na pohyblivou stěnu. Ačkoli náplní tepelných strojů mohou být plyny i kapaliny, pro jednoduchost budeme předpokládat, že naše kouzelná skříňka je naplněna plynem. Dále budeme předpokládat, že pohyblivá stěna v naší virtuální realitě klouže opravdu volně, bez tření, a při nárazu molekuly se nijak nezmění (nedeformuje, neohřívá). V tomto případě by náraz první molekuly měl stěnu uvést do rovnoměrného přímočarého pohybu (předat jí nějakou hybnost) a náraz každé další 30 KAPITOLA 3. PRÁCE molekuly by měl pohyb stěny více urychlit. Abychom zabránili nekontrolovanému zrychlování pístu, budeme na něj z druhé strany, zvenčí, působit nějakou vnější silou Fex. Pokud bude tato síla působit kolmo na píst, můžeme velikost síly _Fex vydělit plochou pístu a a získáme vnější tlak Pex, kterým na píst působíme my. Tento tlak se bude nejspíš lišit od tlaku molekul P ve skříňce, který neznáme. Nejjednodušší by bylo, kdybychom na píst působili konstantním tlakem, který by se neměnil, ať už by se uvnitř skříňky dělo cokoli. Toho lze dosáhnout například tak, že na píst budeme působit konstantní silou nějakého závaží. Nebo můžeme umístit celou skříňku do větší nádoby, ve které udržujeme stálý tlak, který působí zvnějšku na píst. Co se bude přitom dít? Pokud bude tlak P uvnitř skříňky větší, než náš vnější tlak Pex, budou molekuly posouvat píst ven ze skříňky. Tím ale poroste objem skříňky V. Až budeme v části 4.1 hledat, co se pod pojmem tlak plynu vlastně skrývá, zjistíme, že tlak P je nepřímo úměrný objemu V (rovnice 4.7). Proto se bude se zvětšováním objemu tlak uvnitř skříňky snižovat, dokud neklesne na hodnotu Pex. V tomto okamžiku dosáhneme mechanické rovnováhy, tlaky se vyrovnají a píst nebude mít důvod pohybovat se ani na jednu, ani na druhou stranu. Než se ale tlaky vyrovnaly, vytlačily molekuly ve skříňce píst o nějakou hodnotu Ax. Jde o proces nevratný, píst se při něm pohybuje jen jedním směrem, směrem k ustanovení mechanické rovnováhy. Protože jsme na píst působili konstantní silou _Fex proti směru jeho pohybu, vykonal pro nás stroj práci W = -FexAx. (3.2) Pravou stranu této rovnice můžeme rozšířit hodnotou plochy pístu a, tedy hodnotou a vynásobit dráhu Ax a vydělit sílu _Fex. Dostaneme tak stejnou práci vyjádřenou pomocí vnějšího tlaku Pex a změny objemu skříňky AV: W = -—Ax-cr = -PexAV. (3.3) 3.4 Vratné děje a malé změny Všimněme si, že vykonaná práce je určena vnějším tlakem Pex, rovnice 3.3 nám nic neříká o tlaku molekul v kouzelné skříňce. Když bychom například skříňku během vyrovnávání tlaku postupně zahřívali a chladili, měnil by se tlak P jinak, než v původním pokuse. Pokud bychom ale zahřívání a chlazení prováděli šikovně tak, aby píst nakonec doputoval do stejného místa, byla by vykonaná práce stejná. Z hodnoty — PexAV bychom se tak vůbec nedozvěděli, že se s naší kouzelnou skříňkou dělo něco jiného. Protože nastavovat a měřit můžeme pouze vnější tlak Pex, existuje jen jediná možnost, jak sledovat tlak P během experimentu. Udržovat kouzelnou skříňku v mechanické rovnováze během celého pokusu, již od samého začátku. Tedy měnit vnější tlak Pex průběžně tak, aby se rovnal tlaku uvnitř skříňky P. Pak bude v každém okamžiku platit Pex = P, takže měřením vnějšího tlaku Pex budeme automaticky sledovat průběh tlaku molekul ve skříňce P. Protože budou během celého pokusu tlaky na obou stranách pístu stejné, půjde o proces vratný. Nepatrné zvýšení tlaku na jedné či druhé straně pístu posune píst jedním či druhým směrem. Mechanická rovnováha ale nestačí. Vnitřní energii mění nejen dodaná či vykonaná práce, ale i výměna tepla. Přenos tepla má přitom jasný směr. Těleso s vyšší teplotou vždy předává teplo tělesu s nižší teplotou. Měla by nás tedy zajímat i teplota uvnitř kouzelné skříňky. Narážíme tu ale na stejný problém, jako v případě tlaku. Měřit můžeme pouze vnější teplotu, k teplotě uvnitř kouzelné skříňky přístup nemáme. Také řešení tohoto problému je stejné, jak jsme si ukázali v případě tlaku. Musíme kouzelnou skříňku udržovat také v tepelné rovnováze. Měnit vnější teplotu průběžně tak, aby se vždy rovnala teplotě molekul uvnitř kouzelné skříňky. Opět tak půjde o vratný děj. Nepatrné zvýšení teploty uvnitř nebo vně kouzelné skříňky způsobí maličký přenos tepla jedním či druhým směrem. Vysvětlili jsme si, proč se ke zkoumání vlastností molekul hodí vratné tepelné stroje. Zároveň si ale musíme přiznat nevýhody takových strojů. Udržování mechanické a tepelné rovnováhy vyžaduje, aby 3.5. PRÁCE JAKO INTEGRÁL 31 Obrázek 3.1: Integrování ve výpočtu práce. Kouzelná skříňka s pístem (A), práce jako obsah obdélníku — Fex ■ Ax (B), práce jako obsah obdélníku — Pex ■ AV (C), práce jako součet (integrál) obdélníčků — Pex ■ dV (D), práce jako součet (integrál) obdélníčků dui = — Pex ■ dV, stejně velkých, jako v panelu D, ale jinak orientovaných (E). Detaily jsou popsány v textu. se všechny změny děly velmi pomalu a teplota a tlak měly vždy dost času se vyrovnat. Takový stroj by nebyl moc užitečný prakticky, ale nás dovede k rozluštění tajemství teploty. 3.5 Práce jako integrál Neustálé vyrovnávání vnějšího tlaku vratného tepelného stroje také přináší jeden výpočetní problém. Vykonanou práci už nemůžeme spočítat jednoduše jako vynásobení konstantního tlaku (nebo konstantní síly) změnou objemu (nebo nebo dráhou, kterou píst urazí). Tlak a síla se nám mění takřka pod rukama, takže výpočet práce je mnohem složitější. Pro nás je tato složitost výtečnou příležitostí procvičit si oblast matematiky zvanou intfinitezimálni počet. Práci, kterou vykoná píst kouzelné skříňky, na který tlačíme konstantní silou, si můžeme znázornit graficky Rovnice, popisující tuto práci jako W = -FexAx = -PexAV, (3.4) nám říká, že velikost W se rovná ploše obdélníku, jehož strany jsou Fex a Ax (obrázek 3.1B) nebo Pex a AV (obrázek 3.1C). Pokud si tedy do grafu vyneseme Fex jako funkci proměnné x, nebo Pex jako 32 KAPITOLA 3. PRÁCE funkci proměnné V, je velikost práce rovná (obdélníkové) ploše pod grafem funkce Fex nebo Pex mezi body danými počáteční a konečnou polohou pístu x, nebo počátečním a konečným objemem kouzelné skříňky V. Totéž platí v případě vratného stroje, kdy sílu Fex neboli tlak Pex během pokusu průběžně měníme, abychom stále udržovali mechanickou rovnováhu. Jediným rozdílem je, že grafy funkcí Fex a Pex již nejsou vodorovné (polo)přímky, ale nějaké křivky (obrázek 3.1C). Graficky si takovou plochu dokážeme jistě snadno představit, jak ji ale spočítat? Můžeme vyjít z představy, jak bychom mohli sílu nebo tlak upravovat. Předpokládejme, že na začátku je poloha pístu x\ a objem skříňky V\. Vnější tlak nastavíme na hodnotu Pex,i tak, aby Pex,i = f. V tuto chvíli je vše v pořádku. Poté, co se píst posune o maličký úsek Ax do polohy x2 a objem vzroste o maličký přírůstek A V = uAx na hodnotu V2, ale tlak ve skříňce poklesne a my musíme Pex maličko upravit na hodnotu Pex,2- Mechanická rovnováha se nám na chviličku obnoví, ale po dalším posunutí pístu o Ax musíme tlak upravit znovu, tentokrát na hodnotu Pex,3- čemu se rovná vykonaná práce? Mezi polohami pístu x\ a x2 byl vnější tlak Pex konstantní, rovný Pex,i- Práce vykonanou s tímto nastavením tlaku vypočítat umíme, bude rovná Awi = —PexiAV~. Tento výpočet se od rovnice 3.4 liší jen tím, že A V" je tentokrát jen nepatrná změna objemu, zatímco v rovnici 3.4 šlo o celkovou změnu objemu, která mohla být hodně velká. Vypočtená práce je ale jen malým příspěvkem k celkové práci vykonané během našeho pokusu, příspěvkem za kratičkou chvilku, kdy udržujeme vnější tlak na hodnotě Pex,i- Proto jsme si tento příspěvek k celkové práci označili jako Awi. Podobně spočítáme práci při tlaku nastaveném na Pex,2 jako Aw2 = —Pex2AV a tak dále, až do poslední změny objemu s tlakem nastaveným na Pex,n- Celkovou energii získáme tak, že jednoduše sečteme W = AWl + Aw2 + Aw3 + ■■■ + Awn = -(PeXjlAV + Pex,2AV" + Pex,3AV + • • • + Pex,„AV), (3.5) což graficky odpovídá ploše pod lomenou čárou připomínající schodiště (obrázek 3.ID). Tento výsledek ale neodpovídá úplně přesně průběhu tlaku P uvnitř kouzelné skříňky. Během doby, kdy byl Pex nastaven na určitou hodnotu, se tlak P přece jen maličko změnil. K dokonalé mechanické rovnováze se přiblížíme tím lépe, čím budou změny Ax a A V" mezi přenastavením tlaku menší. Změnu objemu blížící se nule můžeme matematicky zapsat pomocí limity dV = lim AV, (3.6) kde jsme nekonečně malý rozdíl označili písmenkem d, jak je v matematice zvykem. Takovýto nekonečně malý rozdíl se nazývá diferenciál. Dříve než budeme přemýšlet, jestli něco takového lze spočítat, zamyslíme se nad tím, jak vůbec takový nekonečný součet napsat. Součty neboli sumy řady nespojitých (diskrétních) hodnot je zvykem zapisovat pomocí řeckého písmene sigma s vyznačením prvního a posledního členu řady, které sčítáme. Například součet příspěvků k práci při postupném snižování vnějšího tlaku můžeme stručně zapsat n n w = j2 Aw(0 = -J2 p^AV- (3-7) i=l i=l Německý matematik Gottfried Wilhelm Leibniz vymyslel roku 1675 zápis, ve kterém součet nekonečně malých a tedy vlastně spojitě se měnících hodnot označil písmenkem S (tímto písmenkem začíná nejen české slovo součet, ale i latinské summa). Protože sčítáme velmi maličké hodnoty, píšeme také písmenko S hodně hubené,2 takto: J. Naše nekonečné součty nekonečně maličkých hodnot se zapisují 2Leibniz použil středověký znak, kterým se odlišovalo „s" na začátku nebo uprostřed slova od koncového „s". 3.5. PRÁCE JAKO INTEGRÁL 33 w W = j áw o (3.8) v„ W = -JpexdV (3.9) Vi a říká se jim integrály. Hodnoty proměnné, od které po kterou chceme plochu pod grafem sečíst, zapisujeme pod a nad znak integrálu a říkáme jim meze. Nekonečným zmenšením přírůstků objemu dl/ mezi úpravami vnějšího tlaku dosáhneme toho, že Pex = P během celého pokusu. Rovnici 3.9 tedy můžeme přepsat W = -J PdV. (3.10) Vi K tomu, abychom tento integrál, plochu pod grafem funkce P (V), spočítali, nám pomůže úvaha nad rovnici 3.8. Rovnice 3.8 nám říká, že sčítáme malé plošky dw. Každá z těchto plošek je jiná, závisí na tom, jaký je v daném okamžiku tlak P. Tento okamžik popisujeme objemem V, který právě v tu chvíli kouzelná skříňka má. Proto zapisujeme tlak jako funkci objemu P(V). V rovnici 3.8 to můžeme zdůraznit zápisem w (3.11) o My vime, že každá plocha má obsah dw(V) = PdV. Stejné číslo ale dostaneme, když vynásobíme výsledný obsah jedničkou dw(V) = 1 • dw(V). Takový zápis sice vypadá legračně, ale pomůže našim grafickým úvahám. Graficky si plošky dw(V) můžeme poskládat „nastojato", tak že jejich šířka bude stále stejná, rovná jedné (obrázek 3.1E). Výška se pak bude rovnat hodnotě dw(V). Plošky si ale můžeme také poskládat „naležato". V tom případě bude jejich výška byla vždy stejná, rovná jedné. Měnit se bude šířka, která bude rovná dw(V). Šířka jedné plošky bude vlastně rovná změně jakési funkce w(V) při maličké změně objemu V. Graf „naležato" poskládaných plošek bude obdélník, což je tvar, jehož plochu dokážeme snadno spočítat, pokud známe délky stran. Délka jedné strany (výšky) je rovná jedné. Délka druhé strany (šířky) je rozdíl mezi hodnotou funkce w(V) na začátku pokusu, což je nula, a na konci pokusu, což je hodnota w(Vn) pro poslední hodnotu objemu Vn. Vidíme, že pro výpočet celkové plochy, tedy vykonané práce, stačí znát hodnotu funkce w(V) pro V\ a Vn: w(Vn) J dw{V) = l-{w{Vn)-w{V1)) = w{Vn)-w{V1). (3.12) ™(Vi) Naše grafické úvahy nás dovedly k jakési funkci w. Jak tato funkce souvisí s funkcí tlaku P(V)1 To nám napoví srovnání rovnic 3.8 a 3.10. Protože se rovnají levé strany rovnic, musejí se rovnat i integrály na pravých stranách. To si můžeme zapsat 34 KAPITOLA 3. PRÁCE j dw(V) = - J P (V) dV, (3.13) to(Vi) Vi kde jsme si zdůraznili, že P a w jsou funkce objemu a že meze, mezi kterými sčítáme dw, jsou hodnotami funkce w pro objemy V± a Vn. Pokud jde o průběhy funkcí P a w, tak nás meze příliš nezajímají. Důležitější je srovnání funkcí, které integrujeme dw(V) = -P(V) dV. (3.14) Když vydělíme obě strany přírůstkem objemu dV, získáme funkci tlaku vyjádřenou pomocí změny hodnoty funkce w za maličkou změnu tlaku dV P(V) = (3.15) Výraz na pravé straně rovnice je derivace funkce w podle objemu V. Uvědomme si, že jsme nezískali to, co jsme chtěli. Pro výpočet integrálu bychom potřebovali vědět, jak vyjádřit funkci w pomocí tlaku. Místo toho, jsme se dozvěděli, jak vyjádřit tlak pomocí funkce w. A to je celá bída počítání integrálů. Neexistuje obecný předpis pro to, jak spočítat plochu pod libovolnou funkcí. Umíme spočítat pouze plochy pod funkcemi, které jsou derivacemi již známých funkcí. Základem úspěchu počítání integrálů je proto znalost výsledků počítání derivací co nejvíce různých funkcí. Když máme štěstí, tak mezi výsledky najdeme funkci, jejíž integrál chceme spočítat. 3.6 Derivace jako směrnice tečny ke grafu Pro počítání integrálů by nám vlastně stačila tabulka návodů, jak spočítat derivace všech běžných matematických funkcí. Takové tabulky snadno najdeme v učebnicích či na internetu. Důležitost derivací si ale zaslouží, abychom jim rozuměli a chápali, z čeho vztahy v tabulkách návodů vychází. Proto se na derivace podíváme trochu detailněji. Význam derivace si můžeme ukázat na velmi jednoduchém příkladu rychlosti pístu naší kouzelné skříňky. U pístu můžeme předpokládat přímočarý pohyb ve směru, který jsme si označili x. Pokud se pohybuje píst pohybem rovnoměrným, je výpočet rychlosti v jednoduchý: Ax (3-16) kde Ax je změna polohy pístu na jeho dráze za časový úsek Ar. Pokud se píst pohybuje sice přímočaře, ale nerovnoměrně (chvilku rychleji, chvilku pomaleji), můžeme Ax/At také spočítat, ale číslo bude mít trochu jiný význam, bude to průměrná rychlost za časové období Ar. Jak bychom mohli spočítat okamžitou rychlost v čase ŕ? Mohli bychom začít tím, že spočítáme průměrnou rychlost mezi časem t a t + Ať. Ax průměrná \^/ ' \o.Lt) Pak můžeme začít zkracovat dobu Ar. Čím bude Ar kratší, tím bude průměrná rychlost bližší okamžité rychlosti v čase t. Kdybychom Ar zkrátili až k nule, měli bychom získat okamžitou rychlost. Nulou sice dělit nesmíme, ale matematika nám nezakazuje mluvit o limitě, jak jsme to udělali, když jsme si potřebovali popsat číslo e. Tentokrát budeme psát / \ dx ^okamžitá = v = lim — = —. (3.18) At^o \ Ar / dí 3.6. DERIVACE JAKO SMĚRNICE TEČNY KE GRAFU Tato limita není nic jiného, než derivace. 35 Obrázek 3.2: Graf závislosti x na i pro rovnoměrně přímočarý pohyb. Hodnota sq nám udává počáteční polohu pístu. Zkusme si nakreslit graf závislosti x na í (obr. 3.2). V případě rovnoměrného přímočarého pohybu to bude přímka. Jaký vztah ke grafu má poměr Ax/At? Ten nám říká, jaký má přímka sklon: o kolik se změní x (tuto změnu jsme si označili Ax), když se čas změní o Aí. V matematice se takovému číslu popisujícímu sklon přímky říká směrnice. Všimněte si, že poměr Ax/At je pořád stejný, ať už vezmeme kratší či delší Aí. To bude platit i tehdy, když budeme Aí zkracovat k nule. Jinými slovy, pro rovnoměrný přímočarý pohyb platí Ax Aí dx ďí' (3.19) takže i dx/dt popisuje sklon přímky. Obrázek 3.3: Graf závislosti x na i pro nerovnoměrně přímočarý pohyb (zeleně). Červené a modré úsečky ukazují sklony tečen pro různé hodnoty i. Červená barva je použita, kde je funkce konkávni (pod tečnou), modrá barva je použita, kde je funkce konvexní (nad tečnou). A teď se podívejme na graf závislosti i na í pro případ nerovnoměrného přímočarého pohybu (obrázek 3.3). Grafem je křivka, která chvilku roste rychleji a chvilku pomaleji. V tomto grafu nám dx/dt popisuje sklon tečny ke grafu narýsované pro daný čas í. Také vidíme, že se tento sklon mění s měnícím se časem. To znamená, že derivace v = dx/dt závisí na čase, neboli je funkcí času. 36 KAPITOLA 3. PRÁCE Se směrnicí souvisí také jedno velmi užitečné použití derivací: popis tvaru grafu funkce. Kladná směrnice znamená že funkce roste (například bod 5 na obrázku 3.3), záporná směrnice, že funkce klesá (například bod 2 na obrázku 3.3). Všimněme si také, že když divoká závislost i na í pro případ nerovnoměrného přímočarého pohybu prochází vrcholem (matematicky přesně ostrým lokálním maximem body 1 a 7 na obrázku 3.3) nebo údolím (ostrým lokálním minimem body 4 a 9 na obrázku 3.3), je tečna vodorovná. Směrnice vodorovné tečny je nula. Pokud se tedy na derivaci v = dx/dt díváme jako na funkci času, vidíme, že pro ostré lokální maximum a minimum funkce x prochází funkce v nulou. Liší se nějak průběh v pro lokální maximum a minimum? Ano. Když prochází x lokálním maximem, v klesá, a když prochází x lokálním minimem, v stoupá. Jak vidíme, mezi ostrým lokálním maximem a minimem rozlišuje směrnice funkce v, tedy okamžité zrychlení a = dv/dt. Vzhledem k x je a druhou derivací. Pokud je zrychlení kladné, směrnice tečny k funkci x roste (nebo, pokud x klesá, směrnice je čím dál méně zápornější). Pro takové zrychlení je tečna vždy pod grafem a graf funkce x je konvexní (vyboulený nahoru). Pokud je naopak zrychlení záporné, směrnice tečny k funkci x se snižuje (nebo, pokud x klesá, směrnice je čím dál zápornější). Pro takové zrychlení je tečna vždy nad grafem a graf funkce x je konkávni (vyboulený dolu). Děje se něco zajímavého v místě, kde prochází nulou druhá derivace? Děje. Pro tuto hodnotu protne tečna graf funkce x, funkce x se změní z konkávni na konvexní (body 2 a 8 na obrázku 3.3) nebo naopak (bod 6 na obrázku 3.3). Takovému místu na grafu funkce se říká inflexní bod. Ale pozor, nulová první derivace nemusí vždy znamenat maximum nebo minimum, ani nulová druhá derivace neznamená vždy inflexní bod, jak si ukážeme později. Obecně lze říci, že určování lokálních maxim a minim na základě nulové první derivace a určování infiexních bodů na základě nulové druhé derivace selhávají, pokud se i vyšší derivace rovnají nule. dv d í dx\ d2x Z matematického pohledu se v našich úvahách vyskytly dvě funkce času: x a v. Otázka nejen zajímavá z pohledu matematiky, ale také užitečná z pohledu fyziky, je: Pokud umím matematicky zapsat závislost x na čase, existuje nějaké matematické pravidlo, které mi okamžitě řekne, jak bude na čase záviset funkce v, která je derivací funkce x? Odpověď je ano, alespoň pro „rozumné" funkce x. Ukážeme si to na několika příkladech. 3.7 Derivace polynomiálních funkcí Jako první příklad funkce, kterou lze snadno derivovat, nám poslouží funkce tvořená polynomem neboli mnohočlenem proměnné í: f(t) = c0 + cií + c2t2 + ■■■ + cntn. (3.21) Nejprve si uvědomíme, že derivaci celého mnohočlenu získáme jednoduše sečtením derivací jednotlivých členů: df v c0 + ci(ŕ + Aŕ) + c2(í + Aí)2 + • • • + cn(t + At)n - (c0 + cií1 + c2í2 + • • • + cntn) — = lim------ = dí At^o Aí c0-co , ci(í + Aí-í) c2((í + Aí)2-í2) c»((í + Aí)"-í") lim —---h lim----h lim —----- + • • • + lim---. At^o Aí At^o Aí At^o Aí At^o Aí (3.22) Odvodíme si postup počítání derivace pro jakýkoli řád mnohočlenu n 3.8. EXPANZE DO VAKUA 37 dc^ = ^((t + Atr-Q 3 dŕ At^o Aŕ v ; Vytknutím tn před závorku získáme v čitateli výraz , AA , , AA , Aí , , . • i , Aí /o^^ 1 H--I • • • n-krat • • • 1 H--I — 1 = n--h výrazy s vyššími mocninami zlomku —, (3.24) který jsme spočítali již dříve v rovnici 2.33. Když výsledek vynásobíme zpět ŕ™, dospějeme k obecnému předpisu %^=lim^-. (3.25) dŕ At^o Aŕ v ; Když si shrneme všechny vztahy které jsme odvodili, získáme předpis pro výpočet derivace jakékoli polynomiální funkce df d (cp + Cit + c2r2 + ■ ■ ■ + cntn) _ dc0 | d(cir) , d(c2r2) | , d(c»r") _ j dŕ ~ dŕ ~dŕ + dŕ + dŕ +"'+ dŕ -Cl+^2Í+-"+^„t . (3.26) Pozoruhodné na tomto předpisu je, že derivací ztrácíme informaci o konstantním členu cq, zatímco ostatní konstanty Ci až c„ derivování přežijí. Jinými slovy, existuje nekonečně mnoho funkcí w, které se liší konstantním členem a přitom mají stejnou derivaci. 3.8 Expanze do vakua Pojďme se podívat na derivace jednotlivých mocninných funkcí. Začněme derivací konstantního členu. Jako příklad nám může opět posloužit dráha, kterou urazí píst přímočarým pohybem. Pokud se x nemění (píst se nepohybuje), je jeho rychlost nulová. Totéž říká limita Ax dx — = — = 0. (3.27) Aŕ dŕ y ' Obrázek 3.4: Graf závislosti x na i pro píst v klidu. Hodnota xq nám udává počáteční polohu pístu. 38 KAPITOLA 3. PRÁCE Graf funkce x je vodorovná čára, její smernice je všude nula (obr. 3.4). Totéž popisuje limita prvního členu v rovnici 3.22: cq — cq v čitateli je vždy presné nula a nulou zůstane i po vydělení sebemenším At. V případě tepelného stroje nás více než pohyb pístu zajímá vykonaná práce. Proto budeme v našich dalších úvahách zkoumat funkci w, jejíž hodnoty nám udávají, kolik práce kouzelná skříňka vykoná (rovnice 3.12). Budeme přitom využívat zjištění, že vnější tlak se rovná — dw/dV a vnější síla je rovna -dw/dV. Gemu by se rovnala práce — W vykonaná kouzelnou skříňkou, kdyby byla funkce — w konstantní? Kdyby její hodnota pro jakýkoli objem byla rovna nějaké konstantě c0? Meze integrálu w(Vn) - J dw(V), (3.28) ™(Vi) kterými jsou hodnoty funkce — w pro počáteční objem V\ a konečný objem Vn, by byly pro oba objemy stejné, rovné cq. Integrál, popisující vykonanou práci, by byl roven nule -W = J dw(V) = - j dw(V) = -w(Vn) - (-w(Vi)) = c0 - c0 = 0. (3.29) w(Vi) c0 Pokud budeme vycházet ze situace, kdy v čase t = 0 kouzelná skříňka zatím žádnou práci nevykonala, bude v čase t = 0 hodnota funkce — w rovná nule. A nulovou zůstane, protože studujeme případ, kdy je w konstantní (obrázek 3.5). x (nebo V) Obrázek 3.5: Závislost funkce —w (zeleně) na poloze pístu x (nebo objemu V) při expanzi proti nulové síle (nulovému tlaku). Jaký průběh tlaku vnější síly _Fex nebo vnějšího tlaku Pexby odpovídal konstantní funkci — w? To umíme spočítat snadno „ dw den „ dw den F- = -ď^ = -ďf = 0< p« = -ď7 = -ď7 = a (3'30) Jak vidíme, konstantní w odpovídá expanzi do vakua, kdy kouzelnou skříňku neobklopují žádné molekuly ani na píst nepůsobíme žádnou silou, takže vnější tlak na píst je nulový. Všimněme si také, že stejný výsledek dostaneme pro jakoukoli hodnotu konstanty cq. 3.9. EXPANZE PROTI KONSTANTNÍMU TLAKU 39 3.9 Expanze proti konstantnímu tlaku V příkladech počítání derivací pokračujme lineární funkcí. Tento příklad jsme si už popsali na obrázku 3.2)pro rovnoměrný přímočarý pohyb pístu x = xq + vt, kde rychlost v = dx/dt je stejná pro jakýkoli čas t. Obecně pro lineární funkci /(ŕ) = c^l můžeme psát — = C1. (3.31) Pokud jde o kouzelnou skříňku, lineárně rostoucí vykonaná práce — w odpovídá příkladu se kterým jsme začínali, když na píst působil konstantní tlak Pex proti pohybu pístu: w(Vn) Vn Vn -W= j dw(V) = - j PexdV = Pex j dV = Pex{Vn-V1), (3.32) ™(Vi) Vi Ví protože = (3.33) a zároveň = (3.34) Graficky je průběh funkce — w i její první derivace znázorněn na obrázku 3.6. Funkce —w, představující vykonanou práci, s rostoucím x (nebo V) lineárně roste (zelená přímka), čemuž odpovídá konstantní kladná první derivace (konstantní opačná, tedy záporná vnější síla nebo tlak), znázorněná červeně. Takový graf je vlastně fyzikálně nesprávný, svislá osa by měla být pro první derivaci jiná, protože síla (nebo tlak) je jiná veličina, než práce, a měla by být uváděna v jiných jednotkách, které by měly být v grafu jasně vyznačeny. Naše ledabylé zobrazení má ale jednu výhodu, snadno se v něm porovnávají hodnoty naší funkce a jejich derivací pro stejné hodnoty x (nebo V). x (nebo V) Obrázek 3.6: Závislost funkce —w (zeleně) na poloze pístu x (nebo objemu V) při expanzi proti konstantní síle (konstantnímu tlaku). Průběh první derivace w (tedy síly Fex nebo tlaku Pex) je zakreslen červeně do stejného grafu. 40 KAPITOLA 3. PRÁCE 3.10 Expanze proti lineárně klesajícímu tlaku Představme si, že sílu působící proti pohybu píst snižujeme úměrně tomu, jak se posouvá poloha pístu (obrázek 3.7). V takovém případě zkoumaná funkce — w poroste čím dál pomaleji. V jisté poloze pístu, která je na obrázku 3.7 označena x0 a odpovídá určitému objemu Vq, síla klesne na nulu. Při této poloze dosáhne funkce — w maxima. Pokud bude změna síly Fex pokračovat, začne působit na píst v opačném směru. Nebude již působit proti expanzi molekul, naopak bude rozpínání molekul pomáhat tahem na píst ve směru expanze. Tomu bude odpovídat formálně záporný vnější tlak. Skříňka nebude dále žádnou práci konat, naopak my budeme vynakládat práci na další pohyb pístu, takže hodnota — w začne klesat. Pokud budeme pokračovat dostatečně dlouho, může celková dodaná práce převážit vykonanou což se projeví změnou znaménka funkce w (ze záporného na kladné). x (nebo V) Obrázek 3.7: Závislost funkce —w (zeleně) na poloze pístu x (nebo objemu V) při expanzi proti lineárně klesající síle (lineárně klesajícímu tlaku). Tečna ke grafu funkce —w pro polohu pístu xg je znázorněna oranžově. Průběhy první derivace —w (tedy síly Fex nebo tlaku Pex) a druhé derivace —w jsou zakresleny červeně a modře do stejného grafu. Pro polohu pístu xq by byla tečna ke grafu funkce — w vodorovná, což odpovídá nulové hodnotě první derivace — w podle x (vnější síly). Červený graf první derivace na obrázku 3.7 skutečně nulou prochází. Nulová první derivace může ovšem značit maximum i minimum. Ty by měla rozlišit druhá derivace, znázorněná na obrázku 3.7 modře. Záporná hodnota na obrázku opravdu odpovídá maximu. Průběh funkce — w může procházet maximem i minimem. To je znázorněno na obrázku 3.8, kde se vnější síla (a tlak) mění složitějším způsobem. Síla s rostoucím x klesá, při poloze pístu xq prochází nulou, chvíli působí ve směru pohybu pístu, v poloze pístu x\ prochází nulou podruhé a dále opět roste proti směru expanze. Tento průběh popisuje červený graf první derivace — w (vnější síly nebo tlaku) na obrázku 3.8, který protíná nulu pro xq aii. Přitom druhá derivace, znázorněná modře, je v poloze pístu Xq záporná a v poloze pístu x\ kladná. To odpovídá maximu — w pro x0 a minimu pro x\. Mezi polohami pístu xq a x\ —w klesá v souladu ze zápornou hodnotou první derivace. Uprostřed mezi xq a x\ se také nachází poloha pístu, pro kterou prochází druhá derivace nulou. V souladu s pravidlem o nulové druhé derivaci je pro tuto polohu pístu na grafu funkce — w inflexní bod. Tečna protíná graf funkce —w, funkce — w se změní z konkávni na konvexní 3.11 Expanze proti parabolicky se měnícímu tlaku Podívejme se teď na zvláštní případ, kdy má závislost vnější síly na poloze pístu tvar paraboly, která se právě dotýká nuly pro polohu xq, jak ukazuje červený graf na obrázku 3.9. V této poloze je tedy první derivace rovna nule. Přesto funkce — w neprochází při této hodnotě ani minimem ani maximem. 3.11. EXPANZE PROTI PARABOLICKY SE MĚNÍCÍMU TLAKU 41 o Xq 2i x (nebo V) Obrázek 3.8: Závislost funkce —w (zeleně) na poloze pístu x (nebo objemu V) při expanzi proti síle měnící se jako funkce c^(x — xq)2 + c\(x — xq) (tlaku měnícímu se jako funkce c2(V — Vo)2 + c±(V — Vo), s kladným C2 a záporným ci). Tečny ke grafu funkce —w pro polohy pístu xg a x\ jsou znázorněny oranžově. Průběhy první derivace —w (tedy síly Fex nebo tlaku Pex) a druhé derivace —w jsou zakresleny červeně a modře do stejného grafu. Proč tomu tak je? Pro xq je nulová i druhá derivace, znázorněná modře. Druhá derivace rovná nule znamená inflexní bod, který se v tomto případě nachází v poloze pístu, kdy je první derivace — w nulová. Jak vidíme, pravidlo, že nulová první derivace znamená maximum nebo minimum, teď neplatí, nulové druhá derivace jej ruší. Xq x (nebo V) Obrázek 3.9: Závislost funkce —w (zeleně) na poloze pístu x (nebo objemu V) při expanzi proti síle (tlaku) měnící se jako parabolická funkce polohy pístu (objemu). Tečna ke grafu funkce —w pro polohu pístu xq je znázorněna oranžově. Průběhy první derivace —w (tedy síly Fex nebo tlaku Pex), druhé a třetí derivace —w jsou zakresleny červeně, modře a purpurově do stejného grafu. Prozkoumejme ještě jeden případ, kdy závislost vnější síly na poloze pístu má tvar kubické paraboly, která protíná nulu pro polohu pístu xq (červený graf na obrázku 3.10). Také v tomto případě se první i druhá derivace funkce — w rovnají nule pro polohu pístu xq, funkce — w však nemá pro xq inflexní bod, ale maximum (zelený graf na obrázku 3.10). Co se stalo? Zvítězilo tentokrát pravidlo o nulové první derivaci a maximu/minimu nad pravidlem o druhé derivaci a inflexním bodu? Pokud ano, podle co nám říká, že nejde o minimum, když je druhá derivace nulová? Vysvětlením je, že i třetí derivace (purpurový graf na obrázku 3.10) je v poloze xq rovná nule. V tomto případě rozhoduje to, že čtvrtá derivace (azurový graf na obrázku 3.10) je záporná, což odpovídá maximu. 42 KAPITOLA 3. PRÁCE Xq x (nebo V) Obrázek 3.10: Závislost funkce —w (zeleně) na poloze pístu x (nebo objemu V) při expanzi proti síle (tlaku) měnící se jako kubická funkce polohy pístu (objemu). Tečna ke grafu funkce —w pro polohu pístu xo je znázorněna oranžově. Průběhy první derivace —w (tedy síly Fex nebo tlaku Pex), druhé, třetí a čtvrté derivace —w jsou zakresleny červeně, modře, purpurově a azurově do stejného grafu. Tabulka 3.1: Vztah mezi tvarem funkce /(i) a jejími derivacemi dnf(t)/dtn v bodě tg. Část n d"/(ŕ)/dŕ" funkce / v bodě íq A sudé sudé liché liché > 0 < 0 > 0 < 0 má ostré lokální minimum má ostré lokální maximum roste klesá B sudé sudé liché liché > 0 < 0 > 0 < 0 je ryze konvexní je ryze konkávni má infiexní bod a přechází z má infiexní bod a přechází z polohy pod tečnou nad tečnu polohy nad tečnou pod tečnu Jaká jsou tedy obecná a spolehlivá pravidla pro hledání ostrých lokálních minim, maxim a infiexních bodů? Popišme si je pro obecnou funkci / proměnné t. Pokud je pro určitou hodnotu proměnné t (označme si tuto hodnotu íq) n-tá derivace funkce / nenulová, ale všechny nižší derivace jsou nulové, platí závěry v části A tabulky 3.1. Pokud je n-tá derivace funkce / nenulová, ale všechny nižší derivace krom první jsou nulové, platí pro jakoukoli hodnotu první derivace závěry v části B tabulky 3.1. Jako konkrétní příklady funkcí s více nulovými derivacemi si můžeme vzít jednoduché mocninné funkce tk. Tabulka 3.2 shrnuje hodnoty jejich derivací a tvary pro t = 0. 3.12 Určité a neurčité integrály K počítání integrálů můžeme přistoupit dvěma způsoby. Cílem prvního přístupu je spočítat plochu pod grafem funkce v určitých mezích, tedy získat jedno konkrétní číslo. Příkladem je výpočet vykonané práce W při zvětšení kouzelné skříňky z objemu V± na objem V2. Pokud bychom například z nějakého důvodu tlak lineárně zvyšovali o deset megapascalů na zvýšení objemu o jeden litr (označme si tuto konstantu úměrnosti k), byla by vykonaná práce rovna 3.12. URČITÉ A NEURČITÉ INTEGRÁLY 43 Tabulka 3.2: Vztah mezi tvarem funkce tk a jejími derivacemi d" (tfe) /dtn v bodě i = 0. Hodnoty derivací, které jsou nulové pro všechna reálná čísla, jsou uvedeny černě. Hodnoty derivací, které jsou nulové jen pro i = 0, jsou uvedeny červeně. Hodnoty derivací, které jsou kladné pro i = 0, jsou uvedeny modře. Tvar funkce v bodě i = 0 je schematicky znázorněn a popsán na posledním řádku tabulky (ve schematických grafech jsou osy znázorněny černě a funkceZZ) n d" (t) /dtn d" (ť) /dtn d" (t3) /dtn d" (í4) /dtn d" (tb)/dtn 1 (lichá) í 2t 3í2 4ŕ 5F" 2 (sudá) 0 2 6í 12í2 20í3 3 (lichá) 0 0 6 24í 60í2 4 (sudá) 0 0 0 24 120í 5 (lichá)_0_0_0_0_120 v t = 0 roste má minimum má infiexní bod má minimum má infiexní bod w{Vn) Vn Vn W = J dw = - J PexdV = - J kVdV = -\k{yl - Vi). (3.35) ™(Vi) Vi Ví Ve výpočtu jsme využili znalosti z části 3.7, že derivací kvadratické funkce c2í2 je lineární funkce 2c2í. Pokud tedy proměnnou je objem a konstantu k budeme považovat za koeficient 2c2, musí mít funkce w tvar ^kV2. Cílem druhého přístupu je nikoli výpočet nějakého čísla, ale odvození tvaru funkce. Příkladem může být odvození tvaru funkce w pro naši kouzelnou skříňku, za předpokladu, že se tlak Pex opět lineárně roste s objemem w = - J PexdV = - J kVdV = -\kV2 + c0. (3.36) V zápisu tentokrát neuvádíme meze, protože nám jde o obecný průběh funkce. Hlavně si ale všimněme, že výsledek není jednoznačný. Výsledkem je jedna z nekonečného množství funkcí tvaru — \k{V2 — V2) + co, lišící se hodnotou konstanty co (konstanta k je známá, rovná deseti megapascalům na litr). Pokud chceme určit průběh funkce w jednoznačně, potřebujeme znát ještě nějaký dodatečný údaj. Takovému údaji se říká okrajová podmínka. Může jí být například informace, že na začátku pokusu, kdy píst ještě nevykonal žádnou práci (w = 0), má skříňka objem dva litry (vq = 2dm~3). Konstantu cq pak můžeme dopočítat V = V0 : w = 0 => --kV^ + co = 0 => c0 = -kyo = % ' 107 Pa • 4 • 10"6 m3 = 20 J. (3.37) Pokud chceme dvojí přístup k integrování odlišit, mluvíme v prvním případě (s uvedením mezí) o určitém integrálu a v druhém případě o neurčitém integrálu. Oba přístupy můžeme v případě potřeby kombinovat. Pokud do určitého integrálu napíšeme místo jedné meze nulu a místo druhé obecnou hodnotu proměnné V, získáme místo čísla W funkci w. Pokud naopak do neurčitého integrálu dosadíme konkrétní hodnotu proměnné (a známe okrajovou podmínku), vypočítáme číslo W. KAPITOLA 3. PRÁCE Kapitola 4 Entropie Science owes more to the steam engine than the steam engine to science. Lawrenc Joseph Henderson (podle Charlese Coulstona Gillispie) Matematika: Střední hodnota, derivace logaritmické funkce, derivace součinu, derivace exponenciální funkce, derivace složené funkce, derivace obecné mocniny, exaktní (úplný) a neexaktní (neúplný) diferenciál. 4.1 Tlak plynu Molekuly plynu se v kouzelné skříňce pohybují různými rychlostmi. Rychlost je veličina vektorová. Pokud ji chceme zapsat, potřebujeme tři čísla, popisující, jak rychle se molekula pohybuje ve třech různých směrech, nejlépe na sebe kolmých, které obvykle popisujeme pomocí souřadnic x,y,z. Při nárazu na píst nás ale zajímá jen jeden směr, ten, ve kterém píst klouže. Zvolme si tedy souřadnici x podél směru pohybu pístu a soustřeďme se na rychlost vx v tomto směru. Každá molekula, která narazila na píst, se před srážkou pohybovala rychlostí vx^(před) a po srážce s rychlostí vx^{pó), kde index i označuje, kterou molekulu a kolikátý její náraz na píst právě popisujeme. Uvědomme si, že před srážkou se molekula pohybovala směrem k pístu (tento směr udává směr osy x) a po srážce se molekula pohybuje zpátky od pístu. Proto vXti(přeď}> 0 a vx^(po)< 0. Pro každý náraz molekuly na píst můžeme spočítat hybnost, kterou molekula předá pístu miVXj(pŤed)—miVXj(po)= Apx^. Platí při nárazech molekul na píst zákon zachování hybnosti? Zachování hybnosti by znamenalo, že se kinetická energie nepřemění na žádný jiný druh energie molekul. To by platilo pro molekuly, které se nemohou natahovat, ohýbat, kroutit ani otáčet v prostoru, tedy na molekuly skládající se z jediného atomu (jako je například molekula helia). Navíc by muselo platit, že se kinetická energie nevyužije ani k excitaci elektronů či jader do vyšších energetických stavů. Takovým srážkám se říká dokonale pružné. Náplni kouzelné skříňky, která by se takto chovala, se říká ideální plyn. Chování molekul helia při pokojové teplotě a atmosférickém tlaku se od ideálního plynu moc neliší. Totéž platí pro velmi zředěné plyny jiných jednoatomových molekul jako argonu, nebo páry rtuti. Mnohé plyny se ale takto ideálně nechovají. Naštěstí nejdůležitější závěry, ke kterým analýzou tepelných strojů dospějeme, platí obecně, nejen pro ideální plyny. Na ideální plyny se ale občas podíváme, protože nám umožní provádět poměrně jednoduché a přitom přesné výpočty v případech, kdy chování jiných látek jednoduše popsat nelze. Nyní se soustředíme časový úsek Ar, krátký tak, aby se během něj nestačily dvě molekuly letící k pístu vzájemně srazit a odrazit jiným směrem. Pokud během Ar narazí na píst n molekul, můžeme pro přilétající molekuly spočítat průměrnou rychlost ve směru x 45 46 KAPITOLA 4. ENTROPIE _, . n vx,i (před) + vx,2 (před) + ^,3 (před) H-----h ^„(před) Mpred) = —-:-:-:- (4.1) a průměrnou změnu hybnosti ApxA + Apxa + ApXt3 H-----h Apx, A^. =-. (4.2) n Změna hybnosti za jednotku času ale není podle druhého Newtonova zákonu nic jiného, než síla. Průměrnou sílu, kterou působí jedna molekula na píst, můžeme tedy spočítat Kolik molekul ale stihne během Ar narazit na píst? V průměru tolik, kolik jich je od pístu ve vzdálenosti t^r(před)-Ar (tuto vzdálenost stačí během Ar uletět) a letí směrem k pístu. Pokud je v blízkosti pístu koncentrace molekul c, tak můžeme počet molekul, které během Ar narazí na píst, spočítat n = —c • TT^(před) • Aŕ • er, (4-4) kde a je plocha pístu a koncentraci jsme vydělili dvěma, protože předpokládáme, že ve vrstvě před pístem o objemu i!jr(před)-Ar • a se polovina molekul pohybuje k pístu a polovina od něj. Celková síla, kterou molekuly působí na píst, je tedy —— ApT 1 c • AnTfT(před) • Aŕ • u -, x = nl^ = 2- Aŕ -= C' PxVx (pf } '17■ ( 5) Vydělením plochou pístu a získáme hodnotu tlaku, kterým působí na píst molekuly 1 P = -c ■ Apxvx(přeď). (4.6) Pokud budou v celé kouzelné skříňce rozptýleny molekuly rovnoměrně, je koncentrace podílem celkového počtu molekul N a objemu kouzelné skříňky V. Pak můžeme tlak vyjádřit 1 N- P = --Apxvx{Vfeá). (4.7) Někdy je výhodné si převést mechanické veličiny objem a tlak na jednu stranu rovnice 1 PV= -N ■ APxvx(PŤed). (4.8) 4.2 Rychlost molekul a teplota Cemu se rovná pravá strana rovnice 4.8? Pokud jsou v kouzelné skříňce molekuly zředěného1 jednoato-mového plynu jako helia, argonu, nebo páry rtuti, můžeme předpokládat, že se při srážce s pístem (nebo jinou molekulou) téměř nedeformují (vnitřní struktura atomu se nemění). Od stěny pístu se pak odrazí s přesně opačnou rychlostí miVXj(po)= — m,iVXti(před) a tedy Apx^ = 2mjí;2;!j(před). Naše rovnice bude mít v tomto případě tvar PV = Nmv2x. (4.9) -'-Zředěným plynem budeme rozumět plyn, ve kterém budou molekuly plynu samotné zaujímat mnohem menší objem, než je objem prostoru, ve kterém se nacházejí (kouzelná skříňka). 4.3. TERMODYNAMICKÁ TEPLOTA 47 Zde již nemusíme rozlišovat vx (po) a vx (před), protože v2(po) = (—-^.(před))2 = i>2(před) = v2. (4-10) I když tlak na píst souvisí jen s pohybem molekul ve směru x, molekuly se v kouzelná skříňce pohybují všemi směry. Podle Pythagorovy věty je druhá mocnina celkové rychlosti rovna v2 = vx + vl + v2z- (4-11) Když zanedbáme nepatrnou gravitační sílu (přesněji tíhu), molekuly plynu v kouzelná skříňce nemají důvod se pohybovat ve směru y a z jinak, než ve směru x. Proto bude platit v2 = v2 = v2 =>• v2 = 3i>2, =>• v2 = -v2. (4-12) y 3 Po dosazení za v2 do rovnice 4.9, PV=^Nmv2. (4.13) Přitom ale ^mv2 není nic jiného, než průměrná kinetická energie molekuly £kin- Pro zředěný jedno-atomový plyn tedy platí PV=^Ně^n. (4.14) Pokud bude v kouzelné skříňce ale dvouatomový plyn, třeba dusík, bude vše složitější. Dvouatomová molekula může totiž rotovat. Náraz na píst může molekulu roztočit nebo naopak rychlost její rotace zbrzdit. Kinetická energie přímého letu molekuly se tak může měnit na kinetickou energii jejího otáčení. Navíc může náraz stlačit atomy k sobě a část kinetické energie se tak může přeměnit na potenciální energii atomů v molekule. Další komplikace nastanou, když plyn nebude zředěný a molekuly na sebe budou vzájemně působit. V případě jakékoli jiné náplně kouzelné skříňky, než je zředěný jednoatomový plyn, bude na pravé straně rovnice 4.8 nějaká složitá funkce, závisející na rychlosti molekul, ale ovlivněná i jejich rotací, deformacemi a vzájemným působením mezi molekulami. Obdobně se budou chovat i molekuly mimo kouzelnou skříňku. Pokud v naší virtuální realitě dovolíme stěnám kouzelné skříňky, aby všechny nárazy molekul z jedné strany předávaly molekulám na druhé straně, bude se vnitřní energie přenášet přes stěny, i když molekuly samy nebudou moci stěnami projít. Právě tuto výměnu energie nazýváme přenosem tepla. Můžeme tedy očekávat, že složitá funkce na pravé straně rovnice 4.8 bude nějak souviset s tím, čemu říkáme teplota. Síla, kterou molekuly působí na píst, neboli tlak, tak bude kromě objemu skříňky záviset ještě na teplotě. 4.3 Termodynamická teplota Tepelné stroje pracují v takzvaných pracovních cyklech, během kterých se mění teplota. Bude užitečné si tuto teplotu nějak označit. Protože zatím nerozumíme tajemství teploty, použijeme číslo, které vidíme na našem teploměru (například 100 °C nebo 212 °F). Toto číslo si označíme písmenkem 0. Náš stroj bude pracovat mezi dvěma teplotami, nižší si označíme 6\ a vyšší 62 - Námi hledané tajemství teploty nezáleží na tom, jak přesně kdekterý stroj pracuje. Zákonitost, kterou hledáme, platí pro všechny stroje. Ale pro pochopení toho, co se s tepelným strojem děje, bude výhodné, když si představíme, že se pracovní cyklus skládá ze čtyř vratných částí, ve kterých se buď vůbec nemění teplota, nebo se vůbec nevyměňuje teplo s okolím (obrázek 4.1). Tento cyklus poprvé analyzoval francouzský inženýr Sadi Carnot již roku 1824, dříve než byla formulována první věta termodynamiky. 48 KAPITOLA 4. ENTROPIE Část první: Začneme tím, že celý stroj včetně jeho okolí zahřejeme na teplotu 62 ■ Při této teplotě necháme stroj konat práci, velmi pomalu, aby byl stále v tepelné rovnováze. Přitom musíme stroji stále dodávat teplo, abychom udrželi stejnou teplotu. Během první části stroji dodáme určité množství tepla, které si označíme Q2, a stroj vykoná nějakou práci, kterou si označíme T4/2- Část druhá: Když máme pocit, že jsme dodali tepla dost, dokonale izolujeme stroj od okolí, aby si už dál žádné teplo nevyměňoval, a teplotu okolí snížíme na hodnotu 6\. Ve skutečnosti je dokonalá izolace obtížná, ale ve virtuální realitě není problém izolaci naprogramovat. Stroj má stále dost energie, aby dál konal práci, ale už nepřijímá teplo z okolí, takže jeho teplota klesá. Protože je stroj dokonale izolovaný, k veškeré práci, kterou v druhé části vykoná, stroj využívá svou vnitřní energii. Takto necháme stroj pomalu pracovat až do chvíle, kdy teploměr ukazuje hodnotu, kterou jsme si označili 6\. Během druhé části pracovního cyklu stroj vykoná práci —W21 (toto označení připomíná, že jde o práci vykonanou v té části pracovního cyklu, kdy číslo na teploměru kleslo z hodnoty 62 na hodnotu 9\). Část třetí: Abychom mohli pokračovat, musíme stroj vrátit do původního stavu. Na to musíme určitou práci vynaložit. V třetí části pracovního cyklu odebereme izolaci, s vynaložením práce velmi pomalu vracíme stroj k původnímu stavu a přitom ze stroje odebíráme teplo, abychom udrželi teplotu na hodnotě 6-\_. Celkem tak dodáme stroji práci W\ a odebereme teplo —Q\. Část čtvrtá: Ze stroje přestaneme odebírat teplo ve chvíli, kdy nám zbývá vynaložit právě tolik práce W\2, o kolik potřebujeme zvýšit vnitřní energii. Tedy o stejnou práci, kterou stroj vykonal v druhé části (—W21). V tomto okamžiku stroj opět zaizolujeme a pomaličku pokračujeme v dodávání práce. Protože si stroj nemůže vyměňovat teplo s okolím, pomalu se zahřívá a číslo na teploměru se vrací k hodnotě 02- Co všechno dokážeme říci o změnách energie, výměnách tepla a vykonané práci během pracovního cyklu, který jsme si popsali? Za prvé víme, že na konci se stroj vrátí do původního stavu. Bude mít tedy stejnou vnitřní energii jako na začátku. Jinými slovy, změna vnitřní energie po celém pracovním cyklu bude nulová: Ač7 = 0. (4.15) Za druhé víme, že během pracovního cyklu dodáme stroji při vyšší teplotě 62 teplo Q2 a při nižší teplotě odebereme teplo —Q± (dodané teplo počítáme s kladným znaménkem, odebrané teplo se záporným znaménkem, takže —Qi a Q2 jsou kladná čísla). Za třetí během pracovního cyklu vykoná stroj nějakou celkovou práci W. Tato práce bude rozdílem prací, které stroj vykonal pro nás v prvních dvou částech a práce, kterou jsme naopak my museli vynaložit ve zbytku cyklu: —W = —(W\ + W12 + W2 + W21) = —W\ — W2 (protože W12 = —W21). AU je součet dodaného tepla a vložené práce, neboli rozdíl dodaného tepla a vykonané práce (dodanou práci počítáme s kladným znaménkem, práci, kterou stroj vykoná, se záporným znaménkem). Můžeme si tedy naše tři předchozí závěry shrnout do rovnice AU = 0 = Q2 + Qi+W. (4.16) Když si převedeme W na levou stranu rovnice, vidíme, že vykonaná práce —W = Q2 + Qi-Nejdůležitější otázka pro odhalení tajemství teploty je: Kolik z dodaného tepla Q2 se skutečně přemění na práci —Wl Odpověď je =K = 9i±Qi neboli M=IQ»l-IQil=1-jgil (4.17) K této odpovědi jsme došli pro jeden konkrétní pracovní cyklus. Můžeme ji ale zobecnit na jakýkoli cyklus. Graficky se práce —W rovná rozdílu ploch pod funkcí P(V) během prvních a druhých dvou částí pracovního cyklu, neboli ploše ohraničené grafy funkce P(V) během částí pracovního cyklu, kdy objem roste a kdy se naopak zmenšuje (obrázek 4.1C). V případě jiného pracovního cyklu bude mít 4.3. TERMODYNAMICKÁ TEPLOTA 49 A x (nebo V) x (nebo V) Obrázek 4.1: Pracovní cyklus tepelného stroje (Carnotův cyklus). A. Schematické znázornění Carnotova cyklu. Oranžová barva znázorňuje izolační materiál, sytost červené barvy symbolizuje teplotu (sytější barva znamená vyšší teplota). B. Závislost teploty molekul v kouzelné skříňce na poloze pístu (nebo objemu skříňky) v průběhu pracovního cyklu. C. Závislost tlaku molekul v kouzelné skříňce na poloze pístu (nebo objemu skříňky) v průběhu pracovního cyklu. D. Konaná a dodávaná práce během dvou pracovních cyklů. E. Dodávané a uvolňované teplo během dvou pracovních cyklů. V celém obrázku jsou kroky s dokonalou tepelnou výměnou znázorněny zeleně a kroky bez tepelné výměny znázorněny oranžově. 50 KAPITOLA 4. ENTROPIE plocha určující práci W jiný tvar. Tento tvar ale můžeme poskládat z velkého množství malých plošek, které budou vymezeny průběhem tlaku během částí pracovního cyklu, který jsme analyzovali. A teď se zamysleme: proč se vlastně liší dodané teplo Q 2 od odebraného tepla — Qi? Protože jsme Q2 dodávali při vyšší teplotě, než při jaké jsme odebírali —Q±. Zkušenost nám říká, že při vyšší teplotě musíme dodat více tepla. Podíl —Q1/Q2 = IQ1I/IQ2I Je tedy dán teplotami, mezi kterými stroj pracuje. Protože zatím nevíme, jak přesně závislost na těchto teplotách vypadá, označíme si ji velmi obecně /12 (výraz /12 znamená „něco, co nějak závisí na číslech 6\ a 62")■ Abychom se o /12 dozvěděli trochu více, představíme si, že máme ještě druhý stroj, pro který je 6\ vyšší teplota a kterému během první části cyklu dodáme při teplotě 61 přesně tolik tepla \Qi\, kolik jsme z prvního stroje odebrali v třetí části jeho cyklu. Aby druhý stroj pracoval, musí se během druhé části ochladit na nižší teplotu, které odpovídá číslo 0q na našem teploměru. Práce, kterou vykoná druhý stroj, se rovná (|Qi| — |Qo|)/|Qi| = 1 ~~ IQ0I/IQ1I; kde — Qo je teplo odebrané z druhého stroje při teplotě 6$. Podíl |Qo|/|Qi| bude zase záviset na dvou teplotách, tentokrát 60 a #1. Toto „něco, co nějak závisí na 60 a 61", si označíme /o,i. A do třetice si představíme stroj, který pracuje mezi teplotami 60 a #2- Pro tento třetí stroj označíme závislost podílu IQ0I/IQ2I na teplotách 6q a 62 výrazem Jo,2- Co můžeme říci o dvou teplotních závislostech /12, /o,i a /o,2 na základě srovnání našich tří strojů? Když vynásobíme podíly |Qi|/|Q2| = A,2 a IQ0I/IQ1I = fo,i, získáme , , _ IQil IQol _ IQol _ , Vidíme, že naše dvouteplotní závislosti musí být takové, aby se součin Ji 2 ■ f0,1 závisel jen na 60 a 62, a ne na Oi. To znamená, že závislosti /12 a Jo,i se musí skládat ze složek, které nezávisí na 6\ (označíme si je O2 a Oo) a ze složky, která závisí jen na 6\ a která se v součinu zkrátí (označíme si je Oi). Aby rovnice 4.18 platila pro jakoukoli hodnotu 6\, musíme /12 a Jo,i poskládat z ©2, ©1 a ©o následujícím způsobem Když srovnáme rovnice 4.18 a 4.19, vidíme, že JQii = 8i K^ = eo JQol = Oo IO2I ©2 IQil ©i IO2I e2" 1 ' 1 První důležitý závěr našeho hraní s tepelnými stroji je, že dodaná a odčerpaná tepla jsou přímo úměrná nějaké matematické funkci ©, která závisí jen na číslech 6, která nějak popisují teploty, při kterých teplo dodáváme nebo odebíráme. Stále ale nevíme, jaká matematická funkce to je. Zdá se, že jsme v pěkné šlamastyce. Teplotu má popisovat nějaká matematická funkce ©. My za prvé zatím teplotu umíme popsat jenom čísly 6, o kterých víme, že neudávají teplotu dobře, podíl 6\ : 62 vyjde na českém teploměru jinak, než na americkém. To nám říká, že takový podíl nemá vůbec cenu počítat. A za druhé ani nevíme, jak funkce © na čísle 9 závisí. Lorda Kelvina napadla geniální myšlenka: Podíl teplot nezískáme vydělením čísel, která čteme na teploměru. Vlastně zatím vůbec nevíme, co to podíl teplot je. Nebude nejlepší, když budeme za podíl teplot přímo považovat podíl IQ1I/IQ2I? Tedy kde písmenko T označuje „skutečnou" teplotu? Takováto definice opravdu řeší všechny problémy s teplotou. Jasně nám říká, kde teplota začíná: Pokud bude v naší definici nižší teplota Ti = 0, tak bude platit Q\ = |f Q2 = 0 a 4.4. ENTROPIE ANEB CO SE NEMĚNÍ 51 neboli —W = Q2- Tedy veškeré dodané teplo se přemění na vykonanou práci, více práce stroj udělat nemůže.2 4.4 Entropie aneb co se nemění Během pracovního cyklu tepelného stroje se mění různé fyzikální veličiny. Některé z nich popisují, co stroj během cyklu „spotřebuje" (teplo) nebo „vyrobí" (celková práce). Tyto veličiny se za každý cyklus o určitou hodnotu zvětší nebo zmenší (obrázek 4.1D,E). Jiné veličiny popisují stav stroje. Proto jim říkáme stavové funkce. Takové veličiny se na konci pracovního cyklu vrátí na svou počáteční hodnotu, protože i stroj se vrátí do původního stavu. Příkladem takové veličiny je vnitřní energie. Snížení vnitřní energie ve druhé části cyklu o hodnotu AU je stejné, jako její zvýšení ve čtvrté části, takže celková změna je nulová (v první a třetí části cyklu se vnitřní energie nemění). Pokud bychom posčítali všechny maličké změny vnitřní energie, ke kterým během cyklu dochází, dostali bychom nulu. Rovnice 4.21 nám říká, že podobně jako vnitřní energie se chová i poměr Q/T. Rovnici 4.21 si můžeme přepsat do tvaru ^ = !f!i, (4.23, J-2 -11 ze kterého vyplývá, že teplo dodané v první části vydělené teplotou, kterou v této části udržujeme, je stejné, jako teplo odebrané ve třetí části vydělené teplotou, kterou udržujeme během třetí části. Pokud si tedy dodané teplo dělené teplotou označíme AS a odebrané teplo dělené teplotou —AS1, získáme na konci cyklu nulovou změnu veličiny S, pomocí které jsme si teplo vydělené teplotou popsali AS - AS = l^i - i^ii = 0. (4.24) T2 Ti 4.5 Práce vykonaná při isotermální expanzi ideálního plynu Úvahy, kterými jsme došli k definici teploty a entropie, nijak nezávisely na tom, jakými molekulami byl tepelný stroj naplněn. To je velká výhoda, protože nám to zaručuje, že naše definice platí pro jakoukoli látku. Na druhou stranu bude užitečné, když dokážeme práci W vykonanou během jednoho cyklu, vypočítat pro nějakou konkrétní náplň tepelného stroje. Nejjednodušší volbou je ideální plyn. Pro něj víme, jak tlak závisí na objemu a kterou funkci potřebujeme během částí pracovního cyklu integrovat. Zkusme nejdříve spočítat práci vykonanou a dodanou vratným tepelným strojem v první a třetí části pracovního cyklu, který jsme si popsali v části 4.3. V těchto částech pracovního cyklu jsme udržovali konstantní teplotu kouzelné skříňky, takže šlo o děj isotermální Pokud by byla kouzelná skříňku naplněna ideálním, velmi zředěným jednoatomovým plynem, byla by vnitřní energie rovna celkové kinetické energii molekul -/Ve^in a při konstantní teplotě by se neměnila. Pravá stana rovnice 4.14 by se tak rovnala konstantě K = |iVěkin a závislost P na V" by tak byla hyperbolická. 2Všimněme si, že stejný podíl v rovnici 4.21 dostaneme, když T± i T2 vynásobíme jakýmkoli nenulovým číslem. To, že v rovnici 4.21 máme podíl teplot, znamená, že definice nám dává volnost ve volbě jednotky. S touto definicí se teplota stává stejně dobře popsanou fyzikální veličinou, jako délka. Každý ví, co to znamená nulová délka, ale musíme se domluvit, jestli za jednotku délky budeme považovat stopu, metr, nebo něco jiného. Podobně je jasné, co je to nulová teplota, ale musíme se domluvit, co budeme považovat za jednotku teploty. Ve fyzice používáme jednotku pojmenovanou po lordu Kelvinovi, která byla zvolena tak, aby číselně vyšel rozdíl dvou teplot přibližně tak, jako na českém teploměru. 52 KAPITOLA 4. ENTROPIE P= — =KV-1. (4.25) Kdybychom se naivně snažili hledat funkci w ve tvaru cnVn s využitím rovnice 3.26, museli bychom předpokládat, že n = 0, abychom po derivování získali objem V umocněný na n — 1 = —1. To by však funkce w byla konstantní, a my víme, že derivací konstantní funkce je funkce nulová, ne hyperbolická. Jak vidíme, hyperbolická závislost musí být derivací nějaké jiné funkce. V příští části si ukážeme, že touto funkcí je funkce logaritmická. 4.6 Derivace logaritmické funkce S logaritmy jsme se setkali při porovnávání pravděpodobností a energií. V části 2.2 jsme si také řekli, že logaritmy jsou užitečné pro počítání s velkými počty molekul. Když se domluvíme na nějakém čísle a (kterému říkáme základ), pak můžeme nějaké velké číslo ŕ vyjádřit t = ax (4.26) a místo s velkým číslem ŕ počítat s malou mocninou x, o které říkáme, že je logaritmem t. Pojďme se podívat, jak se počítají směrnice tečen k funkci, která logaritmus popisuje. Obecně je zvykem označovat takovou funkci jednoduše zkratkou log, za kterou píšeme, z jakého čísla logaritmus počítáme: x = logo(í) (4.27) Protože číselná hodnota závisí na tom, na jakém základu a jsme se domluvili, píše se hodnota a ke zkratce.3 Dosazením za x do rovnice 4.26 získáme obecný tvar vzorečku 2.44 í = a'°8a(*)j (4.28) který se nám bude za chvilku hodit. Zkusme teď spočítat tečnu k funkci logaritmus pro libovolnou hodnotu proměnné t. Začneme jako obvykle výpočtem rozdílu pro t a t + Aŕ: Ax = loga(ŕ + Aŕ)-loga(ŕ) Aŕ Aŕ 1 ' ' S využitím vzorečku 4.28 a známého pravidla pro počítání s mocninami ab~c = ab/ac můžeme výraz s logaritmy trochu přeskládat: ŕ +Aŕ = alog»(t+At), ŕ = alog»(t), (4.30) ŕ al°Sa(t) z čehož vyplývá + I A + „logQ(t+At) ŕ + Aŕ a alogQ(t+At)-logQ(t); (431) Ax loga (í^£) _ loga (1 + f) Aŕ Aŕ Aŕ Dalším krokem je jako obvykle zmenšování Aŕ. (4.32) ,im Ml + !¥)). («3) At^o V Aŕ / At^o \ Aŕ / y ' 3Pokud nenapíšeme ke zkratce log žádnou hodnotu a, obvykle předpokládáme, že jako základ používáme číslo 10. 4.6. DERIVACE LOGARITMICKÉ FUNKCE 53 Teď konečně využijeme naší znalosti magického čísla e. Podle rovnice 2.20 je / Aí\ ^* e = lim 1 + — . (4.34) At^o \ t J V rovnici 4.33 máme logaritmus velmi podobného výrazu, chybí jen umocnit na t/At. Anebo to můžeme říci naopak. Výraz v logaritmu v rovnici 4.33 je číslo e odmocněné číslem t/Ať. lim (%) = lta (i*4±*n = lim c^(^) = lim Mť,,. (4.35) At^O V At / At^O \ At / At^O \ At / At^O \ At 1 Díky vzorečku 4.28 si můžeme hodnotu e napsat způsobem e = a1°Sa(e) (4.36) který je na první pohled kostrbatý, ale který nám pomůže vyjádřit si lépe hodnotu v logaritmu rovnici 4.35. Hodnotu eAt/* si totiž můžeme přepsat podobně na ( a*\ At log„ e ŕ e^ =a V ). (4.37) Do levé strany této rovnice můžeme za e dosadit z předchozí rovnice xlog»(e)J ' . (4.38) Podle dalšího pravidla pro počítání s mocninami ab = ab'c si můžeme pravou stranu přepsat At e^ = (>^e)) ' =a£?-i°^. (4.39) A teď si tuto rovnici porovnáme s rovnicí 4.37. Vidíme, že a¥-i°g»(e)=alos»(e¥). (4.40) Protože na levé i pravé straně umocňujeme stejné číslo a, můžeme přímo porovnat mocniny / aí \ Ar , loga (e « J = — -loga(e). (4.41) Odtud můžeme do rovnice 4.35 dosadit za loga (eAt/*). Získáme lim (£) = lim '"■H = lim (ítJSM) = li,n (*.!=& ] . (4.42) At^o \At J At^o l Aí I At^o l Aŕ y At^o \ t At ' y ' At v posledním výraze můžeme vykrátit. Tím nám ale všechna Aí z rovnice zmizela! V rovnici pak nezbude, co bychom ještě měli zmenšovat, takže už nemá smysl počítat žádné limity. Výsledkem je přímo 54 KAPITOLA 4. ENTROPIE A teď poslední kouzlo. Co se stane, když počítáme logaritmus z čísla, které jsme použili jako základ? Naposledy použijeme vzoreček 4.28: a = alos^a). (4.44) Opět máme rovnici, kde na levé i pravé straně umocňujeme stejné číslo a. Na levé straně máme pouze a, to znamená, že a umocňujeme na prvou. Na pravé straně umocňujeme na náš logaritmus. To ale znamená, že se tento logaritmus rovná jedničce! Jaké poučení si z toho vezmeme? Základ a je číslo, na kterém se musíme dohodnout, ale je úplně jedno, jaké číslo si zvolíme. Jaké číslo by bylo nejšikovnější zvolit, aby se nám směrnice tečny počítaly nejlépe? Přece číslo e. Pokud bude a = e, tak bude logaritmus v rovnici 4.43 roven jedné a rovnice se zjednoduší na lim í^-)=-. (4.45) Vidíme, že i když máme deset prstů, není nej přirozenější používat jako základ deset, ale číslo e. Proto také logaritmu se základem e říkáme přirozený a označujeme ln (logarithmus naturalis). Předpis pro směrnici tečny k funkci popsané přirozeným logaritmem si tedy můžeme zapsat -^ = 1. (4.46) dŕ t K ' Pro každou hodnotu proměnné t je směrnice tečny k funkci ln(í) rovna převrácené hodnotě t. Derivace logaritmu nám umožní vypočítat práci pro hledaný tvar funkce P (V), kdy tlak je nepřímo úměrný objemu. Z rovnice 4.46 víme, že funkci K/V získáme derivováním funkce logaritmické: dln(V) _ 1 dV ~ V' Z toho vidíme, že w = —Kla(V), aby (4.47) dw _ dln(-KV) _ Kdln(V) = K ^ dV dV dV V Práci tedy můžeme spočítat w(Vn) Vn Vn -W = - J dw = f PdV = K J ^áV = K (HVn) -ln(Vi)) = Kin . (4.49) u(Vi) V\ Ví 4.7 Práce vykonaná při adiabatické expanzi ideálního plynu Zkusme teď vypočítat práci vykonanou a dodanou vratným tepelným strojem v druhé a čtvrté části pracovního cyklu, který jsme si popsali v části 4.3. V těchto částech pracovního cyklu jsme kouzelnou skříňku dokonale izolovali, takže nedocházelo k výměně tepla. Takovému ději se říká adiabatický. Bez tepelné výměny se vykonaná práce se přímo rovná změně vnitřní energie skříňky —W = PAV = -AU. (4.50) Pro velmi malou změnu objemu se vnitřní energie změní o dU = -PdV. (4.51) Pokud by byla kouzelná skříňku naplněna ideálním plynem a pravá stana rovnice 4.14 by se tak rovnala |č7, platilo by zároveň 4.8. DERIVACE SOUČINU 55 dU = ^d(PV). (4.52) Na pravé straně máme diferenciál součinu tlaku a objemu. Tlak i objem jsou funkcemi teploty, která se při adiabatickém ději mění. Výpočet takového diferenciálu souvisí s derivováním součinu dvou funkcí. 4.8 Derivace součinu Jak se změní součin tlaku a objemu, když maličko změníme teplotu? A(PV) = (P+AP)-(V+AV)-P-V = P-V+PAV+VAP+APAV-P-V = PAV+VAP+APAV. (4-53) Pokud se budou změny teploty blížit nule, budou se nule blížit i výsledné změny tlaku a objemu. Potom budeme k malým číslům PAV a VAP přičítat ještě mnohem menší součin nepatrných změn APAV. Pro nekonečně malý diferenciál d(PV) můžeme součin dPdV bezpečně zanedbat a psát d(PV) = PdV + VdP. (4.54) Vydělením nekonečně malou změnou teploty bychom získali derivaci součinu PV ^ĽYl-pW+V^ (4 55) dT ~ťdT + VdT- (4'55j Nám ovšem stačí dosadit do rovnice přímo diferenciál dU = T^VdP + T^PdV. (4.56) Porovnáním pravých stran rovnic 4.51 a 4.56 získáme vztah mezi tlakem a objemem -PdV = ^VdP+^PdV, (4.57) 0 = ^VdP+^PdV, (4.58) 0 = -2-p+-2-y- (4-59) K dalšímu postupu využijeme předpis pro derivaci logaritmické funkce. Když vynásobíme obě strany vzorečku 4.46 změnou proměnné dt, získáme výraz dln(r) = y, (4.60) podle kterého můžeme přepsat rovnici 4.59 3 5 -dlnP+ -dlnF = 0. (4.61) Závislost tlaku na objemu získáme po vynásobení obou stran dvěma třetinami pomocí neurčitého integrálu dlnP+ /jjdlny = 0. (4.62) 56 KAPITOLA 4. ENTROPIE lnP+^lny = ln(C*), (4.63) kde ln(C) na pravé straně píšeme proto, že výsledná funkce není integrováním určena jednoznačně a se může od levé strany lišit o nějakou konstantu. Protože na levé straně máme logaritmické funkce tlaku a objemu, je výhodné psát také konstantu na pravé straně jako logaritmus nějakého (zatím neznámého) čísla C. Po odlogaritmování PVÍ =C => P = CV~%. (4.64) Konečně se můžeme pustit do počítání vykonané práce w(Vn) Vn Vn -W = - J dw = J PdV = C J V~*dV. (4.65) ™(Vi) Vi Ví Opět narážíme na integrál proměnné umocněné na něco jiného, než celé kladné číslo. Zkušenost s mocninou —1 nás naučila opatrnosti. Místo slepého požití vztahů pro derivování polynomiálních funkcí si odvodíme, čemu se rovná derivace proměnné umocněné na jakékoli reálné číslo. K tomu budeme nejprve potřebovat vědět, jak se logaritmují exponenciální funkce. 4.9 Derivace exponenciální funkce Jako další z užitečných derivací si spočítáme směrnici funkce e* vzhledem k proměnné t. Budeme postupovat jako obvykle. Vezme funkci pro proměnnou ŕ a pro hodnotu proměnné větší o nepatrný kousek Ar, spočítáme 2t+At_et eteAt_et +eAt-l ,At * - "* (4.66) e -— = e Aŕ Aŕ Aŕ Aŕ kde jsme v předposledním kroku využili přibližného vztahu popsaného rovnicí 2.35. Vidíme tak další pozoruhodnou vlastnost čísla e: směrnice funkce e* má stejnou hodnotu, jako funkce sama: de* 4.10 Derivace složené funkce = e (4.67) Dále se potřebujeme naučit, jak derivovat kombinace více funkcí. Vezměme si například exponenciální funkci, která v exponentu ukrývá polynomiální funkci g eS _ eco+C!t+c2t +•• (4.68) Jak bychom spočítali derivaci této složené funkce? Podle obecného postupu potřebujeme spočítat de3 , e3+A9 -ea — = lim---. (4.69) dŕ At^o Aŕ kde jsme si pro jednoduchost označili Ag = c0 + exit + Aŕ) + c2(ŕ + Aŕ)2 +----(c0 + Clt + c2t2 + •••). (4.70) Maličkou změnu Aŕ můžeme rozšířit výrazem Ag 4.11. DERIVACE OBECNÉ MOCNINY 57 Aí = ^Ag. (4.71) a dosadit do rovnice 4.69 des /e3+A3-e3 Ag\ dg e9+A9 - e9 — = lim------i = -i lim---. (4.72) dí At^o \ Ag At) dt At^o Ag y ' Výraz v limitě má teď stejný tvar, se kterým jsme se setkali v rovnici 4.66 popisující odvození derivace exponenciální funkce. Pouze písmenko í je nahrazeno písmenkem g. Můžeme proto využít závěru předchozí části a místo limity psát de9/dg = e9. Derivaci dg/dt jsme se naučili počítat v části 3.7. Hledaná derivace naší složené funkce tedy bude des des dg „dg „ _. .2, , N , — = —-£ = e^ = eco+^t+c.t +... Ci + 2c2Í + ... y 4 73 dí dg dt dt Tento výsledek můžeme zobecnit. Pokud v sobě nějaká funkce f(t) ukrývá další vnitřní funkci g(t), je derivace f(t) podle í rovna df áfá9 í = ígíf (4'74) 4.11 Derivace obecné mocniny Umění derivovat složenou funkci využijeme k tomu, abychom předpis pro derivování polynomiální funkce rozšířili na jakoukoli mocninu proměnné í. Ve výrazu tn nahradíme proměnnou í nějakou funkcí / a celé číslo n jinou funkcí g. Funkci / přepíšeme pomocí vzorečku 4.28, abychom obě funkce dostali do exponentu / = eln(/). (4.75) Derivaci f9 pak vypočítáme d(P) = d&Mf) = de?Mf) d(g-Hf)) = lnmd(g-ln(/)) = d(g-ln(/)) dí dí d(ff-ln(/)) dí dí 7 dí ' 1 1 V dalším kroku musíme použít pravidlo pro derivaci součinu. Do vzorečku 4.55 dosadíme za x funkci g, za y logaritmus funkce / a za T obecnou proměnnou í. S využitím pravidel o derivování složené funkce (rovnice 4.74) a vztahu 4.60 získáme ^^<|M/, + ^)^<|M/» + ^)^.(|,,/» + f|)-(-, Výsledný vztah vypadá možná příliš komplikovaně, ale pro počítání derivací a integrálů je užitečný. Jeho poněkud zjednodušená verze nám umožní vypočítat práci vykonanou a dodanou vratným tepelným strojem v druhé a čtvrté části pracovního cyklu, který jsme si popsali v části 4.3. Pro náš případ se vztah 4.77 hodně zjednoduší, protože funkce / je v rovnici 4.65 přímo rovná proměnné V (objemu) a funkce g je konstanta. Ím=v(%HV) + $%). (4.78) dV \dV v ' V dV 58 KAPITOLA 4. ENTROPIE Protože derivace konstanty g je nula, zůstane v rovnici jenom druhý člen, kde se navíc vykrátí dV. Výsledkem derivace tedy je ^T = VgT?=9V9-1. (4.79) dV V Získáváme tedy stejnou závislost, jako v případě celočíselné mocniny. Mocnina v naší funkci w v rovnici 4.65 musí být g = — | + 1 = — |, abychom po zderivování získali V~ž. Vykonaná práce je tedy rovna -W = C j V-idV = -^C (vň* - V^) , (4.80) Vi kde hodnotu C udává okrajová podmínka. Pokud by například počáteční hodnotě piVi = K\ = 2 500 J (teď už nejde o konstantu!) odpovídal počáteční objem V\ = 27 litrů, byla by podle rovnice 4.64 C = P{V^ = (PiVi) • v} = 2 500 • (27 • 10"3m3)i J = 225 kg m4 s~2. (4.81) 4.12 Exaktní diferenciál Zatím jsme pomocí integrálu počítali práci. Ještě více než vykonaná či dodaná práce nás zajímá vnitřní energie. Změnu vnitřní energie při zahřátí či ochlazení a stlačení nebo zvětšení objemu popisuje první věta termodynamiky AU = Q + W. (4.82) Pokud sledujeme, jak se vnitřní energie postupně mění, můžeme celkové zvýšení poskládat z maličkých postupných změn neboli diferenciálů dU AU = J dU. (4.83) Stejně tak celkové teplo a práci můžeme poskládat z maličkých příspěvků dq a dw dq, (4.84) w(Vn) W= J dw. (4.85) w{V-l) Poslední tři rovnice vypadají velmi podobně. Jejich spojením získáme zápis první věty termodynamiky v diferenciálním tvaru dU = dq + dw. (4.86) Příspěvky dq a dw se ale od dU liší v něčem velmi důležitém. Ukážeme si to na příkladu vratného stroje z části 4.3. Tento stroj pracuje v cyklech. To znamená, že se na konci každého cyklu vrací do počátečního stavu, se stejnou vnitřní energií jako na počátku. Změna vnitřní energie během cyklického děje musí být nutně nulová. Matematicky to můžeme zapsat 4.12. EXAKTNÍ DIFERENCIÁL 59 AU = dU = 0. (4.87) Kroužek kolem znaku integrálu zdůrazňuje, že sčítáme diferenciály během jednoho cyklu. Naopak meze nemusíme vyznačovat, protože změna vnitřní energie je nulová pro jakékoli počáteční podmínky a pro jakýkoli průběh pracovního cyklu. Diferenciálu, jehož integrál je během cyklického děje nulový, říkáme exaktní diferenciál nebo úplný (totální) diferenciál. Funkce, jejíž diferenciál je exaktní, se nazývá stavová funkce, protože popisuje stav zkoumaného systému. Pokud je děj opravdu cyklický, musí systém nakonec dorazit do stejného stavu, v jakém byl na počátku, a každá funkce, která závisí jen na stavu systému, se musí vrátit ke své původní hodnotě. Kromě vnitřní energie jsou stavové funkce například objem, teplota, tlak, entropie. Diferenciály dq a dw ale exaktní nejsou, protože jejich součty (integrály) během cyklického děje nejsou nulové. Stroj z části 4.3 v každém cyklu spotřeboval teplo Q2 + Qi > 0 a vykonal práci —W\ — W2 > 0. Diferenciálům dq a dw se říká neexaktní diferenciály nebo neúplné diferenciály a někdy se pro ně používá i zvláštní symbol (například S nebo d). Práce ani teplo nejsou stavové veličiny nezávisí jen na stavu systému, ale také na průběhu děje. Funkci, která není stavová, je ale možné na stavovou funkci převést. Příklad jsme viděli v části 4.4. Teplo, které není stavovou funkcí, jsme převedli na entropii, která je stavovou funkcí, tím, že jsme teplo vydělili termodynamickou teplotou T. Matematické funkci, jejímž vynásobením se nestavová funkce změní na stavovou, se říká integrační faktor. V části 4.4 tedy byla integračním faktorem převrácená hodnota teploty 1/T. Zkusme se teď zamyslet nad tím, co pracovní cyklus vratného stroje určuje. V části 4.3 jsme mluvili jen o teplotách 62 a 6\ (které jsme později nahradili termodynamicky definovanými teplotami T2 a Ti). Stroj ale také koná práci, takže se mění objem V. Během pracovního cyklu se mění i tlak, ale v části 4.2 jsme si řekli, že tlak P závisí pouze na objemu a teplotě. Proto je průběh pracovního cyklu jednoznačně popsán, když uvedeme teplotu a objem v každém okamžiku cyklu. Vnitřní energii měnící se během pracovního cyklu bude tedy nejlépe popsat jako funkci dvou proměnných, teploty a objemu. Změny vnitřní energie během pracovního cyklu budou dány změnami teploty a objemu. Graficky si můžeme závislost vnitřní energie na teplotě a objemu znázornit jako plochu nad rovinou určenou souřadnicemi T a V. Pracovní cyklus bude odpovídat okružní jízdě po této ploše. Pokud bychom se na T a V dívali jako na souřadnice na mapě a na U jako na nadmořskou výšku, odpovídal by diferenciál dU změně nadmořské výšky při maličkém posunutí na mapě. Pokud by se souřadnice při každém posunutí změnily o stejné maličké hodnoty dT a dV, byla by velikost dU dána těmito hodnotami a sklonem plochy podél souřadnic T a V. K určení dU tedy potřebujeme znát směrnice dvou tečen k ploše. Směrnici tečny můžeme spočítat jako derivaci. V našem případě půjde o parciální derivace dU/dT a dU/dV. Název parciální a odlišný symbol (d místo d) říkají, že derivujeme jen podle jedné proměnné a druhou ignorujeme, protože nás zajímá vždy sklon jen ve směru jedné souřadnice. Souřadnici, kterou ignorujeme, někdy zvýrazňujeme spodním indexem. Hodnota dU je tak dána První člen nám říká, o kolik vzroste U při změně teploty o dT (při konstantním tlaku), druhý člen říká, o kolik vzroste U při změně objemu o dV (při konstantní teplotě). Pokud lze diferenciál napsat v tomto tvaru, tedy jako součet diferenciálů proměnných vynásobených příslušnými směrnicemi, jde o diferenciál exaktní. To například neplatí pro vztah dW = — PdV. Práce obecně závisí i na teplotě, ale člen se směrnicí dW/dT ve vztahu chybí. (4.88) KAPITOLA 4. ENTROPIE Kapitola 5 Rovnováhy There is, essencially, only one problém in statistical thermodynamies: the ditribution of a given amount of energy S over Aľ identical systems. . . . We assume that each of them has identically the same "mechanism"attached to it, screws, pistons and what not, which we can handle and thereby change its náture. Erwin Schrôdinger Matematika: Exaktní diferenciál, integrační faktor, diferenciál součinu, exponenciální funkce a jejich přibližné hodnoty pro malý exponent, entropie v informatice. 5.1 Mikrokanonické a kanonické soubory V kapitole 2.7 jsme si odvodili tvar Boltzmannova zákona, schází nám pouze odhalit význam zatím neznámého parametru j3. Při odvozování jsme přitom používali počty jednotlivých molekul. Jak se můžeme na tento postup dívat z pohledu kouzelných skříněk? Naše odvození Boltzmannova zákona odpovídá analýze obrovského (teoreticky nekonečného) počtu vzájemně izolovaných skříněk, které všechny mají stejný objem V, obsahují stejný počet molekul N a mají stejnou celkovou energii S = Ně. Takovému sbírce kouzelných skříněk se říká mikrokanonický soubor. Tajemství konstanty j3 můžeme odhalit tak, že pohled na kouzelné skříňky trochu změníme. Dovolíme jim, aby si vzájemně vyměňovaly teplo. Všechny kouzelné skříňky budou mít opět stejný objem V a obsahovat stejný počet molekul N. Mohou se ale lišit celkovou energií, kterou si pro skříňku číslo i označíme Si. Místo energie budou mít všechny skříňky stejnou teplotu T. Také energie celého souboru bude konstantní. Pokud se bude soubor skládat z JV skříněk, bude celková energie rovna AÍU, kde vnitřní energie U je střední hodnota energií Si jednotlivých skříněk. Takové sadě kouzelných skříněk se říká kanonický soubor. V kanonickém souboru se jednotlivé skříňky vlastně chovají jako tepelné stroje, které jsou schopny vnitřní energii měnit a tedy konat práci. Dává to smysl i fyzikálně. To, že je fruktóza v určitém isomerním stavu, neznamená ještě, že má její molekula pevně danou energii. Všelijaké deformování, stlačování, natahování a kroucení molekuly každého isomeru energii této molekuly změní. Takového zvýšení vnitřní energie můžeme dosáhnout tím, že kouzelnou skříňku s fruktózou zahřejeme nebo stlačíme. Půvab termodynamiky tkví v tom, že přitom vůbec nemusíme vědět, co přesně se s molekulou děje, stačí nám analyzovat celkové změny vnitřní energie, teploty, objemu a tlaku. Kouzelné skříňky v kanonickém souboru můžeme analyzovat úplně stejně jako jednotlivé molekuly v mikrokanonickém souboru skříněk se stejnou energií. Energie molekul Ei nahradíme energiemi skříněk 61 62 KAPITOLA 5. ROVNOVÁHY £i, celkový počet molekul ve skříňce N nahradíme celkovým počtem skříněk Aľ, a počet skříněk s energií £i pro nejpravděpodobnější rozdělení energií všech skříněk se bude rovnat ví=N-—ž~, (5.1) kde Z = J2e-^, (5.2) i=0 je kanonická partičm funkce. Co se stane, když maličko zvýšíme teplotu kouzelné skříňky s našimi molekulami? Hodnoty v exponentech našich rovnic, tedy j3 a energie, se přitom také maličko změní (při změně teplot to už nebudou konstanty). To, co se skrývá za hodnotou /3, zjistíme, když budeme pečlivě sledovat, jak se maličké změny j3 a energií odrazí na hodnotě logaritmu výrazu Z. 5.2 Boltzmannova konstanta Pátrání po hodnotě j3 začneme tím, že prozkoumáme, jak se při maličké změně teploty změní ln(Z). Uvědomíme si, že když změníme teplotu, změníme také maličko součiny j3 ■ £im Zvýšení teploty změní j3 o velmi malou hodnotu A/3 a každou z energií o velmi malou hodnotu A£j. Jednotlivé součiny j3 ■ £i v exponenciálních členech se tedy změní o hodnotu Atf-Ei) = ((3 + A(3)-(£l + A£l)-(3-£l = (3-£l+A(3-£l + (3-A£l + A(3-A£l-(3-£l = A/3 • £i+P- A£,+ A/3- A£t. (5.3) Teď využijeme toho, že teplotu můžeme změnit o libovolně malou hodnotu, tak aby A/3 byla mnohem menší než původní hodnota j3. Potom bude i každý výraz A/3 • A£i mnohem menší než j3 ■ A£i, takže změnu součinu j3 ■ £i můžeme nahradit diferenciálem d(/3£i) d(P£i) = £idp +/3d£i. (5.4) Při malé změně teploty se tedy ve výrazu Z každý z exponenciálních členů změní na e-0-Si-d(0Si) = e-p-Si-Sidp-pá£i m (55) Znovu využijeme toho, že d(j3£i) je libovolně malé číslo. Můžeme tedy opět použít rovnici 2.35 a exponenciální výraz s maličko změněnými hodnotami j3 a energií vyjádřit jako e-/3.£ť-d(/3£ť) = e-p-St-etáp-páSi = e-P-s> (1 _ E.áp _ pá£i) = e-p-s>-EiiT^dp-p-e-^áEi. (5.6) Součet výrazů e~@'£i ovšem není nic jiného, než hodnota Z před zvýšením /3. Hodnota celého součtu Z po zvýšení j3 proto bude Z — (^^e-^ d/3 - /3j2£^0£'d£^ (5-7) Podle rovnice 2.99 je ale výraz v závorce rovný U ■ Z. Ve druhé sumě můžeme zase podle rovnic 2.93-2.97 dosadit za exponenciální výrazy 5.2. BOLTZMANNOVA KONSTANTA 63 e-^dEi = ^jfdS,. (5.8) Co to znamená? Vzpomeňme, že energie je schopnost konat práci. Změna energie —dSi je tedy práce, kterou vykoná skříňka číslo i v důsledku maličké změny teploty. Hodnota —ví ■ d£i je pak práce, kterou vykonají všechny kouzelné skříňky s energií Si. Součet hodnot —ví ■ dSi pro všechny stavy vydělený celkovým počtem skříněk je průměrná práce vykonaná jednou skříňkou při nepatrné změně teploty dT. Pokud si tuto maličkou průměrnou vykonanou práci označíme — dw, můžeme závorku na druhém řádku zapsat jednoduše jako Zdw. Zjednodušení obou závorek nám říká, že při nepatrném zvýšení j3 a energií se součet exponenciálních členů sníží z hodnoty Z na hodnotu Z ■ (1 — Udj3 — j3dw). Jak se tedy při malé změně teploty změní \ti(Z)1 Pokud si změnu označíme Aln(Z), můžeme psát Aln(Z) = ln(Z • (1 - Ud/3 - /3dw)) - ln(Z) = ln -Ud^ fidw) = ^ _ ^ _ ^ ^ Z Opět využijeme toho, že dj3 je tak malé, že platí l-Udp- pdw = e-UápJ-pjáw, (5.10) takže po dosazení do logaritmu dln(Z) = ln (e-u&P-P&w} = _uáp _ páw, (5 U) Výraz na pravé straně trochu připomíná exaktní diferenciál dU = dq + dw (rovnice 4.86). Abychom však mohli náš výsledek s tímto exaktním diferenciálem porovnat přímo, potřebovali bychom v našem výsledku f3dU místo Ud/3. Toho ale můžeme dosáhnout snadno, když si vzpomeneme jak se počítá diferenciál součinu j3 ■ Sí: d(/3 ■ U) = Udp + pdU. (5.12) Místo — Udf3 tedy můžeme do rovnice 5.11 dosadit f3dU — d(/3 ■ U) a d/3 ■ U) převést s opačným znaménkem na levou stranu. Tak dostaneme dln(Z) + d(/3 • U) = d(ln(Z) + /? • U) = /? • (dU - dw). (5.13) Podle rovnice 4.86 ale není dU — dw nic jiného, než teplo dq. Vidíme tedy, že teplo přijaté kouzelnou skříňkou s naší molekulou se rovná dg=i-d(ln(Z) + /3-E0 = i-dy, (5-14) kde jsme si výraz hi(Z) +/3-U pro jednoduchost označili písmenkem Y. V kapitole 4.4 jsme si dodané teplo vydělené teplotou označili AS. Podle toho tedy dS=^-dY. (5.15) Součin teploty a dosud záhadného čísla j3 tedy spojuje naši novou veličinou Y s entropií S. Veledůležitá otázka v našem pátrání po významu j3 zní: závisí součin teploty a j3 na tom, jakou molekulu zkoumáme, nebo je to univerzální konstanta, stejná pro všechny látky? Abychom nalezli odpověď, podíváme se jak závisí S na Y pro různé molekuly. Pokud bude tato závislost různá, znamená to, že součin T ■ j3 je pro každou látku jiný. Pokud ale bude tato závislost stejná, je T ■ j3 univerzální konstanta. V tom případě bude dY exaktní diferenciál (protože se bude až na konstantu rovnat exaktnímu 64 KAPITOLA 5. ROVNOVÁHY diferenciálu dS) a j3 bude hrát roli integračního faktoru: po vynásobení j3 se z neexaktního diferenciálu dQ stane exaktní diferenciál dY. Podíváme se na dva cukry o kterých jsme si povídali, na fruktózu a glukózu. Přitom budeme zkoumat tři kouzelné skříňky. První s fruktózou, hodnoty y na S1 v této skříňce označíme lf a Sf. Ve druhé skříňce bude glukóza. Hodnoty Y na S ve skříňce s glukózou označíme Yg a Sg. Třetí skříňku vyrobíme tak, že spojíme první skříňku s druhou, tak, aby se vzájemně ovliňovaly jen natolik, aby se udržely v tepelné rovnováze, ale nezměnily se přitom energie jednostlivých stavů kyselin. Hodnoty Y na S ve třetí skříňce označíme lf+g a : 2?0, 2?2; ^3, T^a)- Proto je Zf+g je součet všech členů s různými energiemi £i + T>j, kde i a j se rovnají 0,1, 2, 3, 4: Zf+g = e -0-(Eo+Vo) _ l-e" -/3-(£0+X>i) _ l-e" -/3-(£o+X>2) _ l-e" -0-(Eo+V3) _ l-e" -/3-(£o+X>4) + e" -13-^+Vo) _ l-e" -/3-(£i+X>i) _ l-e" -/3-(£i+X>2) _ l-e" -/3-(£i+X>3) _ l-e" -/3-(£i+X>4) + e" -0-(E2+Vo) _ l-e" -/3-(£2+X>i) _ l-e" -/3-(£2+X>2) _ l-e" -/3-(£2+X>3) _ l-e" -/3-(£2+X>4) + e" -/3-(£3+X>0) _ l-e" -/3-(£3+X>i) _ l-e" -/3-(£3+X>2) _ l-e" -/3-(£3+X>3) _ l-e" -/3-(£3+X>4) + e" -/3-(£4+X>o) _ l-e" -/3-(£4+X>i) _ l-e" -/3-(£4+X>2) _ l-e" -/3-(£4+X>3) _ l-e" -/3-(£4+X>4) (5.17) Členy se stejnou energií isomerních stavů fruktózy můžeme vytknout Zí+e = e-P-£° (e" -/3-X>o _|_ e" e -/3-x>2 ^ + e-^i (e- -/3-X>0 _|_ e" -P-T>i ^ e -/3-x>2 ^ -e-^M _e-^) + 6-^ (e- -0-T>o _|_ e" -/3-X>! ^ e -/3-ľ2 _| -e-^M -e-^) + e-^3 (e- -/3-X>0 _|_ e" -/3-X>! ^ e -/3-x>2 ^ -e-^M -e-^) + e~p-£i (e" -/3-X>0 _|_ e" -/3-X>! ^ e -/3-x>2 ^ -e-^M _e-^) = (e-'3'50 -f + e-/9-£2 + e-/9-£s + e-^) = Zf ■ zg Když spočítáme logaritmus Zf+g = Z f ■ Zg, získáme -p.Vl +e-p-va +e-p-va +e-p-vi> (5.18) ln(Zf+g) = ln(Zf • Zg) = ln(Zf) + ln(Zg). (5.19) K logaritmům přičteme vnitřní energie vynásobené j3. Protože zatím nevíme, jestli je j3 stejné pro různé látky, budeme raději rozlišovat /3f a j3g: ln(Zf+g) = ln(Zf) + ln(Zg)/3f • U{ + f3g ■ Ug. (5.20) 5.3. BOLTZMANNŮV ZÁKON JAKO VZTAH ENERGIÍ A TEPLOTY 65 Ať už se f3 liší nebo ne, vidíme, že veličina Y se sčítá (podobně, jako se sčítá entropie S) Yi+e = Yi + Ye. (5.21) Teď už máme všechno, co potřebujeme k porovnání závislostí S na Y. Podíváme se, co se stane s entropií třetí skříňky, když změníme nejdříve jenom Yf a potom jenom Yg. Když budeme měnit jenom Yf, tak bude změna AYg = 0. Proto platí, že změna AYf+g = Yf. Změnu entropie třetí skříňky spočítáme ASi+g = ASi + ASg=7f^--Yi + 7f^-Yg. (5.22) Protože teď neměníme Yg, můžeme za AYg dosadit nulu a místo AYf psát AYf+g ASí+g = ^-Yí+g. (5.23) Když budeme naopak měnit jenom Yg, tak bude zase změna AYf = 0. Proto bude změna AYf+g = Yg a změnu entropie třetí skříňky spočítáme ASí+g = ASí + ASg=T^-Yí + 1^--Yg. (5.24) Tentokrát dosadíme nulu místo AYf a AYf+g místo AYg ASf+g=^-Yf+g. (5.25) Porovnání rovnic 5.23 a 5.23 jasně ukazuje, že /3f a j3g musí mít stejnou hodnotu. Z toho vyplývá, že T ■ j3 musí být univerzální konstanta, stejná pro všechny látky (nazvěme ji univerzální konstantou R: AS = —!— • AY = R ■ AY. (5.26) T ■ 13 Takto jsme zjistili, že záhadné číslo j3 se rovná p = éř- (5-27) Naše výpočty neříkají, jaká je číselná hodnota konstanty R. To totiž závisí pouze na tom, jaké jednotky používáme a kolik molekul je v kouzelné skříňce. Pokud energii měříme v jednotkách J (joule), teplotu v jednotkách K (kelvin) a ve skříňce je 602 214 076 000 bilionů (lmol) molekul, je hodnota R rovna 8,314 J-K_1-mol_1. Pokud by jednotky energie a teploty byly stejné, ale místo skříněk bychom se bavili o jednotlivých molekulách, byla by hodnota této konstanty 1,38 • 10~23 J-K-1. Toto číslo se obvykle zkracuje k-g nebo jen k a nazývá se Boltzmannova konstanta. 5.3 Boltzmannův zákon jako vztah energií a teploty Odhalení významu čísla j3 bylo poslední, co nám scházelo k určení počtů molekul v jednotlivých stavech pro nejpravděpodobnější makrostav za tepelné rovnováhy. Když si za j3 v rovnicích 2.93-2.97 dosadíme z rovnice 5.27, vidíme, že počty molekul v jednotlivých isomerních stavech závisejí pouze na jejich energiích a teplotě 66 KAPITOLA 5. ROVNOVÁHY n0 e0 e rt e0 e «r N e rt - f e rt - 1 "2 i- e rt - fe e3 rt - f e e4 rt z ni e rt e ht N e rt - f e el rt - i e2 t- e ht - fe e3 iíT - f e e4 rt Z e Hr e ht N e~ rt - fe" el rt - f e rt -e3 fe" e3 iíT - f e" e4 rt Z e3 n-i e Hr e ht N e- rt - fe" el rt - f e ht - fe" e3 rt - f e" e4 rt Z e4 714 e Hr e ht ~N e- ..ÍI1. rt - fe" Irf - fe" rt - f e" "ŘT Z (5.28) (5.29) (5.30) (5.31) (5.32) Získali jsme tedy Boltzmannův zákon jako vztah mezi energiemi jednotlivých stavů a teplotou. Říká nám, že poměry počtů molekul v jednotlivých stavech závisí na rozdílu energií tímto způsobem: ^=e-^ (5.33) n0 neboli AS = Sl - S0 = -R ■ T • ln ( — ) . (5.34) \noJ Stejný vztah platí i pro kanonické soubory kde vnitřní energie je áí e. U = ^--. (5.35) y l e ht o Odhalení významu j3 nám navíc prozradilo, jak souvisí s energiemi jednotlivých stavů entropie. Po dosazení za j3 do rovnice 5.14 neboli áU-T-áS = -R-T -á\n{Z). (5.37) 5.4 Entropie a statistika V našem hledání nejpravděpodobnějších počtů molekul v různých stavech jsem začínali úvahou, že s nejvyšší pravděpodobností najdeme molekuly v takovém makrostavu, který se skládá z největšího počtu mikrostavů. Nejvyšší počet mikrostavů, označený písmenkem fž, pochopitelně znamená také nejvyšší hodnotu logaritmu ln(fž). Zkusme se teď k hledané nejvyšší hodnotě ln(fž) vrátit. Podařilo se nám najít takové počty kouzelných skříněk no, n\, atd., pro které je ln(fž) nejvyšší. Tyto hodnoty můžeme dosadit do rovnice 2.53, ze které jsme vycházeli. Pro jednoduchost se omezíme na tři stavy 0, 1, 2, ale naše úvahy bychom mohli lehce rozšířit na jakýkoli počet stavů. Nejprve dosadíme do rovnice 2.53 hodnotu N z rovnice 2.54 (tedy N = uq + n\ + n2): 5.4. ENTROPIE A STATISTIKA 67 ln(fž)« N ■ hi(N) — N — uq ■ In (no) + no — nx ■ ln(ni) + nx — n2 ■ ln(n2) + n2 = N ■ hi(N) — n0 ■ ln(ng) — nx ■ ln(ni) — n2 • ln(n2). (5.38) Podle Boltzmannova zákona (rovnice 2.84-2.88) je počet molekul ve stavu číslo i tu = N^^. (5.39) V rovnici 2.53 potřebujeme také logaritmus tohoto čísla \n(ni) = \n(N)--^-\n(Z). (5.40) Do rovnice 5.38 dosadíme nejdříve jen za tyto logaritmy ln(íí) « N ■ \n{N) - (n0 + nx + n2) • ln(iV) + n0|^ + nx^= + n2^- + (n0 + nx + n2) • ln(Z). (5.41) lil lil lil Když opět dosadíme no + nx + n2 = N, členy s ln(iV) se odečtou H^^n^+n^+n^ + N-\n(Z) (5.42) a za součet členů s energiemi můžeme dosadit z rovnice 2.90 ln(íí) *^f + N- MZ) = N ■ + ln(^)) ■ (5-43) Podle rovnice 5.36 se změna výrazu v závorce na pravé straně rovnice rovná změně entropie vydělené konstantou R, takže můžeme psát ln(íí) « iV--|. (5.44) Po vydělení obou stran rovnice celkovým počtem molekul N a vynásobení konstantou k 5^2« S. (5.45) Až dosud jsme si veličinu zvanou entropie spojovali pouze se změnou tepla (vydělenou teplotou) za tepelné rovnováhy. Teď ale vidíme, že entropie je přímo úměrná ln(fž). Připomeňme si, že fž nám říká, kolikrát se v souboru molekul vyskytne jeden určitý makrostav, tedy jedna určitá kombinace molekul ve svých různých stavech. Entropie tedy přímo souvisí s počty molekul v jednotlivých stavech. Vraťme se teď úplně na začátek našeho povídání, kdy jsme místo molekul počítali koně. Začínali jsme tím, že jsme počítali kolika způsoby lze zapojit čtyři koně do čtyřspřeží. Došli jsme k číslu 4!, což je šestnáct1 V případě molekul by tomu odpovídala otázka, kolika způsoby lze uspořádat N molekul, pokud každá molekula představuje zvláštní, rozlišitelný stav, který se nemění. Jaké je číslo fž v tomto případě? Počet stavů je stejně velký, jako počet molekul a v každém stavu je právě jedna molekula: no = nx = ■ ■ ■ = njv = 1. Podle vzorce 5.38 ln(f2)«iV • ln(iV) — N — uq ■ ln(no) + no — nx ■ ln(ni) + nx — ■ ■ ■ — njy ■ ln(njv) + riN = N ■ ln(N) - n0 • ln(n0) - nx ■ ln(ni)-----nN ■ ln(njv) = N ■ ln(iV), (5.46) Stejnou odpověď bychom ovšem dostali, i kdybychom se ptali, kolika způsoby lze rozdělit čtyři koně do čtyř ohrad. 68 KAPITOLA 5. ROVNOVÁHY protože no = n\ = ■ ■ ■ = n n = 1 a logaritmus jedničky je nula. Entropie takového souboru molekul je s„^ = Sjí^m = R.HN)_ (5.47) Tento vztah má zajímavou obdobu v informatice. Počítač pracuje s čísly ve dvojkové soustavě. Každé číslo si ukládá jako kombinaci určitého počet nul a jedniček, neboli bitů. Kdyby počítač pracoval s čísly skládajícími se ze čtyř bitů, tedy 0000, 0001, 0010, 0011 atd., mohl by rozlišit jen 24 neboli 16 různých čísel. Když bude počítač pracovat s 32-bitovými čísly, rozliší jich už 232 = 4,3 miliardy. Různých 64-bitových čísel je 264, přibližně stokrát méně, než molekul v kapce vody. K tomu, abychom číslo jednoznačně určili, stačilo by nám položit tolik otázek, s kolika bitů se číslo skládá. V případě čtyř bitů stačí čtyři otázky: „je první bit jednička?", „je druhý bit jednička?", „je třetí bit jednička?" a „je čtvrtý bit jednička?". Jeden bit tedy můžeme považovat za základní jednotku informace: počet bitů nám říká, kolik „kousků informace" nám schází, abychom se dozvěděli informaci celou (přesnou hodnotu čísla). Pokud si počet čísel, která dokážeme rozlišit, označíme N a počet bitů b, tak platí N = 2b, (5.48) ln(N) = b ■ ln(2) (5.49) a konečně ln(N). (5.50) ln(2) Počet bitů má tedy k ln(]V) podobný vztah, jako entropie. Pouze místo konstanty R, srovnávající jednotky entropie s jednotkami teploty a energie, máme bezrozměrné číslo: převrácenou hodnotu ln(2).2 5.5 Samovolné děje Souvislost entropie s počtem mikrostavů nám také pomůžeme lépe porozumět rovnici 5.37 z minulé kapitoly. Co můžeme očekávat od souboru molekul? Ze jej nejspíše najdeme v nejpravděpodobnějším makrostavu, tedy v takové kombinaci molekul v různých stavech, pro které je číslo fž (počet mikrostavů) nejvyšší. Teď vidíme, že číslo fž můžeme popsat veličinou zvanou entropie. Můžeme tedy čekat, že samovolně budou probíhat děje, při kterých fž a entropie rostou. Co nám k tomu říká termodynamika? Analýza tepelných strojů ukazuje, že nejvíce práce vykonají kouzelné skříňky při vratných neboli reverzibilních dějích. Pro změnu funkce w popisující příspěvek k vykonané práci můžeme psát —dw > — dwrev, (5.51) kde —dwrev je příspěvek pro vratný (reverzibilní) děj. Změna vnitřní energie dli ovšem musí být pro vratný i nevratný děj stejná, protože U je stavová funkce dU = dw + dq = dwrev + dgrev (5.52) Z toho vyplývá díjrev — dq = — dwrev + dw > 0. (5.53) Protože změna entropie je definovaná jako 2Kdybychom měřili teplotu v násobcích jednotky energie, tak by konstanta k bylo také bezrozměrné číslo. 5.5. SAMOVOLNÉ DĚJE 69 dS=^, (5.54) musí také platit Clausiova nerovnost dS-jr>Q- (5-55) Pokud budeme dodávat teplo a zároveň udržovat konstantní objem, nebude se konat žádná práce a všechno dodané teplo se přemění na vnitřní energii dS - ^ > 0 => dU - TdS < 0. (5.56) Rozdíl na levé straně už známe z rovnice 5.37. Pokud si označíme U-TS = -R-T ■ ln(Z) = A (5.57) a spočítáme diferenciál dA = dU - TdS - SdT, (5.58) zjistíme, že za konstantní teploty (dT = 0) dA = dU - TdS. (5.59) Vidíme, že pokud je diferenciál (změna) nově zavedené funkce A záporný, probíhá děj za konstantní teploty a konstantního objemu samovolně a pokud je nulový, nachází se systém v rovnováze. Pokud se přitom nemění vnitřní energie, entropie zkoumaného systému, například naší kouzelné skříňky, roste (diferenciál dS je kladný). Tou je v souladu s naším očekáváním, že fž a tedy i entropie se budou při samovolných dějích zvyšovat. Co ale, když se entropie systému (kouzelné skříňky) měnit nebude? Pak podle rovnice 5.66 musí klesat vnitřní energie systému (diferenciál dU je záporný). Mohlo by se zdát, že zvyšování entropie není nutnou podmínkou samovolných procesů. Ze krom entropie rozhoduje o samovolnosti také vnitřní energie. Ale i v tomto případě je samovolnost děje určena zvýšením entropie. Musíme si však uvědomit, že požadavek růstu entropie se vztahuje na celý vesmír. Pokud zafixujeme entropii systému samotného, musí nutně růst entropie okolí. K tomu ale může systém přispět pouze tím, že dodává okolí teplo. A protože mluvíme o systému za konstantního objemu, nekoná se žádná práce a odevzdání tepla musí vést ke snížení vnitřní energie. V rovnici 5.66 je tedy dS změna entropie systému a dU tepelný příspěvek ke změně entropie okolí. Co když udržujeme konstantní tlak, zatímco se objem kouzelné skříňky může měnit? Odpovědět nám pomůže, když si zavedeme novou funkcí H, zvanou entalpie a definovanou H = U + PV (5.60) Diferenciál dH je pak dH = dU + PdV - VdP, (5.61) což je za konstantního tlaku (dP = 0) dH = dU + PdV. (5.62) Za konstantního tlaku odpovídá dH tepelné změně dq: dH = dU + PdV = dq + dw + PdV = dq- PdV + PdV. (5.63) 70 KAPITOLA 5. ROVNOVÁHY Diferenciál entalpie nám tak říká, jaká část změny vnitřní energie odpovídá tepelnému přenosu. Protože systém dodává okolí entropii právě prostřednictvím předaného tepla (dS = Tdq), je celková změna entropie dána kombinací dH — TdS, kde dS je změna entropie systému a dH tepelný příspěvek ke změně entropie okolí. Když si označíme H-TS = G (5.64) a spočítáme diferenciál dG = dH - TdS - SdT, (5.65) uvidíme, že za konstantní teploty (dT = 0) můžeme rovnici 5.66 nahradit vztahem dG = dH - TdS. (5.66) 5.6 Volná energie Funkce A a G nám také říkají, kolik práce lze v nejlepším případě při daném ději za konstantní teploty získat. Když dosadíme do rovnice 5.55 za příspěvek k teplu z první věty termodynamiky (dli = dw+dq), dS-^=dS-á-^>0, (5.67) získáme informaci o maximální práci, kterou může systém vykonat dw > dU - TdS = dA (5.68) Proto se funkce A nazývá volná energie, tedy část energie, která je k dispozici pro konání práce. Přesněji jde o Helmholtzovu volnou energii, která popisuje rovnováhu za konstantního objemu a teploty. Za konstantního tlaku a teploty hraje stejnou roli Gibbsova volná energie G, která zahrnuje objemové změny tím, že nahrazuje vnitřní energii U entalpií H (vybírá z vnitřní energie tu část, která se za konstantního tlaku přemění na teplo dodané okolí) dG = dH - TdS = dU- PdV - TdS = dA- PdV. (5.69) Mezi volnými energiemi je tedy vztah G = A + PV. (5.70) Součin PV, kterým se volné energie liší, mívá pro plyny nezanedbatelnou hodnotu. Objem pevných a kapalných látek, což zahrnuje i roztoky molekul ve vodě, je ale za běžných podmínek tak malý, že je součin PV zanedbatelný a hodnoty Helmholtzovy a Gibbsovy volné energie se liší jen nepatrně. Kapitola 6 Rychlosti The actual science of logic is conversant at present only with things either certain, impossible, or entirely doubtful, none of which (fortunately) we have to reason on. Therefore the true logic for this world is the calculus of Probabilities, which takes account of the magnitude of the probability which is, or ought to be, in a reasonable man's mind. James Clerk Maxwell Matematika: Gaussův integrál, ĽHospitalovo pravidlo, integrování per partes, střední hodnota, hustotní a kumulativní distribuční funkce, derivace při hledání extrémů. 6.1 Kinetická energie ideálního plynu V našem zkoumání fruktózy jsme se zabývali isomerními stavy. Energii molekuly ale ovlivní také ledacos jiného. Energii můžeme zvýšit tím, že budeme molekulu natahovat, ohýbat, kroutit. Energie závisí na tom, v jakých stavech jsou elektrony a jádra atomů, ze kterých se molekula skládá. A energie závisí také na tom, jak se celá molekula pohybuje. Vidíme, že ve skutečnosti se molekuly mohou nacházet v obrovském množství stavů s různými energiemi. Síla Boltzmanova zákona je v tom, že platí nejen pro isomery, ale pro jakékoli stavy.1 Abychom si ukázali příklad využití Boltzmannova zákona pro případ, kdy možných stavů molekuly je nekonečně mnoho, podíváme se na vliv kinetické energie molekuly. Na zkoumání vlivu kinetické energie je fruktóza příliš složitá molekula. Proto budeme postupovat podobně, jako když jsme zkoumali tepelné stroje. Podíváme se na molekuly jednodušší, pro které platí zákon zachováni hybnosti, tedy na ideální plyn. Kinetická energie jedné molekuly je rovná £kin = ^ • m ■ v2, (6.1) kde m je hmotnost a v2 je druhá mocnina rychlosti molekuly. Již v kapitole 4.1 jsme zmínili, že rychlost molekuly je veličina, která má velikost a směr, můžeme ji tedy popsat vektorem v= [vx;vy;vz] , (6.2) kde vx, vy, vz jsou složky rychlosti ve směru osy x, y, z. Druhá mocnina rychlosti bude podle Pythagorovy věty rovná -'-"Určitá úprava je potřebná, aby Boltzmannův zákon vyhovoval kvantové teorii, kterou musíme použít pro zkoumání tak malých částic, jako jsou elektrony. 71 72 KAPITOLA 6. RYCHLOSTI v2 = v2x + v2y + v2z. (6.3) Představme si, že máme obrovské množství molekul ideálního plynu. Každá z nich může mít jinou kinetickou energii. Pokud nebudou na molekuly působit žádné síly zvenčí, budou se molekuly se stejnou pravděpodobností pohybovat všemi směry. Proto budou k celkové energii stejnou měrou přispívat v2, v2 i v2. Abychom získali celkovou průměrnou energii, stačí nám spočítat příspěvek rychlosti v jednom směru (třeba x), a výsledek vynásobit třemi. Při výpočtu se budeme nejdříve muset vypořádat s tím, že v případě kinetické energie ideálního plynu máme nepředstavitelně velký počet stavů. Když bychom si chtěli pro takový soubor molekul napsat rovnici obdobnou 2.99, měli bychom v čitateli na pravé straně součet obrovského počtu členů typu -^•e 2teT, (6.4) kde jsme konstantu R nahradili konstantou fcg, vztaženou na jednu molekulu. Podobně i Z ve jmenovateli bude obrovský součet exponenciálních výrazů e~^r . Energie jednotlivých molekul se liší podle toho, jakou mají molekuly rychlost. Zkusme si nejdříve spočítat průměrnou energii přibližně. Určitý počet molekul, který si označíme n\, se bude ve směru x pohybovat rychlostí větší než nula, ale menší, než nějaké malé číslo Avx. Tyto rychlosti přispějí k celkové energii hodnotou o něco menší než m 12AV'C ■ Přibližně stejný počet molekul (ni) se pohybovat stejně rychle, ale opačným směrem (—x). Tyto molekuly přispějí stejně, protože kinetická energie závisí na druhé mocnině rychlosti. Počet molekul ri2 bude mít rychlost mezi Avx a 2 • Avx a stejný počet molekul se bude touto rychlostí pohybovat v opačném směru. Jejich příspěvek bude o něco nižší než m'(2'^V":c) (ale vyšší než m'(1'^v"=°) y Tak můžeme pokračovat pro vyšší a vyšší rychlosti (v obou směrech). Obdobu rovnice 2.99 tedy můžeme zapsat jako f (1 ■ A^.)2 ■ e'^(1,A^)2 + f (2 ■ A^.)2 ■ e'^(2,A^)2 + f (3 ■ A^.)2 ■ e'^(3'A^)2 + ■ ■ ■ (6-5) Celý zlomek jsme vynásobili třikrát,2 protože stejně přispívá i pohyb ve směrech y a, z. Připomeňme - --i v- / , ~ ~ -i . / m-íi-Av^)2 m-ťYi+lVA-tO2 si, ze rovnice je pouze približná, protože všechny energie v rozmezí mezi —2 ; a —-—^- jsme si nahradili vyšší hodnotou m'((l+iyAv^) _ Tato chyba bude tím menší, čím menší Avx použijeme. Pokud si označíme eí = ^(z.A^.)2.e-^(í'A^)2 (6.6) můžeme rovnici zapsat přehledněji U = Z-J + J + J + --. (6.8) Ci + c2 + c3 + • • • 1 ' 2 Pokud tři tečky za posledním plus znamenají, že sčítáme od nulové vx až po nekonečně velké rychlosti v kladném směru osy x, tak bychom měli čitatele i jmenovatele vynásobit ještě dvojkou, abychom zahrnuli i příspěvky rychlostí v záporném směru osy x. Tyto dvojky se ale ve zlomku zkrátí, proto jsme je v rovnici nepsali. 6.2. GAUSSŮV INTEGRÁL 73 Jak jsme viděli v kapitole 3.5, takové součty velkého počtu téměř spojitě se měnících hodnot se s výhodou dají považovat za integrály. Tou výhodou je, že pro počítání s integrály umíme najít pravidla, která platí, i když se počet členů blíží nekonečnu. Přepis na integrály začneme tím, že jmenovatele i čitatele vynásobíme hodnotou Avx t/ = 3>+e;+e; + ---^. (6.9) (Ci + C2 + Ca + • • ■) Avx 1 ' Teď se čitatel i jmenovatel podobají pravé straně rovnice 3.5, kterou jsme si v rovnicích 3.8 a 3.9 zapsali jako integrál. Stejným způsobem si teď zapíšeme našeho čitatele a jmenovatele: OO OO 2 mv2 J edvx J ^ ■ e_3¥i* • dvx U = 3-^-= 3- ° ^ -. (6.10) / (dvx J e %f • dvx o o V zápisu mezí integrálu jsme zdůraznili, že hodnoty e a C sčítáme pro všechny rychlosti, od nulové až po nekonečně velkou. Abychom neměli v mocninách tak složitý výraz, zavedeme si novou proměnnou (6.11) 2kBT Potom nám v mocnině zbude pouze r2, v čitateli před exponenciálním výrazem číslo • 2fcgT • r2 a místo dv„. dostaneme d [ -i / ■ r } = \ ■ dr OO JĽ^.e-2^rdVx Jf.^.r2.e-r\^2k^,dr Jr2-e-r2-dr U = 3-° „ ,-= 3--5-^-—---= 3kBT^-. (6.12) OO J e~^^dvx J e~r2 ■ ■ dr J e~r2 ■ dr o o o Získali jsme, po čem jsme toužili, zlomek se dvěma poměrně jednoduše vypadajícími integrály. Jediný problém je, že ačkoli na první pohled vypadají získané integrály nevinně, jejich výpočet není vůbec jednoduchý, protože r2 ■ e~r ani e~r nejsou derivacemi žádné funkce, kterou již známe. 6.2 Gaussův integrál Hledání vztahu pro vnitřní energii začneme jednodušším integrálem ve jmenovateli rovnice 6.12, který obsahuje Gaussovu funkci e~r . Pomůže nám geometrie. Místo toho, abychom se ponořili do výpočtů, nakreslíme si graf funkce e~r . Na první pohled by bylo nejjednodušší si na osu x vynášet hodnotu r a na osu y hodnotu e~r . Výhodnější je ale udělat něco zdánlivě složitějšího. Proměnnou r budeme považovat za poloměr kruhu v rovině xy. Podle Pythagorovy věty je pro každý bod, který leží na kružnici v rovině xy, druhá mocnina poloměru této kružnice součtem druhých mocnin souřadnic daného bodu r2 = x2 + y2, (6.13) takže 2 / 2 i 2\ -r -{x +y ) e = e (6.14) Místo dvourozměrného grafu tedy budeme kreslit trojrozměrný a na jednotlivé osy budeme vynášet hodnoty x, y a z = e-^' +v ) (obrázek 6.1). A teď si položíme trochu překvapivou otázku: Jak velký 74 KAPITOLA 6. RYCHLOSTI Obrázek 6.1: Graf závislosti z = e I1 +' ' na i a y. je objem prostoru pod plochou grafu na obrázku 6.1? Se vzorečky pro počítání objemů tak podivných těles se pochopitelně na střední škole nesetkáme. Ale můžeme si pomoci tím, co umíme už z mateřské školky. Představme si, že máme za úkol postavit z kostek dětské stavebnice model tělesa z obrázku 6.1. Výsledek nemůže být samozřejmě dokonalý, plocha na obrázku 6.1 je hladká a náš model z kostek bude nutně hranatý. Pokud ale budou kostičky dostatečně malé, můžeme tvar přibližně vystihnout. Stavbu modelu začneme zjištěním výšky nejvyššího bodu našeho grafu. Obrázek 6.1 ukazuje, že z je nejvyšší pro x = y = 0. Dosazením nul do z = e~^x +v ) snadno zjistíme, že nejvyšší z = 1. Potom postavíme první patro našeho modelu, které bude tvořit jedna vrstva kostek tvořící přibližně čtvrtkruh. Pokud budeme chtít, aby náš model byl vysoký jeden metr a naše kostičky budou mít hranu jeden decimetr, výška prvního patra bude odpovídat hodnotě z = 0,1 m. Pak budeme pokračovat dalšími patry, až po nejvyšší bod. Objem modelu bychom mohli získat snadno tak, že bychom prostě spočítali, kolik kostiček jsme použili a tento počet vynásobili objemem jedné kostky (v našem případě decimetr krychlový, neboli litr). K nalezení vzorečku pro výpočet integrálu J e~r dr nás ale dovede jiný postup. o Celkový objem budeme počítat tak, že nejdříve spočítáme objemy jednotlivých svislých vrstev kostek v modelu. Začneme první svislou vrstvou, ve které bude jen jedna kostka ve směru x. Pokud si označíme rozměry kostek Ax, Ay a Az, bude tloušťka první vrstvy Ax. Jakou plochu bude mít svislá stěna první vrstvy? Bude to součet ploch jednotlivých sloupečků kostek, které první stěnu tvoří. Plocha každého sloupečku je rovná šířce sloupečku Ay vynásobené výškou sloupečku z. Plocha stěny o\ je proto rovná <7! = e-(^2+^y2) . Ay + e-(1'A-2+2'A^) . Ay + e-(i-**2+3-±v2) . Ay + ■ ■ ■ = e-(l.A,)2 . e-(l.Ayf . Ay + e-(l.A,)2 . e-(2-Ayf . Ay + ^(1-A,)2 . e-(W . Ay + ■ ■ ■ = (6.15) 6.2. GAUSSŮV INTEGRÁL 75 Pokud se bude Ay blížit nule, tak můžeme součet na posledním řádku nahradit integrálem, tak, jak jsme součet z rovnice 3.5 nahradili integrálem v rovnici 3.8 in = e-(1Aa')2 • ( J e-v'áy ) . (6.16) Objem první vrstvy bude proto (oo Je-v~dy | • Ax. (6.17) Podobně bude objem druhé vrstvy V2 = (72 • Ax = e-(2Al')2 • e-y2dy } ■ Ax, (6.18) objem třetí vrstvy V3 = v3-Ax = e-(3Aa') • [ J e~y dy | • Ax, (6.19) \0 a tak dále. Celkový objem V = V1+V2 + V3 + --- = (<7! + 0 rovná z + dz, tak integrovaná funkce nápadně připomíná Sni ■ ln(n^ + ôrii) z rovnice 2.66. Podle rovnice 2.66 tedy víme, že ln(z) • dz = ln(z + dz) • dz = d(z • ln(z)) - dz ^> ln(z) = ^ - X> (6-31) takže (6.32) 6.2. GAUSSŮV INTEGRÁL 77 Tímto máme vyhráno, protože v obou integrálech v závorce nemáme před diferenciálem žádnou funkci. Jak již víme z rovnice 3.12, k výpočtu takový integrálů nám stačí znáte mezní hodnoty integrovaných funkcí. V závorce v rovnici 6.33 máme dva integrály. Ten druhý (J dz) je jednoduchý. Výsledkem integrace je přímo rozdíl mezí i dz = 1-0=1. (6.33) Druhý integrál je trochu složitější, musíme spočítat počáteční a konečnou hodnotu z -ln(z). Výpočet konečné hodnoty je snadný: z = 1, In (z) = ln(l) = 0, takže z ■ In (z) = 1-0 = 0. Výpočet počáteční hodnoty je ale oříšek: z = 0, ale ln(0) spočítat neumíme. Logaritmus čísla blížícího se nule klesá do nekonečně velkých záporných hodnot. Čemu se tedy rovná součin z ■ ln(z) pro z blízké nule? Abychom dobře viděli, v čem je problém, je výhodné si z ■ ln(z) zapsat trochu jinak: z-ln(z) = í^Í (6.34) z Užitečnost tohoto na první pohled zbytečně komplikovaného zápisu uvidíme, když si uvědomíme, že jakékoli konečné číslo dělené nekonečně velkým číslem bude nekonečně malé, tedy nulové. Z toho vyplývá, že když se z blíží nule, tak se ^ blíží k nekonečnu. K čemu je nám to dobré? Vždyť v upraveném výrazu nemůžeme dosadit nulu ani za jedno z. Ale můžeme se podívat, co se bude dít, když se z k nule blíží, neboli počítat limitu 1.mM£)=_oo^ z^O -!- OO z Teď vidíme, v čem je problém. Jde vlastně o boj dvou nekonečných výrazů. Pokud se bude čitatel zlomku v limitě blížit k nekonečnu rychleji, než jmenovatel, celý zlomek bude nekonečně velký (se záporným znaménkem). V opačném případě bude celý zlomek bude nekonečně malý, tedy rovný nule. Tato úvaha je v matematice známá jako ĽHospitalovo pravidlo.3 Jak poznáme, která funkce se blíží k nekonečnu rychleji? Nejlépe tak, že zjistíme, jaké jsou směrnice funkcí ln(z) a ^ pro z = 0. Podle vzorečku 4.46 je !Míl = I = z-i. (6.36) dz z K výpočtu derivace funkce ve jmenovateli pravé strany rovnice 6.34 můžeme použít předpis 4.77 pro derivování obecné mocniny který ve své zjednodušené formě (pro konstantní mocninu g a funkci / rovnou proměnné, zde z) říká dz Pro g = — 1 je tedy dz- aZ =gzý-\ (6.37) : -z~z. (6.38) dz Teď se můžeme vrátit k rovnici 6.34. Zjistili jsme, že směrnice v čitateli je^ = z_1a směrnice ve jmenovateli — z~2 = — (\)2 ■ Pro velmi malá z je ^ velké číslo a (i)2 pochopitelně ještě větší číslo. 3Guillaume Francois Antoine, Marquis de FHôpital uvedl toto pravidlo roku 1696 ve své knize o diferenciálním počtu, nejspíš mu je ale ukázal o dva roky dříve Joliann Bernoulli. 78 KAPITOLA 6. RYCHLOSTI Vidíme, že pro z blížící se nule jmenovatel roste rychleji než čitatel, takže celá limita se blíži k nule. Složitější integrál je tedy roven nule. Po dosazení do rovnice 6.33 V = -\-7ľ-(J d(z-Hz))-j dz^J = -I . 7t. (0 - 1) = Ítt. (6.39) Konečně můžeme dosadit za objem do rovnice 6.40 a spočítat integrál ve jmenovateli rovnice 6.12 oo j e-r2dr = W= ^VtF. (6.40) o 6.3 Integrování per partes Ještě nám zbývá spočítat složitější integrál v čitateli rovnice 6.12. Integrály tohoto typu, ve kterých násobíme exponenciální funkci funkcí mocninnou, je obvykle vhodné počítat metodou per partes (česky „po částech"), kterou teď použijeme. Zkusme si spočítat derivaci výrazu r • e~r . Derivace součinu již počítat umíme (vztah 4.55 v kapitole 4.8) d ir 'e 1 de~r" 2 dr de~r = r • —--h e r ■ — = r ■ —--h e r . (6.41) dr dr dr dr Derivaci na pravé straně spočítáme jako derivaci složené funkce (kapitola 4.10) tak, že si —r2 nahradíme proměnnou t a čitatele i jmenovatele vynásobíme dí de r2 dt de* d (-r2) de' dr dí dr dr dí Po dosazení do rovnice 6.41 získáme -2 • r • e~r . (6.42) d ( r • e = -2-r2 -e-r2 +e-r\ (6.43) dr Teď si e~r převedeme na levou stranu a obě strany rovnice vynásobíme dr a vydělíme —2: ie~r2 • dr - (r ■ e~r2) = r2 ■ e~r2 • dr. (6.44) Když vložíme výsledek do integrálu a přehodíme levou a pravou stranu rovnice, uvidíme, proč bylo užitečné spočítat derivaci součinu r • e~r : oo r2 • e-r2 • dr = i j e^2 • dr - i j d (r ■ e^2) . (6.45) 0 0 0 Integrál z čitatele rovnice 6.12, který nám vyšel na levé straně, se rovná rozdílu polovin dvou integrálů. Prvním z nich je integrál ze jmenovatele rovnice 6.12. Před chvílí jsme spočítali, že se rovná •y/ŤF. Druhý integrál můžeme přímo vypočítat jako rozdíl mezních hodnot, protože před diferenciálem 2 nemáme žádnou další funkci. Za počáteční hodnotu integrované funkce budeme považovat součin r -e~r pro nulovou vx a tedy nulové r. Tento součin se rovná nule: 0 • e-°2 =0-1=0. (6.46) 6.4. POČÍTÁNÍ PRŮMĚRU 79 Protože chceme zahrnout všechny možné rychlosti, budeme za konečné s považovat součin r • e~r pro vx jdoucí do nekonečna. Tady si opět budeme musit poradit s poměrem dvou nekonečných čísel. Součin r • e~r si přepíšeme jako zlomek r-e-r2 = ^, (6.47) er ve kterém budeme r zvyšovat do nekonečna. Již na první pohled je jasné, že funkce ve jmenovateli roste exponenciálně, tedy mnohem rychleji, než lineární závislost v čitateli. I bez počítání vidíme, že výsledek bude nula. Pokud bychom chtěli k tomuto závěru dojít výpočtem, spočítali bychom si směrnice čitatele a jmenovatele, jak jsme to udělali pro rovnici 6.34. Směrnice čitatele ^ je jedna. Směrnice jmenovatele je der2 dr2 de7"2 n r2 . = X~ ' 7T = 2 ' r ' e (6-48) dr dr drz a pro r jdoucí do nekonečna také poroste do nekonečna, takže celý zlomek se bude blížit nule. Zjistili jsme tedy, že obě mezní hodnoty jsou nulové, takže celý druhý integrál z rovnice 6.45 se rovná nule. Integrál ve jmenovateli rovnice 6.12 se tedy rovná přesně polovině integrálu z čitatele. 00 2 °° 2 J r2•e~r •dr \ Je~r • dr 1 U = 3kBT^-= 3kBT-£-= 3kBT ■ -. (6.49) J e~r2 • dr J e~r2 • dr o o Po dlouhém počítání jsme tedy dospěli k závěru, že střední energie ideálního plynu souvisí s teplotou velmi jednoduchým vztahem U = ^kBT. (6.50) Zkusme se po získání konečného výsledku podívat na rovnici 6.12 trochu obecněji. Můžeme ji považovat za příklad úkolu, se kterým se setkáme v chemii často: spočítat průměrnou hodnotu nějaké veličiny. Zamysleme se nad tím, co takový úkol vlastně znamená. 6.4 Počítání průměru S počítáním průměru jsme se setkali už v kapitole 4.1, kdy nás zajímala průměrná rychlost ve směru pístu. Obecně můžeme průměrnou hodnotu nějaké veličiny / spočítat n n f i f i i f ^ h Y, f j -j h + h +----H j n i=i i=i ,a r-, \ / =-jv-= ~ = ~- (6'51) Ei i=i Pokud / je funkce proměnné t (například času) a hodnoty / měříme pro pravidelně rozložené hodnoty t (například po pravidelných časových krocích Aŕ), můžeme spočítat průměrnou hodnotu / v intervalu mezi to a íjv = ío + NAt jako n n _ E f (t j) E f (t j) f^) = 3-^N— = 3-^—■ (6-52) E i i=i 80 KAPITOLA 6. RYCHLOSTI Stejný výsledek získáme, když vynásobíme čitatele i jmenovatele Aí: n _ e m)M f(W = ^-■ (6-53) e Aí i=i Zkracování časového kroku Aí —> 0 nám umožní vypočítat průměrnou hodnotu spojitě se měnící funkce /(í) integrováním _ / /(*)dí / /(í)dí /(í) = *L--= - (6.54) to 6.5 Distribuční funkce V předchozí kapitole jsme si popsali výpočet průměru hodnot, z nichž každá k výsledku přispívá stejnou měrou. Například v kapitole 4.1 k průměrné rychlosti přispívala rychlost každé molekuly. V kapitole 2.6 v rovnici 2.55 jsme ale narazili na jiný typ výpočtu. Počítali jsme průměrnou energii ě ne z energií jednotlivých molekul, ale z energií molekul v jednotlivých stavech. Přitom v každém stavu byl počet molekul různý. Každá hodnota (energie molekul ve stavu i) přispívala k průměru různou měrou, podle toho, kolik molekul v daném stavu bylo. Při výpočtu průměrné energie ľ jsme proto museli brát počty molekul do úvahy N ■ ľ = n0 ■ e0 + ni • £i + n2 • £2 (6.55) neboli £ = -j-j: ■ e0 + — ■ El + — • £2 = po ■ £0 + Pi ■ £1 + P2 ■ £2- (6.56) Hodnoty ^ představují váhy, se kterými energie jednotlivých stavů molekul k průměrné energii přispívají. V případě, že k průměru / přispívá každá hodnota /j s váhou pi, musíme výpočet průměru upravit na n n f . f . . f e Pifi e Pifi n J — P1-*1 P2->2 ''' PnJn _ i=i _ i=i _ jy /g Pl+ P2 + --- + PN ^ 1 ~i 1 ^ Pi i=l kde váha pi udává pravděpodobnost, že při měření veličiny / narazíme právě na hodnotu /j. Jednička ve jmenovateli říká, že pravděpodobnost, že při měření narazíme na jednu z možných hodnot, je rovná jedné (100%). Pro spojitou funkci /(í), kde í se může měnit od —00 do +00, mluvíme o takzvané hustotě pravděpodobnosti popsané hustotní (distribuční) funkcí p(t), jejíž integrál přes všechny možné hodnoty í je jedna +00 +00 / p(í)/(í)dí / p(t)f(t)dt +00 = ^-= Z^—í-= / P(*)/(*)dt. (6.58) / p(í)dí -OO 6.6. ROZDĚLENÍ RYCHLOSTÍ 81 Jako příklad si můžeme vzít výpočet průměrné kinetické energie v rovnici 6.10. Omezíme se na to, jak přispívá ke kinetické energii pohyb v jednom směru (podél osy x). Z rovnice 6.10 tak zmizí násobení třemi. Také důsledně vezmeme do úvahy, že se molekuly mohou pohybovat podél osy x oběma směry, takže do průměru zahrneme všechny rychlosti od —oo do +oo. Přitom můžeme stále využít výsledků výpočtů, kde jsme integrovali od 0 do +oo. Průměr kinetických energií je pro rychlosti v jednom směru (od nuly do +oo) stejný jako v opačném směru (od —oo do nuly) a integrál od —oo do +oo je proto prostě dvojnásobek dříve spočítaného integrálu od nuly do +oo. Rovnice 6.10 tak bude mít tvar OO 2 m„2 J HH* . e 2fcBT . dVx U(vx) = ~°° x -• (6.59) J e 2fcBT • dvx — oo V této rovnici je hustotní funkcí e 2fcBT g 2fcBT g 2fcBT g 2fcBT / m m»- J e~^dvx Je^J^dr J^.2je^dr V ^T -oo -oo V 0 (6.60) Tato funkce, známá jako jednorozměrné Maxwellovo-Boltzmannovo rozložení rychlostí popisuje hustotu pravděpodobnosti, tedy s jakou relativní pravděpodobností se molekula ideálního plynu pohybuje ve směru x kterou rychlostí. Pokud se budeme ptát, s jakou pravděpodobností nalezneme složku rychlosti vx v intervalu od vXji do vXj2, získáme odpověď integrací p(vx) v mezích od vXji do vXj2 m ""x e 2»bt. (6.61) 2iTkBT Zvláštním případem takového úkolu je zjistit, jaká frakce molekul se ve směru x nebo — x pohybuje maximálně rychlostí vxjq (nebo jinými slovy, má kinetickou energii menší než trojnásobek mv*-°), Obecně výsledek popisuje kumulativní distribuční funkce vx,o _ vxiq _ u _ .- u f j m _ m"i f j m _ m"l f j m „2 2k^T , 2 f j, / ./-e 2kBTdvx= / ./-e 2k^T dvx = 2 / ./-e \ ——dr = - / e~r dr, J V 27^bT J V 27TkBT J V 27^bT V to ir J (6.62) kde u = ' 2]™T. Tento integrál bohužel nemá analytické řešení. Setkáváme se s ním ale v přírodních vědách a statistice tak často, že má svoje jméno. Výsledná funkce se nazývá error function a značí erf(it). 6.6 Rozdělení rychlostí Hustotní funkci z rovnice 6.60, která popisuje s jakou pravděpodobností má molekula složku rychlosti vx, můžeme použít i k počítání průměrů jiných veličin, než kinetické energie. Výpočet průměru v2, bude velmi podobný < ■ p{vx) ■ dvx = / "bt . div (6.63) 82 KAPITOLA 6. RYCHLOSTI Po zavedení r jako v rovnici 6.12 a převedení integrálu od —oo do +oo na dvojnásobek integrálu od 0 do oo m [2kBT 2 _r2 2kBT, 1 AkBT f 2 = 1 4ä:bT 1 f = 2 / -re W-dr = —= ■- / re dr = —= ■ - ■ - / e dr 2irkBT J m \ m y/Ťř m J y/Ťř m 2 o oo y/ŤŤ m 2 2 m Protože pohyb ve směru jaz přispívá ke kinetické energii stejně 3kBT 1 AkBT l^_kBT (6 64) v2 = v% + v% + ví- = 3i>2 =-. (6.65) Střední kvadratická rychlost (v2) se pak rovná ^ý = ^°^L. (6.66) Ale pozor, tato hodnota se liší od střední (arimetické) rychlosti molekul, kterou bychom spočítali oo v = j v ■ p (v) ■ dv, (6.67) o kde f je velikost rychlosti (bez ohledu na směr). Protože velikost vektoru rychlosti nemůže být záporné číslo, začínáme počítat integrál od nulové hodnoty v. V rovnici 6.67 ovšem máme jinou hustotní funkci p(v), funkci, jejíž proměnnou je velikost rychlosti v. Jak ji zjistíme? K tomu si musíme uvědomit, co nám vlastně hustotní distribuční funkce říká. Počet molekulu s rychlostí vyšší než vx$ a nižší než vx$ + Ai^. můžeme spočítat n(Vxe(vM, + AVx))=N f p(Vx).dVx, (6.68) kde N je celkový počet molekul. Hustotní funkce pro hodnotu vx udává, jaká část molekul dn(vXto)/N se bude pohybovat ve směru x rychlostí v nekonečně úzkém rozmezí mezi vx a vx+dvx. Tuto část můžeme spočítat tak, že At^. v rovnici 6.68 zmenšíme na nekonečně malé dt^. i>x,o+d"Ux ^= / P(vx)-dVx. (6.69) V úzkém intervalu (vxfl; vx$ +dvx) je hodnota p(vx) prakticky konstantní, rovná p(vXto), a můžeme ji tedy vytknout z integrálu i>x,o+d"Ux dn(^'0) = P{vx) f dvx = p(vx)dvx, (6.70) čímž jsme získali, na první pohled zbytečně krkolomně, zpátky definici 6.6. ROZDĚLENÍ RYCHLOSTÍ 83 , x dn(vx,o) dn(vXt0) N J dvx Graficky bychom si integrál v rovnici 6.70 mohli znázornit jako rozdíl vektorů [vx + dvx; 0; 0] — K;0;0]. Jak bude vypadat hustotní funkce, popisující současně hustotu pravděpodobnosti pro vx, vy a vzl Tedy funkce která nám řekne, s jakou pravděpodobností najdeme vx v nekonečně úzkém rozmezí mezi vx a vx + dvx, vy v nekonečně úzkém rozmezí mezi vy a vy + dvy a vz zároveň v nekonečně úzkém rozmezí mezi vz a vz+dvz? Pravděpodobnost nezávislého splnění tří podmínek zároveň je rovna součinu pravděpodobností splnění každé podmínky zvlášť. Frakci molekul s vx v nekonečně úzkém rozmezí mezi vx a vx+dvx popisuje p(vx). Mezi těmito molekulami hledáme ty, které mají navíc vy v nekonečně úzkém rozmezí mezi vy a vy + dvy. Tento ještě menší zlomek z celkového počtu molekul je dán p(vx) ■ p(vy). A z tohoto zlomku nás zajímá jen malá část molekul s vz nekonečně úzkém rozmezí mezi vz a vz + dvz. Z celkového počtu takových molekul bude p(vx) ■ p(vv) ■ p(vz)dvvdvxdvz = , -e 2fcBT • ,/-e 2fcBT • ,/-e 2fcBT dvvdvxdvz H\ x) H\ V) ľ\ z) y y 2TTkBT V ^kBT V ^kBT V / \ — 2 2 2 / \ — / 771 \ 2 _ rnvx + rnvy + mvs / \ 2 rn.t!2 = —■- e_ 2fcB^ dvvdvxdvz = —■- e~ 2fcB^ dvvdvxdvz. (6.72) \2tt kBT) v \2tt kBT) v y ' Graficky bychom si toto rozmezí mohli znázornit jako malou krychličku vymezenou rozdíly vektorů [vx + dvx;vy;vz] - [vx;vy;vz], [vx;vy + dvy;vz] - [vx;vy;vz] a [vx;vy; vz + dvz] - [vx;vy;vz]. Nazvěme si objem jedné takové krychličky dV(vx, vy, vz). Součin p(vx) ■ p(vy) ■ p(vz) ale ještě není hustotní funkce, kterou hledáme. Nás zajímá hustota pravděpodobnosti, že vektor v má velikost v bez ohledu na směr. Pro velikost v = v q tomu odpovídá pravděpodobnost nalezení velikosti v v nekonečně úzkém rozmezí mezi vq a vq + dv. Toto rozmezí si můžeme graficky představit jako nekonečně tenkou slupku pomeranče o poloměru vq. Objem této slupky je roven součtu objemů dV(vx, vy, vz) těch krychliček, jejichž hodnoty vx, vy, vz odpovídají polohám uvnitř slupky. Součet diferenciálů jako dV(vx, vy, vz) je zvykem zapisovat jako integrál slupka = J dV(vx,vy,vz) = J di^di^duj. (6.73) slupka slupka V tomto integrálu jsme výběr krychliček, které sčítáme, označili pouze obecně slovem „slupka". Matematický popis toho, pro která vx,vy,vz leží krychlička uvnitř slupky, není jednoduchý a my se k takovým úlohám dostaneme později. Ted si vystačíme s následující úvahou. Objem slupky je vlastně maličký rozdíl objemů neoloupaného pomeranče o poloměru vq + dv a oloupaného pomeranče o poloměru v0. Se znalostí vzorce pro objem koule4 můžeme tento rozdíl spočítat slupka = ^Tt(v0 + dvf - ^TTvl = ^Tt(v^ + 3v2dv + 3v0dV2 + dV3) - ^tt^g, (6.74) kde vyšší mocniny maličkého dt> můžeme bezpečně zanedbat slupka = ^(^o + 3v2dv) - ^ttvI = 4iTv2dv. (6.75) Výsledek můžeme ovšem zapsat také 4Tento vzorec můžeme odvodit pomocí integrálů podobným postupem, jakým jsme počítali objem tělesa z obrázku 6.1. 84 KAPITOLA 6. RYCHLOSTI vo~\-áv vo~\-áv slupka = 4:T7V2dv = 47TO2 j dv = J i^dv, (6.76) vo v0 protože vq je zároveň hodnota v uvnitř slupky. Počet molekul ve slupce udává integrál hustotní funkce p(vx)p(vy)p(vz) přes celý objem slupky obdobně tomu, jak jsme počítali počet molekul v intervalu (vxq; vx0 + dvx), dnslupka = N J p(vx)p(vy)p(vz)dvxdvydvz (6.77) slupka Uvnitř slupky je hodnota p(vx)p(vy)p(vz) prakticky konstantní, rovná hodnotě pro všechny kombinace, pro které platí v2 + v2 + v2 = v2. Proto můžeme p(vx)p(vy)p(vz) vytknout před integrál jako v rovnici 6.70 dn,jupka = .p(Vx)p(Vy)p(Vz) j dvxdvydvz = p(vx)p(vy)p(vz) ■ V;iupka- (6.78) slupka Za objem slupky můžeme dosadit z rovnice 6.76 vo~\-dv vo~\-dv dn,jupka = p{yx^p{yy^p{yz^ j 47ro2di; = j p(vx)p(vy)p(vz) ■ 47ro2di;. (6.79) vo v0 Počet molekul ve slupce ale můžeme vyjádřit také pomocí hledané hustotní funkce p(v) N slupka Porovnání posledních dvou rovnic nám tak poskytne hledaný tvar hustotní funkce p (v) piv) = p(vx)p(vy)p(vz) ■ 4ttv2 = 4ttv2 ) e ^ . (6.81) Tato funkce je známá jako Maxwellovo-Boltzmannovo rozložení velikostí rychlostí. Na rozdíl od p(vx) nezačíná od minus nekonečna, ale od nuly, a pro v = 0 nemá maximum, ale je rovna nule. Konečně se tedy můžeme vrátit k rovnici 6.67 a spočítat střední aritmetickou velikost rychlosti OO OO 3 3 OO v = í v ■ p(v) ■ dv = í v ■ 4tto2 [ —^— ) e^^Ž7 ■ dv = -^= ( ™ ) / v3e^2^T ■ dv. (6.82) J J \2ttkBTJ y/tt \2kBTJ J 0 0 o Jako v případě rovnice 6.10 si zavedeme proměnnou m -v 2kBT (6.83) V mocnině nám tak zbude pouze r2, před exponenciálním výrazem r3 vynásobené číslem (2*^T) 2 které se zkrátí s výrazem před integrálem, a místo dv dostaneme d [ J 2fcBT - r I = J — • dr 6.6. ROZDĚLENÍ RYCHLOSTÍ 85 OO 4 /2kBT , »r: /ir V m o r3e~r -dr. (6.84) K výpočtu tohoto integrálu použijeme opět metodu per partes. Při počítání integrálu r2e~r v rovnici 6.45 se nám hodilo začít derivací výrazu reTr , s mocninou r před exponenciálním výrazem o jedničku menší, než v integrálu. Zkusme tedy podobně začít derivací výrazu r2e~r d(r2-e~r2) j -r2 j 2 -/ = r2 . + e-r2 . 2L. = -2 ■ r3 • e^ + 2 • r • e~r . (6.85) dr dr dr Po dosazení do integrálu získáme OO OO OO r3-e-r2-dr = ^ j2-r-e~r2 -dr-^ Jd(r2-e-r2^. (6.86) 0 0 o Podle rovnice 6.42 můžeme 2 • r • e r nahradit derivací ~ dr a na pravé straně získáme v obou integrálech pouze diferenciály OO OO OO r3 • e-r2 • dr = -i j d (Vr2) - \fá(r2- *~r') ■ (6-87) 0 0 0 Hodnota prvního integrálu na pravé straně je 0 — 1 = —1. Při vyčíslování druhého integrálu si budeme muset poradit s neurčitým výrazem po dosazení nekonečna za r ve výrazu r2-e-r2 = ^. (6.88) Spočítáme si směrnice čitatele a jmenovatele, jak jsme to udělali pro rovnici 6.34. Směrnice čitatele i 2 je 2 • r. Směrnice jmenovatele je der dr2 der ^ r2 /g gg\ dr dr dr2 V poměru směrnic se nám 2 • r vy krátí a zbývající výraz se pro r —> oo blíží nule. Integrály se tak rovnají / • e^2 • dr = -I |d (e^2) - i | d (r2 • e-2) =-|(0 - 1) - |(0 - 0) = i (6.90) 0 0 0 Po dosazení do vztahu pro střední aritmetickou velikost rychlosti 2kBT f 3 _r2 , 4 /2A;bT 1 /S/jbI1 r"e ' dr = —j=\j-■ — = \j-■ (6.91) Spočítali jsme střední kvadratickou i střední aritmetickou hodnotu velikosti rychlosti ideálního plynu. Jaké hodnoty rychlosti je nejpravděpodobnější? Odpověď pro složku rychlosti vx (a vlastně pro jakoukoli složku a tedy i celý vektor rychlosti v) je jednoduchá. Funkce p{vx) má maximum v nule (pro nulové složky a tedy in pro nulový vektor). To nepřekvapí, protože se molekula může pohybovat oběma směry se 86 KAPITOLA 6. RYCHLOSTI stejnou pravděpodobností, takže průměr všech možných rychlostí je nula. Co je ale nej pravděpodobnější velikost vektoru rychlosti? Bude to hodnota v, pro kterou je hodnota p(v) nej vyšší. A funkce p(v) nemá maximum pro nulovou velikost rychlosti v. Jak víme z kapitoly 3.6, v maximu funkce je její derivace nulová. Spočítejme si tedy dp^ = 4tt (-^—] 2 -:-'- = 4tt f—^— ) ( 2ve-^ - 2-^—i,^^ ) (6.92) dv \2tt kBT J dv \2tt kBT J \ 2kBT Kdy se tato derivace rovná nule? Když je rozdíl v poslední závorce nulový. Nej pravděpodobnější velikost rychlosti v * je tedy řešením rovnice 2v*e~Ľ^r~ - 2-^—(v*Ýe^Ľ^^) = 0, (6.93) 2kBT J 2v*e~^r~ =-(v*)3e~^^, (6.94) kBT (v*)2, (6.95) kBT (6.96) Kapitola 7 Rotace Post hcBC memorabimus corporum ccelestium motum esse circularem. Mobilitas enim SphcercB, est in circulum volvi, ipso actu formám suam exprimentis in simplicissimo corpore, ubi non est reperire principium, nec finem, nec unum ab altero secernere, dum per eadem in seipsam movetur. Nicolaus Copernicus Matematika: Rotace bodu a vektoru v rovině, goniometrické funkce, vektorový součin, součtové vzorce, lineární algebra, matice, nulová, jednotková, inverzní matice, komplexní čísla, derivace goniometrických funkcí, exponenciální tvar komplexního čísla, Eulerův vztah, rotace v prostoru. 7.1 Rotace bodu v rovině Boltzmannův zákon nás učí, jak důležitou roli hraje energie v souborech molekul. Potenciální energie může významně záviset na tom, kde se v prostoru molekula nachází (poloha těžiště), ale také na tom, jak je natočena (orientace). Změnu polohy těžiště beze změny orientace (posunutí všech atomů molekuly stejným směrem o stejný úsek) nazýváme translace, naopak změnu orientace při zachování těžiště (kruhový pohyb jednotlivých atomů) nazýváme rotace. V této kapitole si budeme povídat o rotaci. Můžeme se na ni dívat dvěma způsoby. Za prvé se můžeme snažit popsat rotaci jako jednorázovou událost, definující určitou orientaci. Za druhé můžeme chtít popsat rotaci jako plynulý děj. Ve většině této kapitoly zůstaneme u prvního pohledu. Protože popis rotace není matematicky jednoduchý, začneme analýzou rotace v rovině. Při popisu rotace molekuly si do značné míry vystačíme s popisem rotace jednotlivých bodů představujících jádra atomů. Polohu bodu v rovině můžeme popsat dvěma čísly, souřadnicemi x a y (obrázek 7.1) Například polohu bodu R vzdáleného od počátku souřadné soustavy o čtyři jednotky ve směru osy x a o tři jednotky ve směru osy y můžeme zapsat1 Polohu bodu si můžeme také popsat pomocí polohového vektoru, který začíná v počátku souřadné soustavy (v průsečíku os) a končí v našem bodě. Číselně si tento vektor (říkejme mu r) můžeme zapsat "'Správně bychom měli uvádět za čísly také jednotku, například metr, ale pro jednoduchost jednotky psát nebudeme. R — [Rx',Ry]- (7.1) R= [4; 3]. (7.2) 87 88 KAPITOLA 7. ROTACE y Obrázek 7.1: Různé způsoby popisu rotace bodu. r = [*•*;*•„] = [4;3]. (7.3) Jak uvidíme za chvilku, někdy je šikovnější psát souřadnice do sloupečku r= 3 ■ (7.4) Polohu bodu si ale můžeme stejně dobře popsat pomocí jiných dvou čísel, pomocí délky vektoru r a úhlu p, o který musíme otočit stejně dlouhý vektor ležící ve směru osy x (a začínající v počátku souřadné soustavy), aby mířil do bodu R. S trochou trigonometrie snadno najdeme vztah mezi souřadnicemi bodu a čísly r = |r| (délka vektoru) a p: Rx = r cos ip = \r \ cos p, (7-5) Ry = r sin ip = \r\sin ip, (7-6) neboli r cos ip ■|ř| cos p r srn p \r) sin ip (7.7) Do třetice můžeme zapsat polohu bodu pomocí jednotkových vektorů, tedy vektorů, které míří ve směru jednotlivých os a jejichž délka je rovna jedné. Takové vektory se značí například ux, uy, nebo i, j 7.2. POČÍTÁM S VEKTORY 89 Uy=J = Pomocí nich polohu našeho bodu zapíšeme "4' "ť '0' = 4 • + 3 • 3 0 1 = 4m3. 3uy = Aí + 3 j. (7.9) (7.10) Jaký má smysl zapisovat totéž různými způsoby? Každý způsob zápisu má nějakou výhodu. Souřadnice x,y si umíme snadno představit a jsou nejšikovnější pro kreslení grafů. Použití vektorů nám umožní využít všech pravidel pro počítání s vektory (vektorová algebra), které matematika nabízí. Zápisem pomocí vzdálenosti a úhlu ip nejjednodušeji popíšeme případ, kdy víme, že bod se otočil o určitý úhel. Navíc nám pěkně oddělí popis posuvného pohybu (translace) a otáčivého pohybu (rotace). 7.2 Počítání s vektory Pokud chceme při popisu rotace využít vektory musíme samozřejmě vědět, jak se s vektory počítá. Pravidla pro počítání s vektory jsou jednoduchá a dobře známá, je ale dobré si uvědomit, odkud pocházejí. My si ukážeme pravidla na příkladu jednoduchém příkladu, kdy máme dva body A a B, popsané vektory a a b (obrázek 7.2). Uhly mezi těmito vektory a osou x si označíme a a ji. Naše úvahy nás brzy dovedou mimo oblast kladných souřadnic vektorů. To vyžaduje malé upřesnění hodnot úhlů a a ji. Matematika totiž zachází s úhly dvěma různými způsoby. První způsob chápe to, čemu říkáme sinus a kosinus, čistě jako poměry stran v pravoúhlém trojúhelníku. Hodnoty úhlů jsou proto čísla mezi nulou a pravým úhlem. Druhý způsob chápe sinus a kosinus jako funkce proměnné, kterou je úhel. Hodnoty úhlu jako proměnné mohou být všechna reálná čísla od minus nekonečna do plus nekonečna. Tento druhý způsob je pro popis rotace mnohem šikovnější, protože dokáže rozlišit, jestli se bod otočil kolem středu dvakrát nebo třikrát, jestli se otáčí po směru nebo proti směru hodinových ručiček2 a podobně. V této části budeme ale s úhly zacházet prvním způsobem. Abychom to zdůraznili, budeme hodnoty úhlů psát jako absolutní hodnoty, a a ji, protože nemohou být záporné. A teď již k pravidlům. Počítání je jako hra. Pro počítání s jakýmikoli matematickými objekty (čísla, vektory atd.) potřebujeme definovat hráče a pravidla hry. Nejdůležitější pravidla popisují základní kroky při počítání, sčítání a násobení. Součet vektorů je definován jednoduše součtem jednotlivých souřadnic: a + b = [ax + bx; ay + by] (7.11) neboli ax + bx ay + by (7.12) Toto dává smysl. Pokud se náš bod několikrát posunul v prostoru, jeho výsledné souřadnice jsou součtem souřadnic všech vektorů, které jednotlivá posunutí popisovaly. S násobením to je méně průhledné, u vektorů dokonce máme několik různých operací, kterým se říká „součin". Jednou z nich je skalární součin, jejímž výsledkem je číslo (tedy skalární veličina, která má pouze velikost). Definice skalárního součinu má kořeny v Pythagorově větě. Podle ní je druhá mocnina délky vektoru rovna r2 = r2+r2. (7.13) 2 Platí dohoda, že kladná hodnota úhlu znamená otáčení proti směru hodinových ručiček, tedy od kladného směru osy x ke kladnému směru osy y a dále. 90 KAPITOLA 7. ROTACE y Obrázek 7.2: Počítání s vektory. Za druhou mocninu vektoru je považována druhá mocnina jeho délky. Tak jako druhá mocnina čísla není nic jiného, než násobení tohoto čísla sebou samým, tak definice druhé mocniny vektoru v sobě vlastně skrývá definici součinu r-r= |f|2 = r2. (7.14) Jakousi definici součinu tedy máme, ale dost omezenou. Umíme násobit jenom vektor sebou samým. Pokud budeme chtít spočítat skalární součin dvou různých vektorů, které míří stejným směrem, nebude tak těžké najít řešení. Jeden z vektorů jednoduše vynásobíme poměrem délek a ■ b = a ■ a ■ — = \a\2 = a2 ■ — = ab pokud a || b. (7-15) a a Ale co, když vektory a a b míří různým směrem (obrázek 7.2)? Musíme skloubit dvě pravidla, která už známe: pravidlo pro součet a pravidlo pro druhou mocninu. Začneme součtem. Jak je vidět na obrázku 7.2, vektor b získáme tak, že k vektoru a přičteme nějaký rozdílový vektor c. Čemu se rovná druhá mocnina vektoru cl Spočítejme ji nejdřív stejně, jak jsme zvyklí násobit součty dvou čísel3 c • c = c • (b — a) = c • b — c • a = (b — a) - b — (b — a) ■ a = b ■ b + a ■ a — 2 ■ a ■ b = b2 + a2 — 2 ■ a - b. (7.16) A podruhé spočítejme druhou mocninu podle Pythagorovy věty, tím že si dosadíme druhé mocniny souřadnic vektoru c c-c = c2,+c2 = (bx-ax)2 + (by-ay)2 = b2x+a2x+b2+a2-2(axbx+ayby) = b2+a2-2(axbx+ayby). (7.17) 3Mlčky tím definujeme další pravidlo, že pro skalární součin součtu vektorů platí distributivní zákon (a+b) - c = a-c+b-c. 7.3. SOUČTOVÉ VZORCE 91 Porovnání posledních členů v obou rovnicích nám dává jednu definici skalárního součinu, pomocí souřadnic a ■ b = axbx + ayby. (7-18) Je velmi užitečné vyjdádřit si skalární součin také pomocí úhlu, který vektory svírají. Tentokrát si s různými směry vektorů poradíme pomocí průmětu. Na obrázku 7.2 je kromě vektorů a a b nakreslený ještě vektor p, který je průmětem vektoru b do směru vektoru a. Nakreslením průmětu nám vznikly dva pravoúhlé trojúhelníky se společnou odvěsnou h (což je výška našeho původního trojúhelníku tvořeného vektory a,b,Č). Délku průmětu p spočítáme snadno, protože tvoří odvěsnu pravoúhlého trojúhelníku s přeponou b: p = 6-cos(|/3|-H). (7.19) Podle Pythagorovy věty platí h2 = b2-p2 (7.20) a zároveň h2 = c2 - (a-p)2. (7.21) Dosazením z rovnice 7.20 do rovnice 7.22 c2 = b2 - p2 + (a - p)2 = b2 + a2 - 2ap. (7.22) Porovnáním s rovnicemi 7.16 a 7.17 a dosazením za p z rovnice 7.19 získáme definici skalárního součinu vyjádřenou pomocí souřadnic i úhlů a ■ b = axbx + ayby = ab ■ cos(|/3| — \a\). (7.23) 7.3 Součtové vzorce Dosazením za souřadnice v definici 7.23 navíc získáme známé pravidlo pro kosinus rozdílu úhlů a ■ b = axbx + ayby = acos \a\ ■ bcos \/3\ + asin \a\ ■ 6 sin \/3\ = ab ■ cos(|/3| — \a\) (7.24) a po vydělení ab cos(|/3| — \a\) = cos |or| cos \/3\ + sin \a\ sin \/3\. (7-25) Obdobné pravidlo pro kosinus součtu úhlů bychom získali pro vektor a~ mířící pod osu x (a~ by měl souřadnice [acos \a\; — asin \ot\]), protože pak by byl mezi aT a b úhel |/3| + |or| a~ ■ b = axbx — ayby = acos \a\ ■ bcos \/3\ — asin \a\ ■ Ďsin \/3\ = ab ■ cos(|/3| + |o;|) (7.26) a po vydělení ab cos(|/3| + \a\) = cos |or| cos |/3| - sin \a\sin |/3|. (7.27) A odkud pocházejí pravidla pro sinus rozdílu a součtu úhlů? Pohled na obrázek 7.2 napovídá, že pro vyjádření sinu rozdílu úhlů musíme promítat b do směru vektoru a<, který je oproti a otočen proti směru hodinových ručiček o 90° (a jehož souřadnice jsou [—asin \a\; acos |o;|]) 92 KAPITOLA 7. ROTACE a< ■ b = —aybx + axby = — asm \a\ ■ bcos \/3\ + acos |or| • Ďsin \/3\ = ab ■ sin(|/3| — \a\) (7.28) a po vydělení ab sin(|/3| - \a\) = - sin\a\ cos \/3\ + cos\a\ sin \/3\. (7.29) Konečně pravidlo pro sinus součtu úhlů odvodíme z průmětu b do směru vektoru a-, který je oproti a~ otočen proti směru hodinových ručiček o 90 ° (a jehož souřadnice jsou [asin \a\; acos \ot\]) a- • b = aybx + axby = asin \a\ ■ bcos |/3| + acos |or| • 6 sin |/3| = ab ■ sin(|/3| + \a\) (7.30) a po vydělení ab sin(|/3| + \a\) = sin |or| cos \/3\ + cos \a\ sin \/3\. (7-31) Pomocí pravidel (součtových vzorců), která jsme si právě uvedli, můžeme spočítat souřadnice bodu po otočení, když víme, o jaký úhel A(p se náš bod otočil a jaké byly jeho souřadnice před otočením. Pokud si bod před otočením označíme A a po otočení B, bude A(p = \/3\ — \a\ & a = b = r (vzdálenost od středu a tedy délka vektoru popisujícího polohu bodu se rotací nemění). Dosazením do vzorečků 7.25 a 7.29 získáme soustavu rovnic r2 cos(A<í£>) = axbx + ayby (7.32) r2 s'm(A(p) = -aybx + axby, (7.33) kde neznámými jsou souřadnice bx, by. Pohled na tuto soustavu rovnic nám může podsouvat nedůvěřivou otázku, zda opravdu potřebujeme obě rovnice. Vždyť se zdá, že už v prvním řádku máme všechny parametry. To je ale klam. Hodnota cos(A) 1 ax - ay Čij, Cly V r2 ay r2 sin(A<í£>) ay ax^ Cly ClX by_ ax cos(A<í£>) — ay sin(A(y9) ~bx ay cos(A<í£>) + ax sin(A(y9) by •t (7.60) (7.61) (7.62) 96 KAPITOLA 7. ROTACE ax cos(A) + ay cos(Ay) V by_ cos(Ay) — sin(Ay>) sin(Ay>) cos(Ay) ax bx av by (7.63) (7.64) Na posledním řádku máme velmi důležitý vztah, další způsob popisu rotace. Vektor b, popisující polohu bodu po rotaci, získáme tak, že vektor b, popisující polohu bodu před rotací, vynásobíme takzvanou rotační maticí, obsahující siny a kosiny úhlu Aip, o který se bod otočil. 7.5 Matice a komplexní čísla Je důležité si uvědomit, že jedna rovnice s maticí je vlastně zápis soustavy několika rovnic s (reálnými) čísly. Rovnice s maticemi proto může mít řešení i tehdy, když obdobně vypadající rovnice s (reálnými) čísly je neřešitelná. Například neexistují žádná dvě různá reálná čísla p a q, pro která by existovalo řešení rovnice .2 2 2 t -p = -g , kde t je neznámá (reálné číslo). Obdobná rovnice s maticemi P a Q ale řešení mít může. Pokud P = 1 a Q = i, tak ŕ ■ P2 = -Q2 (7.65) (7.66) ť ■ 1 • 1 (7.67) ť • 1 -(-i) = i, (7.68) což na první pohled platí, když t2 = 1, takže řešení jsou ŕ = 1 a ŕ = — 1. Není na tom nic magického, rovnice 7.66 prostě popisuje něco jiného, než rovnice 7.65. Přepišme si rovnici 7.66 jako zápis soustav dvou rovnic, která popisuje, jak se z vektoru a stane vektor b t 0 t 0 ax bx 0 -1 0 -1 ax 0 t 0 t ay by 1 0 1 0 ay (7.69) Rovnice nám říká, že když obě souřadnice vektoru a dvakrát vynásobíme číslem t (dvojí násobení jednotkovou matici vynásobenou číslem ť), tak dostaneme ten samý vektor b, jako když vektor a dvakrát otočíme o devadesát stupňů proti směru hodinových ručiček (dvojí násobení maticí i). Rešení rovnice nám říká, že stejný vektor dostaneme jen tehdy, když číslo t je jedna nebo minus jedna (to znamená buď s oběma souřadnicemi dvakrát neuděláme nic, nebo dvakrát změníme jejich směr). Jednoduchá geometrie, žádná kouzla. Jak jsme si řekli, maticové rovnice obsahují důležité informace, které nemůžeme zahodit. Počítání s maticemi je ale někdy trochu těžkopádné. Zkusme se teď zamyslet, jestli je možné maticové rovnice přepsat nějak jinak, bez matic. Vezměme si dvě různé matice popisující rotaci, říkejme jim třeba P a Q. Každá z nich odsahuje dvě různá čísla (sinus a kosinus úhlu otočení), označme si jejich pozice v maticích různou barvou (sinus červeně, kosinus modře) P = ä ■ 1 + b ■ i = a b -b a = c ■ 1 + d ■ i = c d (7.70) 7.5. MATICE A KOMPLEXNÍ ČÍSLA 97 Pro tyto matice si napišme základní početní operace, sčítání, násobení a inverzi: P + Q=(a + c)-í + (b + d)-l = \a + C. ~b~d b + a a + c (7.71) P-Q = (ac)-í-í + (bd)-í-í+(bc)-l-í + (ad)-í-í = (ac-bd) -í + (bc+ad)-í = ac — bd —bc — ad bc + ad ac — bd (7.72) P 1 = (a2 + b2)'1 (a • í - b ■ í) = (a2 + b2)'1 a b —b a (7.73) Jakou roli hrají matice 1 a i v těchto operacích? Především fungují jako rozlišovače modrých a červených čísel (kosinových a sinových prvků rotačních matic). U sčítání a počítání inverzní matice se nic dalšího neděje, ale při násobení narazíme na součiny rozlišovačů. Násobení jednotkovou maticí se chová stejně jako násobení jedničkou při počítání s čísly. Ale při násobení dvou matic i platí i • i = — 1 (tak nám z (ac) ■ 1 ■ 1 + (bd) • i • i vznikne (ac — bd) ■ 1)). Při počítání čísly by to znamenalo, že druhá mocnina nějakého čísla se rovná minus jedné. Toto číslo bychom si mohli tedy zapsat Takové reálné číslo ale neexistuje. Z našeho průzkumu výpočtů s maticemi P a Q vyplývají následující postřehy 1. Při počítání jde o to, co se děje s (reálnými) čísly a, b, c, d. 2. Matice 1, i fungují jako rozlišovače (stejné pro jakékoli číselné hodnoty a, b, c, d). 3. Pro matici (rozlišovač) 1 platí stejná početní pravidla jako pro číslo 1. 4. Pro matici (rozlišovač) i platí početní pravidlo, jaké by platilo pro číslo \J— 1, které není v oboru reálných čísel definované. Na základě těchto postřehů můžeme místo maticových rovnic použít zápis podobný počítání s reálnými čísly (vždyť o reálná čísla a,b,c,d koneckonců v našich výpočtech jde), kde matici 1 nahradíme číslem 1 a matici i výrazem Protože mezi reálnými čísly není definováno, co \J— 1 znamená, nemůžeme s ním provádět žádné početní operace. Kdykoli v našich rovnicích na \J— 1 narazíme, tak to prostě opíšeme, protože nevíme, co s tím dělat. Ale to je vlastně výhoda, protože tak se nám čísla násobená \J—1 (červená čísla) nikdy nepomíchají s obyčejnými reálnými čísly (modrými čísly), což je přesně to, co chceme. Jedinou výjimkou je, když dojde k násobení dvou výrazů \J— 1. V tom případě si my budeme definovat, že se rozlišovač \f—\ chová stejně, jako rozlišovač i, tedy (\J— l)2 = —1. Pro jednoduchost místo \J— 1 píšeme v rovnicích písmenko „i". Tomuto rozlišovací se v matematice říká imaginární jednotka a našemu upravenému zápisu rotačních matic se říká komplexní číslo. S použitím komplexních čísel p = a + bi, q = c + di si můžeme naše početní pravidla zapsat p + q = (a + c) + (b + d)i (7.74) pq = (ac — bd) + (bc + ad) i p-1 = - = (a2 + b2y1(a-bi). (7.75) (7.76) 98 KAPITOLA 7. ROTACE 7.6 Goniometrické funkce a jejich derivace Přejděme teď od popisu sinů a kosinů jako poměrů stran pravoúhlých trojúhelníků k výhodnějšímu popisu sinů a kosinů jako funkcí. Grafy těchto funkcí jsou nakresleny na obrázku 7.3. Proto, abychom mohli graf nakreslit, jsme se museli rozhodnout, v jakých jednotkách budeme na vodorovnou osu vynášet hodnoty úhlu. My máme sklon považovat volbu jednotek za nedůležitou formalitu. Do určité míry to je pravda, ale vhodná volba jednotek může značně zjednodušit pravidla pro počítání. Uhly se asi nejčastěji vyjadřují ve stupních. Matematici ale mají rádi jiné jednotky. Uhly s oblibou vyjadřují pomocí oblouku, který ramena úhlu vyseknou z kružnice o vcelku libovolném poloměru r. Velikost úhlu s použitím této jednotky5 se rovná délce oblouku vydělené poloměrem r. Obrázek 7.3: Sinus a kosinus jako funkce. Stejně jako pro jiné funkce, pro funkce sinus a kosinus můžeme počítat derivace, neboli směrnice tečny pro všechny hodnoty p. Na první pohled může počítání derivací působit dojmem nudného a trochu odtažitého cvičení. V případě otáčivého pohybu je to ale zbraň, která míří přímo na komoru. Pravidla pro výpočet směrnice sinu a kosinu jsou velmi jednoduchá a najdeme je už ve středoškolských učebnicích. Opět bude ale dobré se zamyslet, odkud pocházejí. Obrázek 7.4 ukazuje geometrickou úvahu, která k pravidlu pro výpočet derivace sinu a kosinu vede. Pro jakoukoli funkci /, která závisí na jedné proměnné, spočítáme derivaci neboli směrnici tečny velmi jednoduše. Řekněme, že hodnota proměnné v místě tečny je rovna číslu ŕ. Spočítáme hodnotu funkce v noto bodě, pak zvýšíme proměnnou o malou hodnotu Aŕ a spočítáme, o kolik se změnila hodnota funkce. Tuto změnu nazveme A/ a budeme se dívat, k jakému číslu se blíží poměr ^j, když zmenšujeme Aŕ k nule. Pro sinus a kosinus pro úhel p hodnota Aŕ rovná změně úhlu Ap a změna funkce (funkcemi jsou pro nás souřadnice bodu určeného vektorem r podle obrázku 7.4) rovná Ax nebo Ay. Co se stane, když budeme brát menší a menší Ap? Uhel vyznačený na obrázku zeleným obloukem bude bližší a bližší pravému úhlu, takže délka zelené úsečky se bude více a více blížit délce odvěsny pravoúhlého trojúhelníka vyznačeného tečkovanou čarou. Zároveň se bude délce zelené úsečky blížit délka oblouku nakresleného čárkovanou čarou. Jakou roli hraje délka čárkovaného oblouku ve výpočtu derivace? Naprosto zásadní. Pokud vyjadřujeme úhel p a jeho změnu Ap v jednotkách, které jsme si před chvilkou popsali (v obloukové míře neboli v radiánech), tak se pro velmi malá Ap blíží délka zelené úsečky hodnotě rAp. Protože změna souřadnice x je r krát změna kosinu A cos p a změna souřadnice y je r krát změna sinu A sin p, můžeme pro naše funkce poměr ^ vypočítat jako poměry modré (pro kosinus) a červené (pro sinus) odvěsny k zelené přeponě v trojbarevném pravoúhlém trojúhelníku na obrázku 7.4 5 Říká se jí radián, ale je to jednotka bezrozměrná. 7.7. EXPONENCIÁLNI TVAR KOMPLEXNÍHO ČÍSLA 99 pro kosinus6 a A f Ax —rAcosp — A cos ip dcosi^ (7 77) Ar rAp rAp Ap dp A f Ay rAsin —■- (7.78) Aŕ rAp rAp Ap dp pro sinus (jak je v matematice zvykem, naznačili jsme v rovnicích to, že nás zajímají velmi malé změny tím, že jsme místo „A" napsali „d"). A prototože se pro velmi malá Ap blíží úhel mezi zelenou přeponou a červenou odvěsnou hodnotě p, můžeme snadno spočítat Ax = rAp sin p a Ay = rAp cos p. Po dosazení do rovnic 7.77 a 7.78 získáme hledané derivace dcosi^ dp dsin. (7.80) dp y Obrázek 7.4: Derivace sinu a kosinu. 7.7 Exponenciální tvar komplexního čísla Znalost derivací funkcí sinus, kosinus a exponenciální funkce nám umožní dojít k nahrazení rotačních matic něčím, s čím se počítá ještě lépe, než s cos cos i9 cos% ~~ sini^sinx — cos p cos ů sin \ — sin p cos \ cos^sini^ sin p cos ů cos x + cos p sin x — sin p cos ů sin x + cos p cos x sin p sin ů | . (7.93) — sin ů cos x sin ů sin x cos ů Pasivní rotaci, popisující, jak pozorovatel vidí vektor a z různých souřadných soustav, provádíme v opačném pořadí: fa*} / ay, = \az> \ cos x sinx / cos?9 0 — siní? sinx cos x ° o 1 0 0 0 1/ \ sin?9 0 cosi? cos p - sin p 0 sin p cos p 0 \ (ax\ ay / \az (7.94) fax} / ay = \az \ sin p / cos?9 0 siní? cos p ° o 1 0 0 1/ V — sin ů 0 cosi? Když matice roznásobíme, \ (axA ay / \az> (7.95) ax,\ í cos x cos ů cos p — sin x sin p cos % cos i9 sin y> -+ sin x cos \az> i sin ?9 cos p sin ?9 sin - cos x sin ?? sin x sin i9 cos?9 / (7.96) 7.9. ROTACE JAKO DĚJ 103 o-x\ /cos p cos ů cos x — sin f sin X — cos y> cos $ sin x — sin p cos x cosysin^X /a'x\ ay = sm V3 cos ^ cos X + cos V3 s™ X ~~ sin V3 cos ^ sin X + cos V3 cos X sin V3 sin $ I \ a'y ■ azy y — sin?9cosx sin ů sin x cos?9 J \a'zJ (7.97) Jazykem vektorové algebry nazýváme matici goniometrických funkcí úhlů p, •&, x is a transformační matice. Pokud si prvky této matice označíme iífe/fe pro rotaci z původní do „čárkované" soustavy, a iífefe' pro opačnou rotaci, můžeme změnu (transformaci) souřadných soustav popsat pomocí složek vektoru a jako ak, ='^2,Rk,k(-ip,--d,-x)ak ak = ^2 Rkk'(x, v)a-k>■ (7.98) fe fe' Matice složené z prvků Rk'k(—p,—ů,—x) a Rkk' (x, • 0 dx vx = -jj = -ydip = -uy, (7.102) vy = -jj = +xdp = +ujx. (7.103) Získali jsme soustavu dvou diferenciálních rovnic, ale jejich proměnné jsou pomíchané. Separování proměnných dosáhneme jednoduchým trikem. Druhou rovnici vynásobíme imaginární jednotkou a obě rovnice sečteme a odečteme x+iy x+iy t ^^=.(ix-y) = Mx + iy) => f f dQnV + V)) =f™M, xo+iyo x0+iy0 0 (7.104) 104 KAPITOLA 7. ROTACE x — iy x — iy t d{X~'lV) = u{-ix-y) = -iu{x-iy) =>• f d(5 "Í2!0 = f d(ln(x'-iy')) = - ficdť, (7.105) dí J x' — iy' xo-iyo x0-iy0 O kde jsme k nalezení diferenciálu využili vztah 4.46. Výpočet integrálů je pak snadný ln(x + iy) - ln(x0 + iy0) = iwŕ x + iy = (x0 + iy0)eiut = reiv°eiut, (7.106) ln(x - iy) - ln(x0 - iy0) = iwí x - iy = (x0 - iy0)e~[ult = re"i = +FX cos ip + Fy sin ip, y'=—xsimp + ycosp, Fy> = — Fx sinip + Fy cosip, (7.113) z z, Fz' Fz. Když si označíme cos ip = c, siny> = x'Fy< - y'Fx< = (xc + ys)(Fyc - Fxs) - (xs + yc)(Fxs + Fyc) 7.10. VEKTOROVÝ SOUČIN 105 = xFv(c2 + s2) - yFx(c2 + s2) + xFx(-sc + sc) + yFv(-sc + sc) = xFy - yFx = rxy, (7.114) Ty'Z' = y'Fz,-z'Fy, = (-xs+yc)Fz-z(Fyc-Fxs) = (yFz-zFy)c+(zFx-xFz)s = Tyzcosip-Tzxsmip, (7.115) tz>x> = y'Fx>-x'Fy> = z(Fxc+Fys)-(xc+ys)Fz = (zFx-xFz)c-(yFz-zFy)s = -tyzcosip+tzxsmip. (7.116) Srovnání s rovnicemi 7.113 ukazuje, že skalární momenty sil tyz, tzx a rxy se převádějí do čárkované soustavy úplně stejně, jako by to byly složky x, y a z nějakého 3D vektoru. Můžeme proto mluvit o vektoru t = \ryz; tzx; rxy] = [tx; tv; tz\. Není to ale „poctivý vektor", je to jen výsledek určité matematické konstrukce, která funguje jen v trojrozměrném prostoru. Součástí této konstrukce je domluva, že směr t udává v pravotočivé souřadné soustavě pravidlo pravé ruky: K rovině, ve které leží vektory rap, přiložíme malíkovou hranu pravé ruky, prsty ohneme ve směru odrkpa palec určuje směr f. Vektor f je jakýsi přízrak ve světě vektorů, proto se mu říká pseudovektor. V některých strašidelných pohádkách se přízrak pozná podle toho, že se neodráží správně v zrcadle. Podobně odhalí zrcadlo i pseudovektor, protože v zrcadle neuvidíme jeho zrcadlový obraz, ale zrcadlový obraz otočený vzhůru nohama. Pro rovnice 7.112 byl zaveden zjednodušený zápis f = fxF, (7.117) kterému se říká vektorový součin. Pro vektorový součin neplatí stejná pravidla, jako pro skalární součin. Vektorový součin není ani asociativní, ani komutativní (je antikomutativní rxF = —F x r). Moment síly není jediný pseudovektor. Pseudovektorem je každá vektorová veličina odvozená z pravých vektorů pomocí vztahu obdobného rovnici 7.117 neboli soustavě rovnic 7.112. Z veličin, o kterých již byla řeč, jde pseudovektor momentu hybnosti L, definovaný rovnicí L = fxpa pseudovektor úhlové rychlosti uj, definovaný rovnicí v = uj x r. KAPITOLA 7. ROTACE Kapitola 8 Difúze Die Mathematik ist die Königin der Wissenschaften, und die Arithmetik ist die Königin der Mathematik. Carl Friedrich Gauß (podle Wolfganga Sartoria von Waltershausen) Matematika: Hustota pravděpodobnosti, skalární a vekorová pole, vektorová algebra (gradient, divergence, rotace), Gaussova věta, trojný, křivkový, plošný integrál, Stokesova věta. 8.1 Pohyb z místa na místo Důsledky toho, že se molekuly pohybují v prostoru, jsme zkoumali již v částech 4.1 a 4.2. Zatím jsme ale nezkoušeli popsat pohyb molekul jako takový. Proč se vlastně molekuly (a atomy v nich) pohybují z místa na místo? Příčinou může být vnější síla (elektrická, gravitační, síla nějakého stroje), která táhne nebo tlačí všechny molekuly stejným směrem. Molekuly se ale pohybují i tehdy když na ně taková vnější síla nepůsobí. Mohli bychom říci, že se pohybují proto, že nějakým způsobem získaly kinetickou energii, která je úzce spojena s teplotou. Výsledkem je pohyb náhodný, kterému říkáme difúze. Slůvko „náhodný" ale neznamená, že by se pohyb molekul neřídil žádnými pravidly. Pohyb jednotlivých molekul se řídí Newtonovými zákony. To co se děje s velkými soubory molekul, které nelze analyzovat jednoduše, zase můžeme popsat jazykem statistiky. 8.2 Pohyb v přítomnosti vnější síly Zkusme se zamyslet, co se děje s molekulami, když na ně působí vnější síla a jsou přitom vystaveny náhodným srážkám s dalšími molekulami. Působení vnější síly Fex popisuje druhý Newtonův zákon kde jsme zdůraznili, že zrychlení je derivace rychlosti molekuly podle času. Bez srážek s ostatními molekulami bychom okamžitou rychlost v čase t spočítali snadno. Pokud si zvolíme směr osy x podél směru působení síly budou složky rychlosti vy a vz nulové a dv (8.1) ex m a (8.2) t>*(0) o o 107 108 KAPITOLA 8. DIFÚZE kde předpokládáme, že v čase t = 0 je rychlost nulová. Naše molekula se ale s ostatními molekulami sráží a každá srážka okamžitou rychlost (ve všech třech směrech) nepředvídatelně změní. Můžeme tedy o okamžité rychlosti naší molekuly něco říci? Bohužel ne. Něco ale víme o střední hodnotě její rychlosti. Můžeme předpokládat, že náhodné změny rychlosti v důsledku srážek se po určitém čase zprůměrují k nule. Pokud si písmenkem t označíme čas potřebný k tomu, aby se vliv srážek na okamžitou rychlost právě zprůměroval k nule, můžeme rovnici 8.2 využít k tomu, abychom spočítali střední rychlost molekuly během jejího prodírání se davem ostatních molekul1 to K) = — / dí=^r. (8.3) m J m t0—t Na rozdíl od rovnice 8.2 není výsledkem hodnota měnící se v čase, ale hodnota konstantní, protože t je nějaká konkrétní doba, právě tak dlouhá, aby během ní molekula „zapomněla", jakou rychlost měla před časem t a střední hodnota byla tedy dána jenom tím, jak během doby t průměrně urychlí molekulu vnější síla Fex. Při výpočtu střední rychlosti v jakémkoli čase rg začínáme s nulovou rychlostí, protože okamžitou rychlost v čase tg—t stihly srážky s okolními molekulami během doby t zprůměrovat k nule. Vidíme tedy, že při prodírání se davem molekul není vnější síla úměrná zrychlení naší molekuly, jako v rovnici 8.2, ale její střední rychlosti Til Fex = -(vx)=Í(vx). (8.4) t Konstantě úměrnosti, kterou jsme si zkráceně označili £, se říká frikční koeficient. To, že se střední rychlost molekuly nemění, přirozeně znamená, že střední zrychlení molekuly je nulové. Podle druhého Newtonova zákona (rovnice 8.2), ale nulové zrychlení znamená, že výsledná síla je také nulová. Pokud tedy platí náš předpoklad, že se vliv srážek zprůměruje k nule, tak je síla Fex je zcela vyvážena hodnotou £(vx), která představuje odpor prostředí. Tuto rovnováhu sil si můžeme zapsat také Fex - £(vx) = 0. (8.5) 8.3 Translační difúze Podívejme se teď na difúzi, pohyb molekul v nepřítomnosti vnější síly. Difúze je důsledek srážek pozorované molekuly s molekulami v okolí. Difúze mění polohu těžiště molekuly v prostoru (způsobuje translaci) a její orientaci (způsobuje rotaci). V této části se zaměříme na translační difúzi, kterou si můžeme popsat pomocí oblíbeného modelu opilého námořníka.2 Chůze dokonale opilého námořníka je náhodná v tom smyslu, že každý jeho další krok může směřovat jakýmkoli směrem, zcela nezávisle na tom, kam mířil krok předchozí. Když se takový opilec vypotácí z vrat hospody, nelze odhadnout, do jaké další putyky dojde. Můžeme ale studovat, s jakou pravděpodobností jej můžeme v jednotlivých okolních krčmách po čase najít. Stejný přístup budeme aplikovat na difundující molekuly. Opět použijeme představu kouzelné skříňky, ale trochu jinak, než v termodynamice. Naše skříňka bude mít tu vlastnost, že jejími stěnami mohou molekuly volně procházet. Na začátku nebudeme předpokládat nic o jejích rozměrech. Pozdější úvahy nás dovedou k určité představě o její velikosti. Jak uvidíme za chvíli, skříňky jsou velmi malé. Pravděpodobnost, že nějakou molekulu najdeme v čase t uvnitř skříňky o objemu AV = AxAyAz se středem v bodě xo,yo, zq, můžeme spočítat -'-Budeme se snažit rozlišovat, jestli počítáme střední hodnotu jedné molekuly v čase, tu budeme značit (vx), nebo střední hodnotu souboru molekul v určitém okamžiku, kterou bychom značili W^. Mnohé úvahy zejména výpočetní chemie jsou ale založeny na předpokladu, že tyto střední hodnoty jsou stejné (ergodická hypotéza). 2 Pro molekuly v roztoku musíme ovšem model opilého námořníka rozšířit do trojrozměrného prostoru. 8.3. TRANSLAČNÍ DIFÚZE 109 p(x,y, z,ť) dxdydz = J \ f \ f p(x,y, z,t)dz \ dy \ dx, (8.6) kde p{x, y, z, ť) je hustota pravděpodobnosti v bodě x, y, z, odpovídající lokální koncentraci naší molekuly. Setkáváme se tak poprvé s příkladem trojného integrálu, zapsaného nejdříve tak, jak je v matematice zvykem, a potom tak, jak jej ve skutečnosti postupně počítáme. Pokud je skříňka tak malá, že se uvnitř ní hustota pravděpodobnosti prakticky nemění, můžeme vytknout p{x, y, z, ť) před integrály p(x,y,z,t) J \ j \ j dz \dy \dx (8.7) V0-^a V0-%r / / Výpočet je pak triviální. Nejdříve vypočítáme integrál v nejvnitřnější závorce, kde sčítáme příspěvky dz (snadný případ, kdy integrujeme pouze diferenciál) zo + 4r dz = (z0 + ^ - (z0 - ^) ) = Az- (8-8) zo-^ Výsledek dosadíme do prostředního integrálu Azdy = Az y dy = Az(y0 + ^-(m-^y)= AzAy, (8.9) kde jsme mohli Az vytknout před integrál, protože není funkcí proměnné y, a opět integrovali pouze diferenciál. Nakonec dosadíme průběžný výsledek do původního vztahu a hrajeme stejnou hru ™ i í\x i í\x Xq-\-—^- ^OT — p(x,y,z,ť) j AzAydx = p(x, y, z, ť) AzAy j dx = p(x, y, z, ť)AzAy ^x0 + - ^x0 - Ax Ax 2-0--2~ 2-0--2~~ = p(x, y, z, ť)AzAyAx = p(x, y, z, ŕ) A V. (8.10) Při studiu difúze nás ovšem nezajímá pravděpodobnost, že molekula je uvnitř skříňky. Chceme určit pravděpodobnost, že molekula skříňkou proputuje například ve směru osy x. Takovou molekulární turistiku popíšeme pomocí pravděpodobnosti, že molekula ze skříňky, jejíž střed má souřadnice x,y, z, vletí během časového intervalu Ar do skříňky, jejíž střed má souřadnice x + Ax, y, z. Tato pravděpodobnost je rovná pravděpodobnosti, že molekula pohybující se rychlostí se složkou vx se nachází ve vzdálenosti nejvýš vxAt od levé stěny pravé skříňky. Pokud je pravděpodobnost nalezení molekuly letící rychlostí vx v celé levé skříňce p(vx; x, y, z, ť)AV, tak pravděpodobnost nalezení molekuly letící rychlostí vx do vzdálenosti vxAt od stěny je p(vx; x, y, z, t)vxAtAyAz. Očekávaná frekvence přeletů takových molekul z levé skříňky do pravé je tedy p(vx;x,y,z,t)vxAtAyAz -—-= p(vx;x,y,z,t)vx. (8.11) 110 KAPITOLA 8. DIFÚZE Obvykle se uvádí frekvence přeletů mezi skříňkami spočítaná pro jednotku plochy stěny, kterou molekuly prolétají. Takové veličině říkáme tok. Pokud budeme počítat tok molekul letících rychlostí vx z levé skříňky do pravé, vyjde nám t f .s Pfr*'a-"-'ffi°AtA"A* p(vx;x,y,z,t)vxAtAyAz Jx^x+Ax{vx;x,y,z,t) =-——-=-... .-= p(vx;x,y,z,t) vx. (8.12) AyAz AtAyAz Molekuly mohou ovšem cestovat i opačným směrem, z pravé skříňky do levé. Pravděpodobnost, že molekula vletí během časového intervalu Aŕ z pravé skříňky do levé je rovná pravděpodobnosti, že molekula pohybující se rychlostí se složkou —vx se nachází ve vzdálenosti nejvýš vxAt od pravé stěny levé skříňky. Pokud je pravděpodobnost nalezení molekuly v celé pravé skříňce p(vx; x + Ax, y, z, t)AV, tak pravděpodobnost nalezení do vzdálenosti vxAt od levé stěny stěny pravé skříňky můžeme vyjádřit jako p(—vx; x+Ax, y, z, t)vxAtAyAz. Výsledný tok ve směru x je potom rozdíl toků jednotlivými směry Jx(vx;x, y, z, ť) = Jx^x+Ax(vx;x, y, z, ť) - Jx+ax^x(vx; x, y, z, ť) = (p(vx;x,y,z,t) - p(-vx;x + Ax, y,z,t)) ■ vx = -Ap(vx;x,y,z,ť) vx, (8.13) kde jsme rozdíl hustot pravděpodobností výskytu p(vx; x + Ax, y, z, ť) — p(vx; x, y, z, ť) pro jednoduchost označili Ap(vx; x,y,z,ť). Vidíme, že výsledný tok Jx(vx; x,y,z,ť) nejenom způsobuje rozdíl mezi hustotami pravděpodobnosti výskytu molekuly v sousedních skříňkách, ale na tomto rozdílu také závisí. Pokud budou skříňky, mezi kterými molekuly přelétají, velmi malé, můžeme předpokládat, že a i +\ dp(vx;x,y,z,ť) Ap(vx;x,y,z,t) =-—-Ax, (8.14) kde l9p^xg^í/'z't'> je směrnice závislosti p(vx;x,y,z,ť) na x. Parciální derivace zdůrazňuje, že nás zajímá směrnice závislosti p(vx; x, y, z, ť) jen na x, ne na y nebo z. Po dosazení do rovnice 8.13, Jx(vx;x,y,z,t) = -vxAxdp(Vx,^'y'Z,t\ (8.15) ox Očividným omezením našich úvah je, že pořád mluvíme o molekulách pohybujících se nějakou rychlostí vx (zleva doprava) nebo —vx (zprava doleva). Ve skutečnosti se ale rychlost molekul ve směru x po každé srážce změní. Jak se s tím vypořádat? Zatím nám nic neříkalo, jak bychom měli zvolit konkrétní hodnoty Aŕ a Ax. Nic nám tedy nebrání, zvolit si Aŕ rovné času t, za který se vliv srážek na okamžitou rychlost molekul zprůměruje k nule. Stejně tak si můžeme zvolit velikost skříněk tak, že Ax = vxt tí +\ 2 dp(vx;x,y,z,ť) Jx(vx;x,y,z,t) = -vxt-—-. (8.16) Čas t navíc můžeme vyjádřit pomocí frikčního koeficientu £ = to/t t , .s 2m dp(vx;x,y,z,ť) Jx{vx;x,y,z,t) =-vx—--—-. (8.17) Jak nám tyto úpravy pomohou rozšířit neužitečné úvahy o přeletech molekul s určitou rychlostí ve směru x na obecný popis difúze molekul, jejichž rychlost ve směru x se stále mění? Při popisu difúze nemůžeme přece sledovat každou molekulu v každém okamžiku. Můžeme ale počítat střední hodnotu toku ve směru x. Stačí nahradit druhou mocninu rychlosti v našem vztahu její střední kvadratickou hodnotou Jx = -(vl)^-dp{XtZ't]. (8.18) 4 ox 8.4. GRADIENT 111 Získaná veličina Jx se nazývá difúzni tok ve směru x a p(x,y, z, t) ve výsledném vztahu je hustota pravděpodobnosti výskytu jakékoli molekuly v místě x, y, z v čase t. Navíc víme, že m(vx) = |(f2) určuje střední kinetickou energii molekuly (£kin> = ^m(v2) = ^m(vx). (8.19) Je rozumné předpokládat, že střední kinetická energie jedné molekuly vystavené srážkám s ostatními molekulami bude mít stejnou hodnotu jako průměrná kinetická energie všech molekul, která úzce souvisí s teplotou a nemění se v čase, pokud je teplota konstantní. Vidíme tedy, že výraz před parciální derivací je konstantou, která se většinou označuje jako translační difuzní koeficient DtT. Mx,y,z,t) = --^ • M^lM = _D tr 9p(x,y,z,t) 3 £ dx dx (8.20) Protože pohyb molekul při difúzi je náhodný a ve všech směrech stejný (isotropní), můžeme stejné rovnice psát pro difuzní toky ve všech třech směrech Jx{x,y, z,t) = -D Jy(x,y, z,t) = -D Jz(x,y, z,t) = -D tr 9p(x,y,z,t) dx tr 9p(x,y,z,t) dy tr dp(x,y,z,t) dz (8.21) (8.22) (8.23) Celkový difuzní tok je vektorová veličina, kterou můžeme zapsat J(x,y,z,t) = [Jx(x,y,z,t);Jy(x,y,z,t);Jz(x,y,z,t)] = —Dl Tento vztah se nazývá první Fickův zákon. dp(x,y,z,t) dp(x,y,z,t) dp(x,y,z,t) dx dy dz (8.24) 8.4 Gradient První Fickův zákon je pozoruhodný vztah. Říká nám, že když vezmeme skalární veličinu hustotu pravděpodobnosti, která nemá žádný směr, můžeme z ní spočítat vektor difuzního toku J, který má nejen velikost, ale i směr. Aby tento vztah mezi skalární a vektorovou veličinou více vynikl, používá se ve vektorovém počtu zápis \Jx> Jy> Jz\ E) p. (8.25) d d d dx' dy' dz Na pravé straně jsme jaksi vytkli hustotu pravděpodobnosti p z vektoru jejích parciálních derivací. Co v závorce na pravé straně zbylo, vypadá jako vektor. Je to ale podivný vektor, vlastně nesmysl. Předpis pro výpočet tří parciálních derivací něčeho. Čeho ale, to vektor neříká. Takovému neúplnému zápisu se říká operátor. Dává smysl teprve s výrazem, který je uveden za ním a který definuje pro co (pro jaké číslo či funkci) máme předpis využít. Operátoru tří parciálních derivací, který z jedné skalární veličiny vytvoří tři složky vektorové veličiny, říkáme gradient. Protože se s tímto operátorem ve fyzice a v chemii setkáváme často, požívají se pro něj různé zkrácené formy zápisu \Jx> Jy-} Jz\ E) d d d dx' dy' dz J = -Dtrgrad p J = -L>trVp. (8.26) 112 KAPITOLA 8. DIFÚZE 8.5 Derivace vektorových polí Proč jsme v části 8.3 u složek difuzního toku a u hustoty pravděpodobnosti tak tvrdošíjně psali závorku se souřadnicemi (a časem)? Chtěli jsme zdůraznit, že hodnota těchto veličin je v každém bodu prostoru jiná (a mění se v čase). Takovým veličinám se ve fyzice říká pole. Pokud stačí popsat, jak se v prostoru mění velikost nějaké veličiny jde o skalární pole. Příkladem je hustota pravděpodobnosti (nebo lokální koncentrace) v části 8.3, nebo teplota v meteorologických mapách při předpovědi počasí. Pokud musíme popsat, jak se v prostoru mění velikost a směr, jde o vektorové pole. Příkladem je difúzni tok v části 8.3, nebo rychlost větru v meteorologických mapách při předpovědi počasí. Měli bychom si zdůraznit, že v následujícím povídání budeme slovo vektor používat pro popis veličin, které mají velikost a směr ve fyzickém trojrozměrném prostoru, který často popisujeme kartézskými souřadnicemi x, y, z. V matematice mívá slovo vektor i obecnější význam, jako uspořádaná n-tice čísel, pro kterou platí nějaká pravidla (například součet druhých mocnin těchto čísel se při některých operacích nemění). Na příkladu difuzního toku coby gradientu hustoty pravděpodobnost jsme si ukázali, že vektorové pole můžeme vypočítat pomocí parciálních derivací odpovídajícího skalárního pole. Teď se podíváme, k čemu nám poslouží parciální derivace polí vektorových. Předpis pro výpočet gradientu skalárního pole vypadal jako násobení skalární veličiny (například p) vektorovým operátorem V. Může operátor V podobně působit na vektorové pole? Pokud se budeme snažit zapsat zapsat takové působení třeba pro vektor difuzního toku, narazíme na problém hned na začátku. Násobení skaláru vektorem při výpočtu gradientu mělo jednoznačný smysl: každou složkou vektorového operátoru jsme působili na skalár p, tak jako při násobení skaláru vektorem násobíme skalár každou složkou vektoru. Co ale znamená zápis VJ? Vždyť v matematice se slovem „součin" označuje několik různých operací mezi vektory. Musíme tedy předem říci, jaký druh součinu má zápis představovat. V algebře vektorových polí hrají důležitou roli derivace, které připomínají dva druhy součinu: skalární a vektorový. 8.6 Divergence Skalární součin je velmi univerzální matematická operace, která je definována pro jakoukoli dimenzi vektorů v obecném matematickém smyslu. Podmínkou je, aby oba vektory měli dimenzi stejnou. Pro vektory dimenze N je předpis pro skalární součin n ä-b = ^albl. (8.27) i=i Skalární součin je operace komutativní, tedy nezávislá na pořadí (složek) vektorů, které násobíme n n a ■ b = b ■ a = ^""^ ajbj = ^""^ bjCLi. (8.28) i=i i=i Výsledkem skalárního součinu je číslo, skalár. Toto číslo nijak nezávisí na konkrétní volbě souřadné soustavy v obecně ]V-rozměrném (abstraktním matematickém) prostoru, ve kterém skalární součin počítáme. Skalární součin nám definuje i velikost vektoru. Pokud vektor vynásobíme sebou samým, je výsledkem druhá mocnina velikosti n ä ■ ä = \ä\2 = y ' a2. i=i (8.29) 8.6. DIVERGENCE 113 Tento vztah je rozšířením Pythagorovy věty pro ]V-rozměrný prostor. Pokud vektorem a v N-rozměrném prostoru otáčíme, směr a hodnoty jednotlivých složek se mění, ale velikost \a\ je stále stejná. Ve fyzickém trojrozměrném prostoru, popsaném kartézskými souřadnicemi x, y, z, je konkrétní tvar skalárního součinu a ■ b = b ■ a = axbx + avby + azbz = bxax + bvav + bzaz (8.30) Derivaci, která zápisem připomíná skalární součin, se říká divergence. Například divergenci vektorového pole J zapisujeme - - - d div J = V • J = —Jx dx dyv d_j _ dJ^ dz z dx dJy_ dy dJ^ dz .31) Od skalárního součinu dvou opravdových vektorů a & b se divergence ovšem liší tím, že komutativní není. Zápis J ■ V nedává smysl (výsledkem by nebyl skalár, ale nějaký operátor). Význam názvu „divergence" si zkusíme uvědomit na několika jednoduchých příkladech. Do tabulky si zakreslíme grafy vektoru J a zapíšeme odchylku polohového vektoru od počátku souřadné soustavy [Ax; Ay; Az] a odchylku A J = J(x, y, z) — J(0, 0, 0) ve čtyřech místech prostoru vzdálených od počátku souřadné soustavy ve směru x, y, —x a — y vždy o stejnou maličkou hodnotu Ar. Z toho, jak se mění složky vektoru J pak spočítáme divergenci v počátku souřadné soustavy. Začneme příkladem, kdy vektor J bude mít všude v prostoru stejný směr, například podél osy x. Fyzicky by takové pole odpovídalo akváriu, ve kterém by koncentrace molekul klesala zleva doprava a podle prvního Fickova zákona (rovnice 8.24) by difuzní tok směřoval stejným směrem. graf J [Ax;Ay;Az] [AJX; AJy; AJZ] [0; +Ar; 0] [0;0;0] -í- [-Ar;0;0] [0; 0; 0] [+Ar;0;0] [0;0;0] [0;0;0] [0; 0; 0] [0; -Ar; 0] [0;0;0] Čemu se rovná divergence v počátku souřadné soustavy? Ať se pohybuje kterýmkoli směrem, vektor se nemění. Všechny složky jsou konstantní, takže směrnice všech složek jsou nulové dx = 0 3Jy dy Proto je nulová i divergence V • J = dJx d,L, dx dy = 0 dz djh dz = 0. = 0 + 0 + 0 = 0. (8.32) (8.33) To odpovídá grafu v prvním sloupečku tabulky: pole vektorů J se nikam nerozbíhá, tedy nediverguje. Druhý příklad je pole, kde se vektory J sbíhají do středu. Fyzicky bychom si takové pole mohli představit jako akvárium s molekulami zkoumané látky, které bychom ze středu intenzivně odsávali tenkou hadičkou, takže by ve středu byla koncentrace molekul výrazně snížená. Podle prvního Fickova zákona (rovnice 8.24) by v takovém akváriu mířil difuzní tok do středu. V rovině xy takové pole popisuje následující tabulka 114 KAPITOLA 8. DIFÚZE graf J [Ax;Ay;Az] [AJX;AJV;AJZ] \ i [0;+Ar;0] [0;-AJ;0] ->■ -í- [-Ar; 0; 0] [0;0;0] [+Ar;0;0] [+A J; 0; 0] [0;0;0] [-AJ;0;0] t \ [0;-Ar;0] [0;+AJ;0] Když se pohybujeme zleva doprava, hodnota Jx klesá se směrnicí — ^r- Když se pohybujeme zdola nahoru, hodnota Jy klesá se stejnou směrnicí — AjZ. Směrnici ve směru z sice tabulka nezachycuje, ale pro sféricky symetrické pole můžeme předpokládat, že bude stejná: — Divergence je součet těchto směrnic, tedy —3^. Tentokrát je tedy divergence v počátku souřadné soustavy nenulová. Kladná divergence by znamenala pole, které se rozbíhá. Záporná divergence naopak popisuje pole, které se sbíhá. To také odpovídá grafu pole, které se sbíhá do středu. Posledním příkladem je pole, ve kterém se směr vektoru J točí v kruzích kolem středu, kolmo k ose z. Přitom budeme předpokládat, že vektor J bude mít složku Jz = 0 a složky Jx a Jy se nebudou měnit ve směru osy z. Realizaci takového pole pomocí difúze si lze představit obtížně. Můžeme ale J považovat za vektor popisující proudění molekul vířených například pomocí míchátka. Pole vektorů J rotujících kolem středu si můžeme popsat tabulkou graf J [Ax;Ay;Az] [AJX; AJy; AJZ] \ [0;+Ar;0] [-AJ;0;0] i t [-Ar; 0; 0] [0;0;0] [+Ar;0;0] [0; — AJ; 0] [0;0;0] [0;+AJ;0] \ Z1 [0;-Ar;0] [+AJ;0;0] Když se pohybujeme zleva doprava, ve směru x, hodnota Jx se nemění. Když se pohybujeme zdola nahoru, ve směru y, hodnota Jy se také nemění. To, že se vektor J nemění při pohybu ve směru osy z, jsme si řekli při popisu pole. Takže dx 0 ÔJy dy 0 dz 0 (8.34) -t dJx dJv dJz v ■J = ^r + ^r + ^r ox oy oz = 0 + 0 + 0 = 0. (8.35) V tomto příkladu je tedy divergence v počátku souřadné soustavy nulová. 8.7 Rotace Vektorový součin je, na rozdíl od skalárního, matematická operace, která je definována pouze ve fyzickém trojrozměrném prostoru, který můžeme popsat kartézskými souřadnicemi x, y, z. Výsledkem vektorového součinu trojrozměrných vektorů a a b je vektor, jehož složky jsou aybz — azby, azbx — axbz a axby — aybx. Pokud si výsledný vektor označíme c, můžeme psát 8.7. ROTACE 115 a x b = c, kde CLybZ CLZby, azbx - axbz; Čij, by Cly l)X . (8.36) Výsledný vektor můžeme jednoduše popsat geometricky. Jeho velikost je rovná obsahu rovnoběžníku vytvořeného vektory a & b. Výsledný vektor je k vektorům a & b kolmý a jeho konkrétní směr určuje pravidlo pravé ruky: pokud prsty pravé ruky míří od vektoru a k vektoru b, palec ukazuje směr vektoru c. Když si zvolíme kartézskou souřadnou soustavu chytře tak, aby vektor a směřoval ve směru osy x a b ležel někde v rovině xy (taková volba je vždycky možná), budou složky ^ CL g b z nulové, složka ax = \a\ a 0-0-0-^ = 0; cy = 0 • bx - \a\ • 0 = 0; \a\-by-0- bx = \a\ ■ by .37) Vidíme, že (1) vektor c je opravdu kolmý k rovině xy, ve které leží vektory a a b, protože pouze souřadnice cz je nenulová, (2) pro kladné by je cz > 0, jak odpovídá pravidlu pravé ruky a (3) velikost vektoru c je rovná cz = \a\ ■ by, což je obsah rovnoběžníku tvořeného vektory a a b. Na rozdíl od skalárního součinu není vektorový součin komutativní, protože přehození pořadí násobených vektorů otáčí směr výsledného vektoru Cj. by CLZ bZ Cly , Cy bz CLX bx CLZ CZ bXCLy byCLX, což odpovídá změně znaménka vektorového součinu b x a = —a x b. (8.38) (8.39) Derivaci, která zápisem připomíná vektorový součin, se říká rotace. Například rotaci vektorového pole J zapisujeme3 rot J = V x J = o ,J z 0 ,Jy oy oz ^. iJx 0 °z OZ OX o ,Jy o ,Jz ox oy dy 3Jy dz dJx dJz dz dx ÔJy dx dy (8.40) Od vektorového součinu dvou opravdových vektorů a & b se rotace liší tím, že pořadí V a J přehodit nemůžeme, J x V nedává smysl (výsledkem by nebyl vektor, ale nějaký operátor). Význam názvu „rotace" si ukážeme na příkladech stejných polí, jaká jsme použili pro ilustraci divergence. Začneme příkladem, kdy vektor J bude mít všude v prostoru stejný směr podél osy x. graf J [Ax;Ay;Az] [AJx;AJy-AJz] [0; +Ar; 0] [0;0;0] -í- [-Ar;0;0] [0; 0; 0] [+Ar;0;0] [0;0;0] [0;0;0] [0; 0; 0] [0; -Ar; 0] [0;0;0] 3V anglické literatuře se často místo rot J píše curlj. 116 KAPITOLA 8. DIFÚZE Jak již jsme si popsali u divergence, vektor J se nemění, ať se pohybuje kterýmkoli směrem. Všechny složky jsou konstantní, takže směrnice všech složek jsou nulové dJz dJz —- = 0 —-dy dx Proto je nulová i rotace 0 dz 0 dy 0 dx 0 dz 0. V x J = dJz ÔJy dy dz dJx dJz dz dx dJy _ dJx dx dy = [0;0;0], To odpovídá grafu v prvním sloupečku tabulky: pole vektorů J se nijak netočí, nerotuje. Druhým příkladem je pole, pro které jsme spočítali nenulovou divergenci: .41) (8.42) graf J [Ax;Ay;Az] [AJX; AJy; AJZ] \ i [0;+Ar;0] [0;-AJ;0] ->■ Když se pohybujeme zdola nahoru, ve směru y, složka Jx klesá se směrnicí — ^ (pole J míří více a více doleva). Když se pohybujeme zleva doprava, ve směru x, hodnota Jy naopak roste se směrnicí ^ (pole J míří více a více doleva). Takže dJx=_AJ^ dJy = AJ^ dy Ar' dx Ar Po dosazení do rovnice pro výpočet rotace VxJ Ar AJ_ Ar AJ" — 0;0;2— Ar 'dJz _ dJy\ / 9Ja; _ / 9Jy _ ď Ja' dz ) ' \ dz dx j ' \ dx dy (8.48) V tomto příkladu má tedy rotace v počátku souřadné soustavy nenulovou složku z. To nám říká, že směr vektoru J v tomto poli rotuje kolem osy z, což odpovídá obrázku v prvním sloupečku tabulky. 8.8 Tok vektorového pole Při popisu pohybu molekul v prostoru předpokládáme, že se molekuly pohybují, ale nevznikají ani nezanikají. Takový zákon zachování počtu molekul bychom si mohli popsat opět pomocí nějaké kouzelné skříňky. Aby se nám ale tato skříňka nepletla se skříňkou rozměru vxt, pomocí které jsme si definovali difúzni tok J, použijeme místo skříňky kouzelný pytel (obrázek 8.1A). Zkoumané molekuly mohou povrchem takového pytle volně prolétat, přičemž frekvenci, se kterou prolétají jednotkovou plochou povrchu pytle popisuje difúzni tok J. Také budeme potřebovat veličinu, která nám řekne, kolik molekul celkem prolétne za jednotku času povrchem pytle. Takové veličina se většinou označuje písmenem <í>. Protože počítá všechny molekuly, které povrchem prolétnou v jakémkoli směru, není <í> vektor, ale pouze číslo. Rozlišujeme ale molekuly, které vlétají dovnitř pytle (ty počítáme se záporným znaménkem), a ty, které vylétají z pytle ven (ty počítáme s kladným znaménkem). Trochu matoucí může být, že i <í> se označuje jako tok. Aby se nám to nepletlo s difuzním tokem, budeme <í> nazývat celkový tok. Je-li J tok na jednotku plochy a <í> celkový tok, zdá se výpočet $z J jednoduchý: prostě vynásobíme J plochou povrchu pytle. Plochu celého nepravidelného povrchu přitom můžeme získat posčítáním maličkých plošek, jejichž tvar už může být pravidelný. Tak snadné to ale není. Za prvé je J vektor, ale <í> skalár. Za druhé závisí celkový tok také na směru, ve kterém molekuly pytlem prolétají. Vektor J je frekvence průletů na jednotkovou plochu kolmou ke směru J. Vektor J ale může ale mířit šikmo k plošce, ze které v daném místě celkový povrch pytle skládáme. Oba problémy zmíněné v předchozím odstavci vyřešíme tím, že si plošky, ze kterých skládáme povrch pytle, popíšeme pomocí vektoru de?. Velikost tohoto vektoru der je velikost maličké plošky a směr vektoru de? je směr kolmý k povrchu pytle v daném místě. Protože je dc? vektor, můžeme jej rozložit na složky áax, du-y a dcrz. Tyto složky odpovídají průmětům plošky do směrů kolmých na osy x, y a z. Frekvence průletu molekul maličkou ploškou není Jder, ale d$ = J-dc?. (8.49) Skalární součin v tomto vztahu zařídí přepočet frekvence průletů šikmou ploškou der na frekvenci průletů stejně velkou kolmou plochou, ke které je vztažen vektor J. To si můžeme ověřit, když si zvolíme osu x ve směru vektoru J. Potom má vektor J složky J, 0, 0 a počítaný skalární součin je d<í> = J ■ der = Jxdax + Jydffy + Jzduz = J ■ dux + O • duy + O • daz = J ■ dux. (8.50) Jak vidíme, počítaný skalární součin se rovná součinu velikosti J a průmětu plošky der do směru kolmého k J. Tento průmět je přitom přesně tou plochou kolmou k J, na kterou je difuzní tok vztažen. Posčítáním jednotlivých příspěvků d<í> = J ■ de? získáme celkový tok celým povrchem pytle. Toto sčítání si můžeme zapsat jako integrál j d$= J J-de?, (8.51) Cpytel Cpytel kde poznámka pod integrálem připomíná, že počítáme tok celým povrchem pytle erpytei. Pohyb molekul v důsledku difúze vede k tomu, že se mění pravděpodobnost nalezení molekuly v určité části prostoru. Pravděpodobnost, že molekulu nalezneme v kouzelném pytli je J pdV, (8.52) Vpytel kde Ipytei je objem pytle. V důsledku difúze se tato pravděpodobnost mění. Přitom změna pravděpodobnosti nalezení molekuly v pytli se musí rovnat pravděpodobnosti, že molekula zvenku do pytle přiletí. Tedy změnu pravděpodobnosti nalezení molekuly v pytli za jednotku času můžeme vyjádřit pomocí celkového toku molekul ven z pytle. 9pdV = - I J-de?, (8.53) &t ffpytel neboli dpdV+ I J-dc? = 0. (8.54) dt Vpytel Cpytel Tento důsledek zachování celkového počtu molekul se nazývá rovnice kontinuity. 8.9. GAUSSOVA VĚTA 119 8.9 Gaussova věta Rovnice 8.53 definuje, jak spolu souvisí změna hustoty pravděpodobnosti nalezení molekuly v určitém objemu a celkový tok povrchem, který tento objem uzavírá. Otázkou ale zůstává, jak celkový tok spočítat. Začneme tím, že si ukážeme, jak lze celkový tok rozdělit. Představme si, že uprostřed našeho kouzelného pytle máme přepážku, která pytel dělí na levou a pravou polovinu (obrázek 8.1A). Jak spočítáme tok povrchem levé poloviny? Objem levé poloviny je obklopen povrchem levé části pytle a plochou přepážky. Tok tímto povrchem spočítáme d$+ j d$= j J-dS + J J • dřj. (8.55) 0"levá část ^"přepážka zleva ^"leváčást ^"přepážka zleva Označení „přepážka zleva" pod integrálem upozorňuje, že součástí toku ven z levé části pytle je tok přepážkou zleva doprava. Jak spočítáme tok povrchem pravé poloviny? Objem pravé poloviny je obklopen povrchem pravé části pytle a plochou přepážky. Ale pozor! Součástí toku ven z levé části pytle je tentokrát tok přepážkou zprava doleva. d$+ J d$= J J-da + J J-da = J J-do- J J-do. oprava část ^přepážka zprava oprava část ^přepážka zprava oprava část ^přepážka zleva (8.56) Poslední rovnost nám připomíná, že tok přepážkou zleva i zprava má stejnou absolutní hodnotu, ale opačné znaménko. Díky této rovnosti můžeme psát J ■ d(7 = / J -da+ / J -do + / J ■ do + / J ■ do = J ■ do + / J ■ der + / J -da- I J ■ d(7 = / J ■ da + / J ■ do (8-57) Tato rovnice ukazuje, jak můžeme spočítat celkový tok uzavřeným povrchem nepravidelného tvaru. Objem uvnitř tohoto povrchu můžeme rozdělit na dvě menší části, spočítat toky povrchy kolem těchto částí a tyto toky pak sečíst. Pokud můžeme zmíněný objem rozdělit na dvě části, můžeme tyto části dělit dál na menší a menší objemy. Takovým dělením můžeme dospět k maličkým krychličkám s hranami rovnoběžnými s osami x,y,z, ze kterých lze poskládat jakýkoli tvar. Celkový tok povrchem takové malé krychličky lze spočítat snadno. J ■ d*)=D*mE!Ŕ, (8.74) dt dx2 což můžeme také zapsat ^-D« = 0. (8.75) dt dxz Bude difuzní rovnici splňovat i parciální derivace funkce f(x, t) podle xl Zkusme to: d d f (x, t) = d d f (x, t) = gtr d2 df(x,t) =gtr d d2f(x,t)^ dt dx dx dt dx2 dx dx dx2 Když si všechny derivace převedeme na levou stranu, d df(x,t) DtI d d2 f (x, t) = d ídf(x,t) DtTd2f(x,t)\ = ^ dx dt dx dx2 dx \ dt dx2 Pokud ale funkce f (x, t) splňuje rovnici 8.75, je červená závorka v rovnici 8.77 rovná nule. Derivace nuly je ovšem nula, takže je splněna i rovnice 8.77. Vidíme, že pokud nějaká funkce f (x, t) splňuje difuzní rovnici, může být hledaným rozložením hustoty pravděpodobnosti i df(x,t)/dx. Položme si další otázku. Pokud naši rovnici splňuje nějaké rozložení hustoty p(x, t), bude ji splňovat i rozložení v čase a-krát delším a v místě Ď-krát vzdálenějším od počátku souřadné soustavy? Vyzkoušíme to dosazením takového rozložení do naší rovnice dp(bx, ať) = /d2p(bx,at)\ ^ ^ dt V dx2 Derivaci na levé straně spočítáme dp(bx, ať) dp(bx, ať) d(ať) dp(bx, ať) a—7T,—ň—■ (8.79) dt d(at) dt d(at) Výpočet druhé derivace na pravé straně bude trochu delší d2p(bx,at) d ídp(bx,ať)\ d ídp(bx,at) d(bx)\ ^d ídp(bx,ať) dx2 dx \ dx j dx \ d(bx) dx j dx \ d(bx) , d (dp(bx,at)\ d(bx) = 2 d2p(bx,at) d(bx) \ d(bx) ) dx d(bx)2 ' ( ' Po dosazení do rovnice 8.78 8.10. DIFÚZE V KAPILÁŘE 123 dp{bx,ať) = &2£)tr / d2p(bx, ať)' ^ g^ což bude mít tvar rovnice 8.74, pokud b2 = a a a na obou stranách rovnice se vykrátí. Teď si položíme ještě podivnější otázku. Pokud se a vykrátí, tak by vlastně mohlo být a rovno čemukoli. Mohlo by být rovno 1/í? Pokud ano, tak by funkce, která je řešením difuzní rovnice, závisela jen na jedné proměnné u = y/ax = x/y/t, protože at = t j t = 1. Zkusme si takovou funkci f (u) dosadit do difuzní rovnice. Derivace na levé straně teď bude d f (u) = df(u) Ôu = df(u) d(xt-*) = íxt_s df(u) = 1 x df(u) = 1 udf(u) dt du dt du dt 2^ du 2t y/t du 2í" du [ ' ' a derivace na pravé straně d2f(u) _ d fdf(u)\_ d fdf(u)du\_ d j df(u) d(xt~i) \ _ i d (df{u/ dx2 dx \ dx J dx \ du dx J dx \ du dx I dx \ du J = ŕ_i d /df(u)\ du =t_h d /df(u) \ d{xt-%) = id2/H^ d« \ du J dx du V du J dx t du2 Difuzní rovnice tak získá tvar 2 du du Pokud si df(u)/du označíme f (u), Když si uvědomíme, jak se derivují mocninné (rovnice 3.26) a logaritmické (rovnice 4.46) funkce ~áu--2U' ~dJ^-J" (8'86) můžeme difuzní rovnici řešit jednoduchým integrováním /'(«) dln(/V)) = -/ ^ck/2 (8.87) o o ln(/>))-ln(/'(0))= 111^4 = --^ ^5-= e" 4^?. (8.88) u v " yj y " /'(O) 4L>tr /'(O) V ; Po dosazení zpět za f (u) d/H du Zatím jsme nevypočítali funkci f (u), ale jen její derivaci podle u = x/y/t. Ukázali jsme si ale, že pokud splňuje difuzní rovnici nějaká funkce /, tak je řešením difuzní rovnice také parciální derivace / podle x. Pojďme tedy prozkoumat, jak souvisí derivace / podle u s parciální derivací podle x = /'(0)e-ÄíF. (8.89) 124 KAPITOLA 8. DIFÚZE d f (u) = duáfju) = dft d/(M) = r(o)c_-^ (g90) (9x (9x dw cte dw -y/í ' kde /'(O) je zatím neznámá konstanta. Protože víme, že df /dx je řešením difuzní rovnice, můžeme očekávat, že f CO) *2 p{x,ť) = J—7J-e~^-t (8.91) ví odpovídá distribuci hustoty pravděpodobnosti výskytu molekuly popsané druhým Fickovým zákonem. Takto definovaná hustota pravděpodobnosti nám poskytuje informaci o hodnotě /'(O), protože celková pravděpodobnost nalezení molekuly někde v kapiláře musí být rovna jedné. Pro nekonečně dlouhou kapiláru o průřezu a 1 = p{x,ť)dV = o j p{x,ť)dx = o^-^- j e~^-tdx = 2v/Z)trcr/'(0) / e^TĚ^d 2VTÄ7, Vkapilára -OO (8.92) kde výsledný integrál má tvar Gaussova integrálu, který jsme vyřešili v části 6.2. Podle rovnice 6.40 oo oo 1 = 2v/TÄcr/'(0) J e~lS^d ^J—^j = 4v/TÄcr/'(0) J e~lS^d ^J—^j = 2VZ^cr/'(0) VtF -oo 0 => /'(O) =-1- => p{x,ť) =-^-e-t^-t (8.93) My ovšem víme, že df /dx je jen jedním z mnoha řešení. Podívejme se, jaké situaci, nebo přesněji jakým okrajovým podmínkám, toto řešení odpovídá. Pro í = 0 a i ^ 0 se l/VÍ blíží nekonečnu a exponenciální člen nule (protože u2 —> oo pro i^Oa e~°° = 0), takže hodnotu jejich součinu musíme zjistit pomocí ĽHospitalova pravidla. Nejvýhodnější bude zapsat si p(x, 0) jako p(x,0) = limf'(0) —— => p(x,0) = limf'(0) * = lim/'(0)- 9t ^r^2-,-^ 9* ti 0 0 = lim/'(O)- 2 ' = lim/(O) *~ = /'(O)—^ = /'(O)- = 0. (8.94) Pro í = 0ax = 0se?i blíží nule, protože x2 klesá k nule rychleji, než t p(0, 0) = j™/'(0)^ = /'(0) J = oo. (8.95) Vidíme, že hustota pravděpodobnosti nalezení molekuly je v čase t = 0 nekonečná v počátku souřadného systému a nulová všude jinde a v čase t > 0 má stejný tvar, jako Maxwellovo-Boltzmannovo rozložení rychlostí. Takováto distribuce hustoty pravděpodobnosti je limitním případem difúze z okamžitého zdroje, kdy difúze každé molekuly začíná z polohy molekuly přesně v počátku souřadné soustavy, což 8.11. STOKESOVA VĚTA 125 Obrázek 8.2: Cirkulace uzavřenou křivkou (A) a malým čtverečkem (B). odpovídá souboru molekul zahuštěnému do nekonečně malého objemu v počátku souřadné soustavy. V takovém případě je pravděpodobnost nalezení molekuly v místě x = 0 rovná jedné, takže p(0,0)dl/=l => p(0,0) = ± = ^-^ = 00. (8.96) 8.11 Stokesova věta V povídání o tocích vektorových polí jsme zatím nenarazili na výpočet rotace. S ní bychom se setkali, kdyby vektorové pole cirkulovalo. To znamená, že bychom mohli sledovat jak vektor, například J, mění svůj směr podél uzavřené křivky. I když se s takovým tokem u difúze nesetkáváme, můžeme se cirkulací zamyslet. Jako cirkulaci T budeme označovat následující integrál podél uzavřené křivky (obrázek 8.2A) (8.97) Skřivka kde ds má velikost danou délkou kratičkého úseku křivky a směr daný směrem tečny ke křivce v místě tohoto úseku. Při integrování vlastně sčítáme podél celé křivky ty části vektoru J, které míří ve směru tečny ke křivce. Cesta k výpočtu je obdobná jako u celkového toku povrchem. Nejprve si uzavřenou křivku libovolného tvaru rozdělíme na dvě části „zkratkou" a spočítáme integrály levé a pravé části J-ds+ (h J-ds, (8.98) J-ds- 6 J-ds. (8.99) Záporné znaménko v druhé rovnici nás upozorňuje na to, že pokud zkratkou poprvé procházíme ve stejném směru, jako putujeme křivkou, podruhé musíme jít směrem opačným. Cirkulace celou křivkou je pak 126 KAPITOLA 8. DIFÚZE J-ds = (h J-ds + (h J-ds+ (h J-ds- (h J-ds = (h J ■ ds+ (h J-ds ^■křivka ^levá část ^"zkratka oprava část ^"zkratka Mevá část oprava část (8.100) Jak vidíme, křivku můžeme rozdělit na více menších uzavřených křivek, spočítat jejich cirkulace a cirkulaci původní křivkou získat jako součet cirkulací křivkami menšími. V dělení můžeme pokračovat tak dlouho, až si tvar křivky rozdělíme na velké množství maličkých čtverečků. Pro výpočet cirkulace čtverečkem si zvolíme souřadnou soustavu tak, aby osy x & y byly rovnoběžné se stranami čtverečku, označíme souřadnice jednoho rohu čtverečku xo,yo, délku stran Ax a Ay (obrázek 8.2B) a sečteme integrály podél jednotlivých stran a.'0+Aa; yo+Ay a;0 y0 J-ds = J Jx(x,y0)dx+ J Jy(x0 + Ax,y)dy+ J Jx(x,y0 + Ay)dx+ J Jy(x0,y)dy čtvereček %0 VO X0+Ax y0+Ay x0+Ax yo+Ay io+Ai yo+Ay Jx(x,y0)dx+ J Jy(x0 + Ax, y)dy- J Jx(x, y0 + Ay)dx - J Jy(x0,y)dy (8.101) a-'o Vo xo Vo Pokud je čtvereček opravdu malý, můžeme opět předpokládat, že směrnice se v rámci čtverečku významně nezmění. V tom případě dJ Jx(x,y0 + Ay) « Jx(x,y0) + ^Ay (8.102) dy a dJ Jy(x0 + Ax, y) « Jy(x0, y) + ^Ax. (8.103) Proto Xq + Ax Xq + Ax Xq + Ax Xq + Ax J Jx(x,y0)dx- J Jx(x, y0 + Ay)dx = - J -j^-Aydx = —j dx =—^AyAx' Xo Xo Xo Xo (8.104) kde jsme využili toho, že směrnice se v rámci čtverečku nemění a můžeme ji tedy vytknout před integrál. Podobně yo+Ay yo+Ay y0+Ay yo+Ay J Jy{x0 +Ax,y)dy - j Jy(x0,y)dy= J -^Axdx=-^-Ax J dy=-^-AxAy, (8.105) vo vo yo yo takže J-ds=[d^-^)AxAy, (8.106) 8.11. STOKESOVA VĚTA 127 kde AxAy je obsah plochy čtverečku, která je kolmá ke směru z. Protože cirkulace celou křivkou je součet cirkulací všemi čtverečky, můžeme cirkulaci jedním čtverečkem považovat za diferenciál Výraz v závorce ovšem není nic jiného, než složka z vektoru V x J. Protože jsme souřadnou soustavu zvolili tak, aby složky x a y vektoru der byly nulové, rovná se vlastně součin složek z vektorů V x J a der skalárnímu součinu těchto vektorů dr= (V x J) -do. (8.108) Cirkulace celou křivkou pak je J-ds= J (VxJ)-dff, (8.109) ^"křivka kde (Tkřivka je plocha ohraničená křivkou. Tento vztah se nazývá Stokesova věta. Zkusme si teď položit kacířskou otázku. Co kdyby J přece jen byl difuzní tok? Pak by podle prvního Fickova zákona (rovnice 8.24) muselo platit J = — DtľWp. O kolik se změní hustota pravděpodobnosti, když se po naší křivce posuneme o vzdálenost ds, tedy o dsx ve směru x, o dsy ve směru y a o dsz ve směru z? Změna dp bude záviset na směrnicích v jednotlivých směrech dp dp dp TTdsx + TT^Sy + — dx dy dz Cirkulace křivkou tedy bude dP = TTZds* + TTdsy + 7Tdsz = ' d3- (8.110) T = -Dtľ (J) Vp-ds = -Dtľ (J) dp. (8.111) Skřivka ^křivka Když ovšem posčítáme všechny maličké změny po celé uzavřené křivce, musíme nám vyjít nula, protože nakonec dojdeme k místu se počáteční hodnotou p. To ale podle Stokesovy věty znamená -DtT J [V x Vp) • do = 0. (8.112) Okřivka Pokud toto má platit pro jakoukoli plochu (Tkřivka, musí se nule rovnat výraz, který integrujeme VxVp = 0. (8.113) Stokesova věta nám nejen vysvětlila, proč difuzní tok nemůže cirkulovat, ale také poskytla důležitý matematický vztah: rotace gradientu jakéhokoli skalárního pole je nulová. KAPITOLA 8. DIFÚZE Kapitola 9 Koule Jakživ neviděl národ Birimarataoův něco tak velkolepého a nadlidského; neboť i když jejich kněží dovedli všechno možné, kouli stvořiti nedovedli, a proto byla jim mořská perla posvátnou. Eduard Bass Matematika: Gradient, divergence a Laplaceův operátor ve sférických souřadnicích, integrování ve sférických souřadnicích, parciální a obyčejné diferenciální rovnice druhého řádu, separace proměnných, substituce, derivace součinu, druhé derivace goniometrických funkcí, okrajové podmínky, Frobeniova metoda, Legendrova rovnice, mocninné řady, sférické harmonické funkce. 9.1 Gradient ve sférických souřadnicích Popis rotace v prostoru nám umožňuje popsat polohu v prostoru nejen pomocí kartézských souřadnic x,y,z, ale také pomocí vzdálenosti r od počátku souřadné soustavy a pomocí úhlů ů,(p z části 7.8. Posunutí bodu z počátku souřadné soustavy o hodnoty rx,ry,rz ve směrech x,y,z je totiž totéž, jako posunutí o hodnotu r = \Jr2 + r2 + r2 ve směru z, otočení kolem osy y o úhel ů (inklinaci) a otočení kolem osy z o úhel ip (azimut). Čísla r,ů,(p se nazývají sférické souřadnice a s kartézskými souvisí následujícími vztahy x = r sin •& cos ip, y = r sin •& sin ip, = rcosů. (9.1) Při zkoumání difúze, ale i dalších dějů popsaných skalárními a vektorovými poli, často narazíme na případy se sférickou symetrií. V těchto případech je přirozené (a pro nalezení matematického řešení v podstatě nutné) pracovat ve sférických souřadnicích. Převedení Fickových zákonů do sférických souřadnic ale není jednoduchý úkol. Prvním úskalím je výpočet gradientu, se kterým se setkáme již v prvním Fic-kově zákonu. Gradient (vyjádřený jak pomocí složek, tak pomocí jednotkových vektorů u x j ^y i Ú z) dp dp dp dx' dy' dz dp_ dp . dx dy dp dz (9.2) v kartézských souřadnicích x, y, z nám říká, o kolik se změní hodnota p, když se ve směru x posuneme o vzdálenost dx, ve směru y posuneme o vzdálenost dy a ve směru z posuneme o vzdálenost dz. Totéž musí gradient říkat i ve sférických souřadnicích. Složky vektoru V ve sférických souřadnicích nebudou jednoduše směrnice závislosti p na r, •& a ip, ale na vzdálenostech, o které se v prostoru posuneme, když 129 130 KAPITOLA 9. KOULE Obrázek 9.1: Infinitezimální posunutí v důsledku změn sférických souřadnic (A) a jednotkové vektory Úr,Ú^,Úv (B). tyto souřadnice změníme. Pokud si vzdálenost, o kterou se posuneme při maličké změně i-té souřadnice, označíme si; bude mít gradient ve sférických souřadnicích tvar nikoli dp dp dp dsr' ds$ ' dsv dp dp dp dr' dů' dtp dp _ dp -^—ur + -— dsr ds$ dp dp _ dp _ dp _ . . &řUr + ~d~ůUS + Jhp^' (špatně)! (9.3) (9.4) Vzdálenost si; o kterou se posuneme při maličké změně i-té sférické souřadnice, musí být rovná délce změny polohového vektoru r při změně sférické souřadnice. Při změně souřadnice r o dr se pochopitelně změní délka vektoru r o dr, takže dsr = dr (zelená úsečka na obrázku 9.1A). Při změně souřadnice ů o dů se vektor r pootočí tak, že jeho konec opíše na „poledníku" koule o poloměru r oblouček o délce ds$ = rdů. Konec vektoru r se přitom pohybuje po poledníku „jižním" směrem (červený oblouček na obrázku 9.1A). Konečně při změně souřadnice ů o dů se vektor r pootočí tak, že jeho konec opíše na „rovnoběžce" koule o poloměru r oblouček délky dsv směrem na východ. Protože poloměr „rovnoběžky" při „zeměpisné šířce" udané úhlem ů je rovný rsin?9, je délka obloučku dsv = rsinůdíp (modrý oblouček na obrázku 9.1A). Když to shrneme, vztah mezi změnou i-té sférické souřadnice a výslednou vzdáleností posunutí s j můžeme popsat škálovacím faktorem hi dsy dsfl ds dsr = ——dr = hr-dr = 1 -dr, ds$ = —— ď& = h$-ď& = r-dů, dsv = ——dtp = hv-dtp = r sinů-dip. dr dů dip (9-5) Směr, kterým se při změně i-té sférické souřadnice posuneme, můžeme popsat jednotkovým vektorem Ui. Přitom ur bude z místa určeného vektorem r mířit ve směru r (pryč od středu, k vyšší „nadmořské výšce", ve směru zelené šipky na obrázku 9.1B), u$ bude mířit „k jihu", ve směru červené šipky na obrázku 9.1B, a uv „k východu", ve směru modré šipky na obrázku 9.1B. Protože směry „na jih", „na 9.1. GRADIENT VE SFÉRICKÝCH SOUŘADNICÍCH 131 východ" a „vzhůru" jsou navzájem kolmé, vidíme, že i sférické souřadnice jsou pravoúhlé (ortogonální), stejně jako souřadnice kartézské. Proto také pro nekonečně malé změny platí Pythagorova věta. ds2 = ds2 + ds2, + ds2v = h2 ■ dr2 + h% ■ dů2 + h2v ■ dp2 = dr2 + r2 ■ dů2 + r2 sin2 ů ■ dp2 (9.6) Směry jednotkových vektorů ur, u$ a uv jsme si popsali slovně, jak je ale vyjádřit matematicky? V případě ur je to jednoduché, protože ur míří podél f, takže ur = r/\r\. Pro ostatní jednotkové vektory se ale nevyhneme složitějším výpočtům. Nejpřímočařejší je asi uvědomit si, že velikost změny vektoru r udávají hi a směr jednotkové vektory. Proto můžeme změny vektoru f (tedy změny kartézských souřadnic) způsobené změnami jednotlivých sférických souřadnic popsat jako dr dr dr ^ — = hrur, — = hsus, 7j- = hvuv (9.7) Z toho vyplývá Q-r-Q-r=h2r^-Ur = h2r, —. — =h2Uů-Uů=h2, —. — =hluv-Uv = hl (9.8) ur = 1 dr _ 1 dr _ 1 dr ^ hr dr' h$ dů' v hv dtp Zatímco hodnoty hi bychom si mohli spočítat z rovnic 9.8 (kdybychom k nim už dříve nedošli prostými geometrickými úvahami), rovnice 9.9 nám poslouží k zápisu vektorů ur, u$ &uv v kartézských souřadnicích. Nejdříve si ovšem musíme spočítat, jak se mění kartézské souřadnice se změnou sférických souřadnic. Vyjdeme z definic sférických souřadnic a podrobíme je příslušným parciálním derivacím hrilr = ur : hfiUfi = ru$ : hvuv = rsmůu^ x = rsmůcosp => ^ = sin ů cos p |^ = r cos ů sin ip §^ = — r sin ů sin p (9.10) y = r sin ů sin p =>• = sm $ sm

• |^ = cos ů || = — r sin ů || = 0 Vydělením jednotlivých sloupečků příslušným škálovacím faktorem hi získáme souřadnice vektorů Ui. Konečně máme vše potřebné k vyjádření gradientu ve sférických souřadnicích: -ĺ 1 dp _ 1 d p _ 1 dp _ d p _ 1 dp _ 1 dp _ Vp = — tt Ur+ 7— ttj 116 + — — Uv= — Ur+ -— U#-\--:--— Uv, (9.11) hr dr h$ dv hv dp dr r dů r sm v dp kde ur = [sin ů cos p; sin ů sin p; cos ů] [cos ů cos p; cos ů sin p; — sin ů] - sin p; cos p; 0] (9.12) 132 KAPITOLA 9. KOULE 9.2 Divergence ve sférických souřadnicích V kartézských souřadnicích můžeme divergenci vektoru J zapsat V • J dJx d d d dx' dy' dz [ J x t Jyt Jz\ d(Jxux) dx d(JyUy) ^ d(JzUz) _ ux • ux -\- Jx • ux -\- ^ uv • uv -\- Jl dx dx du^ dy dJ: dz díl uz ■ uz + Jz—^ ■ uz. (9.13) dz dz ^y U>y | tjy U> l dy dy Modře označené druhé mocniny jednotkových vektorů se rovnají jedné. Zároveň v platí, že jednotkové vektory nemění ani velikost ani směr, když se změní kartézské souřadnice. Proto jsou jejich červeně označené derivace nulové. Poslední řádek se tedy zjednoduší dJx _ dux _ dJy _ diiy _ dJz _ duz _ dJx 3Jy dJz —— UX ■UX + JX——-UX + ——Uy ■ Uy + Jy——-Uy+——UZ ' U Z + JZ ~~ ' U Z = ~~ + ~~ + ~~ ox Ox Oy Oy Oz Oz Ox Oy Oz Jak vyjádřit divergenci ve sférických souřadnicích? Zkusměji zapsat obdobně, jako případě kartézských souřadnic. Přitom ovšem nesmíme zapomenout, že derivujeme podle vzdálenosti sr, s,?, s^,, o kterou se posuneme, když změníme sférické souřadnice r,ů,p, V • J = d d d dsr ' dstf ' dsv d(Jrur) ^ d(Jtfúd) ^ d(Jvuv) —~-• ur H--~-• u-6 H--~- dsr ds$ dt u. dJr _ _ dur _ dJ$ _ _ dú$ _ dJv _ _ duv _ = t;—ur ■ ur + Jr—— • ur + ——u# ■ u$ + Js-r— • u$ + -r—uv ■ uv + Jv—— • uv. dsr dsr ds$ ds$ dsv dsv 1 dJr Jr dur _ 1 dJ$ _ J$ důtf _ 1 dJv Jv duv _ = t 7\ ur ■ Ur + T ' «r + 7—^TTU^ ' U# + t--TČT ' U# + t ô u

ur = hrVr. (9.18) 9.2. DIVERGENCE VE SFÉRICKÝCH SOUŘADNICÍCH 133 u-6 = /itfV??, ílcp = hcpVtp. (9.19) Vzájemnou kolmost jednotkových vektorů popisuje také vektorový součin ur x u$ = uv, u$ x uv = ur, uv x ur = u$. (9.20) Když si jednotkové vektory v součinu vyjádříme pomocí gradientů souřadnic, Vr x W, —= Vy x Vr, —r— = W x Vy. (9.21) hrh$ h^phj. htfhp Došli jsme k tomu, že vektorový součin gradientů dvou souřadnic se rovná jednotkovému vektoru třetí souřadnice, podělenému součinem škálovacích faktorů prvních dvou souřadnic. Zkusme si spočítat divergence těchto jednotkových vektorů podělených součinem škálovacích faktorů. Abychom pochopili, co je právě na těchto divergencích zajímavého, musíme si je trochu upravit. Nejpřímočařejší, i když těžkopádnou, cestou je rozepsat si divergence pomocí parciálních derivací, zatím v kartézských souřadnicích. Pokud si označíme Vr = a a V?? = b, můžeme psát — — d d d V • (a x b) = -7^{aybz - azby) + -^(azbx - axbz) + -g^(axby - aybx) dbz day dby daz dbx daz dbz dax dby dax dbx day = ay—+bz —--az—--by—— + az —— + bx —--ax—--bz—— + ax—-+by—--ay—--bx—— dx dx dx dx dy dy dy dy dz dz dz dz ^z__^y\+f) (<^x_ _ doz\ ^ íday dax dy dz J y \ dz dx J z \ dx dy jy . ,' dbx dbz\ (dby 1 a„ —---— - a ' dy dz J v \dz dx J \ dx dy = b • (V x a) - a • (V x b) = W • (V x Vr) - Vr • (V x W) = W • 0 - Vr • 0, (9.22) kde jsme v posledním kroku využili závěr odvozený ze Stokesovy věty, žo rotace gradientu jakéhokoli skalárního pole je nulová (rovnice 8.113). Takto dospíváme k užitečnému zjištění, že V • ^f- = 0 (9.23) a stejným způsobem můžeme odvodit V-ff=0, V--^ = 0. (9.24) Když si uvědomíme, že pro každý vektor a (9.25) a podobně ar = a ■ ur; a$ = a ■ ů$; alp=ä-ulpi (9.26) můžeme si divergenci zapsat ~ _ d(arur) _ d(a,$ú,$) _ d(avuv) _ d((a ■ ur)ur) _ d((a ■ u^)u^) _ d((d-úv)úv) _ V-a = —---ur-\-----u^-\--^--uv =----ur-\-----u^-\--^--uv. dsr ds$ dsv dsr ds$ dsv (9.27) 134 KAPITOLA 9. KOULE Pro jednotkové vektory vydělené škálovacími faktory proto platí • = —tt^— • ur H--—--• us H--tt^-• uv = ——- • ur = 0, (9.28) ur ■ ur - d^'^u , Uh*hv aV hshv dsr r „ ■ U, dss dsv us f)U0-Ur. J ° hrhv Ur ■ Ur ^ ! ° hrhv U

' ^9'33') Po dosazení konkrétních hodnot škálovacích faktorů V-J _^ ^ V2 1 (d ír2„AnůdP\ | d f„-můdp\ ! d í 1 dp.. Dtľ r2sin?9 \dr \ dr J dů \ dů J dp ysinůdp 9.4. SFÉRICKY SYMETRICKÁ TRANSLAČNÍ DIFÚZE 135 9.4 Sféricky symetrická translační difúze Vyjádření Laplaceova operátoru ve sférických souřadnicích nám umožňuje přepsat druhý Fickův zákon do sférických souřadnicích. To je zvlášť výhodné v případě radiální difúze, kdy je pohyb zkoumané molekuly (nebo souboru molekul) sféricky symetrický. Hustota pravděpodobnosti nalezení molekuly (nebo lokální koncentrace) tak závisí pouze na vzdálenosti r od středu, nikoli na úhlech r) a ip. To zjednoduší rovnici 9.34 na íll=l±(r2^p) (935) DtT r2 dr \ dr J a druhý Fickův zákon tak nabude tvaru dp(r,t) _ D^ Ô (r2dp(r,ť) \ = D^ (2rdp(r,ť) | r2d2p(r,t)\ = D^ / dp(r,ť) | r&p{r,ť) (9.36) kde jsme použili pravidlo o derivování součinu. Toto pravidlo nám také pomůže rovnici dál zjednodušit. Uvědomíme si, že d(rp(r,t)) dp(r, ť) —5^=p(r,t)+r—5r (9.37) a tedy d2{rp(r,ť)) = d d{rp(r,ť)) = dp(r,t) dp(r,t) d2p(r, ť) Or2 dt dt dt dt dr2 ' 1 ' ' což je výraz v závorce na pravé straně rovnice 9.36. Rovnici 9.36 tedy můžeme přepsat do tvaru 9p(r, ť) _ d(rp(r, t)) _ ntrd2(rp(r, t)) r^t~- dl ~D dr~2 ' (9'39) který je pro / = r p identický s rovnicí 8.75. Pro okamžitý zdroj molekul v počátku souřadné soustavy bychom tedy mohli přímo použít řešení z části 8.10, které by se lišilo pouze výpočtem hodnoty /'(O). Zde si ale ukážeme jiný postup, který nás dovede k obecnějším výsledkům. 9.5 Separace časové a prostorové proměnné Zkusíme, jestli je možné najít řešení ve tvaru rp{r, ť) = f(r) ■ g(ť), tedy jako součin dvou funkcí, z nichž první závisí jen na poloze molekuly a druhá jen na čase. Pokud ano, dt ~H ' dt dr2 9() dr2 ■ ( > Když vydělíme obě strany rovnice součinem f(r)g(t) (a navíc DtT, abychom si co nejvíc zjednodušili složitější pravou stranu), bude levá strana rovnice záviset jenom na čase a pravá jenom na poloze _^dm = ^d2m D^g(t) dt f(r) dr2 ' 1 ' ; Čas a poloha v prostoru jsou obecně nezávislé údaje. Pokud má tedy naše rovnice platit obecně, nemůže se levá strana měnit v čase a pravá s polohou. Obě strany rovnice se tedy musí rovnat nějaké konstantě, stejné pro obě strany. 136 KAPITOLA 9. KOULE 1 dg Čt) , 1 d2/(r) , —-——-= konstanta, ——--— = konstanta. (9.42) D^g(t) dt ' f(r) dr2 1 ' Zápis konstanty zvolíme tak, aby byl co nejpraktičtější pro pravou stranu. Po vynásobení f(r) d2 f(r) / ; ; = f(r) • konstanta (9.43) drz vidíme, že druhá derivace funkce f(r) se až na vynásobení konstantou rovná funkci samotné. Jaká funkce má takové vlastnosti? Vzpomeňme na derivace goniometrických funkcí. Derivace funkce sinus je (rovnice 7.80) dsin(r) , . , --^=cos(r), (9.44) dr nebo obecněji dsin(Ar) d(Ar) dsin(Ar) —ďr~ = = Acos(Ar)' (9'45) Derivace funkce kosinus je (rovnice 7.79) dcos(r) dr = -sin(r), (9.46) nebo obecněji dcos(Ar) _ d(Ar) dcos(Ar) = _Asin(A^ (Q 4?) dr dr d(Ar) Z toho vyplývá d2sin(Ar) d dsin(Ar) ^dcos(Ar) ^d(Ar) dcos(Ar) A2 ' (A ) (9 48) dr2 dr dr dr dr d(Ar) a d2 cos(Ar) d dcos(Ar) ^dsin(Ar) ^d(Ar) dsin(Ar) ^2 (9 49) dr2 dr dr dr dr d(Ar) Jak vidíme, konstantu bude nejlépe zapsat jako —A2: d2/(r) dr2 A2/(r) (9.50) a že řešením této rovnice je bud funkce sin(Ar), nebo cos(Ar), nebo jakákoli lineární kombinace funkcí sin(Ar) a cos(Ar) se všemi možnými hodnotami A. Obecně si takovou lineární kombinaci můžeme zapsat oo /(r) = J2 (A sin(A4r) + B, cos{\r)), (9.51) i=i kde hodnoty Ai, Bi a Aj musí být určeny z okrajových podmínek. Po vyřešení rovnice pro f(r) se vraťme k rovnici pro g(ť), která s našim zápisem konstanty bude mít tvar -if = -M (9.52) g(t) dt 1 ' 9.6. ROTAČNÍ DIFÚZE 137 9(0) 3(0) Srovnání s předpisem pro derivaci logaritmické funkce (rovnice 4.46) nás ihned dovede k řešení g(t) g(t) t Mť) _ ľ d]n(g(t>)) = _x2DtI Jdť, (9.53) o ln(ff(í)) - ln(ff(0)) = -\2DH => g(t) = g(0)e-x2Dtrt. (9.54) Když dosadíme t = 0 (což je okrajová podmínka), vyjde nám g(0) = 1. Protože jsme vycházeli z předpokladu rp{r,ť) = f(r) ■ g(ť), má výsledné řešení difuzní rovnice obecný tvar oo f(r) = J2 (Ai sm(Xir) + B, cos{\r)) e^"*, (9.55) i=i kde, jak bylo řečeno, hodnoty Ai, B i a Aj udávají okrajové podmínky. 9.6 Rotační difúze Difúze nezpůsobuje jen náhodný pohyb molekul z místa na místo, ale také jejich otáčení v prostoru. To si můžeme znázornit pomocí vektoru r, který popisuje natočení molekuly, například směr určité chemické vazby. Směr tohoto vektoru se v důsledku rotační difúze stále náhodně mění. Jeho délka ale zůstává pořád stejná, protože nás teď nezajímá poloha těžiště molekuly, ale jen její natočení. Pokud použijeme začátek vektoru jako počátek souřadné soustavy, jeho konec bude náhodně bloudit po povrchu koule, jejíž poloměr je délkou vektoru r. Podoba s opilým námořníkem je dokonalá. Námořník putuje po povrchu zeměkoule, konec vektoru po povrchu koule o poloměru r. Protože na velikosti koule nezáleží, můžeme ji klidně považovat za rovnu jedné. Při popisu translační difúze jsme sledovali hustotu pravděpodobnosti nalezení molekuly v místě o souřadnicích x,y, z, které můžeme určit pomocí polohového vektoru r. Popis rotační difúze bude velmi podobný, pouze délka vektoru bude zafixována na hodnotě jedna. Pro zafixování délky vektoru r bude výhodné pracovat ve sférických souřadnicích r,ů,p, protože délka vektoru je jednou z těchto souřadnic. Nastavením r na konstantní hodnotu r = 1 tak snížíme počet potřebných proměnných na dvě. Druhý Fickův zákon se nám tak zjednoduší z tvaru Op _ D*ot Í3_ ( 2s.můdp\ + d_ (s-mů 1 - u2 dp2 (9.64) Po vynásobení obou stran 1 — u2 a převedení —A2 na levou stranu Opět si uvědomíme, že má-li platit rovnice pro všechny inklinace •& a nezávisle na nich pro všechny azimuty ip, musí se levá i pravá strana rovnat stejné konstantě, kterou tentokrát označíme třeba p2 (I-""2)//, 2xd20 „ d9 ,2 \ 2 1 d2$ 2 . . V ((1 -u ^ - 2u *ľ+ J = ^< "i= (9'66) Vztah pro <í> d2$ = ^ (9'67) má stejný tvar, jako rovnice 9.50, a proto musí mít i stejné řešení: je buď funkcí sm(pp), nebo cos(\p), nebo lineární kombinaci funkcí sin(pp) a cos(pp) se všemi možnými hodnotami p. Ze vztahu 7.89 ale vyplývá, že sin(pp) a cos(/zy) můžeme zapsat jako lineární kombinace elfI(p a e~1A1fl(ip)=Aflei»* (9.68) pro různá (kladná i záporná) p, kde A^ určíme z okrajových podmínek. 9.8. FROBENIOVA METODA 139 9.8 Frobeniova metoda Zlatým hřebem je řešení rovnice pro O, kterou si můžeme přepsat (1 - -2)S - ^ + (* - ^~2 ) 6 = 0. (9.69) du2 du \ 1 — u Tuto rovnici budeme řešit postupem, kterému se říká Frobeniova metoda. Začneme matematicky riskantním krokem, vydělením obou stran výrazem 1 — u2. d2f) 2v df) \2 ii2 —__íľ—^í + —l_e__^_e Í9 70) dlí2 1 - u2 du 1 - u2 (í-u2)2 1 ' Pokud u2 7^ 1, žádné nebezpečí nehrozí. Co když se ale molekula natočí tak, že (jednotkový) vektor r míří „k severnímu, nebo jižnímu pólu"? Pak je r) = 0 nebo r) = ir, cos2 r) = v? = 1, 1 — u2 se blíží nule a dělení takovým výrazem způsobí, že levá strana poroste do nekonečna, pokud jí v tom nezabrání takový tvar funkce O, který nepřístojný výraz l—u2 zkrátí. Musíme tedy nejdříve pečlivě vyšetřit, jaké tvary funkce O zaručí, že rovnice 9.69 bude mít řešení i pro u2 = 1. Vlastně to znamená, že budeme hledat tvar funkce O pro okrajovou podmínku u2 = 1. Problémy s nulovým l—u2 se odstraní, pokud bude funkce O obsahovat násobení dostatečně vysokou mocninou výrazu 1 — u2, aby tento výraz „přežil" i derivování. Takový tvar si můžeme obecně zapsat e(u) = (l-ii2)ttI(ii), (9.71) kde X{u) je nějaká funkce proměnné u, jejíž tvar budeme hledat později. Pro dosazení do rovnice 9.70 budeme potřebovat první a druhou derivaci (1 — u2)aX{u), při jejichž výpočtu budeme hojně používat pravidlo o derivování součinu: de n 2^dx d{i - u2) d{i - u2r v , dx , ! ďu- = {í-u) du d(l-u2)X = {í-u) -d~a--2au{l-u) (9'72) d2e d de ^ 2,ad2x t ^ 2^a ,dx n ^ 2^a , n d(i-m2)d(i-m2)"-1 ^ *š = ďTuď^ = (1-^)^-4^(1-^)"^^(l-,2)^X-2au^du ^d(i_j2) X a — (9.73) d2 X dX (1 - u2)a-— - 4cm(l - li2)""1 — - 2a{l - u^^X - 2a(l - u^^X + 4a(a - l)u2(l - u2)a-2X. du2 du Dosazením za funkci O a její derivace do rovnice 9.70 vznikne d2 X dX (1 - u2)a-— - AauCl - li2)""1— - 2a(l - u^^X - 2a(l - u^^X + 4a(a - l)u2(l - u2)a-2X duz du d X -2u{l - u2)*-1---4cm2(l - u2)a-2X + A2(l - u^^X - fj2(l - u2)a-2X = 0, (9.74) du Když obě strany vynásobíme (1 — u2)a~2 d2X dX (1 - u2)2-— - 4cm(l -u2)---2a(l - u2)X - 2a(l - u2)X + Aa(a - l)u2X du2 du dX -2u(l -u2)---Aau2X + A2(l - u2)X - it2X = 0, (9.75) du zůstanou v rovnici už jen kladné mocniny (1 — u2). Proto můžeme bez obav dosadit u = ±1. Přitom vypadne množství členů s(l — it2)=0, což rovnici značně zjednoduší 140 KAPITOLA 9. KOULE (4a(a -í)-4a- fŕ)X = (4a2 - fj2)X = 0. (9.76) Pokud má být tato rovnice splněna pro jakékoli X, musí být a = |/i|/2 (pro a = — |/i|/2 by rovnice 9.69 v případě u2 = 1 neměla řešení). Vztah 9.71 tedy můžeme upřesnit na Q(u) = (í-u2)lJidX(u). (9.77) Hodnotu a = |/i|/2 můžeme dosadit do rovnice 9.75 a seskupit v ní stejné derivace X d2 X c\X (1 - "2)2^2- - 2(lMl + 1M1 - u2)— + (A2(l - u2) 2|M|(1 - u2) + |M|(|M| - 2)u2 2\p\u2 - |M2|) X = (i - "2)2^2- - 2(H + - "2)^7 + (a2 - +1)) (i - u2)x = [i\ u2)— 2(|M| + l)u— + (A2 - |M|(|M| + 1)) X) (1 - u2) = 0. (9.78) Pro m^±1 tato rovnice platí, když se výraz ve velké závorce rovná nule. 9.9 Legendrova diferenciální rovnice Naším posledním cílem je najít funkce X(u), pro které platí d2 X c\X (1 - u2)^ 2(|M| + l)u— + (A2 - |M|(|M| + 1)) X = 0, (9.79) což je Legendrova diferenciální rovnice. Základní úvaha je následující. V rovnici 9.79 se kromě X(u) vyskytují mocniny u. My hledáme takovou funkci X(u), aby se levá strana rovnice 9.79 rovnala nule pro jakýkoli úhel •&, tedy pro jakékoli u = cosů mezi —1 a 1. Pokud by i funkce X(u) byla polynomem proměnné u, byly by i derivace X(u) polynomy a celá levá strana rovnice 9.79 byla polynom. Aby se levá strana rovnala nule pro všechna u mezi —1 a 1, musely by se rovnat nule koeficienty u všech mocnin u na levé straně. Takže hledání správné X(u) by znamenalo hledání takových koeficientů polynomu X(u), aby výsledné koeficienty po dosazení do rovnice 9.79 byly nulové u všech mocnin u. Zkusme si tedy funkci X(u) zapsat jako mocninnou řadu s teoreticky neomezeným počtem členů a koeficientů oo X = J2akUk- (9.80) fe=0 První a druhá derivace X(u) budou oo J2kakuk^, (9.81) fe=0 oo J2k(k- l)akuk-2. (9.82) fe=0 Po dosazení do rovnice 9.79 dX du d2X du2 9.9. LEGENDROVA DIFERENCIÁLNÍ ROVNICE 141 (1 - u2) J2 k(k - l)akuk-2 - 2(|M| + 1) £ kakuk + (a2 - |m|(|mI + 1)) J2 a*u* = 0 (9'83) fe=0 fe=0 fe=0 ]T Hk - l)akuk~2 - k(k - l)akuk - 2(|/z| + 1) ]T kakuk + (A2 - |/z|(|/z| + 1)) ]T afewfe = 0. (9.84) fe=0 fe=0 fe=0 fe=0 V první sumě jsou první dva členy rovné nule (první obsahuje násobení k = 0 a druhý násobení A; — 1 = 0 pro k = 1). Proto můžeme v prvním členu začít sčítat až od k = 2 Hk - ^)akuk-2 -J2k(k- iWuk - 2(i/z| +1) kakuk + (a2 - Imkimi +1)) akuk =0 (9-85) fe=2 fe=0 fe=0 fe=0 a posunout index v první sumě o dva, abychom první sumu zapsali se stejnými mocninami u, jako ostatní dvě sumy ^^(A; + 2)(A:+ l)afe+2^fe — — l)o,fe^fe — 2(|M| +1) A:afe^fc + (|/x|(|M| +1) — A2) afe^fc = 0 (9.86) fc=0 fc=0 k=0 k=0 oo J2 ((k + 2)(k + lK+2 - (k(k - 1) + 2(|M| + l)k + |M|(|M| + 1) - A>fe) uk k=0 oo = V ((A + 2)(fc + l)afe+2 - ((k + \p\)(k + {ni + 1) - A>fe) uk = 0. (9.87) fc=0v musí být rovno nule Tato rovnice platí pro m^O pouze pokud se označený výraz rovná nule. To nám umožní vyjádřit si koeficienty rekurentně, vyšší ak+2 pomocí nižšího ak: (fc + H)(fc + H + i)-A2 ak+2 = -(Jfc + 2)(Jfc + l)-^ (9'88) Tento vzorec můžeme použít k zapsání mocninné řady pomocí ciq a a\: ( |M|(|M| + 1)-A2 2 H(H + 1)-A2 (|M| + 2)(H + 3)-A2 4 *-a°(^+-1T2- +-1~2---3~4- +■ / (|M| + l)(|M| + 2)-A2 3 (|M| + l)(|M| + 2)-A2 (|M| + 3)(|M| + 4) - A2 5 +ai^+ 2 3 u + 2 3 • 4 5 « +... (9.89) Pokud budou řady u ao a ai nekonečné, porostou jejich hodnoty pro u = ±1 donekonečna. Tomu můžeme zabránit tím, že řadu ukončíme (získáme konečný polynom). Vyžijeme toho, že ak+2 = 0, když zatím neurčená konstanta A2 = (k + \/j,\)(k + + 1). Pokud si konstantu A2 zapíšeme jako A2 = 1(1 + 1), jednu z řad zastavíme na hodnotě k = l — protože koeficient ak+2 bude nulový pro l = k + = (fc+lMl)(fc + M+ !)-*(* + !) (g go) fe+2 (jfc + 2)(jfc + l) k' ( ' 142 KAPITOLA 9. KOULE Abychom tím ukončili celou řadu X, musíme zvolit pro sudé rozdíly l — \p\ koeficient a\ = 0 a pro liché rozdíly l — \p\ koeficient ciq = 0. Nenulové ciq a a\ budou pak představovat konstantu, kterou si označíme Bi^\ a určíme ji z okrajových podmínek. Volba l také omezuje možné hodnoty \p\. Konstanta \p\ je celé číslo nejvýš rovné l, protože nejnižší hodnota indexu k = l — \p\ je nula. Řešení pro l rovno 0, 1 a 2 jsou v tabulce l ImI k a0 ai 0 0 < o Bo,o 0 Bq,o Bo,o 1 0 < 1 0 Bi,o Biflu Biflu 1 1 < o Bi,i 0 Bi,i Si,i(l-it2)5 2 0 < 2 B2,0 0 B2,o (h2 \) B2,o (h2 \) 2 1 < 1 0 B2,l B2,iu S2,l(l-m2)3lí 2 2 < o B2,2 0 B2,2 S2,2(l-it2) Ve vzorcích 9.77 a 9.90 se vyskytuje jen \p\, zatímco funkce <í> je definována pro kladná i záporná p. Měli bychom tedy určit i funkci O pro všechny hodnoty p. Pro /z > 0 je /z = |/z| a tedy = 0;|M|. Pro /z < 0 je /z = —|/z|. Funkci O pro záporná /z si dodefinujeme jako = O;,-^ = (—l^O;,^. 9.10 Sférické harmonické funkce Po odvození tvarů funkcí $a6 přichází čas spojit je opět do funkce Y, popisující hustotu pravděpodobnosti jednotlivých orientací. Kombinací vztahů 9.68, 9.77, 9.80 a 9.90 získáme obecný tvar funkce Yitfí pro různé hodnoty l a /i, ve kterém musíme ještě z okrajových podmínek určit konstanty a parametry z rovnice 9.68. Jako okrajovou podmínku budeme požadovat, aby funkce Yi^ byly ortonormální, tedy aby integrál 27T 7ľ 27T y Y^Y;^Sm9dů = J dtp J ŕY^^du (9.91) 0 0 0 -1 byl roven jedné, když l = ľ a zároveň /i = /i', a roven nule, pokud se indexy l a ľ, nebo indexy /i a /i', liší. Hvězdička u YJ* , nám říká, že ve funkci máme změnit znaménko o imaginární jednotky, tedy použít komplexně sdruženou hodnotu k Yy ^. Protože <í> závisí jen na ip a O na •& nebo u, můžeme integrál rozdělit 2-it 1 2-it 1 1 y »%,dp y e^et^du = J A^e^-^dp J e^&p^du = i^, J e^&p^du. (9.92) 0-1 o -1 -1 Pro /i = p! 2-k 2-k W = W = y A^díP = M Jdf = (9.93) o o takže = 1, pokud zvolíme A^ = l/y/2Ťř pro všechna /z. Jestliže /z a p! jsou celá čísla, tak jejich rozdíl p — p! je také celé číslo. Pro p =/= p' můžeme při integrování Ifj,,fj,' — A^,e i(M-M') -Bi .1 — ± ± 1 = I e2,0e^0d« = j s22 o -1 \u2-\ \ du= I B o n f —M4--U2 H--) du 2,0 1 4 2 4 (9.105) = S. 2,0 9 5 1 3 1 20 2 4 20 M [9ií5 - lOtí3 + 5it] ^ = -S2 o -B2j0 = 1 1 -1 -1 1 1 1 = j ©2,2©2,2áu = J B2,l(l - U2)2du = Bl 2 3 5 2m3 2 2 /15 -S2>1 =>• #2,1 -ý y: 15 -S. 2,2 (9.106) (9.107) 15 2,2 Teď již máme vše, abychom mohli vyjádřit YitfJj = $^0;,^ l" ' (9.108) ^0,0 = *i,o = \/J^cosi?, ylj±1 = W^e^sini?. Y~5 2,0 -l-^cos^-l), y2,±1 = TA/^e±i^siní9cosí9, y2,±2 167t V ott 15 32^ e±2iv sin2 ů. (9.109) Takto normalizované ortonormální Y] „ se nazývají sférické harmonické funkce. 9.11. korelační funkce 145 Po zahrnutí časové závislosti popsané rovnicí 9.63 získáme obecné řešení jako lineární kombinaci všech možných Yi^ oo / P(ů,p,t) = J2 E YiA$^)giA^l(l+1) 1=0 fi=-\ kde d o, (po jsou hodnoty ů, ip v čase t = 0. 9.11 Korelační funkce K čemu je taková analýza rotační difúze dobrá? Rotační difúze ovlivňuje výsledky řady metod, používaných ke studiu molekul, například měření anizotropie fluorescence nebo spekter NMR. Vliv rotační difúze na tyto metody popisuje časová korelační funkce c. Korelační funkce nám říká, jak rychle se v důsledku náhodných srážek molekul ztrácí informace o hodnotě nějakého parametru určující výsledek měření. Obecně má takový parametr vztah k orientaci zkoumané molekuly. V případě anizotropie fluorescence, nebo relaxačních dějů ve spektroskopii NMR, je příslušný parametr úměrný hodnotě Y2to-Korelační funkce c2 (pro y2fl) Je definovaná 00 z = E E Y^m:^,^-1^^, 1=0 fi=-\ (9.110) C2(í) = dp0 p0(0di?0 = Po Jd, se všemi Y^ÍPOi $o)Yi^{p, f?) z dvojité sumy rovné nule, s výjimkou součinů s Y20(po, ůo)Y2fl(p, které budou rovny jedné. Výpočet korelační funkce se nám tak zjednoduší na 1I asymetrické molekuly, jejichž rotační difúze je anizotropní, jsou v běžných rozpouštědlech orientovány izotropně. Nesmíme zaměňovat izotropii pohybu s izotropií orientace. 146 KAPITOLA 9. KOULE 2tt tt 2tt tt , 1 ľ ľ ľ ľ e-6D'att i C2{ť) = — / d^o / sin(90d??o dp e"2'3'-0™** sin6dů = ——--4tt • 4tt = -^e"60™**. (9.114) 0 0 0 0 Složitá analýza nás tak dovedla (díky předpokladu izotropní difúze) k jednoduché exponenciální závislosti. Kapitola 10 Náboje La force repulsive de deux petits globes electrises de la meme nature d'electricite est en raison inverse du carre de la distance du centre des deux globes. Charles-Augustin Coulomb Matematika: Sférické souřadnice, skalární a vekorová pole, vektorová algebra (gradient, divergence, rotace), integrování per partes, Taylorův rozvoj, mocninné řady, Laplaceův operátor ve sférických souřadnicích, druhé derivace exponenciálních funkcí. 10.1 Elektrické pole Hodně jsme si již povídali o tom, že molekuly na sebe vzájemně působí. Zatím jsme se ale nezabývali fyzikální podstatou sil mezi molekulami. Z nich jsou pro chování molekul zdaleka nejdůležitější síly elektrické. Protože elektrické síly závisí také na vlastnostech samotných molekul (na tom, jaký má molekula elektrický náboj, nebo jak jsou elektrické náboje v molekule rozloženy), popisujeme elektrické pole pomocí veličiny elektrická intenzita, což je síla působící na jednotkový náboj Ě=%, (Id) kde F je síla, kterou působí pole na náboj Q, a E je elektrická intenzita pole. Je pozoruhodné, že popis působení elektrických sil vychází ze stejných úvah o tocích povrchem, jaké jsme použili při popisu difúze. Pokud se elektrické pole nemění a náboje nepohybují, vyplývají vlastnosti tohoto pole z následujícího konstatování. Celkový tok elektrické intenzity E povrchem kouzelného pytle je určen elektrickým nábojem uvnitř pytle. To můžeme zapsat Ě ■ de? = — / pdV, (10.2) eo 7 °pytel Vpytel kde p je hustota elektrického náboje a elektrická permitivita vakua eo = 8, 854.10~12 F m-1 je konstanta, která vlastně definuje jednotky elektrického náboje. Pokud v pytli žádný náboj není, je celkový tok povrchem pytle nulový (kolik elektrické intenzity míří dovnitř, tolik míří ven). Stejné úvahy, pomocí kterých jsme analyzovali difuzní tok, nás dovedou ke vztahu / V-ĚdV= — f pdV => V-Ě=—, (10.3) 7 e0 7 e0 Vpytel Vpytel 147 148 KAPITOLA 10. NÁBOJE což je první Maxwellova rovnice. 10.2 Elektrický potenciál V části 3.5 jsme počítali, jakou práci koná vnější síla, když tlačí píst určitým směrem. Podobně můžeme spočítat práci, kterou vykonáme proti elektrické síle mezi náboji Qi a Q2, když přesuneme zkušební náboj Q2 z místa o souřadnicích x\,y\,z\ do místa o souřadnicích x2,y2,z2. Nej užitečnější je spočítat práci, kterou vykonáme při přesunutí náboje Q2 z místa, kde mezi náboji žádná síla nepůsobí. Kde je takové místo? Kdekoli, kde jsou náboje nekonečně daleko od sebe. Pokud si zvolíme náboj Qi jako počátek souřadné soustavy a směr posouvání náboje Q2 jako směr osy x, bude se vykonaná práce rovnat integrálu r (10.4) oo kde r je výsledná vzdálenost mezi náboji. Po celou dobu přesouvání působí elektrická síla F ve směru x, takže F = [Fx; Fy; Fz] = [F; 0; 0]. Vykonáním této práce získá náboj Q2 v poli náboje Q\ elektrickou potenciální energii rovnou hodnotě W. Pokud vydělíme obě strany rovnice nábojem Q2, získáme na pravé straně místo elektrické síly elektrickou intenzitu i? a na levé straně místo elektrické potenciální energie elektrický potenciál (p v bodě o souřadnicích r, 0, 0. r 0m,o) = - (10.5) oo Elektrický potenciál pole tvořeného nábojem Q\, nebo složitějšího pole tvořeného mnoha náboji, můžeme spočítat v jakémkoli místě o souřadnicích xo,yo, zq. Zkusme spočítat příspěvek k práci (diferenciál dW7), který odpovídá posunutí zkušebního náboje z místa xo,yo,zo ve směru x o dx. Protože diferenciál dx je nekonečně malá vzdálenost, můžeme předpokládat že se potenciál (p v rámci této vzdálenosti mění se stejnou směrnicí S^. Potom je příspěvek k práci spojený s tímto přesunem roven dW = Q2 ((x0, y0, z0)) = Q2 [ (p(xo,Vo, z0) + -r^dx - (f)(x0, y0,z0) Tento příspěvek se ale také rovná z čehož vyplývá dW = -Q2Exdx, Q2—dx. ox (10.6) (10.7) Ex — ^ ■ ox Totéž platí pro posunutí ve směru y a z. Můžeme tedy psát E — [Ex;Ey;Ez] Po dosazení do rovnice 10.3 dx' dy' dz -V0. v • Ě = -v • = -v20 = —, (10.8) (10.9) (10.10) 10.3. COULOMBŮV ZÁKON 149 což je vztah známý jako Poissonova rovnice. Výsledek 10.9 můžeme také dosadit do rovnice 8.113 V x V =-V x £ = 0, (10.11) což nám říká, že rotace statického elektrického pole popsaného potenciálem cp je nulová. Rovnice 10.10 a 10.11 představují plný popis elektrostatiky (elektrických polí nehybných nábojů) a odpovídají prvním dvěma Maxwellovým rovnicím pro tento případ. 10.3 Coulombův zákon Z úvah o kouzelném pytli vedoucích k první Maxwellově rovnici můžeme odvodit i Coulombův zákon ve formě popisující elektrickou sílu mezi dvěma náboji. Představme si, že máme bodový náboj Q\ a zajímá nás, jakou silou působí na jiný náboj Q2. Náboj Q\ uzavřeme do kouzelného pytle. Protože je náboj Qi soustředěn do jediného bodu, můžeme tvar pytle zvolit chytře jako kulový povrch s nábojem Qi uprostřed a nábojem Q2 přesně na povrchu pytle. V čem je kulový tvar výhodný? Bodový náboj Q\ je sféricky symetrický. Pokud je Q\ jediným zdrojem elektrického pole, měly by elektrické síly působící na případné náboje v okolí směřovat buď směrem ke Q\ nebo naopak od Qi, tedy směrem kolmým na povrch koule se středem v náboji Q\. V jakémkoli místě na povrchu kulového pytle o poloměru r kolem náboje Qi bude tedy vektor E kolmý k vektoru der. Skalární součin E ■ der je tedy v každém místě rovný součinu velikosti E a velikosti plošky der - f pdV= — = f Ě-da = f Eda. (10.12) eo J eo Vkoule ^povrch koule ^povrch koule Vzdálenost povrchu koule od náboje Q\ je ve všech místech na povrchu rovná r. Proto je také velikost elektrické intenzity kdekoli na povrchu stejná, můžeme si ji označit E{r) a vytknout před integrál Q- = E(r) ľ der. (10.13) eo J Cpovrch koule Integrál na pravé straně představuje posčítání všech plošek na povrchu koule, takže výsledkem musí být obsah povrchu koule — =E(r) -47rr2, (10.14) eo z čehož jednoduchou úpravou získáme obvyklý tvar Coulombova zákona ElT) = T-% F{r) = -?-Q^. (10.15) 4-7re0 r2 47re0 r2 Je také dobré si uvědomit, že síla a elektrická intenzita jsou vektory, mají směr. Směr síly můžeme do Coulombova zákona zahrnout pomocí jednotkového vektoru mířícího ve směru síly. Takový jednotkový vektor můžeme zapsat jako f/r, kde r je vektor udávající vzájemnou polohu interagujících nábojů v dané souřadné soustavě a r je velikost tohoto vektoru, tedy vzdálenost nábojů: ~ 1 QxQ2f 1 QXQ2 ^ F=------= ---— r. (10.16) 47reo rz r 47reo ra Obdobně můžeme popsat vektor elektrické intenzity jako vektor elektrické síly působící na jednotkový náboj v elektrickém poli jiného náboje o velikosti Q E =----- =---- r. (10.17) 47TÉQ rz r 47TÉQ ra 150 KAPITOLA 10. NÁBOJE Čemu se rovná potenciální energie naší dvojice nábojů? Jak jsme si řekli v části 10.2, potenciální energie náboje kterou bychom vykonali při přemístění nábojů ze vzdálenosti, kde na sebe náboje již nepůsobí (což by musela být nekonečná vzdálenost), do vzdálenosti r. Pokud zvolíme osu x ve směru posouvání náboje Q2 k náboji Q\, spočítáme práci jako integrál r r w = ľFár> = 9i9i f i-d/ = J-9i9i. (lo.ig) J 47té0 J r2 47té0 r 00 00 Pokud budeme chtít uvádět energii nábojů v jednom molu molekul, musíme výsledek vynásobit Avogadrovým číslem: U=1^9i9i, (io.i9) Atteo r V molekulách se obvykle nesetkáme s dvojicí bodových nábojů, ale spíše s poměrně složitým rozložením hustoty elektrického náboje (elektronové hustoty). Rozložení nábojů můžeme popsat pomocí elektrických multipólových momentů, tedy navenek neutrálních dvojic, čtveřic atd. opačných nábojů. My se podíváme jen na interakce nejjednoduššího multipólu, kterým je elektrický dipól. Vzájemné působení nábojů a dipólů lze popsat nepříliš složitými rovnicemi. Jde o různé varianty Coulombova zákona. Odvození uvedených rovnic často jednoduché není, v učebnicích většinou chybí a v literatuře se hledá obtížně. V této kapitole si uvedeme i poměrně zdlouhavá odvození, abychom si ukázali, odkud se vzaly různé mocniny vzdálenosti mezi interagujícími náboji a dipólovými momenty a závislosti na teplotě. 10.4 Energie náboje a elektrického dipólu v jedné molekule Energie U interakce mezi nábojem Q a trvalým elektrickým dipólovým momentem o velikosti qd, který odpovídá dvojici nábojů +q a — q ve vzájemné vzdálenosti d, je rovná práci spojené s otočením dipólu v poli náboje Q. Dle dohody začínáme dipól otáčet z polohy znázorněné na obrázku 10.1 vlevo. Jak je ukázáno na obrázku 10.1, na každý náboj Q působí síla směřující od nebo k náboji Q (na obrázku červeně). Pokud je vzdálenost dipólu od náboje Q mnohem větší, než vzájemná vzdálenost nábojů +q a —q, lze síly považovat za téměř rovnoběžné (na obrázku znázorněno černě). Posunutí +q a — q vůči Q lze pak vyjádřit pomocí úhlu •&, definovaného na obrázku 10.1 vpravo. Celkovou práci na posunutí obou nábojů o hodnotu Ar = cosa = a + ľ-—, (10.40) 4 2ar d2 b2 -\- v2 ^ -J- = Ď2+r2-2Ďrcos/3^> = cos/3 =-T ~ ~ . (10.41) 4 2br Jak ukazuje obrázek 10.2, celková intenzita ve směru x je součtem složek intenzit E_ a E+ v tomto směru: ^ „ „ „ „ „ Q^ di sin^i / 1 1 \ Oi a3 + Ď3 d i sinf9i ^ = E+*+E-* = E+ Sm? + E- Sma= 4^^ U + ^) = 4^^^' (10'42) Celková intenzita ve směru z je naopak rozdílem svislých složek intenzit E_ a E+: a 1 / b2 + r2 - ^ a2 + r2 - ^ \ £z = £+jZ + £_,z = £+cos/?-£_cosa =---^----M . (10.43) 47reo 2r \ bd a6 j Vzdálenosti a a b nám poskytne opět kosinová věta d2 a2 = ~^ +r2 - dircostfi, (10.44) (i2 (i2 62 = — +r2 - íiircos(7r - ??i) = — + r2 + r = -\aeoE2 = -^NA ^, (10.63) oo 0 kde červená barva označuje rozdíly od vztahu pro energii dvou nábojů. 10.7 Energie permamentního a indukovaného elektrického dipólu Obdobně můžeme odvodit i energii dipólu indukovaného permanentním elektrickým dipólem. S využitím vztahů pro energii dvou permanentních dipólů dU' = qd- dĚ' = -ae0Ě' ■ dĚ' = -ae0(E'xdE'x + E'zdE'z) = -^ae0(d(E'x)2 + d(E'z)2) (10.64) a 156 KAPITOLA 10. NÁBOJE U= j dU' = -- / ae0(d(E'x)2+d(E'z)2) = --ae0(E2+E2) = -^NA[ — ) ^-(1 + 3coS2$), (10.65) kde červená barva opět označuje rozdíly od vztahu pro energii dvou nábojů. 10.8 Průměrování závislostí na orientaci Zatím jsme počítali energie nábojů a dipólů pro jejich jednu určitou orientaci. Pokud jsou náboj a elektrický dipól v různých molekulách, které se mohou vůči sobě volně otáčet, dává smysl počítat průměrnou energii pro všechny vzájemné orientace. Různé orientace přitom nebudou stejně pravděpodobné, ale jejich hustota pravděpodobnosti bude záviset na energiích nábojů a dipólů v různých orientacích. S počítáním průměrů vážených různou hustotou pravděpodobnosti jsme se seznámili již v části 6.5. Tehdy nám ale stačilo průměrovat funkce jedné proměnné, zatímco k popisu orientace v prostoru potřebujeme dvě sférické souřadnice ů a p. Rozšíření průměrování na funkce dvou kartézských souřadnic je snadné xn y n xn y n I I f(x,y)dxdy J J f(x,y)dxdy f(x y) = _= x° yo_ í 10 66) J J áxáV x o y o Geometrická interpretace je ukázána na obrázku 10.3A. Průměr funkce f (x,y) odpovídá objemu pod růžovou plochou nad obdélníkem o rozměrech (x jv — x q) x {y n — y0), vydělenému objemem hranolu o rozměrech (x n — x q) x (y n — yo) x 1- Objem pod růžovou plochou je přitom součtem objemů velkého počtu fialových hranolků s nepatrným obsahem podstavy dx ■ dy (žlutě na obrázku 10.3A). Vážený průměr funkce f(x,y) v celém jejím rozsahu pak je f(x,v) = / / p{x,y)f{x,y)dxdy. (10.67) — oo —oo S průměrováním závislosti na orientaci je to trochu složitější. Orientaci můžeme popsat pomocí vektoru r, který definuje všechny orientace jako body na povrchu koule o poloměru \r\ (obrázek 10.3B). Pokud nás nezajímá závislost na vzdálenosti, můžeme pro jednoduchost zvolit \r\ = 1. Hodnota / závislá na orientaci pak může být popsána pomocí úhlů ů a ip. Průměrnou f(ů, ip) spočítáme jako integrál hodnot df(ů,p) „nad" povrchem koule, vydělený obsahem povrchu koule Att (pro r = 1). Integrál „nad" povrchem koule je součtem integrálů nad úzkými proužky na povrchu koule, z nichž jeden je znázorněn zeleně na obrázku 10.3B. Každý proužek si můžeme rozdělit na malé obdélníčky, z nichž jeden je znázorněn žlutě na obrázku 10.3B. Strana obdélníčku, která je na obrázku 10.3B nakreslena červeně, odpovídá šířce zeleného pásku. Tato šířka je daná délkou oblouku mezi body vymezenými vektory r(ů, ip) (na obrázku 10.3B zakreslen zeleně) a r{ů — dů, ip) (na obrázku 10.3B zakreslen červeně). Strana žlutého obdélníčku, která je na obrázku 10.3B nakreslena modře, odpovídá délce oblouku mezi průměty vektorů r(ů, ip) (na obrázku 10.3B zakreslen zeleně) a r(ů, p + dp) (na obrázku 10.3B zakreslen modře). Délka tohoto oblouku je rsmůdp. Z toho vyplývá, že obsah žlutého obdélníčku je r2 smůď&dp, nebo jednoduše sinůdůdp, protože r = 1. Integrování „nad" povrchem koule je sčítání maličkých objemů hranolků podobných těm z obrázku 10.3A. Jeden takový hranolek je nakreslen na obrázku 10.3C. Celkový výsledný integrál je 10.9. ENERGIE NÁBOJE A DIPÓLU V RŮZNÝCH MOLEKULÁCH 157 A f (x, y) áx C 471 m*) r sin ůd(p Obrázek 10.3: Integrování ve výpočtu průměrů. Integrování funkce f (x,y) (A), integrování funkce f(ů,tp) (B) a diferenciál objemu f(ů, tp)r2 sini9di?dip (C). Detaily jsou popsány v textu. S=tt cp=2-ir 2-k -k f{ů,p)smůdůdp = f dp f smůdůf(ů,• du = —dv =-dv = — smvdv. dů dů V případě váženého průměru (10.70) 27t 7T J dp J sinůdůp(ů)pz(ů,p) o o_ 27T 7ľ J dp J p(ů) smůdů o o (10.71) 10.9 Energie náboje a dipólu v různých molekulách Pokud se bude v jedné molekule nacházet náboj Q a v druhé dipól qd, bude výpočet průměrné energie jednodušší. Orientace dipólu vůči náboji můžeme totiž popsat jediným úhlem •&. Navíc platí, že nějakou orientaci dipól mít musí, takže pravděpodobnost nalezení dipólu v nějaké orientaci je rovná jedné 158 KAPITOLA 10. NÁBOJE 7T j p(ů)sinůdů = 1. (10.72) f dtp f smůdůp(ů)U(ů) (f dtp) (f pe(i(r])U(r])smůdů oo Vo/ Vo / í Proto UW = 2« «- = —- 2,-- = J P^WW sin^, J doc J /?($) sin J dp o oo o (10.73) kde peq(r)) je hustota pravděpodobnosti nalezení určité orientace v termodynamické rovnováze. Tuto hustotu pravděpodobnosti poskytuje Boltzmannuv zákon i-U(u)/RT euw kde p ^ V "Ví ±>-L pu Pe» =---= (10.74) w = cos?9, (10.75) eo ■ (10.76) a Z je součet všech možných hodnot e"1", zvaný partiční funkce. Tento součet můžeme spočítat jako integrál 7T -li peq(cos??)shn?d?? = - / e™dii = / euwdu = '——^—. (10.77) o 1-1 Při výpočtu integrálu jsme využili toho, že du d(cos?9) di = Aär = (10-78) takže sin?9d?9 = — du. Průměrnou energii potom můžeme spočítat i i U = j peq(u)U(u)du = ~J^^_W j ueuwdu. (10.79) -i -i Integrál funkce ueuw je výhodné počítat per partes. Vzpomeneme, že derivace součinu je ^ = ^9 + f^ (10-80) du du du a hledáme takové funkce / a g, abychom mohli náš integrál vyjádřit jako ueuwdu 10.10. TAYLORŮV ROZVOJ 159 kde g^E je funkce, jejíž integrál je známý. Určitě bude dobré využít toho, že ^ = 1 (10.82) dít a zvolit si / = u. Pak nám nezbude, než považovat euw za derivaci nějaké funkce g. To ale není velký problém, protože podle pravidla o derivování složené funkce deuw d(uwj dgl (10.83) du du d(uw) ' takže hledanou funkcí g je -^deuw. Po dosazení za / a g do rovnice 10.81 li i í ueuwdu = í -d(udeuw) - í -euwdu = - kte1""!-! - -4 k™]1, J J w J w w wz -1 -1 -1 = - (ew + e-w) - -^ (ew - e-w) . (10.84) 1/7 wz Když tento výsledek dosadíme do rovnice 10.79, U = -RTw----^-- = -RTw----- (10.85) ^1t) ^—II) \ .vír' —11) „.. I ^ ' 10.10 Taylorův rozvoj V rovnici 10.85 jsme získali přesný výsledek průměrné energie pro různé orientace elektrického dipólu poblíž náboje. Mohli bychom tedy být spokojeni. Poměr součtu a rozdílu exponenciálních funkcí je ale dost složitá závislost. Proto se pokusíme výsledek ještě zjednodušit. Exponenciální funkce jsme pro malé hodnoty v exponentu zjednodušovali už víckrát. Obvyklým předpokladem bylo eAt k, 1 + Ar, (10.86) kde Aŕ t ti ti Ati Ati Ati 54 = y ^)dí=y ^F-dí-^^r- y dAí-^-r- y AtáAt-^^r- J —dAí to to 0 0 0 = d"-4/(r!) _ d"-4/(t0) _ d-3/(r0) _ d-2/(r0) At2 d"-V(r0) Ar3 dí™-4 dí™-4 dí™~3 1 dí™-2 2 dí™-1 3-2' 1 j Když budeme celý postup opakovat n-krát, získáme _ ,m f(. , ,. . ,df(t0) (t-t0)2d2f(t0) dn-2f(t0) (ŕ-r0)"-2 d"-V(ŕ0) (ŕ-to)"'1 (10.95) Převedením /(ŕ) na levou stranu a g„ na pravou stranu dojdeme k vyjádření funkce /(ŕ) x ,^d/(ío) (ŕ-ŕo)2d2/(ŕ0) (t-t0)"-2 d"-2/(t0) (í-íp)"'1 d"-V(ŕ0) /(í) - /(í0)-(í-í0)_ - — . . - (n_2), ---rä (n_l)! dín-l (10.96) Připomeňme, že g„ je n-násobný integrál funkce go = d™/(í)/dí™. Obecně je tedy gn nějaká funkce proměnné í. Pro některé funkce /(ŕ) se ale hodnota integrálu g„ blíží nule pro n —> oo. Takové funkce můžeme zapsat jako nekonečné řady /(^f^.íLM!. (10.97) w ^ dí™ n! v ; n=0 10.10. TAYLORŮV ROZVOJ 161 Tomuto způsobu zápisu se říká Taylorův rozvoj a nekonečné řady v tomto zápisu se označují jako Taylorovy řady. Pokud gn —> 0 pro n —> oo, je nekonečná Taylorova řada přesným zápisem funkce f(t). Pro rozhodnutí, zda se gn blíží k nule pro n —> oo, je užitečná následující úvaha. Při výpočtu gn integrujeme n-tou derivaci funkce f(t). Tato derivace je koneckonců zase nějaká funkce, říkejme ji třeba D(t). Nejvyšší a nejnižší hodnotu této funkce pro interval (t0,ti) si označíme H a h. Integrál D(t) v mezích od to do t\ je rovný obsahu plochy pod grafem D{ť) v rozmezí od to do t\. Tento obsah je určitě menší, než obsah obdélníku šířky t\ — to a výšky H, a určitě větší, než obsah obdélníku šířky t\ — to a výšky h. Zmíněné obdélníky jsou přitom integrály konstantních funkcí H a. h v mezích od to do t\. Je také jasné, že integrál D{ť) se rovná obsahu obdélníku šířky t\ — to a nějaké výšky n, což je hodnota D{t) pro nějaké t v intervalu (ío,íi)- Při počítání dvojného integrálu bude integrál rovný objemu pod plochou grafu D{ť) nad čtvercem rozměrů (ti — to) x (ti — to)- Tento objem je menší, než objem hranolu výšky H nad základnou (ti — to) x (ti — to), a větší, než objem hranolu výšky h nad stejnou základnou. Objemy hranolů jsou přitom dvojné integrály konstantních funkcí H a /i v mezích od to do t\ v obou rozměrech. Opět musí existovat takové t, že hranol se základnou (ti — to) x (ti — to) a výškou D(t) má stejný objem, jako dvojný integrál D(t). Vícenásobné integrály už si graficky znázornit nedokážeme. I pro ně však platí, že (1) n-násobný integrál funkce D(t) je větší, než n-násobný integrál konstantní funkce H, a menší, než n-násobný integrál konstantní funkce h pro stejné meze, a (2), že musí existovat hodnota t = t, pro kterou je n-násobný integrál konstantní funkce D{t) stejný, jako n-násobný integrál D(t). Integrály konstantních funkcí spočítáme snadno s použitím substituce At = t — to At At At At j dAí • • • n-krát ■■■ J K dAí = K j dAí • • • n-krát - j dAí = K^y, (10.98) 0 0 0 o kde K je H, h, nebo D(t). Z toho vyplývá, že !LJ*rh < k= v rovnici 10.99 je rovná eT pro jakékoli n. Zbývá nám tedy porovnat (t — t0)"/n! a (t — Íq)™-1/(n — 1)1 {t - in - 1)1 - 1 - t0 - Ihn^oo (^) = hm_ (t^L) = 0 g-n-i (t-t0)n 1 n! n \9n-i. => lim^oo (ffn) = 0 • ffn_! = 0. (10.100) Díky tomu, že všechny derivace exponenciální funkce /(ŕ) = e* se rovnají e*, je také snadné spočítat Taylorův rozvoj exponenciální funkce. Pro to = 0 jsou všechny derivace v řadě e° = 1 a řada má tvar 00 j-n j-2 j-3 4-4 '<'> = 2:a = i + ' + 2 + ä + 4i- (lal01) n=0 Nejčastějším využitím Taylorova rozvoje je nahrazení nějaké složité funkce proměnné t v okolí bodu to funkcí polynomiální, se kterou umíme dobře zacházet. Pokud se hodnoty vyšších členů Taylorovy řady rychle snižují, je dostatečně dobrým přibližným vyjádřením funkce /(ŕ) několik málo nejnižších členů Taylorovy řady. Naše zjednodušení eAt « 1 + At je vlastně použitím prvních dvou členů (konstantního a lineárního) Taylorovy řady. 162 KAPITOLA 10. NÁBOJE Pro zjednodušení vztahu v rovnici 10.85 se nám vyplatí začít s celou Taylorovou řadou 1 1 1 . . 1,1 e -(±W)° + Yj^)1 + ^(W + 5j(±w)3 + ''' = 1 ± w + 2^ ± e""3 + ''' (10'102) Protože jsme předpokládali, že d , se rovná potenciální energii Qi4>. Podle Boltzmannova zákona (rovnice 5.33) je poměr počtu iontů s energií Qi<$> k počtu iontů s průměrnou energií £ v nějakém objemu rovný TI ■ Qi4> — £ _l=e (10.123) Vzhledem k tomu, že navenek jsou roztoky iontů elektricky neutrální, je průměrná energie všech kladných a záporných iontů nulová. Celková hustota náboje v objemu V je součet všech nábojů vydělený objemem V n _ Řekli jsme si, že Debyeova-Hůckelova teorie je rozumným přiblížením jen pro zředěné roztoky, kde jsou náboje daleko od sebe. Pokud jsou náboje hodně vzdálené od zkoumaného náboje, budou energie Qi4> nižší než kinetické energie iontů a tedy i než k^T. Kdyby tomu tak nebylo, nerozptýlily by se ionty difúzí v celém objemu roztoku, ale elektrostatické síly by je přitáhly k sobě a ionty by vytvořily iontový krystal. Proto můžeme exponenciální funkci nahradit Taylorovým rozvojem i=l v a ' i=l D i=l První člen rozvoje se musí rovnat nule, aby byl roztok elektricky neutrální, a vyšší členy můžeme pro Qi r2 ár \ ár ) r2 dr \ dr ) r2 \ dr dr dr2 dr) r dr2 ' (10.127) získáme jako v části 9.4 rovnici pouze s druhou derivací. Vynásobením obou stran r dojdeme k rovnici 166 KAPITOLA 10. NÁBOJE d2u u — = —, (10.128) drz TJ, kterou už budeme umět vyřešit. Rovnice nám totiž říká, že druhou derivací funkce u je (až na 2 D kladnou konstantu l/r2)) tatáž funkce. Takto se chová funkce exponenciální ^-e±kr = ±ke±kr => ^ = k2e±kr. (10.129) dr árz Z toho vyplývá, že řešením Poissonovy-Boltzmannovy rovnice je buď ero , nebo e ro , nebo jejich lineární kombinace u = A+e^Ď -\- A-e~^ň. (10.130) Výrazy v exponentu musí být bezrozměrné. To nám říká, že rrj má rozměr délky. Proto jsme v Poissonově-Boltzmannově rovnici shrnuli konstanty do výrazu l/V2), ve kterém se vyskytuje ro- Této konstantě se říká Debyeova délka. Hodnotu konstant A+ a A_ určíme z okrajových podmínek, když se od funkce u vrátíme k potenciálu (p e rD e rd 4> = A+— + —. (10.131) Potenciál cp je nulový pro r —> oo. Clen s A_ se skutečně k nule blíží. K čemu se blíží A+ zjistíme podobně jako v rovnici 6.35. Protože čitatel i jmenovatel v limitě e rd oo lim -= — (10.132) z—>oo r oo jsou nekonečné, spočítáme, jak rychle se hodnoty v čitateli a jmenovateli k nekonečnu blíží. To nám podle ĽHospitalova pravidla řeknou jejich derivace de~ 1 ^_ dr ^e-d ^ , > —-— = —ero , — = 1, hm -ľ--= — = oo. (10.133) dr ro dr z^oo 1 1 Jak vidíme, člen s A+ se blíží nekonečnu, protože exponenciální funkce v čitateli roste rychleji, než lineární v jmenovateli. Aby byl potenciál nulový, musí být A+ = 0. Hodnotu A_ získáme, když porovnáme pravé strany rovnic 10.122 a 10.126 _P = _*=^£_ 6 rD rD r V elektricky neutrálním roztoku je integrál nábojové hustoty p v celém okolí zkoumaného iontu (tedy od iontového poloměru ro do nekonečna) rovný náboji zkoumaného iontu Qq s opačným znaménkem oo oo Qo = - J pdV = - j AiTr2pdr = j re~^dr. (10.135) Vokolí r0 ° r0 Takový integrál jsme řešili metodou per partes v rovnici 10.81. Když si jako funkce f a g z rovnice 10.81 zvolíme r a —roe r& , je řešení re ro dr fjp-dr = [ d^/g'>dr- f g^fdr dr / dr / dr oo oo oo /d(fg)-ígfrAr=[fg]Z-f g%dr. (10.136) 10.12. DEBYEOVA-HÚCKELOVA TEORIE 167 Po dosazení za / a g (a opět s použitím ĽHospitalova pravidla) re ro dr r " oo ■ r ' oo —rrrye rv — r q e rd - takže a odtud Celkový potenciál je tedy roe ro dr h =-2—{ro+ruFue r° Qo rD iíL A- =---ero (ro + rD)rDe ^ . 4ire r0 + rD (10.137) (10.138) (10.139) A-- e ro /o rD m e -d (10.140) r 47t6 ro + ro r Když od tohoto potenciálu odečteme potenciál zkoumaného iontu, podle Coulombova zákona rovný , získáme potenciál ostatních iontů (iontové atmosféry okolo zkoumaného iontu) >q rD in_e ro 1 1 rD isl -erDe ro — l - - - , (10.141) 47t6 ro + ro r Aire r Aire r \ro+ro / Tento potenciál se ve vzdálenosti, kam se mohou ostatní ionty ke zkoumanému iontu nejvíce přiblížit (iontový poloměr ro), rovná 0atm(í"o) 1 IQ. r0 -ero e ro — 1 1 Qo / »"D 4-7re r0 V ro + rD / 4-7re r0 \ ro + rD Protože ve zředěných roztocích je r o ) = Acoss'm(ujt) + Asmcos(ujt). (H-5) A B Nebo můžeme použít vztah 7.89 a řešení zapsat — R 4- i A . (11.6) Vztah konstanty uj k hmotnosti m a tuhosti k přímo vyplývá z výsledku druhé derivace řešení naší rovnice d x , d smíwŕ) d smíwŕ) , 9 , N 9 , N 9 k k -—= A-—^—- + B-—^—- = -Aujz sin(wŕ) - Bujz sin(wŕ) = -u1 x =--x => uj = \—. átz átz dtz m V m (11.7) Koeficienty A, B určíme z počátečních podmínek. Pokud například začneme měřit čas od okamžiku, kdy závaží prochází rovnovážnou polohou, bude v čase t = 0 výchylka x = 0 a rychlost maximální (označme ji v0). Z toho vyplývá x(t = 0) = 0 = A sin(O) + B+ cos(O) = B x (t) = Asm(ujt) (11.8) da;(í = 0) -v0 = Awcoa(0)=Aw A=^=voxf^ (11.9) dí uj V k a tedy maximální výchylka A je maximální rychlost vydělená uj = ^Jkjrn. Zatímco síla působící na závaží, jeho výchylka, rychlost a zrychlení se s kmitáním pružiny stále mění, celková energie pružiny zůstává konstantní. Tato celková energie se skládá z kinetické energie závaží a potenciální energie stlačení či natažení pružiny. Kinetická energie je mv2/2, potenciální energii můžeme spočítat jako práci potřebnou k přemístění závaží z rovnovážné polohy, kde x = 0, do polohy s okamžitou výchylkou xt xt xt W = J (-F)dx = J (kx)dx = ^kx2. (11.10) o o Celková neměnná energie závaží s pružinou je tedy £ = -mv2 + -kx2 (11-11) 2*2* kde f t je rychlost závaží ve chvíli, kdy je výchylka xt. 172 KAPITOLA 11. VIBRACE 11.2 Lagrangián Při popisu vibrace jsme začínali Newtonovým zákonem síly F = ma=d^. (11-12) dŕ v ; Jinou možností je vyjít z energií Celková kinetická energie molekuly skládající se z N atomů je N .n. 2 1 N £íin = ^m^2vn-vn (11.13) fe=i a závisí jen na rychlostech jednotlivých atomů vn, ne na jejich polohách fn. Zrychlení atomů an souvisí s derivacemi kinetické energie podle rychlostí a času dS ■ 1 = -m(2vnl) = mvni = pnh (H-14) ovni 2 d , , dpni d dSkin mani = —(mvni) = —— = — —-, (11.15) dV ' dt dt dvnl y ' kde n je číslo atomu a l je složka vektoru (x, y, nebo z). V přítomnosti sil, které závisejí pouze na souřadnicích x, y, z a mohou být tedy vypočítány jako gradienty potenciální energie, může být zákon síly zapsán dpni _ d <9£kin _ dSpot dt dt dvn, drn. = Fnl. (11.16) Protože fkin závisí jen na rychlostech (ne na polohách) a £pot zase závisí jen na polohách atomů (ne na jejich rychlostech), můžeme sloučit f^in a £pot do jedné funkce, zvané Lagrangián C: Q _ dpni _ F i _ d d£kin _ d£pot _ d d(£kin - Spot) _ d(£kin - Sp0t) = d dC _ dC dt n dt dvni drnl dt dvnl drnl dt dvnl drnl' Soustava rovnic 11.17 pro všechny hodnoty n a l (celkem 3N kombinací) dobře poslouží popisu N volných atomů (například vzácných plynů), které mají 3N stupňů volnosti. Pokud jsou atomy omezeny 3N — C vaznými podmínkami, například vazbami v molekule, počet stupňů volnosti je snížen na 3N — C a tolik by také mělo být rovnic, které pohyby atomů popisují. Proto je žádoucí 3N hodnot rni nahradit 3N — C hodnotami jiných proměnných, zvaných zobecněné souřadnice qj. Každá hodnota r„; pak může být kombinací více hodnot qj, takže 3N-C p. d^= E TT^' (n-18) a pokud vazné podmínky nezávisí na čase . 3N-C n , 3N-C n drnl ^ drnldqj ^ drnl . j=i lj j=i lj kde tečka označuje derivaci podle času. Pohybovou rovnici pak můžeme přepsat d dC _ äC dt dqj dqj (11.20) OblclZek 11.2l Legendrova tranformace obecné funkce f(x) (A) a jednorozměrného Lagrangiánu C (B) a inverzní Legendrova tranformace obecné funkce g(s) (C) a jednorozměrného Hamitoniánu "H (D). Transformace je znázorněna pro Lagrangián C a Hamiltonián "H popisující síly nezávislé na rychlosti. 174 KAPITOLA 11. VIBRACE Rovnici 11.20 jsme si odvodili z Newtonova zákona sily. Mechanika může být ale vybudována i opačným směrem. Můžeme vyjít z tvrzení, že pohybové rovnice popisující děj, který zaěíná v ěase t\ a koněí v ěase t2 musí být takové, aby integrál J 2 Lát byl stacionární, tedy aby variace tohoto integrálu byla nulová. Toto tvrzení je známé jako princip nejmenšího úěinku a pomocí variačního počtu z něj může být rovnice 11.20 odvozena. Radost z nalezení Svatého Grálu mechaniky v Lagrangiánu je ale zkalena skutečností, že neexistuje obecné pravidlo, podle kterého bychom mohli Lagrangián vyjádřit jako konkrétní matematickou funkci. Nalezení Lagrangiánu může být pěkný oříšek, vyžadující zkušenost a fyzikální intuici. Naštěstí se v naší základní analýze pohybů atomů v molekule můžeme omezit na síly nezávisející na rychlostech. V tomto případě je Lagrangián jednoduše rozdílem kinetické a potenciální energie. Z Lagrangiánu můžeme spočítat jinou funkci spojenou s energií, zvanou Hamiltonián. Vztah mezi Lagrangiánem a Hamiltoniánem popisuje takzvaná Legendrova transformace K(i V3 lA|/3 Ax3 Obrázek 11.3: Pohybové módy molekuly oxidu uhličitého. Translační módy popsané proměnnou q± (A) a 0, které označíme ipi a 933, bude mezi úhly a, (fi a ^3 vztah a - fi + f 3 a = tt + (f1 — (f3. (11.25) Pro malé odchylky od lineárního tvaru budeme opět předpokládat kvadratickou závislost energie na odchylce úhlu a od jeho nejvýhodnější hodnoty ag = tt, což odpovídá lineární závislosti vratné síly na odchylce a — ag pot,CK ka(a - a0)2 _ ka(a - tt)2 _ ka(-K + — {m0x1 + mcx2 +m0x3) = 0 => —---■- = -— = 0. (11.30) átz átz 2mo + mc cdz Jako první separovanou proměnnou qi jsme tedy odhalili souřadnici x polohy těžiště a její pohybová rovnice nám říká, že má nulové zrychlení. Ke stejnému závěru dojdeme pro souřadnice y a z polohy těžiště sečtením rovnic IV-VI a VII-VIII. 11.5. VIBRAČNÍ POHYBY 177 d2 moyx + mcV2 + mpy3 _ d2g2 _ Q d2 mpzi + mcz2 + m0z3 _ d2g3 _ Q (1131) dí2 2mo + mc dí2 ' dí2 2mo + mc dí2 To nám říká, že translačním pohybem celé molekuly (obrázek 11.3A,B) se nemění potenciální energie a na atomy tedy nepůsobí žádná síla, která by je vracela do původní polohy (vratná síla). Tak jsme popsali tři translační pohybové módy molekuly CO2, se kterými není spojen žádný periodický pohyb. Tyto pohybová módy jsou navzájem kolmé, tedy z geometrického pohledu normální, vzájemně nezávislé, všechny atomy se při nich pohybují zároveň. Celkový translační pohyb celé molekuly v libovolném směru je lineární kombinací popsaných tří módů. 11.5 Vibrační pohyby Vraťme se k rovnicím I-III. Při porovnání rovnic I a III nás ihned napadne, že další separovanou proměnnou získáme jejich odečtením d2 d2 d2íj4 m°ďí2 (Xl ~ x^) = m°ďí2 (^Xl ~ ^X3^ = m°"ďí2" = ~kx ~ ^X3^ = ~kxq4> (11-32) d2(74 kx _ n. -ttt =-- 11.33 átz toq Získali jsme pohybovou rovnici harmonického oscilátoru (rovnice 11.7). Protože jsme se rozhodli měřit čas od okamžiku, kdy atomy mají nulové odchylky od nejvýhodnějších poloh, je počáteční hodnota 94(0) = Axi(O) — Ax3(Q) = 0. Řešením rovnice pro 54 = Axi — Ax3 je proto q4(t) = A4sin(w4r), (11.34) kde LJ4 = kx/mo- Pohybový mód, který tato rovnice popisuje, je asymetrická vibrace, při které atom uhlíku zůstává nehybný a atomy kyslíku se od něj se stejnou fází a s frekvencí w4 vzdalují nebo k němu přibližují (obrázek 11.3C). Poslední kombinace rovnic I—III možná není tak zřejmá. Odvodíme si ji proto trochu podrobněji. Začneme tím, že sečteme velmi podobné rovnice I a III a porovnáme je s rovnicí II d2(Xl+x3) d2(Ax1 + Ax3) to0--= m0--= -kx(Ax1 + Ax3) + 2kxAx2 (11.35) d22ľ2 d2Aaľ2 mc~ďJT = TOC dt2 =+kx(Ax1 + Ax3) - 2kxAx2. (11.36) Druhou rovnici vynásobíme nějakou konstantou A a obě rovnice sečteme d2 — (mo(Ai! + Ax3) + \mcAx2) = (A - l)kx(AXl + Ax3) - 2(X - l)kxAx2. (11.37) átz Jakou hodnotu musí mít A, aby poměr konstant násobících Ax2 ke konstantám násobícím (Axi + Ax3) byl stejný na levé i pravé straně, a mohli jsme tak výchylky Ax\, Ax2, Ax3 sloučit do jedné proměnné q5? ^ = -2 =* A = -2^2.. (11.38) 178 KAPITOLA 11. VIBRACE Jak vidíme, třetí kombinace rovnic I III je I + III — (2mo/wic)II m0^(Ax1 + Ax3 - 2Ax2) = -kx (í + ---^ (Au + Ax3 - 2Ax2), (11.39) díz \ mc J ^(Ax, + Ax3 - 2Ax2) = ^ = -— (l + —) (Ax, + Ax3 - 2Ax2) = -^q5. (11.40) átz átz mo v mc / Řešením této rovnice je q5(t) = A5sin(W4í), w5 = J^- 1 + —- . (11.41) Rovnice pro q§ popisuje symetrickou vibraci, při které se atomy kyslíku pohybují stejným směrem se stejnou fází, zatímco atom uhlíku se pohybuje také se stejnou fází, ale v opačném směru, tak aby těžiště zůstalo nehybné (obrázek 11.3D). Podívejme se teď na rovnice IV-IX. Translační pohybové módy, popsané souřadnicemi q2 a q3, jsme už zmínili. Srovnání součtu rovnic IV a VI s rovnicí V připomíná rovnice 11.35 a 11.36. To nám napovídá, že k dalšímu pohybovému módu nás dovede kombinace IV + VI — (2?7!,o/m,c)V. Výsledkem je ^(Vi +V3- 2y2) = ^. = -J-y-(l + (Vl +V3- 2y2) = -ufa (11.42) s řešením q6(t) = A6sm(u6t), w6 = W-Ml +-- . (11.43) Tato rovnice popisuje deformační vibraci, kdy se atomy kyslíku pohybují na jednu stranu se stejnou fází a atom uhlíku se pohybuje v opačném směru, takže těžiště zůstává nehybné (obrázek 11.3E). Úplně stejně dojdeme k popisu deformační vibrace v rovině xz ^(2/1+2/3-22/2) = ^(Ay1+Ay3-2Ay2) = ^ = -h-(l + ^ (Ayi + Ay3-2Ay2) = -u*qr, (11.44) q7(t) = A7sin(c7í), u7=J]-y-(i + --]£.). (n.45) po \ mc / Vztah mezi vibračními pohybovými módy, popsanými proměnnými q^, q5, qe, qj, je podobný jako v případě translačních pohybů. Vibrace jsou nezávislé, druhá derivace každé proměnné závisí (přímou úměrou) pouze na hodnotě této proměnné. Jednotlivé módy popisují pohyby, při kterých všechny atomy vibrují se stejnou frekvencí i fází. Požadavek na stejnou frekvenci a fázi bývá uváděn přímo jako definice normálních vibračních módů. Popsané vibrační módy jsou ale normální i ve smyslu kolmosti (v geometrii slovo normála popisuje kolmici). V čtyřrozměrném abstraktním prostoru tvořeném proměnnými (1L73) m0J m0 ^X1+(uj2-2^)x2 + ^X3, (11.74) ni c y mC J mC &x v , f, 2 ^x \ -X2+[uj2-^)X3. (11.75) rovnic se říká homogenní. Pomocí matic můžeme převedení Xn na "0" 611612613 0 = 621622623 x2 x2 = 0 631632633_ x3 x3 611 - p 612 613 621 622 - p 623 631 632 633 - p x x 'x{ C11C12C13 'Xi x2 = C21C22 C23 x2 x3 _c3ic32 c33_ X Č X (11.76) Proměnné můžeme v homogenní soustavě Gaussovou metodou eliminovat úplně stejně, jak jsme si popsali pro soustavu nehomogenní (s nenulovou levou stranou). £21^ Aí c2i en Xí-cii )Xi- 0=[c31^i-c11)X1- C12 C11 ,£11 ' C31 x2 :c22%£ - c12)X2- Cl3 X3 'C23Sľ ~ c13 )*3, ,£11 ' C31 (11.77) Tentokrát si označíme nové koeficienty násobící Xi v druhém a třetím řádku jako C, (i) C. (i) Y1 =c11X1+ C12 X2- (i) 22 — 0 Xx J20 (1) 30 " -o9t A.2- Cl3 X3, (i) 23 Lj^ Jl3 0 X\-\-C32 X2-\-C33 X3. (11.78) 11.8. HOMOGENNÍ SO ÚSTAVY LINEÁRNÍCH ROVNIC 183 Ve druhém kroku eliminace vynásobíme třetí rovnici poměrem C22*/Cg a od výsledku odečteme druhou rovnici 0 = c11X1+ c12 X2+ ci3 X3, o= o Ii+ cg) x2+ cg) x3, 0= o x1+ [ cg}^ cg}) x2+ (cg^ cg) x3, (11.79) 0 = cnXi+ ci2 X2+ ci3 X3, 0= 0 X1 + C(22>X2+cgx3, (11.80) 0= 0 Xj.+ 0 X2+C$X3, takže rovnice, ve které nám zbude X3, bude mít tvar 0 = cg}X3. (11.81) Tato rovnice bude samozřejmě splněna pro X3 = 0. Homogenní soustavy lineárních rovnic ale mají i nenulová řešení. V případě pohybových rovnic nás právě zajímají řešení pro nenulové výchylky, popsané funkcemi Xn. Aby rovnice 11.81 platila pro nenulové hodnoty X3, musíme X3 násobit nulou. Ukážeme si nejdříve řešení pro obecný tvar homogenní soustavy. Postupným zpětným dosazením získáme ,(2) _ n{\)C22 (1) _ / Cn 0 = C£ = Cg>^ Cg> = - ci3 ) Z : ( C23- - ci3 ) , (11.82) C22— -ZZ C21 Cl2 ( Cn c23- V C21 C32— -iA C3i Cl2 / Cn c32-- V c31 -ci2)| ( Cn C23- V C21 y32 0 = ^C22^- - Ci2^j Í^^~ ~ ) _ ( C32T--) ( C237--) ' (11.83) Co vznikne roznásobením velkých závorek? V obou součinech se vyskytují červené výrazy Ci2 a ci3, výrazy Ci2Ci3 vzniklé jejich vynásobením se odečtou a ve výsledku se proto nevyskytnou. Všechny ostatní výrazy vzniklé roznásobením čitatele i jmenovatele budou obsahovat alespoň jednou modrý člen cn / Cn cn Cn cn \ / cn cn cn cn \ 0 = c22 — c33--c22 — c13 - c33 — c12 - c32—c23--c32—c13 - c23—c12 . (11.84) V c2i c31 c2i c31 / V c31 c2i c31 c2i Po vytknutí cn a převedení na společného jmenovatele „ / c11c22c33 - c12c21c33 - c13c22c31 c11c23c32 - c12c23c31 - c13c21c32 0 = cn--- V c21c31 c21c31 Pokud je koeficient cn nenulový, můžeme obě strany rovnice vynásobit c2\c3i/c\\ 0 = c11c22c33 - c12c21c33 - c13c22c31 - c11c23c32 + c12c23c31 + c13c21c32, (11.86) Výsledkem našich úprav je docela složitá kombinace součinů koeficientů Cji, kterou násobíme X3. Pro j =/= l jsou koeficienty Cji rovné koeficientům bji z matice B původně násobící vektor X na pravé straně rovnice 11.72. Pro j = l platí Cjj = bjj — j3. Rovnice 11.86 nám tak umožňuje nalézt vlastní hodnoty j3 pro matici B. Kombinaci součinů na pravé straně se z pohledu hodnot j3 říká charakteristický polynom. Jak ukazuje hned první součin v kombinaci, pro soustavu tří rovnic jde o polynom třetího řádu, tedy kubickou rovnici se třemi kořeny j3. (11.85) 184 KAPITOLA 11. VIBRACE 11.9 Determinanty Kombinace součinů koeficientů Cji z rovnice 11.86 se skládá ze součinů tří Cji, z nichž každý pochází z jiné rovnice (jiného řádku matice C). Pokud si vytkneme koeficienty z první rovnice, 0 = Cll(c22C33 - C23C32) + Cl2(c23C3l - C21C33) + Cl3(c2lC32 - c22c3i), (11.87) obsahují závorky násobící každý koeficient cu výraz c2i'C3i" — c2í"C3;/, kde ľ ^ l a l" =/= l. Co určuje, který index je Z' a který l", tedy před kterým součinem je kladné znaménko a před kterým záporné? Například ve výrazu C22C33—C23C32 se vlastně vyskytují součiny s permutacemi čísel 2, 3 v druhém indexu. Záporné znaménko má přitom součin, kde je pořadí druhých indexů oproti posloupnosti 2, 3 obrácené, tedy 3, 2. Podobně je tomu i s druhými indexy ostatních výrazů c2i'C3i" —c2i>>c3i>. Před součiny, ve kterých je pořadí druhých indexů obrácené proti posloupnosti 1, 2, 3, 1, 2, 3,. .., je záporné znaménko. Kombinaci součinů koeficientů Cji poskládaných tak, jak jsme si právě popsali, říkají matematici determinant matice C. Rozšířit pojem determinantu nám pomůže následující úvaha. Co by se stalo, kdyby se v soustavě rovnic 11.49-11.51 rovnalo X\ nule? Pak by nám k řešení soustavy stačily rovnice dvě, například 11.50 a 11.51 Y2 = c22 X2+ c23 X3 y3S ~Y2=(C32S ~C22)Ä2+ (C33S ~C23)Ä3- (n-88) c(1) o r,( 30 o3. Pokud Yn = Y3 = 0, C32 0 = ^X3= (C33— -C23 )X3. (11.89) Tato rovnice platí pro X3 =/= 0 tehdy, když 0 = C22C33 - C23C32, (11.90) což je obdoba rovnice 11.87 pro soustavu dvou homogenních lineárních rovnic, ale také výraz násobící koeficient cu v rovnici 11.87. Podobně můžeme analyzovat případ, kdy se nule rovná X2- Pokud opět použijeme rovnice 11.50 a 11.51, ale pro změnu budeme eliminovat X3l získáme2 Y2 = c2i Xi+ c23 X3 y3S ~Y2=(C3i2 ~C21)Xi+ (C33S ~C23)Ä3- (n-91) Pokud Y2 = Y3 = 0, C(1'> r(1'> 0 °30 Oon C[3\)X1 = ( C31— - C21 ) li. (11.92) V c33 2Mohli bychom stejně dobře eliminovat X\ a získat rovnici pro X3, ve které by místo CÍ^ bylo C33', které je rovno —Vzhledem k tomu, že na levé straně je v případě homogenní soustavy nula, nám nic nebrání výslednou rovnici vynásobit —1 a psát výsledek se stejnými znaménky u C23C31 a C21C33 ať už eliminujeme X\ nebo X3. Jak jsme si řekli, o znaménkách rozhoduje pořadí čísel 1,2,3 v druhém indexu. Eliminaci X3 jsme si zvolili jen proto, abychom se násobení — 1 vyhnuli. 11.10. VLASTNÍ HODNOTY FREKVENCÍ 185 Tato rovnice platí pro X3 =/= 0 tehdy, když 0 = c23c3i - c21c33, (11.93) což je kromě obdoby rovnice 11.87 pro soustavu dvou homogenních lineárních rovnic také výraz násobící koeficient c\2 v rovnici 11.87. Do třetice prozkoumáme případ, kdy se nule rovná X3. Vyjdeme-li i tentokrát z rovnic 11.50 a 11.51, Y2 = c2i Xi+ c22 X2, C21 v ( C21 \ y . f c21 s--Y2=[ c31--c2i Ai+ c32 — c31 V c3i / V c3i Y3---Y2= [ c31---c2i ) Xi+ \ c32---c22 ) X2. (11.94) Pokud Y2 = Y3 = 0, 0 = C$X2= (c33— -C23 )X2. (11.95) V c32 Tato rovnice platí pro X2 =/= 0 tehdy, když 0 = C21C32 - c22c3i, (11.96) což je kromě obdoby rovnice 11.87 pro soustavu dvou homogenních lineárních rovnic také výraz násobící koeficient c13 v rovnici 11.87. Co jsme se ze zkoumání řešení tří různých soustav dvou rovnic dozvěděli? Ze determinant matice o rozměru 3 x 3 se rovná součtu koeficientů prvního řádku, vynásobených determinanty matic o rozměrech 2x2 získaných z matice o rozměru 3x3 takto: vynecháme vždy první řádek a ten sloupec, ve kterém se nachází koeficient cu, který násobíme. Pokud je pořadí druhých indexů koeficientů c2i'C3i" opačné, než v posloupnosti 1, 2, 3,1, 2, 3,..., násobíme navíc součin cu s determinantem — 1. Tento krkolomný návod pro počítání determinantu platí obecně pro matici rozměru N x N. Determinant se rovná součtu koeficientů prvního řádku násobených determinanty matic rozměrů (N — 1) x (N — 1) získaných přesně tak, jak jsme si popsali pro matice o rozměrech 2x2. Tyto součiny násobíme —1 tehdy, když pořadí druhých indexů odpovídá lichému počtu přehození čísel z posloupnosti 1, 2, 3,4,... N, 1, 2, 3,.... 11.10 Vlastní hodnoty frekvencí Vraťme se teď k řešení pohybových rovnic a podívejme se na determinant, ke kterému dojdeme eliminací proměnných v soustavě rovnic 11.73-11.75. Koeficienty Cji pro tuto soustavu jsou kjr~ &x 2 ^x 2 ^x Cl 2 = C32 = -, C21 = C23 = -, Cu = C33 = Lú--, C22 = W -2-, C13 = C31 = 0. (11.97) Gaussova eliminační metoda nás dovede k „ „(2) v (CllC22C33 - C12C21C33 - C13C22C31 C11C23C32 - C12C23C31 - C13C21C32 \ , . u — ^33 A3 — en---A3. (ll.ysj V C21C31 C21C31 J Má-li být výchylka X3 nenulová, musí se nule rovnat determinant 0 = Cll(c22C33 - C23C32) + Cl2(c23C3l - C21C33) + Cl3(c2lC32 - C22C31), (11.99) 186 KAPITOLA 11. VIBRACE vlastně jen O = Cll(c22C33 - c23c32) - Cl2C2lC33, (11.100) protože ci3 = c3i = 0. Po dosazení ^2 k% \ I'2 2 ^x \ ( uj2 ^x \ ^x ^x ^x ^x ( uj2 ^x mo / \ mc / V mO / mO mC mO mC \ mO ^2 _ M / 4 _ ^2 (kx_ 2K_\ _ 2k^k^\ = mo / V Vmo mc / TOo TOc TOo TOc / w2 ^2_M ^2_ Í^L+2h.)) =0. (11.101) V mo J \ \m0 mc J J 2 Tato rovnice, kubická pro proměnnou uj , má tři kořeny 2 _ kx 2 _ kx(2m0 + mc) c^ = 0, lo2 = ^l-, 1^ = "^--w . -w_ (11.102) mo monic Tyto kořeny odpovídají frekvencím wi z části 11.4 a W4 a W5 z části 11.5. 11.11 Amplitudy Známe-li již frekvence, můžeme postoupit k určení amplitud. První pohled na rovnice 11.66-11.68 říká, že pokud jsou výchylky nenulové, můžeme všechny rovnice vydělit sin(wŕ) a získat pro každou hodnotu ui soustavu tří rovnic pro amplitudy jako neznámé. Dosazením kořenů do těchto rovnic získáme relativní3 hodnoty amplitud A\-A%. Dosazení uii = 0 vede k soustavě i)=-kxA1 +kxA2 = kx{A2-A{), (11.103) 0 = kxAľ - 2kxA2 + kxA3 = kx{Ax + A3- 2A2), (11.104) 0 = ^2 - kxA3 = kx(A2 - A3). (11.105) Protože kx /= 0, pravé strany se rovnají nule jen, když A\ = A2 = A3. Dosazení w4 = \Jkxjmo vede k soustavě -KA^-k^ + k^ => Q = kxA2, (11.106) -kx^A2 = kxA1-2kxA2 + kxA3 => 0 = kx(A1+A3), (11.107) m0 -kxA3 = kxA2-kxA3 => 0 = kxA2. (11.108) Z první a třetí rovnice vyplývá, že A2 = 0, a dosazení tohoto výsledku do druhé rovnice ukazuje, že A3 = —A\. Dosazení ui§ = \Jkx(2mo +mc)/momc vede k trochu složitější soustavě 3 Absolutní hodnoty amplitud závisí na konkrétních počátečních podmínkách. 11.12. NORMÁLNÍ VLASTNÍ VEKTORY 187 -kr 1 2mo mc J mc ^2 2 + — A2 = kxA1 - 2kxA2 + kxA3 = V moJ -kx[l + ^-)A3 = kxA2-kxA3 ^> Když odečteme první rovnici od třetí, získáme 0 = Aí - A3 Po dosazení do druhé rovnice 2A2 + —A2 = Á! + A3 - 2A2 = 2AX - 2A2 ma 11.12 Normální vlastní vektory U = = A2-A1, (11.109) 2mn ^-- , mc ) 2 + — ) A2 = A,. + A3 - 2A2, (11.110) m0; l+2-^)A1 = A2-A3. mc Ai =A3 A2 = - 2mo mc A1. (11.111) (11.112) (11.113) Pro každou frekvenci určenou z determinantu jsme získali trojici relativních hodnot amplitud, kterou můžeme zapsat jako vektor (v matematickém smyslu, ne jako veličinu, která má nějaký směr v trojrozměrném fyzikálním prostoru): wi = 0 CJ4 kx m0 I kx(2mp + mc) mc-mc [i;i;i]^i, [1;0;-1]A!, 2toq mc (11.114) (11.115) (11.116) Jak poznáme, jestli jsou tyto vektory (v matematickém smyslu) kolmé? Výpočtem jejich skalárního součinu. Pokud bude rovný nule, vektory jsou kolmé. Jednoduchý výpočet ukáže, že [1; 1; l]Ai • [1; 0; -l]Ai = (1 + 0 - l)A1 = 0, ale [i;i;i]^i 2roo mc A1 1 2mo mc (11.117) (11.118) takže vektory sestavené z amplitud kolmé (normální) nejsou. Musíme se tedy poohlédnou po jiných vektorech [ui, u2, u3], které by kolmé byly. Budeme předpokládat, že mezi amplitudami a složkami kolmých vektorů u\,u2,u3 je vztah A1 = X1u1, A2 = X2u2, A3 = X3u3 (11.119) a hledat dosud neznámé koeficienty Ai, \2, \3. Vektor, který jsme získali pro frekvenci uj\ = 0 tedy přepíšeme [Ai;A2;A3] = [l;l;l]Ai = [XlUl; X2u2; X3u3}. (11.120) 188 KAPITOLA 11. VIBRACE Rovnost amplitud vyžaduje Ai Ai U2 = T-, M3 = — => [Mi,M2,M3J A2 Podobně tvar vektoru [1; 0; — 1\A\ vyžaduje "3 = -^- => [ui,U2,U3] A3 Konečně vektor A1.A1 A2 A3 1;0;-^ Ml. (11.121) (11.122) [Ai;A2;A3} = 2m0 mc ukazuje, že (11.123) 2toq Ai A3 [Ml,M2,M3J = 1;- 2mo Ai Ai mc A2' A3 Ml. (11.124) mc A2' Koeficienty Ai,A2,A3 určíme z požadavku, aby byly vzájemné skalární součiny všech tří vektorů nulové j.Ai.V ' A2' A3 Ul l;0;-£ ^3 Ml 1 A11 1 - — I u 0 = 2mp Ai ' mc A2 0 = 2m0 Ai ' mc A2 mi = 1--+ 1 mí mi-[1;0;-1]mi = (1-1)m2, 2m0 A2 A2 m0 ' (11.125) (11.126) (11.127) Pokud budeme také chtít, aby měly vektory [mi,m2,m3] jednotkovou velikost, musí platit m0 Ml m0 mi=(1 + --- + 1)m2 1 mo 1 = [1;0;-1]mi-[1;0;-1]mi = (1 + 2)m2 Ml Ml m0 2mo + mc 1 (11.128) (11.129) 1 = l;-2,/^;l mc Ml l;-2,/^;l mc Ml = I 1+4—+ 1 ) m? Ml = 1 mc 1 mc V 2mQ + mc ' (11.130) Frekvencím wi, CJ4, CJ5, a tedy vlastním hodnotám u;2, u;2, u;2, teď již můžeme přiřadit opravdu jednotkové normální (vzájemně kolmé) vlastní vektory wi = 0: m0 2mo + mc l;W^;l m0 \/2mo + mc UJ4 h^. JL mO ' %/2 [1;0;-1]; = íř;I(2mo+mc)i 1 / mč momc -y/2 V 2m0 + mc l;-2,/^;l m0 [y/mo, y/mč, VmoJ , (11.131) (11.132) /mč, -2 Jma, Jmč] ■ y/2 \/2mo + mc (11.133) Kapitola 12 Vlny Ľanalyse mathématique . . . dans ľétude de tous les phénoménes; elle les interprete par le merne langage, comme pour attester ľunité et la simplicitě du pian de ľunivers, et rendre encore plus manifeste cet ordre immuable qui préside ä toutes les causes naturelles. Jean-Baptiste Joseph Fourier Matematika: vektorový součin, parciální a obyčejné diferenciální rovnice druhého řádu, rovnice vlny, komplexní čísla v exponenciálním tvaru, druhé derivace goniometrických funkcí, sumy a integrály, integrování per partes, derivace součinu, separace proměnných, substituce, mocninné řady, Fourierovy řady, Fourierova transformace, delta funkce, konvoluce. 12.1 Elektromagnetické vlny V části 10.2 jsme si popsali Maxwellovy rovnice pro případ nehybného elektrického pole. Pokud se náboje pohybují, objevuje se navíc záhadná síla, kterou nelze popsat pomocí skalárního potenciálu a které říkáme magnetismus. Jakmile drátem začne téci proud, vytvoří se kolem drátu magnetické pole, které obvykle popisujeme vektorem magnetické indukce B. Jde vlastně o relativistický jev, důsledek toho, že vzdálenost mezi náboji (a tedy počet nábojů na jednotku délky drátu) je jiná z pohledu souřadné soustavy spojené s nehybnou kovovou mřížkou tvořící materiál drátu, než z pohledu souřadné soustavy pohybující se s elektrony tekoucími drátem. Proto se přitahují dráty, kterými teče proud ve stejném směru (jádra atomů v jednom drátu „vidí nadbytek elektronů" v druhém drátu a tento nadbytečný náboj je přitahuje). Je pozoruhodné, že Maxwell tento projev speciální teorie relativity svými rovnicemi správně popsal více než padesát let předtím, než Einstein teorii relativity formuloval. V elektrodynamice musíme změnit jednu ze dvou Maxwellových rovnic, kterými jsme v části 10.2 popsali elektrostatiku. Rovnice 10.3, popisující divergenci E, platí i v elektrodynamice. Avšak tvrzení rovnice 10.11, že rotace E je nulová, v elektrodynamice neplatí. Jak dobře víme, elektrická intenzita popsaná vektorem E začne v drátu stočeném do smyčky cirkulovat, když se mění vektor magnetické indukce procházející plochou smyčky. Tohoto jevu můžeme využít k výrobě elektřiny (přesněji k indukci elektromotorického napětí). Pro rotaci E tedy platí Vx£ = --, (12.1) což je jedna z verzí Faradayova zákona. Dále musíme popsat i „nové" magnetické pole. Protože neexistují žádné „magnetické náboje", obdoba první Maxwellovy rovnice pro B je 189 190 KAPITOLA 12. VLNY V-S = 0. (12.2) Jak jsme již řekli, zdrojem magnetického pole je pohyb elektrických nábojů, neboli změna rozložení hustoty náboje p. Při analýze hustoty pravděpodobnosti p, že molekulu najdeme v určitém místě, nás v části 8.9 Gaussova věta nás dovedla k rovnici 8.70 f = -V.J, (12.3) Pokud touto rovnicí nepopíšeme rozložení hustoty pravděpodobnosti nalezení molekuly, ale rozložení hustoty náboje, bude mít J význam elektrického proudu. Podle Ampérova zákona by měla být rotace magnetické indukce B kolem drátu úměrná elektrickému proudu V x B = p0J, (12.4) kde konstanta po je nazývána magnetická permeabilita vakua. Maxwell si ale všiml jedné nesrovnalosti. Když spočítáme divergenci výrazu na levé straně rovnice 12.4, měli bychom dostat nulu, protože a ■ (a x b) = 0 pro jakékoli vektory a a i). Je tomu tak proto, že výsledkem vektorového součinu a x b je vektor kolmý k a i b a skalární součin dvou kolmých vektorů s a a x ď je nula. Pak ale musí být nule rovna i divergence proudu V • J = V • (V x B)/po. Podle rovnice 8.70 není ale —V • J nic jiného, než změna náboje v čase, která přece nemusí být nutně nulová! Maxwell tento problém vyřešil geniálně tak, že „opravil" Ampérův zákon ^ dĚ V x B = p0J +e0p0 — , (12.5) takže 0=V.(VxS) = V.^0J + eoMof) =* V.J=-e0V.f = -to^1 = -% (12.6) jak očekáváme (svorka ukazuje, kde jsme použili první Maxwellovu rovnici). Další pozoruhodnou skutečností je, že elektrická a magnetická pole mohou existovat i v nepřítomnosti elektrického náboje (daleko od jakéhokoli náboje, „ve vakuu"). Bez nábojů a proudů vypadají Ma-xwellovy rovnice takto f) R f) F V-Ě = 0, V-5 = 0, VxĚ =——, VxS = e0/i0 —. (12.7) dt ^ dt y ' Představu, jak se může elektromagnetické pole šířit „prázdným prostorem", nám poskytnou poslední dvě rovnice. K cíli nás dovede, když spočítáme rotace obou stran rovnic. Na levých stranách tak získáme dvojnásobné rotace, se kterými jsme se ještě nesetkali. Spočítáme si takový dvojnásobný vektorový součin nejdřív obecně pro vektory a, b, c a pak vyměníme a a b za V. Proto budeme psát c vždycky napravo od a a b. w = a x (bxc) (12.8) I^x byCz bZCy^ Uy bZCX bXCZl UZ bXCy \)yCX (12.9) 12.1. ELEKTROMAGNETICKÉ VLNY 191 WX ClyUZ CLZUy Q,y{hXCy byCX^j Q> Z{\) ZCX ^X^z) bXClyCy ClybyCX CLZbZCX ~\~ bXCLZCZ = bx(ayCy + azcz) - (ayby + azbz)cx = bx(a ■ c - axcx) — (a ■ b — axbx)cx = bx(a ■ Č) — (a ■ b)cx (12.10) wy = azux - axuz = by(a- Č) - (a ■ b)cy (12-H) wz = axuy — ayux = bz(a ■ Č) — (a ■ b)cz (12.12) => w = ax(bxč) = b(a ■ Č) — (a ■ b)c (12.13) Dosazení E a. B místo c a V místo sad nám poskytne rotace levých stran rovnic: Vx(Vx£)=V(fJ)-(V-V)íí = -V2E (12.14) =o V x (V x B) = V(V-_B) - (V • V)S = -V2S (12.15) =o Při výpočtu levých stran dosadíme za rotaci B ze čtvrté rovnice a za rotaci E z třetí rovnice - dB <9(V xB) d ( dĚ\ d2Ě ~v x =--dl— = -dl [£o^) = -w-w (12-16) - dĚ d(VxĚ) d ( dĚ\ d2B eoMoV x — = eofio-^-= eoMo^ I I = -e0Mo^-- (12.17) Spojením levých a pravých stran a rozepsáním V na jednotlivé parciální derivace dostáváme rovnice d2Ě d2Ě d2Ě _ d2Ě d2B d2B d2B _ d2B + + ~~ e°^°"ň7?"' + + — e°^°~ň7?"- (12.18) dxz dyz dzz dtz dxz dyz dzz dtz V obou rovnicích máme (až na konstantu eo/xo) parciální druhé derivace stejné funkce. Řešením je jakákoli funkce E nebo B, která závisí na takové lineární kombinaci časových a prostorových proměnných kxx + kyy + kzz — ujt = 4>{x, y, z, t), pro kterou konstanty kx, ky, kz, uj splňují rovnici 12.18. Hodnoty konstant zjistíme jednoduše dosazením E((f>) do rovnice 12.18 (stejně dobře bychom mohli použít B). Nejprve spočítáme všechny parciální druhé derivace d2Ě() d2 d2Ě() d2(kxx - h kyy -f - kzz - ut) d2Ě() dx2 dx2 d2 dx2 d2 d2Ě{4>) d2^ d2Ě{4>) d2(kxx- h kyy -f - kzz - ujt) d2Ě{4>) dy2 dy2 d2 dy2 d2 d2Ě(4>) d24> d2Ě(4>) _ d2(kxx - h kyy -f - kzz - ujt) d2Ě{) dz2 dz2 d2 dz2 d2 d2Ě(4>) d24> d2Ě(4>) d2{kxxA - kyy + kzz - ujt) d2Ě{) dt2 dt2 d2 dt2 d2 (1,20) ,2 d' d2Ě(4>) d2 Po dosazení do rovnice 12.18 se parciální druhé derivace podle (p vykrátí a zbude .2 (12.21) (12.22) k2 + k2 + k2z = k2 = eonou ■ (12.23) 192 KAPITOLA 12. VLNY Když (p vydělíme k kq. kí, ky ÍÚ . ^ ^ ^ , . Tx + Ty + Tz-t> (12'24) budou mít všechny členy rozměr délky (poměry kj/k jsou bezrozměrné). Aby to platilo i pro poslední člen, musí mít zlomek ui/k rozměr rychlosti, kterou si označíme písmenkem c. Podle rovnice 12.23 se tedy rychlosti c musí rovnat i 1/^/eo/io, takže rovnici 12.18 můžeme přepsat d2Ě d2Ě d2^_l_d2E_ (PB_ (PB_ d^B__l_^B_ dx2 dy2 dz2 c2 dt2 ' dx2 dy2 dz2 c2 dt2 Rychlostí c putuje prostorem vlna nějakého konkrétního vektoru E. Pokud v čase t = 0 se v místě xq, y0, zq vektor E rovná E(cJ)q), stejný vektor najdeme v čase t v místě x+Ax, y+Ay, z+Az, posunutém od xq, yo, zq o vzdálenost ct ve směru daném poměrem konstant kx, ky, kz. Pokud se navíc ve stejném místě xo,yo,zo vektor E po každé časové periodě t vrátí do stejného stavu, znamená to, že místo x + Ax, y + Ay, z + Az je od xq, yo, zq posunuto o vlnovou délku A. Směr posunutí udávají poměry Ax, Ay, Az, které jsou stejné, jako poměry kx, ky,kz. Vyjádřeno ve sférických souřadnicích, Ax kx . Ay ky . Az kz —— = — = cos i^sinu, —— = —- = cos (f smv, —— = — = cos v, (12.26) A k A k A k takže ct = ^-Ax+^-Ay+^Az = A (cos2 ipsin2ů + cos2 ipsin2ů + cos2 ů) = A ^> - = c = (12.27) k k k t k Úplně stejnou analýzu bychom mohli provést pro B. Maxwellovy rovnice tedy předpovídají, že ve vakuu, bez nábojů a proudů, mohou pole vektorů E a B tvořit vlny šířící se prostorem stejnou rychlostí a se stejnou vlnovou délkou. Podle vlnové délky považujeme tyto elektromagnetické vlny za Rôntgenovy paprsky, světlo, mikrovlny, či radiové vlny. Rotace v rovnicích 12.7 přitom říkají, že E a B kmitají ve směrech na sebe kolmých. Změna (derivace podle času) B je úměrná rotaci E a naopak. Vektor úměrný rotaci vektoru E musí být na E kolmý. To zdůrazňujeme již tím, že rotaci zapisujeme jako vektorový součin V x E (výsledek vektorového součinu je vektor kolmý k násobeným vektorům). Tvar vlny tvořené vektory E a B může být velmi složitý. Jedním z nejjednodušších řešení rovnice 12.18 je (psáno pro E) Ě = Ěoe4, = E0ei(-k^x+kyy+k^-ut) = Ě0 cos 4> + iĚ0 sin 0. (12.28) Vlnu zde popisujeme vlastně dvakrát, v číslech reálných i imaginárních, což může pro pro reálnou fyzikální veličinu E vypadat jako zbytečnost. V kvantové mechanice ale hrají komplexní čísla důležitou roli a s exponenciálními funkcemi se každopádně počítá lépe, než s kombinacemi sinů a kosinů, na druhou stranu, ve funkcích sinus a kosinus ale hrají konstanty k a ui dobře pochopitelnou roli. V těchto funkcích je k = 2tt/\ a ui = 2tt/t, aby pro \Jx2 + y2 + z2 = A a t = t byl argument sinu 2tt a funkce tak ukončila první periodu a vrátila se na počáteční hodnotu. 12.2 Superpozice Ukázali jsme si již příklady několika periodických změn v čase (rotace a vibrace molekul). V přírodě se setkáváme i s periodickým uspořádáním v prostoru. Elektromagnetická vlna je objekt, který se periodicky mění v prostoru i čase. Zdaleka ne všechno se ale v chemii a fyzice pravidelně opakuje. Proto 12.2. SUPERPOZICE 193 bychom si mohli říkat, že periodické jevy jsou spíše výjimkou. Pomocí jednoduchých periodických funkcí sinus a kosinus můžeme ale popsat i tvary a závislosti na první pohled neperiodické a neharmonické. Jako příklad nepříliš chemický, ale snadno představitelný, si můžeme představit strunu, třeba na kytaře. Náš zájem o molekuly může uklidnit, že podobně se chovají například elektrony v kyaninových (poly-methinových) barvivech, tvořených dlouhými řetězci konjugovaných dvojných vazeb. Pokud zachytíme druhou nejtlustší strunu kytary, přitáhneme ji na stranu a pustíme, budeme pozorovat rozmazaný obraz kmitající struny. Kdybychom si nahráli video s rychlostí 1320 snímků za sekundu, viděli bychom změny struny načrtnuté šedě na obrázku 12.1A. Napnutá struna má ve své rovnovážné poloze tvar úsečky mezi zářezy, ve kterých je uchycena. Když strunu vychýlíme, tento tvar porušíme a donutíme strunu mít tvar přibližně trojúhelníku. Jakmile strunu uvolníme, vychýlení se po struně rozběhne jako malá vlnka oběma směry. V obou směrech ale tyto vlnky brzy narazí na překážku. U kytary jsou těmi překážkami kobylka a poslední pražec, zvaný ořech. Vlnky, které se po kytaře rozběhnou opačnými směry po uvolnění struny, budou mít podobný tvar jako vychýlená struna, ale s poloviční výchylkou. Vlnka, která poběží nahoru k ořechu, je na obrázku 12.1 A nakreslena modře a vlnka, která se rozběhne dolů ke kobylce, červeně. V okamžiku uvolnění jsou obě poloviční vlnky stejné, celkové vychýlení struny se rovná součtu výchylek modré a červené vlnky. Na druhém snímku obrázku 12.1A vidíme červenou vlnku právě ve chvíli, kdy se její vrchol odráží od kobylky. Vlnka se odráží zpět, ale vychýlená na druhou stranu, doprava,k. Modrá vlnka se posunula o stejnou vzdálenost k ořechu, od kterého se její koneček odrazil, také s opačnou výchylkou. Změna směru vychýlení dává smysl, když si uvědomíme, že tvar struny získáme složením všech vlnek, které sledujeme. Dole, v místě kobylky, musíme sečíst zbytek červené vlnky běžící dolů a kousíček červené vlnky, který už se odrazil zpět nahoru. Struna je ale ke kobylce pevně přichycena, takže v tomto místě nemůže mít žádnou výchylku. Červená vlnka se musí odrazit s přesně opačnou výchylkou, než se kterou do kobylky naráží, aby se obě výchylky od sebe odečetly a výsledkem byla nulová výchylka na konci struny. Takto se trojúhelníkové vlny odrazí od ořechu a kobylky mnohokrát. Po delší době bude ale tvar struny vypadat spíše jako tmavě zelená křivka na obrázku 12.1B, která mnohem lépe odpovídá našim znalostem o funkci hudebních nástrojů. Jakým kouzlem se změnil trojúhelníkový tvar struny na hladký tvar popsaný funkcí sinus? Souvisí to s tím, že jakýkoli tvar, včetně trojúhelníku, můžeme získat součtem, neboli superpozicí dostatečného množství funkcí sinus a kosinus popisujících vlny s rozdílnou vlnovou délkou, neboli periodou vlny v prostoru. V případě trojúhelníku je ovšem dostatečné množství nekonečné, takže v praxi se můžeme trojúhelníkovému tvaru jen přiblížit. Jak ale ukazuje obrázek 12.2 vlevo, již tři funkce sinus vystihují tvar rovnoramenného trojúhelníku velmi věrně, snad kromě vrcholu. S využitím funkcí sinus i kosinus můžeme napodobit obecný trojúhelník, jak je ukázáno na obrázku 12.2 vpravo. Trojúhelníkový tvar vychýlené struny si tak můžeme popsat jako součet velkého (ideálně nekonečného) množství sinových a kosinových funkcí, jejichž periody (vlnové délky) odpovídají dvojnásobku délky struny vydělenému celým číslem A = 2L/n. Takové vlny se šíří oběma směry, odrážejí na konci strun a zase putují zpět. Tvar struny je součtem takových vln. Ačkoli se sčítají vlny běhající po struně, součet vln, které mají stejnou A = 2L/n, ale putují opačným směrem, je vlna stojatá, která neputuje nikam. Stojaté vlny s A = 2L/n jsou pro n = 1, 2, 3 ukázány na obrázku 12.1B-D. Proč ale na struně vidíme jen stojatou vlnu s A = 2L? Struna nekmitá ve vzduchoprázdnu. Musí rozechvět tělo kytary, které pak rozkmitá vzduch a vznikne tak to, čemu říkáme zvuk. Z pohledu fyziky prsty dodají energii struně a ta ji pak předá kytaře a kytara molekulám vzduchu. Jak jsme si řekli, po drnknutí se po struně rozběhnou trojúhelníkové vlny, které lze rozložit na vlny tvaru funkcí sinus a kosinus lišící se vlnovou délkou. Tyto vlny se také šíří po struně tam a zpátky, stejnou rychlostí bez ohledu na vlnovou délku. Rychlost vln závisí jen na hustotě materiálu struny a na tom, jak je struna napnutá, tedy naladěná. Protože je rychlost stejná, vlny s delší vlnovou délkou A musí mít také delší periodu kmitání v čase t, která je zároveň periodou kmitání stojaté vlny, která vzniká jejich složením. 194 A KAPITOLA 12. VLNY B C D |\ |\ /\ |\ ^ Obrázek 12.1: A. Změny tvaru struny (znázorněna šedě) po vychýlení. Vlny šířící se po uvolnění struny jsou znázorněny modře a červeně, výchylky těchto vln jsou vyznačeny vodorovnými šipkami. Šipky nad a pod obrázky označují odraz vlny na pevném konci struny. B. Stojatá vlna (znázorněna tmavě zeleně) vlnové délky A = 2L pozorovaná na struně po delší době. C. Stojatá vlna (znázorněna modrošedě) vlnové délky A = L, představující druhou harmonickou vlnu. D. Stojatá vlna (znázorněna světle zeleně) vlnové délky A = |L, představující třetí harmonickou vlnu. Vlny šířící se podél struny, ze kterých se stojaté vlny na obrázcích B—D skládají, jsou znázorněny modře a červeně. 12.3. FOURIEROVY ŘADY 195 Obrázek 12.2: Napodobení tvarů trojúhelníků pomocí superpozice funkcí sinus a kosinus. Požadovaný trojúhelníkový tvar je nakreslen šedě, výsledek superpozice červeně a grafy funkcí, které sčítáme, ostatními barvami. Energie jednotlivých vln se předává vzduchu tím více, čím rychleji vlny kmitají, tedy čím mají kratší periodu. Proto nejdříve odezní vlny s nejkratší periodou a tedy i vlnovou délkou. Z trojúhelníkového tvaru struny tedy nejrychleji mizí vlny s kratší délkou, až se nakonec tvar struny změní na stojatou vlnu nakreslenou tmavě zeleně na obrázku 12.1B. To je stojatá vlna, kterou vidíme, když se díváme na strunu. V případě kytary je ale lepší věřit svým uším, než očím. Tmavě zelená vlna s vrcholem uprostřed na struně, které říkáme A, kmitá sto desetkrát za sekundu. To je výška tónu, který slyšíme. Vlna, která je rozpůlená nulou uprostřed, má poloviční vlnovou délku a dvakrát vyšší frekvenci kmitání. To odpovídá tónu v hudební stupnici o oktávu výš. Tuto vlnu sice oko nepostřehne, ale lidské ucho dokáže rozpoznat, že se do základního tónu přimíchá ještě další, o oktávu vyšší. Vlny s třikrát, čtyřikrát, pětkrát vyšší frekvencí také trochu přispívají ke zvuku struny A a společně vytvářejí to, čemu hudebníci říkají barva nástroje. 12.3 Fourierovy řady Na obrázku 12.2 jsme si ukázali, jak můžeme tvar trojúhelníku poskládat z funkcí sinus a kosinus. Neřekli jsme si ale, podle čeho poznáme, v jakém poměru máme funkce sinus a kosinus sečíst. Podle vztahu 7.89 můžeme kombinaci sinů a kosinů nahradit lineární kombinací funkcí elkx s různými (kladnými i zápornými) čísly k. Přesněji řečeno, lineární kombinací funkcí elkx s reálnými koeficienty získáme kombinaci funkcí cos(fcr) a i sin(fcr), ale tato drobná komplikace je vyvážena mnohem snadnějším počítáním s (komplexní) exponenciální funkcí ve srovnání s počítáním s goniometrickými funkcemi. Další komplikací je, že pomocí lineární kombinací sinů a kosinů můžeme nahradit jakoukoli periodickou funkci, zatímco struna na kytaře má začátek a konec. Pro znázornění tvaru vychýlené struny můžeme ale použít matematickou funkci skládající se ze stále se opakujících trojúhelníků a taková funkce již periodická je. Pro začátek budeme předpokládat, že čísla k v naší lineární kombinaci funkcí elkx (nebo cos(kx) a isin(fcr)) jsou celočíselné násobky Ak = 2tt/L, kde L je délka struny (a perioda funkce strunu popisující). Výchylku y v každém místě x podél struny pak můžeme popsat následující lineární kombinací zvanou Fourierova řada oo oo oo (12.29) n— — OO Ti — — OO Ti — — OO Periodičnost nám umožňuje vypočítat jednotlivé koeficienty An integrováním 196 KAPITOLA 12. VLNY OO ^K j y(x)e-ik-xdx = J2 An' f ei("'"")Afea'dx = ^An, (12.30) 0 n'=-oo 0 kde všechny integrované funkce jsou kombinace sinů a kosinů a jejich integrály přes celou periodu jsou proto nulové. Jedinou výjimkou je případ, kdy n' = n, exponent (argument sinové a kosinové funkce) je proto nulový a funkce je tedy konstantní (rovná jedné). Z tohoto pohledu připomínají integrály funkcí e'(™ ~n)Akx skalární součiny kolmých (ortogonálních) vektorů. Součin dvou různých je nulový, součin dvou stejných rovný druhé mocnině velikosti. Proto se i naše funkce e1^™ ~™)Afea; označují jako ortogonální Ke stejnému výsledku dojdeme integrováním přes jakékoli meze lišící se o L = 2/t/A/j, například j y(x)e-ik^dx= An' f e^'-^Akxdx=^-An. (12.31) _ n — — oo " Ak Ortogonalita funkcí e17lAkx s různým n nám umožňuje najít užitečný vztah mezi druhými mocninami koeficientů An a funkce y(x). Stačí vypočítat integrál /n OO OO n j-. K^sJ y(x)y(x)*dx = j \y(x)\2dx= E E AnA*n, j e^'-^Akxdx = E \An\2. (12.32) n— — co n— — oo n n— — oo Získaný vztah se nazývá Parsevalova věta. Zatím jsme funkcemi elkx popisovali jen tvar struny, závisející na jediné prostorové proměnné x. Úprava rovnice 12.29 pro popis časových závislostí, stejně jako rozšíření na trojrozměrné objekty, jsou přímočaré: oo y(ť)= J2 Ané^= J2 AnénA^= J2 ^né2mt/T, (12.33) 71—— OO 71 —— OO 71 — — OO OO OO OO p(x,y,z) = J2^neik^= E E E ^,„B,„y*(n**+n»5/+n**). (12.34) 7lx — — OO 7lv — — OO 71 z — — OO 12.4 Fourierova transformace Fourierovy řady jsme si popsali jako posloupnosti funkcí sinus a kosinus (v exponenciální formě), jejichž prostorová nebo časová frekvence se měnila skokově, jako celočíselné násobky Ak = 2ir/L nebo Auj = 2/t/t. Prostorové a časové proměnné jsou ve skutečnosti spojité. Když ale pořizujeme digitální záznamy obrazu, zvuku, či výsledku nějakého měření, ukládáme v počítači prostorové a časové závislosti také nespojitě, po jednotlivých pixelech, voxelech, či časových krocích. Tyto závislosti bychom tedy vlastně měli popisovat jako nespojité řady čísel. To by se mělo projevit i na vyčíslování koeficientů ve Fourierových řadách. Místo integrálu v rovnici 12.30 bychom proto měli psát JV-l JV-l JV-l E yje-inAk^AxAx = E An' E é^'-^'^^Ax = AnJ2 e°-iAxAx = NAxAn = ^rAn = Yr 3=0 Ti' — — OO j—0 3=0 Ak (12.35) 12.4. FOURIEROVA TRANSFORMACE 197 a místo rovnice 12.29 1 oo yi = ^ zZ YneinAk^AxAk, (12.36) n——oo Pokud v poslední rovnici omezíme počet Fourierových řad na stejné číslo N, jako počet „pixelů" na L, získáme téměř symetrické vztahy pro přepočet posloupností y j na posloupnosti Yn a naopak Vi = ^Y, YnénAk^AxAk, Yn=J2 V'ř V'A,-. (12.37) n=0 j=0 Zcela obdobné vztahy platí i pro časové závislosti % = ^ YneinA^AtAu, Yn=J2 yje-'mA^AtAt. (12.38) n=0 j=0 V obou případech jsme si jako y j označili čísla, která se mění se skokovými změnami prostorové nebo časové proměnné, v reálném prostoru nebo čase. Naproti tomu Yn jsou čísla závisející na skokově se měnící prostorové či časové frekvenci, tedy postupně se měnící v reciprokém prostoru nebo ve frekvenční doméně. Popsanému převádění posloupností y j na posloupnosti Yn, a naopak, se říká diskrétní Fourierova transformace. Diskrétní Fourierova transformace se často používá při zpracování obrazu či zvuku. Jak si později ukážeme, hraje důležitou roli i při studiu struktur molekul. Co se stane s rovnicemi 12.37 a 12.38, když začneme zvětšovat L nebo t nade všechny meze? Hodnoty Ak = 2tt / L a Auj = 2tt/t se budou blížit nule, takže je můžeme nahradit diferenciály a místo sum počítat integrály oo oo y{x) = J Y{k)eíkxák Y{k) = j y(x)e-'lkxdx, (12.39) — OO —OO OO OO 1 /*—' ^ Jutr V(t) = — J yMe-'dw Y (u) = j y(t)e-^dt. (12.40) — oo —oo Tyto vztahy představují spojitou Fourierovu transformaci. Spojité funkce sice nepopisují realisticky digitální záznamy měření, umožňují nám ale pochopit například chování vlnových funkcí v kvantové mechanice. Navíc výsledky integrování v rovnicích 12.39 a 12.40 bývají často jednodušší, než výsledky výpočtů sum v rovnicích 12.37 a 12.38. Rovnice 12.37-12.40 popisují přepočty posloupností oběma směry. Když provedeme po sobě oba přepočty, měli bychom zpátky získat posloupnost, se kterou jsme začínali. Například K-1 i N-l N-1N-1 Yn=J2 — J2 Yn>énAk^AxAke-'mAk^AxAx = e*" -n>Afe-''Aa:==. (12.41) j=0 n'=0 j=0 n'=0 Tento vztah je díky ortogonalitě funkcí e'(™ -n)Akx ekvivalentní rovnici 12.35. Protože k výsledku přispívají jen členy s n = l, můžeme rozsah l v sumě rozšířit do nekonečna. Abychom získali zpět Yn, musí se součin AkAx rovnat 2tt. To nám připomíná, že krok Ak, o který se liší sousední členy Fourierových řad, není libovolný, ale je pevně dán velikostí pixelu Ax a počtem pixelů N: Ak = 2tt/L = 2tt/(NAx). Na druhou stranu, rozsah hodnot k, které je schopna diskrétní Fourierova transformace jednoznačně určit, je K = N Ak = 2ttN/L = 2tt / Ax. Zahrnuje-li spektrální šířka K interval od — kmSíX do kn lmax 7 198 KAPITOLA 12. VLNY být velikost pixelu nejvýš Tr/kmSíX (Nyquistova podmínka). Velikost pixelu tak určuje spektrální šířku, kterou je digitální záznam schopen pokrýt. Pokud k tvaru popsanému závislostí y j přispívá i periodická funkce s \k\ > tt/Ax, Fourierova transformace ji interpretuje jako funkci s \k\ nižší o takový násobek tt/Ax, aby se k vešlo do intervalu mezi —tt/Ax a tt/Ax. Stejné vztahy platí i mezi hodnotami Au;, uj, t a At. Lze rozlišit pouze frekvence lišící se alespoň o Auj = 2tt/t = 2tt / (N At) a frekvenční šířka je dána časovým krokem digitálního záznamu, zahrnuje frekvence od —ttN/t = —tt/Aí do ttN/t = tt/At. Požadavek, abychom se Fourierovou transformací tam a zpět vrátili k původní hodnotě y nebo Y, má zajímavý důsledek i pro transformaci spojitou. Můžeme si to tentokrát ukázat na příkladu časové závislosti oo oo oo y{t) = é / yMei"tdw = ^ / ei"*dw / y(ť)^ťdť = j y(ť)dť±- j e-e-'W (12.42) — 00 —00 —00 —00 —00 Abychom získali zpátky y(ť), musí se druhý integrál rovnat 2tt pro ť = t a nule pro ť ^ t. Tento integrál můžeme využít k definování delta funkce 00 5(t-ť) = ^- f e^^'W (12.43) 2tt J —00 Ověřili jsme si, že rovnice 12.39 a 12.40 opravdu správně popisují přepočty y a, Y oběma směry. Pokud by nás trápilo, že vztahy nejsou zcela symetrické (symetrii kazí faktor 2tt), stačí jen maličko změnit definici koeficientů Aj. Například pro časovou závislost na 00 A- 00 A- y(t)= y -2Le^*= V ^e1^*, (12.44) 1 V2^ V2t} 1 ' j— — qo j — — qo což upraví rovnice 12.39 a 12.40 na oo oo y(x) = í Y{k)ékxák Y(k) = í y(x)e-ikxdx (12.45) \J2tt J \J2tt J —oo —oo a oo oo y(t) = -j=j y(c)ei"tdc y(u) = -j=j y(t)e-^dt. (12.46) — oo —oo Jinou možností je vyjádřit Fourierovy řady pomocí s = &/(27r) a v = uj/(2tt) oo oo y(x) = f Y(s)e[2"TSXds, y(t) = f Y(y)é^vtdv. (12.47) 12.5 Konvoluce Pomocí rovnic 12.39 a 12.40 jsme si popsali, jak přepočítat funkce y(x) nebo y(t) na funkce Y(k) nebo Y{uj) a naopak. Jak můžeme přepočítávat kombinace více funkcí? V případě součtu to je jednoduché. Podstatou Fourierovy transformace je integrování, tedy vlastně sčítání. Integrál součtu proto můžeme 12.6. ZÁŘENÍ ČERNÉHO TĚLESA 199 rozdělit na součet dvou integrálů. Proto Fourierova transformace součtu funkcí y\ + y2 je součet transformací Yi +Y2 a naopak. Se součinem funkcí to tak jednoduché není. Podívejme se na dvě funkce vyjádřené pomocí Fourie-rových řad podle rovnice 12.29. oo oo Vl(x)= J2 AneinAkx, y2(x)= J2 BneinAkx. (12.48) n——oo n— — oo Protože sumy sčítáme od —oo do oo, můžeme pro y2{x) klidně otočit směr počítání n a navíc začít počítat n nikoli od nuly, ale od nějaké jiné hodnoty l. V druhé sumě pak budeme psát l — n místo l. Zkusme se podívat na součin y\{x) s takto otočenou a posunutou sumou popisující y2{x) AnénAkx fíi-n'e'C-"')^ = eiíAfe* JT AnénAkx jŤ Bi-n, t— oo / \n'=—oo / \n——oo / \n' = — oo g — in Akx (12.49) Budeme-li počítat integrál takového součinu vynásobeného e~líAfea; podobně jako v rovnici 12.31, budou díky ortogonalitě nenulové integrály pouze pro stejná n v obou sumách ^ / oo \ / oo \ J e-iiAkx I J2 AnénAkx J I J2 »!-nei(í^)Ml I dx = \n——oo / \n——oo E Z da; = Äfc E A^-„= E Äfc-4"ÄlSí-"2^ = EyiÄí-„--. (12.50) n—— oo n——oo —oo V limitě A& —> 0 nahradí sumu integrál. Pokud si označíme lAk/(27r) = s a lAk/(27r) = s', můžeme psát oo oo %i(^)y2(a:)e-i2"sa'da;= í Y^Y^s - s')ds'. (12.51) Integrálu na pravé straně se říká konvoluce a zkráceně se zapisuje Y\ * ^(s)- Rovnice ukazuje, že Fourierova transformace součinu dvou funkcí se rovná konvoluci Fourierových transformací jednotlivých funkcí. 12.6 Záření černého tělesa Trojrozměrnou obdobou kmitání struny pro elektromagnetické vlny je takzvané černé teleso. Takové těleso pohlcuje záření všech vlnových délek (proto je „černé") a jeho energii přeměňuje na tepelnou energii svých atomů. Nebo naopak při zahřátí se rozkmitané náboje stávají zdroji elektromagnetických vln, jejichž vlnová délka závisí jen na teplotě. Jako černé těleso si můžeme představit pec, nebo spíše troubu, zahřátou na nějakou teplotu. Při nepatrném pootevření dvířek bude štěrbinou vycházet záření (pro určité teploty světelné), jehož vlnová délka bude odpovídat teplotě trouby. Pozorovaná závislost hustoty zářivé energie na vlnové délce, která neodpovídala klasické fyzice, dovedla Plancka k prvnímu krůčku ke kvantové mechanice. Pro jednoduchost budeme předpokládat, že vnitřek naší trouby má tvar krychle o rozměrech LxLxL. Pokud budou vnitřní stěny dokonale vodivé, bude muset mít elektrické pole na stěnách nulovou intenzitu E. Tuto podmínky splňují vlny tvaru funkce sinus, ve kterých 200 KAPITOLA 12. VLNY kxL — tttix, kyL — TTUy, kzL — tttiz =>■ kx — , ky — ^, kz — , (12.52) kde nx,ny,nz jsou přirozená čísla, aby hodnoty kxL, kyL, kzL byly celočíselné násobky 7r a funkce sinus tak byla pro x = L,y = Laz = L nulová. Z kombinace podmínek 12.23 a A = 2L/n vyplývá, že u? Att2v2 2 2 .2 471"2 n27T2 ^2~ = c2 = kx + ky + kz = —— = ~j2~i (12.53) kde jsme zavedli frekvenci v = 1/t. Geometrická interpretace této rovnice je, že v trojrozměrném grafu s osami nx, ny, nz (v takzvaném k-prostoru) odpovídají všem vlnám, které se vejdou do trouby, body na povrchu koule o poloměru mr/L. Přesněji řečeno, jde pouze o body na povrchu osminy takové koule s kladnými hodnotami nx,ny,nz. Kolik vln s různou kombinací nx,ny,nz existuje pro vlnové délky rovné vzdálenosti 2L vydělené čísly mezi n a n + An? Graficky to znamená sečíst počet bodů ve vrstvě mezi koulemi s poloměry n a n + An. Na jednotku objemu v fc-prostoru (krychličku o stranách délky jedna) připadá v průměru jeden bod (jedna trojice přirozených čísel). Počet bodů N v určitém objemu se tedy číselně rovná přímo objemu počítaném v jednotkách fc-prostoru (což jsou přirozená čísla). Objem vrstvy mezi koulemi se rovná rozdílu objemů těchto koulí. Od osminy objemu větší koule |-7r(n+An)3 odečteme osminu objemu Nn,n+An = ^-tn(n3 + 3n2An + 3nAn2 + An3 - n3) = ^ ( n2An + nAn2 + f^An3 ) . (12.54) '8 3 2 \ 3 J Využijeme rovnici 12.53 k vyjádření čísla n pomocí frekvence v 2ttv rm 2Lv . 2LAz^ ^> An=-. (12.55) c L c Po dosazení N„,v+a„ = -J- (v2Av + vAv2 + i= [v2Av + vAv2 + ±A^ , (12.56) kde V je objem trouby ve skutečném (reálném prostoru). Frekvence v je v klasické fyzice veličina, která se mění spojitě. Dovolíme si proto zmenšit Av na nekonečně malý diferenciál dis, abychom mohli zanedbat vyšší mocniny dis. Navíc vezmeme do úvahy, že pro každou kombinaci nx,ny,nz existují dvě vlny (dva různé módy) lišící se polarizaci orientací E a B. Pokud vlna postupuje ve směru z, může E kmitat podél osy x a B podél osy y, nebo naopak. Na každé N^^Au t&k připadnou dvě vlny (dva módy). Počet módů pro daný rozsah frekvencí na jednotku objemu trouby, neboli diferenciál hustoty módů p, se proto rovná 2dNv 8tt 2 j ,10 r-. dp = —— = —v2dv. (12.57) V cá Podle klasické fyziky by se mezi tyto módy měla rovnoměrně rozdělit celková energie elektromagnetických vln v troubě (každá vlna by měla mít stejnou energii). Přitom veškerá energie těchto vln pochází z tepelné energie trouby, takže podle Boltzmanna můžeme za průměrnou energii vlny považovat hodnotu kBT. Tuto energii stačí vážit hustotou módů. Závislost spektrální hustoty zářivé energie u na frekvenci (příspěvek zářivé energie na nekonečně úzký interval frekvencí a na jednotku objemu) pak spočítáme jednoduše 12.7. PLANCKŮV ZÁKON 201 &7t &7t du = £dp = kBTdp = — kBTv2dv = udv => u = —kBTv2. (12.58) Pokus vypočítat ze celkovou zářivou energii na jednotku objemu trouby integrací spektrální hustoty přes všechny frekvence oo oo £ ľ , 8irkBT f 2 8irkBT 3 ,,. ... y = / udv = e3 / v2dv = -» oo (12.59) o o ukazuje na zásadní problém: pro vyšší a vyšší frekvence, neboli vlnové délky kratší a kratší než vlnová délka fialového světla, roste energie nade všechny meze. Tento nešťastný výsledek odporující pozorování i zdravému rozumu si vysloužil název ultrafialová katastrofa. 12.7 Planckův zákon Způsob, kterým ultrafialové katastrofě zabránil Plaňek, je mimořádný. Zatímco v klasické fyzice souvisela energie vlny jen s její amplitudou (vlny s různou frekvencí v naší troubě by měly mít stejnou energii), Plaňek přišel s myšlenkou, že se energie kmitajících nábojů v zahřáté troubě mění po skocích, po kvantech o velikosti A£ = h-ľ= -2ttv = h-Lo, (12.60) 2tt kde h je slavná Planckova konstanta. Po stejných skocích se mění i energie vyzářených vln. Jaký důsledek má tento požadavek pro rozdělení energie mezi vlny? Odpověď nám dá, stejně jako v jiných podobných případech, Boltzmannův zákon. V souboru N vln bude počet rij těch, jejichž energie je £n = jhľ, přímo úměrný e^ihu/k^T. Průměrnou energii módu o frekvenci v můžeme proto spočítat OO £j OO OO E^e-*^ Ej^w EM3' ^ = E &i = Jt ^ = 3=°oo ^ = ^-, (12.61) j=o E e fcBT E e fcBT E Cj 3=0 3=0 3=0 kde C = e-hv/k*T. Vyčíslit mocninné řady nám pomůže chytrý trik. Uvědomíme si, co se stane, když vynásobíme mocninnou řadu skládající se z N členů (s mocninami od 0 do N — 1) výrazem 1 — C N-l (1-0 E ? = (!-o (c° + c1 + c2 + • • • + cN-') = c°-c1+c1-c2+c2+- • -c^+c"-1-^ = i-C" 3=0 (12.62) Pak zkusíme totéž pro řadu složenou z členů j^3 N-l (1-OE & = í1 - 0 (C1 + 2C2 + 3C3 + • • • + (N - íx"-1) = 3=0 C - C2 + 2C2 - 2C3 + 3C3 - 3C4 + • • • + (N - Í)CN^ -(N- Í)CN = N-l c (i + c1 + c2 + • • • + cN-ľ) = c E (12-63) 3=0 Vidíme, že na tuto řadu musíme aplikovat náš trik dvakrát 202 KAPITOLA 12. VLNY n-l I n-l \ I n-l \ (i-o2£jcj' = (i-o (i-oE^I =(i-o cEíj =c(i-0. (12.64) 3=0 \ 3=0 J \ j=0 J Poměr našich dvou mocninných řad je tedy pro jakékoli N (včetně N —> oo) N-l £jC' _C(i-CN) i-C c Nf}cj (i-C)2 (i-CN) i-C (12.65) Po dosazení do rovnice 12.61 Když zopakujeme výpočet závislosti spektrální hustoty zářivé energie na frekvenci s touto průměrnou energií, získáme Planckův distribuční zákon — 87T hv 2 8"7T /lZ/3 dít = fcdp = — --v dv => u = — --. (12.67) 12.8 Stefanův—Boltzmannův zákon Čemu se rovná celková hustota hustota energie, vypočítaná integrací získané spektrální hustoty přes všechny frekvence? T,= f"*»=^f h,?t ^=4^(W4 / ^Tds = 4j,(fcBT)4 / ----Id,, (12.68) V J C3 J e^u/k^T _ l c3/j3 V / J es _ l c3/j3 ^ D ' J l_e-s 'V / 0 0 0 0 kde s = hv/k^T. Podle vztahu 12.62 OO E e-''fl lim (1 — e JV^oo -Ns 1 -e- S3e- J2e~3S = s3J2e~3S- (i2-69) 3=0 i=l S3ye-J' = y / s3e~ja. (12.70) o J=1 J=1 o Integrovaný výraz je příkladem exponenciální funkce násobené mocninnou funkcí. Takové integrály lze naštěstí řešit metodou per partes, uvedenou v části 6.3. Ukážeme si, jaký je obecný výsledek počítání takového integrálu. Využijeme toho, že podle pravidla o derivaci součinu d(S«e-^) _d(a°) «s , „d(-/te) p-*3 e-/3fl + aa y / >. = as^e-P" - (3sae-^s (12.71) ds ds ds d(—/3s) 12.8. STEFANŮV-BOLTZMANNŮV ZÁKON 203 oo => j sae-^ds = j j ť-ie-P'ds - i j d (^e-^8) = s^e^ds - ± [^e^] ~ . 0 0 0 0 (12.72) Výsledek obsahuje integrál stejného typu jako na začátku, jen s je umocněno na číslo o jedničku menší. Tento integrál můžeme tedy vypočítat stejným způsobem, jenom místo a budeme psát a — 1: oo oo 0 0 Když celý postup zopakujeme a-krát, dojdeme k oo oo -i-'-- / se_/3sds = — / e_/3sds--se"^L =--— e_/3s L--se_/3s n (12.74) o o (v obou členech ve výsledku máme a\, protože jak (1 • 2 • 3 • • • a), tak (2 • 3 • • • a) se rovná a\). Teď bychom měli postupně podosazovat výsledky jednotlivých kroků do předchozích integrálů a nakonec získat dlouhou řadu členů v hranatých závorkách s mezemi integrálů. Při dosazení spodní meze získáme pro [e_/3s] jedničku, protože e° = 1. Ve všech ostatních členech získáme nulu, protože 0C • e° = 0 • 1 = 0 pro každé c. Horní meze představují limity pro s —> oo. lim (sce-0s) = lim 4r- (12.75) s->oo V ' s^oo e^s Tyto limity můžeme vypočítat z poměrů rychlostí (derivací podle s), s jakou se výrazy v čitateli a jmenovateli blíží nekonečnu (ĽHospitalovo pravidlo): c dsc c—l dcs i i S "i— CS 1— c c lim -3- = lim = lim —- = • • • = lim = lim ——- = — = 0. (12.76) ds ' As" ' K celkové hodnotě integrálu přispívá tedy pouze spodní mez úplně posledního integrování. Integrál mocninné funkce násobené exponenciální je tedy oo *a*-p'** = -^TT(° " 1) + (0 - 0) + ■ ■ ■ + (0 - 0) = (12.77) o Použitím tohoto vzorce pro integrál v rovnici 12.68 získáme OO V cshs „ - - o o J=1 8tt OO Spočítat výslednou sumu nám pomůže Parsevalova věta (rovnice 12.32). Pro L = 1 => Ak = 2tt oo E j=-oo \A3\2 = \A0\ -2EIA- i=i 1 27 |y|2dx Eia- i=i 1 4/T \y\2dx, (12.79) 204 KAPITOLA 12. VLNY kde Aj = 2^ I yelJXdx- (12.80) Abychom mohli tyto vztahy využít, musíme najít takovou funkci y, aby \Aj\2 bylo úměrné l/j4 Aj = ± I ye^dt konstanta (12.81) Když jsme při odvozování vzorce 12.77 integrovali sae @s, použili jsme a-krát metodu per partes a v každém kroku jsme získali jeden člen řešení, který měl pro l-tý krok tvar _a(a-l)_(a-ll ~ _ (12g2) P Pokud v rovnici 12.81 zvolíme y = xa, budeme počítat podobný integrál, pouze meze budou odlišné. Metoda per partes nám bude poskytovat členy a(a- l)---(a-l) r , ijx]ir (12.83) Podle vztahu 7.87 e±ii,r = cos(JTr) ± isin(JTr) = ± i • 0 = , (12.84) takže po dosazení mezí do výrazu v hranatých závorkách získáme 27ra~'(—1)J pro lichá a — l a nuly pro sudá a — l. Abychom dostali ve jmenovateli zlomku j2, musíme zvolit a = 2. Pro l = 0 a l = 2 získáme nulové členy a pro l = 1 získáme Hi) jak potřebujeme. Pro dosazení do rovnice 12.79 potřebujeme vypočítat (12.85) Aj = ^- í x2é^dx = 2-( 1)J Po dosazení 2tt x2dx = x 6tt y i 4-7T x4dx = 20tt IAI2 7t tt 10 ~ 18 ^4(9 - 5) = _2_ 4 90 4577 i=i , 10' (12.86) 6 TT4 15' 3 oo oo J=l 3=1 (12.87) Jak vidíme, po Planckově zásahu integrál v rovnici 12.68 neroste do nekonečna, ale nabývá konstantní hodnoty. Hustota energie se po dosazení integrálu do rovnice 12.68 rovná V 15C3/^4< (12-88) což je závislost známá jako Stefanův-Boltzmannův zákon. Aby Plaňek získal stejnou hodnotu, jaká byla pozorována experimentálně, musel zvolit h = 6,626176 • 10~34 Js. Kapitola 13 Elektrony In Bohr's semi-classical model of the hydrogen atom there is an electron describing a circular or elliptic orbit. This is only a model; the real atom contains nothing of the sort. The real atom contains something which it has not entered into the mind of man to conceive, which has, however, been described symbolically by Schrodinger. This 'something' is spread about in a manner by no means comparable to an electron describing an orbit. Sir Arthur Stanley Eddington Matematika: Laplaceův operátor ve sférických souřadnicích, integrování ve sférických souřadnicích, integrování per partes, parciální a obyčejné diferenciální rovnice druhého řádu, separace proměnných, substituce, derivace součinu, druhé derivace goniometrických a exponenciálních funkcí, Taylorův rozvoj, ĽHospitalovo pravidlo, okrajové podmínky, Frobeniova metoda, Laguerrovy polynomy, mocninné řady, Fourierovy řady, komplexní čísla, Fourierova transformace, konvoluce. 13.1 Energie dvou indukovaných elektrických dipólů V naší snaze popsat matematicky chování molekul jsme se zatím nevěnovali zvláštní pozornost elektronům. Přitom elektrony činí chemii chemií a rozložení elektronů stojí za interakcemi molekul, které jsme již mnohokrát zmínili a obecně analyzovali, aniž jsme se zabývali jejich původem. V této kapitole se na elektrony zaměříme konkrétněji. V částech 10.6 a 10.7 jsme si popsali, jak interagují elektrické dipólové momenty indukované v jinak nepolárních molekulách vnějšími elektrickými silami. Indukované dipóly vznikají také v nepřítomnosti vnějších elektrických sil v důsledku kmitání elektronů (elektronové hustoty) v molekulách. Fritz London, po kterém je toto silové působení pojmenováno, analyzoval energii indukovaných dipólů takto. Energie dvou interagujících indukovaných dipólů se skládá z energie prvního dipólu Ui, energie druhého dipólu Č72 a energie jejich vzájemného působení Č712. Protože první dipól tvoří rozkmitaný elektron, U± je energie kmitající částice, na kterou působí elektrická síla f\ a jejíž výchylka od rovnovážné polohy popisuje vektor d±. Ze známých vztahů pro energii pružiny (U = kd2j2) a výchylku d pružiny o tuhosti k (F = —kd) můžeme spočítat U1 = -k1d21 = --F1d1=-- — ^ = -- —--2Ľ. (13.1) Dále víme, že dipólový moment q\d\ je úměrný elektrické intenzitě: q\d\ = —aie^Ei. 205 206 KAPITOLA 13. ELEKTRONY Ul = _iJ:__gi = 1 1 g? = iM _ 2 47TÉQ gidi 2 47TÉQ 2a1e0 Obdobně £/2 = Ä (13.3) 2a2e0 Energii t/12 známe z rovnice 10.59, kterou převedeme ze sférických do kartézských souřadnic: t/12 = —~— -^-^ — — (sin ů1 sin ů2 cos (^2-2 cos #1 cos ů2) = -^p (dixd2x + dlyd2y - 2dlzd2z) . Atteq r r r Atteq r3 (13.4) Když sečteme všechny tři příspěvky k energii a v prvních dvou rozepíšeme d\ a d\ na jednotlivé složky, získáme q\{d\x + d2 + d2lz) q\{d2 + d2 + d2) 1 g,g2 / ^ = la. ly-1*1 + 2, 2y-2_^_ + -gig, + _ 2d d _ ^ 5 2aie0 2a2e0 4-7re0 r3 Pro jednoduchost budeme předpokládat, že náboje i polarizovatelnosti jsou pro oba dipóly stejné: q2(d2x + d2+d2z) q2(d22x + d2+d2z) 1 q2 , , ^ ^ = 1, ly-izl + 2y-2_z!_ + -q + _ 2d d _ g 2ae0 2ae0 4-7re0 r3 London zde zavedl substituci dlrr + rfea; dlrr - d2x X+ + X- X+ - X- x+ = ——, x^—^-^dx^—dto = _^_, (13.7) dl« + ^ dly__d2y_ , ď+ + Z/- , Ž/+ ~ ž/- n , ^, ^— =>dlj/__^_, d2j/____ (13.8) diz + d2z dlz - d2z z+ + z- z+- z- z+ = —/2—> z- = —j2—^dlz = ^r> d2z = ^r- (13-9) Po dosazení do vztahu pro energii získal vztah (13.10) který je formálně součtem energií šesti kmitání s výchylkami x+, x_, y+, y_, z+, z_ a tuhostmi *l = /-ŕl + ^, fe = /-ŕl + ^, *3 = ^(1 2aeo V 47rr3 / ' 2aeo V 47rr3 / ' 2aeo V 47rr3 , _JÍ_(i__u _ __Ľ/i__u q2 (1 i a 4 2ae0 \ 4^r3J' 5 2ae0 \ 2^)' 6 2ae0 V 27rr3 Tuhost pružiny obecně souvisí s vlastní frekvencí kmitání v vztahem k = ArK2v2ra, kde m je hmotnost. Z toho vyplývá, že vlastní frekvencí kmitání pro naši šestici můžeme spočítat 13.1. ENERGIE DVOU IND UKOVANÝCH ELEKTRICKÝCH DIPÓL Ů 207 Vi = = ^VT+^J, (13-11) 2tt V 2m 2tt 2 ^Jcte^m 2 kde 1 + Oj jsou výrazy v závorkách v seznamu tuhostí, uvedeném výše. Když vynásobíme tyto frekvence Planckovou konstantou h = 6,626 • 10~34Js, získáme podle zákonů kvantové mechaniky energie. Celkovou energii šesti kmitání můžeme pak spočítat ^TlfffW'-iPl'-Pl1^)- (13-12) Tento vztah je užitečné ještě zjednodušit. Úvaha, ze které vyjdeme, bude možná trochu nezvyklá. Již v části 2.4 jsme počítali s výrazem (l + —) . Pro malé — se nám nakonec zjednodušil na 1 + c—, ale před zjednodušením se rovnal řadě mocnin zlomků — násobených binomickými koeficienty, které jsme si definovali v rovnicích 1.17 a 1.18 n=0 kde ' c n J n!(c —n)! c-(c-l)-(c-2)-(c-3)---(c-n+l)_ Výrazy ^/l + Oj si můžeme zapsat ve tvaru (1 + 07)2, který ((1 + — )c připomíná. Zatímco ale c bylo celé číslo, ve výrazu (1 + cij)i umocňujeme na zlomek i. Klíčem k řešení tohoto problému je uvědomit si, že nám nic nebrání napsat výraz podobný definici binomického koeficientu v rovnici 13.14 pro jakékoli reálné číslo s s ■ (s - 1) • (s - 2) • (s - 3) • • • (s - n + 1) . n j n\ a mocninnou řadu podobnou té z rovnice 13.13 považovat za definici výrazu (1 + a)s (13.15) i1 + - E C) a- = l + aa+ ^a2 + ^-y-2)fl3 ... (13.16) Všimněme si, že v oboru celých čísel v rovnici 13.13 pokrývají celá čísla od 0 do c všechny mocniny, které se mohou v řadě vyskytnout, v rovnici 13.16 jsou nenulové výrazy pro všechna n od nuly do nekonečna. S využitím rovnice 13.16 můžeme výrazy ^/l + a j vyjádřit jako mocninné řady a~ a2 a3 5a4 = 1 + ^--^- + ^---3- + ... (13.17) 2 8 16 128 1 ' Pro dostatečně velké vzdálenosti dipólů, kdy a První člen, nezávislý na vzdálenosti dipólů r, popisuje energii samotných indukovaných dipólů. Druhý člen je hledaná energie vzájemného působení indukovaných dipólů U\2- Pokud budou mít indukované dipóly různé polarizovatelnosti, bude energie jejich vzájemné interakce 3hu0 aľa2 ^0,1^0,2 C12 —---—7-—t-■ (lo.iy) 2 (47r)2r6 z/0jl + z/0j2 13.2 Rozptyl elektromagnetických vln na molekulách Zůstaneme ještě chvíli u kmitání elektronů a podíváme se na případ, kdy jsou elektrony v molekulách rozkmitány dopadající elektromagnetickou vlnou. Zatím jsme zkoumali elektromagnetické vlny pouze ve vakuu. Co se stane, když se elektromagnetická vlna šíří nějakou chemickou látkou složenou z molekul? Elektromagnetická vlna je vlastně kmitání elektrických a magnetických sil (popsaných E a B). Při dopadu elektromagnetické vlny na molekuly kmitající elektrické síly rozkmitají náboje v molekule. Nejvíce se rozkmitají nejlehčí nabité částice, elektrony. Náboje elektronů jsou zdrojem elektrických polí a rozkmitání těchto polí se podle rovnice 12.18 šíří prostorem jako nová elektromagnetická vlna. Molekul v látkách a elektronů v molekulách bývá hodně, proto vzniká mnoho vln, které se vzájemně skládají. Výsledek pozorujeme jako větší či menší rozptyl elektromagnetických vln do jiných směrů, než směr, ve kterém se šířila původní vlna. Směr původní vlny udává poměr konstant kx,ky,kz z řešení rovnice 12.18. Tyto konstanty můžeme psát jako jeden vektor k = [kx;ky;kz]. Směry, kterými se šíří rozptýlené vlny, popisují obdobné vektory k'. Vektor k' získáme tak, že k k přičteme nějaký vektor q, který udává změnu směru vlny (k' = k + q). Protože pro skládání vln jsou důležité celočíselné násobky vlnové délky, bývá užitečné používat vektory s = k/(2Tľ) a s* = k'/(2tt), jejichž velikost je l/A. Změnu směru pak popisuje vektor S: šľ = s + S. Kdybychom věděli, že jeden elektron se nachází v místě popsaném polohovým vektorem r\ a druhý elektron se v místě popsané polohovým vektorem r2, mohli bychom skládání vln rozptýlených na těchto elektronech analyzovat na základě geometrie, načrtnuté na obrázku 13.1. Analýzu můžeme zjednodušit tím, že první elektron budeme považovat za počátek souřadné soustavy ř1 = 0 a polohu druhého si označíme f2 = ?■ Směr, ze kterého dopadá vlna na elektrony, a náhodně zvolený směr, ve kterém budeme sledovat rozptýlené vlny, si popíšeme vektory sa/, ukázanými na obrázku 13.1 vpravo. Abychom si zápis vln zjednodušili, budeme směry vektoru s1 považovat za osu z' souřadné soustavy, ve které budeme vlnu popisovat. Potom bude mít lineární kombinace proměnných , zavedená v části 12.1, pro vlnu vyzářenou prvním elektronem do směru s1 tvar 4>'\ = 27r|s|z' — ujt = z'/\ — ujt. Čím se liší lineární kombinace proměnných (p vlny vyzářené druhým elektronem? Předpokládejme, že vlna z prvního elektronu doletí během času t do vzdálenosti vyznačené na obrázku 13.1 přerušovanou čárou C. Aby do stejné úrovně doputovala vlna z druhého elektronu, musí urazit vzdálenost větší o velikost zeleného vektoru Až*. To zvýší '2 o hodnotu 27r|s||Az'| = 2ir\Az'\/\. Navíc vlna z druhého elektronu vyletí později, protože k elektronu 2 dorazila později dopadající elektromagnetická vlna. 13.2. ROZPTYL ELEKTROMAGNETICKÝCH VLN NA MOLEKULÁCH 209 Obrázek 13.1: Rozptyl elektromagnetické vlny na dvou elektronech. Čas měřený od okamžiku vyzáření vlny elektronem 2 je tedy oproti času měřenému od vyzáření vlny elektronem 1 opožděn. O kolik? O dobu potřebnou k překonání vzdálenosti \Az\, tedy At = |Az|/c. Abychom obě vlny sledovali ve stejném čase, musíme A t odečíst od času měřeného od vyzáření vlny elektronem 2. To zvýší '2 navíc o hodnotu — At) = lj\Az\/c = |ä;||Az| = 27r|s||Az| = 27r|Az|/A, protože c = ujjk. Celkem je tedy '2 = <(>[ + 2ir(\Az'\ + |Az|)/A. Jak vypočítat velikosti vektorů Az a Až*? Vektor Az se rovná průmětu rz vektoru r do směru z, jak naznačuje červená přerušovaná šipka na obrázku 13.1. Takový průmět spočítáme r ■ uz, kde uz je jednotkový vektor ve směru z. Protože vektor s míří tímto směrem, můžeme jednotkový vektor „vyrobit" podělením s*jeho velikostí uz = s/\s\ = As*. Potom Az = rz = \rz\uz = A (r • s) uz. (13.20) Vektor Az1 získáme obdobně, musíme si ale uvědomit, že míří opačným směrem, než průmět fz, jak ukazuje červená přerušovaná šipka na obrázku 13.1: Až* = ř>z = -\r'z\u'z = -A (r • í)v!z. (13.21) Fázový rozdíl (p'2 — 4>'\ proto spočítáme jako 9ir 9ir 9ir 4>'2 01 = -(|Az'| + |Az|) = -(k| - \rz\) = -A f- s) = 2tt f ■ S. (13.22) Z toho plyne důležitý závěr. Složenou vlnu můžeme tedy popsat1 £oei0í + £?oei0Í! = Soei0í + Soei0íei(^-^í) = Ě0é^ l + e^jf] , (13.23) V f(S) J kde vliv samotného skládání vln zahrnuje červená část, zvaná rozptylový faktor. Ve skutečných molekulách bývá elektronů více, než dva, a jejich polohy nejsou přesně určeny. Rozptylový faktor pro směr 1 Striktně vzato, v následujícím vztahu nesčítame vlny v jednom bodě, ale počítáme součet vln v bodech na čáře C, vzdálených o velikost vektoru x'. Vzdálenost \x'\ je ale mnohem menší než dráha, kterou vlna urazí při pozorování okem nebo kamerou. Odchylky od našeho vztahu způsobené rozdíly ve směrech vln v důsledku posunutí o \x'\ jsou proto zanedbatelné. 210 KAPITOLA 13. ELEKTRONY -4 -2 0 2 4 -4 -2 0 2 4 -4 -2 0 2 4 Š ■ fa § -fa Š ■ f a Obrázek 13.2: Příklad skládání vln na jednorozměrné mřížce složené ze dvou, pěti a deseti molekul. určený vektorem S proto počítáme jako integrál fázových rozdílů v různých místech molekuly popsaných polohovým vektorem r= [x; y; z], vážených elektronovou hustotou (hustotou pravděpodobnosti nalezení elektronu) v daném místě p{r) f{Š) = J p(x,y,z) é27T ^+ysy+zS^áxáyáz = j p{r) é27T PŠáV. (13.24) molekula molekula 13.3 Difrakce na krystalech Pokud jsou molekuly uspořádány v pravidelných krystalových mřížkách, můžeme si skládání rozptýlených vln rozdělit do dvou úrovní. V každé krystalové buňce se skládají vlny vyzářené různými elektrony molekul, které buňku tvoří. První úrovní je rozmístění elektronů v rámci jedné molekuly, a tedy i v rámci krystalové buňky, které je obecně neperiodické a jeho vliv na skládání vln rozptýlených do určitého směru popisuje rovnice 13.24. Celkový rozptylový faktor pro elektrony všech atomů krystalové buňky se nazývá strukturní faktor F(S). F(Š) = J p(r) é27T PŠdV. (13.25) buňka Protože vektor S se v F(S) vyskytuje pouze vynásobený imaginární jednotkou, platí F(—S) = F*(S), kde hvězdička značí komplexně sdružené číslo (s opačným znaménkem u imaginární jednotky). Druhou úrovní je uspořádání buněk v krystalu, které je naopak vysoce periodické, protože strukturní faktory jednotlivých buněk jsou velmi podobné, ideálně identické. Vzájemnou polohu sousedních buněk popisují tři vektory ra,ri,,rc, ne nutně vzájemně kolmé.2 Skládání vln rozptýlených na elektronech v celém krystalu tak můžeme popsat W„ nb na _ JVQ nb na / p^jfj ei2-K(r+nara+nbrb+ncrc)-Š_ F(Š) ei2'K(nar'a+ríbrb+ncrc)-§ na = l nb=l ™c=lbunka na=lnb = lnc = l (13.26) kde Na, Nb, Nc jsou počty pravidelně se opakujících buněk ve směrech vektorů ra, t%, fc. Porovnání s rovnicí 12.34 ukazuje, že sama geometrie krystalů vede k tomu, že vliv skládání vln má matematický tvar trojrozměrné Fourierovy řady. Protože krystaly obsahují obrovské počty pravidelně se opakujících Krystalografové tyto vektory obvykle značí a, b, c. 13.3. DIFRAKCE NA KRYSTALECH 211 buněk, vlny se extrémně zesílí ve směrech, ve kterých je fázový rozdíl rovný násobku vlnové délky (obrázek 13.2). Matematicky si to můžeme popsat takto. Sčítání například ve směru fc můžeme přepsat - N 2 J2 F(S) ei27ra<=(íVS) = J2 F(Š) ei27ra<=(íVS)Anc = -^F(Š) e1^^'5^Akc, (13.27) nc—l nc — l nc—l kde jsme v prvním kroku využili toho, že počty krystalových buněk rostou po jedné Anc = 1, a v druhém jsme exponent rozšířili číslem Nc. Zlomek v exponentu můžeme označit kc a sčítat po krocích Akc = 2irAnc/Nc = 2ir/Nc, tedy od Akc po NcAkc = 2ir. Protože Nc je velmi velké číslo, krok Akc, se kterým se hodnota kc od buňky k buňce mění, je naopak velmi malý a můžeme jej nahradit diferenciálem dkc. Místo sumy tak budeme počítat integrál. Dalším trikem bude, že k rc -S přičteme a od něj odečteme nějaké celé číslo lc 2-k 2-k i- , - * T 2?r ^F(Š) J eik^§+l^l^dkc = ^F(Š)ék^N< J eik^§-l^dkc = ^F(Š) i(rc • 5 - lc)Nc = NcF ~■ cos(27r(re -Š-lc)Nc) + isin(2^(rc -Š-lc)Nc) - 1 = Ncp g cos(2^z/) + isin(2^) - 1 2^ i(rc-Š-lc)Nc 2n w (13.28) Modrý výraz před integrálem, elkclcNc = el27Tla = cos 2irlc+i sin(27rZc), je rovný jedné, protože kosinus celočíselného násobku 2tt je jedna a sinus celočíselného násobku 2tt je nula. Červený integrál nám poskytl zlomek, kde v čitateli máme komplexní číslo, jehož reálná složka leží mezi nulou a —2 a imaginární složka mezi —1 a +1. Protože Nc je velmi velké, jmenovatel červeného zlomku je také obrovský a celý červený zlomek se blíží nule. Jedinou výjimkou je případ, kdy se fc ■ S — lc blíží nule a výsledné v je rozumně velké číslo. Jak vidíme, k nezanedbatelné difrakci dochází jen ve směrech popsaných takovým vektorem S, kdy rc ■ S je blízký celému číslu. Pokud je rc ■ S téměř přesně celé číslo a tedy v se blíží nule, blíží se exponenciální výraz v červeném integrálu jedničce a vliv difrakce nabývá maxima rovného NCF(S). Proto k difrakci významně přispívají jen strukturní faktory pro celočíselné skalární součiny ra ■ S = la, rb ■ Š = lb a rc • Š = lc.3 Polohu v elementární buňce navíc nemusíme určovat pomocí směrů os x, y, z kartézské souřadné soustavy. Můžeme využít směrů vektorů ra,r*b,rc. Pokud polohový vektor r popíšeme jako r = wara + Wbfb + wcrc, můžeme skalární součin r ■ S zapsat jako r ■ S = wara ■ S + Wbfb ■ S + wcrc ■ S. (13.29) Protože k difrakci významně přispívají jen směry s celočíselnými hodnotami ra ■ S, rb ■ S a fc ■ S, stačí strukturní faktor popsat jako lil F(la,lb,lc) = VhuňkaJ J J P(wa,wb,wc)ea«w"l^l>^Udwadwbdwc, (13.30) 0 0 0 nebo zkráceně F(í) = f p(w)ei2™-rdV, (13.31) 3Krystalografové používají místo Za,Z(,,Zc označení h,k,l. Písmenka h a k by se nám ale mohla plést s Planckovou konstantou a velikostí vektoru k. 212 KAPITOLA 13. ELEKTRONY kde dV = Vbuňkadwadwbdwc, l je trojice celých čísel la,lb,lc a w je trojice čísel wa, wb,wc. V rentgenové krystalografii ovšem není naším úkolem počítat strukturní faktory z tvarů molekul, ale naopak spočítat rozložení elektronové hustoty ve zkoumané molekule z naměřených difrakčních dat. Zde přichází ke slovu zpětná Fourierova transformace. Kdyby la,lb,lc byly spojité proměnné, počítali bychom oo oo oo p(wa,wb,wc) =-X- í í í F(la,lb,lc)e-'l2^w^+WblM^dladlbdlc. (13.32) V'buňka j j j —oo —oo —oo Protože jsou ale la,lb,lc celá čísla (s Ala = Alb = Alc = 1), počítáme místo integrálu sumu přes všechny hodnoty la,lb,lc odpovídající směrům, ve kterých byla pozorována difrakce (v principu přes všechna celá čísla) 1 oo oo oo p(wa,wb,wc) = -- E E E F(laMX)z-^[Wala+Wbh+w^\ (13.33) •'buňka . . . la— — OO ífo —— oo íc —— oo kde F(la,lb,lc) je komplexní číslo, které si můžeme zapsat v exponenciálním tvaru jako |F|eia. Rozložení elektronové hustoty bychom tedy měli získat jednoduše jako 1 oo oo oo p(wa,wb,wc) = -- E E E ^(/„./ft./^le^C-'6^)-2-^'-^'^^'^), (13.34) ^buňka . . . la — — OO ífo —— oo íc—— oo nebo zkráceně p(w) = J2 \F(í)\e-[(a&-2™-rK (13.35) ^buňka ^ l Problém je v tom, že detektory jsou schopny změřit jen amplitudu rozptýlených vln, nikoli jejich fázi, odpovídající posunutí vlny o zlomky nanometrů. Proto získáváme jen amplitudy strukturních faktorů v jednotlivých směrech F\(la, lb, lc)\, ale ne jejich fáze a(la, lb, lc). Způsobů, jak tento problém řešit, je několik. My si v příští části ukážeme přístup, který lze použít pro molekuly s elektrony v malém počtu atomů. 13.4 Pattersonova funkce Rozložení elektronové hustoty můžeme pro jednodušší molekuly zjistit i bez znalosti fáze strukturního faktoru, s využitím konvoluce popsané v části 12.5. Na fázi strukturního faktoru totiž nezávisí konvoluce p(w) * p(—w), tedy konvoluce elektronové hustoty se s inverzí stejné elektronové hustoty vůči středu symetrie. Tato konvoluce se nazývá Pattersonova funkce. Proč nezávisí Pattersonova funkce na fázi strukturního faktoru? Když si do předpisu pro konvoluci dosadíme za p z rovnice 13.33, získáme ľ p(w)p(u + w)dwadwbdwc= -2^^^|F(r)||F(r)|ei(a^+a(?)-2x"'r') ľ e-i2™'(r+ř))dV. J buňka Tu buňka t t buňka (13.36) Protože vektor w popisuje polohy všech bodů v elementární buňce, jsou hodnoty wa, wb, wc rozmístěny rovnoměrně mezi nulou a jedničkou a hodnoty 2ttw ■ (l + ľ) (argumenty kosinů a sinů vyjádřené v 13.5. TL UMĚNÝ SIGNÁL NUKLEÁRNÍ MAGNETICKÉ REZONANCE 213 komplexním exponenciálním tvaru) pokrývají rovnoměrně interval od nuly do 2tt (a jeho celočíselné násobky). Proto je výsledek integrování nula, s výjimkou případu, kdy V = —l, argument je nulový a exponenciální člen roven jedné. Pokud V = —l, jsou F(l) a F(ť) komplexně sdružené a jejich součin je čistě reálná druhá mocnina amplitudy Nenulové příspěvky ke konvoluci J2 \F(ľ)\2e[2™-r f dV = J2 inO|V2™';Vbunka = ^— £ |F(f)|2ei2™'r (13.37) Mmňka t j Mjuňka T ^buňka _ <- buňka <- <- proto nezávisí na experimentálně nedostupných fázích a(l).4 Nezískáme ovšem mapu elektronové hustoty v elementární buňce, ale pouze popsanou konvoluci. Co se z ní dozvíme o rozložení elektronů? Předpis pro naši konvoluci vlastně říká: „Vezmi rozložení elektronové hustoty a stejné rozložení posunuté ve směru vektoru u o velikost vektoru u, tato rozložení vynásob a nakonec spočítej, jaká by byla celková pravděpodobnost nalezení elektronu v elementární buňce, kdyby byla hustota pravděpodobnosti dána popsaným součinem". Pro jaké vektory u bude tato pravděpodobnost (hodnota Pattersonovy funkce) největší? Pro jednoduchost předpokládejme, že elektrony jsou nahloučeny v těsné blízkostí jader atomů (černé kroužky na obrázku 13.3A). Pokud posuneme rozložení elektronů tak, že všechny černé kroužky budou posunutí ležet mimo polohy černých kroužků před posunutím, získáme nulový výsledek. V součinu bude všude v buňce bud jedna nebo druhá hodnota rovná nule, a tak bude celý součin všude nulový a tedy i integrál všech takových součinů bude nulový. Maxima Pattersonovy funkce naopak získáme tehdy, když se posunutím překryjí dva kroužky odpovídající různým atomům (modré kroužky na obrázku 13.3B). Konvoluce zvaná Pattersonova funkce nám tedy říká, jaké jsou vzájemné polohy atomů (oblastí s vyšší elektronovou hustotou). Když si vypočítáme konvoluce pro všechna posunutí v rámci elementární buňky, získáme takzvanou Pattersonovu mapu (pro tři atomy je ukázána na obrázku 13.3C). Z této mapy můžeme teoreticky určit vzájemné polohy všech atomů a tak získat tvar molekuly. Jak ale obrázek 13.3C ukazuje, již pro tři atomy obsahuje mapa mnoho maxim a tento počet dále roste s počtem atomů v molekule. Proto lze Pattersonovy mapy použít pouze k určení tvaru jednodušších molekul, nebo k rozložení malého počtu „těžkých" (na elektrony výrazně bohatších) atomů ve velkých molekulách.5 13.5 Tlumený signál nukleární magnetické rezonance Elektrony jsou zásadní nejen pro difrakci na krystalech, ale také pro další důležitou metodu strukturní analýzy, pro spektroskopii nukleární magnetické rezonance. V této metodě pomocí radiových vln polarizujeme magnetické momenty jader ve směru kolmém na vnější magnetické pole. Takto polarizované magnety rotují několik sekund kolem směru vnějšího magnetického pole s frekvencí, která je ovlivněna rozložením okolních elektronů, tedy strukturou molekuly. Postupně ale polarizace kolmá k magnetickému poli mizí a obnovuje se polarizace s polem rovnoběžná. Během toho detegujeme elektromotorického napětí, které v anténě detektoru indukuje magnetické pole rotujících polarizovaných magnetických momentů. V ideálním případě by měl záznam indukovaného elektromotorického napětí následující tvar 4Výsledná konvoluce je reálná funkce. Když si sumu rozdělíme na sčítání pro vektory Z s la < 0 a la > 0, získáme dvě sumy. Jedna z těchto sum bude rovná druhé s opačným znaménkem vektoru Z. Proto platí El^(0|2ei2,ra'r= E l^(0|2 (ei2'ra'r+e-i2'ra'^ = 2 ^ l^(0|2 cos(2™ ■ Z) = ^ 12 cos(2™ ' 0- r r s ia>o ľs ia>o r 5Taková analýza rozložení těžkých atomů hrála důležitou roli v postupu, který poprvé umožnil spočítat tvar molekul proteinů. 214 KAPITOLA 13. ELEKTRONY 2-3 Co o o o o o o _ o _ o o o r o , o / o o / o o / o o /o o o o /o o i o J o o o o r o , o o / o o / o 0 i8 ° i8 ° j8 o Obrázek 13.3: Pattersonova mapa. Na obrázku A je černě zobrazena jednoduchá molekula v zelené elementární buňce. Obrázek B ukazuje posunutí molekuly vedoucí k překryvu atomů. Obrázek C představuje několik buněk Pattersonovy mapy této molekuly. jV y (t) = J2 A.e -Rr ťeifi„ pro t > 0, y(t) = 0 pro t < 0, (13.38) který se od rovnice 12.29 liší přítomností exponenciálního tlumení. Hodnoty fž„ v záznamu signálu jsou rozdíly úhlových frekvencí rotací magnetických momentů různých jader (s různým elektronovým okolím) od nějaké referenční hodnoty (obvykle frekvence použitých radiových vln). Rychlostní konstanty Rn popisují, jak rychle signál různých jader mizí. V anténě ve skutečnosti osciluje elektromotorické napětí jako funkce kosinus (nebo sinus) s určitým fázovým posunem. Tento záznam se na tvar elf2rl* převádí umělým rozdělením signálu na dvě složky s fází posunutou o 90°, tedy kmitající jako sinus a kosinus. Tyto dvě složky se ukládají odděleně a imitují tak reálnou a imaginární část komplexního čísla. Příklad pro signál tří magnetických momentů s různou frekvencí je ukázán na obrázku 13.4 nahoře. Frekvence jednotlivých jader bychom teoreticky mohli odhalit postupem obdobným rovnici 12.30. Pokud by rotace magnetických momentů měly nějakou společnou periodu t, mohli bychom počítat integrál y(t)< ,-ífžnt dí. (13.39) To má ovšem dvě úskalí. Za prvé, od rozložení elektronů v molekulách můžeme těžko očekávat, že povede k rozdílům frekvencí jaderných magnetických momentů, které by měly společnou periodu. Za druhé, u tlumené oscilace nemůžeme sázet na ortogonalitu. Integrál tlumené funkce sinus či kosinus přes jednu periodu nebude nulový, protože signál ve druhé polovině periody bude mít menší rozsah a neodečte se přesně od signálu z první poloviny. Proto bychom měli integrovat do nekonečna a neomezovat úhlové frekvence v argumentu na konkrétní hodnoty fž„ n=l / v{t)e-'wtát = Ale--R"ťein"ťe-i*'ťdt =^An j n n n=l n=l n M r _e-{Rn-i{nn-Lo))t^ 00 AT -(Rn-i(Qn-uj))tdt Rn - i(fž„ - oj) 0 n=l j-Rntp(i(nn-ui))t Rn - i(fž„ - oj) 0 Aí 1 - o n=l (íí„ - Oj) ' (13.40) Abychom neměli ve jmenovateli komplexní číslo, vynásobíme čitatele i jmenovatele číslem komplexně sdruženým k tomu, které máme ve jmenovateli 13.5. TL UMĚNÝ SIGNÁL NUKLEÁRNÍ MAGNETICKÉ REZONANCE 215 1. A ^ íi2 ____-- íi2 Í23 Obrázek 13.4: Časový signál uložený jako komplexní funkce (nahoře) a spektrum frekvencí získané spojitou Fourierovou transformací (dole) pro molekulu s třemi jádry s rozdílnými frekvencemi magnetických momentů. Reálná a imaginární část je ukázána zvlášť (modře vlevo a červeně vpravo) jako záznam v „kanálech" 1 a 2. , _1_ Rn + Í(fžn - u) _ . Rn + Í(fžn - U) _\p . Rn + i(fžn - Cj) n=,Ä„-i(n„-w)' + i?2 -í2(íi„-c)2 - 2^-AnR2n + inn-^' (13.41) kde jsme využili rovnosti (a + b)(a — b) = a2 — b2 a toho, že i2 = — 1. Výsledek integrace ukazuje obrázek 13.4 dole. Vidíme, že výsledkem nejsou určité hodnoty rozdílů frekvencí fž„, ale spojitá komplexní funkce frekvenční proměnné ui. Z reálné složky této funkce na obrázku 13.4 vlevo dole ale můžeme snadno rozdíly frekvencí fž„ určit jako polohy lokálních maxim. Příspěvky k reálné složce vypočítaného integrálu pro jednotlivá n jsou známé jako Lorentzova funkce. Integrál v rovnici 13.40 můžeme lehce upravit, aby se rovnal předpisu pro spojitou Fourierovu transformaci (rovnice 12.40). Stačí posunout spodní mez integrálu z nuly na —oo. V tom nám nic nebrání, protože podle rovnice 13.38 je signál v záporném čase (tedy před začátkem měření) nulový. Větší problém je, že ve skutečnosti ukládáme signál v digitální formě. Funkci v rovnici 13.38 proto musíme nahradit posloupností /V y3 = J2 Ane-R^AtéQ^At (13.42) n=l a frekvenční spektrum vypočítat v digitální formě diskrétní Fourierovou transformací N-i jV iV N-l Yl=J2J2 Ane-R^AtéQ^Ate-ilA^AtAt = J2J2 e^-^-1^^ At, (13.43) j—0 n—1 n—1 j—0 Když si označíme £ = e~^Rn~^Qn~lAuj^At, spočítáme sumu přes j podle rovnice 12.62 216 KAPITOLA 13. ELEKTRONY a-oEc^i-r =► ^ = E^i_e-(H,-i(n,-«/w))At^ j=0 j=0 ^ n=l (13.44) kde jsme v posledním kroku zahrnuli požadavek AwAí = 2tt/N. Jak vidno, diskrétni Fourierovu transformaci ideálního digitálního signálu lze popsat analyticky. Tvar výsledné funkce je jiný, než v případě spojité transformace. Výsledek diskrétní transformace se od výsledku spojité transformace liší tím víc, čím „hrubější" digitalizace je, tedy čím větší jsou Aŕ a Au;. Naopak pro Ar —> 0 a Au; —> 0 se řešení k sobě blíží, jak lze očekávat, protože takto jsme spojitou Fourierovu transformaci definovali. Konkrétně, ' ^ ™l-e-^At(cos((íl„-ZAu;)Aí)-isin((íl„-ZAu;)Aí)) * ~* ^ " Rn - i (íí„ - l Au)' (13.45) protože v čitateli e~~i^Rrí —>• 0 pro Au; —>• 0 =>• 2irRn/Au -íooave jmenovateli e_iíriAt « 1 — RnAt, cos ((íí„ - /Au;) Aí) « 1, (1 - i?„Aí) sin ((íí„ - /Au;) Aí) « (íí„ - / Au;) Aí pro malé Aí. 13.6 Vlnová funkce volného elektronu V části 12.7 jsme si připomněli Planckovu myšlenku, že energie elektromagnetických vln se mění po kvantech velikosti hv = hu. Popíšeme-li tedy elektromagnetickou vlnu rovnicí 12.28, můžeme za uj ve vlnové rovnici dosadit energii kvanta této vlny vydělenou h Ě = Ě^k^x+kyv+k^z-uit) = = fi^k^x+kyy+kzZ-Ě-1) ^ (13.46) V části 12.1 jsme si také odvodili, že k = uj/c. Když spojíme Planckův vztah s Einsteinovým vztahem pro celkovou energii £ = mc2, můžeme si k vyjádřit jako uj £ mc2 mc . *: = - = - = — = —. (13.47) c ňc ňc ň V čitateli nám zbyla hmotnost násobená rychlostí, což jsme zvyklí považovat za hybnost. V případě elektromagnetické vlny to opravdu hybnost je, takže kx, ky, kz jsou složky hybnosti px,py,pz vydělené konstantou h. Rovnici elektromagnetické vlny si tak můžeme zapsat pomocí hybnosti a energie Ě = Ě0e^x+pyv+p"z-£t). (13.48) Jak to souvisí s tématem této kapitoly, s elektrony? Roku 1801 Thomas Young pozorováním difrakce světla na nejjednodušší mřížce (dvou štěrbinách) ukázal, že se světlo chová jako vlny. V letech 1923-1924 přišel de Broglie s myšlenkou, že i elektron lze popsat jako vlnu, a 20. letech 20. století byla skutečně pozorována difrakce elektronů. Vztah téměř identický s rovnicí 13.48 tak můžeme považovat za vlnovou funkci volného (s ničím neinteragujícího) elektronu = Ce%(p*x+PyV+PzZ~£t\ (13.49) 13.7. OPERÁTORY, JEJICH VLASTNÍ FUNKCE A HODNOTY 217 13.7 Operátory, jejich vlastní funkce a hodnoty V kvantové mechanice nese vlnová funkce 'ř veškerou dostupnou informaci o fyzikálním systému, který popisuje (v našem případě volný elektron). Hodnoty měřitelných veličin z vlnové funkce získáme tak, že na veličinu působíme operátorem, matematickým předpisem, který veličinu reprezentuje. Například operátor parciální derivace podle souřadnice, vynásobené —ifi reprezentuje složku px hybnosti elektronu (ce-k(P*x+Pyy+P*z-£t^ = PxCež(P*x+Pyy+P*z-£ť) (13.50) neboli -ih—y=pxV. (13.51) Náš operátor vlnovou funkci téměř nezměnil, pouze ji vynásobil konstantou px. Funkce, které se takto chovají (jsou řešením rovnice 13.51), se nazývají vlastni funkce příslušného operátoru a násobícím konstantám, se říká vlastní hodnoty operátoru.6 Vlastní hodnoty jsou právě ty hledané hodnoty měřitelných veličin (v našem případě px). 13.8 Schrodingerova rovnice pro volný elektron Zajímavým operátorem je parciální derivace podle času vynásobená ifi. Jednak nám poskytuje hodnotu energie ifl— (^Ce-k(P*x+Pyy+Pzz-eí)^ _ g(je^{pix+pyy+pzz-St) ^ (13.52) ale rovnice 13.52 zároveň představuje pohybovou rovnici, popisující, co se s elektronem děje v čase. Jak vidíme, řídí se to hodnotou energie přesněji řečeno Hamiltonovy funkce popisující celkovou energii. Volný elektron ale nemá jinou než kinetickou energii. Kinetická energie úzce souvisí s hybností £=m*=f_ i4* = |l* (13.53) 2 2m dt 2m y ' a předpisem pro určení složek hybnosti je rovnice 13.50 (a její obdoby s parciálními derivacemi podle y a z). Po dosazení rovnice 13.50 do rovnice 13.53 dt 2m \ dx dx dy dy dz d z j 2m \ dx2 dx2 dx2 j (13.54) což je Schrodingerova rovnice popisující pohyb volného elektronu. "Není náhoda, že v kvantové mechanice používáme jazyk lineární algebry, se kterým jsme se seznámili v části 11.8. Vlastní hodnoty hrají stejnou roli, jako v maticovém zápisu homogenních soustav lineárních rovnic. Vlastní funkce jsou obdobou vlastních vektorů: funkční hodnoty můžeme formálně matematicky zapsat jako nekonečně blízké složky ne-konečně-rozměrného vektoru (v matematickém smyslu). Matice násobící vektory v lineární algebře můžeme považovat za operátory, které na vektory působí a nějakým způsobem je mění (v případě vlastních vektorů je pouze násobí vlastní hodnotou). Operátory v kvantové mechanice mohou být reprezentovány maticemi. 218 KAPITOLA 13. ELEKTRONY 13.9 Superpozice a neurčitost Světlo a elektromagnetické záření obecně jsme si popsali jako vlny šířící se vektorovým polem elektrických a magnetických sil (přesněji E a B). Druhá mocnina amplitudy elektromagnetických vln udává jejich intenzitu. Co představuje vlnová funkce ty elektronu? Hodnota ty je nejčastěji interpretována jako amplituda pravděpodobnosti, jejíž druhá mocnina ty* (x, y, z)ty{x, y, z) (hvězdička označuje komplexně sdružené číslo) je hustota pravděpodobnosti p nalezení elektronu v místě popsaném souřadnicemi x, y, z. Dosazení za vlnovou funkci volného elektronu z rovnice 13.49 p = Vp*^ = C* (T TÍ^P^Vvy+Vzz-et) (j^ipxX+Pyy+PzZ-St) = |£,|2 (13.55) nás ale vede k smutnému závěru. Výpočtem druhé mocniny komplexní vlny se úplně ztratila informace o poloze a čase. Hustota pravděpodobnosti nalezení elektronu je všude stejná, rovná druhé mocnině amplitudy |C|2. Kvantová mechanika nám tedy neumožňuje říci, kde volně letící elektron v daném okamžiku je. Situaci zachraňuje superpozice vln, kterou jsme si ukázali na příkladu struny kytary. Vlny se skládají. V rovnici 13.23 jsme si ukázali, že složením elektromagnetických vln vyzářených dvěma elektrony, jejichž vzájemnou polohu popisuje vektor r, vznikne složená vlna Ěoe^i + Ěoe^z = Ě0é^ (l + ei27T P'Š^ . (13.56) Zatímco intenzita původních vln \Eq\2 nezávisí na poloze v prostoru, intenzita složené vlny je různá v různých směrech, popsaných různými vektory S lEofé^e-^ (1 + é2"" řSj [1 + e-^ PSJ = \E0\2 [2 + é2"" p's + řSj = 2|£0|2(l+cos(27r f-Š)). (13.57) Totéž platí pro vlnovou funkci ty, proto také popis elektronů vlnovou funkcí ty vysvětluje jejich difrakci. Pokud má tedy ty*ty podávat informaci o pravděpodobnosti elektronu v různých místech prostoru, musí být ty složenou vlnou, neboli superpozici více harmonických vln z rovnice 13.49 N N ^ = J2 CneiiPri'r~£t) = J2 bn^if!n-r), (13.58) n—1 n—1 kde jsme fázový posun — £t skryli do komplexního koeficientu bn = Cne~l£t/h. Jednotlivé vlny se liší hybností p, která se mění spojitě a v nerelativistické fyzice může mít libovolný směr i velikost. Proto superpozici lépe popisuje integrál oo oo oo *=/"/"/" b(Px,Py,Pz)eiÍP*x+Pvy+p*z)dpxdpvdPz, (13.59) — oo —oo —oo což není nic jiného, než spojitá Fourierova transformace nějakého rozložení hybností, popsaného spojitou funkcí b. Je-li závislost ty na distribuci hybnosti b Fourierova transformace, tak můžeme také spočítat distribuci b z rozložení ty v prostoru oo oo oo b= ty(x,y,z)e-^x+pyy+p'z)dxdydz. (13.60) — oo —oo —oo Díky Fourierově transformaci tak můžeme stav elektronu popsat jak pomocí ty, tak pomocí b. Proto o ty a b mluvíme jako o souřadnicové a hybností reprezentaci vlnové funkce. Hodnotu b*b pro určitou hybnost můžeme interpretovat jako hustotu pravděpodobnosti, že elektron má právě tuto hybnost. 13.10. SCHRÔDINGEROVA ROVNICE PRO ATOM VODÍKU 219 Pravděpodobnostní interpretace vlnové funkce určuje její celkovou amplitudu, protože pravděpodobnosti, že elektron je někde v prostoru a že má nějakou hybnost, musí být rovny jedné y,z)*^(x,y,z)dxdydz = 1 J J J h^x,yy,yz)*b(yx,yy,yz)dpxdpydpz = \. — oo —oo —oo —oo —oo —oo (13.61) Pokud bychom se chtěli dozvědět, kde přesně se elektron nachází, tedy získat nenulovou hodnotu p = pouze v jednom místě, musel by se integrál rovnat delta funkci 6(x,y,z), která má nenu- lovou hodnotu pouze v místě o souřadnicích x,y,z. Srovnání s rovnicí 12.43 nám říká, že v takovém případě by musela být funkce b rovná konstantě stejné pro všechny hybnosti. Tak bychom ale ztratili veškerou informaci o hybnosti elektronu, protože všechny hybnosti by byly stejně pravděpodobné. Základní pilíře kvantové mechaniky, popis elektronu vlnovou funkcí a princip superpozice vyjádřený Fourierovou transformací, v sobě neodvratně skrývají nemožnost určit zároveň přesně polohu i hybnost elektronu. 13.10 Schrodingerova rovnice pro atom vodíku Blízkou obdobu difuzní rovnice najdeme i v kvantové mechanice. Stejně jako v Debyově-Hůckelově teorii jde o popis elektricky nabité částice v elektrickém poli popsaném sféricky symetrickým potenciálem. Tou elektricky nabitou částicí je tentokrát elektron a zdrojem pole jádro atomu. Přesněji řečeno jádro atomu vodíku, protože ostatní atomy obsahují ještě další elektrony, které nám brání vyřešit rovnici popisující pohyb elektronu analyticky. Schrodingerova rovnice elektronu v atomu vodíku má tvar velmi podobný druhému Fickovu zákonu: ti2 o -O2 i^ = -^V2vP+—í^vř. (13.62) dt 2m 4ire0r y ' Hlavním rozdílem je elektrický potenciální energie elektronu v elektrickém poli jádra — Q2 / (Airegr), kde — Q2 je součin nábojů elektronu a jádra, které mají v atomu vodíku stejnou velikost, ale opačné znaménko.7 Ve Schrodingerově rovnici také nevystupuje hustota pravděpodobnosti p, ale její „komplexní odmocnina" (přesněji amplituda pravděpodobnosti), vlnová funkce Hodnota m je memp/(me + mp), kde me a mp jsou hmotnosti elektronu a protonu, přičemž předpokládáme, že těžiště atomu se příliš nepohybuje a neliší od polohy protonu, kterou považujeme za počátek souřadné soustavy. Budeme předpokládat, že vlnová funkce je součinem funkce g(t) závislé na čase a funkce ip(r, ip, ů) závislé na prostorových proměnných. Tyto funkce oddělíme postupem popsaným v části 9.5, tedy vydělením rovnice \P = gip. ift^ = ±í-£vV + f^V (13.63) g dt tp \ 2m Aire^r Aby rovnice platila pro jakýkoli čas a jakoukoli polohu, musí se obě strany rovnice rovnat stejné proměnné, která má rozměr energie a označíme si ji proto £. Řešením levé rovnice je g = e_1Ř*, jak víme z části 9.5. Pravá rovnice je znavná jako stacionární Schrodingerova rovnice elektronu v atomu vodíku a chemika zajímá především. Rozepíšeme v ní La-placeův operátor 7Jde o verzi Coulombova zákona, o kterém je řeč v části 10.3. 220 KAPITOLA 13. ELEKTRONY )H h2 1 íd_ ( 2s.můd±\ + d_ f-mů?±\ + A \ _ ŕ v ! c \ ^ - Q (13 65) 2m r2 sin ů \dr \ dr J dů \ dů J dip \sinf9 dp J J \4-7reor a obvyklým způsobem se budeme snažit rozdělit proměnné. Budeme předpokládat, že ip můžeme zapsat jako součin funkce R(r), závislé jen na vzdálenosti od jádra, a funkce Y(p,ů), závislé jen na orientaci. Po vydělení součinem R(r)Y(p,ů) a vynásobení 2m/fi2, ,2"- dR\ 2m / Q2 \ , \ 1 / d ( . BY\ d ( 1 dY 1 £ r R =--- — srno 11 ' R \dr \ dr J h2 \4-7reor J J Ysin?? \dů \ dů J dip \sin?9 d(p ' (13.66) Levá strana popisuje závislost na r, pravá na úhlech p,ů. Má-li rovnice platit pro jakákoli r, p,ů, musí se obě strany rovnat stejné konstantě, kterou si jako dříve označíme A2 1 /d ( dY\ d ( 1 dY\\ , -Y^ů [ďů {S'mŮM)+ď^ {^Ůc%p-))=x ■ (13'68) Druhou z těchto rovnic, angulární část stacionární Schrôdingerovy rovnice, jsme s velkým úsilím vyřešili v předcházejících částech. Řešení nám ukázalo, že je vhodné A2 rozepsat jako 1(1 + 1). Zkusme tedy první z rovnic, radiální část stacionární Schrôdingerovy rovnice, vyřešit se stejně rozepsanou konstantou dr V dr J h2 V47re0r / 13.11 Radiální část vlnové funkce Postupem, který jsme si ukázali v části 9.4 (rovnice 9.36-9.39), zjednodušíme rovnici zavedením substituce / = r R S+SKiSH'-'^1'^0- (13J0) Abychom rovnici zjednodušili, vynásobíme ji nejdříve (47reofi2/(m(52))2 47re0fi2\2d2/ 47re0fi2 2 2m /47re0fi2 \ 2 „ , 1. /47re0fi2 \ 2 / £f-i(i + i) —í-T- ^ = 0 (13-71) 12 / dr2 rriQ2 r h2 \ mQ2 J \ mí a zavedeme bezrozměrné veličiny A-xe^h2 re' m \ Q2 J £\ ' kde výraz —£ je kladný, protože energie elektronu v atomu je záporná (je k jádru přitahován). Konstanta re odpovídá poloměru první orbity v Bohrově modelu atomu a £\ ionizační energii elektronu v základním stavu atomu vodíku. Upravenou rovnici 13.11. RADIÁLNÍ ČÁST VLNOVÉ FUNKCE 221 d2 f 9f f t4 + — -e2/-^ + l)4 = ° (13-73) dsz s sz bychom uměli vyřešit pro tak velké vzdálenosti od jádra, že bychom mohli zanedbat členy s l/s a l/s2. Pak by d2f = e2f. (13.74) Řešením je mathrme~es, protože druhá derivace této funkce podle s je e2ees. Pro menší vzdálenosti bychom ale potřebovali, aby druhá derivace řešení poskytla ještě další člen závislý na s, protože d2 f 2f f -ri= £2f -^+1(1 + 1)4- (13.75) dsz s sz Takto by se chovala exponenciální funkce vynásobená nějakou jinou funkcí relativní vzdálenosti s, kterou si můžeme označit třeba A(s): d2(Ae-£S) d d((Ae-£S) d /dA „ A \ d2A „ dA „ dA „ ?A y - u - — — e~" - eAe~" = -r^-e~" - e—e~E* - —e~" +e2Ae ds2 ds ds ds \ ds J ds2 ds ds -v-' £2/ -21+1(1+1)4, (13.76) Po dosazení Ae~es za / do rovnice 13.73 a vydělení e~es, d2A dA (2 + A , — - 2e— + - - -^-^ A = 0. (13.77) dsz ds \s sz / Tento vztah nápadně připomíná rovnici 9.69, proto opět použijeme Frobeniovu metodu. Levá strana rovnice tentokrát roste do nekonečna, když se s blíží nule. Aby rovnice platila, musí A obsahovat násobení dostatečně vysokou mocninou s: A(s) = saL(s). (13.78) Derivace této funkce jsou ^ = as^L + s«f, = a(a - l)s-2L + as^f + as^ + s^. (13.79) ds ds ds2 ds ds ds2 Po dosazení do rovnice 13.77 a(a- l)sa~2L + 2as dL ds2 2easa-1L - 2esa— + 2sa-1L - 1(1 + Í)sa-2L ds 1 dL d2L dL ^ a(a - ľ)L + 2as— + s2-— - 2easL - 2es2— + 2sL-1(1 + ľ)L ds ds2 ds V (13.80) 7 kde se všechny členy s první a druhou mocninou s ve velké závorce rovnají nule pro s = 0. Má-li tato rovnice platit pro všechny funkce L, musí se a rovnat l + 1 (hodnota a = — l by také rovnici splňovala, ale je záporná, takže násobení s~' by neodstranilo s ve jmenovateli). Pro s ^ 0 obsahuje velká závorka 222 kapitola 13. elektrony kromě hledané funkce l mocniny s. Podobně jako v případě rovnice 9.79 v části 9.9 nás to vede k úvaze, že pokud bude i l obsahovat pouze kombinaci mocnin s, bude ve velké závorce polynom. Takový polynom se bude rovnat nule tehdy, když budou nulové koeficienty u všech mocnin s. Obdobně jako v části 9.9 si tedy zapíšeme oo l = J2 b3sJ => A = s'+1 J2 bjsj = J2 b3sJ+l+1- (13-81) 3=0 3=0 j=0 První a druhé derivace těchto mocninných funkcí spočítáme snadno dA °° d2A °° = £Cí + 1 + l)^'+'> = £0' + 0(J + l + (13.82) S 3=0 S 3=0 Po dosazení do rovnice 13.77, £(j + l)U + l + - 2e£(j + l + l)bjsj+l + 2j2b3s3+l ~ l(l + l)J2 b3sJ+l~1 = °> (13-83) 3=0 3=0 3=0 3=0 oo oo J2 (0' + 00' + 1 + 1)-1(1 + 1)) bjs^1-1 + £(2 - MJ + l + m3sJ+l = 0, (13.84) 3=0 3=0 oo oo J2j(j + 2Z + Vbjs^1-1 + £(2 - 2e(j + l + l))bjSi+l = 0. (13.85) 3=0 3=0 První sumu můžeme začít počítat až od jedné, protože člen s j = 0 je nulový (koeficient násobíme j(j + 21 + 1)). To je výhodné, protože když v druhé sumě posuneme index j o jedničku (místo j budeme používat j — 1), abychom také sčítali od jedné, získáme stejnou mocninu s v obou sumách 00 00 J23(3 +21 + l)bjs*+1-1 + 5^(2 - 2e(j + l))bj-lS*+1-1 = 0, (13.86) i=i i=i OO J2 (3(3 + 2Z + l)bj + 2(1 - e(j + Z>j-i)) s^1-1 = 0. (13.87) i=i Má-li být celá suma rovná nule pro jakékoli s, musí se nule rovnat závorka před každým sJ+i_1. Z toho získáme rekurentní vzorec pro výpočet koeficientu bj z předchozího bj—i (j(j + 2/ + l)6J- + 2(l-e(j + /)6J--i))aJ'+'-1 = 0 => b3 = ^^^1 + 1)&J'1' (13'88) Abychom se vyhnuli nekonečným výrazům, musíme podobně jako v části 9.9 zvolit takové hodnoty e, které ukončí řadu pro nějaké j. K ukončení řady dojde, když bude čitatel zlomku před bj—i roven nule, tedy pro s = í/(j + l). Když budeme za s postupně dosazovat převrácené hodnoty přirozených čísel n, budeme ukončovat mocninnou řadu pro j = n — l. Hodnoty pro n < 3 jsou vypsány v následující tabulce: 13.12. NORMALIZACE RADIÁLNÍ ČÁSTI VLNOVÉ FUNKCE 223 n-l-l _j=o 10 1 2 3"U,^,u " ^0,2,0 e^í (s - \s2) bl,n,l b2,n,l 0 0 "1^0,2,0 0 0 0 "|°0,3,0 2 h 27°0,3,0 "3^0,3,1 0 0 0 2 1 \ 0 0 60,2,i e^ís2 3 0 | 3 1 | 3 2 | '0_O &o,3,2 e-is3_ 13.12 Normalizace radiální části vlnové funkce Koeficient bg vypočítáme pro každou dvojici n, l z následující normalizační okrajové podmínky. Druhou mocninu amplitudy vlnové funkce ipíp* obvykle interpretujeme jako hustotu pravděpodobnosti nalezení elektronu p. O atomu vodíku víme, že obsahuje jeden elektron, takže pravděpodobnost nalezení tohoto elektronu někde v prostoru musí být rovna jedné. To pomocí integrálu zapíšeme OO 27T 7T OO 27T 7T OO 27T 7T 1 = j dr J dp J pr2sinůdů = J dr J dp J tptp*r2 smůdů = j Ŕ^^drJ dp J\Yi^\2 sinůdů, ooo ooo o oo i (13.89) kde indexy u R označují hodnoty n a Z a modrý integrál se podle podmínky 9.91 rovná jedné. Zbývá nám tedy spočítat OO OO OO -l-l 1 = JRl^dr = rlj f^ds = rlje^A^ds = r3 je"*8 £ bhn^+l+1 ds. (13.90) 0 0 0 o V 1=0 / Druhé mocniny sum v integrálu představují řady mocninných funkcí od s2 do s20'+'+1). Takové integrály jsme již počítali v části 12.8. Roznásobením A2 ;, dosazením do rovnice 13.90 a využitím rovnice 12.77 můžeme vypočítat potřebné integrály a z nich hodnoty normalizovaných b0. Pro n < 3 OO OO / /iV* = &o,i,o /e-2ss2ds = 62j1j0^ = \ 62j1j0 60,i,o = 7=3= = 2ŗ > (13-91) o o 00 00 / flo^ = ^0,2,0 / e~s (*2 - s3 + ds = 62j2j0 (2! - 3! + |) = 2 62, 0,2,1 o o 1 y0,2,0 '2ri 2(2rb)-3, (13.92) OO OO //f,ida = ^,2,i Ie-ss4dS = 62214! = 24 6221 60j2j1 = -^L= = ^(2^)^, (13.93) 0 00 00 J flods = bh,o J e_|s 92 94 93 o2 s2_^s3 + ^s4_^s5 + ^s6 3 33 34 36 ds = 224 KAPITOLA 13. ELEKTRONY 2 ,'33-2! 23-34-3! 24 • 35 • 4! 23 • 36 • 5! 22-37-6!\_ 27 2 ^A^ + -3^ + -^ + -š^ + -ŠTlŕ )=T6á,3,o(l-6 + 16-20 + 10) 27 2 3 T6o,3,o 60,3,o = -== = 2(3rB)-*, (13.94) * vi7ľb /3,ida = Ďo,3,i y e-Sfl ( s4 - -s5 + ^^s6 )ds = bf o 1 5 1 g\ _ 2 /35-4! 23-36-5! 37 • 6! 3S + 2^¥S J dS _ 6°'3'1 (+ 3-26 + 22 • 32 • 27 06 o 7 4a/2 = ^0,3,1 (8 - 20 + 15) = -6* 3>1 =>• 60j3j1 = —^== = -^=(3rB)-f (13.95) /3^ 6! 3^ 4 4 e~3ss6ds = ď2 „—— = 5—r b2. 3 ? 60 3 2 =- =-= (3rB)~^. 0,3,2 27 23 0,3,2 0,3,2 ^ v 0 0 V b v (13.96) Výpočtem koeficientů b0 jsme uzavřeli výpočet vlnových funkcí atomu vodíku. Zbývá už jen dosadit všechny hodnoty do původní rovnice. Pokud nás bude zajímat stacionární Schrodingerova rovnice (rovnice 13.65), řešením budou vlnové funkce Vv,m> kterým chemici říkají atomové orbitaly. Celočíselné koeficienty, které rozlišují jednotlivá řešení, se nazývají kvantová čísla. Hlavní kvantové číslo n udává dovolené hodnoty energie, protože — £ j£\ = e2 = í/n2. Vedlejší kvantové číslo l udává velikost momentu hybnosti elektronu. Magnetické kvantové číslo /i určuje průmět momentu hybnosti elektronu do směru, který jsme si zvolili jako osu z. V chemii je ovšem zvykem místo písmenka /i používat označení to;, takže se atomové orbitaly označují ipn,i,mi ■ Ještě častěji se místo čísla l = 0,1, 2, 3 používají písmenka s, p, d, f, místo čísla to; = 0, ±1, ±2 symboly odkazující na orientaci v prostoru a písmeno ip se nepíše vůbec. Pro úplnost je také třeba dodat, že náš popis nezachycuje fakt, že elektron má vlastní moment hybnosti, neboli spin. Zahrnutí spinu rozšíří všechny stacionární vlnové funkce atomu vodíku na dvě varianty, jednu pro spinové kvantové číslo +1/2, druhou pro spinové kvantové číslo —1/2. Prvních několik řešení (orbitalů), odhalených naší analýzou, je n l mi Rnj_ Y^m, 1 0 0 2rB' e~s 2 0 0 ^.rš* e-S(2-a) 2 1 0 ^gr-'e-Ss 2 1 ±1 ^r^e-is 3 0 0 g^fs1 e-f(27- 18s + 2s2) 3 1 0 ^rBJ e-í(6S-S2) 3 1 ±1 -Vb1 e-i(6S-S2) 3 2 0 81^6 4 ? 81VŠÔ 3 2 ±1 —7=rR2 e-ís2 T< ±=e±iv sin??cos?? 81^30 b ~\/ 8tt Literatura [1] Atkins, P., de Paula, J. Fyzikální chemie. Vysoká škola chemickotechnologická v Praze, 2013. [2] Celý, J. Základy kvantové mechaniky pro chemiky I. Principy. UJEP Brno 1986. [3] Celý, J. Základy kvantové mechaniky pro chemiky II. Aplikace. UJEP Brno 1986. [4] Houston, P. L. Chemical Kinetics and Reaction Dynamics, Dover Publications, 2006. [5] Feynman, R., Leighton, R. B., Sands, M. The Feynman Lectures on Physics. Addison-Wessley, 1964, 2005. [6] Feynman, R., Leighton, R. B., Sands, M. Feynmanovy přednášky z fyziky. Fragment, 2024. [7] Kolda, S., Krajňáková, D., Kimla, A. Matematika pro chemiky I. SNTL Praha, 1989. [8] Moore, W. J. Fyzikální chemie. SNTL Praha, 1979. [9] Rektorys, K. a spol. Přehled užité matematiky. Prometheus Praha, 2000. [10] Schrôdinger, E. Statistical Thermodynamics. Dover Publications, 1989. 225