Úvod do studia fyziky studijní text pro kombinované studium Jiří Králík Katedra fyziky PF UJEP Univerzita Jana Evangelisty Purkyně v Ústí nad Labem Přírodovědecká Fakulta Obsah Předmluva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1 Úvod do studia fyziky 7 1.1 Co je to věda a postavení fyziky v systému věd . . . . . . . . . . . . . . . . 7 2 Mechanika 11 2.1 Popis pohybu — kinematika . . . . . . . . . . . . . . . . . . . . . . . . . . 11 2.1.1 Hmotný bod . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 2.1.2 Vztažné soustavy . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 2.1.3 Kinematika v jedné dimenzi . . . . . . . . . . . . . . . . . . . . . . 17 2.1.4 Polohový vektor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 2.1.5 Rychlost hmotného bodu . . . . . . . . . . . . . . . . . . . . . . . . 31 2.1.6 Zrychlení hmotného bodu . . . . . . . . . . . . . . . . . . . . . . . 37 2.1.7 Speciální druhy pohybů . . . . . . . . . . . . . . . . . . . . . . . . 40 2.1.8 Pohyb tuhého tělesa . . . . . . . . . . . . . . . . . . . . . . . . . . 46 2.2 Pohybové zákony pro hmotný bod . . . . . . . . . . . . . . . . . . . . . . 49 2.2.1 První Newtonův zákon . . . . . . . . . . . . . . . . . . . . . . . . . 51 2.2.2 Druhý Newtonův zákon . . . . . . . . . . . . . . . . . . . . . . . . 54 2.2.3 Třetí Newtonův zákon . . . . . . . . . . . . . . . . . . . . . . . . . 55 2.2.4 Dodatky k Newtonovým zákonům . . . . . . . . . . . . . . . . . . . 55 2.3 Složitost a jednoduchost pohybu . . . . . . . . . . . . . . . . . . . . . . . . 62 2.3.1 Časový účinek síly . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 2.3.2 Dráhový účinek síly . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 2.4 Gravitační pole . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 2.5 Mechanika tuhého tělesa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 2.5.1 Moment síly a pohybová rovnice pro otáčení tuhého tělesa kolem pevné osy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 2.5.2 Těžiště tuhého tělesa . . . . . . . . . . . . . . . . . . . . . . . . . . 89 2.5.3 Mechanická energie tuhého tělesa . . . . . . . . . . . . . . . . . . . 91 2.6 Mechanika kapalin a plynů neboli tekutin . . . . . . . . . . . . . . . . . . . 92 2.6.1 Tekutiny, tlak a Archimédův zákon . . . . . . . . . . . . . . . . . . 92 2.6.2 Proudění kapalin . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 2 3 Mechanické kmitání a vlnění 95 3.1 Kmitavý pohyb . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 3.2 Vlnění . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 3.2.1 Popis vlnového pohybu . . . . . . . . . . . . . . . . . . . . . . . . . 97 3.2.2 Interference vlnění . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 3.2.3 Šíření vlnění a Huygensův princip . . . . . . . . . . . . . . . . . . . 104 3.2.4 Odraz a lom vlnění . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 4 Struktura látek a přeměny energie 106 4.1 Základní pojmy kinetické teorie látek . . . . . . . . . . . . . . . . . . . . . 108 4.1.1 Modely struktur látek různého skupenství . . . . . . . . . . . . . . 110 4.1.2 Základní rovnice kinetické teorie plynů . . . . . . . . . . . . . . . . 111 4.2 Základy termodynamiky . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 4.2.1 Vnitřní energie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 4.2.2 První termodynamický princip . . . . . . . . . . . . . . . . . . . . . 113 4.2.3 Teplota . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 4.2.4 Měrná tepelná kapacita . . . . . . . . . . . . . . . . . . . . . . . . . 114 4.2.5 Druhý termodynamický princip . . . . . . . . . . . . . . . . . . . . 115 5 Elektřina a magnetismus 117 5.1 Elektrický náboj a elektrické pole . . . . . . . . . . . . . . . . . . . . . . . 118 5.1.1 Coulombův zákon . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 5.1.2 Intenzita a potenciál . . . . . . . . . . . . . . . . . . . . . . . . . . 119 5.2 Elektrický proud . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 5.3 Magnetické pole . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 5.3.1 Stacionární magnetické pole . . . . . . . . . . . . . . . . . . . . . . 121 5.3.2 Nestacionární magnetické pole . . . . . . . . . . . . . . . . . . . . . 125 5.4 Elektromagnetické pole . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 5.4.1 Spektrum elektromagnetického záření . . . . . . . . . . . . . . . . . 128 5.4.2 Energie a hybnost elektromagnetického pole . . . . . . . . . . . . . 129 5.4.3 Jednota elektromagnetického pole, rychlost světla . . . . . . . . . . 132 6 Optika 134 6.1 Optika a podstata světla . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 6.2 Paprsková optika . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 6.2.1 Optické zobrazování . . . . . . . . . . . . . . . . . . . . . . . . . . 136 6.2.2 Zrcadla . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 6.2.3 Čočky . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 6.3 Vlnová optika . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 6.3.1 Disperze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 6.3.2 Interference světla . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 6.3.3 Difrakce . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 3 7 Fyzika mikrosvěta 147 7.1 Odhalování struktury atomu . . . . . . . . . . . . . . . . . . . . . . . . . . 147 7.2 Kvantová fyzika . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148 7.3 Fyzika elektronového obalu . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 7.4 Jaderná a částicová fyzika . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 4 Předmluva Kurz Úvod do studia fyziky je míněn jako opakování a ucelování nejdůležitějších partií středoškolské látky. Důvodem pro zavedení tohoto kurzu je různá úroveň znalostí, s nimiž na vysokou školu přicházíte. Stěžejním (i když jen stěží zcela realizovatelným) cílem předkládaných skript je tedy přibližné vyrovnání a prohloubení vašich středoškolských znalostí fyziky. Kapitola Úvod do fyziky v krátkosti pojednává o fyzice jako vědě a o fyzikální metodě zkoumání přírody. V nejobsáhlejší kapitole – Mechanice – je výklad veden relativně podrobně. Této části fyziky je věnováno tolik místa, protože tvoří základ nejen k pochopení ostatních partií fyziky, ale též k řešení příkladů tohoto oboru se přímo netýkajících. Další, o poznání stručnější kapitoly jsou věnovány vysvětlení hlavních fyzikálních konceptů a přehledu základních aplikací příslušných fyzikálních oborů. Hned z počátku studia je důležité, abyste se naučili vést své zápisy pečlivě. Při psaní rukou zapisujte vektory pomocí symbolů s šipkou. Takto jsou označovány vektory i v tomto úvodním textu. V literatuře se běžně setkáte se značením vektorů tučným písmem. Také je nanejvýš vhodné naučit se řádně zapisovat jednotlivá písmena řecké alfabety, protože pouhých 26 znaků standardní mezinárodně uznávané latinské abecedy nestačí zdaleka pokrýt nároky fyzikální komunity. V textu je zavedeno trojí značení rovnosti: Definiční rovnítko def = je uváděno při definici fyzikálních veličin, například Ek def = (1/2)mv2 . Je-li již tato veličina zavedena, je vždy označení z jedné strany této rovnosti synonymem pro její druhou stranu – jde o naprosto ekvivalentní způsoby vyjádření téhož – je tedy nadále užíváno rovnítko identity Ek ≡ (1/2)mv2 . Toto rovnítko je užíváno i v případech, kdy chceme zestručnit delší výraz, tj. například ∆t ≡ tf − ti, ale nejedná se o definici nové veličiny. Ve skriptu je často studováno těleso, které se posune z nějaké počáteční polohy do polohy konečné. Veličiny sdružené s počáteční polohou pak obvykle indexuji písmenkem i (z anglického initial) a veličiny sdružené s polohou konečnou indexuji písmenkem f (z anglického final). Oproti zvyklostem ze střední školy v textu označuji tíhovou sílu znakem −→ Fg a gravitační sílu znakem −→ FG. Tento zápis se mi zdá logičtější, protože v prvním případě platí Fg = mg a ve druhém FG = GMm/r2 , kde písmenem G je mezinárodně označena gravitační konstanta, ve středoškolské fyzice obvykle značená κ. Závěrem bych se chtěl zmínit o nezastupitelné roli řešení problémů (počítání příkladů), protože sebelepší znalost teorie vám nebude nic platná, nebudete-li ji umět aplikovat. Doporučuji, abyste se o svém umění řešení úloh dozvěděli z útlé sbírky [1]. Pěkná je i vysvětlující sbírka [2] a obdivuhodný soubor kompletně řešených příkladů [3].1 Dobré přehledy středoškolské fyziky je možno najít i v učebnicích [4, 5, 6]. Fyzika je náročný obor. Má-li se dělat na vyšší úrovni, stojí nemalé úsilí nadané 1 Tento soubor stojí za prohlédnutí nejen proto, že vás může naučit způsobu řešení fyzikálních úloh, ale také proto, že vás naučí zápisu postupu řešení. 5 a ohromné úsilí ty ostatní. Tato investice se však bohatě vyplatí — fyzika je totiž krásná. Tuto myšlenku nádherně vystihl jeden z nejvýznamnějších vědců-fyziků 20. století Richard P. Feynman(1918–1988)2 ve svých světoznámých přednáškách [17]: „Chtěl jsem, abyste dokázali ocenit nádheru tohoto světa a dokázali jste se na ni dívat fyzikálním způsobem, neboť jsem přesvědčen, že to patří k hlavní části skutečné kultury dnešní doby. (Někteří přednášející z jiných oborů budou mít pravděpodobně námitky, ale jsem přesvědčen, že se úplně mýlí.) 2 U nás i v zahraničí je Feynman známý i široké veřejnosti, zejména díky svým knihám [13, 14, 15, 16], které rozhodně stojí za přečtení. 6 Kapitola 1 Úvod do studia fyziky 1.1 Co je to věda a postavení fyziky v systému věd Má-li se věda rozvíjet, je nezbytně nutné, abychom si vždy ponechali prostor pro pochybnosti — vědec si nikdy nemůže být jistý, může jen odhadovat, s jakou pravděpodobností je jeho tvrzení pravdivé či nepravdivé. Feynman [18] Ve své knize [7] historik vědy F. W. Westaway o vědeckém způsobu poznávání píše: 1. Pravým badatelem je člověk, který: a) nikdy neříká „vím, že ... , nýbrž říká „myslím, že ... nebo „důkazy jak se zdá nasvědčují tomu, že ... nebo „podobá se pravdě, že ... nebo „je možné, že ... ; b) nikdy neodpírá uznat, že ve skutečnosti nemá to, čemu vlastně nerozumí; c) nikdy se nepokouší vyložit nemožnost; d) nikdy nečiní velekněžská prohlášení; e) nikdy si nelibuje ve fantasii. 2. Příroda ráda šálí lidi tím, že je ponouká k přesvědčení, že každý pojem, který vynajdou, má nezbytně obdobu v přírodě. 3. Nejvyšší poučky vědy jsou vědecké zákony, které jsou zobecněním skutečností, založených na hromadném a přesvědčujícím důkaze. 4. Domněnky, ač jsou pro pokrok nutné, jsou jen zatímní. Mají menší hodnotu než zákony, neboť do jisté míry vznikají pouhou úvahou a jsou tedy subjektivní. 7 5. Věda se zabývá výhradně úsudky o pojmech a nikoli úsudky o citech. Úsudek o citu je nezbytně osobní. Vědecká pravda není soukromou pravdou jednotlivce, nýbrž je objektivní a obecná. Věda o přírodě a světě bez matematiky, aspoň nějaké, je vědou živou toliko na polovic. Ti, kdo volají jen „po romantice vědy a ne po jejích rovnicích , zřejmě si vůbec nemohou uvědomit, co věda skutečně znamená. Přestože je v tomto citátu, jak sám autor dále přiznává, poněkud potlačen význam teorie, odpovídá původnímu chápání slova „věda . Obecněji lze vědu definovat jako oblast činnosti, snažící se o třídění starých poznatků a upírající síly hlavně na vytváření nových poznatků o přírodě, společnosti a myšlení. Zahrnuje však v sobě i všechny podmínky a momenty tohoto vytváření: vědce jako takové, vědecké ústavy, metody vědeckovýzkumné práce, pojmový aparát a systém veškerých existujících poznatků ([19]). Poněkud úžeji definuje vědu Slovník spisovné češtiny [20], v němž je věda „poznávací lidská činnost vytvářející na základě pozorování, experimentování a studia soustavu verifikovatelných, (exaktně) formulovaných znalostí o povaze a zákonitostech jednotlivých oblastí skutečnosti. K tomu je třeba dodat několik vysvětlení. Základním pilířem tzv. exaktní vědy, pod níž spadá i fyzika, je skutečně principiální ověřitelnost (verifikovatelnost) tvrzení, které je proneseno v rámci jednotlivých vědních disciplín. Nicméně v každé vědní disciplíně existují prohlášení, která často přímo ověřit nejdou. Na jejich správnost pak usuzujeme z ověřování jejich důsledků. Věc je však ještě složitější — libovolná ověřitelnost tvrzení v principu znamená, že kdokoli, kdo bude mít vhodné prostředky a podmínky, může tvrzení potvrdit. Jak ale můžeme vědět, že tisíckrát potvrzené prohlášení, nebude tisícím prvým pozorováním nebo experimentem vyvráceno. Příkladem může být věta: „Každý den vyjde Slunce.1 Skutečně, po staletí, generaci za generací, je tento výrok potvrzován. Znamená to však, že Slunce i Země tu budou navěky? Pokud jde o exaktnost formulovaných znalostí, nemůžeme ji chápat jako synonymum pro (absolutní) přesnost, protože ať svá tvrzení formulujete sebepřesněji, vždy se dá nalézt nejednoznačnost nebo slovo, které prostě nelze definovat pomocí slov již definovaných. Samozřejmě, rozlišujeme-li nějaké stupně exaktnosti, vědy se snaží (nebo přinejmenším měly by) o co nejvyšší reálně dosažitelný stupeň. Exaktnost také můžeme chápat v tom smyslu, že vědecká tvrzení jsou v zásadě matematicky postihnutelná (kvantifikovatelná), z tohoto hlediska by však například biologie ještě dlouho (pokud vůbec) vědou nebyla. Vědu tedy nemůžeme redukovat na soubor matematicky formulovaných tvrzení. Fyzika patří mezi tzv. přírodní vědy, což jsou vědy zkoumající přírodu mimo lidské společenství2 — k těmto vědám dále patří například chemie, geologie či biologie (ale třeba matematika nikoli). Fyzika se orientuje na poznávání nejobecnějších zákonitostí pohybu a jeho příčin, a to jak na úrovni makroskopické (což je zhruba od objektů pozorovatelných optickým mikroskopem do kosmických měřítek), tak na úrovni mikroskopické (molekuly, 1 Když je zamračeno, můžeme se dívat radioteleskopem :-) 2 Nikoli však mimo člověka jako organismus či jako živočišný druh. 8 atomy, elementární částice). Dává tak základ pro ostatní přírodní vědy: Například chemie přijímá z pozorování existenci a stabilitu atomů různých prvků a chemickou vazbu, která vysvětluje stabilitu sloučenin tvořených atomy. Stabilita atomu i vazby je však plně vysvětlitelná kvantovou mechanikou, použitou na elektromagnetické síly mezi elektrony a jádry atomů. Rovněž na techniku lze nahlížet jako na praktickou aplikaci převážně fyzikálních poznatků. Fyzikální způsob poznávání se prosazuje i biologii, kde hraniční obor — biofyzika — prožívá v současné době ohromný rozmach (viz [21]). Podle způsobu získávání poznatků bychom mohli fyziku rozdělit na experimentální a teoretickou, v současné době má ovšem velký význam i tzv. počítačová fyzika, která stojí na pomezí (nikoli na okraji) mezi těmito tradičními způsoby výzkumu. Experimentální fyzika se zabývá problematikou navrhování a realizace fyzikálních pokusů a měření — dobrou představu o jejích metodách a výsledcích získáte například pročtením [22], [23] či [24]. Teoretická fyzika se s pomocí matematických metod snaží o formulaci obecných zákonů a principů a z nich deduktivní cestou odvozuje dílčí poznatky. O této části fyziky se můžete více dovědět pročtením a pochopením hezké a obsažné knížky [25], která sice po matematické stránce nevyužívá náročnějšího než středoškolského aparátu, ale rozhodně není triviální. Na závěr stojí za to si přečíst tři odstavce o tom, co znamená vysvětlení ve fyzice, potažmo ve vědě (publikované ve velmi pěkné knížečce [30] od Daniela F. Styera): Vysvětlil jsem pohyb magnetické střelky v magnetickém poli? Vysvětlil jsem povahu magnetického pole? Vůbec ne! Tyto jevy jsem prostě popsal. Někdy může být popis ve vědě vysvětlen s odvoláním na základnější principy. Například jsem mluvil o severním a jižním magnetickém pólu střelky kompasu. Tyto póly mohou ve skutečnosti být vysvětleny pomocí pohybu elektronů v atomech střelky. V jiných případech je však popis jednoduše tou nejzákladnější věcí a nemůže být „vysvětlen něčím jiným. Co je to magnetické pole? Popsal jsem jej v podstatě jako to, „co způsobuje, že se střelce kompasu chce oscilovat. Existují daleko propracovanější a matematičtější popisy magnetického pole, ale žádný není základnější. Věda nemá vysvětlení pro magnetické pole, pouze jej popisuje. Co tedy vlastně znamená ono „vysvětlení ? Řekněme, že se mě zeptáte „Proč včera pršelo? Můžu odpovědět „Protože nás zasáhla studená fronta. Pak se ovšem můžete zeptat „Ale proč nás zasáhla studená fronta? Můžu říci „Protože ji postrčil vzdušný proud. Vy zase: „Ale proč ji sem vzdušný proud postrčil? Já na to: „Protože Slunce zahřálo Bavorsko a tím vychýlilo vzdušný proud. (Každý, kdo vychovával dítě, takové sledy otázek velmi dobře zná.) Vy opět: „Ale proč Slunce zahřívá objekty? A na tomto stupni již skutečně vaší otázku neumím zodpovědět. Vím, že sluneční světlo nese energii a věda umí popsat tento transport energie s vynikající přesností. Ale věda neumí vysvětlit tento transport energie nebo říci proč se tak děje. Tento příběh ilustruje, že „vysvětlení znamená „vysvětlení v pojmech něčeho základnějšího . V jistém bodě jakéhokoliv řetězce otázek sestoupíme k nejzákladnějším představám a zde musíme zastavit. V současnosti se nejhlubší soubor takových představ nazývá „kvantová elektrodynamika a „kvantová chromodynamika , ... Pravděpodobně někdy budeme 9 mít ještě základnější soubor myšlenek, takže otázky „proč týkající se kvantové elektrodynamiky budou zodpovězeny pomocí těchto nových idejí. Nicméně „proč otázky týkající se těchto základnějších idejí stejně zůstanou bez odpovědi! Konečně, na konci každého řetězce otázek, který jde do hloubky našeho poznání věda může dát pouze popis (fakta) a ne vysvětlení (důvody pro tato fakta). 10 Kapitola 2 Mechanika Mechanika je obor fyziky, který se zabývá popisem a zkoumá příčiny tzv. mechanického pohybu . Pod pojmem pohyb si obvykle představíme změnu polohy (možná i velikosti a tvaru) nějakého tělesa v prostoru. Ovšem pojímáno v tom nejobecnějším smyslu je pohyb určen jakoukoli změnou v čase. Objekty (např. hřebík, kus dřeva nebo buňka) mohou měnit i své tepelné, elektrické či magnetické vlastnosti, případně skupenství, chemické složení, biologické vlastnosti apod., to vše obecně považujeme za pohyb. Mechanika se zabývá tou nejjednodušší a nejméně abstraktní formou pohybu — mechanickým pohybem, který spočívá v přemísťování těles nebo jejich částí vzhledem k tělesům okolním. Více si o tom povíme v následujících kapitolách, z nichž v té úvodní se naučíme jak takovýto mechanický pohyb popisovat. 2.1 Popis pohybu — kinematika Kinematika jako fyzikální disciplína se zabývá popisem a zkoumáním mechanických pohybů (dále už jen pohybů) bez ohledu na jejich příčiny. Je podoborem mechaniky. 2.1.1 Hmotný bod Protože úplný popis pohybu reálných těles1 je obvykle značně složitý, zavádíme si různé zjednodušené (a tím zjednodušující) objekty, kterými tato tělesa při popisu reality nahrazujeme. Takovýchto zjednodušení (idealizací) je ve fyzice mnoho — pro fyziku jsou „životně důležité . Nejde však jen o zjednodušení vynucená složitostí úlohy, jde i o to, že mnoho vlastností nehraje ve zkoumané úloze žádnou nebo jen zanedbatelnou roli, proto je zbytečné se jimi zabývat. Při popisu základních mechanických pohybů reálných těles se často ukazuje výhodné abstrahovat od jejich rozměrů, tvaru, složení, struktury a pod. Zavádí se proto pojem 1 Pod pojmem „úplný popis pohybu tělesa máme na mysli, že v každém čase je známa poloha každé části tohoto tělesa. 11 hmotného bodu: Hmotný bod je idealizované těleso, které je plně určeno svou hmotností a svou polohou v prostoru.2 Popis mechanického pohybu reálného tělesa již nelze zjednodušit více než pomocí pojmu hmotný bod. Toto přiblížení zřejmě nemůžeme použít vždy. Například popis valivého pohybu kuličky po nakloněné rovině pomocí pojmu hmotný bod popsat nemůžeme, i kdyby byl poloměr kuličky sebemenší, protože při popisu otáčení tělesa je jeho rozměrovost podstatná. Jsme pak nuceni přistupovat k složitějším idealizacím (např. definujeme tzv. tuhé těleso, u něhož jsou již jeho rozměry důležité, odhlíží se ale od jiných reálných skutečností. S popisem pohybu tuhého tělesa se setkáme v oddíle 2.1.8. Uplatnění pojmu hmotný bod na reálná tělesa zcela relativní, neboť toto zjednodušení je motivováno pouze charakterem fyzikálního problému. Např. studium letu baseballového či golfového míčku může být po odpalu zjednodušeno na studium letu hmotného bodu v tíhovém poli Země, záleží jen na tom, jak moc chceme být přesní. Při větší přesnosti již nemůžeme zanedbat odpor vzduchu. Rovněž popis falše, která při hře hraje nezastupitelnou roli, s přiblížením hmotného bodu nevystačí, a to ani nelze mluvit o tom, jak by se naše idealizace líbila mouše, kterou by míček mohl zasáhnout — hmotný bod by totiž, díky svému nulovému objemu, proletěl moušinými atomy nejspíš zcela nepovšimnut (obr. 2.1 a 2.2). 2.1.2 Vztažné soustavy Pohyb těles popisujeme vždy vůči jinému tělesu, kterému říkáme vztažné těleso.3 Abychom však mohli pohyb popsat matematicky, je nutné se vztažným tělesem spojit soustavu souřadnic a určit si způsob, jakým budeme v této soustavě měřit čas. To nám dovolí číselně (matematicky) vyjadřovat polohy a změny poloh těles nebo částic. Souřadnicovým soustavám spojeným se vztažným tělesem a dohodnutým způsobem určování času říkáme vztažné soustavy. Vztažná soustava se vyznačuje tím, že pomocí ní můžeme (alespoň v principu) matematicky jednoznačně určit polohu a čas každé události ve vesmíru. Tedy ještě jednou: vztažnou soustavou nazýváme vztažné těleso s připojenou soustavou souřadnic a dohodnutým způsobem měření času (obr. 2.3) 2 Samotný pojem „hmotný bod bývá považován za poněkud nešťastný z toho důvodu, že při jediném studovaném ději může mít tentýž objekt sice zanedbatelné rozměry a jeho rozložení hmotnosti může být nepodstatné, ale např. jeho rozložení elektrického náboje bodové vlastnosti vykazovat nemusí (např. molekula vody se v tíhovém poli Země chová prakticky jako bod bez vnitřní struktury, ale zároveň vložená do elektrického pole vykazuje chování dipólové). Proto by se správněji mělo užívat poněkud vhodnějšího (ale bohužel nevžitého) termínu „bodová hmotnost (jako analogie k bodovému náboji). Často se též užívá termínu částice, který v sobě malé rozměry zahrnuje již implicitně a je užíván běžněji. Tento výraz ale trpí stejným neduhem jako výraz „hmotný bod . Navíc, např. Zemi můžeme v jistých případech rovněž uvažovat jako hmotný bod, ale nazvat ji částicí by asi také znělo poněkud neobvykle. Pojem „částice je často užíván i v souvislosti s tzv. elementárními částicemi, ty se ovšem chovají úplně jiným způsobem než jakým se chovají hmotné body v následující části mechaniky (viz též kapitola 7). V tomto textu se tedy budeme v převážné míře (ale ne vždy) držet pojmu „hmotný bod . 3 Za vztažné těleso obvykle uvažujeme tuhé těleso, tj. soustavu částic neměnících vzájemné vzdálenosti (viz kap. 2.1.8). 12 Obrázek 2.1: Hmotný bod Obrázek 2.2: Reálné těleso Vztažné soustavy mohou být různě deformované v prostoru i v čase, mohou se navzájem různě pohybovat a mohou mít i jinak složitou strukturu. Lze je proto třídit (klasifikovat) z různých hledisek — pro náš účel postačí jejich rozlišení z hlediska počtu rozměrů (dimenzí) jejich prostorových souřadnic, přičemž počet dimenzí prostoru je dán nejmenším počtem údajů nutných k jednoznačnému určení polohy místa (bodu) v prostoru. Ve středoškolské fyzice obvykle pracujeme se souřadnicemi: • jednorozměrnými neboli jednodimenzionálními (1D) — v tomto případě k určení polohy jakéhokoliv bodu nacházejícímu se v takovém prostoru postačí jediné číslo. Pomocí jednorozměrné souřadnice můžeme například popsat polohu vlaku pohybujícího se po nerozvětvujících se kolejích. Zvolíme-li si na kolejích nějaký počátek (obvykle značený O), můžeme třeba pomocí krejčovského metru pokládaného podél kolejí určit jeho vzdálenost od vlaku nacházejícím se na kterémkoliv místě na kolejích. Této vzdálenosti přiřadíme znaménko „+ v jednom směru od počátku a znaménko „− ve směru opačném. Takovéto „orientované vzdálenosti budeme říkat (jednorozměrná) souřadnice (obvykle značíme s). Tímto způsobem můžeme pomocí souřadnice určit polohu libovolného hmotného bodu, který se může pohybovat jen dvěma směry (jako například vlak nebo korálek na niti) v každém okamžiku jeho pohybu. Nejjednodušeji se takové souřadnice zavádějí na přímkách (reálná osa), ale jde to i na křivkách.4 Souřadnice však nemusí být jen vzdálenostní (v jednotkách délky) — například na kružnici daného poloměru lze určit polohu jakéhokoliv bodu pomocí úhlu. (viz obr. 2.4). • dvojrozměrnými neboli dvojdimenzionálními (2D) — my budeme pracovat pouze na rovinných plochách. Na nich obvykle zavádíme tzv. kartézské (ortonormální) soustavy souřadnic tak, že zvoleným bodem — počátkem — soustavy 4 Například „nabalením reálné osy. 13 O x y z Obrázek 2.3: Vztažná soustava proložíme dvě navzájem kolmé přímky (ozn. x, y), na kterých zvolíme stejné měřítko (tj. na přímkách jsou stejné jednotky). Souřadnice x, y míst v prostoru pak určují (orientované) vzdálenosti od těchto přímek — x od přímky y a y od přímky x. Uvedené zavedení souřadnic v rovině však není jediné možné. Každé místo v rovině můžeme jednoznačně určit například i pomocí tzv. polárních souřadnic, které s těmi kartézskými souvisejí vztahy (viz obr. 2.5):5 [r, α] → [x, y] ⇒ x = r cos α; y = r sin α (2.1) [x, y] → [r, α] ⇒ r = x2 + y2; tg α = y x (2.2) Souřadnice lze ovšem zavést i na plochách různě zakřivených (viz obr. 2.7)). • trojrozměrnými neboli trojdimenzionálními (3D)6 — nejjednodušší je opět kartézská soustava, jejíž zavedení je obdobné jako ve 2D prostoru: tři stejně oškálované 5 Takovýmto převodním vztahům z jedné souřadnicové soustavy do druhé se říká transformace sou- řadnic. 6 V celém textu budeme trojrozměrným prostorem mít na mysli vždy tzv. eukleidovský prostor, ve kterém platí takové „samozřejmé věci, jako že součet úhlů v každém trojúhelníku je roven π rad, nebo že jedním bodem můžeme k dané přímce vést vždy pouze jednu rovnoběžku. Zdůrazňuji to proto, že i trojrozměrný prostor může být jistým způsobem zakřivený a například uvedené „samozřejmosti v něm nemusí platit — je to podobné jako na plochách na obr. 2.7, ty jsou dvojdimenzionální a zakřivují se do třetí dimenze, trojrozměrný prostor se může zakřivit do čtvrté dimenze (což se samozřejmě představuje neporovnatelně hůře). Teorie relativity nás naučila nahlížet na prostor a čas jako na jediný objekt, tzv. prostoročas, jehož jednota se jeví až při pohybech rychlostmi blížícími se rychlosti světla ve vakuu. Proto je někdy vhodné považovat čas za další rozměr v podstatě ekvivalentní rozměrům prostorovým, říkáme pak, že prostoročas má dimenzi čtyři (3 prostorové rozměry a jeden časový). Teorie relativity rovněž předpokládá zakřivení i tohoto čtyřdimenzionálního prostoročasu. V současné době nejpopulárnější směr teoretické fyziky — teorie superstrun — ukazuje, že prostor, ve kterém žijeme, musí mít více než jen tři 14 I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I IIIIIII I I I IIIIII O O O s s α Obrázek 2.4: Jednodimenzionální souřadnice O B α 1 1 x y x y r Obrázek 2.5: Kartézské souřadnice v rovině a polární souřadnice α r Byy x y xOO Obrázek 2.6: Souřadnice v rovině nemusí být vždy pravoúhlé navzájem kolmé přímky x, y, z se společným počátkem O. Vzhledem k této souřadnicové soustavě je poloha libovolného bodu ve 3D jednoznačně určena uspořádanou trojicí čísel zvaných kartézské souřadnice (viz obr. 2.8). Souřadnice x, y, z libovolného bodu jsou jeho orientovanými vzdálenostmi od rovin yz, zx, xy.7 V celém tomto skriptu budeme jevy popisovat v prostorech s maximální dimenzí tři. Zavedení kartézských souřadnic ve 3D prostoru není opět jediné možné přiřazení souřadnic místům v prostoru. Dalšími často užívanými soustavami jsou prostorové dimenze. Dimenze navíc jsou však svinuté do velmi malých rozměrů, takže je nemůžeme přímo pozorovat (na populární úrovni se s těmito výsledky můžeme setkat např. v [26, 27, 28, 29]. 7 Ještě jednou připomeňme, že termínem „orientovaná vzdálenost bodu např. od roviny xy, máme na mysli vzdálenost branou s kladným znaménkem, nachází-li se bod v poloprostoru určeném rovinou xy a kladnou poloosou z. Znaménko záporné pak přiřazujeme vzdálenosti bodů, které se nacházejí v poloprostoru opačném. 15 B B O O Obrázek 2.7: Dvojdimenzionální souřadnice na zakřivených plochách x y z r R ϕ ϑ z y x Obrázek 2.8: Třídimenzionální souřadnice sférické (kulové) soustavy souřadnic (obr. 2.8) [r; ϑ; ϕ] → [x; y; z ] ⇒ (2.3) ⇒ x = r sin ϑ cos ϕ; y = r sin ϑ sin ϕ; z = r cos ϑ (2.4) [x; y; z ] → [r; ϑ; ϕ] ⇒ (2.5) ⇒ r = x2 + y2 + z2; cos ϑ = z x2 + y2 + z2 ; tg ϕ = y x (2.6) a cylindrické soustavy souřadnic (obr. 2.8) [R; ϕ; z ] → [x; y; z ] ⇒ x = R cos ϕ; y = R sin ϕ; z = z (2.7) [x; y; z ] → [R; ϕ; z ] ⇒ R = x2 + y2; tg ϕ = y x ; z = z (2.8) 16 Od popisu umístění hmotného bodu se však nyní vraťme k popisu pohybu hmotného bodu.8 2.1.3 Kinematika v jedné dimenzi Trajektorie Jistě jste si na nebi už někdy všimli pomalu se rozplývajícího pásu (kondenzovaných vodních par) tvořícího se za letadlem. Tento „záznam přítomnosti letadla v prostoru (i když značně nedokonalý) nás přivádí k důležitému pojmu trajektorie hmotného bodu. Přesně řečeno je trajektorie hmotného bodu množina těch míst v prostoru, ve kterých se bod při svém pohybu nacházel.9 Je to tedy jakási myšlená čára, spojující „místa pobytu hmotného bodu v různých časech. Kdybychom považovali kuličku propisovací tužky za hmotný bod a psali po papíru, mohli bychom napsanou linku považovat za trajektorii kuličky-hmotného bodu vzhledem k papíru. Proč je v předchozí větě uvedeno na první pohled zbytečné slovní spojení „vzhledem k papíru ? Důvod je ten, že tvar trajektorie velmi významně závisí na soustavě, vzhledem k níž pohyb popisujeme, tj. na vztažné soustavě. Příkladem může být popis pohybu čepičky ventilku B (≈ hmotný bod) jedoucího jízdního kola (viz obr. 2.9). S S'' S' Obrázek 2.9: Souřadnicové soustavy a popis pohybu Např. vůči soustavě S spojené se zemí se jeho trajektorie jeví jako křivka zvaná cykloida, vůči soustavě S’, pohybující se s kostrou kola, jako kruh a konečně v soustavě S”, pevně 8 Z hlediska výše uvedeného je hmotný bod vlastně nuladimenzionální objekt. 9 Často se (a to nejen v běžné mluvě) zaměňují pojmy trajektorie a dráha (viz níže). Například se říká, že dráhy planet jsou eliptické. Vzhledem k rezervaci pojmu dráha pro jiné účely, budou v tomto textu tyto dva pojmy důsledně rozlišovány. 17 spojené s pláštěm, je celý ventilek v klidu. Jeho degenerovanou trajektorií je pak bod.10 V tomto smyslu je trajektorie pojmem relativním, tj. závisícím na vztažné soustavě. Z toho ovšem vyplývá, že nejenže musíme vztahovat pohyby těles vždy vzhledem k jiným tělesům, ale také že popis pohybu bude silně záviset na tom, jaká tělesa to budou. B S Obrázek 2.10: Trajektorie ventilku vzhledem k zemi B S' Obrázek 2.11: Trajektorie ventilku vzhledem ke kostře kola S'' B Obrázek 2.12: Trajektorie ventilku vzhledem k plášti Dráha Z čistě finančního hlediska není pro zakoupení jízdenky do vlaku ani tak důležité, kam se chcete dostat, ale především jak daleko to bude. Z hlediska fyzikálního to lze 10 Zkuste si rozmyslet jak by asi vypadala trajektorie ventilku vzhledem k okolo jedoucímu autu, vzhledem pohybujícímu se klokanovi, vůči rotační ose naší planety, vzhledem ke Slunci, ... existuje nekonečné množství možností (z nichž některé jsou nekonečně těžce řešitelné:-)). 18 přeložit tak, že nezáleží na trajektorii, ale na dráze (tím je samozřejmě myšlena dráha jako fyzikální pojem:-)). Dráhu hmotného bodu měřenou v metrech definujeme jako délku příslušné trajektorie hmotného bodu. Tuto definici je ale nutno upřesnit. Považujme trajektorii hmotného bodu za jednodimenzionální prostor a zaveďme na něm souřadnici s (na trajektorii „nabalíme reálnou osu podobně jako na obr. 2.4). Je-li například v čase t0 sekund hmotný bod vzdálen od počátku O s(t0) metrů a v čase t1 sekund je vzdálen s(t1) metrů, říkáme, že urazil dráhu |∆s| = |s(t1) − s(t0)| metrů, ovšem jen za předpokladu, že se bod pohyboval po trajektorii stále stejným směrem. Pokud se měnil směr jeho pohybu (vracení), celkovou dráhu určíme jako součet délek příslušných trajektorií, tj. dle obr. 2.13 |∆scelk| = |s(t1)−s(t0)|+|s(t1)−s(t2)| = |∆s|+|∆s′ |. Takto zavedená dráha je zřejmě vždy kladnou veličinou a s narůstajícím časem může jen růst.11 O s0 ∆s' s1 s2 ∆s Obrázek 2.13: K zavedení pojmu dráha (delší šipka míří v kladném směru) Jak je z předešlého příkladu vidět, při pohybu se hmotný bod nachází v různých okamžicích na místech s různými souřadnicemi, jeho (orientovaná) vzdálenost od počátku se tedy s časem mění, říkáme, že je funkcí času s = s(t). Vyšetříme nyní tuto funkci podrobněji. Dráhová rychlost Vraťme se na chvíli k příkladu s vlakem. Většinou člověku záleží na tom, jak dlouhou cestu bude muset podniknout a je obecně známo, že České dráhy (stejně jako železniční spoje v jiných státech) poskytují dopravu na stejné vzdálenosti v různých časových intervalech. V této souvislosti se mohou objevit výroky typu: „Vlakem Eurocity budeš v Praze rychleji než osobákem. Tím „rychleji se má na mysli, že trasa do Prahy bude zvládnuta v kratším časovém intervalu. Pro přesný popis podobných výroků si nyní zaveďme nový pojem. 11 Často se místo námi zavedeného označení dráhy |∆s| vynechává absolutní hodnota, tj. píše se jen ∆s. Absolutní hodnota nám však má zajistit, aby rozdíl souřadnic polohy hmotného bodu v různých časech bylo vždy kladné číslo, a to i v případě, že se bod pohybuje ve směru opačném než je nárůst souřadnice (tj. nalevo od počátku O v obr. 2.13). 19 Rychlost, o které jsme mluvili v souvislosti s dráhami, nazýváme dráhovou rychlostí, přesněji střední dráhovou rychlostí vd 12 a zavádíme ji jako podíl celkové dráhy |∆scelk|, kterou hmotný bod urazil v nějakém časovém intervalu ti; tf a délky ∆t ≡ tf −ti tohoto intervalu. Matematicky střední dráhovou rychlost pohybu hmotného bodu v uvedeném intervalu zapisujeme jako vd def = |∆scelk| ∆t . (2.9) Pokud by se hmotný bod pohyboval po trajektorii pouze ve směru narůstající souřadnice s, v čase ti by se nacházel v místě o souřadnici s(ti) a v čase tf v místě o souřadnici s(tf ), mohli bychom pro střední dráhovou rychlost v intervalu ti; tf psát vd = s(tf ) − s(ti) tf − ti ≡ ∆s ∆t 13 (2.10) Z uvedeného je vidět, že střední dráhová rychlost číselně udává, kolik metrů urazil hmotný bod za sekundu.14 Vyšší střední dráhová rychlost tedy znamená, že hmotný bod za jednu sekundu v průměru urazí více metrů. Z uvedeného ovšem vyplývá i jednotka střední dráhové rychlosti — m s−1 , tj. metry za sekundu. Střední dráhová rychlost nám ovšem neříká nic podrobného o průběhu celé cesty. Řekněme například, že urazíme dráhu 90 km z Ústí nad Labem do Prahy za jednu hodinu. Střední dráhová rychlost nám pak říká, že kdybychom každou sekundu naší cesty urazili dráhu 25 m, dorazíme za hodinu z Ústí do Prahy. Takový rovnoměrný průběh cesty je však značně nereálný — během cesty musíme několikrát brzdit a opět se rozjíždět a určitě neurazíme každou sekundu stejný počet metrů i přesto, že nám cesta bude trvat stejně dlouho. Střední dráhová rychlost bude v případě, že jedeme naprosto rovnoměrně i v případě, že jedeme naprosto chaoticky úplně stejná, bude-li nám cesta na stejnou vzdálenost trvat stejnou dobu. Ve fyzice a v technice však potřebujeme podrobnější popis průběhu cesty. Abychom tyto podrobnosti byli schopni matematicky postihnout, musíme zkoumat střední dráhové rychlosti i v kratších časových intervalech. Na obr. 2.14 je znázorněna trajektorie hmotného bodu,15 který se pohybuje zleva do- prava.16 Předpokládejme opět, že na ní máme „nabalenou jednodimenzionální souřadnici s, jejíž hodnota vzrůstá ve směru pohybu. Zvolíme-li si libovolný (ale pevný) okamžik ti, 12 Jde trošku o slovní hříčku, ale aby nedošlo k omylu, výslovně upozorněme, že pojem „dráhová rychlost nesouvisí se železnicí, ale s dráhou jako délkou trajektorie. Jak dále uvidíme, ve fyzice se zavádí pojem rychlosti hned na několik způsobů, proto považujeme na tomto místě za nutné je rozlišovat i poněkud nepřirozeně působícími přívlastky. Pokud bude z kontextu jasné o jaký druh rychlosti jde, budeme občas určující přívlastek vynechávat. 13 Asi bychom správně měli u střední rychlosti vyznačovat její závislost na krajních hodnotách časového intervalu ti; tf , takže by bylo vd(ti; tf ) . To by ovšem značně znepřehlednilo zápis, navíc z kontextu by vždy mělo být zřejmé, z jakého intervalu je střední rychlost počítaná. 14 Obecně hovoříme o vzdálenosti za jednotku času. 15 Pozor na zaměňování trajektorie a grafu závislosti dráhy na čase! 16 Abychom úvahu zjednodušili, předpokládáme, že pohyb se děje jen jedním směrem. Můžeme tak rozdíly souřadnic hmotného bodu v jednotlivých časech považovat za dráhu hmotného bodu a nemusíme se starat o absolutní hodnotu. 20 bude se hmotný bod nacházet na místě o souřadnici s(ti). Dále si zvolme nějaký pozdější okamžik t ≡ ti + ∆t17 , v němž se hmotný bod nachází na místě o souřadnici s(t). Zkracujeme-li časový interval, dostáváme postupně posloupnost časů t0 < ... < t′′ < t′ < t a posloupnost odpovídajících poloh s(t0) < ... < s(t′′ ) < s(t′ ) < s(t) (viz obr. 2.14). O s(ti) s(t) s(t') s(t'') Obrázek 2.14: K limitnímu procesu Pro matematický popis změn polohy (dráhové souřadnice) během časového úseku ∆t jsme si zavedli veličinu nazvanou střední dráhová rychlost vd ≡ ∆s /∆t a předpokládáme, že čím menší je časový interval ∆t, tím je popis pohybu jemnější (podrobnější). Uděláme-li tedy posloupnost podílů vyjadřujících střední dráhovou rychlost ve stále se zmenšujícím intervalu s(t) − s(ti) t − ti → s(t′ ) − s(ti) t′ − ti → s(t′′ ) − s(ti) t′′ − ti → s(t′′′ ) − s(ti) t′′′ − ti →??? (2.11) bude nám uvedený podíl stále lépe charakterizovat změnu (dráhové) souřadnice v blízkém okolí vybraného bodu (u nás s(ti)). Z obr. 2.14 vidíme, že při přibližování t k ti se k sobě blíží i příslušné souřadnice s(t) a s(ti), což zapisujeme jako: pro t → t0 se s(t) → s(t0) nebo ekvivalentně — při zmenšování intervalu ∆t nade všechny meze, což zapisujeme ∆t → 0 se stejně tak zmenšuje i uražená dráha ∆s ≡ s(t) − s(t0), tj. ∆s → 0. Pokud se nám čitatel i jmenovatel zlomku zmenšují nade všechny meze, můžeme dalším zjemňováním dostat něco rozumného? Ukazuje se, že ve velké většině v praxi se vyskytujících případů ano. Uvedenou posloupnost lze matematicky dovést až do času, který bude „nekonečně blízký k původnímu času ti a uvedený podíl bude mít přesto (matematicky) dobrý smysl. Takovýto podíl „nekonečně malé změny polohy za „nekonečně krátký čas nazýváme okamžitou dráhovou rychlostí nebo většinou jen dráhovou rychlostí. Slova „nekonečně jsou v uvozovkách proto, že z fyzikálního hlediska (a o to nám jde především) chápeme okamžitou dráhovou rychlost jako podíl s(ti + ∆t) − s(ti) ∆t (2.12) 17 Tj. ∆t > 0. 21 kde ∆t je nějaké dostatečně malé číslo. Přitom pod „dostatečně malým číslem si představujeme toto: Zvolíme-li si předem přesnost, s jakou budeme vyčíslovat podíly (např. na tři platné číslice), přestane se posloupnost čísel (viz 2.11) s(ti + ∆t) − s(ti) ∆t → s(ti + ∆t′ ) − s(ti) ∆t′ → s(ti + ∆t′′ ) − s(ti) ∆t′′ → · · · (2.13) kde 0 < · · · < ∆t′′ < ∆t′ < ∆t, od jistého členu měnit. ∆tk onoho členu a členů stojících za ním, již považujeme za „dostatečně malé . Jak daný proces funguje si doozřejmíme na příkladu. PŘÍKLAD Představme si, že jsme měřením zjistili, že závislost dráhové souřadnice hmotného bodu na čase je dána funkcí s(t) = t2 . To znamená, že v době, kdy se začal měřit čas, se hmotný bod nacházel v počátku, za jednu sekundu se dostal na souřadnici 1 m, v druhé sekundě byl již na čtyřech metrech, ve třetí na devíti atd. Již z názoru je patrné, že rychlost pohybu nezůstává během pohybu konstantní.18 Jaká je okamžitá dráhová rychlost hmotného bodu například v čase ti = 2 s? Zkoumejme podíly typu 2.13 tak, že pro ∆t postupně volíme 1 s; 0, 1 s; 0, 01 s; 0, 001 s; 0, 0001 s, přičemž budeme zaokrouhlovat na 3 platné číslice (výsledky samozřejmě vycházejí v metrech za sekundu): (t0 + ∆t)2 − (t0)2 ∆t → → (2 + 1)2 − 22 1 = 5 1 = 5, 00 → (2 + 0, 1)2 − 22 0, 1 = 0, 441 0, 1 = 4, 41 → (2 + 0, 01)2 − 22 0, 01 = 0, 0401 0, 01 = 4, 01 → (2 + 0, 001)2 − 22 0, 001 = 0, 004001 0, 001 . = 4, 00 → (2 + 0, 0001)2 − 22 0, 0001 = 0, 00040001 0, 0001 . = 4, 00 → · · · (2.14) Z uvedeného je vidět, že za „dostatečně malou časovou změnu můžeme považovat zhruba ∆t = 0, 001. Se zvolenou přesností tedy můžeme tvrdit, že okamžitá dráhová rychlost hmotného bodu, jehož poloha se mění s časem jako s(t) = t2 je ve druhé sekundě rovna 4 m/s. Procesu, jakým při zmenšování ∆t nade všechny meze přechází střední dráhová rychlost na okamžitou dráhovou rychlost (při ∆t → 0 se vd → vd), se říká limitní proces. Takovýto 18 Bod by musel každou sekundu urazit stejný počet metrů. 22 proces „proces přecházení budeme občas ve vztazích připomínat v matematice běžným symbolem lim.19 Budeme tedy psát vd(ti) def = lim ∆t→0 s(ti + ∆t) − s(ti) ∆t (2.15) Pomocí tohoto nového zápisu můžeme zobecnit náš závěr z předchozího příkladu (když za ti dosadíme hodnotu 2): vd(ti) def = lim ∆t→0 s(ti + ∆t) − s(ti) ∆t = lim ∆t→0 (ti + ∆t)2 − t2 i ∆t = = lim ∆t→0 t2 i + 2ti∆t + (∆t)2 − t2 i ∆t = lim ∆t→0 (2ti + ∆t) = 2ti (2.16) V tomto případě nám limitní proces užitý v poslední rovnosti říká, že se zmenšováním ∆t > 0 nade všechny meze, jej můžeme vůči 2t0 zanedbat. Uveďme si ještě pro pořádek několik dalších, ekvivalentních, zápisů definice okamžité dráhové rychlosti v čase ti tak, jak se s nimi můžete setkat v literatuře:20 vd(ti) ≡ lim t→ti s(t) − s(ti) t − ti ≡ lim ∆t→0 s(ti + ∆t) − s(ti) ∆t ≡ lim ∆t→0 ∆s ∆t ≡ ds(ti) dt (2.17) Matematici by toto vyjádření popsali slovy: dráhová rychlost je derivací funkce s(t) (dráhy) podle t (času) v bodě (okamžiku) ti. Fyzikové by tento zápis přečetli nejspíše jako: dráhová rychlost v okamžiku ti nám udává o jakou dráhu by postoupil hmotný bod za jednu sekundu (obecně za jednotku času), kdyby se od okamžiku ti pohyboval nadále rovnoměrně přímočaře. Tato vyjádření a vůbec takovouto názornou intuitivní představu o limitním procesu a derivaci jako podílu dvou prakticky nekonečně malých veličin je dobré si zapamatovat, protože se s ní ještě mnohokrát setkáme. Za jakých okolností podílem dvou, prakticky nekonečně malých, čísel dostaneme nějaké rozumné číslo (v našem případě okamžitou dráhovou rychlost)? Abychom získali přesnou odpověď, museli bychom se ponořit hlouběji do tajů disciplíny zvané matematická analýza. To však na tomto místě dělat nebudeme (jemným úvodem mohou být např. [31, 32, 33].21 Na tomto místě si uveďme ještě jeden jednoduchý a názorný příklad toho, jak si představit, že podílem dvou nekonečně malých čísel může vzniknout „normální číslo. Mějme pravoúhlý trojúhelník (viz obr. 2.15) a zkoumejme tangens úhlu α, který je dán podílem y/x. Zmenšíme-li ho řezem rovnoběžným s osou y, dostaneme nové strany x′ a y′ , jejich podíl však dává stejný tangens úhlu α. Vidíme dokonce, že dalším a dalším dělením trojúhelníku se podíl yj /xj = tg α nemění pro jakkoli vysoké j. To znamená, že přestože x → 0 i y → 0 je jejich podíl stále „rozumné číslo. 19 V matematice má symbol „lim přesně definovaný význam, my ho však v tomto textu budeme užívat pouze intuitivně ve výše naznačeném smyslu. 20 Stále mějme na mysli, že se hmotný bod pohybuje jen v kladném směru nárůstu souřadnice. Kdyby tomu tak nebylo, museli bychom do těchto definic zařadit ještě absolutní hodnoty rozdílu dráhových souřadnic. 21 Pořadí zhruba podle náročnosti. 23 xx y y' y'' x'x'' α y Obrázek 2.15: Podíl nekonečně malých veličin V další části se seznámíme s příbuzností grafů závislosti dráhy na čase a závislosti dráhové rychlosti na čase. Protože pro velmi malý časový interval ∆t přibližně platí (viz rov. 2.17) vd = ∆s ∆t , můžeme po úpravě psát s(ti + ∆t) = s(ti) + vd(ti)∆t. (2.18) Tento vztah nám neříká nic jiného než, že nachází-li se hmotný bod v čase ti na trajektorii ve vzdálenosti s(ti) od počátku O, bude se při rychlosti vd(ti), kterou má v tomto okamžiku, za nepatrnou chvilku ∆t nacházet ve vzdálenosti s(ti + ∆t). Vidíme tak, že čím bude vd větší, tím větší dráhu v intervalu ∆t urazíme. Pokud se vzdálenost od startu nemění, tj. když je funkce s(t) konstantní, je rychlost změny souřadnice nulová.22 Tam kde graf s(t) rovnoměrně stoupá, je rychlost konstantní, protože závislost dráhy na čase můžeme v tomto případě vyjádřit přímkovou závislostí s(t) = kt + b. Je tedy vd(ti) = lim ∆t→0 k(ti + ∆t) + b − (kti − b) ∆t = lim ∆t→0 k = k 22 s(t) = konst. ≡ s0 ⇒ vd(ti) ≡ lim ∆t→0 s(ti + ∆t) − s(ti) ∆t = lim ∆t→0 s0 − s0 ∆t = 0 24 a dráhová rychlost nám tak udává směrnici takové přímky.23 V příkladu u rovnice 2.16 jsme si ukázali, že má-li dráha kvadratickou závislost na čase, je rychlost její změny (tj. dráhová rychlost) v čase lineární. Když se dráha s časem mění nepravidelně, je situace trošku složitější, ale obecně platí: čím je graf závislosti s(t) dráhy na čase strmější, tím větší je i vd(t), naopak při pomalém narůstání nebo dokonce konstantním průběhu (zastavení) s(t), je lim∆t→0 ∆s/∆t a tedy i rychlost malá nebo nulová.24 Lze dokázat, že v grafech závislosti dráhy na čase je dráhová rychlost v libovolném okamžiku ti směrnicí tečny ke grafu funkce s(t) sestrojené v bodě ti (viz obr. 2.16). s si ti t α Obrázek 2.16: Graf závislosti dráhy na čase a jeho souvislost s dráhovou rychlostí tti vd(ti) vd(tf) vd tf Obrázek 2.17: Graf závislosti dráhové rychlosti na čase a jeho souvislost s dráhou (graf neodpovídá grafu 2.16) Vidíme tedy, že z grafu funkce s(t) lze čistě geometrickou cestou odvodit graf funkce vd(t) tak, že každý bod grafu t − vd sestrojíme tak, že změříme v odpovídajícím čase na grafu t − s úhel tečny a osy t, spočítáme jeho tangens a vyneseme do t − vd. Lze to ale udělat i naopak — ze znalosti grafu závislosti dráhové rychlosti na čase můžeme zjistit, jak se mění dráha v závislosti na čase. To například znamená, že kdyby nám v automobilu nefungoval měřič ujetých kilometrů, ale pouze tachometr, jsme schopni ze zaznamenané závislosti vd = vd(t) určit dráhu, kterou jsme urazili. Ukazuje se totiž, že plocha v diagramu t − vd ohraničená osou t, přímkami t = ti a t = tf a křivkou vd(t) (viz obr. 2.17) udává dráhu ∆s = s(tf ) − s(ti), kterou hmotný bod či těleso během doby ∆t = tf − ti urazilo.25 23 Směrnice přímky je rovna tangentě úhlu α, který přímka svírá s osou x (k = tg α). Proto čím větší směrnice, tím strměji přímka stoupá. 24 Pozor, stále pod heslem jednoduchosti zaměňujeme dráhovou souřadnici s(t) a absolutní hodnotu rozdílu souřadnic |∆s(t)| = |s(t) − 0|, tj. dráhu hmotného bodu uraženou od startu. 25 Opět budeme předpokládat takový pohyb, že nemusíme zavádět absolutní hodnotu. 25 Důkaz tohoto tvrzení lze nalézt například ve výše zmiňovaných učebnicích zabývajících se základy matematické analýzy. Zde si uvedeme pouze názornou ukázku. Je-li dráhová rychlost hmotného bodu po dobu jeho pohybu konstantní, tj. je-li vd(t) = konst. ≡ v0, je uražená dráha za dobu ∆t ≡ tf − ti rovna ∆s = v0∆t. Nakreslíme-li v tomto případě graf závislosti rychlosti na čase, dostaneme vodorovnou přímku (viz 2.18). Dráha, kterou hmotný bod projde, se rovná obsahu vyšrafovaného obdélníku, protože se rovná součinu základny tf − ti a výšky v0. vd v0 tf tti Obrázek 2.18: K rovnoměrnému pohybu vd vp vi vf ttfti Obrázek 2.19: K pohybu rovnoměrně zrych- lenému Při obecné závislosti dráhové rychlosti na čase (viz obr. 2.17), můžeme interval ti, tf rozdělit na n podintervalů délky ∆τ ≡ (tf −ti)/n. Pokud bude časový krok ∆τ dostatečně malý (n bude vysoké číslo), můžeme během něj považovat dráhovou rychlost přibližně za konstantní, a pro změnu souřadnice pak bude platit (viz rov. 2.18) ∆si ≡ s(ti + ∆τ) − s(ti) = vdi∆τ (2.19) což je plocha prvního obdélníčku naznačeného na obr. 2.17.26 Uvážíme-li změnu rychlosti po tomto kroku, tj. nyní bude v′ d ≡ vd(t+∆τ), bude dráha ∆s′ uražená v dalším okamžiku ∆τ přibližně dána vztahem ∆s′ ≡ s(ti + 2∆τ) − s(ti + ∆τ) = v′ d∆τ (2.20) Tento vztah zřejmě souhlasí s plochou druhého obdélníčku. Analogicky lze postupovat dále, až obdélníčky pokryjeme celou plochu pod grafem funkce vd(t). Součet těchto obdélníčků, tj. vd∆τ + v′ d∆τ + v′′ d∆τ + · · · (2.21) přibližně dává celkovou dráhu uraženou během intervalu ti; tf . Limitním procesem, kdy ∆τ → 0 (nebo n → ∞), se obsah hranatého útvaru složeného z obdélníčků na obr. 2.17 bude stále více přibližovat skutečné celkové dráze. Je nanejvýš vhodné tomuto postupu porozumět, protože je po celé fyzice hustě roztroušen. 26 vdi ≡ vd(ti) 26 Dráhové zrychlení Při předjíždění aut na silnici není ani tak důležité, jakou maximální rychlost je předjíždějící vůz schopen vyvinout (i když to rovněž o mnohém svědčí), ale spíše za jak krátkou dobu je schopen dosáhnout podstatné změny rychlosti. Pro popis této schopnosti se užívá termínu zrychlení.27 V jednodimenzionálním prostoru definujme tzv. střední dráhové zrychlení v intervalu ti; tf vztahem ad def = vd(tf ) − vd(ti) tf − ti ≡ ∆vd ∆t (2.22) Z této definice je vidět, že hodnota středního dráhového zrychlení udává, o kolik metrů za sekundu muselo těleso průměrně každou sekundu změnit svoji rychlost, aby se z počáteční rychlosti vd(ti) změnila na konečnou rychlost vd(tf ). Jednotkou středního dráhového zrychlení je m s−2 , což obvykle čteme jako metr za sekundu na druhou.28 Pro podrobnější popis změn dráhové rychlosti zavádíme pomocí limitního procesu (zcela v analogii s okamžitou dráhovou rychlostí) veličinu (okamžité) dráhové zrychlení: ad(ti) def = lim t→ti v(t) − v(ti) t − ti ≡ lim ∆t→0 v(ti + ∆t) − v(ti) ∆t ≡ lim ∆t→0 ∆v ∆t ≡ ds dt (ti)29 (2.23) Platí tedy, že pro dostatečně malý časový interval ∆t, přechází střední dráhové zrychlení v tomto intervalu na okamžité dráhové zrychlení, tj. pro ∆t → 0 je ad → ad. Jako ilustraci prozkoumejme pohyb hmotného bodu s lineární závislostí dráhové rychlosti na čase. PŘÍKLAD Nechť tedy platí vd(t) = at, kde a = konst. je zatím neznámá veličina, mající náhodou stejné označení a stejnou jednotku jako zrychlení.30 Jelikož rychlost pohybu hmotného bodu stoupá rovnoměrně od vd(ti) do vd(tf ), pohybuje se v intervalu ti; tf s průměrnou rychlostí vp = (vd(ti) + vd(tf ))/2. Z grafu na obr. 2.19 je zřejmé, že obsah vp∆t obdélníku ohraničeného osou t a přímkami t = ti, t = tf a vp 31 je stejný jako plocha ohraničená osou t a přímkami t = ti, t = tf a vd = at. Protože již víme, že uražené dráze odpovídá obsah plochy pod grafem funkce vd(t), plyne z toho, že za čas ∆t ≡ tf − ti hmotný bod urazí stejnou dráhu ať se pohybuje s rovnoměrně vzrůstající rychlostí od vd(ti) do vd(tf ) či se pohybuje s konstantní rychlostí vp. Dráha hmotného bodu v intervalu ti, tf tedy bude ∆s ≡ s(tf ) − s(ti) = vp∆t = ati + atf 2 ∆t = = a 2 (2ti + tf − ti)∆t = ati∆t + a 2 ∆t∆t = vd(ti)∆t + 1 2 a(∆t)2 (2.24) 27 Zrychlení z nuly na sto je jedním z důležitých parametrů při koupi vozu ;-) 28 Poněkud výstižněji je tato jednotka vyslovována v angličtině, kde v překladu zní „metr za sekundu za sekundu . 29 Říkáme, že zrychlení ad(ti) je derivací (funkce) rychlosti vd(t) v okamžiku ti. 30 Takovému pohybu se obvykle říká „rovnoměrně proměnný . 31 Ověřte, že vp = vd . 27 což je známý vztah pro dráhu rovnoměrně zrychleného pohybu se zrychlením a a počáteční rychlostí vd(ti). Při popisu pohybu v prostorech o více než jednom rozměru se ukazuje jako velmi výhodné, zobrazovat kinematické veličiny pomocí vektorů. Teoreticky bychom mohli zkoumat pouze průměty těchto veličin do jednotlivých souřadnic a přistupovat k nim v zásadě stejně jako jsme to dělali výše. Nicméně užívání vektorového počtu ve fyzice je výhodné proto, že umožňuje zapsat obecné vztahy mezi veličinami nezávisle na souřadnicové soustavě. Vektorový vztah totiž platí jak v kartézských soustavách, tak i třeba v cylindrických. V nejdůležitější rovnici klasické mechaniky, v druhém Newtonově zákoně, hraje významnou roli časová změna rychlosti. Kdybychom ovšem rychlosti přisoudili pouze skalární charakter tak, jako jsme to udělali výše, nepopisoval by Newtonův zákon experimentální výsledky úplně. Připíšeme-li rychlosti nejenom velikost, ale i směr, budou naměřené hodnoty a hodnoty vypočítané z Newtonova zákona úžasným způsobem v souladu.32 Než si budeme moci vektor rychlosti zavést, musíme se nejprve podrobně seznámit s jiným důležitým pojmem — polohový vektor. 2.1.4 Polohový vektor Polohovým vektorem hmotného bodu B v dané vztažné soustavě nazveme vektor, jehož počáteční bod je „ukotven vždy v počátku souřadnicové soustavy a jeho koncový bod spočívá v B (viz obr. 2.20). Jde o příklad tzv. vázaného vektoru. Souřadnice tohoto vektoru jsou číselně rovny souřadnicím určujícím okamžitou polohu hmotného bodu. x y z B[x,y,z] r(x,y,z) Obrázek 2.20: Souřadnice a polohový vektor Proč vůbec zavádíme polohový vektor? Proč nestačí pracovat pouze se souřadnicemi hmotných bodů? Mohlo by se zdát, že je to z důvodu nezávislosti vektorů na souřadnicové 32 Více o tom v odstavci 2.2.2. 28 soustavě, jak jsme o tom hovořili výše. Jenže tato vlastnost platí jen pro tzv. vektory volné, jejichž umístění v prostoru není vázáno na určité místo. Polohový vektor jakožto vektor vázaný na počátek souřadnic samozřejmě na jejich změně závisí. Skutečným důvodem jeho zavedení je, že z hlediska fyziky je velmi významná změna polohového vektoru (protože právě s ní souvisí vektor rychlosti), ta už totiž na vztažné soustavě nezávisí. Polohový vektor rovněž významně zjednodušuje zápisy fyzikálních vztahů. Při popisu pohybu hmotného bodu vůči dané souřadnicové soustavě, se jeho souřadnice mění s časem, a proto je časově závislý i jeho polohový vektor — tuto skutečnost zapisujeme jako −→r = −→r (t). Pro konkrétní představu se podívejme na obr. 2.21. Zde je zobrazena rovinná (2D) kartézská soustava s polohou hmotného bodu B vyznačenou v různých časových okamžicích vzdálených od sebe o jednu sekundu. Souřadnice x i souřadnice y bodu B se s časem mění lineárně (přímo úměrně), a proto můžeme psát x = kxt + bx; y = kyt + by (2.25) kde bj ∈ R jsou posunutí po příslušných osách (absolutní členy) a kj ∈ R jsou směrnice přímky určené parametrickými rovnicemi 2.25,33 tato přímka tvoří trajektorii bodu B v soustavě Oxy. Z následující tabulky (v jednotkách z obr. 2.21) lze dosazením snadno tyto koeficienty vypočíst.34 t(s) x(cm) y(cm) 1 -3 -1 2 1 2 3 5 5 4 9 8 Obecně bychom parametrické rovnice trajektorie ve 2D mohli zapsat takto: x = x(t); y = y(t) (2.26) Pro ilustraci si teď matematicky popíšeme trajektorie ventilku jízdního kola známého ze strany 17 (obr. 2.9) vůči různým vztažným soustavám. PŘÍKLAD Označme r vzdálenost nábů jízdního kola od silnice a d vzdálenost ventilku od nábů. Bude-li se kolo pohybovat rychlostí vd, budou se jeho galusky kolem nábů otáčet s úhlovou 33 Parametrem je zde zřejmě čas t 34 Dosazením minimálně dvou různých časových okamžiků a příslušných souřadnic do obou rovnic a vyřešením soustavy dvou lineárních rovnic pro dvě neznámé. Neparametrickou rovnici trajektorie v soustavě Oxy získáme vyloučením parametru t. Opět získáme lineární rovnici, tentokrát ve tvaru y = kx + b. Vyjádřete z následující tabulky i konstanty k a b a zjistěte jak souvisejí s konstantami ki a bi. 29 y xr(0s) r(1s) r(2s) r(3s) i j Obrázek 2.21: Popis dvojrozměrného pohybu hmotného bodu pomocí vektorů rychlostí ω = v/r (viz odst. 2.1.8). Trajektorie ventilku vůči zemi (soustava S, viz obr. 2.10) pak bude dána vztahy: x(t) = rωt − d sin ωt; y(t) = r − d cos ωt35 (2.27) Pohyb vůči soustavě spojené s kostrou kola (soustava S’, viz obr. 2.11) bude popsán výrazy: x(t) = d sin ωt; y(t) = d cos ωt (2.28) A umístíme-li počátek soustavy souřadnic přímo na galusku (S”), budou rovnice jeho pohybu triviální: x(t) = x0; y(t) = y0 (2.29) Známe-li časové závislosti souřadnic hmotného bodu, je vektorové vyjádření trajektorie jednoduché, stačí totiž zapsat −→r = x(t)ı + y(t) (2.30) kde ı a  jsou tzv. jednotkové vektory (tj. |ı| = || = 1), mířící ve směru souřadnicových os x a y (viz obr. 2.21). Zadáním skalárních funkcí x = x(t) a y = y(t) již tedy máme určen polohový vektor (a tedy i polohu) bodu B v libovolném okamžiku t. Zobecnění na tři rozměry je nasnadě. Ve 3D prostoru můžeme v kartézských souřadnicích polohu vyjádřit obecně takto (viz obr. 2.22): −→r = x(t)ı + y(t) + z(t)k (2.31) 35 Tyto výrazy jsou parametrickým vyjádřením křivky zvané zkrácená cykloida. 30 kde k je jednotkový vektor mířící v kladném směru osy z. r(t-2) r(t-1) r(t0) r(t1) r(t2) i j k x z y B x(t0)i y(t0)j z(t0)k Obrázek 2.22: Popis trojrozměrného pohybu hmotného bodu pomocí vektorů Nyní již umíme vektorově popsat trajektorii ve 3D prostoru pomocí polohového vektoru −→r (t) a je čas se zabývat jeho časovými změnami. 2.1.5 Rychlost hmotného bodu Protože předpokládáme, že již máme změřenu nebo zadánu závislost −→r (t), tj. známe polohu hmotného bodu v každém okamžiku během pohybu (viz obr. 2.22), můžeme vybrat libovolný (ale pevný) okamžik ti a nějaký pozdější okamžik tf s příslušnými polohovými vektory −→r (ti) a −→r (tf ) a zkoumat, jak se bude měnit jejich rozdíl v jednotlivých úsecích trajektorie. K tomuto účelu si nyní definujme tzv. vektor posunutí (viz obr. 2.23) ∆−→r def = −→r (tf ) − −→r (ti) (2.32) Takto definovaný vektor nám umožňuje postihnout časové změny samotného polohového vektoru.36 36 Snadno si můžeme zapamatovat, že díky vektoru posunutí přecházíme z místa −→r (ti) do místa −→r (tf ), tj. že platí −→r (tf ) = −→r (ti) + ∆−→r . O závislosti vektoru posunutí na krajních hodnotách časového intervalu ti; tf platí stejná poznámka jako u definice střední rychlosti (rov. 2.10). 31 Zaveďme si nejprve důležitý pojem tzv. střední rychlosti −→v v časovém intervalu ti; tf , jako rozdílu polohových vektorů v časech ti a tf , dělenému délkou tohoto inter- valu:37 −→v def = −→r (tf ) − −→r (ti) tf − ti ≡ ∆−→r ∆t . (2.33) Tato definice nám říká, že střední rychlost je vektorová veličina, která dovoluje porovnávat změny polohových vektorů ve stejném časovém intervalu (tj. za stejnou časovou jednotku) a má stejný směr jako vektor posunutí38 Nebudeme již opakovat celou diskusi, kterou jsme dělali u střední dráhové rychlosti, jen uveďme, že střední rychlost v časovém intervalu ti; tf nám říká, že kdybychom se pohybovali z místa určeného polohovým vektorem −→r (ti) ve směru vektoru −→ v a každou sekundu urazili vzdálenost číselně rovnou | −→v | metrů, dospěli bychom za dobu ∆t ≡ tf − ti do bodu −→r (tf ). Z definice 2.33 totiž vyplývá, že −→r (tf ) = −→r (ti) + −→v ∆t. Ze zavádění okamžité dráhové rychlosti již můžeme zhruba tušit, jakým způsobem je možné definovat vektor rychlosti nezávislý na délce časového intervalu. Takováto rychlost bude udávat změnu polohy lokálně, tj. v jednom časovém okamžiku v daném bodě prostoru. Podívejme se nejprve, jak můžeme studovat lokální změny polohového vektoru kolem okamžiku ti. r(ti) r(tf) r(tf') ∆r ∆r' Obrázek 2.23: K vektoru posunutí Při zkoumání změn polohového vektoru středu míče z obr. 2.23 vidíme, že pro posloupnost časových okamžiků tf > t′ f > t′′ f > · · · > t (k) f > · · · > ti se bude pro vzrůstající k vektor posunutí ∆−→r (k) ≡ −→r (t (k) f ) − −→r (ti) stále lépe přimykat k trajektorii míče. Proces „blížení se můžeme opět teoreticky dovést do extrému a uvažovat o časech nekonečně blízkých k času ti. Intuitivně je zřejmé, že přestože má vektor posunutí v těchto časech 37 Sledujme zároveň úzkou analogii se střední dráhovou rychlostí. 38 A stejně jako on závisí na počátečním a koncovém okamžiku. 32 téměř nulovou velikost (tj. |∆−→r | → 0), stále přesněji míří ve směru tečny k trajektorii v bodě −→r (ti). Sledujme opět posloupnost podílů ∆−→r ∆t → ∆−→r ′ ∆t′ → ∆−→r ′′ ∆t′′ → · · · ∆−→r (k) ∆t(k) → · · · (2.34) kde ∆t(k) ≡ t (k) f − ti. Pokud se uvedený podíl přestane měnit, docházíme k definici (okamžité) rychlosti −→v (ti) — při zkracování časového intervalu tedy přechází střední rychlost v rychlost okamžitou, tj. pro ∆t → 0 platí −→v → −→v . Formálně pak vektor okamžité rychlosti hmotného bodu v čase ti definujeme zápisem −→v (ti) def = lim tf →ti −→r (tf ) − −→r (ti) tf − ti ≡ lim ∆t→0 −→r (ti + ∆t) − −→r (ti) ∆t ≡ lim ∆t→0 ∆−→r ∆t ≡ dr dt (ti) (2.35) Matematicky řečeno, rychlost hmotného bodu v okamžiku ti je derivací vektorové funkce −→r (t) podle času v bodě ti. Shrňme k čemu jsme se dobrali: (okamžitá) rychlost hmotného bodu −→v (ti) je vektorová veličina, která charakterizuje časovou změnu polohového vektoru −→r (t) v časovém okamžiku ti.39 Vektor rychlosti −→v (ti) leží ve směru tečny k trajektorii hmotného bodu v bodě −→r (ti) a je orientován ve směru pohybu. Stále při tom platí, že rychlost vyjadřuje změnu polohového vektoru za časovou jednotku, což je nutné chápat tak, že kdyby se hmotný bod od okamžiku ti pohyboval rovnoměrně (což samozřejmě nemusí), urazí každou sekundu |−→v (ti)| metrů. Rychlost jako vektor má tedy dvě kvality — velikost a směr. Mnoho fyzikálních zákonů (např. již zmiňovaný 2. Newtonův zákon) můžeme obecně zapsat ve formě vektorové rovnice mezi různými veličinami — platí tedy nezávisle na volbě vztažné soustavy. Nicméně při konkrétních výpočtech je prakticky vždy nutno vztažnou soustavu zvolit a počítat s průměty vektorů do souřadnicových os, vektorová rovnice nám pak zaručí, že ať si tuto soustavu zvolíme jakkoli, budou nám jednotlivé složky příslušných veličin splňovat formálně stejné vztahy. Vyjádřeme si proto rychlost i v tzv. složkovém tvaru. Pomocí jednotkových vektorů mířících podél kartézských souřadnicových os můžeme psát −→v (t) ≡ vx(t)ı + vy(t) + vz(t)k (2.36) kde vx, vy, a vz jsou průměty vektoru okamžité rychlosti −→v do směrů jednotlivých os. Přitom platí vx(t) = dx(t) dt ; vy(t) = dy(t) dt ; vz(t) = dz(t) dt (2.37) 39 Komu i přes výše uvedené stále připadá limitní proces „blížení se poněkud tajemný, nechť si jako ∆t opět představuje nějaké malinké číslo (≪ 1) a vyzkouší si na konkrétních (skalárních) funkcích, např. f(t) = t3 , jak se chová ”derivační podíl” při jeho zmenšování, tj. (t+∆t)3 −t3 ∆t →? pro ∆t → 0. 33 Toto tvrzení dokážeme z definice. Platí totiž −→r (ti + ∆t) − −→r (ti) ∆t = = x(ti + ∆t)ı + y(ti + ∆t) + z(ti + ∆t)k − x(ti)ı + y(ti) + z(ti)k ∆t = = x(ti + ∆t) − x(ti) ∆t ı + y(ti + ∆t) − y(ti) ∆t  + z(ti + ∆t) − z(ti) ∆t k což pro libovolný okamžik t můžeme přepsat na −→v (t) = vx(t) ı + vy(t)  + vz(t) k V limitě ∆t → 0 pak dostáváme 2.37.40 Nyní je čas na prostudování další velmi důležité vlastnosti vektoru okamžité rychlosti. Je-li poloha hmotného bodu v čase ti určena polohovým vektorem −→r (ti), můžeme pomocí znalosti jeho rychlosti −→v (ti) v tomto čase, určit budoucí polohu hmotného bodu v blízkém okamžiku. Pro velmi krátké časové intervaly ti; tf totiž platí: −→v (ti) = ∆−→r ∆t kde jako obvykle ∆t = tf − ti. Pak ale také platí (viz 2.18): −→r (tf ) = −→r (ti) + −→v (ti)∆t (2.38) Z toho vyplývá, že ze znalosti závislosti −→v (t) a znalosti umístění hmotného bodu na počátku, můžeme krok za krokem zrekonstruovat celou jeho trajektorii. Ukažme si podrobněji příklad toho, jak taková „rekonstrukce probíhá. Celkovou dobu pohybu ti; tf si rozdělme na n intervalů ti ≡ t0; t1 , t1; t2 , t2; t3 , . . . , tn−1; tn ≡ tf stálé délky ∆t ≡ (tf − ti)/n. Opakovaným použitím rovnice 2.38 získáme body, jejichž spojnice se bude blížit skutečné trajektorii tím více, čím kratší časový interval ∆t zvolíme (viz obr. 2.24): −→r (t1) = −→r (t0) + −→v (t0)∆t −→r (t2) = −→r (t1) + −→v (t1)∆t ... −→r (tj) = −→r (tj−1) + −→v (tj−1)∆t (2.39) ... −→r (tn) = −→r (tn−1) + −→v (tn−1)∆t 40 S limitním procesem to není na první pohled tak jednoduché, jak se zdá. To, že intuitivně dokážeme nahlédnout, že si limitní proces nevšímá konstant a že limita součtu je součtem limit není ještě korektní důkaz. Jak již bylo uvedeno, takovéto důkazy se dělají v disciplíně zvané matematická analýza a pro nás je důležité pouze to, že je lze učinit. 34 Všimněte si, že skutečně k plné rekonstrukci trajektorie hmotného bodu nepotřebujeme nic jiného než znalost funkce −→v (t) a „startovací pozici −→r (t0). r(t0) r(tj) r(t1) Obrázek 2.24: Konstrukce trajektorie družice Země — v tomto případě je ∆t zvoleno příliš veliké Ze znalosti −→v (t) můžeme rovněž určit délku trajektorie, tedy dráhu. Budeme-li totiž sčítat velikosti jednotlivých vektorů posunutí určených obecně vztahy ∆−→rj ≡ −→r (tj) − −→r (tj−1), budeme uraženou dráhu aproximovat tím lépe, čím budou vektory ∆−→rj kratší, resp. ∆t menší. Součet |∆−→r1 | + |∆−→r2 | + . . . + |∆−→rn| můžeme vzhledem k platnosti −→v ·−→v = |−→v |2 ≡ v2 , platnosti vztahů 2.40 a vzhledem k volbě ∆t > 0 přepsat na |−→v (t0)∆t| + |−→v (t1)∆t| + ... + |−→v (tn−1)∆t| = = −→v (t0) · −→v (t0)∆t + −→v (t1) · −→v (t1)∆t + ... + −→v (tn−1) · −→v (tn−1)∆t ≡ (2.40) ≡ v(t0)∆t + v(t1)∆t + ... + v(tn−1)∆t Vidíme, že jsme získali podobný součet jako u počítání dráhy ze znalosti dráhové rychlosti (viz 2.21). Kdybychom si nakreslili graf závislosti velikosti rychlosti na čase, podobný např. obr. 2.25, bude součet 2.41 určovat obsah vyšrafované plochy. Zmenšujeme-li ∆t, 35 bude se tento součet stále více blížit obsahu plochy pod grafem (viz obr. 2.26)). Tím se opět dostáváme k souvislosti uražené dráhy a grafu funkce v(t).41 |v| ti tf t Obrázek 2.25: Konstrukce dráhy po kroku ∆t |v| tti tf Obrázek 2.26: Konstrukce dráhy po kroku ∆t′ < ∆t Souvislost mezi dráhovou rychlostí a rychlostí jako vektorem lze ukázat následovně: Z obr. 2.23 je pro velmi malé ∆t vidět, že dráha za tuto dobu uražená má téměř stejnou velikost, jako velikost vektoru posunutí v tomto intervalu, tj. ∆s ≈ |∆−→r |. Pro neomezeně malý časový interval platí přesně vd(ti) def = lim ∆t→0 s(ti + ∆t) − s(ti) ∆t ≡ lim ∆t→0 ∆s ∆t = = lim ∆t→0 |∆−→r | ∆t = | lim ∆t→0 −→r (ti + ∆t) − −→r (ti) ∆t | def = |−→v (ti)| (2.41) Okamžitá dráhová rychlost je tedy rovna velikosti vektoru rychlosti. O středních rychlostech však podobné prohlášení neplatí, protože obecně není s(t+∆t)−s(t) = |−→r (t + ∆t) − −→r (t)|.42 Na samý závěr povídání o rychlosti si pro pořádek uveďme jednotku rychlosti (s jaký- 41 Z měření lze obvykle snadněji určit závislost −→r (t), než závislost −→v (t). Proto by se uvedení postupu konstrukce trajektorie hmotného bodu ze znalosti počátečního polohového vektoru a znalosti funkce −→v (t) mohlo zdát poněkud nadbytečné, nicméně v odstavci 2.2.2 o 2. Newtonově zákoně zjistíme, že je-li dána soustava sil působících na hmotný bod, můžeme určit s jakým zrychlením se tento bod pohybuje (o zrychlení jako vektoru viz dále). Ze zrychlení lze určit rychlost hmotného bodu obdobným způsobem jako z rychlosti závislost jeho polohového vektoru na čase. 42 Zkuste přijít sami na to, za jakých okolností si vd a | −→v | jsou rovny. 36 mikoli přívlastky)43 v soustavě SI — plyne z definice: [v] = m s 2.1.6 Zrychlení hmotného bodu Obdobně jako rychlost, která nám slouží k postižení změn polohového vektoru v časové jednotce, zavádíme další veličinu, která nám „naoplátku umožňuje popsat, jak se za sekundu změní sama rychlost. To znamená, že jakmile se vektor rychlosti jakýmkoli způsobem mění,44 je tato veličina nenulová. Takovou veličinu nazýváme zrychlení a značíme ji −→a . Přestože ohromná důležitost této vektorové veličiny vysvitne až později v souvislosti s 2. Newtonovým zákonem, seznámíme se s ní podrobněji již nyní. S matematickou definicí zrychlení nám pomůže analogie se zavedením vektoru rychlosti. Mějme zadánu, změřenu či z funkce −→r (t) odvozenu vektorovou funkci −→v (t) popisující rychlost pohybu hmotného bodu v každém okamžiku a tedy i místě jeho trajektorie. Nechť v čase ti má hmotný bod rychlost −→v (ti) a v nějakém blízkém pozdějším čase tf ≡ ti + ∆t je jeho rychlost −→v (tf ). Potom změnu rychlosti určíme jako rozdíl obou vektorů:45 ∆−→v def = −→v (tf ) − −→v (ti) (2.42) Sestrojení tohoto vektoru v bodě B je naznačeno na obr. 2.27. Vektor ∆−→v nám určuje jak se změnila rychlost hmotného bodu během časového intervalu ti; tf , platí totiž: −→v (tf ) ≡ −→v (ti) + ∆−→v . Abychom se zbavili závislosti na délce časového intervalu,46 vztáhneme změnu rychlosti opět na časovou jednotku. Pro libovolný časový interval ti; tf pak definujeme vztahem −→a def = −→v (tf ) − −→v (ti) tf − ti ≡ ∆−→v ∆t (2.43) novou fyzikální veličinu zvanou střední zrychlení.. Střední zrychlení nám říká, že když se rychlost −→v (ti) hmotného bodu během každé sekundy od času ti rovnoměrně změní co do velikosti i směru o −→a metrů za sekundu, bude v čase tf mít rychlost −→v (tf ). Je to vidět i z toho, že dle 2.43 platí −→v (tf ) = −→v (ti) + −→a (tf − ti) ≡ −→v (ti) + −→a ∆t Okamžité zrychlení je veličina charakterizující změnu rychlosti hmotného bodu v nekonečně malém časovém intervalu. Matematicky je definována jako derivace vektoru rychlosti 43 V běžném životě (tachometry automobilů, čítače na jízdních kolech a pod.) se obvykle měří („okamžitá ) dráhová rychlost, resp. velikost vektoru rychlosti. Nicméně v každodenní mluvě se o této rychlosti mluví bez přívlastků, říká se jen rychlost. 44 Ať už do velikosti, směru či do obojího. 45 Všimněme si opět závislosti „rozdílového vektoru ∆−→v na krajních bodech intervalu ti; tf a vůbec silné analogie s vektorem posunutí. 46 Nikoli na jeho krajních bodech. 37 B(ti ) B(tf ) vi vf vi ∆v ∆v vf rf ri Obrázek 2.27: Změna vektoru rychlosti podle času, tj. −→a (ti) def = lim tf →ti −→v (tf ) − −→v (ti) tf − ti ≡ lim ∆t→0 −→v (ti + ∆t) − −→v (ti) ∆t ≡ (2.44) ≡ lim ∆t→0 ∆−→v ∆t ≡ d−→v dt (ti) Fyzikálně vysvětleno: kdyby vektor zrychlení zůstal od okamžiku ti konstantní, měnila by se nadále velikost rychlosti pohybu každou sekundu o |−→a (ti)| metrů za sekundu ve směru určeném vektorem −→a (ti). Z obr. 2.27 lze nahlédnout, že změny vektoru rychlosti ve velmi krátkých časových intervalech, a tedy i vektor zrychlení, míří vždy na tu stranu, na kterou se trajektorie zakřivuje. V případě, že velikost rychlosti se postupně zvětšuje, bude vektor zrychlení odkloněn od kolmice k vektoru rychlosti ve směru pohybu. Je zřejmé, že v případě klesající velikosti rychlosti bude −→a odkloněno proti směru pohybu (nakreslete si obrázek). Vektor zrychlení bude kolmý na vektor rychlosti pouze tehdy, když pohyb hmotného bodu bude rovnoměrný, tj. když bude mít konstantní velikost rychlosti.47 Přestože jako obvykle můžeme vektor zrychlení rozložit na součet vektorů vzniklých jeho průmětem do jednotlivých souřadnicových os, tj. −→a = axı + ay + azk bývá občas výhodné rozložit jej poněkud jinak. V každém bodě (rovinné) trajektorie můžeme jednoznačně určit její tečnu a přímku na ni kolmou (normálu) — vektor zrychlení pak rozkládáme do těchto dvou navzájem kolmých směrů (viz obr. 2.28). Složku, která míří ve či proti okamžitému směru pohybu (tj. v tečně k trajektorii) nazýváme zrychlení tečné a značíme jej −→at a složku mířící ve směru kolmém na rychlost v daném bodě, nazýváme 47 Z toho například vyplývá, že projíždíte-li rovnoměrně zatáčku s konstantní rychlostí 30 km.h−1 , jedete z fyzikálního hlediska s nenulovým zrychlením. 38 at an a r v Obrázek 2.28: Konstrukce tečného a normálového zrychlení zrychlení normálové −→an.48 Říkáme, že vektor zrychlení má tečnou a normálovou složku a v každém místě trajektorie platí −→a (t) = −→at (t) + −→an(t) Dá se obecně dokázat, že tečné zrychlení souvisí se změnou velikosti rychlosti a normálové zrychlení se změnou směru rychlosti během časové jednotky. Bude-li se velikost rychlosti zvětšovat nebo zmenšovat, bude |−→at | ≡ at = lim ∆t→0 |v(t + ∆t) − v(t)| ∆t . různé od nuly. Normálové zrychlení bude nenulové vždy, když trajektorie pohybu hmotného bodu nebude přímka nebo její část.49 Výpočtem, který nebudeme dělat, můžeme stanovit velikost normálového zrychlení hmotného bodu pohybujícího se v okamžiku ti rychlostí o velikosti v(ti) po části kružnice o poloměru R: |−→an(ti)| = v2 (ti) R .50 (2.45) 48 Lze ukázat, že skoro každým bodem dostatečně hladké křivky lze proložit kružnici tak, aby ji co nejlépe „kopírovala , její střed leží na kolmici k tečně trajektorie, tj. míří do něj normálový vektor. Této kružnici říkáme oskulační kružnice. Při konstrukci takové kružnice opět hraje roli malinké okolíčko zkoumaného bodu trajektorie. V případě přímky samozřejmě takovou kružnici zavést nemůžeme. 49 Normálové zrychlení je nulové rovněž v místě, kde se zakřivení trajektorie mění z jedné strany na druhou. 50 Normálové zrychlení má toto vyjádření i případě pohybu po obecné křivočaré trajektorii. Potom R je poloměr oskulační kružnice, která v těsném okolí bodu −→r (ti) trajektorii aproximuje. 39 Při zkoumání pohybu v jedné dimenzi jsme k dráhové rychlosti vd přiřadili skalární veličinu (okamžité) dráhové zrychlení ad, které charakterizovalo změnu dráhové rychlosti během jedné sekundy. Podívejme se, jak tento druh zrychlení souvisí s vektorem zrychlení (sledujte analogie se vztahem ∆s = |∆−→r | pro velmi malá ∆t). V odstavci věnovaném rychlosti jsme si ukázali, že je vd = |−→v | ≡ v. Tato rovnost platí v důsledku toho, že vektor změny polohového vektoru (a tedy i rychlost sama) leží v tečně k trajektorii. Proto je i přírůstek dráhy ve velmi malém časovém intervalu stejný jako velikost vektoru posunutí. V případě změn vektoru rychlosti však obecně výsledný vektor −→a směr trajektorie nemá. Dráhové zrychlení ovšem popisuje změny dráhové rychlosti, která je svázána s trajektorií a za žádných okolností nemůže vybočit mimo ni. Obecně totiž vd(ti + ∆t) − vd(ti) = |−→v (ti + ∆t)| − |−→v (ti)| = |−→v (ti + ∆t) − −→v (ti)| Jelikož je ad(ti) def = lim ∆t→0 vd(ti + ∆t) − vd(ti) ∆t a zároveň |−→at (ti)| def = lim ∆t→i |v(ti + ∆t) − v(ti)| ∆t bude také |ad(ti)| = |−→at (ti)|. Absolutní hodnota dráhového zrychlení je tedy obecně rovna velikosti vektoru tečného zrychlení.51 Pro úplnost ještě uveďme jednotku zrychlení s jakýmkoliv přívlastkem — v soustavě SI má díky své definici vyjádření [a] = m/s2 . Protože změny zrychlení se ve fyzice příliš nestudují, budou k popisu mechanického pohybu stačit pouze veličiny −→r , −→v a −→a . Podívejme se nyní z hlediska toho co jsme se dosud naučili, jak lze mechanické pohyby třídit. 2.1.7 Speciální druhy pohybů Rovnoměrný pohyb Má-li hmotný bod v každém bodě trajektorie zrychlení −→a = −→ 0 , nazýváme jeho pohyb pohybem rovnoměrným přímočarým. Důvod takového názvu je tento: je-li při pohybu hmotného bodu jeho zrychlení v libovolném čase nulové, je během celého pohybu nulová i změna jeho rychlosti, to ale nelze splnit pro každý okamžik jinak než konstantní rychlostí, tj. je −→v = −→v0 .52 Ovšem z toho, že se nemění rychlost pohybu ani co do velikosti (pohybuje se rovnoměrně) ani co do směru (pohybuje se po přímce), plyne oprávněnost označení tohoto druhu pohybu. 51 Zkuste sami nalézt podmínky platnosti vztahu ad = |−→a |. 52 Index „ 0 zdůrazňuje (a nadále bude), že jím označená veličina je na čase nezávislá, tj. během pohybu se nemění. 40 Při pohybu s nulovým zrychlením v jednom rozměru (ad = 0) bude ze stejného důvodu dráhová rychlost konstantní (vd = v0). Pro dráhu ∆s hmotného bodu pohybujícího se po dobu ∆t rovnoměrným přímočarým pohybem tedy platí vztah53 ∆s = v0∆t Nacházel-li se hmotný bod v okamžiku startu (t = 0 s) v místě s jednodimenzionální (dráhovou) souřadnicí si ≡ s(0), můžeme psát: s(t) = s(0) + v0t Přechod do třírozměrného prostoru je naprosto analogický. Je-li totiž −→a = −→ 0 , platí pro polohový vektor obecně rovnice (dokažte si podrobně sami) −→r (t) = −→r (0) + −→v0 t (2.46) kde −→r (0) ≡ −→r (t = 0 s). Tuto rovnici lze v libovolné 3D kartézské soustavě souřadnic přepsat na soustavu rovnic x(t) = x(0) + vx0t y(t) = y(0) + vy0t (2.47) z(t) = z(0) + vz0t kde −→r (0) = x(0)ı + y(0) + z(0)k a −→v0 = vx0ı + vy0 + vz0k 54 Díky vektorovému tvaru rovnice 2.46, budou mít rovnice 2.48 stejný tvar v různých (kartézských) souřadnicových soustavách (jde o průměty těchže vektorů): x′ (t) = x′ (0) + v′ x0t y′ (t) = y′ (0) + v′ y0t z′ (t) = z′ (0) + v′ z0t kde nyní je −→r (0) = x′ (0)ı′ + y′ (0)′ + z′ (0)k′ a −→v0 = v′ x0ı′ + v′ y0′ + v′ z0k′ Jak si ukážeme na následujícím příkladu, vhodnost volby soustavy souřadnic však může mít značný vliv na zjednodušení úlohy. 53 V definici dráhové rychlosti 2.17 se se zmenšujícím se ∆t podíly nemění, tj. rovnost vd = ∆s/∆t platí pro jakékoli ∆t. 54 Pozor, na rozdíl od dráhy a dráhové rychlosti, mohou mít průměty do souřadnicových os i zápornou hodnotu! 41 PŘÍKLAD Podívejme na rovnoměrný 2D pohyb hmotného bodu znázorněný na obrázku 2.21. Závislost průmětů polohového vektoru do souřadnicových os x a y na čase je dána vztahy x(t) = −5 + 4t y(t) = −1 + 3t Pokud však počátek soustavy souřadnic posuneme do místa −→r (0), tj. do místa o souřadnicích [−5; −1] a celou ji pootočíme tak, aby nová souřadnicová osa x’ mířila ve směru vektoru rychlosti, bude vyjádření průmětů polohového vektoru jednodušší:55 x(t) = 5t y(t) = 0 Pohyb rovnoměrně proměnný Je-li po celou dobu pohybu hmotného bodu nulová normálová složka zrychlení (−→an = −→ 0 ), nazýváme jeho pohyb pohybem přímočarým, protože rychlost nemění svůj směr. Jeli navíc tečná složka zrychlení nenulová a konstantní, tj. je-li |−→at | = ad0 = 0, nazýváme pohyb přímočarý rovnoměrně zrychlený nebo přímočarý rovnoměrně zpomalený v závislosti na tom, jestli tečné zrychlení míří ve směru pohybu (−→at ↑↑ −→v ) nebo proti směru pohybu (−→at ↑↓ −→v ). V případě, že neklademe na normálové zrychlení žádnou podmínku, ale tečné zrychlení zůstává během pohybu konstantní, pohyb už nebude obecně přímočarý, ale stále bude rovnoměrně zrychlený nebo zpomalený. Takovéto druhy pohybu nazýváme rovnoměrně proměnné. Vztah pro rychlost rovnoměrně zrychleného či rovnoměrně zpomaleného pohybu odvodíme snadno, uvědomíme-li si, že velikost tečného zrychlení je rovna absolutní hodnotě dráhového zrychlení.56 Protože dráhové zrychlení má stejný vztah k dráhové rychlosti jako má dráhová rychlost k dráze, bude změna dráhové rychlosti ∆v = ad0∆t (2.48) Je-li v čase t = 0 s počáteční velikost rychlosti |−→v (0)| ≡ vd(0), bude v čase t dráhová rychlost (najděte následující rovnost v grafu závislosti ad na čase) vd(t) = vd(0) + ad0t 57 (2.49) 55 Otáčíme o arctg 3 4 , proč? Jaká je směrnice vektoru rychlosti? 56 Na rozdíl od dráhy či dráhové rychlosti, nemusí být dráhové zrychlení nezáporné. 57 Protože ve smyslu předchozí poznámky je vždy vd > 0, ale ad0 může být i záporné, platí uvedená rovnice pouze pro časy, ve kterých je vd(0) > ad0t. 42 Z výše uvedených vztahů lze nahlédnout (a lze i korektně matematickou cestou dokázat), že vektorové vyjádření rychlosti přímočarého rovnoměrně zrychleného či zpomaleného pohybu (−→a = −→at = −→a0) můžeme psát ve tvaru −→v (t) = −→v (0) + −→a0t Tuto vektorovou rovnici opět můžeme rozepsat v nějaké soustavě souřadnic pomocí složkového vyjádření vektorů −→v (t) = vx(t)ı + vy(t) + vz(t)k −→v (0) = vx(0)ı + vy(0) + vz(0)k −→a0 = ax0ı + ay0 + az0k na rovnice58 vx(t) = vx(0) + ax0t vy(t) = vy(0) + ay0t vz(t) = vz(0) + az0t Na straně 27 jsme odvodili vztah 2.24 pro dráhu rovnoměrně zrychleného pohybu ∆s ≡ s(ti + ∆t) − s(ti) = vd(ti)∆t + 1 2 ad(∆t)2 který v případě, že počátek pohybu klademe do času ti = 0 s a uvážením ∆t ≡ tf − ti = t − 0 = t, můžeme přepsat na známější s(t) = s(0) + vd(0)t + 1 2 adt2 resp. vzhledem k poslední poznámce na s(t) = s(0) + vd(0)t ± 1 2 |−→at0| t2 ≡ s(0) + vd(0)t ± 1 2 at0t2 Obecně lze dokázat, že polohový vektor hmotného bodu při jeho pohybu s konstantním zrychlením −→a = −→a0 splňuje zcela analogický vztah −→r (t) = −→r (0) + −→v (0)t + 1 2 −→a0t2 (2.50) 58 Ještě jednou upozorňuji, že průměty polohového vektoru a vektoru rychlosti mohou být, na rozdíl od jejich dráhových ekvivalentů, i záporné. Mezi dráhovým zrychlením a velikostí tečného zrychlení platí vztahy: ad = |−→at | pro −→v ↑↑ −→at a ad = − |−→at | ro −→v ↑↓ −→at . 43 Po promítnutí do os 3D kartézské soustavy platí pro příslušné souřadnice (průměty) při zřejmém značení vztahy x(t) = x(0) + vx(0)t + 1 2 ax0t2 y(t) = y(0) + vy(0)t + 1 2 ay0t2 z(t) = z(0) + vz(0)t + 1 2 az0t2 Práci s těmito rovnicemi si ilustrujme na vodorovném vrhu tělesa, nacházejícího se pod vlivem tíhových sil Země (se silami se podrobněji seznámíme v kapitole o dynamice pohybu). PŘÍKLAD Z věže vysoké 25 m byl vodorovným směrem vržen kámen rychlostí o velikosti 15 m s−1 . Určete: • Jak dlouho kámen poletí? • V jaké vzdálenosti od věže dopadne na zem? • Jaký úhel svírá vektor rychlosti kamene s vodorovnou rovinou v okamžiku dopadu? Odpor vzduchu neuvažujte. Označme si nejprve veličiny, které známe: • h ... výška věže • v(0) ... počáteční velikost rychlosti a veličiny, které pomocí nich máme zjistit: • tdop ... doba letu kamene • l ... vzdálenost místa dopadu kamene od paty věže • α ... úhel, který svírá vektor rychlosti v okamžiku dopadu −→v (tdop) ≡ −−→vdop s vodorovným zemským povrchem Kámen můžeme považovat za hmotný bod pohybující se ve vakuu s konstantním zrychlením (ozn. −→a0 = −→g ).59 Pro polohový vektor a rychlost kamene tedy budou platit obecné 59 Z experimentů plyne, že všechna tělesa v blízkosti zemského povrchu by umístěná do vakua padala (v daném místě) se stejným zrychlením (ozn. −→g ) kolmo na vodorovnou plochu. Velikost tohoto zrychlení se v závislosti na zeměpisných souřadnicích liší, proto se zavádí tzv. normální tíhové zrychlení o velikosti gN = 9, 806 65 m.s−2 . Není-li však uvedeno jinak, počítá se v rámci školských příkladů obvykle se zaokrouhlenou hodnotou, tj. g ≈ 10 m s−2 či o něco přesněji g ≈ 9, 8 m s−2 . 44 vektorové rovnice 2.50 a 2.1.7. Vhodnou volbou vztažné soustavy, tj. vhodným výběrem počátku odečítání času, počátku soustavy souřadnic a směru souřadnicových os můžeme projekce těchto rovnic zjednodušit. Protože se pohyb kamene děje v rovině určené vektory −→v (0) a −→g , proložíme touto rovinou i 2D souřadnicovou soustavu (zavedení třetí souřadnice je tedy nadbytečné) a její počátek umístíme na zem k patě věže — viz obr. 2.29. Pokud zvolíme i počátek měření času od okamžiku vrhu, budou hodnoty souřadnice a rychlosti v čase t = 0 s dány −→r (0) = h a −→v (0) = v(0)ı. Vektor tíhového zrychlení má vyjádření −→g = −g. v(0) h l v(tdop) a Obrázek 2.29: K vodorovnému vrhu V projekci do souřadnicových os tedy dostaneme x(t) = v(0)t y(t) = h − 1 2 gt2 vx(t) = v(0) vy(t) = −gt Tyto rovnice popisují x-ové a y-ové souřadnice polohy a rychlosti vrženého kamene v závislosti na čase až do okamžiku dopadu na zem. Všimněme si, že x-ová souřadnice rychlosti se po celou dobu pohybu nemění, tj. kdybychom studovali pohyb kamene pouze v průmětu na osu x, jeho pohyb by se nám jevil jako rovnoměrný. Zrychlení nastává pouze ve směru osy y, kde je kámen urychlován proti její orientaci (proto znaménko −). V okamžiku dopadu bude platit x(tdop) ≡ l = v(0)tdop y(tdop) = 0 = h − 1 2 gt2 vx(tdop) = v(0) vy(tdop) = −gtdop Ze znalosti y-ové souřadnice polohy v okamžiku dopadu, můžeme vyjádřit dobu letu — tdop = 2h/g. Díky této znalosti již snadno získáme další příslušné souřadnice: xdop = v(0) 2h/g a vy(tdop) = − 2hg 45 přičemž platí tg α = vy(tdop) vx(tdop) = − √ 2hg v(0) Dosazením zadaných hodnot zjistíme, že kámen letěl po dobu tdop = 2, 3 s, dopadl do místa vzdáleného l = 33, 9 m od paty věže a v okamžiku dopadu svírala jeho rychlost s vodorovnou rovinou úhel α = 55, 9◦ . Pohyb po kružnici V případě, že je tečná složka zrychlení pohybu nulová (−→at = −→ 0 ) a velikost normálového zrychlení je konstantní (|−→a | = |−→an| = a0), vykonává se hmotný bod rovnoměrný pohyb po kružnici. Protože je tečné zrychlení nulové, velikost rychlosti se během pohybu nemění (rychlost jako vektor však ano!), tj. |−→v (t)| = v0. Pro velikost normálového zrychlení pak platí (viz vztah 2.45) |−→an| = |−→a | = |−→v |2 R kde R je poloměr kružnice. Vektor zrychlení v tomto případě míří stále do středu (oskulační) kružnice. 2.1.8 Pohyb tuhého tělesa Jak již bylo uvedeno v úvodu k této kapitole, přiblížení hmotného bodu je největším možným zjednodušením popisu pohybu reálných těles. Pro realističtější popis zavádíme pojem tuhého tělesa. Tento pojem vznikl opět idealizací (pevných) reálných těles, a to odmyšlením si jejich deformovatelnosti.60 Ještě než se podíváme na popis nejjednodušších pohybů, které může tuhé těleso vykonávat, musíme si ho korektně nadefinovat: Tuhé těleso je těleso, jehož části mezi sebou za žádných okolností nemění vzájemnou vzdálenost. Kdo si někdy hrál s kovovou mincí na stole, jistě si všiml, jakou rozmanitostí různých pohybů (oproti pohybům hmotného bodu) oplývá. Popis pohybu tuhého tělesa je ve své obecnosti o poznání komplikovanější než popis pohybu hmotného bodu. Čistě matematickou cestou však lze ukázat, že jakkoli komplikovaný pohyb tuhého tělesa je, vždy jej lze složit tak, jakoby těleso vykonávalo dva nezávislé pohyby: pohyb posuvný a pohyb otáčivý (rotační). Zabývejme se jimi proto zvlášť. 60 Každé myslitelné fyzikální těleso musí být deformovatlené, protože opak by odporoval výsledkům speciální teorie relativity a příčinnosti (kauzalitě) událostí. Podle teorie relativity by signál (nebo částice) pohybující se nadsvětelnou rychlostí mohl po odrazu zpět přijít do místa vzniku v době před jeho vysláním! Protože nám připadá tento výsledek absurdní a protože zatím není žádný experimentální důvod výsledkům teorie relativity nevěřit, usuzujeme z toho na neexistenci rychlostí částic či jiných signálů převyšujících rychlost světelnou. V případě existence absolutně tuhé látky bychom z ní například mohli vyrobit tyč dlouhou až na Měsíc a prostým pohybováním nahoru a dolů (např. vyťukáváním Morseovy abecedy) bychom na Měsíc předávali zprávy nekonečnou rychlostí, protože absolutně tuhá tyč by se pohybovala celá najednou. 46 Posuvný pohyb tuhého tělesa O posuvném (translačním) pohybu tuhého tělesa hovoříme tehdy, pokud po celou dobu pohybu má každá jeho část stejnou rychlost −→v . Mají-li však všechny části v každém okamžiku stejnou rychlost, mají i stejná zrychlení −→a . Posuvný pohyb tělesa je pak v každém okamžiku popsán jedinou rychlostí a jediným zrychlením.61 Z toho je zřejmé, že takovýto pohyb můžeme popsat formálně naprosto stejnými vztahy jako pohyb hmotného bodu. Otáčivý pohyb tuhého tělesa Těleso se může otáčet kolem jednoho bodu (srdce zvonu, řadící páka, joystick, ...) nebo kolem přímky (houpačka, dveře, ...). My se budeme zajímat pouze o popis tuhého tělesa otáčejícího se kolem nehybné osy. Pro tento druh pohybu (též rotační pohyb) je charakteristické, že existují body ležící na přímce pevně spojené s tělesem, které jsou (v určité vztažné soustavě) stále v klidu. Této přímce se říká pevná osa otáčení či osa rotace.62 Pro popis otáčivého pohybu je vhodné zavést tzv. úhlové veličiny — úhlovou dráhu, úhlovou rychlost a úhlové zrychlení. Úhlová dráha Protože se části otáčejícího se tuhého tělesa pohybují po kružnicích, jejichž středy leží na ose otáčení a roviny těchto kružnic jsou na ní kolmé, je výhodné volit vztažnou soustavu tak, že osa otáčení bude ležet v jedné ze souřadnicových os (nejčastěji z). Tím i osu otáčení orientujeme (obr. 2.30).63 Při otáčení tuhého tělesa se všechny jeho body (kromě těch na ose) pohybují najednou a urazí stejný úhel za stejný čas. Proto zavádíme místo dráhy, která je pro různé části tělesa v daném časovém intervalu různá, veličinu zvanou úhlová dráha. Zavedeme tzv. úhlovou (1D) souřadnici ϕ ∈ 0; 2π) tak, že její velikost bude udávat velikost úhlu mezi souřadnicovou osou x a přímkou kolmou na osu otáčení a zároveň procházející bodem B tuhého tělesa, jehož souřadnici chceme měřit. Úhlová souřadnice části tuhého tělesa narůstá, když se při pohledu proti směru osy otáčení, těleso pohybuje proti pohybu hodinových ručiček (viz předchozí poznámka). Řekneme, že bod B urazil během doby ∆t ≡ tf − ti úhlovou dráhu ∆ϕ def = ϕ(tf ) − ϕ(ti) právě tehdy, když změnil svou úhlovou souřadnici z ϕ(ti) na ϕ(tf ). Na rozdíl od dráhy samotné, může být úhlová dráha i záporná, a to právě při pohybu v záporném smyslu (směr hodinových ručiček). 61 Polohový vektor má však samozřejmě každá část tělesa jiný. V kapitole věnované hmotnému středu a těžišti tuhého tělesa se dozvíme, jakým způsobem můžeme charakterizovat polohu tuhého tělesa jediným vektorem. 62 Osa otáčení nemusí procházet přímo tělesem, má však vzhledem k němu neproměnnou polohu. 63 Obvykle si nejprve vhodně zvolíme směr otáčení tuhého tělesa, který budeme považovat za kladný. Poté orientujeme osu otáčení (a tím i souřadnicovou osu) tak, aby mířila na tu stranu tělesa, ze které se jeví otáčení tohoto tělesa proti směru otáčení hodinových ručiček (kladný smysl). V tomto smyslu se užívá i pravidlo pravé ruky — stáčejí-li se prsty pravé ruky v kladném smyslu otáčení, ukazuje vztyčený palec orientaci osy rotace. 47 x x y y z z ϕ(ti) ϕ(tf) ∆ϕ Obrázek 2.30: Rotace tuhého tělesa Úhlová dráha se obvykle udává v radiánech a s dráhou ∆s, kterou urazí bod B tělesa nacházející se ve vzdálenosti R od osy otáčení, je spojena vztahem ∆ϕ = ∆s R .64 Úhlová rychlost Ani popis rotačního pohybu se neobejde bez zkoumání časových změn. Známe-li časovou závislost ϕ = ϕ(t), můžeme zavést veličinu zvanou střední úhlová rychlost vztahem: ω def = ϕ(tf ) − ϕ(ti) tf − ti ≡ ∆ϕ ∆t A když opět „půjdeme do extrému , můžeme zavést i (okamžitou) úhlovou rychlost: ω(ti) def = lim tf →ti ϕ(tf ) − ϕ(ti) tf − ti ≡ lim ∆t→0 ϕ(ti + ∆t) − ϕ(ti) ∆t ≡ dϕ dt (ti) Jednotka úhlové rychlosti [ω] = rad.s−1 = s−1 . Souvislost velikosti okamžité rychlosti libovolného bodu B tuhého tělesa s okamžitou úhlovou rychlostí můžeme odvodit takto: |−→v | = vd = ds dt = lim ∆t→0 ∆s ∆t = lim ∆t→0 ∆(Rϕ) ∆t = lim ∆t→0 R ∆ϕ ∆t = Rω 65 (2.51) 64 Z uvedeného vztahu je vidět, že radián je jednotka bezrozměrná. 65 R můžeme vytknout, protože se se změnou úhlové dráhy nemění. 48 Frekvence otáčení f nám říká, kolik otáček vykoná těleso za jednotku času. Součin f∆t pak udává počet otáček za čas ∆t. Označíme-li jako T čas za který těleso vykoná jednu otáčku (2π rad), musí být fT = 1. Vydělíme-li úhlovou frekvenci, která udává o kolik radiánů se těleso za jednotku času otočilo, plným úhlem 2π, zjistíme i počet otáček v časové jednotce, tj. platí ω = 2πf = 2π T Veličinu T nazýváme perioda pohybu. Úhlové zrychlení Obdobně ke zrychlení translačního pohybu, zavádíme tzv. úhlové zrychlení ε, které postihuje změny úhlové rychlosti v čase. Opět nejprve zavádíme tzv. střední úhlové zrychlení v časovém intervalu ti; tf εi def = ω(tf ) − ω(ti) tf − ti ≡ ω(ti + ∆t) − ω(ti) ∆t a následně úhlové zrychlení v jediném okamžiku ti ε(ti) def = lim ∆t→0 ω(ti + ∆t) − ω(ti) ∆t ≡ dω dt (ti) 66 2.2 Pohybové zákony pro hmotný bod V této velmi důležité kapitole se naučíme jak předvídat pohyb — to znamená, že bychom měli na jejím konci umět vypočítat, jak se objekt bude pohybovat, když víme, co na něj působí. V předchozí části jsme si zavedli pro popis pohybu hmotného bodu tři veličiny: polohový vektor, rychlost jako charakteristiku jeho změny v čase a zrychlení jako veličinu popisující změnu této změny. Teoreticky bychom mohli ještě zkoumat časové změny zrychlení (tzv. ryv) a dále změny této veličiny a další změny těchto změn. Experiment však ukazuje, že pro „předvídatelnost pohybu (hmotného bodu) nám stačí pracovat pouze s prvními třemi veličinami. Víme, že ze zadané nebo změřené časové závislosti −→r (t) již můžeme (derivováním) zjistit všechny další kinematické veličiny, které „dokreslují představu pohybu. Když tedy známe polohový vektor, víme i kudy a jak se hmotný bod pohyboval. Obvyklá fyzikální úloha však zní takto: Z toho, že víš jaká a jak tělesa a pole67 na hmotný bod působí, urči kudy a jak se tento bod bude pohybovat. Ke splnění tohoto úkolu si nejprve musíme říci něco o silách. 66 V obecném případě pohyblivé osy otáčení je vhodné zavést úhlovou rychlost a úhlové zrychlení jako vektorové veličiny, přičemž vektor (okamžité) úhlové rychlosti míří vždy ve směru okamžité osy otáční a s okamžitou rychlostí libovolného bodu B tuhého tělesa souvisí vztahem −→v = −→ω ×−→r , kde −→r je polohový vektor bodu B s počátkem na ose otáčení. Úhlové zrychlení je pak definováno přímo pomocí vektoru úhlové rychlosti vztahem −→ε (t) def = d−→ω (t)/dt. 67 Pole prozatím můžeme chápat jako něco, co může ovlivňovat pohyb těles. 49 Síla Pojem síly vznikl kvůli popisu vzájemného působení objektů v přírodě. Experimentálně se zjistilo, že síla má vektorové vlastnosti — např. dvě síly −→ F1, −→ F2 působící na vězeňskou kouli (≈ hmotný bod) B (obr. 2.31) mají na ni stejný pohybový účinek jako jediná síla −→ F , daná jejich vektorovým složením. Síla působící na těleso se projevuje buď změnou jeho pohybového stavu nebo jeho deformací (nejčastěji obojím). Matematické vyjádření sil působících v přírodě bylo nutné nalézt rovněž experimentálně. Ukázalo se, že základní druhy sil působících na hmotné body lze zapsat jako vektorové funkce jeho souřadnic a rychlosti, případně i času. To znamená, že funkce −→ F (−→r , −→v , t) popisuje sílu, která v okamžiku t působí na hmotný bod nacházející se v místě −→r a pohybující se rychlostí −→v . F1 F2 F v v F1 F2 vF Obrázek 2.31: Vektorová podstata síly Koncem 17. století n.l. Angličan Isaac Newton sestavil pravidla (podpořená samozřejmě experimentem), která dovolovala ze znalosti soustavy působících sil předpovídat pohyby hmotných objektů (nejen hmotných bodů). Tato pravidla byla později nazvána Newtonovy zákony. Než si tyto zákony přiblížíme, vyjmenujme několik sil, se kterými se setkáváme nejčastěji. Patrně nejznámější silou působící mezi dvěma tělesy je síla gravitační −→ FG. Její matematické vyjádření tvoří tzv. Newtonův gravitační zákon68 s nímž se podrobněji seznámíme v paragrafu 2.4. Tato síla je vyvolávána jakýmkoliv hmotným objektem ve vesmíru a má pouze přitažlivý charakter. Například každičký atom vašeho těla gravitačně přitahuje každičký atom klokana na druhé straně Zeměkoule a naopak. Další veledůležitou silou je síla tíhová −→ Fg (viz příklad na str. 44). Tento druh síly působí na tělesa v blízkosti zemského povrchu a v malých oblastech (tj. zhruba v objemu 1 km3 ) ji považujeme za konstantní. Tíhová síla je vektorovým součtem gravitační síly buzené Zemí 68 zákon Newtonův gravitační 50 a síly, která vzniká v důsledku otáčení Země kolem své osy.69 Matematicky je tíhová síla působící na těleso o hmotnosti m70 vyjádřena vztahem −→ Fg = m−→g . Rovněž často se vyskytující silou je síla třecí −→ Ft vznikající v místě styku dvou těles, která jsou k sobě přitlačována silou −→ Fn a zároveň jsou buď po sobě přímo posouvána (smykové tření) nebo alespoň existuje složka vnější síly, která se posunutí snaží (klidové tření). Třecí síly míří vždy proti směru pohybu, resp. proti síle, která se snaží těleso rozpohybovat. Jejich velikost je úměrná velikosti přítlačné síly | −→ Fn| ≡ Fn, přičemž koeficient úměrnosti nazýváme součinitel smykového tření (ozn. fs) resp. součinitel klidového tření (ozn. fk), podle toho zda jsou styčné plochy v relativním pohybu nebo ještě ne. fs i fk jsou materiálové konstanty závislé na materiálu z něhož jsou styčné plochy a zajímavé je, že nezávisí na velikosti těchto ploch. Třecí síly působící v klidu jsou vždy tak velké aby právě kompenzovaly tečnou sílu, která se snaží uvést tělesa vůči sobě do pohybu. Součinitel klidového tření fk však udává pouze poměr mezi maximální velikostí klidové třecí síly a silou přítlačnou, tj. fk = Fmax t /Fn. Je-li vnější „pohybová síla větší než Fmax t , začnou se plochy navzájem pohybovat a součinitel tření se sníží (fk > fs), což znamená, že i třecí síla mezi plochami bude za pohybu menší (Ft = fsFn < fkFn). Nakonec budiž zmíněna síla, která má velký význam i v moderní fyzice (i když v poněkud pozměněném smyslu) — síla pružnosti −→ Fp. Na obr. 2.32 leží kvádr na podložce se zanedbatelným třením a působí na něj pružina ve směru osy x. Pokud kvádřík vychýlíme z klidové polohy o vzdálenost ∆x, bude na něj pružina působit vratnou silou přímo úměrnou této vzdálenosti. Pro x-ový průmět síly −→ Fp tak bude platit vztah Fp = −k∆x. Konstanta úměrnosti k se nazývá tuhost pružiny a charakterizuje pružinu co do „odporu k protažení či stlačení. Tím, že je působící síla úměrná prodloužení pružiny, je vhodné pomocí pružin síly měřit — čím větší síla na pružinu působí, tím více se pružina protáhne. Na základě tohoto poznatku jsou konstruovány siloměry.71 Prozatím se má za to, že k vysvětlení všech známých (fyzikálních) procesů ve vesmíru stačí předpokládat existenci několika málo sil, které by navíc mohly mít společný původ. Kromě nám již známé gravitační síly, je to síla elektromagnetická a síly vyskytující se v atomovém jádře, podrobněji o nich bude pojednáno v dalším. Všechny výše uvedené „mechanické síly mají buď gravitační nebo elektromagnetický původ. 2.2.1 První Newtonův zákon Již v úvodních odstavcích jsme si uvedli, že pohyb musíme popisovat vždy vzhledem k nějaké vztažné soustavě. Rovněž bylo ukázáno, že vzhledem k různým soustavám, vypadá 69 Takovéto síle se říká síla odstředivá a bude o ní ještě řeč v části věnované neinerciálním vztažným soustavám. 70 O hmotnosti bude podrobněji pojednáno v dalším. 71 O silách pružnosti si více řekneme v kap. 3.1 věnované kmitání. 51 ∆x Fp Obrázek 2.32: K síle pružnosti popis různě a pohybové zákony i pro jednoduché soustavy sil by tedy mohly být velmi komplikované. Nejjednodušší myslitelný pohyb vzniká, když na částici nepůsobí žádné síly, takové částici pak říkáme volná částice (volný hmotný bod). Mezi všemi vztažnými soustavami existuje třída takových, ve kterých je popis pohybu volné částice nejjednodušší, těmto soustavám říkáme inerciální vztažné soustavy. Inerciální vztažná soustava je taková vztažná soustava, ve které je volný hmotný bod buď v klidu nebo v pohybu rovnoměrném přímočarém, tj. v těchto soustavách má volný hmotný bod konstantní rychlost −→v = −→v0 . Právě tvrzení o existenci takovýchto soustav tvoří obsah tzv. prvního Newtonova (pohybového) zákona, zvaného též zákon setrvačnosti. Ukazuje se, že stačí postulovat existenci jediné inerciální vztažné soustavy a pak každá jiná vztažná soustava, která se vůči ní pohybuje rovnoměrným přímočarým pohybem, je rovněž inerciální. Důvod, proč si existenci těchto soustav musíme zvlášť postulovat je v tom, že ve vesmíru působí vše na vše (zejména díky gravitačním silám). Tyto síly nemůžeme úplně odrušit, proto ani nemůžeme realizovat zcela volnou částici, se kterou bychom pak mohli spojit inerciální vztažnou soustavu. Ve velmi dobrém přiblížení však může být za takovou soustavu považována soustava s počátkem souřadnic v těžišti sluneční soustavy a s osami mířícími ke vzdáleným hvězdám („stálicím ) — heliocentrická soustava. Pro popis pohybů v blízkosti Země bývá obvykle vhodné za inerciální považovat i vztažnou soustavu spojenou s povrchem Země. V této soustavě je vždy přítomná tíhová síla −→ Fg, která způsobuje zrychlení −→g všech jinak volných těles. Při teoretické výstavbě mechaniky si Newton svým prvním zákonem určil, v jakých vztažných soustavách „bude pracovat .72 Pokud nebude řečeno jinak, budeme i my pohyby vztahovat vždy vůči inerciálním soustavám. Proč však je tento Newtonův zákon nazýván také zákonem setrvačnosti? 72 Tento zákon v obvyklé verzi zní: Hmotný bod, na který nepůsobí žádné síly (volný) se nachází buď v klidu, nebo v pohybu rovnoměrném přímočarém, dokud na něj nezačnou působit vnější síly. 52 Setrvačnost a hmotnost Pokud jste někdy manipulovali pojízdným nákupním košíkem, možná jste si všimli, že když je vozík v klidu (na vodorovné podlaze), nedá nám žádnou práci ho v tomto stavu udržet. Roztlačení vozíku však už nějaké úsilí vyžaduje, vozík jakoby se bránil tomu abychom ho roztlačili, a brání se tím více, čím více je naložen. Nemalou sílu rovněž musíme vynaložit i na zastavení nebo změnu směru naloženého vozíku, když už je ale vozík v pohybu (rovnoměrném přímočarém), je námaha spojená s udržením ho v tomto stavu minimální. Na pohled zřejmým zobecněním lze usoudit, že kdyby neexistovalo tření, nemuseli bychom se vozíku vůbec dotýkat, sám by se udržoval v pohybu konstantní rychlostí. Tento fakt je umožněn díky tomu, že na vozík sice působí síly (tíhová a reakce podložky), ale ty se ve svých účincích velmi dobře ruší. Vozík tedy (na dokonale hladké podlaze) můžeme považovat za efektivně volné těleso. Protože povrch Země lze v tomto případě považovat za inerciální vztažnou soustavu, první Newtonův zákon předpovídá, že je i při velmi těžkém nákladu snadné udržovat vozík v pohybu, vozík sám od sebe zůstává ve stavu rovnoměrného přímočarého pohybu.73 Můžeme tedy shrnout: Když si odmyslíme veškeré třecí síly, nebudeme na udržení stálé rychlosti74 muset investovat žádnou sílu, naproti tomu na změnu rychlosti pohybu vozíku jisté námahy bude vždy zapotřebí — zdá se, jakoby tělesa kladla odpor vůči změnám své rychlosti. Tento „odpor těles ke změně své rychlosti nazýváme jejich setrvačností. Setrvačnost je tedy vlastnost těles, která je nutí zůstávat v tom pohybovém stavu (tj. s tou rychlostí), ve kterém právě jsou. Aby fyzika mohla kvantitativně předpovídat výsledky pozorované v přírodě, musí pojmům, se kterými pracuje, přiřazovat číselné hodnoty. Z toho, že do změny směru nebo velikosti rychlosti plně naloženého vozíku je nutno investovat daleko větší úsilí než do stejné operace s košíkem prázdným lze vytušit, že setrvačnost těles kvantifikujeme veličinou, které říkáme hmotnost. Čím má těleso větší hmotnost, tím hůře se mění jeho okamžitá rychlost — tím tedy hůře zastavuje, roztlačuje nebo vychyluje z původního směru pohybu, tj. tím větší má setrvačnost. Až do počátku 20. století se obecně mělo za to, že setrvačnost tělesa, a tedy ani jeho hmotnost jako fyzikální veličina, nezávisí na tom, zkoumáme-li odpor tohoto tělesa k změně rychlosti z 20 m/s na 30 m/s nebo z 50 000 m/s na 50 010 m/. Experimentální i teoretické argumenty proti této myšlence zastřešil Albert Einstein svou speciální teorií relativity (poprvé uveřejněna v roce 1905) — hmotnost (přesněji hybnost) závisí na tom, jak rychle se toto těleso v dané vztažné soustavě pohybuje.75 Je ovšem pravdou, že závislost na rychlosti se začne významně projevovat až při rychlostech blížících se k rychlosti světla 73 Ve skutečnosti byl tento zákon odvozen a zobecněn právě z pozorování podobných jevů. Navíc jej jako první formuloval Galileo Galilei. 74 Rychlost má velikost i směr. 75 Ukázalo se, že platí m = m0/ 1 − v2/c2, kde m0 je hmotnost tělesa měřená v soustavě, ve které je toto těleso v klidu — odpor tělesa vůči změně jeho pohybu, tedy roste s jeho vzrůstající rychlostí. Spočítejte si z tohoto vztahu, o kolik procent se zvětší hmotnost tělesa při vzrůstu jeho rychlosti z 0 km/s na 10 000 km/s a o kolik, když jeho rychlost vzroste z 285 000 km/s na 295 000 km/s. 53 (v → c), proto při rychlostech v ≪ c, o které se nyní budeme zajímat, můžeme považovat hmotnost tělesa za konstantu.76 Zajímavé také je, že hmotnost, kterou jsme si zavedli jako míru setrvačnosti těles, je úměrná i velikosti náboje, který ve svém okolí způsobuje existenci gravitačních sil.77 Nyní jsme již připraveni poznat rovnici, bez níž by se naše civilizace jen těžko mohla vyvinout do dnešní podoby. 2.2.2 Druhý Newtonův zákon Zobecněním experimentů konaných do 17-tého století (zejména G. Galilei) vyplynul důležitý závěr: Působí-li na částici (hmotný bod) o hmotnosti m výslednice sil −→ Fv, bude jeho zrychlení mířit vždy ve směru vektoru −→ Fv a jeho velikost bude přímo úměrná velikosti tohoto vektoru. Konstantou této úměrnosti je hmotnost m, přičemž při stejně působících silách bude mít těleso s větší hmotností menší zrychlení než těleso s hmotností menší. Matematické vyjádření výše uvedeného tvoří obsah tzv. druhého Newtonova zákona (též Newtonova pohybového zákona, nebo i poněkud nevhodně zákona síly): −→a = −→ Fv m (2.52) V tomto textu je to první rovnice, která nevyplývá bezprostředně z definice (fyzikální rovnice) a právě ona dovoluje vypočítat ze známé soustavy sil působících na libovolný hmotný bod (částici) časovou závislost jeho polohy −→r (t) a rychlosti −→v (t). Je to proto jedna z nejdůležitějších rovnic ve fyzice, říká se jí pohybová rovnice nebo přesněji Newtonova pohybová rovnice. Jak již bylo uvedeno — vektorové vyjádření této rovnice je ohromně výhodné, protože platí ve stejném tvaru ve všech myslitelných systémech prostorových souřadnic inerciálních vztažných soustav. Ale pozor, jako všechno co bylo ověřeno experimentem za určitých podmínek, i ona má jen omezenou platnost. Platí v tomto tvaru pouze v inerciálních vztažných soustavách 78 a selhává při rychlostech blížících se rychlosti světla. Její předpovědi jsou navíc mylné i při pohybech v blízkosti velmi hmotných těles (hvězdy a jejich konečná stádia vývoje, zejména neutronové hvězdy a černé díry). Tato pohybová rovnice je rovněž zcela nepoužitelná pro zkoumání pohybů částic s velmi malou hmotností (molekul, atomů, elementárních částic), tj. v mikrosvětě. Tento problém bude diskutován ještě v kap. 7. Než si ukážeme jak v principu z této rovnice získat závislost −→r (t), uveďme si ještě poslední z Newtonových zákonů. 76 Lze ovšem studovat i „klasičtější změny hmotnosti těles, což jsou příklady těles, která se během pohybu dělí na více částí, např. kosmická raketa se spuštěnými reaktivními motory, odpařující se kapka a pod. 77 Na uvedeném experimentálním poznatku je postavena Einsteinova obecná teorie relativity, která setrvačné a gravitační síly popisuje z jednotného hlediska. 78 To, že takové soustavy existují, říká první Newtonův zákon. 54 2.2.3 Třetí Newtonův zákon Ukazuje se, že při vzájemném působení těles se síly objevují vždy v páru. Jednu z těchto sil (je jedno kterou) obvykle nazýváme akce a tu druhou pak reakce. Newton zobecněním experimentálních poznatků dospěl k tomuto zákonu (třetí Newtonův zákon, též zákon akce a reakce): Při vzájemném silovém působení dvou těles, působí jedno těleso na druhé silou −→ F a zároveň druhé na první silou −→ F′ , přitom −→ F′ má stejnou velikost i směr, ale opačnou orientaci než −→ F , tj. platí −→ F′ = − −→ F . Tento zákon se tedy nevztahuje přímo k pohybu, ale charakterizuje obecnou vlastnost sil. Přesto se mu někdy říká třetí pohybový zákon. 2.2.4 Dodatky k Newtonovým zákonům Řešení pohybových rovnic V principu můžeme pohybovou rovnici řešit dvěma způsoby, buď užitím metod matematické analýzy nebo numericky, nejlépe pomocí počítačů, a to podobným postupem jako jsme ze znalosti rychlosti určovali trajektorii pohybu družice na str. 34. Na tomto místě si vyložíme pouze princip numerického řešení pohybové rovnice. Řekněme, že na hmotný bod B o hmotnosti m, procházející určitou oblastí prostoru, působí síly, jejichž výslednici můžeme zapsat jako −→ Fv = −→ Fv(−→rB, −→vB, t) Tento zápis je nutno chápat v následujícím smyslu: Velikost a směr výsledné síly působící na bod B může záviset na poloze bodu B (tj. na −→rB), na jeho rychlosti (tj. na −→vB) a také se obecně může měnit s časem. Hmotný bod však obecně svou polohu i rychlost mění, proto výslednice sil působící v okamžiku t na hmotný bod nacházející se v místě −→r (t) a pohybující se s rychlostí −→v (t) zapisujeme jako −→ Fv(−→r (t), −→v (t), t) (2.53) Newtonova pohybová rovnice −→a (t) = −→ Fv(−→r (t), −→v (t), t)/m nám při znalosti výslednice v každém okamžiku ti pohybu hmotného bodu určuje jeho zrychlení −→a (ti). Známe-li rychlost pohybu v čase ti a pokud zvolíme časový interval ∆t tak krátký, že v něm budeme moci považovat toto zrychlení za konstantní, můžeme z jeho znalosti vypočítat i přibližnou rychlost hmotného bodu v pozdějším okamžiku t = ti + ∆t (viz rovnice 2.1.7): −→v (ti + ∆t) = −→v (ti) + −→a ∆t Předpokládáme-li ale, že hmotný bod v intervalu ti; ti + ∆t má konstantní zrychlení, bude jeho pohyb rovnoměrně zrychlený a pro polohový vektor platí rovnice (viz 2.50) −→r (ti + ∆t) = −→r (ti) + −→v (ti)∆t + 1 2 −→a (ti)∆t2 55 Tímto postupem jsme bychom při znalosti výslednice sil, počáteční polohy −→r (ti) a počáteční rychlosti −→v (ti) zjistili polohu a rychlost hmotného bodu v dalším okamžiku. Nic nám však nebrání „proběhnout celý cyklus znovu. Ze znalosti výslednice sil v okamžiku t ≡ ti + ∆t, tj. ze znalosti −→ Fv(−→r (t), −→v (t), t) můžeme, pomocí Newtonova pohybového zákona, vypočítat zrychlení, rychlost a polohu v dalším, pozdějším čase (pro jednoduchost budeme opět předpokládat, že pohyb bude trvat stejnou kratičkou dobu ∆t), tj. po označení ti + ∆t ≡ ti+1 atd. −→a (ti+1) = −→ Fv(−→r (ti+1), −→v (ti+1), ti+1) m −→v (ti+2) = −→v (ti+1) + −→a (ti+1)∆t −→r (ti+2) = −→r (ti+1) + −→v (ti+1)∆t + 1 2 −→a (ti+1)∆t −→a (ti+2) = −→ Fv(−→r (ti+2), −→v (ti+2), ti+2) m ... Opakovaným použitím těchto rovnic získáme tím přesnější představu o poloze a rychlosti hmotného bodu během jeho pohybu, čím kratší bude doba ∆t. Při limitním přechodu ∆t → 0, budou funkce −→r (t) a −→v (t) odpovídat realitě přesně (v rámci omezení platnosti pohybové rovnice). Matematická analýza umí s limitními procesy nakládat tak, že nepotřebuje vypočítávat funkce −→r (t) a −→v (t) bod po bodu, jako jsme to dělali my, resp. jako to dělá počítač, ale tyto funkce rovnou vyplynou z řešení pohybové rovnice. Stačí určit jen tzv. počáteční podmínky, což nejobvykleji bývají poloha −→r (0) a rychlost −→v (0) v jednom okamžiku (všimněme si, že tyto údaje jsou nutné i pro numerické řešení).79 Důvod proč se „zahazujeme s nepřesným řešením pohybových rovnice krok po kroku je ten, že metody matematické analýzy nejsou všespasitelné a v případě složitějších sil většinou naprosto selhávají. Řešení „krok po kroku lze v principu použít vždy,80 jejími zdokonaleními se zabývá rozsáhlý a stále se mohutně rozrůstající obor zvaný numerická matematika.81 Občas se leze setkat i s opačnou úlohou: Je-li pohyb částice zadán kinematicky, tj. jsou-li zadány funkce −→a (t), −→v (t) nebo −→r (t), chceme z pohybových rovnic vyjádřit, jaká výslednice sil −→ Fv(t) musí na částici působit, aby se mohla určeným způsobem pohybovat. V praxi se výše uvedený obecný postup řešení vektorové rovnice 2.53 musí prakticky vždy promítnout do vhodné souřadnicové soustavy. Tato rovnice pak v obecném l-tém 79 Pohybové rovnice patří do druhu rovnic, ve kterých vystupují limitní změny proměnných — derivace. Takovéto rovnice nazýváme diferenciální. Na rozdíl od rovnic algebraických, jejichž řešením získáváme čísla, je výsledkem řešení diferenciálních rovnic nějaká funkce. 80 Samozřejmě existuje velká řada natolik složitých problémů, že je ani touto metodou nelze vyřešit v reálném čase. 81 Tomuto růstu dává mocné impulzy neustále zrychlující vývoj výpočetní techniky. 56 kroku splňuje ekvivalentní hrozivě vypadající soustava rovnic pro průměty: ax(tl) = Fx(x(tl), y(tl), z(tl), vx(tl), vy(tl), vz(tl), tl) m ay(tl) = Fy(x(tl), y(tl), z(tl), vx(tl), vy(tl), vz(tl), tl) m az(tl) = Fz(x(tl), y(tl), z(tl), vx(tl), vy(tl), vz(tl), tl) m vx(tl+1) = vx(tl) + ax(tl)∆t vy(tl+1) = vy(tl) + ay(tl)∆t vz(tl+1) = vz(tl) + az(tl)∆t x(tl+1) = x(tl) + vx(tl)∆t + 1 2 ax(tl)∆t2 y(tl+1) = y(tl) + vy(tl)∆t + 1 2 ay(tl)∆t2 z(tl+1) = z(tl) + vz(tl)∆t + 1 2 az(tl)∆t2 s počátečními podmínkami x(ti) ≡ x(0); y(ti) ≡ y(0); z(ti) ≡ z(0) vx(ti) ≡ vx(0); vy(ti) ≡ vy(0); vz(ti) ≡ vz(0) PŘÍKLAD Pro ilustraci se nyní pokusme pomocí výše naznačené metody zjistit jak se bude pohybovat matematické kyvadlo při jakékoli počáteční výchylce (viz obr. 2.33). Matematické kyvadlo je kulička o hmotnosti m (hmotný bod), visící ve vakuu v homogenním tíhovém poli na nehmotném a neprotažitelném lanku délky l, zavěšeném v jednom bodě pevného stropu. Síly tření v bodě úchytu se považují za nulové. Pro jednoduchost budeme v dalším předpokládat, že na počátku, který definujeme v čase 0 s neudělíme kuličce žádnou rychlost a že se kyvadlo bude pohybovat v rovině xy. Nejprve musíme zjistit, jaké síly na kyvadlo působí. Zanedbáme-li síly tření v úchytu a odporové síly vzduchu, zbyde nám pouze síla tíhová Fg a síla Ft, kterou nit drží (táhne) kuličku. Newtonovy pohybové rovnice pak jsou max = −Ftx may = −Fty + Fg Z geometrie problému (viz obr. 2.33) vyplývají vztahy: x l = sin ϕ = Ftx Ft a y l = cos ϕ = Fty Ft (2.54) Navíc, protože síla působení lana se v každém okamžiku musí vyrovnávat se složkou tíhové síly do tohoto směru (kulička má od závěsu stále stejnou vzdálenost), bude mezi velikostmi 57 j x Ft y Fg Fty Ftx Obrázek 2.33: K matematickému kyvadlu platit vztah Ft = Fg cos ϕ.82 Nyní jsme již připraveni na numerický způsob řešení pohybové rovnice naznačený výše. Předpokládáme-li, že čas budeme přidávat po malých intervalech ∆t a pustíme-li kuličku s nulovou počáteční rychlostí, můžeme v našem případě psát ax = − xy l2 g ay = − y2 l2 g + g v′ x = vx + ax∆t v′ y = vy + ay∆t x′ = x + vx∆t + 1 2 ax∆t2 y′ = y + vy∆t + 1 2 ay∆t2 přitom čárkou byly označeny veličiny, které se vztahují k času o krok ∆t pozdějšímu. Budeme-li znát délku závěsu l a hodnotu g tíhového zrychlení v daném místě, můžeme při zadání polohy kuličky v jednom, počátečním, okamžiku spočítat hodnoty těchto veličin v dalších okamžicích. Výpočet ještě můžeme zjednodušit a zpřesnit, vezmeme-li v úvahu, že tato soustava vzhledem k platnosti x2 + y2 = l2 závisí efektivně pouze na jedné proměnné (má jeden stupeň volnosti). Celkem tak postup řešení našeho problému bude sestávat z kroků: 82 Je vidět, že zatímco tíhová síla je po celou dobu pohybu konstantní a tedy její průmět do osy y je stále Fg = mg, síla jíž působí na kuličku lanko bude při různých výchylkách ze svislého směru různá. 58 • Zadej hodnoty tíhového zrychlení a délky závěsu: g, l • Zadej velikost časového kroku: ∆t • Zadej počáteční x-ovou souřadnici polohy (výchylku): x0 (ϕ0 = arcsin x/l) • Vypočítej počáteční y-ovou souřadnici polohy pomocí vztahu + l2 − x2 0: y0 • Vypočítej zrychlení v x-ovém směru ze vztahu −(x0y0/l2 )g: ax(0) • Ulož uspořádanou trojici hodnot (t; x; y; vx; ax) → (0; x0; y0; 0; ax(0)). • Vypočítej x-ovou rychlost kuličky v čase 0 + ∆t ze vztahu 0 + ax(0)∆t: v(∆t) • Vypočítej x-ovou polohu kuličky v čase 0 + ∆t ze vztahu x0 + 0∆t + 1 2 ax(0)∆t2 : x(∆t) • Vypočítej y-ovou souřadnici polohy v čase 0 + ∆t pomocí vztahu + l2 − x(∆t)2: y(∆t) • Vypočítej zrychlení v x-ovém směru ze vztahu −(x(∆t)y(∆t)/l2 )g: ax(∆t) • Ulož uspořádanou trojici hodnot (t; x; y; vx; ax) → (∆t; x(∆t); y(∆t); v(∆t); ax(∆t)). • Vypočítej x-ovou rychlost kuličky v čase 2∆t ze vztahu v(∆t) + ax(∆t)∆t: v(2∆t) • Vypočítej x-ovou polohu kuličky v čase 2∆t ze vztahu x(∆t) + v(∆t)dt + 1 2 ax(∆t)∆t2 : x(2∆t) • Pokračuj v podobném duchu, dokud bude potřeba! Z ukládaných informací lze sestavit názorné grafy, které demonstrují pohyb kyvadla. Uvedený model lze relativně snadno zobecňovat např. na nenulové počáteční rychlosti či odporové síly. 59 Mechanický determinizmus a stav fyzikálního systému Z toho, že lze ze znalosti soustavy působících sil a počátečních podmínek odvodit celou trajektorii hmotného bodu (do minulosti i do budoucnosti),83 můžeme udělat dalekosáhlý závěr: Budeme-li znát zákon silového působení mezi všemi částicemi a polohu a rychlost každé částečky ve vesmíru v jednom okamžiku, budeme v principu (při dostatečné výpočetní síle) schopni vypočítat budoucnost i minulost světa. Tento fakt si na přelomu 18. a 19. století mezi jinými uvědomil francouzský matematik, fyzik a astronom Pierre-Simon Laplace, když poněkud neskromně prohlásil: „Dejte mi polohy a rychlosti všech hmotných bodů ve vesmíru a budu vám schopen říci, jak bude svět vypadat zítra. 84 Víra, že svět je vlastně jen mechanickým strojem, ve kterém není místo pro „svobodnou vůli člověka je dnes již do značné míry překonána poznatky moderní fyziky. Mechanický determinismus, podle kterého je vše na světě jednoznačně určeno (determinováno) zákony mechaniky a počátečními podmínkami však sehrál ve vývoji vědeckého pohledu na svět značnou roli. Ve výše uvedeném smyslu určuje poloha −→r a rychlost −→v hmotného bodu v daném okamžiku jeho další „chování a spolu s hmotností jej v daném okamžiku úplně charakterizují. Obvykle říkáme, že hmotný bod se nachází ve stavu s určitou polohou a rychlostí.85 Mechanický determinismus tedy prohlašuje, že kdybychom byli schopni přesně poznat stav vesmíru v daném okamžiku, mohli bychom v principu řešením Newtonovy pohybové rovnice předpovídat budoucnost a úplně poznat minulost světa.86 Mimochodem, absolutně přesné určení stavu je z hlediska vždy přítomných chyb a nepřesností měření nereálné. Navíc rovnice popisující mechanické chování mohou být na určení přesnosti počátečního stavu velmi citlivé — i malé nepřesnosti mohou znamenat naprosto odlišný vývoj systémů. O souvislosti této problematiky s tzv. chaosem se můžete na populární úrovni dočíst například v [34] nebo v [35]. Na úrovni molekul, atomů a atomových jader s výše naznačeným stylem popisu nepochodíme — v naprosté většině případů nedokážeme vymyslet klasicky popsatelné modely jevů pozorovaných v mikrosvětě. Pro popis pohybu miroobjektů se ve dvacátých letech dvacátého století podařilo Newtonovu mechaniku nahradit tzv. mechanikou kvantovou. S jejími základy se stručně seznámíme až v kapitole 7, ale již na tomto místě je vhodné upozornit, že kvantová mechanika se od mechaniky Newtonovy liší zejména popisem stavu systému. Zde se již nesetkáváme s názorným zadáváním polohových vektorů a vektorů rychlosti v daném okamžiku, ale stav nám určuje tzv. stavová funkce (často se jí z historických důvodů, a poněkud nevhodně, říká vlnová funkce). Vývoj této funkce (tj. dynamika mikroskopických systémů) se již neřídí Newtonovou pohybovou rovnicí, ale tzv. Schrödingerovou rovnicí. 83 Počátečními podmínkami jsou poloha a rychlost v přítomnosti. Trajektorii směrem do minulosti můžeme počítat zcela obdobně s tím, že ∆t bude menší než nula. 84 Tento známý citát můžete najít například v obsažné, ale dobou trochu poznamenané knížce Úlehla I.: Fyzika a filosofie. SPN, Praha 1982 na straně 70. 85 O změně pohledu na stav částice, který uskutečnila kvantová teorie viz kap.7. 86 Důležitou, ale často pomíjenou podmínkou tohoto prohlášení je nutnost znalosti zákona silového působení mezi částicemi. 60 Poznámka: pojem stavu se ve fyzice používá v mnoha různých významech, například my jsem již užili spojení „změna pohybového stavu tělesa , dále se setkáme se výrazy typu „těleso je ve stavu s energií ... , v termodynamice budeme užívat spojení „stav termodynamické soustavy je určen ... atd. Toto na první pohled volné užívání pojmu „stav je obvykle v jednoduchosti chápáno takto: Stav systému je určen souborem fyzikálních veličin, které jsou nutné k předpovědi chování tohoto systému. Vztahy mezi inerciálními soustavami Ještě před tím než Newton formuloval pohybové zákony, dospěl G. Galilei k závěru, že „každá rovnoměrně a přímočaře se pohybující vztažná soustava je pro popis mechanických pohybů stejně dobrá , tzn. že ve všech inerciálních vztažných soustavách platí stejné mechanické (tj. Newtonovy) zákony. Této myšlence se říká Galileiho princip relativity. V praxi to například znamená, že mechanické děje v rovnoměrně a přímočaře se pohybujícím vlaku či letadle, budou i při různých rychlostech probíhat úplně stejně jako v klidu na Zemi (považujeme-li Zemi za inerciální vztažnou soustavu) — sám Galilei o tom píše: „Uzavřete se s přítelem do prostranné místnosti v podpalubí velkého korábu. Bude-li pohyb korábu rovnoměrný, nebudete s to podle ničeho poznat, zdali se koráb pohybuje nebo stojí. Budete-li skákat, doskočíte na podlaze stejně daleko jako na nehybném korábu. Vaše skoky směrem k zádi nebudou pro rychlý pohyb korábu delší než skoky směrem k přídi, i když po dobu, kdy se vznášíte ve vzduchu, ubíhá pod vámi podlaha opačným směrem, než kterým skáčete. Hodíte-li něco svému druhu, není třeba, abyste to házel s větší silou od zádi k přídi než naopak... . Mouchy budou létat na všechny strany, aniž se budou převážně zdržovat na té straně, která je bližší zádi. (viz např. [12] str. 14). Z tohoto důvodu nemůžeme považovat jednu inerciální soustavu za významnější než jinou. To, že pohyby těles musíme popisovat vždy vzhledem k nějaké vztažné soustavě, jsme již věděli, ale nyní je zřejmé, že neexistuje žádná absolutní vztažná soustava. Tvrzení, že je nějaké těleso v absolutním (rovnoměrném přímočarém) pohybu nebo absolutním klidu tedy nemá dobrý fyzikální význam.87 Rozšířením Galileiho mechanického principu relativity na všechny fyzikální děje a předpokladem (samozřejmě podpořeným experimenty), že světlo se ve vakuu šíří konstantní rychlostí, nezávisle na pohybu zdroje i měřícího pozorovatele, přišel Albert Einstein počátkem 20. století k formulaci speciální teorie relativity. Jak již bylo uvedeno, tato teorie zcela změnila naše chápání prostoru a času. Speciální teorie relativity To, že by matematický popis všech (fyzikálních) dějů neměl záviset na volbě konkrétní inerciální soustavy je sice netriviální fakt, nicméně je snadno intuitivně pochopitelný. Na druhou stranu to, že při měření rychlosti světla reflektorů protijedoucího automobilu docházíme ke stejné hodnotě nezávisle na tom, zdali se my sami pohybujeme či jak rychle 87 Newton však ve své práci pojem absolutního prostoru přece jen zavedl. Důvod viděl v odlišnosti zákonů pohybu vůči neinerciálním soustavám. 61 se pohybuje automobil, je fakt protiřečící „zdravému rozumu .88 Tento fakt je však nesčetněkrát experimentálně ověřený a tedy není nesmyslný — nemůžeme přírodě diktovat, aby se řídila podle lidského rozumu. Právě z kombinace těchto dvou principů vyplývají všechny ony zvláštní (ale přesto reálné) jevy, z nichž nejznámější jsou: zpomalování toku času, zkracování předmětů, pozměněný zákon sčítání rychlostí, relativnost současných událostí a závislost hmotnosti na rychlosti. Z uvedených principů vyplývá i „nejpopulárnější rovnice na světě — E = mc2 , o které si v dalším ještě povíme. Přívlastek „speciální teorie relativity získala proto, že se zabývá vztahy mezi popisem pohybu v různých inerciálních vztažných soustavách, tj. vztahy mezi obecnými neinerciálními soustavami ji „nezajímají . Einstein deset let po svém objevu speciální relativity přišel s další úžasnou teorií. Tato teorie dávala do souvislosti pohyb v neinerciálních soustavách a gravitační působení, přitom byla zobecněním teorie předchozí — dostala proto název obecná teorie relativity (viz též kapitola 2.4). Neinerciální soustavy Z definice inerciálních soustav vyplývá, že v neinerciálních soustavách se hmotné body, na které nepůsobí žádné síly, pohybují se zrychlením. Kdybychom chtěli zachovat platnost Newtonovy pohybové rovnice 2.52, museli bychom předpokládat existenci nějakých nových sil, protože podle 2.52 musí být každé zrychlení způsobeno nějakou silou. Tyto síly, které lze pozorovat například v rozjíždějícím se či brzdícím vlaku, nebo na kolotoči, nazýváme neinerciální síly nebo setrvačné síly. Existence těchto sil tedy nevyplývá z působení nějakých těles či polí, ale čistě z pohybu soustavy, ve které sledujeme pohyb. Podle názvu je patrně nejznámější neinerciální silou síla odstředivá, která působí ve vztažných soustavách, které se vůči inerciálním soustavám nějakým způsobem otáčejí. 2.3 Složitost a jednoduchost pohybu Pohyb a vzájemné působení i jen ideálních těles může být natolik komplikovaný, že je vždy žádoucí najít veličiny, které se při různých dějích nemění. Takové veličiny charakterizují fyzikální soustavu těles jako celek a říkáme o nich, že splňují tzv. zákony zachování. Nejvýznamnějšími z těchto veličin jsou hybnost a energie,89 jejichž zachování ve všech dějích ve vesmíru nám umožňuje určit jisté vlastnosti této soustavy po nějakém (i neznámém) procesu, víme-li, jak vypadala soustava před ním.90 Seznámení začněme hybností. 88 Rozmyslete si, jak by to vypadalo, kdyby tuto vlastnost měl například míč na vybíjenou. 89 Velmi významný je i tzv. moment hybnosti, kterým se však zabývat nebudeme. 90 Lze ukázat, že zachování těchto dvou veličin při jakémkoli ději je důsledkem obecných vlastností prostoru a času. Konkrétně, zákon zachování celkové hybnosti izolované soustavy je důsledkem nezávislosti jevů v ní probíhajících na posunutí v (prázdném) prostoru. Zachování celkové energie izolované soustavy souvisí s nezávislostí jevů v ní probíhajících na posunu v čase, tj. pokud se nezmění jiné podmíky, pouze uplyne nějaká doba, dějí se vždy ty samé věci. 62 2.3.1 Časový účinek síly Snad si každý dokáže představit, jak rozdílné pohybové účinky může mít rozeběhnutý sousedovic kokršpaněl Ben a stejně rozeběhnutý strýčkův dobrman Bojar. Stejně tak si ale lze představit, že se čilý Beník rozběhne tak, že jeho nápor lze jen stěží ustát. Z tohoto příkladu lze vycítit, že jakási „vydatnost pohybu tělesa nebo hmotného bodu závisí nejen na jeho hmotnosti, ale i na jeho rychlosti. Pro popis takovýchto „hybných účinků síly zavádíme proto veličinu zvanou hybnost vztahem: −→p = m−→v (2.55) Pomocí hybnosti můžeme přepsat Newtonovu pohybovou rovnici: −→ Fv = m−→a = (2.56) = m lim ∆t→0 −→v (t + ∆t) − −→v (t) ∆t = lim ∆t→0 −→p (t + ∆t) − −→p (t) ∆t ≡ lim ∆t→0 ∆−→p ∆t ≡ d−→p dt Při odvození jsme užili předpoklad, že rychlost pohybu částice je natolik malá v porovnání s rychlostí světla, že její hmotnost můžeme považovat za nezávislou na rychlosti (viz diskuse o hmotnosti na straně 53), a tedy i netečnou k limitnímu procesu. Ukazuje se, že rovnost prvního a posledního výrazu této rovnice přechází nezměněna do speciální teorie relativity. Pro zajímavost, Newton původně svůj druhý zákon zapsal zhruba ve tvaru d−→p /dt = −→ Fv, ale protože nenašel žádný dobrý důvod proti považování hmotnosti těles za konstantní, upravil jej obráceným postupem na tvar 2.52. Vyjádření pohybové rovnice pomocí hybnosti je tedy obecnější než její vyjádření pomocí zrychlení. Odvoďme si nyní zákon zachování hybnosti pro izolovanou soustavu částic.91 V této soustavě sestává výslednice všech sil působících na každou její částici pouze ze součtu sil, kterými na ni působí ostatní částice soustavy. Pro částice izolované soustavy na obr. 2.34 můžeme v krátkém časovém intervalu ti; ti + ∆t zapsat pohybové rovnice: ∆−→p1 ∆t = −→ F12 + −→ F13 + −→ F14 ∆−→p2 ∆t = −→ F21 + −→ F23 + −→ F24 (2.57) ∆−→p3 ∆t = −→ F31 + −→ F32 + −→ F34 ∆−→p4 ∆t = −→ F41 + −→ F42 + −→ F43 kde −→ Fkl je síla působení k-té částice na l-tou. 91 V tomto případě máme na mysli soustavu, na kterou nepůsobí buď vůbec žádné vnější síly, nebo jen vnější síly, které se úplně kompenzují. 63 F41 F14 F24 F23F13 F34 F43 F21 F31 F32 F12 F42 Obrázek 2.34: Izolovaná soustava částic Protože vzájemné síly mezi částicemi mají charakter akce a reakce, plynou z třetího Newtonova zákona rovnosti −→ Fkl = − −→ Flk. Sečteme-li tedy rovnice 2.58, dostáváme ∆−→p1 ∆t + ∆−→p2 ∆t + ∆−→p3 ∆t + ∆−→p4 ∆t ≡ ≡ −→p1(ti + ∆t) − −→p1(ti) ∆t + · · · + −→p4(t0 + ∆t) − −→p4(ti) ∆t = = (−→p1(ti + ∆t) + · · · + −→p4(ti + ∆t)) − (−→p1(ti) + · · · + −→p4(ti)) ∆t def = def = −−→pcelk(ti + ∆t) − −−→pcelk(ti) ∆t ≡ ∆−−→pcelk ∆t = −→ 0 kde −−→pcelk(t) ≡ −→p1(t) + −→p2(t) + −→p3(t) + −→p4(t) označuje tzv. celkovou hybnost soustavy. Odvodili jsme tedy, že celková hybnost soustavy se během krátkého časového intervalu ti; ti + ∆t nemění. Protože jsme však tento interval vybrali zcela libovolně, nebude se −−→pcelk měnit v žádném časovém intervalu, tj. dokud soustavu budeme moci považovat za izolovanou, zůstane konstantní — −−→pcelk(t) = −−→pcelk(t + ∆t) = −→p0, pro jakékoliv ∆t. Z definice je vidět, že tvoří-li soustavu například dva oddělené systémy částic jejichž celkové hybnosti −→pI a −→pII známe, je celková hybnost obou systémů dohromady rovna −→pI + −→pII. Výše uvedený postup lze jednoduše zobecnit, dostáváme se tak k velmi důležitému výsledku: Je-li součet vnějších sil působících na soustavu roven nule, bude celková hybnost 64 soustavy stálá po celou dobu pohybu, říkáme, že platí zákon zachování hybnosti.92 Ukázalo se, že tento zákon pohybu fyzikálních soustav, platí nejen při mechanických dějích, ale při všech dosud známých fyzikálních dějích jak v makrosvětě tak v mikrosvětě. Zákon zachování hybnosti tak opustil omezenou platnost Newtonových zákonů, z nichž byl původně odvozen a stal se tak jedním z nejdůležitějších pilířů současného fyzikálního poznání světa. Občas bývá výhodné nahradit soustavu mnoha částic93 částicí jedinou tak, že hybnost této částice je stejná jako celková hybnost soustavy. Definujeme-li polohu tzv. středu hmotnosti soustavy n částic vztahem: −→rC def = m1 −→r1 + m2 −→r2 + · · · + mn −→rn m1 + m2 + · · · + mn (2.58) bude odpovídající rychlost tohoto středu94 −→vC def = −→rC(t + ∆t) − −→rC(t) ∆t = = 1 m m1 −→r1 (t + ∆t) + · · · + mn −→rn(t + ∆t) − m1 −→r1 (t) − · · · − mn −→rn(t) ∆t = = 1 m (m1 −→v1 + · · · + m2 −→v2 ) kde jsme označili m = m1 + · · · + mn. Z uvedeného je přímo vidět, že rychlost středu hmotnosti soustavy souvisí s celkovou hybností této soustavy vztahem −−→pcelk = m−→vC 95 (2.59) Pro ilustraci si na jednoduchém příkladě ukažme, jak zákon zachování hybnosti funguje při řešení úloh. PŘÍKLAD Prázdný železniční vůz o hmotnosti 10 000 kg se pohybuje rychlostí o velikosti 0, 9 m s−1 po přímé vodorovné trati a srazí se s naloženým vozem o hmotnosti 20 000 m s−1 stojícím v klidu. V okamžiku nárazu jsou vozy spojeny. Určete rychlost vozů po srážce. Všechny odporové síly můžeme zanedbat. Označíme si m1 = 10 000 kg, |−→v1| = 0, 9 m s−1 , m2 = 20 000 m s−1 , |−→v2 | = 0 m s−1 a rychlost obou vozů po nárazu |−→v | =? m s−1 , kterou máme spočítat. Protože se tíhová síla a síla reakce kolejí ruší (a odpor vzduchu je zanedbatelný), měla by soustava tvořená vozy 92 Takto formulovaný zákon platí pouze v inerciálních vztažných soustavách, v neinerciálních si podržuje svou platnost, pouze započítáme-li mezi vnější síly i síly setrvačné. 93 Za soustavu mnoha částic můžeme považovat i tuhé těleso. 94 Jako vždy v takovýchto případech ∆t značí malilinkou časovou změnu. 95 Střed hmotnosti soustavy je definován vztahem 2.58 tak, aby byla jednoduše splněna tato rovnost. V odstavci 2.89 si ukážeme, že střed hmotnosti úzce souvisí s pojmem těžiště. 65 splňovat zákon zachování celkové hybnosti. Platí tedy, že celková hybnost soustavy před nárazem −→pi musí být rovna celkové hybnosti po nárazu −→pf , tedy pro průměty do přímky rovnoběžné s kolejemi: m1v1 + m2v2 ≡ pi = pf ≡ (m1 + m2)v ⇒ v = m1v1 + m2v2 m1 + m2 Rychlost s jakou se pohybují oba vozy po střetnutí je v = 0, 3 m s−1 . A nyní si ukažme jednu z omezujících vlastností zákona zachování hybnosti. PŘÍKLAD Představme si, že po selhání všech navigačních systémů do sebe narazí dvě kosmické lodě s hybnostmi −→p1 = m1 −→v1 a −→p2 = m2 −→v2 kdesi hluboko v mezigalaktickém prostoru.96 Drtivý náraz lodě rozmetá na 927 kusů a kousků, z nichž l-tý má hybnost −→pl = ml −→vl . Protože se celková hybnost zachovává, je hybnost všech úlomků dohromady stejná jako celková hybnost obou lodí před srážkou, tj. −→p1 + −→p2 = 927 l=1 −→pl Vidíme, že v tomto složitějším případě srážky nám zákon zachování hybnosti nic podrobného o konečném stavu soustavy neřekne, známe-li pouze celkové hybnosti jejích makroskopických částí. Jediné, co za daných okolností můžeme poznat, je rychlost pohybu středu hmotnosti obou lodí — po srážce bude stejná jako před ní, protože platí −→vC = −→p1 + −→p2 m1 + m2 = 927 l=1 −→pl 927 l=1 ml Nyní bychom se měli dostat k tomu, proč je tento oddíl nazván časový účinek síly. Z Newtonovy pohybové rovnice 2.57, totiž pro velmi krátké časové okamžiky ∆t, plyne ∆−→p = −→ Fv∆t (2.60) To znamená, že nezmění-li se podstatně během ∆t výslednice sil −→ Fv působících na hmotný bod, jeho změna hybnosti bude daná tímto vztahem. Kdybychom chtěli vypočítat změnu hybnosti hmotného bodu během nějakého delšího časového intervalu, museli bychom projít podobnou procedurou jako je konstrukce trajektorie −→r (t) ze známé rychlosti −→v (t). Zopakujme si ho na konkrétním jednoduchém případu. PŘÍKLAD 66 0 1 2 3 4 5 6 7 8 9 10 10 20 30 40 50 60 t(ms) F(N) Obrázek 2.35: Graf závislosti velikosti síly na čase Kulečníkové tágo udeří do stojící koule silou, jejíž závislost na čase je dána na obr. 2.35. Jakou rychlostí se bude poté koule pohybovat za předpokladu, že náraz je přímý a že hmotnost koule je 0, 2 kg? Z grafu je vidět, že náraz trval 10 ms. Rozdělíme-li si tento interval (ozn. ti; tf ) na tak malinké „podinterválky ∆t,97 že během každého z nich můžeme přibližně považovat působící sílu F za konstantní (protože se pohyb děje pouze v jednom směru, bude nás zajímat jen velikost síly). Rozdělíme-li 0 ms; 10 ms například na deset dílů (tj. ∆t = 10−3 s), dostaneme postupně pro změny hybnosti během každého z nich přibližně p(1) − p(0) = F(0)10−3 p(2) − p(1) = F(1)10−3 p(3) − p(2) = F(2)10−3 · · · p(10) − p(9) = F(9)10 Výrazy na pravé straně rovnic představují naše známé obdélníčky pokrývající plochu pod grafem 2.35. Sečtením rovnic a se zmenšujícím se ∆t, získáme celkový rozdíl hybností p(10) − p(0) jako obsah plochy pod grafem (viz 2.36) V našem případě je p(10)−p(0) = p(10) = 0, 3 Ns. Z toho ovšem plyne výsledek: Koule se po úderu bude pohybovat rychlostí o velikosti v = p(10)/m = (0, 3/0, 2) m/s = 1, 5 m/s. 96 Na lodě působí jen velmi slabá gravitační pole vzdálených galaxií, která můžeme zanedbat, lodě tak můžeme považovat za izolovanou soustavu. 97 Připomínám, že pro jednoduchost bereme opět velikosti „podinterválků stejné, ale obecně to není nutné. 67 0 1 2 3 4 5 6 7 8 9 10 10 20 30 40 50 60 t(ms) F(N) Obrázek 2.36: Souvislost závislosti F − t se změnou hybnosti Jak bychom postupovali, kdybychom chtěli zjistit, jakou tágo působilo průměrnou silou? Průměrnou sílou F přitom rozumíme sílu, která by byla po celou dobu nárazu konstantní a přitom měla stejné pohybové účinky jako síla zadaná. V takovém případě pro zvolený časový interval ∆τ platí: p(t0 + ∆τ) − p(t0) = F∆τ (2.61) Jinými slovy, plocha sevřená přímkami t = 0 ms, t = 10 ms, osou t a přímkou F musí být stejná jako plocha pod grafem 2.35. Vidíme, že F = 30 N. Veličina spojená s obsahem plochy pod grafem závislosti síly na čase se nazývá impulz síly — právě na něm závisí změna hybnosti hmotných bodů. V případě stejného impulzu síly −→ F (t), ale různých profilů závislosti F − t však nemusí být účinky působení −→ F stejné. Příkladem může být pád tělesa z velké výšky do sena a na beton — v obou případech je celková změna hybnosti ∆−→p (tedy i impulz síly) stejná, ale protože v případě pádu na beton tato změna nastane ve velmi krátkém čase ∆t, působí na těleso daleko větší průměrná síla ∆−→p /∆t, než když pád je brzděn senem postupně po dobu ∆t′ . Na těleso pak působí menší průměrná síla ∆−→p /∆t′ . 2.3.2 Dráhový účinek síly V předchozím oddíle jsme studovali časové účinky síly ( −→ F ∆t) a pro jejich popis jsme si zavedli pojem hybnosti. Nyní se budeme zabývat dráhovými účinky síly a zavedeme si fyzikální veličinu zvanou práce. Jak jsme již mohli vidět např. u zavádění pojmu rychlost, běžná mluva se často na potřeby fyzikálního názvosloví neohlíží. Proto by se nikdo 68 neměl divit, že může být z celodenního sezení za počítačem značně unaven, i když z čistě mechanického hlediska vykonal práci jen opravdu nepatrnou. Ve fyzice se pojem práce (ozn. W) vykonané na hmotném bodu, který je tlačen konstantní silou −→ F po přímém úseku trajektorie, zavádí jako součin průmětu této síly do směru pohybu a dráhy ∆s, která byla uražena (viz obr. 2.37): W def = −→ F · (−→rf − −→ri ) ≡ −→ F · ∆−→r = | −→ F |∆s cos α ≡ Fs∆s 98 (2.62) kde ∆s = |∆−→r | je dráha uražená z místa −→ri ≡ −→r (ti) do místa −→rf ≡ −→r (tf ), α je úhel mezi směrem pohybu a sílou −→ F a Fs je průmět této síly do směru pohybu. Z obr. 2.37 vidíme, že práce může být jak kladná (síla pohyb podporuje, když cos α > 0), tak záporná (síla pohyb brzdí, když cos α < 0). r1 r0 ∆r F α Obrázek 2.37: K definici práce Jednotkou práce nazýváme joule a platí: [W] = J = N m = kg m2 s−2 . Z uvedeného je vidět, že přes subjektivní pocit dřiny, který se může dostavit při nehnutém stání s plným batohem na zádech, se nekoná žádná mechanická práce. Z fyzikální definice práce rovněž plyne, že táhneme-li například naložené sáně po sněhu stále stejnou silou, vykonáme tím větší práci čím menší úhel bude síla (řemínek) svírat se zemí.99 Působí-li na částici více sil −→ F1, −→ F2, · · · , −→ Fn, je práce, kterou na částici vykoná jejich výslednice −→ Fv rovna součtu dílčích prací vykonaných každou sílou samostatně. Platí totiž: W ≡ −→ Fv · ∆−→r = −→ F1 · ∆−→r + −→ F2 · ∆−→r + · · · + −→ Fn · ∆−→r ≡ W1 + W2 + · · · + Wn 98 Práce vykonaná mezi body −→ri a −→rf je samozřejmě na těchto bodech závislá, proto bychom ji měli značit např. W(−→ri ; −→rf ), ale v rámci naší dohody z poznámky na straně 2.10 zůstaneme (většinou) pro jednoduchost u pouhého W. Práce však nemusí obecně záviset pouze na poloze počátečního a koncového bodu, ale též na tvaru a délce trajektorie — z kontextu by mělo být vždy zřejmé o jaké body, případně o jakou trajektorii, jde. 99 Abychom přesnosti učinili zadost, je nutné poznamenat, že kdybychom táhli za provaz pod větším úhlem, saně bychom trochu nadzvedávali a zmenšovali tak třecí sílu mezi sněhem a sáněmi. 69 V případě, že se zajímáme o práci, která byla vykonána silami působícími na nějakou soustavu částic (či těles), definujeme celkovou mechanickou práci vykonanou na soustavě takto: Nechť j-tá částice soustavy se působením síly −→ F (j) posune o ∆−→r (j) (předpokládáme, že tento úsek je tak malý, že se síla během něj podstatně nezmění). Celková práce Wcelk bude dána přirozeným vztahem Wcelk def = n j=1 −→ F (j) · ∆−→r (j) (2.63) Jak již bylo uvedeno, síly působící na částice obecně závisejí na jejich poloze, rychlosti i na čase. Rovněž trajektorie částic obvykle nejsou jednoduše přímkové. Chceme-li vypočítat celkovou práci vykonanou silou působící při pohybu na hmotný bod a měnící se z místa na místo na křivočarém úseku trajektorie, postupujeme takto: Nejprve rozdělíme trajektorii hmotného bodu na úseky tak malé, aby 1) se na nich neprojevovalo její zakřivení a 2) bylo možno v rámci každého z těchto úseků považovat působící sílu za přibližně konstantní (viz obr. 2.38). Na v každém takovémto úseku ∆sl = |∆−→rl |, je práce ∆Wl definovaná zcela obdobně jako v 2.37, tj. platí ∆Wl = −→ Fl · ∆−→rl = Fsl∆sl. Celková práce vykonaná po celé délce trajektorie je pak dána součtem všech elementárních prací. Popsaný proces je nejlépe vidět z grafu na obr. 2.39, kde je vykreslena závislost průmětu Fs na dráhové souřadnici s. Libovolně vybraný l-tý vyšrafovaný obdélníček má obsah úměrný práci ∆Wl, vykonané na příslušném úseku trajektorie hmotného bodu o délce ∆sl silou s průmětem Fsl. Celková práce je dána součtem obsahů šrafovaných obdélníčků. Kdybychom dělení trajektorie nekonečně zjemňovali, došli bychom k tomu, že skutečná celková práce je určena obsahem plochy pod grafem závislosti Fs = Fs(s).100 S podobným procesem jsme se již vícekrát setkali. Výkon Je-li někdo schopen vytáhnout přes kladku do prvního patra čtyřicet cihel za deset minut, řekneme o něm, že je výkonnější než člověk, který je schopen vytáhnout do dvojnásobné výšky dvacet cihel za dvacet minut. Je tomu tak proto, že oba sice vykonali stejnou práci, ale jeden z nich pracoval méně intenzivněji. Výkon ve fyzikálním smyslu (na rozdíl od běžné mluvy) nám bude vždy charakterizovat jakousi rychlost konání (fyzikální) práce. Z matematického hlediska je opět třeba rozlišit výkon podaný během jistého časového intervalu a výkon podaný v „nekonečně malém časovém intervalu , tj. v daném okamžiku. Prvnímu „druhu výkonu říkáme střední výkon, značíme jej P a definujeme vztahem P def = ∆W ∆t = −→ F · ∆−→r ∆t = −→ F · −→v (2.64) kde se opět předpokládá, že síla −→ F je na přímém úseku trajektorie ∆−→r konstantní. Dru- 100 Přesněji — obsahem plochy sevřené osou s grafem Fs(s) a přímkami s = si a s = sf . 70 rk( )t rk( )t+ t∆ ∆rk Fk Fsk Obrázek 2.38: Práce podél křivočaré trajek- torie s Fs ∆sksi sf Fi Fk Ff Obrázek 2.39: Graf závislosti průmětu síly do směru trajektorie na dráhové souřadnici hému „druhu říkáme (okamžitý) výkon, značíme jej prostým P a definujeme P def = dW dt ≡ lim ∆t→0 ∆W ∆t = lim ∆t→0 −→ F · ∆−→r ∆t = −→ F · −→v (2.65) Jednotku výkonu [P] = W = J s−1 = kg m s−3 nazýváme watt. Jeden watt je práce vykonaná silou jednoho newtonu působícího na hmotný bod po dráze jednoho metru během jedné sekundy. Mechanická energie Zadíváme-li se v noci na rozsvícenou stolní lampičku, můžeme si všimnout složitých trajektorií prachových částeček. Je prakticky nemožné určit v každém okamžiku všechny síly, působící na kteroukoliv z nich. Z Newtonova pohybového zákona a z definice práce lze matematickou cestou ukázat (a experimentálně ověřit), že ať je tato soustava sil jakkoli složitá, práce W vykonaná jejich výslednicí závisí vždy jen na hmotnosti m částečky a na rychlostech, kterou měla na počátku a na konci sledovaného intervalu (ozn. vi a vf ): W = 1 2 mv2 f − 1 2 mv2 i ≡ Ekf − Eki ≡ ∆Ek (2.66) kde jsme vztahem Ek def = 1 2 mv2 definovali veličinu zvanou kinetická (pohybová) ener- gie.101 Všimněte si podobnosti mezi tímto vztahem a vztahem 2.60. Můžeme říci, že zatímco časový účinek síly (F∆t) souvisí se změnou hybnosti, dráhový účinek síly (F∆s) souvisí se změnou kinetické energie. 101 Upozorněme, že kinetická energie závisí na čase stejně jako druhá mocnina okamžité rychlosti. 71 Lze ukázat, že naprosto analogická rovnice platí i pro soustavu částic či dokonce o těleso nebo soustavu těles — celková práce všech sil na soustavu působících (definice viz 2.63) je rovna rozdílu celkových kinetických energií soustavy na počátku a konci pohybu. Přitom celková kinetická energie soustavy Ecelk k je dána součtem kinetických energií E (j) k všech jejích částí, tedy Ecelk k = n j=1 E (j) k Na příkladu obruče točící se kolem svého středu (viz obr. 2.40) si můžeme všimnout, že zatímco její celková hybnost je nulová, její celková kinetická energie nikoli. Rozdělíme-li si totiž obvod obruče na velmi malé části, bude její celková hybnost dána součtem hybností příslušných každému úseku, tyto hybnosti se však po dvou ruší. Naproti tomu kinetická energie je vždy nezáporná veličina a pro každý úsek obruče je nenulová. Jednotkou kinetické energie je samozřejmě rovněž joule. Obrázek 2.40: Každému úseku na obvodu přísluší rychlost, a tedy i hybnost a kinetická energie PŘÍKLAD Jaká bude po jedné sekundě od vypuštění celková kinetická energie soustavy tří stejných míčků o hmotnosti 100 g, když budou vrženy z dvaceti metrů nad zemí takto: první míček rychlostí 10 m s−1 směrem k zemi, druhý míček volně puštěn, třetí míček rychlostí 10 m s−1 směrem vzhůru? Návod: Spočítejte ze vztahu v(0) − gt rychlosti míčků a sečtěte jejich kinetické energie. 72 Řekli jsme si, že i když práce vykonaná nějakou silou na hmotném bodu obecně závisí na jeho trajektorii, je celková práce všech sil působících na tento bod vždy dána pouze rozdílem kinetických energií na počátku a na konci pohybu. Kdybychom experimentálně zkoumali působení jediné síly na hmotný bod, ukázalo by se, že existují síly, pro které rozdíl kinetických energií (a tedy i celková práce) závisí jen na počáteční a konečné poloze hmotného bodu, tj. nezávisí na způsobu, jakým se tento bod dostal z jednoho místa na druhé. Pro každou z těchto sil, kterým budeme říkat konzervativní lze definovat jistou skalární veličinu Ep takto: Přejde-li za působení konzervativní síly hmotný bod z místa −→ri do místa −→rf , bude práce Wif této síly dána rozdílem Wif = Ep(−→ri ) − Ep(−→rf ) (2.67) Veličinu Ep(−→r ) závislou na poloze hmotného bodu nazýváme polohová nebo častěji potenciální energie. S důvodem, proč nedefinujeme rozdíl potenciálních energií obráceně, jak by se dalo očekávat, se seznámíme zanedlouho v souvislosti se zákonem zachování mechanické energie. Možná jste si také všimli, že vztahem 2.67 není potenciální energie definována jednoznačně. Totiž jediné co v principu dokážeme změřit je vykonaná práce Wif (například jako rozdíl kinetických energií), ovšem kdybychom potenciální energii posunuli ve všech bodech prostoru o nějakou konstantní hodnotu E0, tj. kdybychom přeznačili Ep(−→r ) −→ Ep(−→r ) + E0 pro všechna−→r dostali bychom [Ep(−→ri ) + E0] − [Ep(−→rf ) + E0] = Wif Této nejednoznačnosti se obvykle zbavujeme tak, že jednomu, v zásadě libovolnému, místu −→r0 v prostoru přiřazujeme nulovou potenciální energii (někdy se říká nulovou hladinu potenciální energie), tj. definujeme Ep(−→r0 ) ≡ Ep0 = 0. Díky vztahu 2.67 pak bude každému dalšímu místu −→ri příslušet již jednoznačně určená potenciální energie Ep(−→ri ) = Ep0+Wi0 = Wi0. Každé místo −→r prostoru, kde působí konzervativní síla, bude tedy charakterizováno skalární veličinou Ep(−→r ) číselně rovnou práci, kterou tato síla bude muset vykonat, aby hmotný bod z tohoto místa dostal do místa −→r0 s nulovým potenciálem.102 Díky uvedené vlastnosti můžeme oblast působení konzervativní síly snadno „zmapovat pomocí hladin stejné potenciální energie — tzv. ekvipotenciál. Potenciální energie tak, podobně jako kinetická energie, závisí pouze na okamžitém stavu tělesa a ne na tom, jak se těleso do tohoto stavu dostalo.103 Zatímco kinetická energie závisí na velikosti rychlosti v daném okamžiku, závisí energie potenciální na poloze v daném okamžiku. To, že práce sil působících na hmotný bod nezávisí ani na jeho rychlosti ani na trajektorii, po které se změna polohy uskutečnila, však není vůbec samozřejmé — jak již 102 Ještě jednou budiž zdůrazněno, že práce konzervativních sil nezávisí na trajektorii, po které se částice z místa −→r do místa −→r0 dostala. 103 Připomínám, že stav tělesa (přesněji hmotného bodu) v mechanice je určen jeho polohou a rychlostí v daném okamžiku. 73 bylo uvedeno, tuto vlastnost mají jen některé síly. Z již zmiňovaných to je síla tíhová, síla gravitační, síla pružnosti a elektrostatická síla. Příklady sil, kterým nemůžeme přiřadit potenciální energii závislou pouze na poloze jsou síly třecí nebo síly magnetické. Pro ilustraci důležité koncepce potenciální energie se seznamme s nejjednodušší konzervativní silou — s konstantní (homogenní) silou, jejímž příkladem je síla tíhová −→ Fg. g r(t) r(t+Dt) Dr Dr Dh r0 h O Obrázek 2.41: Práce tíhové síly po trajektorii koule závisí pouze na rozdílu jejích výšek na začátku a na konci pohybu Sledujme pohyb vrhačské koule o hmotnosti m od okamžiku ti těsně po vypuštění do okamžiku tf těsně před dopadem. V tomto případě je možno zanedbat všechny ostatní síly a uvažovat jen tíhovou sílu −→ Fg, jíž působí Země na kouli. Protože je tíhová síla konzervativní, vykoná na kouli práci závisející jen na její počáteční a koncové poloze vůči zvolené souřadnicové soustavě.104 Tedy, byla-li koule v čase ti v místě o polohovém vektoru −→r (ti) ≡ −→ri a v čase tf v místě −→r (tf ) ≡ −→rf , bude práce Wif , kterou na kouli vykonala tíhová síla působící po celé sledované části trajektorie, rovna rozdílu příslušných potenciálních energií Eg. Můžeme tedy psát Wif = Eg(−→ri ) − Eg(−→rf ) ⇒ Eg(−→ri ) = Eg(−→rf ) + Wif (2.68) Další postup závisí na volbě vztažné soustavy a volbě referenčního bodu. V případě zemského povrchu volíme, jak je obvyklé, vztažnou soustavu v souladu s obr. 2.41 (bod s nulovou potenciální energií leží na povrchu Země). Všimněte si, že práce tíhové síly vykonaná na krátkém úseku trajektorie ∆−→r ≡ −→r (t + ∆t) − −→r (t) je rovna ∆W = −→ Fg · ∆−→r = m−→g · ∆−→r = ±mg∆h kde platí znaménko +, pokud koule na své cestě klesá a znaménko −, pokud stoupá. Sečtením všech prací konaných tíhovou silou na každém úseku sledované trajektorie dostáváme celkovou práci Wif = mg(hi − hf ) ≡ mgh. Potenciální energie koule, která se nachází v místě −→r , které leží ve výšce h nad povrchem Země je tak podle 2.68 dána vztahem Ep(−→r ) = Ep(h) = Ep(−→r0 ) + W = Ep(h = 0) + W = 0 + mgh = mgh 104 Důkazem konzervativnosti síly je možnost sestavení vztahu pro potenciální energii. 74 Ekvipotenciálami tedy budou plochy rovnoběžné s povrchem. Další velmi důležitou konzervativní silou je síla pružnosti, která je přímo úměrná výchylce z rovnovážné polohy (Fp = −kx). Často v souvislosti s touto silou hovoříme o předmětu (hmotný bod) připevněnému k lehké (nehmotné) pružině charakterizované tuhostí k. Pokud byl předmět vychýlen v kladném směru osy x a poté uvolněn (viz obr. 2.32), bude působící síla pružnosti mířit ve směru záporném, tj. souhlasně se změnou ∆x souřadnice kuličky. Pokud kulička byla uvolněna po vychýlení v záporném směru osy x, bude návratová síla pružnosti mířit v kladném směru, stejně jako přírůstek souřadnice kuličky. To znamená, že směrem k počátku (rovnovážné poloze) vykonává síla pružnosti kladnou práci a lze nahlédnout, že směrem od počátku je touto silou vykonávána práce záporná (pohyb je brzděn). Fp xx1 x3 x2 Obrázek 2.42: Práce konaná pružinou Práce vykonaná pružinou při přesunu z místa se souřadnicí x1 (viz obr. 2.42) do počátku, bude dána plochou 1 2 Fpx1. Volíme-li hladinu nulové potenciální energie v rovnovážné poloze (počátku), bude podle 2.68 pro potenciální energii kuličky, která je pod vlivem síly pružnosti ve vzdálenosti x platit Epr(x) ≡ Epr(xi) = Epr(xf ) + Wif = Epr(0) + 1 2 kx2 (2.69) Práce vykonaná silou pružnosti ze vzdálenosti x1 do vzdálenosti x2 od rovnovážné polohy je pak W = 1 2 kx2 1 − 1 2 kx2 2. Shrňme k čemu jsme se dobrali: Práce všech sil, působících na částici při jejím pohybu, je rovna rozdílu její kinetické energie na začátku a na konci pohybu a práci konzervativních sil můžeme vyjádřit (obráceným) rozdílem jejich potenciálních energií. Postupme dále a označme součet potenciálních energií všech takovýchto sil na začátku pohybu Epi a na konci pohybu Epf a práci zbylých, nekonzervativních sil Wnkz. Rovnici 2.66 pak můžeme přepsat do tvaru Ekf − Eki = Epi − Epf + Wnkz =⇒ (Ekf + Epf ) − (Eki + Epi) = Wnkz (2.70) 75 Jsou-li mezi konzervativními silami pouze tíhová (s potenciální energií Eg), síla pružnosti (Epr) nebo gravitační síla (EG), nazýváme součet Em ≡ Eg + Epr + EG (celková) mechanická energie částice. Práce nekonzervativních sil je pak rovna změně této energie, tj. ∆Em ≡ Emf − Emi = Wnkz (2.71) Zkoumáme-li nějakou soustavu částic či těles, definujeme její celkovou mechanickou energii jako součet mechanických energií všech jejích částí (tj. včetně každé části všech těles). Důležitý případ nastává, když na soustavu (resp. její části) působí pouze mechanické konzervativní síly (vnitřní či vnější) nebo když práce nekonzervativních sil je rovna nule. Z rovnice 2.71 pak vyplývá, že ∆Em = 0 — mechanická energie soustavy se pak během pohybu nemění Em = Ek + EG + Eg + Epr = konst. Tímto vztahem je vyjádřen tzv. zákon zachování mechanické energie. Název „konzervativní síly pak plyne z toho, že působení pouze těchto sil na těleso zachovává — konzervuje — celkovou mechanickou energii tělesa. Tento zákon nás přivádí zpětně k tomu, proč byla potenciální energie konzervativních sil definována „rozdílovým vztahem W = Epi −Epf a nikoli, jak by se mohlo zdát přirozenější W = Epf − Epi. Kdybychom totiž definovali potenciální energii podle druhého způsobu, museli bychom pak definovat mechanickou energii jako Ek − Ep, což vypadá daleko méně přirozeně. PŘÍKLAD Pokud se rozskáčete do velké výšky na trampolíně a pak už budete jen pasivně (tj. se strnulým tělem) skákat, bude se vaše kinetická, potenciální tíhová a potenciální energie pružnosti trampolíny měnit. V nejvyšším bodě vaší trajektorie (viz obr. 2.43) bude vaše celková mechanická energie sestávat pouze z energie tíhové — Eg = mghmax, kde m je vaše hmotnost, h výška nad podlahou a g tíhové zrychlení (kinetická energie je v tomto bodě nulová, protože i vaše rychlost je v tomto bodě na okamžik nulová).105 Cestou dolů (volným pádem) budete nabírat rychlost (v = gt) a těsně před dotykem s trampolínou (obr. 2.44) bude vaše rychlost maximální. Trampolína však váš prudký pád zbrzdí tak, že v nejnižším bodě (obr. 2.45) budete mít opět nulovou rychlost, tentokrát však budete ve výšce hmin nad zemí. Navíc ovšem vychýlíte trampolínu z její rovnovážné polohy o l − hmin, kde l je výška trampolíny. Jsou-li pružné vlastnosti trampolíny charakterizovány konstantou k, je vaše potenciální energie pružnosti v nejnižším bodě Epr = 1 2 k(l − hmin)2 . Vaše celková mechanická energie Em v popsaných úsecích trajektorie pak bude Ea m = mghmax, Eb m = 1 2 mv2 max + mgl, Ec m = mghmin + 1 2 k(l − hmin)2 76 hmax l v = 0 Obrázek 2.43: a) počátek pohybu — potenciální energie tíhové síly je maximální vmax Obrázek 2.44: b) dopad na trampolínu — kinetická energie je maximální v = 0 hmin Obrázek 2.45: c) nejnižší bod — potenciální energie pružnosti je maximální Pokud by na vás působily jen tíhová síla a síla pružnosti (tj. konzervativní síly), mechanická energie by se neměnila — Ea m = Eb m = Ec m. Z toho je ovšem zřejmé, že při zpátečním pohybu by vás trampolína vymrštila rychlostí vmax a dosáhli byste nakonec stejné výšky hmax (aniž byste se o to nějakým přídavným pohybem přičinili). Jenže z praxe víme, že do stejné výšky nikdy nevystoupíme — náš pohyb bez „buzení nebude trvat nekonečně dlouho, ale nakonec se zastaví. To nám ovšem signalizuje narušení zákona zachování mechanické energie. Zhruba od poloviny 18. století se ví, že mechanická energie se nemění pouze v důsledku konání práce, ale i v důsledku přenosu tepla. Postupem doby se také přišlo na existenci dalších forem energie, které se mohou přeměňovat ať už navzájem nebo na práci, teplo 105 Zde předpokládám, že jste nahraditelní hmotným bodem. 77 či mechanické druhy energie. Jejich společným pojítkem je, že u všech lze jejich přírůstek (resp. úbytek) vyjádřit pomocí jisté práce a hlavně, že jejich součet v izolované soustavě se vždy musí zachovávat. Předpokládáme tedy platnost tzv. zákona zachování (celkové) energie. Jednotkou jakéhokoli druhu energie v soustavě SI je joule — [E] = J = kg m2 s−2 . Relativistická energie Zahrnutí relativistických principů do zkoumání celkové práce výslednice sil působících na částici (hmotný bod) vede k modifikaci vztahu 2.66 na vztah W = m0c2 1 − v2 f c2 − m0c2 1 − v2 i c2 (2.72) kde m0 je hmotnost částice měřená v soustavě, ve které se nachází v klidu a c je rychlost světla ve vakuu. Veličina Er def = m0c2 1 − v2 c2 (2.73) je nazývána relativistická energie částice. Souvislost relativistické a kinetické energie vyplave na povrch, uvědomíme-li si, že pro běžné rychlosti makroskopických předmětů je (v/c) ≪ 1 a rozvineme-li Er do řady106 Er ≡ m0c2 1 − v2 c2 − 1 2 = m0c2 1 + 1 2 v2 c2 + 3 8 v4 c4 + . . . = m0c2 + 1 2 m0v2 + . . . 106 Na střední škole si ověřovali (a možná i dokazovali) platnost tzv. binomické věty, která říká, že pro jakákoli reálná čísla a, b a nezáporné celé číslo n platí vztah (a + b)n = n k=0 n k an−k bk kde n k =    n(n−1)(n−2)...(n−k+1) k(k−1)(k−2)...3·2·1 (k > 0) 1 (k = 0) 0 (k < 0) je tzv. kombinační číslo (definované obecněji než na střední škole). Ukazuje se, že tuto větu lze zobecnit pro reálné exponenty q: Je-li |a| > |b|, lze výraz (a + b)q rozvinout do řady q 0 aq + q 1 aq−1 b + q 2 aq−2 b2 + q 3 aq−3 b3 + · · · Toho se využívá zejména při aproximacích výrazu (1 +x)q pro velmi malá reálná čísla x (x ≪ 1). Mocniny x se rychle zmenšují a proto tento výraz může být s dobrou přesností nahrazen několika prvními členy řady 1 + qx + q(q − 1) 2 x2 + q(q − 1)(q − 2) 6 x3 + · · · 78 Vidíme, že nejpodstatnější příspěvek k relativistické energii částice pohybující se rychlostí v ≪ c dávají výrazy m0c2 a 1 2 m0v2 . Druhý člen zřejmě odpovídá klasické kinetické energii, tj. energii, která souvisí s pohybem částice. Člen m0c2 je relativistické energii částice nachází vždy, říkáme mu proto klidová energie částice. Mohlo by se zdát, že toto přiřazení energie hmotnosti nemá žádný reálný význam, protože je tato energie nepřeměnitelná na jiné formy energie, tj. že do zákona zachování celkové energie vstupuje pouze jako konstanta. Existují však procesy, které dokáží změnit částici například na elektromagnetické záření, tj. celá klidová energie částice se může změnit na energii příslušnou elektromagnetickému záření107 a tedy zavedení klidové energie není samoúčelné. V jaderné fyzice a fyzice elementárních částic je tento pojem naprosto běžnou záležitostí. Zkuste si sami spočítat, kolik energie je takto skryto v jednom kilogramu látky. V odstavci věnovaném vztahu setrvačnosti a hmotnosti na str. 53 jsme si uvedli, že chceme-li změnit rychlost (vektor) tělesa, musíme aplikovat tím větší sílu, čím je těleso těžší. Také jsme si však uvedli jako experimentální fakt, že působení vedoucí ke změně rychlosti musí být tím větší, čím rychleji se těleso pohybuje. Odůvodnění tohoto faktu můžeme vidět z rovnice 2.72. Uveďme si jednoduchou ilustraci. PŘÍKLAD Jakou rychlost získá částice pohybující se z klidu ve směru osy x na dráze ∆s, když na ni působí konstantní síla Fx? Porovnejte relativistický a nerelativistický případ. Z nerelativistické rovnice 2.66 pro rychlost vn částice získanou během urychlování konstantní silou Fx na dráze ∆s plyne (hmotnost částice je označena m0) W = Fx∆s = 1 2 m0v2 ⇒ vn = 2Fx∆s m0 = 2Fx∆s m0c2 c (2.74) Relativistická rovnice 2.72 vede k výrazu W = Fx∆s = m0c2 1 − v2 c2 − m0c2 ⇒ vr = 1 − 1 Fx∆s m0c2 + 1 2 c (2.75) Všimněme si, že se zvětšováním „rozjezdové dráhy ∆s roste i výraz pro vn nade všechny meze. Kdybychom nechali sílu Fx působit na dráze ∆s = m0c2 Fx nabrala by částice rychlost stejnou, jakou má světlo ve vakuu. Naproti tomu výraz pro vr je vždy menší než rychlost světla. Porovnáním také vidíme, že pro jakékoli ∆s je vr < vn, platí totiž (označme pro jednoduchost x ≡ Fx∆s/m0c2 ≥ 0) vr vn = 1 − 1 (x+1)2 2x = x + 2 2(x + 1)2 ≤ 1 pro všechna přípustná x (2.76) 107 To, že elektromagnetické záření dokáže předávat energii dál, můžeme pozorovat například za horkého letního dne. 79 Tento výsledek můžeme interpretovat tak, že s rostoucí rychlostí, roste i odpor tělesa k urychlování, tj. jeho setrvačnost a tedy i jeho hmotnost. Uvedené úvahy dovolují zavést označení (viz poznámka o relativistické hmotnosti na straně 53) m ≡ m0 1 − v2 c2 (2.77) Relativistická energie 2.73 pak získá tvar Er = mc2 (2.78) Experimenty ukázaly, že tuto patrně nejznámější rovnici na světě (bez indexu „r ) je možno chápat obecně jako vztah mezi celkovou energií soustavy E (můžeme tedy vynechávat přívlastek „relativistická a její hmotností.108 Protože experimentálně lze ověřovat pouze změny energie, můžeme rovnici 2.78 upravit. Uvažujme o soustavě, do které z vnějšku přišla energie ∆E (například zahřátím). Označme Ei celkovou energii soustavy před příchodem ∆E a Ef po příchodu. Podle 2.78 pak platí ∆E = Ef − Ei = mf c2 − mic2 ≡ ∆mc2 (2.79) Z uvedeného je vidět, že změně energie soustavy, odpovídá i změna její hmotnosti. Například, ohřejeme-li 1 000 litrů vody z 0◦ C na 100◦ C, musíme jí dodat energii ∆E = 4, 18·108 J. Hmotnost této tuny vody se zvýší o ∆m = ∆E c2 ≈ 5 · 10−6 g Abychom tento přírůstek hmotnosti zaznamenali, museli bychom umět měřit minimálně s přesností na 1010 %. V mikrosvětě jsou však podmínky pro ověření vztahu ∆E = ∆mc2 poněkud příznivější. Pro ilustraci použijme nyní tento vztah v obráceném smyslu. Důkladným měřením byly zjištěny hmotnosti atomových jader i částic, ze kterých jsou složena, tj. protonů a neutronů. Označíme-li jako m0p a m0n klidové hmotnosti protonu a neutronu, očekávali bychom, že jádro složené ze Z protonů a N neutronů bude mít hmotnost m∗ j = Zm0p + Nm0n. Skutečně změřené hmotnosti mj jader jsou však vždy menší (mj < m∗ j ). Důvod je v následujícím: Abychom mohli stabilní jádro „roztrhnout na protony a neutrony, je potřeba jisté energie ∆Ej (jinak by se rozpadlo samo). Tato energie se při sestavování jádra uvolní do okolí (například ve formě elektromagnetického záření). Ze vztahu 2.79 však víme, že každé změně energie soustavy odpovídá i určitá hmotnost. Fakt, že v hmotnostní bilanci m∗ j jádra chybí právě hmotnost ∆mj = ∆Ej/c2 byl potvrzen nesčetně mnoha pokusy. Rozdíl ∆mj mezi součtem klidových hmotností všech protonů a neutronů obsažených v jádře a mezi skutečnou hmotností jádra je nazýván hmotnostní schodek jádra a energie ∆Ej vazebná energie jádra. U velkých jader, jako je například 108 O zajímavých historických souvislostech doprovázejících tuto rovnici se můžete dočíst např. v [36]. 80 jádro uranu, je úbytek hmotnosti způsobený uvolněním vazebné energie větší než hmotnost protonu (zkuste si to ověřit pomocí tabulek). Přestože teorie relativity pojem energie značně zobecnila, nevyplývá z ní samotné další důležitý experimentálně zjištěný fakt — existují fyzikální soustavy, ve kterých neprobíhají změny energie spojitě. Všimněme si například tělesa, na nějž působí pouze síly pružnosti. Jeho mechanická (nerelativistická) energie je dána vztahem (viz 2.69 a 2.70) Em = 1 2 mv2 + 1 2 kx2 Protože těleso můžeme umístit na libovolnou souřadnici a libovolně silným šťouchem mu můžeme udělit jakoukoli rychlost, může být jeho mechanická energie měněna spojitě. Podobně při klasickém zkoumání dopadají všechny druhy sil. Naproti tomu bylo experimentálně dokázáno, že elektrony v obalech atomů nabývají pouze diskrétních hodnot. V tomto směru musela Newtonovu mechaniku nahradit tzv. mechanika kvantová (více o ní v kapitole 7). Závěrem povídání o energii můžeme říci, že teorie mechanického pohybu založená na Newtonových principech sice byla nahrazena pokročilejšími teoriemi, ale zákon zachování energie (a též hybnosti) tvoří mocné nástroje při předpovídání výsledků fyzikálních experimentů dosud. 2.4 Gravitační pole Na začátku 17. století, asi 180 let po znovuobjevení heliocentrického pohledu na vesmír Mikulášem Koperníkem,109 přišel Johannes Kepler s matematicky přesnějším vyjádřením pohybu planet kolem Slunce. Kepler na základě, v té době nejpřesnějších, pozorování náročnou matematickou cestou objevil, že: • Planety sluneční soustavy se pohybují po elipsách v jejichž společném ohnisku se nachází Slunce.110 • Plocha opsaná spojnicí libovolné planety a středu Slunce se během libovolně zvoleného časového intervalu po celou dobu oběhu nemění. • Poměr mezi druhou mocninou oběžné doby a třetí mocninou velké poloosy oběžné dráhy je pro všechny (tehdy známé) planety sluneční soustavy stejný. 109 Snad jako první začal uvažovat o heliocentrické soustavě Aristarchos ze Samu, který žil ve 3. století před naším letopočtem. To je ovšem 18 století před Koperníkem! 110 Koperník ještě uvažoval jen kruhové dráhy, ale pohyb po jednoduchých kružnicích neodpovídal pozorovaným planetárním pohybům — musel zavést systém různých přídatných kruhových pohybů (po tzv. epicyklech a deferentech), které sice tvořily jeho heliocentrickou soustavu poněkud složitější než by se na první pohled zdálo, ale oproti geocentrické soustavě byl počet takovýchto přídatných kruhových pohybů daleko menší. 81 Na základě pozorování pohybů Měsíce kolem Země a rozborem těchto Keplerových výsledků Newton vyslovil hypotézu o existenci tzv. gravitačních sil,111 které se projevují v okolí každého tělesa ve vesmíru. Tvrzení, že mezi každými dvěma částicemi (hmotnými body) existuje přitažlivá síla, která je přímo úměrná součinu jejich hmotností a nepřímo úměrná druhé mocnině jejich vzdálenosti je obsahem tzv. Newtonova gravitačního zákona nebo též poněkud méně vhodně zákona všeobecné gravitace. Matematické vyjádření velikosti gravitační síly, která k sobě přitahuje dvě tělesa o hmotnostech m a M, jejichž středy leží ve vzdálenosti r, je dána vztahem FG = G mM r2 (2.80) kde o konstantě úměrnosti G ≈ 6, 67 · 10−11 N m2 kg−2 se předpokládá, že je v celém vesmíru stejná (je to univerzální konstanta). Tato tzv. gravitační konstanta charakterizuje „mohutnost gravitačního působení . Díky „malosti této konstanty je gravitační působení běžných těles lidských rozměrů prakticky zanedbatelné, stačí si například vyčíslit, jakou gravitační silou na sebe působí dvě železné koule o hmotnosti 10 kg, leží-li jejich středy ve vzdálenosti 1 m.112 Z Newtonových pohybových zákonů a Newtonova gravitačního zákona lze samozřejmě zpětně matematickou cestou vyvodit Keplerovy zákony. Protože vztah 2.80 závisí pouze na vzdálenosti, vyplývá z něj, že jakákoli dvě tělesa ve vesmíru na sebe gravitačně působí okamžitě. To například znamená, že změna polohy hvězdy na jednom konci vesmíru by se měla projevit v okamžité změně gravitačního působení (které je samozřejmě velmi malé) na hvězdu na druhém konci vesmíru. Celá dvě století po Newtonovi nepřipadalo naprosté většině vědců na tomto faktu nic divného (zřejmě také proto, že jeho gravitační zákon byl v plné shodě s pozorováním). Po objevu speciální teorie relativity Albertem Einsteinem se však ukázalo, že žádná informace se nemůže pohybovat rychlostí větší než je rychlost světla — tedy ani hvězdy ani jiné objekty se o vzdálených změnách nemohou dovědět dříve než by mezi nimi stihlo přelétnout světlo. Sám Einstein pak sestavil novou teorii gravitace, která již požadavkům speciální relativity vyhovovala, jeho teorie byla nazvána obecnou teorií relativity. Tato teorie, která zatím prochází všemi experimentálními testy s úžasnou přesností (na rozdíl od gravitační teorie Newtonovy a jiných) tvrdí, že gravitační síla se nepřenáší z místa na místo okamžitě, ale že existuje cosi, co tuto sílu přenáší konečnou rychlostí (tato rychlost je stejná jako rychlost světla). Ono „cosi je rozprostřené v prostoru (vyplňuje prostor) kolem každého tělesa a zprostředkovává (přitažlivé) silové působení na ostatní tělesa v tomto prostoru se nacházející — říkáme, že každé těleso kolem sebe vyvolává gravitační pole a že každé těleso, které se do tohoto pole dostane je přitahováno gravitační silou.113 111 Z lat. gravis = těžký. 112 Přestože gravitační zákon platí pouze pro hmotné body, tj. tělesa se zanedbatelnými rozměry vůči vzájemné vzdálenosti, lze z něj dokázat, že vztah 2.80 platí i pro všechna tělesa nezanedbatelných rozměrů, je-li jejich hmotnost rozložená kulově symetricky kolem jejich středu a r je vzdálenost těchto středů. 113 Abychom byli přesnější, z Einsteinových výzkumů vyplynulo, že působení gravitačních sil lze popsat pomocí deformací samotného prostoru a času a že tyto deformace se nemohou šířit nekonečnou rychlostí. Výrazné odchylky od Newtonovy teorie se však projevují až při vysokých rychlostech a u velmi těžkých 82 Uvedené si můžeme ilustrovat například takto: Sledujme gravitační působení Slunce na Zemi. Vzdálenost obou těles je přibližně 150 miliónů kilometrů a světlo z povrchu Slunce dopadá na Zemi až po více než osmi minutách putování sluneční soustavou. Kdyby se vyspělá mimozemská civilizace z nějakého důvodu rozhodla náhle vymazat Slunce z našeho vesmíru (například propadem do hyperprostoru :-)), Země bude ještě přes osm minut obíhat kolem místa, kde dříve stálo. Rychleji tuto změnu zaznamenat nemůže. Například planeta Neptun by tuto změnu pocítila až po více než čtyřech hodinách a nejbližší hvězdy dokonce až po několika letech, do té doby by se vše dělo tak, jakoby Slunce bylo stále na svém místě. Jedním z nejdůležitějších impulzů, které přivedli Einsteina k jeho teorii gravitace je poznatek, že v gravitačním poli se všechna tělesa pohybují se stejným zrychlením. Tuto vlastnost (u zemské přitažlivosti) objevil již Galileo Galilei a dodnes nevypadá vůbec samozřejmě, i když odhlédneme od brzdných účinků vzduchu. Jak si ukážeme v kapitole o elektrostatice, v elektrickém poli (podobně jako v gravitačním poli) působí na částici o hmotnosti m nesoucí elektrický náboj q síla Fe, která je mu přímo úměrná, tj. platí Fe ∼ q. Podle druhého pohybového zákona bude tedy zrychlení částice a ∼ q m , tj. když částice bude mít jiný náboj, bude mít i jiné zrychlení. Z 2.80 však plyne, že vztah pro gravitační sílu působící na částici s hmotností m můžeme přepsat na mK, kde K již na m nezávisí. Pro zrychlení této částice pak platí a = K, tj. je také nezávislé na hmotnosti. Tento výsledek vyplývá čistě z logiky věci a nevypadá nijak zajímavě, ovšem pouze do doby než si uvědomíme fakt, že hmotnost vystupující v gravitačním zákonu jsme považovali za tu samou jako hmotnost určující míru odporu vůči změně pohybu, tj. hmotnost setrvačnou. Jenže proč by měla mít gravitace něco společného se setrvačností? V gravitačním zákonu by měla být teoreticky jiná veličina určující mohutnost vytvářeného gravitačního pole, jakási gravitační hmotnost. To, že si jsou gravitační a setrvačná hmotnost úměrné, resp. díky vhodné volbě jednotek jsou vlastně totožné, je v rámci klasické fyziky záhadou. Až Einstein přišel s tím, že tento fakt je nutno brát vážně a postavil jej do srdce své teorie gravitace — obecné relativity. I když je obecná relativita koncepčně velmi jednoduchá a existuje mnoho populárních knih, které její základy vysvětlují (viz např. [37, 26, 25] nebo poněkud náročnější [38, 39]), je matematicky velice náročná. Proto se nadále budeme zabývat pouze Newtonovu teorii gravitace s tím, že navíc budeme používat pojem pole, přestože vlastně k Newtonově teorii vůbec nepatří. Pro gravitační pole platí zákon akce a reakce — v praxi například znamená, že působí-li na vás váš partner gravitační silou, působíte stejně velkou (ale opačně orientovanou) silou i vy na něj. Gravitační síly rovněž splňují velmi významný princip superpozice, který můžeme ilustrovat například takto: označíme-li −→ FM sílu, kterou by na Zemi působil pouze Měsíc a nic jiného (jako kdyby ostatní tělesa sluneční soustavy na chvíli zmizela) a −→ FS sílu působící na Zemi od osamoceného Slunce, bude celková gravitační síla, kterou působí Slunce a Měsíc objektů (násobky hmotnosti Slunce), takže relativistický pohled na gravitaci ukazuje, že přitažlivá síla působící mezi dvěma dostatečně vzdálenými a relativně pomalu se pohybujícími tělesy je prakticky taková, jakou udává Newtonův gravitační zákon. 83 společně na Zemi dána vektorovým součtem −→ FM + −→ FS — gravitační pole se tedy mohou prolínat aniž by jedno narušovalo druhé.114 Studujme nyní působení gravitačního pole vytvořeného těžkou částicí o hmotnosti M na lehkou částici o hmotnosti m. Předpokládáme, že částice m je tak lehká, že její pohyb v okolí částice M ji nijak podstatně neovlivní (říká se jí také testovací částice). Ze vztahu 2.80 plyne, že síla působící na m závisí přímo úměrně na velikosti m. Pole vytvářené hmotností M však existuje nezávisle na tom, nacházejí-li se v něm jiná tělesa. Abychom mohli porovnávat „mohutnost silového působení v různých gravitačních polích, vztáhneme gravitační sílu na jednotku hmotnosti — takovéto „normované gravitační síle budeme říkat intenzita gravitačního pole a označíme ji −→ K. Působí-li tedy v gravitačním poli buzeném hmotností M na tělísko o hmotnosti m gravitační síla −→ FG, je intenzita tohoto pole dána vztahem −→ K(M) def = −→ FG m 115 (2.81) Protože hmotnost je vždy kladná veličina, mají gravitační síla a intenzita gravitačního pole stejný směr i orientaci. Vzhledem k nezávislosti −→ K(M) na hmotnosti m testovací částice, charakterizuje intenzita gravitačního pole silové účinky tohoto pole bez ohledu na to, co se v něm nachází. Silové působení gravitačního pole charakterizovaného intenzitou −→ K(M) na částici s hmotností m′ pak můžeme jednoduše vyjádřit vztahem −→ F = m′−→ K(M) . Pomocí vektoru intenzity gravitačního pole můžeme toto pole zmapovat. Je-li v každém bodě prostoru vektor −→ K stejný (konstantní), mluvíme o homogenním neb stejnorodém poli, protíná-li se směr všech vektorů −→ K intenzity gravitačního pole v jednom bodě, hovoříme o poli radiálním.116 V části 2.3.2 byla zmíněna konzervativnost gravitačních sil a z toho vyplývající možnost zavedení potenciální energie. Skutečně, působí-li na částici o hmotnosti m v místě s polohovým vektorem −→r pouze gravitační síly nějakého tělesa nebo soustavy těles, lze jí připsat skalární veličinu EG(−→r ), které říkáme potenciální energie částice v gravitačním poli nebo zkráceně gravitační potenciální energie. Tato veličina pak bude rovna práci vykonané gravitačním polem při přemístění částice z místa −→r do místa −→r0 , kde je dohodou stanovena nulová hladina potenciální energie, tj. kde EG(−→r0 ) = 0. Umístíme-li počátek souřadnicové soustavy do centra gravitačního pole vytvořeného kulovým tělesem o hmotnosti M a stanovíme-li nulovou hladinu potenciální energie v nekonečnu, lze z gravitačního zákona a definice práce odvodit pro potenciální energii částice nacházející se v gravitačním poli M vztah EG(−→r ) = EG(r) = −G mM r (2.82) 114 Pozor, toto vůbec není samozřejmý fakt a například v Einsteinově pojetí gravitace obecně neplatí. 115 Index M vyjadřuje, že se zajímáme o gravitační pole vyvolaného hmotností M. 116 V případě, že velikost intenzity pole závisí pouze na vzdálenosti od centra, hovoříme o tzv. centrálním poli. 84 Všimněte si, že potenciální energie částice nezávisí na směru, ale pouze na vzdálenosti r od středu tělesa (centrální pole). Dále si všimněte, že takto zavedená potenciální energie částice je v každé vzdálenosti záporná, a tedy se zvětšující se vzdáleností r roste k nule. Obdobně k zavedení intenzity gravitačního pole, jakožto vektorové veličiny popisující vlastnosti gravitačního pole nezávisle na tom, jaké částice se v něm nacházejí, můžeme zavést skalární veličinu zvanou potenciál gravitačního pole, která též popisuje gravitační pole nezávisle na okolí. A stejně jako je intenzita „normovanou silou působící na jednotkovou hmotnost, je potenciál „normovanou potenciální energií přiřazenou v daném gravitačním poli jednotkové hmotnosti. Matematicky tedy je ϕG(−→r ) def = EG(−→r ) m (2.83) což v případě popsané rovnicí 2.82 dává ϕG(r) = −G M r Potenciál v daném místě tedy také závisí pouze na charakteristikách zdroje gravitace. Přestože je potenciál gravitačního pole (skalár) abstraktnější veličinou než intenzita gravitačního pole (vektor), z matematického hlediska se s ním obvykle pracuje lépe, protože pro úplný popis každého místa gravitačního pole postačuje jediné číslo namísto tří. Samozřejmě, že ze znalosti potenciálu lze získat intenzitu a naopak. Souvislost těchto dvou veličin lze také vypozorovat z toho, že vektory intenzity gravitačního pole jsou v daném místě vždy kolmé na hladiny konstantního potenciálu, tzv. ekvipotenciální hladiny. Nakreslete si sami několik ekvipotenciálních hladin pro případ gravitačního pole buzeného stejnorodou koulí. V kapitole 5 o elektřině a magnetismu si uvedeme další příklad fyzikálního pole a zmíníme se i o jeho popisu pomocí intenzity a potenciálu. 2.5 Mechanika tuhého tělesa 2.5.1 Moment síly a pohybová rovnice pro otáčení tuhého tělesa kolem pevné osy Jak jsme si už uvedli v článku 2.1.8 — tuhé těleso je idealizované těleso, jehož tvar a objem se ani účinkem sebevětších sil nemění, tzn. že jednotlivé body tuhého tělesa za žádných okolností nemění vzájemnou vzdálenost. Při působení síly na částici (hmotný bod) jsme se nemuseli starat o její působiště, protože síla působila právě v místě, kde se částice nacházela. U tuhého tělesa je nutno specifikovat, na jakou jeho část síla působí, protože síly působící v různých částech tělesa mají na něj různé pohybové účinky (viz obr. 2.46). Díky tuhosti tělesa platí, že působiště síly můžeme v tělese posouvat po přímce (úsečce) mířící ve směru vektoru síly, tj. po vektorové přímce síly. Tato vlastnost nám dovolí v případě působení několika sil je 85 skládat. To znamená, že pokud na těleso působí soustava sil, umíme ji nahradit silou jedinou tak, že má stejné pohybové účinky. Skládání sil již tedy není tak jednoduché jako u hmotného bodu, protože nejen že musíme nalézt jejich vektorový součet, ale navíc musíme určit i přímku, ve které výsledná síla bude působit. Nahrazení soustavy sil silou jedinou se nám ovšem nepovede v případě, že na tuhé těleso působí dvě stejně velké, ale opačně orientované síly — takovou to soustavu pak nazýváme silová dvojice nebo dvojice sil. Fg Fg Obrázek 2.46: Stejné síly působící na různé části tuhého tělesa Je-li výslednice všech sil působících na soustavu nulová, ještě to neznamená, že těleso bude v klidu — podobně jako u hmotného bodu, byla-li výslednice sil na něj působících nulová, nemohl sice zrychlovat, ale mohl se rovnoměrně přímočaře pohybovat. Tuhé těleso se ovšem navíc může otáčet a my se teď pokusíme zjistit, za jakých podmínek nezrychluje svůj posuvný ani otáčivý pohyb. Roztáčíte-li například se svou kamarádkou kolotoč (tuhé těleso) tak, že působíte stejnými silami ve stejných vzdálenostech od jeho osy otáčení, působíte tak na něj vlastně silovou dvojicí — kolotoč bude svůj otáčivý pohyb zrychlovat přesto, že síly jsou vyrovnané (viz obr. 2.47). Vidíme tak, že síla samotná nám úplně nevystihuje vlastnosti působení na tuhá tělesa. Proto zavádíme vektorovou veličinu, která lépe charakterizuje otáčivé účinky sil na tuhá tělesa — moment síly −→ M vzhledem k ose otáčení. Zavedeme si moment síly jednoduše pro speciální případ síly působící kolmo na (pevnou) osu otáčení tuhého tělesa. V tomto případě je jeho velikost dána součinem (nejmenší) vzdálenosti d vektorové přímky síly od osy otáčení (tzv. rameno síly) a velikosti F této síly, tj. | −→ M| ≡ M = Fd. Směr vektoru −→ M volíme v ose otáčení. K zjištění orientace −→ M si nejprve musíme určit orientaci této osy, tím je totiž zároveň určen kladný smysl otáčení (viz odst. 2.1.8 kinematika tuhého tělesa a pravidlo pravé ruky). Moment síly pak míří ve směru osy otáčení,117 jestliže tato síla „podporuje převládající směr pohybu, což znamená, že míří ve směru (zvoleného) kladného smyslu otáčení a moment síly míří proti směru osy otáčení, když tato síla míří 117 Přesněji, mají stejnou orientaci. 86 v záporném smyslu otáčení. Průmět momentu síly na osu otáčení bude tedy buď kladný +| −→ M| nebo záporný −| −→ M| v závislosti na tom jak síla „podporuje pohyb tuhého tělesa. F F‘ |F‘| = |F| Obrázek 2.47: Rovnováha sil při roztáčení kolotoče Před uvedením názorné ukázky momentů sil si musíme vyjasnit důležitost zavedení tohoto pojmu. Newtonův druhý pohybový zákon platí ve své obecnosti pouze pro hmotné body, pro tuhá tělesa však obecně neplatí.118 To můžeme vidět například i z toho, že i když výslednice všech sil na těleso působících je rovna nule, některé jeho části mohou mít zrychlení nenulové (protože se těleso může otáčet). Pohybovou rovnici, jíž se řídí otáčení tuhého tělesa, lze odvodit užitím druhého Newtonova pohybového zákona na každý element tuhého tělesa (nebudeme dělat). Výsledkem je vztah J−→ε = −→ M (2.84) Všimněte si, že tato rovnice je svým tvarem podobná Newtonově pohybové rovnici 2.52 a tvrdí, že působí-li na těleso momenty sil o výslednici −→ M, začne se otáčet s úhlovým zrychlením −→ε , přičemž konstantou úměrnosti už není jednoduše hmotnost m tělesa jako tomu bylo v Newtonově rovnici, ale veličina J, která závisí na rozložení hmotnosti v tuhém tělese a stejně jako hmotnost je vždy kladná. Tuto veličinu nazýváme moment setrvačnosti tuhého tělesa, její jednotkou je kg m2 (ověřte). Ještě jednou — dospěli jsme k tomu, že dynamiku otáčení tuhého tělesa kolem pevné osy popisujeme rovnicí 2.84, která nám (podobně jako Newtonova pohybová rovnice pro hmotný bod) říká, že tuhé těleso se bude otáčet s úhlovým zrychlením, které bude tím 118 Aby nedošlo k omylu — zkoumáme-li každou částečku tuhého tělesa zvlášť a bereme-li v úvahu i síly, kterými na ni působí všechny ostatní částečky tohoto tělesa, Newtonův pohybový zákon platí pro každou z nich v nezměněném tvaru. 87 větší, čím větší bude výslednice momentů sil na těleso působících. Z rovnice je dále patrné, že orientace úhlového zrychlení a výslednice momentů sil bude shodná, tím je touto rovnicí při zadané výslednici určen i smysl otáčení tuhého tělesa (viz definice úhlového zrychlení v odst. 2.1.8). Moment setrvačnosti J zatím berme jako konstantu, která když je velká, roztáčí se tuhé těleso hůře než když je malá (podobně jako se těleso s větší hmotností roztlačuje hůře než těleso s hmotností menší). Podrobněji se momentem setrvačnosti budeme zabývat až v úvahách o mechanické energii tuhého tělesa. F5 F2 F1 F3 F4 F6 Obrázek 2.48: K definici momentu síly PŘÍKLAD Na obr. 2.48 je silami −→ F1 až −→ F6 znázorněno působení party školáků na kolotoč, jehož kostru tvoří šestiúhelník o straně a (pro jednoduchost nechť všichni školáci tlačí přibližně stejně velkou silou F). Výsledná síla, kterou školáci dohromady na kolotoč vyvíjejí je sice nenulová, ale nechť se vyrovnává s pevností osy otáčení (ložiska kolotoče působí silou stejně velikou opačného směru) — výslednice všech sil působících na kolotoč bude tak nulová. Při pohledu na kolotoč shora si kladný směr zvolíme proti směru pohybu hodinových ručiček a tedy osa otáčení bude orientována směrem vzhůru. Protože síla −→ F1 míří v kladném smyslu otáčení, bude její moment −→ M1 mířit ve směru osy otáčení (průmět −→ M1 na osu bude kladný a jeho velikost bude M1 = Fa. Moment −→ M2 síly −→ F2 bude mířit proti směru osy otáčení a jeho velikost bude M2 = F √ 3 2 a. −→ M3 má stejnou velikost jako −→ M2, ale míří na opačnou stranu. −→ M4 je co do velikosti i směru shodný s −→ M1. Z náčrtku je vidět, že pátý školák tlačí přímo do středu kolotoče a jeho síla −→ F5 míří na osu kolotoče, její rameno je tedy nulové a proto platí −→ M5 = −→ 0 . Konečně pro moment síly −→ F6 platí −→ M6 = −→ M3. Při promítnutí na osu 88 otáčení získáme vyjádření průmětu výsledného momentu síly −→ Mc = 6 j=1 −→ Mj: Mc = M1 + M2 − M3 + M4 − M6 = (2 − √ 3 2 )aF Protože je tento průmět kladný, je vektor −→ Mc orientován shodně s osou otáčení. To ovšem znamená, že se kolotoč bude točit v kladném smyslu s úhlovým zrychlením úhlovým zrychlením o velikosti ε = Mc J kde J je moment setrvačnosti kolotoče. Můžeme shrnout: Podmínkou pro to, aby tuhé těleso nezrychlovalo svůj posuvný ani otáčivý pohyb, je kompenzace všech sil i jejich momentů na toto těleso působících, tzn. působí-li na tuhé těleso n sil (se svými momenty), aby nastala rovnováha, musí být splněny rovnice −→ F1 + −→ F2 + ... + −→ Fn = n j=1 −→ Fj = −→ 0 a (2.85) −→ M1 + −→ M2 + ... + −→ Mn = n j=1 −→ Mj = −→ 0 (2.86) Vektor momentu síly můžeme definovat i přímo pomocí vektoru síly −→ F a polohového vektoru −→r jejího působiště. Ověřte, že vektorový součin −→ M = −→r × −→ F splňuje všechny výše uvedené vlastnosti momentu síly za předpokladu, že počátek souřadnicové soustavy umístíme na osu otáčení. Tato definice momentu síly vhodná, i pro studium působení sil, které nemají směr kolmý na osu otáčení. 2.5.2 Těžiště tuhého tělesa Ještě než se obeznámíme s přiřazením mechanické energie tuhému tělesu, zavedeme si pro popis dynamiky tuhého tělesa další důležitý pojem — těžiště tuhého tělesa (nebo soustavy hmotných bodů). Intuitivně chápeme těžiště tělesa jako místo, pod kterým když je těleso podepřeno (v tíhovém poli Země), nachází se v rovnovážné poloze. Představme si ploché zrcadlo volně visící na stěně a zkoumejme jaké síly a jaké momenty na něj působí, když jej vychýlíme a pustíme (obr. 2.49). Osu otáčení o, která bude v místě závěsu zrcadla orientujeme směrem k nám, přitom předpokládáme dostatečně silný úchyt (pevná osa) — zrcadlo se tedy nebude pohybovat posuvným pohybem a výslednice sil na něj působících bude nulový vektor (součet tíhových sil a síla závěsu se vyrovnává). Vychýlíme-li zrcadlo například v kladném smyslu, bude výslednice sil stále nulová, ale s momenty sil to bude jinak. 89 Abychom si ukázali jak vypadá popis situace pomocí fyzikálních veličin, rozdělíme-li si zrcadlo na malé kousíčky (hmotné body). Výslednici momentů působících sil můžeme určit sčítáním. Pro každý kousek zrcadla bude průsečík vektorové přímky tíhové síly a osy x, jejíž počátek umístíme pod závěs, určovat rameno této síly. Protože momenty sil působících na pravé straně od počátku osy o směřují proti orientaci o (tj. od nás) a momenty sil na levé straně ve směru osy o, budou průměty momentů tíhových sil mít opačná znaménka než průsečíky na ose x. Z toho je vidět, že směr výsledného momentu síly bude orientován za zrcadlo a bude se jej snažit otočit při pohledu od nás ve směru pohybu hodinových ručiček (záporném smyslu). Pro velikost výsledného momentu síly platí: M = M1 + M2 + . . . + Mk + . . . + Mn = m1gx1 + m2gx2 + . . . + mkgxk + . . . + mngxn = = g(m1x1 + m2x2 + . . . + mkxk + . . . + mnxn) ≡ gmxT (2.87) kde mk je celková hmotnost sloupce čtverečků majících souřadnici xk, m ≡ m1+m2+...+mn je celková hmotnost tělesa a definicí xT def = m1x1 + m2x2 + . . . + mnxn m (2.88) byla zavedena x-ová souřadnice těžiště tuhého tělesa. Z rovnice 2.87 vidíme, že celkový moment tíhových sil působících na těleso, lze nahradit momentem síly jediné (Fg = mg), která má působiště právě v těžišti. Z toho plyne, že z hlediska působení tíhových sil, můžeme při otáčení kolem pevné osy tuhé těleso nahradit stejně těžkým hmotným bodem umístěném v jeho těžišti. To ale neznamená se budou stejně těžká tělesa různých tvarů pohybovat stejně (se stejným úhlovým zrychlením). Závislost na tvaru tělesa se projeví v momentu setrvačnosti, který vystupuje v pohybové rovnici 2.84. Z podobných úvah lze odvodit, že těžiště tuhého tělesa jako bodu charakterizujícího působení tíhových sil na těleso nezávisí na jeho natočení, na volbě osy otáčení ani na volbě osy x — pro dané těleso je stále v jednom místě (pozor, může ležet i mimo těleso). Jinými slovy souřadnice těžiště samozřejmě na volbě vztažné soustavy závisí, ale umístění těžiště tuhého tělesa se vzhledem k tělesu samotnému nikdy nemění. Pro jakkoli volenou inerciální vztažnou soustavu (kartézskou) určujeme polohu těžiště tuhého tělesa výpočtem ze známých souřadnic a hmotností příslušných částí tohoto tělesa takto: xT ≡ m1x1 + m2x2 + ... + mnxn m ≡ n j=1 mjxj n j=1 mj yT ≡ m1y1 + m2y2 + ... + mnyn m ≡ n j=1 mjyj n j=1 mj (2.89) zT ≡ m1y1 + m2y2 + ... + mnyn m ≡ n j=1 mjzj n j=1 mj kde pro spojité těleso poroste n nade všechny meze a sumace přejde v integraci. 90 O xT T xk Obrázek 2.49: K zavedení těžiště Bude-li těžiště tělesa umístěno přímo pod osou otáčení, bude i celkový moment tíhových sil vzhledem k této ose nulový a tedy dle 2.84 bude i jeho úhlové zrychlení nulové — těleso se nebude otáčet. 2.5.3 Mechanická energie tuhého tělesa Zkoumejme nejprve kinetickou energii tuhého tělesa otáčejícího se kolem nehybné osy. V části o kinetické energii hmotného bodu jsme si uvedli, že (celková) kinetická energie soustavy hmotných bodů je rovna součtu kinetických energií všech členů takové soustavy. Předpokládejme nyní, že tuhé těleso je sestaveno z n částí, které můžeme považovat za hmotné body. Dále předpokládejme, že se právě otáčí úhlovou rychlostí o velikosti ω a že libovolná (j-tá) z jeho částí má hmotnost mj, rychlost vj a že její vzdálenost od osy otáčení je rj. (Celková) kinetická energie rotačního pohybu tuhého tělesa pak bude dána součtem119 Ek = n j=1 Ekj = n j=1 1 2 mjv2 j = n j=1 1 2 mj(ωrj)2 = 1 2 ω2 n j=1 mjr2 j = 1 2 Jω2 (2.90) kde výrazem J def = n j=1 mjr2 j (2.91) 119 Obvodové rychlosti vj = ωrj (viz rov. 2.51) různých částí tuhého tělesa jsou sice v důsledku různých vzdáleností od osy otáčení obecně různé, ale úhlová rychlost je jim všem společná (těleso se otáčí jako celek), proto můžeme ω vytknout. 91 který určuje rozložení hmotnosti v tělese, je konečně řádně definován moment setrvačnosti zmiňovaný výše. Kinetická energie posuvného pohybu tuhého tělesa je v důsledku toho, že rychlost v každé jeho části je stejná, rovna jednoduše Ek = 1 2 mcv2 kde mc ≡ n j=1 mj je celková hmotnost tělesa. Při zkoumání potenciální energie tuhého tělesa v tíhovém poli si jej opět „rozkousíčkujeme a budeme uvažovat potenciální energii Epj každého kousíčku zvlášť. Abychom nakonec dostali jeho celkovou potenciální energii, všechny tyto příspěvky sečteme: Ep = n j=1 Epj = n j=1 mjghj = g n j=1 mjhj ≡ mghT kde poslední rovností byla definována výška těžiště tělesa v souladu s rovnicemi 2.89. Vidíme, že obdobně jako jsme mohli při zkoumání momentu tíhových sil nahradit tuhé těleso stejně těžkým hmotným bodem umístěným v jeho těžišti, můžeme tak učinit i při vyšetřování tíhové potenciální energie tuhého tělesa. Pro tuhé těleso pohybující se v potenciálových silových polích s celkovou kinetickou energií Ek = 1/2mv2 +1/2Jω2 a celkovou potenciální energií Ep opět platí, že jejich součet se během pohybu (a klidu už vůbec ne :-)) nemění, tj. platí zákon zachování mechanické energie: Eki + Epi = Ekf + Epf Působí-li navíc nekonzervativní síly, které při posunutí tuhého tělesa z místa i do místa f vykonají práci W, bude platit (Ek2 + Ep2) − (Ek1 + Ep1) = W zcela obdobně jako u hmotného bodu (viz rovnice 2.70). 2.6 Mechanika kapalin a plynů neboli tekutin 2.6.1 Tekutiny, tlak a Archimédův zákon Z mechanického hlediska si jsou kapaliny a plyny v mnohém podobné, proto je označujeme společným názvem tekutiny. Na tomto místě tekutiny budeme popisovat pomocí představy o spojitě rozloženém prostředí neboli kontinuu.120 Tekutiny se od pevných látek 120 Tedy prostředí neskládající se z atomů a molekul, ale z teoreticky nekonečně dělitelné látky. O vnitřní mikroskopické struktuře kapalin a plynů si více uvedeme v kapitole 4. 92 liší hlavně tím, že nemají vlastní tvar, ale zaujímají tvar nádoby, v níž se nacházejí. Jsou snadno dělitelné a mohou do nich snadno vnikat jiná tělesa (alespoň do většiny z nich). Pro zjednodušení popisu si opět zavádíme idealizace, a to v podobě ideální kapaliny a ideálního plynu. Tyto ideální tekutiny se vyznačují nulovým vnitřním třením, tzv. viskozitou, která charakterizuje velikost tření mezi jednotlivými vrstvami tekutiny při jejím pohybu. Ideální kapalina je navíc dokonale nestlačitelná, tj. její hustota se s časem nemění. Důležitou veličinou pomocí níž tekutiny popisujeme je tlak. Řekneme, že v bodě B nějaké tekutiny je tlak p, když na jakkoli malinkou rovinnou plošku o obsahu ∆S obklopující tento bod působí kolmo síla o velikosti |∆ −→ FS| nezávisle na orientaci této plošky tak, že platí p def = lim ∆S →0 |∆ −→ FS| ∆S (2.92) ze které ihned plyne jednotka tlaku, kterou nazýváme pascal a značíme Pa, tj. [p] = Pa = N m2 Tlak jako fyzikální veličina samozřejmě není zavedena jen pro tekutiny. Obecně tlačíme-li kolmo (a rovnoměrně) na jednotkovou plošku silou o velikosti p newtonů, vyvíjíme tak tlak p pascalů. Nachází-li se tekutina ve stavu bez tíže, je její tlak ve všech místech stejný. V důsledku působení tíhových sil ovšem tlačí horní vrstvy tekutiny na ty spodní a tlak v ní tak s hloubkou vzrůstá. U plynů se tento tlak projevuje například v tlaku atmosféry, který, jak je známo, s výškou nad zemí klesá (bráno od horní hranice atmosféry — stoupá). V kapalinách tomuto tlaku říkáme hydrostatický tlak, značíme ho ph a lze pro něj z úvah o rovnováze kapaliny vyvodit vztah ph = ρgh, kde h je hloubka pod hladinou a ρ hustota kapaliny. Na povrch kapaliny však ještě může tlačit něco jiného (obvykle to bývá právě zemská atmosféra, ale může to být například i píst hydraulického zvedáku), v takovém případě se tento vnější tlak (ozn. p0) přičítá k tlaku hydrostatickému a v hloubce h pod hladinou je pak tlak p = p0 + hρg Rovnováhu tekutin ilustruje Archimédův zákon. Je-li tekutina o hustotě ρ v klidu, působí na jakoukoli část V0 jejího objemu síly od okolní tekutiny a výslednice −→ Fv těchto sil se musí vyrovnávat s celkovou tíhovou silou −→ Fg na V0 působící, tj. musí být −→ Fv = − −→ Fg. Protože tento vztah platí pro jakoukoli část tekutiny libovolného tvaru, pak nahradíme-li naše „tekutinové těleso o objemu V0 tělesem pevným stejného objemu a tvaru (například kamenem), bude silami okolní tekutiny nadnášeno stejnou silou o velikosti Fv = V0ρg (rozložení sil v okolní tekutině se záměnou tekutiny za pevné těleso nezmění). Protože tato 93 výslednice tlakových sil okolní tekutiny míří vždy směrem vzhůru, říkáme jí vztlaková síla.121 Na základě uvedeného si rozmyslete, proč tělesa s hustotou větší než hustota kapaliny neplovou a naopak. 2.6.2 Proudění kapalin Popis proudění byť jen ideálních tekutin je natolik matematicky náročný, že mu mohou být věnovány až o mnoho pokročilejší partie fyziky. Na tomto místě se proto omezíme na dva nejzákladnější výsledky fyziky ustáleného (neboli stacionárního) proudění ideální kapaliny — důsledek zachování hmotnosti (resp. objemu) a důsledek zachování mechanické energie.122 Tento druh proudění se vyznačuje neměnnými hodnotami tlaku p a rychlosti −→v v každém místě kapaliny, tj. rozložení tlaku a rychlosti v kapalině může být závislé na prostorových souřadnicích, ale nikoli na čase. Je-li kapalina nestlačitelná (tj. má-li všude konstantní hustotu ρ) a proudí-li ustáleným způsobem v potrubí, projde za každou sekundu každým příčným řezem potrubí stejné množství kapaliny. Vteče-li za čas ∆t do místa o průřezu s obsahem S1 kapalina o objemu V rychlostí o velikosti v1, musí v libovolném jiném místě potrubí stejné množství kapaliny vytéci. Zkoumáme-li místo, kde potrubí má průřez S2, vytéká z ní kapalina rychlostí v2 a musí platit rovnice: V = S1v1∆t = S2v2∆t = V =⇒ S1v1 = S2v2 =⇒ Sv = konst. Tato rovnice je matematickým vyjádřením zachování množství kapaliny (kapalina ani nevzniká ani se neztrácí) a říká se jí rovnice kontinuity (spojitosti). Ze zákona zachování mechanické energie pro ideální kapalinu lze sestavit ještě jednu rovnici, důležitou pro určování tlaku v proudících kapalinách (o tom rovnice kontinuity nic neříká, přitom tlak je spolu s rychlostí nejdůležitější dynamickou charakteristikou proudění ideální kapaliny), tzv. Bernoulliovu rovnici: p1 + ρgh1 + 1 2 ρv2 1 = p2 + ρgh2 + 1 2 ρv2 2 Tato rovnice nám říká, že v libovolném místě potrubí bude výraz p+ρgh+ 1 2 ρv2 konstantní, tj. bude platit pro kteroukoli výšku potrubí h s obsahem příslušného průřezu S v němž proudí kapalina hustoty ρ rychlostí o velikosti v. 121 Pro zdůraznění uveďme, že | −→ Fv| = | −→ Fg| = mg = V0ρg, kde m je hmotnost tekutiny nahrazené tělesem. Z této operace je rovněž zřejmá obvyklá slovní formulace Archimédova zákona: „Těleso ponořené do kapaliny je nadlehčováno vztlakovou silou, která se rovná tíze kapaliny tělesem vytlačené. Všimněte si, že my jsme si provedli odvození Archimédova zákona zároveň i pro plyny, jejichž hustota se v oblasti ponořeného tělesa významně nemění. Příkladem vztlakových sil působících v atmosféře jsou lety horkovzdušných balónů nebo vzducholodí naplněných lehkými plyny. 122 Popis proudění ideálního plynu je ještě komplikovanější, protože jeho hustota se může z místa na místo měnit. 94 Kapitola 3 Mechanické kmitání a vlnění V této kapitole se seznámíme s jednou z nejvýznamnějších aplikací Newtonových zákonů — s aplikací na kmitavé a vlnové děje. 3.1 Kmitavý pohyb V životě se setkáváme s kmitavým druhem pohybů například u kyvadla dědečkových nástěnných hodin (kukaček), přímo u samotného dědečka na houpacím křesle, u sedačky pod řidičem autobusu, u kytarové struny, nebo u konce prkna na skokanské věži v bazénu, dokonce i hovor a zpěv jsou vyvolávány kmitavým pohybem hlasivek. Popis kmitavého pohybu začneme zmínkou o rovnovážné poloze. V kapitole o mechanice tuhého tělesa jsme si uvedli, že rovnováha těles spočívá ve vyrovnání působících sil a jejich momentů. Stabilní rovnovážnou polohou tělesa charakterizuje vznik sil, které se jej snaží navrátit zpět. Při přemáhání těchto sil musíme konat práci, která je mírou její stability — čím více práce musíme vykonat, abychom těleso dostali z jedné rovnovážné polohy do jiné, tím je tato poloha stabilnější. Působí-li na těleso síly, které jej opakovaně vyvádí a opět vrací do rovnovážné polohy, vzniká jeho periodicky se opakující pohyb — vzniká kmitání. Nejjednodušeji popsatelným periodickým pohybem je pohyb hmotného bodu po části přímky (úsečce), zapříčiněný vratnou silou, která je přímo úměrná výchylce z rovnovážné polohy. Takováto síla se snaží vrátit hmotný bod zpět do rovnovážné polohy tím více, čím více je od ní vzdálen. Označímeli jako Fv průmět vratné síly −→ Fv do osy x, můžeme tento vztah matematicky vyjádřit Fv = −kx (3.1) Záporné znaménko signalizuje, že průmět této síly míří vždy na opačnou stranu než souřadnice x kmitajícího tělesa (výchylka z rovnovážné polohy). Na obrázku 2.32 tuto vratnou sílu zapříčiňuje pružina (proto síla pružnosti) a konstantu úměrnosti k pak nazýváme tuhost pružiny (jakou má jednotku?), ale existuje mnoho sil, které jsou v jistém přiblížení takto úměrné výchylce tělesa z rovnovážné polohy,1 konstanta úměrnosti pak již nebude 1 Například kmitání splávku na hladině rybníka zapříčiňují vztlaková a tíhová síla. 95 tuhost pružiny, ale stále bude charakterizovat, jak mocně je těleso k rovnovážné poloze poutáno. Z druhého Newtonova zákona (tj. řešením pohybové rovnice max = −kx) vyplývá, že takovýto pohyb (nazýváme ho harmonickým) lze vždy popsat funkcí ve tvaru: x(t) = xm cos(ωt + ϕ0) (3.2) kde xm je maximální možná výchylka z rovnovážné polohy zvaná amplituda výchylky, ω = k/m je tzv. úhlová frekvence a ϕ0 je počáteční fáze kmitavého pohybu. Součet ωt + ϕ0 se nazývá fáze harmonického pohybu.2 Již z definice funkce kosinus lze vidět, že kmitavý pohyb lze studovat jako x-ový průmět polohového vektoru bodu, který se rovnoměrně pohybuje po kružnici (viz obr. 3.1), kde poloměr této kružnice je roven amplitudě výchylky, úhlová rychlost tohoto pohybu je číselně shodná s úhlovou frekvencí kmitání (proto i stejné označení) a fázi určuje úhel, který vektor v čase t svírá s osou x. x wt j0 xm x Obrázek 3.1: K souvislosti kruhového a kmitavého pohybu V kinematice otáčení tuhého tělesa (odst. 2.1.8) jsme zavedli pojmy perioda T a frekvence f, které mají v důsledku příbuznosti kruhového a harmonického pohybu zcela analogický smysl i u studia kmitání. Periodou kmitání se zde rozumí doba, po které se kmitavý 2 Protože konstanta k tak přímo souvisí s frekvencí kmitání a hmotností tělesa, často se vztah 3.1 zapisuje ve tvaru Fv = −mω2 x. 96 pohyb opět opakuje, tj. proběhne jeden kmit (fáze kmitání se změní o 2π). Frekvencí kmitání rozumíme počet kmitů za časovou jednotku, opět tedy platí vztah fT = 1 a úhlová frekvence je ω = 2πf. Užitím souvislosti kruhového a kmitavého pohybu (nebo užitím diferenciálního počtu) lze ukázat, že pro x-ové průměty rychlosti a zrychlení harmonicky kmitajícího hmotného bodu platí: vx(t) = −ωxm sin(ωt + ϕ0) ax(t) = −ω2 xm cos(ωt + ϕ0) = −ω2 x Zakreslíte-li si funkce x(t), vx(t) a ax(t) do jediného grafu (závislost na čase), můžete se snadno přesvědčit, že jejich průběhy splňují intuitivní představy o kmitavém pohybu: Je-li výchylka největší, rychlost je nulová a zrychlení maximální (= ω2 xm), ovšem mířící proti výchylce. Prochází-li kmitající těleso rovnovážnou polohou, je jeho rychlost maximální (= ωxm) a jeho zrychlení je nulové.3 Těleso pohybující se pouze v důsledku působení sil pružnosti nazýváme harmonický oscilátor. V části o mechanické energii (viz odst. 2.3.2) jsme si odvodili vztah pro potenciální energii harmonického oscilátoru o hmotnosti m, kmitajícího s úhlovou frekvencí ω = k/m a vychýleného x metrů z rovnovážné polohy: Ep = 1 2 kx2 = 1 2 mω2 x2 . Pro celkovou mechanickou energii harmonického oscilátoru tak v každém okamžiku t máme Em(t) = 1 2 m[v(t)]2 + 1 2 mω2 [x(t)]2 = 1 2 m[ω2 x2 m sin2 (ωt + ϕ0) + ω2 x2 m cos2 (ωt + ϕ0)] = = 1 2 mω2 x2 m = E0 (3.3) Při harmonickém kmitání oscilátoru se periodicky mění potenciální energie na kinetickou a naopak, celková mechanická energie je však v každém okamžiku konstantní. Harmonické kmity může vykonávat i tzv. matematické kyvadlo, což je hmotný bod (malé těleso) zavěšený na vlákně o zanedbatelné hmotnosti v tíhovém poli (viz příklad na str. 57). Kmitá-li toto kyvadlo jen v malém intervalu úhlů (zhruba do 5◦ ) můžeme jeho pohyb považovat za harmonický s úhlovou frekvencí kmitání ω = g/l, kde l je délka vlákna a g je velikost tíhového zrychlení.4 3.2 Vlnění 3.2.1 Popis vlnového pohybu Dosud jsme se zabývali „osamocenými harmonickými oscilátory, tj. oscilátory, u kterých se během pohybu neměnila jejich mechanická energie. Představíme-li si mnoho takových 3 Na střední škole je obvyklejší popisování harmonického kmitavého pohybu pomocí funkce sinus, vzhledem k platnosti cos ϕ = sin(ϕ + π/2) je to jen otázka volby počáteční fáze. 4 Všimněte si, že konstanta úměrnosti („tuhost ) je zde rovna mg/l. 97 oscilátorů, které jsou navzájem svázány pružnou silou, bude se kmitavý pohyb (a energie) vzniklý v jednom z nich přenášet i na ostatní — tomuto procesu říkáme mechanické vlnění. Mechanické (přesněji elastické) vlnění vzniká v prostředích, kde se rozruch (kmitání) přenáší působením sil pružnosti (elastické síly). Obecně je vlnění fyzikální děj, jehož podstatou je šíření určitého rozruchu látkovým prostředím nebo polem, například elektromagnetickým polem se mohou šířit elektromagnetické vlny. Jelikož různé druhy vlnění mají mnoho společného, vysvětleme si základní pojmy na jednoduchém vlnění mechanickém.5 Jestliže zdroj rozruchu kmitá harmonicky, vzniká v pružném (bezztrátovém) prostředí harmonické vlnění, které se šíří rychlostí o velikosti v (rychlost šíření vlnění v daném prostředí, závisí na vlastnostech tohoto prostředí), říkáme, že vzniklo postupné vlnění. Jestliže zdroj vykonal jeden kmit s periodou T, rozšíří se za tuto dobu vlnění do vzdálenosti λ = vT, kterou nazýváme vlnová délka. Je-li směr pohybu částic prostředí, jimiž vlnění prochází, kolmý na směr šíření vlnění, mluvíme o vlnění příčném, pohybují-li se částice prostředí ve směru postupu vlnění, označujeme ho jako vlnění podélné. I když nadále budeme matematicky vyšetřovat pouze vlnění příčná, závěry ke kterým dojdeme budou platit i pro vlnění podélná. x y Obrázek 3.2: Řada svázaných oscilátorů Při popisu příčného harmonického vlnění se snažíme jedinou rovnicí popsat pohyb (výchylku v závislosti na čase) každého bodu prostředí. Obecně je popis takového pohybu značně komplikovaný, proto se pro jednoduchost zabývejme pouze popisem vlnění vzniklého v dlouhé řadě pružně svázaných oscilátorů s rovnovážnou polohou na ose x, které mohou kmitat pouze ve směru osy y (viz obr. 3.2). Umístíme-li zdroj harmonického kmitání do počátku souřadnicové soustavy, bude jeho pohyb popsán rovnicí y = ym cos(ωt + ϕ0).6 Šíří-li se vlnění z tohoto zdroje rychlostí o velikosti v v kladném směru osy x, bude stejnou rovnicí popsán i bod ve vzdálenosti x od zdroje, ovšem v čase o x/v pozdějším. To 5 Nadále budeme mluvit pouze o prostředích, v nichž můžeme zanedbat ztráty mechanické energie vzniklé v důsledku tření jednotlivých částí těchto prostředí při vzájemných (kmitavých) pohybech. 6 Přestože na pohyb oscilátoru ve svislé rovině má nyní vliv i tíhová síla (a tedy bychom ji měli zahrnout do pohybové rovnice), ukazuje se, že tvar rovnice 3.2 popisující harmonické kmitání to nezmění. 98 znamená, že v okamžiku, kdy fáze zdroje bude ωt + ϕ0, bude oscilátor na souřadnici x teprve ve fázi, kterou měl zdroj o x/v dříve, tj. bude mít fázi ω(t − x/v) + ϕ0. Protože jsme si vybrali souřadnici x libovolně, můžeme obecně pohyb jakéhokoliv oscilátoru, do kterého dospěje (netlumené) postupné příčné vlnění z harmonického zdroje, popsat v čase t výchylkou z rovnovážné polohy ve tvaru y(x, t) = ym cos ω(t − x v ) + ϕ0 = ym cos 2π( t T − x λ ) + ϕ0 (3.4) Z tohoto zápisu vyplývá i souvislost vlnové délky s fází přenášeného kmitavého pohybu (vlnění). Posuneme-li se totiž o vzdálenost jedné vlnové délky od místa se souřadnicí x, tj. do místa o souřadnici x + λ, bude v obou těchto místech fáze (a u netlumeného vlnění i výchylka) kmitání částic stejná,7 protože platí y(x + λ, t) = ym cos 2π( t T − x + λ λ ) + ϕ0 = ym cos 2π( t T − x λ ) + 2π + ϕ0 = ym cos 2π( t T − x λ ) + ϕ0 = y(x, t) Vlnění se v naší řadě oscilátorů samozřejmě šíří ze zdroje (v počátku) i proti směru osy x — na levé straně od zdroje má tedy vektor rychlosti šíření vlnění záporný průmět na osu x a platí y(x, t) = ym cos ω(t + x v ) + ϕ0 = ym cos 2π( t T + x λ ) + ϕ0 (3.5) Povšimněme si, že body x a −x souměrně položené kolem počátku kmitají ve stejných časech se stejnou fází (mají stejnou výchylku). Pokud se zdroj nenachází v počátku soustavy souřadnic (označme jeho souřadnici x0), nezávisí zřejmě fáze vlnění v x již na vzdálenosti od počátku, ale od zdroje. Protože vzdálenost x a x0 je dána jejich rozdílem, je nutné v tomto případě výraz 3.4 upravit na y(x, t) = ym cos ω(t − x − x0 v ) + ϕ0 = ym cos 2π( t T − x − x0 λ ) + ϕ0 (3.6) Celkem je tedy netlumená příčná vlna šířící se řadou vázaných oscilátorů rychlostí o velikosti v, vyvolaná harmonicky kmitajícím zdrojem se souřadnicí x0, s úhlovou frekvencí ω, s maximální výchylkou xm a s počáteční fází ϕ0, popsaná vztahy: y(x, t) = ym cos ω(t + x − x0 v ) + ϕ0 pro x ≤ x0 y(x, t) = ym cos ω(t − x − x0 v ) + ϕ0 pro x ≥ x0 7 Přestože přísně vzato, částice vzdálené o vlnovou délku mají posunuté fáze o 2π, říkáme obvykle, že kmitají se stejnou fází, neboť funkce kosinus je 2π periodická. 99 Všimněme si, že pro oscilátory se souřadnicemi x > x0 by se nic nezměnilo, kdyby jsme zdroj posunuli o λ v kladném či záporném směru osy x. Zajímejme se nyní pro jednoduchost o vlnění buzené zdrojem v počátku, přitom položme počáteční fázi rovnu nule. Kmitání oscilátorů se souřadnicemi x > 0 se nezmění, posuneme-li zdroj z počátku na souřadnici −λ. Nezmění se nic ani když zdroj posuneme o celočíselný násobek λ. Rovnice vlnění pak pro x > 0 bude stále y(x, t) = ym cos ω(t − x + nλ v ) = ym cos ω(t − x v ) V úlohách o vlnění, kde je zdroj značně vzdálen od místa, které je pro nás zajímavé, často uvažujeme, že zdroj je od nás vzdálen kdesi v nekonečnu (na ose x v mínus nekonečnu) a vlnění pak ve všech bodech na ose x popisujeme jedinou rovnicí y(x, t) = ym cos ω(t − x v ) (3.7) Poslední výraz popisuje příčné netlumené vlnění šířící se rychlostí v v kladném směru osy x, které vzniklo velmi dávno z velmi vzdáleného zdroje harmonických kmitů. 3.2.2 Interference vlnění Ne vždy je snadné odhalit přítomnost vlnového procesu (vlnění), zejména jedná-li se o výchylky jiných fyzikálních veličin než polohy mechanických oscilátorů. Existuje však jev, který přítomnost vlnění prozrazuje, aniž bychom museli zkoumat celou oblast mezi zdrojem a detektory. Tato téměř určující vlastnost vlnění se nazývá interference. Představme si, že naší řadu oscilátorů v ose x křižuje obdobná řada oscilátorů s rovnovážnou polohou v ose z. Nechť bylo vlnění v řadě x i z vyvoláno vzdálenými nezávislými ale jinak stejnými harmonickými zdroji a nechť v x je popsáno vztahem 3.7 a v z vztahem ym cos ω(t − z v ) (3.8) Protože oscilátory jsou vázány pouze pružnými silami a pružné síly splňují již zmiňovaný princip superpozice, bude výchylka „křížového bodu (počátku) dána součtem výchylek způsobených každým z uvedených vlnění samostatně. Říkáme, že oscilátor v počátku vykonává složené kmity, přitom tyto kmity vyvolala dvě různá vlnění, platí tak8 y(x = 0, z = 0, t) = ym cos ω(t − x v ) + ym cos ω(t − z v ) = = 2 cos π λ (z − x) cos ω t − 1 v z + x 2 = 2 cos[ωt] 8 Z vlastností trigonometrických funkcí lze odvodit součtový vzorec cos α + cos β = 2 cos α − β 2 cos α + β 2 100 Vidíme tedy, že oscilátor vykonává harmonické kmity se stejnou frekvencí jako oba zdroje, ale s dvojnásobnou amplitudou! Představme si nyní, že vlnění v řadě z bude popsáno rovnicí ym cos ω(t − z v ) + π (3.9) to znamená, že počáteční fáze zdroje v z bude vůči zdroji x posunuta o π.9 Oscilátor v počátku pak bude kmitat v souladu s rovnicí y(x = 0, z = 0, t) = ym cos ω(t − x v ) + ym cos ω(t − z v ) + π = = 2 cos π λ (z − x) + π 2 cos ω t − 1 v z + x 2 + π 2 = 2 cos π 2 cos ωt + π 2 = 0 Tedy bude v klidu, a to přesto, že jím prochází dvě vlnění! z x Obrázek 3.3: Rovina pokrytá oscilátory kmitajícími ve směru osy y Podívejme se nyní na to, co by se stalo, kdyby pružnou vazbou spojené oscilátory byly rozprostřeny po celé rovině xz, tj. nejen v řadách na osách x a z (viz obr. 3.3). Vlnění šířící se ve směru osy x by mohla vyvolávat dlouhá harmonicky kmitající tyč položená kolmo 9 Tento posun lze interpretovat tak, že zdroj v z začal kmitat o půl periody dříve než zdroj v x. Stejný posun bychom získali, kdyby byl zdroj v z o polovinu vlnové délky (nebo její lichý násobek) blíže k počátku než zdroj v x (důkladně si rozmyslete!). 101 na tuto osu (tj. ležela by v z). Kmitání každého bodu v rovině se stejnou souřadnicí x (s různými z) bychom mohli popsat známou rovnicí yx(x, z, t) = ym cos ω(t − x v ) Obdobně pro vlnění šířící se ve směru osy z — oscilátory se stejnou souřadnicí z kmitají v souladu s rovnicí yz(x, z, t) = ym cos ω(t − z v ) V libovolném oscilátoru se souřadnicemi [x, z] se budou podle principu superpozice vlnění překládat a výsledné kmitání pak bude yv(x, z, t) = yx(x, z, t) + yz(x, z, t) = 2 cos π λ (z − x) cos ω t − 1 v z + x 2 (3.10) Výraz ω t − 1 v z + x 2 odpovídá fázi nějaké vlny šířící se rychlostí v (dál nás nebude zajímat). Absolutní hodnota výrazu 2 cos π λ (z − x) odpovídá amplitudě této vlny, měnící se v závislosti na poloze oscilátoru.10 S rozdílem souřadnic se amplituda bude měnit od 0 do 2. Budou-li souřadnice oscilátoru takové, že z−x bude sudým násobkem λ/2, bude oscilátor kmitat s maximální amplitudou11 — říkáme pak, že vlny yx(x, z, t) a yz(x, z, t) se v bodě [x, z] skládají konstruktivně a samotný proces se nazývá konstruktivní interference. Bude-li z−x lichým násobkem λ/2,12 bude oscilátor neustále v klidu a říkáme, že nastala destruktivní interference. Právě skutečnost, že šíříli se prostředím více vzruchů najednou, mohou se navzájem úplně eliminovat, dělá vlnění tak zajímavým objektem studia v celé fyzice. Prozkoumejme nyní, jak spolu budou interferovat vlnění, která postupují v jedné řadě proti sobě. Mějme opět řadu oscilátorů v ose x, nechť oscilátor na souřadnici x1 je zdrojem vlnění postupujícího v kladném směru a oscilátor na souřadnici x2 > x1 je zdrojem vlnění postupujícího v záporném směru osy x. Výsledné vlnění mezi oběma zdroji bude popsáno rovnicí y(x, t) = y1(x, t) + y2(x, t) ≡ = ym cos ω(t − x − x1 v ) + ym cos ω(t + x − x2 v ) = 2ym cos 2π λ x − x1 + x2 2 cos ω t + 1 v x1 − x2 2 10 Přísně vzato zde λ = ω/v již neoznačuje vlnovou délku výsledné vlny, ale tím si nebudeme komplikovat život a budeme pro ω/v toto označení užívat i nadále. 11 Pro n ∈ Z je | cos[2n(π/2)]| = 1 12 Pro n ∈ Z je cos[(2n + 1)π/2] = 0 102 Vidíme, že se nám nyní časová a prostorová část popisu vlny oddělila. Člen cos ω t + 1 v x1 − x2 2 ≡ cos[ωt + ϕ0] charakterizuje harmonický kmit s úhlovou frekvencí ω,13 člen 2ym cos 2π λ x − x1 + x2 2 bude určovat výslednou amplitudu tohoto kmitání. Závisí nejen na souřadnicích zdroje jako v případě skládání vln šířících se stejným směrem, ale rovněž na poloze bodu, do kterého obě vlnění dorazila. Například v bodě o souřadnici xs = (x1 + x2)/2 (což je střed mezi zdroji) bude oscilátor kmitat v souladu s rovnicí y(xs, t) = 2ym sin (ωt + ϕ0) Se stejnou amplitudou bude kmitat i každý bod prostředí mezi zdroji, který je od xs vzdálen o celý násobek poloviny vlnové délky, neboť platí 2ym cos 2π λ ((xs ± nλ/2) − xs) = 2ym cos π(±n) = ±2ym, kde n ∈ N. Říkáme, že takovýto bod se nachází na kmitně výsledného vlnění. Z uvedeného je ale již vidět, že mezi zdroji existují i body, které vůbec nekmitají, jinak řečeno — jejich amplituda je nulová. Obrátíme-li předešlé úvahy, zjišťujeme, že n v předchozím vztahu by pro takové body muselo být lichým násobkem čísla 1 2 , z čehož plyne, že body vzdálené o lichý násobek čtvrtiny vlnové délky od středu mezi zdroji vlnění budou v klidu. Říkáme, že takovýto bod tvoří uzel výsledného vlnění. Vlnění tohoto druhu proto nazýváme stojatým vlněním a v životě se s ním setkáváme například u hudebních nástrojů. Postupné vlnění charakterizuje, že všechny body prostředí kmitají se stejnou amplitudou a každý následující bod dosahuje stejné výchylky později než bod předcházející (viz „kanadská vlna diváků na stadiónech), fáze tohoto vlnění se šíří prostředím jistou rychlostí (tzv. fázová rychlost).14 Postupné vlnění je schopné přenosu energie aniž by byly přenášeny částice. Naproti tomu stojaté vlnění se vyznačuje kmitáním částic prostředí s různou amplitudou, ale jejich fáze je během pohybu stejná, stojatým vlněním se energie mezi částicemi nepřenáší. Šíření vlnění v prostředí je samozřejmě určováno vlastnostmi tohoto prostředí. Zabývejme se nyní ve stručnosti zkoumáním vlnění ve stejnorodých (homogenních) prostředích a jevy na jejich rozhraní. 13 ϕ0 ≡ ω(x1 − x2)/2, můžeme považovat za počáteční fázi kmitání. 14 Přívlastek „fázová se užívá zejména kvůli odlišení od tzv. „grupové rychlosti. Zatímco fázová rychlost určuje prostoročasovou změnu fáze vlnění, grupová rychlost vlnění udává, jakou rychlostí jsou vlny schopny přenášet energii či signály. Fázová rychlost může být i nadsvětelná, kdežto grupová nikoli. 103 3.2.3 Šíření vlnění a Huygensův princip Šíří-li se vlnění v třírozměrném prostoru ve stejnorodém prostředí15 fázovou rychlostí o velikosti v z kulového zdroje, dorazí za čas t ve všech směrech do vzdálenosti r = vt. Částice prostředí ležící na kouli o poloměru r tak kmitají se stejnou fází, říkáme, že tyto body leží na stejné vlnoploše. Pro nebodový (či nesférický) zdroj nebo pro nestejnorodé prostředí již vlnoplocha nemusí být kulová. Kolmice k vlnoploše určuje směr šíření vlnění (a přenos energie) a orientujeme-li ji ve směru od zdroje, nazývá se paprsek. Zajímavý pohled na šíření vlnění přinesl zhruba před 350-ti lety Christian Huygens (velký Newtonův současník), který objevil matematický způsob konstrukce vlnoplochy v čase t + ∆t, známe-li ji v čase t (nepotřebujeme tedy znát polohu zdroje). Huygens tvrdí, že každá částice prostředí, k níž v okamžiku t dorazilo vlnění, se stává novým (tzv. elementárním) zdrojem vlnění, které se z něj šíří nezávisle na ostatních částicích do okolního prostředí. Všechna vlnění z těchto zdrojů spolu podle principu superpozice interferují a vzniká výsledné vlnění, jehož vlnoplochu konstruujeme jako vnější obálku (ve směru šíření vlnění) jednotilvých vlnoploch vzniklých elementárních zdrojů. Mimo výslednou vlnoplochu se elementární vlnění skládá destruktivně. 3.2.4 Odraz a lom vlnění Zákon odrazu Dopadá-li vlnění na rozhraní oddělující dvě prostředí, v nichž se šíří s různou fázovou rychlostí, obvykle se částečně od rozhraní odrazí a částečně proniká do druhého prostředí. Z Huygensova principu lze odvodit, že úhel dopadu a úhel odrazu vlnění na rovinném rozhraní jsou shodné. Při užití „paprskového vyjádření pak tvrdíme, že úhel sevřený paprskem dopadajícím na rozhraní dvou prostředí a kolmicí na toto rozhraní vztyčenou (úhel dopadu α) se rovná úhlu sevřenému danou kolmicí a odraženým paprskem (úhel odrazu α′ ). Navíc odražený paprsek leží v rovině určené kolmicí a dopadajícím paprskem (rovina dopadu). Zákon lomu Proniká-li vlnění z jednoho prostředí, kde se šíří fázovou rychlostí o velikosti v1 do druhého prostředí, v němž jeho fázová rychlost má velikost v2 = v1, nastává lom vlnění. Vyznačuje se změnou směru paprsků dopadajících na rozhraní takovýchto dvou prostředí. Z Huygensova principu lze ukázat, že úhel α2 lomeného paprsku (opět měřeného od kolmice) souvisí s úhlem dopadu α1 díky vztahu sin α1 sin α2 = v1 v2 přičemž lomený paprsek rovněž též leží v rovině dopadu. Všimněme si, že je-li v1 > v2, je i α1 > α2 a vlnění se ze svého přímočarého šíření odchyluje směrem ke kolmici.16 Pro v1 < v2 se vlnění odklání blíže k rozhraní (od kolmice). V tomto případě můžeme najít tzv. mezní úhel dopadu αm takový, že lomený paprsek 15 Takové prostředí si můžeme představit jako prostorový soubor navzájem pružně svázaných oscilátorů. 16 Musíme si uvědomit, že úhly α se pohybují pouze v intervalu 0◦ , 90◦ , kde je funkce sinus ryze rostoucí. 104 se již do druhého prostředí nedostane a vlnění se šíří podél rozhraní (α2 = 90◦ ). Při úhlech dopadu α1 > αm už vlnění není schopno do druhého prostředí zcela proniknout a pouze se odráží, nastává tzv. úplný odraz. Pro mezní úhel ze zákona lomu plyne: sin αm = v1 v2 . Důležitou skutečností rovněž je, že frekvence vlnění se při přechodu z jednoho prostředí do druhého nemění (elementární zdroje kmitají v obou prostředích se stejnou frekvencí). U mechanického vlnění, jakým je například zvuk, je lom běžně těžko pozorovatelný. Je však dobře známo, že světlo při vstupu do jiného prostředí také mění svůj směr, tato podobnost však není náhodná — ukazuje se totiž, že světlo se v určitém smyslu chová rovněž jako vlnění a v tomto přiblížení pro něj také platí Huygensův princip. Proto světelné paprsky splňují zákon odrazu i lomu. U světla se projevují i další vlastnosti charakteristické pro mechanická vlnění jimiž jsme se zde zabývali. O něco podrobněji je probereme v optice (kap. 6). 105 Kapitola 4 Struktura látek a přeměny energie V této kapitole se ve stručnosti seznámíme se základy popisu struktury látek a přenosu a přeměn tepla na jiné formy energie. Do první čtvrtiny dvacátého století již bylo nashromážděno takové množství experimentálního i teoretického materiálu, že prakticky žádný z významnějších fyziků či chemiků nepochyboval, že látky, z kterých je tvořen svět kolem nás i my sami, nevyplňují „přidělený prostor spojitě, ale v jakýchsi chuchvalcích hmoty s konkrétní hmotností a určitým objemem. Dělíme-li tyto chuchvalce ještě dále na menší části, ztrácejí již tyto části vlastnosti charakteristické pro původní látku — buď se přemění na chuchvalce charakteristické pro jinou látku, nebo přestanou být elektricky neutrální (nebo obojí). Ještě neutrální „charakteristické chuchvalce látky nazýváme molekuly této látky. Atomy pak nazýváme molekuly, které při jakémkoli dalším dělení již nezůstávají elektricky neutrální — mohou být rozloženy na ionty a elektrony. Přitom elektronům, které jsou pro všechny atomy naprosto stejné, byl z historických důvodů připsán záporný elektrický náboj, atom s odtrženým jedním nebo několika elektrony (iont) je pak kladně nabitý a říkáme mu kationt.1 Látky složené z atomů stejného druhu nazýváme prvky. Například při dělení vody na stále menší kapičky lze nakonec dosáhnout bodu, ve kterém dostáváme chuchvalce-molekuly charakteristické pro látku kyslík a pro látku vodík. Štěpením molekuly vodíku či molekuly kyslíku již nezískáme molekuly jiné látky, ale opět molekuly (resp. nyní již atomy) vodíku nebo kyslíku. Dalším štěpením již získáváme elektrony a kladně nabité ionty vodíku a kyslíku. Proto jsou kyslík a vodík prvky, ale voda nikoli. Strukturou atomů a molekul se zabývají rozsáhlé oblasti výzkumu na pomezí fyziky a chemie — těchto partií se krátce dotkneme v kapitole 7 věnované hlubšímu mikrosvětu. V této kapitole nás bude zajímat, jak nám výše uvedené poznání může pomoci v popisu struktury látek a přeměn forem energie a do jaké míry je vůbec k tomuto popisu nezbytné. Zmíníme se také o obecných zákonitostech charakterizujících systémy s velkým počtem molekul — tzv. makroskopické systémy. 1 Původně neutrální atomy jsou často schopny utvořit stabilní systém s jedním nebo několika elektrony navíc — jsou pak záporně elektricky nabité a říkáme jim anionty. 106 Přestože klasická mechanika, s jejímiž základy jsme se seznamovali v předchozích dvou kapitolách, dává při popisu dějů v mikrosvětě mnoho nesprávných předpovědí, můžeme se prozatím tvářit, že to není tak hrozné a předpokládat, že pohyb molekul, ze kterých se všechny látky skládají, je určen Newtonovými zákony. V tom případě bychom pro systém N molekul, u nichž bychom znali vyjádření sil jimiž na sebe působí, mohli sestavit soustavu N rovnic ve tvaru mk −→ak = −→ Fk kde k = 1, 2, . . . , N a −→ Fk je výslednice všech sil působících na k-tou molekulu o hmotnosti mk a výsledném zrychlení −→ak. Úplnou informaci o vývoji celého systému bychom pak získali vyřešením této soustavy rovnic (diferenciálních) při zadaných počátečních podmínkách −→r k(0) a −→v k(0) známých pro všechny molekuly, tj. nalezli bychom závislosti polohových vektorů všech molekul na čase. Naděje vkládané do tohoto postupu jsou však plané. Běžné makroskopické systémy (o ty nám nyní jde) sestávají obvykle z více než 1020 molekul. Řešení takto ohromné soustavy rovnic není v reálném časovém horizontu možné ani na nejlepších počítačích, a to ani ve střednědobém výhledu do budoucna. Problémem i do vzdálenější budoucnosti ovšem zůstává, že u reálných systémů nikdy nebudeme schopni poznat přesné počáteční podmínky tak velkého souboru — a ty jsou k jednoznačnému řešení nezbytné. Na první pohled by se mohlo zdát, že s rostoucím počtem molekul nepředstavitelně roste složitost chování celého systému. Úžasnou vlastností přírody však je, že i velice rozsáhlé systémy mohou vykazovat jednoduché chování. Například ve vypité dvoulitrové pet láhvi se za atmosférického tlaku a letní teploty 25 ◦ C nachází asi 5·1022 molekul vzduchu, ale přesto se tento plyn s dobrou přesností řídí jednoduchou stavovou rovnicí pV = NkBT,2 kde p je tlak plynu, V je jeho objem, N počet molekul, T je jeho teplota v tzv. termodynamické stupnici3 a kB je (univerzální) konstanta, tzv. Boltzmannova konstanta (kB ∼ 1, 38 · 10−23 J/K).4 Pomocí základních předpokladů o struktuře a vzájemných interakcích molekul lze, za použití metod teorie pravděpodobnosti a matematické statistiky, podobné zákonitosti, jimiž se makroskopické soustavy řídí, odvodit deduktivní cestou. Historickým jádrem této oblasti zvané molekulová fyzika je kinetická teorie látek se kterou se v dalším seznámíme. Makroskopickým soustavám vládnou tak obecné zákony, že často není nutné k jejich mikroskopické struktuře přihlížet. Například, než se zjistilo, že teplo je jen makroskopickým projevem mikroskopického neuspořádaného pohybu molekul a atomů, přišlo se nejprve na řadu „tepelných zákonů , které šlo (alespoň z části) vysvětlit i bez přihlédnutí k částicové struktuře látky. Zkoumáním tepelných jevů z takovéhoto makroskopického hlediska se zabývá obor fyziky zvaný termodynamika. Termodynamika tedy studuje obecné vlastnosti makroskopických soustav a obecné zákonitosti makroskopických procesů (zejména 2 Tato rovnice přesně platí pouze pro tzv. ideální plyny, což jsou plyny tvořené pouze molekulami o zanedbatelném objemu, které (vyjma krátkých pružných srážek) na sebe vůbec nepůsobí. 3 Termodynamická teplotní stupnice se od běžně užívané stupnice Celsiovy liší pouze posunutím svého počátku o 273, 15 ◦ C za bod mrazu, jiným názvem teplotní jednotky (kelvin) a zejména hlubším fyzikálním významem. 4 Spojením „univerzální konstanta je zde míněno to, že tato fyzikální veličina má ve všech známých procesech ve vesmíru stále stejnou hodnotu. 107 týkajících se transformace energie), popisuje tak tyto procesy bez ohledu na částicovou povahu látek — tento přístup k popisu reality se nazývá fenomenologickým. S tímto přístupem k popisu chování makroskopických soustav, spočívajícím zejména na několika tzv. termodynamických zákonech se rovněž ve stručnosti seznámíme. Souvislost termodynamických a statistických zákonů se nejjednodušeji ilustrují na modelu ideálního plynu. O ideálním plynu jako zjednodušení plynů reálných5 předpoklá- dáme: 1) Rozměry molekul ideálního plynu jsou zanedbatelně malé ve srovnání se střední vzdáleností molekul od sebe. 2) Molekuly ideálního plynu na sebe kromě vzájemných srážek nepůsobí (srážky trvají jen velmi krátce v porovnání s ”dobou volnosti” molekul). 3) Vzájemné srážky molekul ideálního plynu a jejich nárazy na stěny nádoby jsou dokonale pružné. 4.1 Základní pojmy kinetické teorie látek Již několikrát zmiňovaný Richard P. Feynman ve svých přednáškách [40] (str. 16) uvedl: „Kdyby při nějaké katastrofě zanikly všechny vědecké poznatky a dalším generacím by měla zůstat jen jediná věta, které tvrzení by při nejmenším počtu slov obsahovalo nejbohatší informaci? Jsem přesvědčen, že je to atomová hypotéza (nebo atomový fakt, nebo jak to chcete nazvat), že všechny věci se skládají z atomů — malých částic, jež jsou v neustálém pohybu a vzájemně se přitahují, když jsou od sebe trochu vzdálené, ale odpuzují se, když jsou těsně u sebe. V této jediné větě, jak uvidíte, je obsaženo nesmírné množství informací o světě. Je k tomu třeba jen trochu představivosti a uvažování. Dále Feynman ukazuje, jak z tohoto jednoduchého předpokladu plyne chápání tepla a teploty, úměrnost mezi tlakem plynu a jeho hustotou, souvislost stlačování a rozpínání plynu se vzrůstem a poklesem teploty. Dále jednoduše popisuje procesy tání a vypařování, chemické reakce, ... . My na tomto místě bohužel nemáme prostor dokázat Feynmanova slova, ale alespoň se stručně seznámíme se základními pojmy a představami kinetické teorie látek, jejíž jádro tvoří právě ona věta, obvykle rozepisovaná do tří výroků: 1) Látky všech skupenství se skládají z atomů, molekul nebo iontů (souhrnně částice). 2) Tyto částice jsou v neustálém neuspořádaném (chaotickém) pohybu zvaném tepelný pohyb. 3) Částice na sebe navzájem působí silami, které jsou při malých vzdálenostech odpudivé a při větších přitažlivé. 5 Při vyšších teplotách a nevelkých tlacích je přiblížení ideálního plynu pro většinu plynů reálných značně přiléhavé. 108 Historie spjatá s přesvědčením celé fyzikální obce o existenci molekul je velmi zajímavá. Zatímco někteří významní fyzikové přelomu 19. a 20. století již přemýšleli nad vnitřní strukturou atomů, významná část vědců té doby jejich samotnou existenci popírala — asi největší zastánce atomové povahy hmoty Ludwig Boltzmann si dokonce v návalu deprese, způsobené mimo jiné i frustrací ze subjektivního pocitu vědecké izolace, vzal ještě v roce 1906 život. Možnost téměř přímého experimentálního důkazu existence atomů vyplývala z teoretické práce Mariana Smoluchwskiho (1904) a ještě markantněji z práce Alberta Einsteina (1905) o Brownově pohybu.6 Rozhodující experimenty, přesvědčující i největší odpůrce atomové hypotézy, provedl Jean Perrin až v roce 1908. V současné době jsme schopni „pozorovat přímo i pohyb samotných atomů, tedy nejen důsledků jejich pohybu, jako je tomu u Brownova jevu.7 Abychom při popisu světa částic a jejich ohromných souborů nepočítali s příliš velikými čísly, zavádí se fyzikální veličina zvaná látkové množství n. Je definována jako poměr počtu částic N určitého (stejného) druhu k jistému velikému číslu NA zvanému Avogadrovo číslo. Platí tedy: n def = N NA (4.1) Aby takto definovaná fyzikální veličina nebyla bezrozměrná, byla dohodou stanovena její jednotka — tzv. mol. Látkové množství jeden mol má tedy soustava, která obsahuje stejné množství částic, jako je Avogadrovo číslo. Avogadrovo číslo, které tak udává počet částic v jednom molu, bylo definitoricky stanoveno jako počet atomů obsažených ve 12-ti gramech látky, která je složena pouze z atomů uhlíku 12 C.8 Vzhledem k definici 4.1 tak Avogadrovo číslo získalo svůj rozměr a je NA ≈ 6, 02·1023 mol−1 , správněji se mu tedy říká Avogadrova konstanta. Dalším důležitým pojmem je relativní atomová (molekulová) hmotnost Ar, která je definována vztahem: Ar def = ma mu (4.2) kde ma je klidová hmotnost atomu (molekuly) a mu atomová hmotnostní konstanta, což je podobně jako Avogadrova konstanta jakýsi standard pro porovnání — můžeme také říkat, že atom váží Ar hmotnostních jednotek. Tato konstanta je definována jako 1/12 hmotnosti už známého atomu uhlíku 12 C a její experimentálně zjištěná hodnota je mu ≈ 1, 661 · 10−26 kg.9 6 Brownův pohyb je neustálý chaotický pohyb malých částic (např. pylových zrnek) umístěných v kapalině nebo plynu. Parametry tohoto pohybu nebyla schopna žádná teorie neopírající se o atomární představy vysvětlit. 7 Uvozovky jsou u slova „pozorovat na místě, protože žádný optický přístroj není schopen zobrazit atomární struktury, je třeba přístrojů pracujících na jiném principu. 8 Toto označení je zkrácený zápis pro neutrální atom, jehož jádro obsahuje šest protonů a šest neutronů. Více viz kap. 7. 9 Uhlík byl pro tyto definice vybrán z čistě praktických důvodů, vytváří totiž enormně bohaté množství sloučenin. 109 Molární hmotnost Mm je definována jako hmotnost jednoho molu látky, tj. Mm def = m n (4.3) Molární hmotnost je v jednoduchém vztahu s relativní atomovou hmotností. Protože z definice vyplývá, že mu je 1/12 hmotnosti atomu uhlíku a jeden mol atomů uhlíku (jejich počet je číselně roven Avogadrově konstantě) má hmotnost 12·10−3 kg, dává součin konstant mu · NA = 10−3 kg · mol−1 . Takže Mm = Nmm N NA = ArmuNA = Ar10−3 kg mol−1 . Další často používanou veličinou je tzv. hustota částic NV definovaná jako počet částic v jednotce objemu (obvykle m3 nebo cm3 ), tj. NV def = N V 4.1.1 Modely struktur látek různého skupenství Plynná látka (plyn) Za běžných teplot a tlaků jsou střední vzdálenosti mezi molekulami plynu velké ve srovnání s rozměry molekul. Pro tyto vzdálenosti jsou přitažlivé síly velmi malé a můžeme je zanedbat. V prostoru, který plyn zaujímá, se všechny molekuly neustále pohybují různými rychlostmi (velikost i směr). Částice plynu na sebe působí prakticky jen během srážky, proto je jejich střední potenciální energie (v silovém poli vytvořeném ostatními částicemi) v porovnání s jejich kinetickou energií velmi malá. Z této struktury vyplývají i makroskopické vlastnosti plynů: nemají stálý objem ani tvar a jsou relativně snadno stlačitelné. Pevná látka Většina pevných látek je složena z částic s pravidelným uspořádáním na relativně velkou vzdálenost (krystalová struktura). Látky jen s částečně uspořádanou strukturou se nazývají amorfní. Částice pevné látky vykonávají kmitavé pohyby kolem svých rovnovážných poloh. S rostoucí teplotou se amplitudy výchylek částic zvětšují a po dosažení jisté meze látka taje. Vzdálenosti rovnovážných poloh nejsou vůči rozměrům částic o mnoho větší, částice na sebe tedy velmi silně působí, což ovšem znamená, že jejich potenciální energie je relativně velká v porovnání s kinetickou energií jejich kmitavého pohybu. Vliv na makroskopické chování: vlastní tvar a objem. Kapalná látka (kapalina) Molekuly kapalných látek jsou uspořádány jen na velmi krátké vzdálenosti a toto uspořádání se neustále mění. Jejich střední vzdálenosti jsou srovnatelné se vzdálenostmi molekul 110 pevné látky, ale jejich vzájemné působení není tak silné, proto molekuly kapalin působením vnějších sil tak snadno své polohy přeskupují. To dává kapalinám jejich charakteristickou makroskopickou vlastnost — tekutost. Ovšem díky svému „hustému uspořádání bývají velmi málo stlačitelné. 4.1.2 Základní rovnice kinetické teorie plynů Z úvah o pohybech a nárazech molekul na stěny nádoby v níž se nachází (ideální) plyn, plyne rovnice pV = 2 3 Ek (4.4) kde p je tlak plynu v nádobě, V je objem nádoby a Ek je součet kinetických energií všech molekul v nádobě. Je-li v nádobě N molekul, bude v průměru na každou z nich připadat kinetická energie εk = Ek/N. Ze statistických úvah (a předpokladů klasické mechaniky) lze odvodit, že tato střední kinetická energie εk připadající na jednu molekulu plynu souvisí s termodynamickou teplotou T tohoto plynu vztahem εk = 3 2 kBT (4.5) Tento vztah po dosazení do 4.4 sváže do jediné rovnice (platné pro ideální plyny) tlak, objem, teplotu a počet molekul plynu uzavřeného v nějaké nádobě: pV = NkBT (4.6) Tato rovnice je základem termodynamiky ideálních plynů a její jistá modifikace byla nejprve zkonstruována empiricky pomocí vztahů platných pro izotermický (T = konst), izobarický (p = konst) a izochorický děj (V = konst) s plynem. Z této rovnice také vyplývá zajímavý Avogadrův zákon, který tvrdí, že při stejném tlaku a stejné teplotě je ve stejných objemech různých (ideálních) plynů obsažen vždy stejný počet molekul. 4.2 Základy termodynamiky Při zkoumání vlastností nějaké soustavy těles často předpokládáme, že umíme tuto soustavu dokonale izolovat od okolí, což znamená, že umíme zabránit částicím a energii aby putovaly dovnitř nebo ven ze soustavy. Zkušenost ukazuje, že je-li takováto izolovaná soustava ponechána nějakou dobu svému osudu, ustanou veškeré makroskopické pohyby (například proudění) a vyrovnají se teploty jejích různých částí (pokud se soustava nenachází v žádném silovém poli, vyrovnají se i veškeré tlaky uvnitř soustavy), soustava se tak dostane do stavu, kterému říkáme termodynamická rovnováha.10 V tomto stavu soustavu pak charakterizuje jen několik málo fyzikálních veličin, které se z makroskopického hlediska již nemění, jsou to např. teplota, tlak a objem (stavové veličiny). 10 Tomuto tvrzení se také říká nultý termodynamický princip. 111 Termodynamickou rovnováhu soustavy můžeme (po jejím odizolování) narušit např. zahřátím — v soustavě tak vznikne oblast, která má vyšší teplotu než zbytek soustavy a i kdybychom hned po akci tuto soustavu opět zaizolovali, bude chvíli trvat, než se teploty (případně další stavové veličiny) opět všude vyrovnají, záleží samozřejmě na složení a uspořádání soustavy. U některých soustav (např. malá nádoba naplněná plynem) je však tepelné sdílení natolik rychlé, že můžeme v dobrém přiblížení (zvláště při pomalém zahřívání) tvrdit, že soustava prošla z jednoho rovnovážného stavu (charakterizovaného teplotou T) do jiného (charakterizovaného teplotou T′ ) sledem na sebe navazujících rovnovážných stavů, tj. že zahřátí nevyvedlo soustavu z termodynamické rovnováhy. Takovouto idealizovanou změnu stavu soustavy nazýváme rovnovážný děj. Proběhne-li v dané soustavě rovnovážný děj v jednom směru a pak ve směru opačném a soustava se dostane do původního stavu, aniž nastanou v okolních tělesech změny nazýváme takový proces vratný děj. Striktně vzato jsou skutečné děje vždy nerovnovážné a nevratné, ale popis takových dějů je samozřejmě značně složitější, navíc v praxi existuje mnoho oblastí, ve kterých je zjednodušení pomocí rovnovážných dějů velmi dobrým přiblížením k realitě. Nadále budeme mít na mysli pouze rovnovážné děje. 4.2.1 Vnitřní energie Celkovou energii fyzikální soustavy tvoří: a) kinetická energie Ek jejího makroskopického (uspořádaného) pohybu jako celku (např. posuvný či otáčivý pohyb); b) potenciální energie Ep soustavy jako celku, vyplývající ze silového působení vnějších těles působících na soustavu (např. vnější gravitační či elektrické pole); c) vnitřní energie Ev (často z historických důvodů značená U) soustavy, která souvisí kinetickou energií chaotického pohybu částic a jejich potenciální energií v poli ostatních částic patřících k soustavě.11 Protože makroskopické uspořádané pohyby v potenciálních polích jsou doménou mechaniky a jako takové tam byly studovány, zaměřme se nyní pouze na vnitřní energii. Vnitřní energie má pro termodynamiku velmi důležitou vlastnost — je závislá pouze na stavu soustavy. Nezávisí tedy jako například práce na tom, jak se soustava do daného stavu dostala (např. rychlým stlačením nebo pomalým zahřátím). Vnitřní energie je tedy vedle teploty, tlaku a objemu další stavovou veličinou. Důležitou úlohu v termodynamických úvahách má práce vykonaná soustavou. Příkladem může být, když rozpínající se plyn v pístu auta (soustava) otočí klikovým hřídelem 11 Abychom byli přesnější — k vnitřní energii soustavy patří i energie atomů vázaných v molekulách, energie jejich elektronů v obalech i energie skrytá v jádru atomů. Tyto složky energie se však při dějích zkoumaných ve školské fyzice prakticky vůbec nemění, proto je nemusíme do vnitřní energie zahrnovat. 112 (a auto jede). Přímo z definice mechanické práce 2.62 lze odvodit, že plyn uzavřený v nádobě o objemu V , jehož tlak je p, vykoná při malém zvětšení objemu nádoby12 na V + ∆V práci ∆W rovnou ∆W = p∆V 4.2.2 První termodynamický princip Koncem druhé třetiny devatenáctého století se stále více vědců začalo přiklánět k názoru, že teplo úzce souvisí s mechanickou prací a tedy i s energetickými změnami. Nakonec se důkladným experimentálním studiem ověřilo, že každá (i biologická) soustava vyskytující se v přírodě splňuje zákon zachování energie — energie se tak stala jakousi nezničitelnou „substancí , která se může přelévat z místa na místo, ale nikdy nevzniká ani nezaniká, může se jen měnit na různé formy. V souvislosti s termodynamikou se zákon zachování energie (a její provázanosti s teplem) nejčastěji vyjadřuje takto: Zahřejeme-li libovolnou soustavu (tj. dodáme-li jí teplo), vykoná tato soustava nějakou práci a zbytek zůstane uložen ve formě vnitřní energie soustavy — tato věta je vyjádřením tzv. prvního termodynamického principu (zákona). Teplo tedy popisuje děj, při němž se vyměňuje energie mezi soustavou a okolím, na rozdíl od vnitřní energie, která charakterizuje okamžitý stav soustavy. Z toho vyplývá, že teplo (stejně jako práce) není stavovou veličinou. Matematický zápis prvního termodynamického principu zní Q = ∆U + W (4.7) čímž se má na mysli, že teplo dodané do soustavy se spotřebuje dílem na změnu vnitřní energie této soustavy a dílem na práci, kterou soustava vykoná na svém okolí (zvětšuje svůj objem). Důležité je si uvědomit naší znaménkovou konvenci, tj. když ∆U > 0, vnitřní energie soustavy roste a roste díky tomu, že okolní tělesa na ní konají (kladnou) práci, tj. práce samotné soustavy W < 0 nebo do ní z vnějšku proudí teplo, které považujeme za kladné, když je soustavě dodáváno (Q > 0), nebo nastávají oba procesy současně.13 V případě, že vnitřní energie soustavy klesá, práci nekonají okolní tělesa, ale sama soustava nebo teplo je soustavě odebíráno a všechny výše zmíněné veličiny mají hodnotu zápornou. 4.2.3 Teplota Z vysvětlení rovnovážného stavu vyplývá, že přivedeme-li dvě tělesa do vzájemného kontaktu a odizolujeme-li je od zbytku světa, nakonec se mezi nimi ustanoví tepelná rovnováha. Než ovšem rovnováha nastane, vyměňuje se mezi oběma tělesy energie (teplo) a protože se nekoná práce, plyne z prvního termodynamického principu, že se musí měnit vnitřní 12 „Malým zvětšením se myslí takové, při kterém se podstatně nezmění tlak. 13 Samozřejmě, je-li například Q > W > 0, tj. soustavě je dodáváno teplo a zároveň koná práci, je stále ∆U > 0, tj. vnitřní energie soustavy roste, i když pracuje. 113 energie těles — energie tělesa, které teplo přijímá se zvětšuje a energie tělesa, které teplo odevzdává se zřejmě zmenšuje. Pro popis těchto změn vnitřní energie se zavádí staronová stavová veličina — teplota. Říkáme, že těleso, které odevzdalo teplo, mělo větší teplotu než těleso, které teplo při vzájemném styku získalo. Pokud mezi tělesy při vzájemném styku nedošlo k výměně tepla (a tedy ani vnitřní energie každého z těles se nezměnila), říkáme, že tato tělesa měla stejnou teplotu. Lze ukázat, že změna teploty soustavy je úměrná změně její vnitřní energie. K určení teploty užíváme teploměrů14 což jsou vlastně malé sondy, které se snaží dostat do tepelné rovnováhy s měřenou soustavou (bez toho aby jeho původní teplotu nějak podstatně ovlivnili) a pomocí změny nějaké jiné fyzikální veličiny15 určuje vůči dohodnuté základní hladině (v dohodnuté stupnici) teplotu. U nás nejčastěji užívaná teplotní stupnice Celsiova je dána dvěma teplotami, kterým se přiřazuje dohodnutá hodnota — rovnovážnému stavu vody a jejího ledu 0◦ C a rovnovážnému stavu vody a její syté páry (var) 100◦ C. Fyzikové užívají tzv. termodynamickou teplotní stupnici, která má vůči stupnici Celsiově pouze posunutý počátek (dílky jsou stejně veliké, což znamená, že zvýší-li se teplota o jeden 1◦ C, zvýší se teplota o jeden stupeň i v termodynamické stupnici. Tento stupeň nazýváme Kelvin a značíme K). Souvislost Celsiovy (označ. t) a termodynamické (T) stupnice je jednoduchý: T = (t + 273, 15)K a také t = (T − 273, 15)◦ C.16 Významnost počátku termodynamické stupnice (0K ≡ −273, 15◦ C) je v tom, že tato teplota je nejnižší možná, tj. pod tuto (a ani na tuto) teplotu není možné ochladit žádné těleso — obsah uvedené věty tvoří tzv. třetí termodynamický princip. 4.2.4 Měrná tepelná kapacita Pokud byste se pokusili zahřát na sporáku půl litru vody (≈ 0, 5kg) a na stejném (a stejně spuštěném) sporáku vedle tři litry (≈ 3kg), tak při dobrém promíchávání se vám voda za stejnou dobu na prvním sporáku ohřeje na vyšší teplotu než na tom druhém. Je tedy zřejmé, že vzrůst teploty je nepřímo úměrný množství zahřívané látky. Rovněž je ale zřejmé, že každá látka přejímá teplo s jinou účinností. Například kus železa budete zahřívat přibližně dvakrát pomaleji než stejně těžký kus hliníku. Extrémním příkladem je srovnání rtuti a vody. Abyste vodu zahřáli na stejnou teplotu jako rtuť stejné hmotnosti, museli byste ji při stejném přísunu tepla zahřívat skoro třicetkrát déle (proto je rtuťový teploměr výhodnější i při stejné objemové roztažnosti17 vody a rtuti — přejímá totiž daleko snáz teplotu měřeného tělesa). Můžeme tedy říci, že voda pojme při zahřátí o stejnou teplotu více tepla než rtuť stejné hmotnosti, docházíme tak k definici nové látkové konstanty — k měrné tepelné kapacitě, která nám rozlišuje látky podle množství tepla, které mu- 14 Logičtější by bylo označení „teplotoměr , protože neměříme teplo, což je veličina charakterizující určitý děj, ale teplotu, což je veličina závislá na okamžitém stavu soustavy. 15 Nejznámější je změna objemu nějaké látky se změnou teploty, ale se změnou teploty se mohou měnit např. i elektrický odpor nebo tlak plynu. 16 Pro připomenutí, složené závorky znamenají, že jde o číselné hodnoty. Tedy v našem případě T a t jsou číselné hodnoty teploty v termodynamické a Celsiově stupnici. 17 Objemová roztažnost charakterizuje o kolik vzroste objem látky, jestliže ji zahřejeme o 1 K nebo 1◦ C. 114 síme dodat jednomu kilogramu dané látky, abychom ji ohřáli o 1 K nebo 1◦ C. Matematicky můžeme psát c def = Q m∆T ≡ Q m∆t Z této definice tedy plyne, že abychom ohřáli m kilogramů látky s měrnou tepelnou kapacitou c o ∆t stupňů celsia, musíme ji dodat teplo18 Q = cm∆t Díky tomuto vztahu můžeme snadno vypočítat teplotu, na které se ustálí směs nebo jiné spojení dvou látek o různých předem daných teplotách v izolaci.19 Teplejší látka s teplotou t1, hmotností m1 a měrnou tepelnou kapacitou c1 se při styku s látkou o teplotě t2 < t1, s hmotností m2 a měrnou tepelnou kapacitou c2 schladí (v důsledku odebrání tepla chladnější látkou), na teplotu t, pro níž zřejmě platí t2 < t < t1. Tato látka tak zřejmě odevzdá teplo Q = c1m1(t1 − t). Protože je však soustava izolovaná, stejné množství tepla Q musí přijmout chladnější látka, jejíž teplota vzrostla z t2 na t, platí tedy z druhé strany Q = c2m2(t−t2). Porovnáním pak získáme snadno řešitelnou lineární rovnici pro hledanou výslednou teplotu t rovnovážného stavu: c1m1(t1 − t) = c2m2(t − t2) 4.2.5 Druhý termodynamický princip Tento princip omezuje možnost libovolného přelévání energie z jedné formy na druhou. Studujeme-li pád kamene v tíhovém poli Země, zjišťujeme, že jeho mechanická energie se v průběhu pádu zachovává (odpor vzduchu neuvažujeme) — potenciální energie, kterou měl v místě vypuštění se postupně přelévá do energie kinetické. To vše ovšem platí pouze do okamžiku nárazu! V okamžiku nárazu se veškerá mechanická energie ztratí (kámen se na zemi nehýbe) a přemění se na energii tepelnou — kámen i Země se trochu ohřejí. Kdyby nebylo žádné omezení na přeměnu energie, mohly by v principu nastávat i obrácené procesy — zahřátím kamene i Země (např. od Slunce) by mohl kámen vyskočit do výšky. Tomuto procesu první termodynamický princip nebrání, proč tedy takovéto úkazy nepozorujeme? Proč má jedna forma energie přednost před druhou? Vědci přišli s tím, že zřejmě existuje nějaký přírodní zákon, který takovéto věci zakazuje. Nazvali ho druhým termodynamickým principem a byl vyjádřen v několika ekvivalentních formulacích, například (viz [41]) • Teplo nemůže samovolně přecházet z chladnějšího tělesa na teplejší. • Není možné sestrojit periodicky pracující stroj, který by trvale vykonával kladnou mechanickou práci pouze ochlazování jednoho tělesa, aniž by přitom docházelo k jiným změnám v ostatních tělesech. 18 Pro větší názornost budeme nadále užívat Celsiovu stupnici. 19 Nádobu, či zařízení, ve které takovou izolaci nejčastěji simulujeme, nazýváme kalorimetr. 115 Z mikroskopického hlediska tento zákon úzce souvisí s uspořádaností systémů a s pravděpodobností realizace těchto uspořádání. V souvislosti s ním je často diskutována i otázka tzv. šipky času. Na populární úrovni se lze více dočíst např. v [16, 42, 43, 44]. 116 Kapitola 5 Elektřina a magnetismus Na počátku třetí třetiny devatenáctého století se geniálnímu Jamesi Clerku Maxwellovi podařilo sloučit všechny do té doby známé experimentální i teoretické výsledky týkající se elektrických a magnetických jevů do jednotného konzistentního popisu.1 Z Maxwellovy teorie vyplynulo, že elektřina a magnetismus jsou vlastně jen různými projevy jediné, tzv. elektromagnetické síly (interakce). Dále pak, že působení této síly na elektricky a magneticky aktivní látky se děje prostřednictvím pole (viz odst. 2.4), které je popsáno vektory −→ E a −→ B (tyto vektory byly z historických důvodů nazvány intenzita elektrického pole a magnetická indukce). Maxwell dokonce ze svých rovnic vyvodil možnost existence tzv. elektromagnetických vln, jakožto periodických vzruchů přenášených elektromagnetickým polem (podobně jako zvukové vlny jsou přenášeny vzduchem) a zjistil, že rychlost šíření těchto vln se shoduje s rychlostí světla. To jej přesvědčilo, že světlo je elektromagnetickým vlněním omezených vlnových délek (více o tom v odst. 5.4). Technická aplikace Maxwellovy teorie měla a má nedozírné důsledky i pro prostý občanský život — od generátorů střídavého napětí ve vodních elektrárnách, po komunikaci s extrasolárními sondami. Nemohu si pomoci, ale na tomto místě musím opět ocitovat R. P. Feynmana a jeho poněkud náročné, ale nanejvýš zajímavé a inspirativní přednášky ([45] str. 25): „Z dlouhodobého pohledu historie lidstva, tak, jak se bude jevit, například, za deset tisíc let, lze sotva pochybovat o tom, že Maxwellův objev zákonů elektrodynamiky bude hodnocen jako nejvýznamnější událost 19. století. V porovnání s touto důležitou vědeckou událostí upadne americká občanská válka z téhož desetiletí do provinční bezvýznamnosti. Prozkoumejme nejprve elektrickou a magnetickou složkou elektromagnetického pole odděleně. V následující části se budeme zabývat elektrickými náboji a elektrickými poli v klidu — tato oblast studia se běžně nazývá elektrostatika a má obdobu u neměnících magnetických polí jako magnetostatika. Při přechodu k časově proměnným polím se popis elektrických a magnetických jevů poněkud komplikuje, pole se stávají závislá, protože změna jednoho vyvolává vznik druhého a naopak — dostáváme se tak na půdu elektrodynamiky, což je název, kterým se nahrazuje výstižnější elektromagnetodynamika. 1 Maxwell navázal na velmi důležité výzkumy dalšího fenomenálního vědce — Michaela Faradaye. 117 5.1 Elektrický náboj a elektrické pole Podstatu elektrického náboje zatím neznáme, víme jen, že existuje ve dvou formách, které označujeme jako kladnou a zápornou a že je vždy vázán na materiální částice, tj. že neexistuje sám o sobě. Elektrické náboje ve svém okolí vzbuzují silové účinky, které popisujeme pomocí elektrického pole — podobně jako hmotnost (gravitační náboj) vzbuzuje ve svém okolí gravitační pole (viz odst. 2.4). Na rozdíl od gravitačního pole však existují elektrické náboje dvou znamének. Náboje, které označujeme stejným znaménkem na sebe navzájem působí silami odpudivými, opačné náboje se přitahují. Necelé půlstoletí po Maxwellových výzkumech se pečlivými měřeními zjistila skutečnost, která z Maxwellovy teorie nevyplývá (ale neprotiřečí jí): kladný ani záporný elektrický náboj nemůžeme dělit libovolně — náboj se vyskytuje pouze v určitých porcích (kvantech) a všechna elektricky nabitá tělesa obsahují celočíselný násobek kladného či záporného elementárního náboje. Logické by bylo považovat elementární náboj za jednotkový a elektrické nabití všech ostatních těles vztahovat k tomuto náboji, ale z historických a praktických důvodů byl za jednotkový náboj určen 1 coulomb, do kterého se náboj elementární vejde přibližně 1, 6 · 1019 krát. Fyzikální veličinu elektrický náboj tedy měříme v coulombech. Ať už je podstata elektrického náboje jakákoli, umíme přiřazenou veličinu měřit s vysokou přesností a dosud se prokazuje, že v izolovaných soustavách se podobně jako energie vždy zachovává, platí tedy její zákon zachování. 5.1.1 Coulombův zákon Francouz Charles Coulomb koncem 18. století postavil výzkum elektrických sil na pevnou půdu experimentálním prokázáním věty: Dva bodové (nebo kulové) elektrické nosiče náboje se přitahují nebo odpuzují silou přímo úměrnou součinu těchto nábojů2 a nepřímo úměrnou druhé mocnině jejich vzdálenosti r, tj. ověřil platnost vztahu | −→ Fe| = k q1q2 r2 (5.1) Dokonalost podoby s Newtonovým gravitačním zákonem však ruší tři věci: 1) Na rozdíl od síly gravitační, elektrická síla může působit i odpudivě. 2) Konstanta úměrnosti k v Coulombově zákoně je, na rozdíl od gravitační konstanty G (stejné v celém vesmíru), závislá na prostředí, ve kterém se elektrické náboje nacházejí (např. ve vodě na sebe stejné náboje ve stejné vzdálenosti působí 81 krát menší silou než ve vzduchu). Tato konstanta se z praktických (technických) důvodů uvádí ve tvaru: k ≡ 1 4πε0εr ≈ 9·109 N m2 C−2 2 Nadále nebudeme rozlišovat elektrický náboj jako vlastnost hmoty a elektrický náboj jako fyzikální veličinu této vlastnosti přiřazenou. 118 kde veličina ε0 ≈ 8, 85·10−12 C2 m−2 N−1 se nazývá permitivita vakua a číslo εr relativní permitivita prostředí. Protože se s prostředím mění pouze εr, můžeme pro zjednodušení označit k0 ≡ 1 4πε0 a pro velikost elektrické síly psát Fe = k0 εr q1q2 r2 Vidíme tak, že relativní permitivita εr udává kolikrát je elektrická síla v daném prostředí zmenšena oproti vakuu.3 3) Elektrické působení mezi dvěma jednotkovými náboji je o mnoho řádů větší než působení gravitační mezi dvěma jednotkovými hmotnostmi ve stejné vzdálenosti (ověřte). Mohli bychom si myslet, že jsme jednotkový náboj (coulomb) zvolili příliš velký, ale věc má hlubší kořen. Elektrické odpuzování takových základních částic jakými jsou protony (každý nese kladný elementární náboj), je 1036 krát! silnější, než jejich gravitační přitahování (ověřte). Tento obrovský nepoměr je dodnes záhadou. 5.1.2 Intenzita a potenciál Obdobně jako byly pro popis gravitačního pole zavedeny dvě veličiny, které jej charakterizovaly bez ohledu na objekty, které se v něm nacházely, zavádějí se i pro pole elektrické dvě navzájem související veličiny: jedna názorná, ale vektorová (tj. k popisu elektrického pole musíme zadat jeho v každém bodě tři složky vektoru) a druhá jednodušší co do popisu (skalární), ale už ne tak názorná. V úplné analogii říkáme první veličině intenzita elektrického pole a značíme −→ E a druhé elektrický potenciál ϕE. Intenzitu elektrického pole zavádíme úvahou naprosto analogickou k její gravitační kolegyni: Budeme studovat působení elektrického pole na nějaký dohodnutý náboj (jednotkový). Intenzita elektrického pole je pak definována jako síla na tento jednotkový náboj působící. Intenzita elektrického pole v daném bodě prostoru je tedy vektorová fyzikální veličina, která má stejný směr i velikost jako elektrická síla působící na jednotkový náboj v tomto místě se nacházející. Jednotkou intenzity elektrického pole je tedy newton na coulomb (N/C). Z Coulombova zákona plyne, že v elektrickém poli bodového náboje Q působí na jiný náboj q elektrická síla, která je tomuto náboji přímo úměrná. Nemáme-li k dispozici jednotkový náboj a přesto chceme stejným způsobem zmapovat elektrické pole, musíme sílu, která na náboj v tomto poli působí podělit velikostí tohoto náboje. Intenzitu elektrického pole pak obecně definujeme vztahem: −→ E def = −→ Fe q (5.2) 3 εr > 1 pro všechna prostředí jiná než vakuum, pro vakuum je εr = 1 119 Elektrické pole ve vakuu splňuje důležitý princip superpozice, který v této souvislosti říká, že vyvolává-li samotný náboj q1 v místě −→r elektrické pole o intenzitě −→ E1(−→r ) a osamocený náboj q2 ve stejném místě pole s intenzitou −→ E2(−→r ), bude výsledné pole od obou nábojů dáno superpozicí (složením) polí tak, že jeho intenzita bude dána prostým součtem −→ E1(−→r ) + −→ E2(−→r ) Princip superpozice pro elektrické pole obecně v látkových prostředích neplatí. Pomocí intenzity můžeme elektrické pole „zmapovat tzv. elektrickými siločárami, což jsou myšlené čáry sestrojené tak, že v každém bodě, kterým prochází, je jejich tečna rovnoběžná s intenzitou elektrického pole a je stejně orientovaná. Elektrickému poli lze rovněž přiřadit potenciální energii (elektrická síla4 je konzervativní). Přiřazení potenciální energie EE(−→r ) náboji q nacházejícímu se v elektrostatickém poli v místě −→r se opět děje tak, že si zvolíme místo −→r0 , kde je potenciální energie nulová a potenciální energií pak bude práce kterou vykoná pole při přesunu náboje q z −→r do −→r0 . Elektrická potenciální energie „normovaná na jednotkový náboj opět charakterizuje pole bez ohledu na okolní náboje, tím dospíváme k elektrickému potenciálu ϕE def = EE q Jednotka elektrického potenciálu byla nazvána volt a značí se (zřejmě je [ϕE] ≡ V = J/C).5 Mapování elektrického pole pomocí potenciálu má výhodu také v tom, že je hned vidět, kolik kinetické energie může náboj q získat při přechodu z jednoho místa s potenciálem ϕE(−→r1 ) do místa s potenciálem ϕE(−→r2 ). Je-li přítomno pouze elektrostatické pole, platí totiž (viz vztah 2.70) ∆Ek ≡ Ek(−→r2 ) − Ek(−→r1 ) = EE(−→r1 ) − EE(−→r2 ) = q[ϕE(−→r1 ) − ϕE(−→r2 )] (5.3) Proletí-li tedy náboj q potenciálovým rozdílem ∆ϕE ≡ ϕE(−→r1 ) − ϕE(−→r2 ), získá kinetickou energii ∆Ek = q∆ϕE. Při experimentálním zkoumání mikrosvěta se často užívá jako jednotka množství energie, kterou získá částice nabitá elementárním nábojem při průchodu potenciálovým rozdílem jeden volt — říká se jí elektronvolt a značí se eV. Rozdílu potenciálů se často říká napětí. 5.2 Elektrický proud Ke studiu uspořádaného pohybu elektrických nábojů zavádíme novou veličinu — elektrický proud. Elektrický proud definujeme jako množství náboje procházejícího jistou 4 Přesněji elektrostatická síla. 5 Ověřte, že jednotku intenzity elektrického pole můžeme psát i ve tvaru V/m. 120 plochou za časovou jednotku. Projde-li během doby ∆t zvolenou plochou náboj ∆q, bude střední hodnota elektrického proudu (ozn. I) dána vztahem (viz například definice střední rychlosti) I def = ∆q ∆t (5.4) Mění-li se s časem množství náboje prošlého plochou a nás zajímá hodnota proudu v konkrétním okamžiku, zmenšujeme časový interval ∆t v okolí tohoto okamžiku a sledujeme změny podílu ∆q/∆t. Okamžitá hodnota proudu pak bude dána vztahem (viz například definice okamžité rychlosti) I def = lim ∆t→0 ∆q ∆t ≡ dq dt Jednotkou elektrického proudu byl zvolen ampér (ozn. A) a platí [I] ≡ A = C s Protože rozdíl potenciálů (napětí) vyvolává pohyb náboje (elektrický proud), který pak může konat práci, je tato oblast elektromagnetismu velmi důležitá pro technické aplikace. Zákonitostmi vedení proudu v různých látkách, charakteristikami elektrických obvodů a popisu jejich prvků se však nebudeme zabývat. Tyto informace lze nalézt např. v [4, 5, 6]. 5.3 Magnetické pole V analogii se tím, že se elektrické pole objevuje v blízkosti elektricky nabitých těles bychom mohli předpokládat, že magnetické pole se obdobně objevuje v blízkosti magneticky nabitých těles či částic. I přes intenzívní výzkum se však dosud izolovaný magnetický náboj (tzv. magnetický monopól) nenalezl.6 Magnetické pole, které pozorujeme, je buzeno buď elementárními magnetickými dipóly nacházejícími se v atomech,7 nebo pohybem elektrického náboje (elektrickým proudem). Magnetismus permanentních magnetů nesouvisí s makroskopickým pohybem náboje, ale s vlastnostmi a uspořádáním částic, které je tvoří. Magnetické pole pohybujících se nabitých částic a magnetické pole permanentních magnetů je stejné povahy a naznačuje hlubokou souvislost elektrického náboje a elementárních dipólků. 5.3.1 Stacionární magnetické pole Obdobně jako jsme elektrickému poli přiřadili fyzikální veličinu, která jej charakterizovala pouze s ohledem na jeho zdroj, přiřazujeme takovouto veličinu i magnetickému poli a říkáme 6 Přitom žádný z dosud objevených přírodních zákonů tomu nebrání. 7 Každý magnet má dva tzv. póly (proto dipól), které se chovají podobně jako opačné elektrické náboje, tzn. souhlasné se odpuzují a nesouhlasné se přitahují. Protože Země se chová také jako magnet s osou jen mírně odchýlenou od osy zemské, volně se otáčející magnet se natočí pólem nazvaným severní (ozn. N, proč?) k severnímu zeměpisnému pólu. Opačný pól byl nazván jižní (ozn. S). 121 jí (ne právě vhodně) magnetická indukce (ozn. −→ B ). Na rozdíl od silového působení elektrického pole −→ E na náboj q, které je dáno jednoduchým vztahem −→ Fe = q −→ E , je silové působení magnetického pole −→ B 8 na náboj q pohybující se rychlostí −→v dáno poněkud složitějším vztahem −→ Fm = q−→v × −→ B (5.5) Z vlastností vektorového součinu je zřejmé, že magnetická síla působící na pohybující se elektrický náboj je kolmá jak na magnetické pole −→ B , tak na směr pohybu udaný vektorem rychlosti −→v (nemůže tedy konat práci). Pokud se náboj pohybuje podél směru magnetického pole (−→v ⇈ −→ B ), magnetická síla na náboj vůbec nepůsobí, naopak největší silové účinky se projevují při letu částice kolmo na směr pole −→ B . Z uvedeného vztahu plyne i jednotka magnetické indukce, kterou nazýváme tesla a značíme T, její vyjádření v jednotkách soustavy SI je [B] ≡ T = [F] [q][v] = N A m (5.6) Podobně jako jsme elektrické pole mapovali pomocí elektrických siločar, můžeme magnetické pole mapovat pomocí tzv. magnetických indukčních čar nebo možná jednodušeji magnetických siločar. Magnetické siločáry určují směr a orientaci vektoru magnetické indukce v daném místě. Experimentálně můžeme tyto čáry reprezentovat osami (spojnicí pólů) malých magnetek (např. železnými pilinami), přičemž orientace indukčních čar byla zvolena od jižního pólu magnetky k severnímu. Jako příklad vezměme magnetické pole vzniklé kolem přímého vodiče s elektrickým proudem. Experimentálně se ukazuje, že toto pole můžeme znázornit pomocí magnetických siločar, které vodič obtáčejí v soustředných kružnicích, jejichž orientace je dána takto (tzv. Ampérovo pravidlo pravé ruky): Uchopíme-li vodič (izolovaný:-)) do pravé ruky tak, aby palec ukazoval dohodnutý směr proudu (tj. směr pohybu kladného náboje), pak prsty ukazují orientaci magnetických siločar. O silovém působení magnetického pole vybuzeného elektrickým proudem procházejícím (přímým) vodičem na pohybující se elektrické náboje se snadno můžeme přesvědčit umístěním jiného vodiče do jeho blízkosti (viz obr. 5.1). Pohybují-li se elektrony ve vodiči V2 umístěném v magnetickém poli −→ B jiného vodiče V1 kolmo na siločáry, které vodič V1 obklopují (viz obr. primevodice.doc) a proti směru elektrického proudu v tomto vodiči (tj. vytváří ve V2 elektrický proud stejného směru jako je ve V1), působí na každý elektron ve V2 magnetická síla mířící k vodiči V1, jak plyne z vlastností vektorového součinu, záporného náboje elektronů a jejich pohybu proti dohodnutému směru proudu9 . Měřením se zjistilo (Ampére), že velikost magnetické indukce B ≡ | −→ B | na kružnici o poloměru r obklopující vodič s proudem I, má velikost B = µ I 2πr (5.7) 8 Zde opět zaměňujeme pole a veličinu, kterou ho popisujeme. 9 Na úvahu jednodušší by bylo předpokládat pohyb kladného náboje ve směru proudu ve vodiči V2, zkuste si to. 122 V1 V2 I I‘ Obrázek 5.1: Magnetické působení přímých vodičů kde konstanta µ ≡ µ0µr se nazývá permeabilita prostředí a charakterizuje magnetické vlastnosti prostředí obdobně jako permitivita charakterizuje ty elektrické. V přesné analogii s permitivitou také nazýváme µ0 ≡ 4π·10−7 N·A−2 permeabilitou vakua a µr relativní permeabilitou.10 Z rovnice 5.5 lze i přímo odvodit jaké silové působení bude ovlivňovat přímý vodič, jehož část (ozn. l) se nachází v homogenním magnetickém poli −→ B = −−−→ konst (viz obr. 5.2). Předpokládejme, že vodič má konstantní průřez S a že v něm teče ustálený elektrický proud I rychlostí −→v . Objem vodiče „ponořeného do magnetického pole bude V = Sl. V každém okamžiku se v tomto objemu nachází stejné množství náboje — označme jej Q. Za krátký okamžik ∆t stihne projít vybraným průřezem náboj ∆q = I∆t do vzdálenosti ∆s = v∆t. Protože je množství náboje připadajícího na objemovou jednotku v celém vodiči stálý (tzv. 10 Na rozdíl od relativní permitivity, která je vždy větší než 1, může mít látka relativní permeabilitu (tj. permeabilitu v porovnání s vakuem) i menší než 1. Podle velikosti relativní permeability rozlišujeme látky (prostředí) do dvou skupin: 1) látky diamagnetické, jejichž µr < 1 (většinou jen o hodně málo); uvnitř těchto látek je magnetické pole mírně zeslabováno (např. inertní plyny, Au, Cu, Hg) a 2) látky paramagnetické, jejichž µr > 1 a magnetické pole zesilují. Naprostá většina těchto látek má svou relativní permeabilitu blízkou 1 (např. Na, K, Al), ovšem existuje skupina látek (např. Fe, Ni, Co), jejichž relativní permeabilita je díky specifickému uspořádání atomů extrémně veliká (až 105 ) a vnější magnetické pole dokáže zesílit značně. Tato skupina paramagnetických látek je natolik význačná, že dostala své zvláštní jméno — látky feromagnetické. 123 I a l S N Obrázek 5.2: Působení magnetického pole na vodič hustota náboje je konstantní), bude platit Q V = Q Sl = ∆q S∆s Celková velikost magnetické síly působící na část vodiče v magnetickém poli bude tedy dle 5.5 dána: Fm = QvB sin α = ∆q ∆s l ∆s ∆t B sin α = I lB sin α (5.8) kde α je úhel sevřený směrem proudu (resp. směrem −→v ) a magnetickými siločárami (směr −→ B ). Směr působení síly můžeme určit díky vlastnostem vektorového součinu — je kolmý jak na směr proudu, tak na směr indukce magnetického pole (v případě obr. bilsinus.doc je orientován směrem do obrázku). Vložíme-li tedy přímý vodič protékaný proudem mezi póly magnetu, bude se nám vychylovat kolmo na magnetické siločáry. Z výše uvedeného už můžeme snadno odvodit i velikost silového působení mezi dvěma přímými rovnoběžnými vodiči s proudem (směr jsme již určili). Vraťme se k obr. 5.1 a opět zkoumejme působení magnetického pole −→ B vzniklého v důsledku procházejícího proudu vodičem V1 v bezprostředním okolí vodiče V2. Toto pole můžeme v uzoučkém okolí vodiče V2 považovat za homogenní a kolmé na vodič (sin α = 1) proto můžeme užít vzorce 5.8 k určení magnetické síly, která na tento vodič působí. 124 V prostředí charakterizovaném celkovou permeabilitou µ, působí přímý vodič V1 protékaný proudem I na s ním rovnoběžný vodič V2, umístěný ve vzdálenosti r a protékaný proudem I′ , magnetickou silou o velikosti Fm = BI′ l = µ 2π II′ r l kde l je celková délka rovnoběžných částí vodičů a B je velikost magnetické indukce vzbuzované podle 5.7 přímým vodičem ve vzdálenosti r. Protože síla, proudy i vzdálenosti se dají relativně dobře měřit, používá se tato formulka k definici jedné ze základních jednotek soustavy SI — ampéru.11 Zcela mimochodem: dle moderního chápání je magnetismus relativistickým efektem pohybu elektrických nábojů a existence elementárních dipólů automaticky plyne z relativistické verze kvantové teorie. 5.3.2 Nestacionární magnetické pole Zhruba deset let po překvapivém zjištění, že elektrický proud vyvolává magnetické pole (Hans Christian Oersted 1820) Michael Faraday experimentálně prokázal další souvislost elektrických a magnetických jevů — časově se měnící magnetické pole působí i na klidné nosiče náboje a je tedy schopno vyvolat elektrický proud. Přeloženo do řeči polí: měnící se magnetické pole způsobuje vznik elektrického pole, a to pak působí na nosiče náboje. Jednoduchým příkladem může být permanentní magnet přibližující se k cívce. Pokud je na cívku zapojen ručkový ampérmetr (přístroj na měření proudu), při přiblížení magnetu k cívce ukáže výchylku (zaregistruje elektrický proud). Při oddálení magnetu od cívky se rovněž změní pole v okolí cívky a ručka ampérmetru se pohne na druhou stranu (proud prochází opačným směrem). Je-li magnet (i hodně silný) libovolně blízko cívky, ovšem v klidu, proud neprochází. Postupně se zjistilo, že elektrické pole vzniká nejenom v důsledku časové změny samotného magnetického pole, ale obecně v důsledku změn veličiny, které se říká magnetický indukční tok. Magnetický indukční tok (ozn. Φ), je definován skalárním součinem vektoru magnetické indukce −→ B a vektoru plochy −→ S , kterou magnetické pole charakterizované −→ B prochází:12 Φ ≡ −→ B · −→ S = | −→ B || −→ S | cos α (5.9) Jednotkou magnetického indukčního toku je weber — [Φ] ≡ Wb = [B][S] = T m2 Změna magnetického indukčního toku tedy způsobuje vznik elektrického pole. Toto (silové) pole je ovšem schopno konat práci a veličina, která charakterizuje práci elektrického 11 Ampér je dle definice stálý elektrický proud, který při průchodu dvěma rovnoběžnými, přímými a nekonečně dlouhými vodiči zanedbatelného kruhového průřezu, umístěnými ve vakuu ve vzájemné vzdálenosti 1 metru, vyvolá mezi nimi stálou sílu o velikosti 2·10−7 newtonu na jeden metr délky. 12 Rovinné ploše (a jen tou se budeme nadále zabývat), přiřazujeme vektor, jehož velikost je stejná jako její obsah a jehož směr je na ni kolmý (normála). Orientace takovéhoto vektoru je dána opět dohodou: zvolíme-li si (nebo ze situace je určen) směr obíhání kolem okraje plochy, míří jí přiřazený vektor na tu stranu plochy, ze které se uvedené obíhání jeví v kladném směru (tj. proti směru hodinových ručiček). 125 pole je elektrické napětí. Z Faradayových pokusů vyplynul velmi důležitý kvantitativní závěr: časová změna magnetického indukčního toku přiřazeného jakékoli (vodivé i nevodivé) uzavřené smyčce v prostoru, způsobuje vznik tzv. indukovaného elektromotorického napětí Ui, pro jehož okamžitou velikost platí: Ui = − lim ∆t→0 ∆Φ ∆t ≡ − dΦ dt (5.10) Z uvedeného tvrzení známého jako Faradayův indukční zákon mimo jiné plyne, že pokud zkoumáme magnetický indukční tok plochou, kterou tato obklopuje vodivá smyčka s elektrickým odporem R, bude napětí indukované ve smyčce vyvolávat (indukovaný) proud Ii = Ui/R v těchto případech (nebo v jejich kombinacích): • Přibližujeme-li či vzdalujeme-li magnet relativně vzhledem ke smyčce, přičemž plocha, kterou obepíná, nemění svou velikost ani orientaci v prostoru. Magnetický indukční tok procházející závitem se mění v důsledku změn magnetického pole charakterizovaného magnetickou indukcí. • Rotujeme-li smyčkou v na čase nezávislém (stacionárním) magnetickém poli (měníme směr vektoru plochy smyčky). • Měníme-li obsah plochy závitu (stahujeme či roztahujeme smyčku) ve stacionárním poli magnetického tělesa. Znaménko mínus v indukčním zákoně matematicky souvisí s tím, že indukovaný elektrický proud vyvolává kolem vodivé smyčky (závitu) magnetické pole, které se snaží zabránit změně indukčního toku, která jej vyvolala (tzv. Lenzův zákon). Jako příklad zkusme určit směr proudu, který se v naší smyčce naindukuje v důsledku přibližování severního pólu magnetu. V tomto případě magnetické siločáry míří směrem od magnetu a při přibližování stále ve větším počtu protínají plochu smyčky (Φ roste). Indukovaný proud pak dle výše uvedeného vyvolá magnetické pole, které bude mířit proti poli magnetu v závitu (jako dva magnety otočené stejnými póly k sobě). A když tedy víme jakým směrem má mířit magnetické pole, které je vyvoláno proudem procházejícím vodičem, snadno z Ampérova zákona pravé ruky směr tohoto proudu určíme. Vidíme tedy, že závit jakoby bránil magnetu do něj proniknout — při rychlém přibližování k cívce (mnoho závitů) je dobře cítit odpor. Na druhou stranu, pokud se původně klidný magnet snažíme ze závitu vyjmout, naindukuje se v něm proud, jehož magnetické pole se snaží udržet magnet na místě. V obvodech, kterými protéká proud se uplatňuje elektromagnetická indukce rovněž. Představme si například, že vodivou smyčku připojíme ke staré nespolehlivé baterii. Smyčkou pak protéká elektrický proud, jehož hodnota neustále klesá a v důsledku toho slábne i magnetické pole podél smyčky vytvořené. Tím ovšem klesá i magnetický indukční tok procházející smyčkou a v důsledku toho se v ní indukuje napětí, které se snaží zabránit poklesu proudu, tj. snaží se proud ve smyčce udržet na původní hodnotě. V důsledku toho smyčkou 126 protéká větší proud, než by odpovídalo okamžitému napětí na svorkách baterie a celkovému odporu závitu. Tento jev nazýváme vlastní indukce nebo také samoindukce.13 Objev elektromagnetické indukce otevřel bránu do světa úžasných aplikací jako jsou například indukční motory, indukční pece, indukční brzdy a mnoho dalších vymožeností. V praxi se prosadily elektrické obvody, jejichž zdroje produkují měnící se napětí a vytvářející tak tzv. střídavé proudy. Zákonitostmi této zajímavé a důležité oblasti se však zde nebudeme zabývat — příslušné informace lze na středoškolské úrovni opět nalézt např. v [4, 5, 6]. 5.4 Elektromagnetické pole Jak již bylo uvedeno na začátku této kapitoly: poté co se ve druhé polovině devatenáctého století podařilo vytvořit ucelenou teorii elektromagnetických jevů, díky níž šlo vysvětlit (téměř) všechny výše uvedené jevy z jednotného hlediska, ukázalo se navíc, že nejen měnící se magnetické pole způsobuje vznik pole elektrického (elektromagnetická indukce), ale i naopak — časová změna pole elektrického vytváří pole magnetické. Dále se ukázalo, že tyto změny vůbec nejsou vázány na vodivé prostředí, protože se mohou šířit i ve vakuu, zcela nezávisle na zdroji. Pro ilustraci se vraťme k vodivé smyčce. Začne-li jí procházet elektrický proud, změní v jejím okolí magnetické pole (z nuly na hodnotu −→ B ), jenže tato změna magnetického pole vyvolá vznik elektrického pole (z nuly na hodnotu −→ E ), a to nejen v samotné smyčce, ale i v prostoru kolem ní. Maxwell ukázal, že změna elektrického pole vyvolá opět přítomnost měnícího se (nestacionárního) magnetického pole, to opět vyvolává nestacionární elektrické pole a tak dále. Jednou vyvolaný vzruch se tak může šířit prostorem i v době, kdy už uvažovanou smyčkou proud vůbec neprochází. Takovéto vzruchy elektrických a magnetických polí nazýváme vlněním elektromagnetického pole nebo častěji elektromagnetickým vlněním. Maxwell byl dokonce schopen ze svých rovnic určit i rychlost šíření tohoto vlnění — elektromagnetické vlnění se šíří prostředím s elektrickou permitivitou ε a magnetickou permeabilitou µ rychlostí c = 1/ √ εµ, což v případě vakua dává přibližně 300 000 km/s. Tato hodnota byla nápadně blízko již tehdy experimentálně určené rychlosti šíření světla a tak Maxwell vyslovil předpoklad, který se ukázal jako pravdivý až několik let po jeho smrti, že totiž světlo resp. světelné vlny jsou jen uzoučkou částí rozsáhlého spektra elektromagnetických vln, jehož vlnové délky se rozprostírají na ohromné škále, od těch nejdelších ∼ 100 km po ty v současné době nejkratší známé ∼ 10−16 m. 13 Mohlo by se zdát, že takto se proud může udržet po dlouhou dobu na stejné hodnotě, ale není to tak. Indukovaný proud může vzniknout pouze mění-li se indukční tok smyčkou a ten by se neměnil, kdyby byl proud konstantní. Pokles proudu proto bude neustále pokračovat. 127 5.4.1 Spektrum elektromagnetického záření Podobně jako mechanické vlny, jsou i elektromagnetické vlny rovněž charakterizovány svou frekvencí f, resp. vlnovou délkou λ = c/f. Vlny různých frekvencí však mají různé vlastnosti. Proberme si nyní stručně vlastnosti elektromagnetických vln postupně od malých frekvencí (dlouhých vlnových délek) k nejvyšším dosud zaznamenaným frekvencím (velmi krátkým vlnovým délkám). Upozorňuji, že oblasti příslušející jednotlivým frekvenčním pásům jsou stanoveny pouze dohodou, i když mezinárodní (tyto pásy dokonce se při vysokých frekvencích překrývají, rozlišení se pak děje podle způsobu vzniku). Rádiové záření14 (vlny) — jejich zdrojem jsou zejména radiotechnické prvky (obvody střídavého proudu, vysílače, antény, ...) Pásmo rádiových vln se dále dělí: Elektromagnetickému vlnění s frekvencemi ∼ (30 − 3000) kHz se říká dlouhé a střední vlny, užívají se pro rozhlasové účely. Pomocí krátkých vln ∼(3−30) MHz lze díky odrazům od zemské ionosféry i samotné Země (radio)komunikovat na velké vzdálenosti. Velmi krátké vlny ∼ (30 − 300) MHz jsou užívány kromě rozhlasového i k televiznímu přenosu. Rovněž se užívají k radiotelefonnímu styku. Elektromagnetické vlny ve frekvenčním pásmu 300 MHz až 300 GHz, což je v pásmu vlnových délek 1 m až 1 mm, se nazývají mikrovlny a užívají se pro směrové spoje, družicový přenos, mobilní telefony, v radarové technice atd. Rovněž slouží jako ohřívací médium v mikrovlnných troubách. Optické záření — elektromagnetické záření s frekvencemi ∼ (3·1016 − 3·1011 ) Hz (∼ 10 nm − 1 mm.) Toto záření je obvykle dále děleno na infračervené, viditelné neboli světlo a ultrafialové. Často se termínu „světlo užívá i pro neviditelné optické záření. Zdrojem infračerveného záření jsou například zahřátá tělesa. Lidský organismus vnímá tento druh záření jako teplo. Užívá se k léčebným účelům, ohřevu, sušení apod. Oproti vidění pomocí světla, kdy v naprosté většině případů pozorujeme světlo odražené od předmětů, je „vidění pomocí infračerveného záření zprostředkováno elektromagnetickými vlnami, které jsou přímo vyzařovány tělesy. O tom jaké vlny a kolik jich bude daným tělesem vyzařováno rozhoduje zejména teplota tělesa Světlo jako druh elektromagnetických vln se vyznačuje zejména tím, že u lidí vyvolává zrakový vjem. Jeho zdrojem jsou například rozžhavená tělesa nebo změny v elektronových obalech atomů. Lidské oko vnímá různé vlnové délky světla jako různé barvy. Denní světlo považujeme za bílé, ale lze jej, např. rozkladem pomocí skleněného hranolu rozložit na několik pásů elektromagnetických vln, které již dále rozložit nejdou a lidskému oku se jeví jako různé barvy (viz odst. 6.3.1). Světlo s nejmenšími frekvencemi (∼ 3 · 1011 Hz) se jeví jako červené, směrem k o něco vyšším frekvencím se pak po řadě jeví jako oranžové, žluté, zelené a modré. Nejvyšším frekvencím odpovídá barva fialová (∼ 3 · 1017 Hz). Rozsah vlnových délek světla je obvykle udáván mezi 380 nm a 760 nm. Zdrojem ultrafialového záření jsou tělesa zahřátá na vysokou teplotu (Slunce, elektrický oblouk) nebo opět energetické změny v elektronových obalech atomů (tento 128 druh elektromagnetického záření produkuje např. trubička z křemenného skla15 naplněná párami rtuti a připojená na zdroj dostatečně vysokého napětí). Ve vysokých vrstvách atmosféry způsobuje ionizaci vzdušného kyslíku a to je příčinou vzniku ozónu. Obecně ultrafialové záření dokáže porušit některé druhy chemických vazeb, proto je potenciálně nebezpečné živým organismům. Zemská atmosféra naštěstí ultrafialové záření silně pohlcuje. Rentgenové záření — toto záření s vlnovými délkami ∼ (10−9 − 10−11 ) m vzniká například při přeměně kinetické energie rychle se pohybujících elektronů, které dopadají na povrch kovové elektrody (anody), na energii elektromagnetického záření (princip RTG). Čím má rentgenové záření větší frekvenci (kratší vlnovou délku), tím lépe proniká látkami a má větší ionizační účinky (tj. je schopno lépe vytrhávat elektrony z atomů a dělat z nich ionty). Rentgenové záření poškozuje biologické tkáně a ve větších dávkách je může být i smrtelné. Používá se například v rentgenové diagnostice, rentgenové terapii, defektoskopii atd. Záření gama — vzniká při radioaktivních přeměnách jader, nebo při reakcích elementárních částic. Původ kosmického záření gama dosud nebyl uspokojivě objasněn. Tento druh záření je velmi pronikavý a životu nebezpečný. 5.4.2 Energie a hybnost elektromagnetického pole Představme si malou periodicky se smršťující a roztahující kouli, umístěnou v obrovském kusu rosolu. Vzruchy způsobované koulí se přenášejí na částice rosolu (mechanickým) vlněním a rozkmitají je. Můžeme tedy říci, že každá částice do níž dorazilo vlnění se rozkmitala v důsledku předání energie od zdroje (koule) — vlnění přenáší energii. Jednoduchým pokusem s řadou ocelových koulí zavěšených na provázku se lze přesvědčit, že mechanické vlnění přenáší i hybnost (viz obr. 5.3 a 5.4). Elektromagnetickému (i gravitačnímu) poli lze též přiřadit energii a hybnost. Toto přiřazení je takové, že v uzavřené soustavě, kde se nachází látka i pole, se energie i hybnost mohou přelévat z látky na pole a obráceně, ale celkově se obě veličiny zachovávají. Přestože tedy vzruchy v elektromagnetickém poli (až na světelnou výjimku) nejsou přímo vidět, není pole jako forma existence hmoty o nic méně reálné než médium, ze kterého právě čtete tento text. Vraťme se na chvíli k představě zdroje vlnění v podobě koule. Kdyby koule kmitala harmonicky v prázdném prostoru, nic by z ní neodvádělo energii a my bychom jí mohli přiřadit konstantní mechanickou energii. Když bude koule obklopená rosolem, bude se její energie zmenšovat s tím, jak vlnění, které v rosolu vyvolá, bude tuto energii přenášet na okolí. Kdybychom kouli dodávali spojitě energii tak, aby kmitala stále stejně, koule by „vyzařovala vlnění s konstantním výkonem P,16 tj. za časovou jednotku by ve formě vln uvolňovala stále stejné množství energie. Množství energie přenášené na vzdálenější částice rosolu by však klesalo nepřímo úměrně s druhou mocninou vzdálenosti od zdroje. 15 Obyčejné draselné sklo ultrafialové záření pohlcuje. 16 Přesněji, s konstantním středním výkonem. 129 Obrázek 5.3: Uhodí-li koule do řady stejných koulí, chvíli se nic neděje ... Obrázek 5.4: ... a pak poslední koule z řady vyskočí Důvodem je toto: Předpokládáme-li ideální rosol, ve kterém se energie nebude ztrácet,17 projde každou sekundu P jouleů energie každou kulovou plochou obepínající zdrojovou kouli (viz obr. 5.5). Stejné množství energie tedy musí každou sekundu projít kulovou plochou s obsahem S1 = 4πr2 1 obepínající zdrojovou kouli ve vzdálenosti r1 od jejího středu i vzdálenější kulovou plochou o obsahu S2 = 4πr2 2 (r2 > r1). Vytneme-li na první ploše jednotkový čtverec, projde jím za sekundu P/S1 = P/(4πr2 1) energie. Jednotkovým čtvercem na druhé kouli však projde již jen P/S2 = P/(4πr2 2) jouleů. E1/1cm2 E2/1cm2 << E1/1cm2 Z je ploška o obsahu 1 cm2 , postavená kolmo ke smeru pohledu Obrázek 5.5: K rozptylu energie Z uvedeného plyne, že pokud je rosol homogenní, bude na každé jednotkové plošce přibližně stále stejné množství částic, a tedy vzdáleným částicím rosolu zdroj předá daleko méně energie než částicím bližším. 17 Tj. přeměňovat na jiné formy než opět mechanické kmitání částic rosolu. 130 Uvažujme nyní o elektromagnetickém poli jako analogii rosolu, kterým umí třást pouze elektricky nabitá tělesa a který umí ovlivňovat jen tato tělesa. Pro nenabitá tělesa nechť je dokonale prostupný. Bude-li se tedy nabité těleso určitým způsobem třást, budou se tyto záchvěvy přenášet elektromagnetickým polem alias rosolem na jiná nabitá tělesa, a to konečnou rychlostí (rychlostí světla). Toto chvění s sebou ponese energii, která se bude do pole spojitě rozptylovat. Rozborem Maxwellových rovnic lze ukázat, že kmitající nabitá koule by vyzařovala elektromagnetické vlny, které by z ní spojitě unášely energii rovnoměrně na všechny strany. Stejným řetězcem úvah jako v případě rosolu bychom přišli k tomu, že množství elektromagnetické energie zasahující malou plošku ∆S ve velké vzdálenosti je velmi malé — opět klesá se vzdáleností od zdroje jako 1/r2 (viz obr. 5.5). Z Maxwellových rovnic rovněž vyplývá, že energie elektromagnetického vlnění je úměrná druhé mocnině intenzity elektrického pole | −→ E |2 , podobně jako energie harmonického oscilátoru je úměrná druhé mocnině jeho amplitudy (viz rov. 3.3).18 Protože energie vlny klesá s druhou mocninou vzdálenosti, musí intenzita pole klesat s první mocninou, tj. je E ∼ 1/r. Tyto relativně přímočaré výsledky začaly získávat silné trhliny na počátku dvacátého století, kdy se zjistilo, že vzdálené nabité částice mohou od zdroje získat nečekané množství energie. Ukázalo se totiž, že vyzařuje-li zdroj elektromagnetické energie vlnění s frekvencí f, nebude přenášená energie libovolná, ale vždy bude pouze celočíselným násobkem energie hf, kde (univerzální) konstanta h ≈ 6, 63·10−34 J s dostala po svém objeviteli název Planckova konstanta. Říkáme, že elektromagnetická energie je kvantována a nejmenším balíčkům energie se říká kvanta energie. Tato kvanta se navíc při střetu s látkou chovají jako malé (bodové) částice (přenášejí i hybnost). Zkoumejme kulový zdroj, který každou sekundu vyzařuje jen malé množství elektromagnetické energie P a obklopme jej homogenní sférou elektricky nabitých částic, které se při dopadu elektromagnetické vlny rozkmitávají podle toho, jaká část elektromagnetické energie na ně dopadla. Pokrývá-li každá částice malou plošku ∆S, měla by, podle Maxwellových rovnic, částice ve vzdálenosti r od zdroje každou sekundu získat P 4πr2 ∆S jouleů energie.19 Ale protože energie je ze zdroje vyzařována v kvantech, nemůže na žádnou plošku nikdy dopadnout méně energie než hf! Protože se jistě dá nalézt vzdálenost r i časový interval ∆t, pro které platí P 4πr2 ∆S∆t < hf dovolí tento vztah experimentálně rozlišit mezi Maxwellovou teorií a teorií zahrnující kvanta energie. Vzdálená elektricky nabitá částice zasažená elektromagnetickou vlnou by 18 Důvodem, proč v energetické bilanci nefiguruje i vektor magnetická indukce je, že v elektromagnetické vlně platí mezi velikostí B a velikostí E přímá úměrnost. 19 Za předpokladu, že veškerá dopadající energie je částicí pohlcena. 131 se podle Maxwella dlouho téměř nepohnula, kdežto ve skutečnosti se pozoruje, že i takovéto částice občas utrží pěkný „elektromagnetický kopanec . Celá záležitost vypadá tak podivně, jakoby vlna šířící se na hladině rybníka, kde se nalézá míč, náhle zmizela a míč by povyskočil. Maxwellova teorie, přestože se stala oporou pro celý elektrotechnický průmysl, při popisu dějů, při kterých dochází k výměnám elektromagnetické energie řádu hf zklamává. Důkladná kvantová teorie elektromagnetického pole a jeho interakce s látkou (tzv. kvantová elektrodynamika) však byla podána až koncem čtyřicátých let dvacátého století. O souvislosti kvant a elektromagnetického pole (světla) si povíme více v kapitole 6. 5.4.3 Jednota elektromagnetického pole, rychlost světla Jednotu a vlastně relativnost samostatného použití pojmů elektrického a magnetického pole můžeme jednoduše demonstrovat například takto: Pole vytvořené kolem elektrického náboje, který je v klidu, nazýváme polem elektrickým, ovšem díváme-li se na ten samý náboj z okolo projíždějícího rychlíku, náboj se vůči nám (naší vztažné soustavě) pohybuje a my jej můžeme považovat za elektrický proud. Elektrický proud kolem sebe ale vytváří i pole magnetické a proto by výzkum v naší rychlíkové soustavě ukázal, že pole kolem pozorovaného náboje má nejen elektrickou, ale i magnetickou složku. Elektrické a magnetické pole jsou tak opravdu jen speciálními případy jediného pole elektromagnetického. Představu elektromagnetického pole jako výše uvedené analogie rosolu narušuje kromě kvantování jeho energie a vzájemného proměňování polí −→ E a −→ B při pohybu pozorovatele ještě další zvláštní okolnost. Šíření vzruchu v elektromagnetickém poli nacházejícím se ve vakuu je proces značně rychlý, vlastně je to nejrychlejší proces, který doposud známe. Navíc jsme v současné době přesvědčeni, že žádný fyzikální vzruch se nemůže šířit rychleji.20 Skutečná, až nepochopitelná zvláštnost je však toto: Mnohými experimenty bylo (k častému zklamání samotných experimentátorů) dokázáno, že rychlost šíření elektromagnetických vln vůbec nezávisí na pohybu zdroje těchto vln. To znamená, že ať se zdroj vlnění pohybuje jakkoli rychle, bude se elektromagnetická vlna šířit stále stejnou rychlostí c, a to dokonce i nezávisle na rychlosti pozorovatele. Podivnost této vlastnosti si ilustrujme na příkladu: Řekněme, že pes, který když jste v klidu se k vám přibližuje rychlostí o velikosti v. Z klasické úvahy plyne, že začnete-li náhle od něj utíkat rychlostí u < v, bude se k vám blížit pouze rychlostí v − u. Nyní si představme, že by vás „honilo světlo (což, jak už jsme uvedli, je částí elektromagnetického spektra). Pokud na vás kamarádka zasvítí ruční svítilnou, bude se směrem k vám světlo pohybovat rychlostí c, pokud se ale rozhodnete, že před světlem začnete utíkat rychlostí u, nebude vás světlo dohánět rychlostí c − u, ale opět rychlostí c, a to nezávisle na rychlosti u jakou utíkáte. Obdobně by vás světlo „nehonilo o nic pomaleji, kdyby na vás vaše kamarádka svítila ze zadního sedadla auta jedoucího velkou rychlostí směrem od vás. Právě z této zvláštnosti šíření elektromagnetických vln vyplývá i většina 20 Rychlost šíření elektromagnetických vln obvykle značíme c a její hodnota je neuvěřitelně vysoká — 299 792 458 m s−1 ≈ 300 000 km s−1 . Pro představu, Superman by touto rychlostí byl schopen za jedinou sekundu více než sedmkrát obletět Zemi podél rovníku. 132 podivností speciální teorie relativity, jako např. relativita současnosti, zpomalování toku času a zkracování délek, o kterých jsme se zmínili v 2.2.4. Oproti mechanickému vlnění, které ke svému šíření se potřebuje nějaké „nosné prostředí, se ukazuje, že eletromagnetické vlny takové prostředí nepotřebují — šíří se i ve vakuu (tj. v prostoru bez částic). Vědci si v minulosti neuměli představit, že by nějaký druh vlnění nepotřeboval ke svému šíření nosné prostředí, proto jeho existenci předpokládali a nazvali jej éter. Tato konstrukce však měla více problémů, než řešila,21 proto se od užívání této představy ve fyzice ustoupilo. Nyní obrátíme svou pozornost na studium elektromagnetických vln, jejichž frekvence se nachází v oblastech detekovatelných lidským okem nebo blízko nich. 21 Vlastně řešila jediný problém, zakořeněnou představu, že vlnění musí být přenášeno nějakým médiem. 133 Kapitola 6 Optika 6.1 Optika a podstata světla Optika je fyzikální disciplína zabývající se zákonitostmi a procesy, kterých se účastní světlo, případně blízké infračervené a ultrafialové záření. Newtonova představa světla jako proudu částic (korpuskulí) se počátkem 19. století ukázala jako nevyhovující (Youngův pokus, Foucaultovo určování rychlosti světla ve vodě, difrakce na hraně, ...). Jak jsme viděli v předchozí kapitole, Huygensovu představu světla jakožto vlnění v druhé polovině stejného století potvrdil a upřesnil J. C. Maxwell svým objevem elektromagnetického spektra, jehož je světlo jen malou částí. Optika se tak stala podoborem elektromagnetické teorie pole (elektromagnetická optika). Vlnová povaha světla se však počátkem dvacátého století ukázala rovněž nedostatečným přiblížením popisu reality. Byly provedeny experimenty, na jejichž vysvětlení Maxwellova elektromagnetická teorie nestačila. Aby za každou cenu objasnil experimentální výsledky týkající se vyzařování vycházejícího ze začerněné pece (což je model tzv. absolutně černého tělesa), musel německý vědec Max Planck předpokládat, že elektromagnetické vlnění (tedy i světlo) si při interakci s látkou vyměňuje energii jen v určitých dávkách — kvantech energie. Planck původně považoval svůj „objev pouze za matematický trik, ovšem o několik let později užil Albert Einstein Planckovu kvantovou hypotézu k vysvětlení dalších jevů, které z hlediska Maxwellovy teorie elektromagnetického pole byly nepochopitelné. Po dalších výzkumech se dospělo i k tomu, že elektromagnetické vlnění si při styku s látkou vyměňuje nespojitě také hybnost (což se na vlnění nesluší), tj. chová jako soubor jakýchsi zrníček hmoty (kvant). Tato kvanta byla nazvána fotony. Tím se do představy o světle opět „vkradly částicové rysy. V současné době tedy světlo považujeme za soubor fotonů, které se při styku s látkou chovají jako malé lokalizované objekty mající svou energii a hybnost, ale přitom se šíří ve formě vlnění (což je ne příliš dobře lokalizovatelný proces) s vlnovými délkami z intervalu ∼ (380; 760) nm. Protože fotony přenášejí energii a protože energie elektromagnetického vlnění v určitém místě je úměrná druhé mocnině intenzity elektrického pole v tomto místě (viz diskuse k poklesu intenzity se vzdáleností od zdroje na str. 131), bude do místa s větší 134 hodnotou E dopadat více fotonů, než do místa s menší E. Zajímáme-li se o jednotlivé fotony, bude tak pravděpodobnost P dopadu fotonu na určité místo úměrná E2 , tj. P ∼ | −→ E |2 (6.1) Často se v této souvislosti hovoří o dvojaké (dualistické) vlnově částicové povaze světla a říká se, že „světlo se částečně chová jako vlna a částečně jako částice . Tuto terminologii však nepovažuji za příliš vhodnou. Důvod, který bych asi nevyjádřil lépe, popsal ve své útlé, ale velmi pěkné knížce [30] Daniel Styer:1 „Z hlediska každodenního pohledu na svět známe několik tříd objektů: kuličky, kousky tmelu, vlnky na rybníku, příbojové vlny v oceánu, mraky, tyče, bubliny atd. Požadovat po objektech z mikrosvěta aby zapadly do jedné nebo druhé z těchto kategorií je naprosto scestné. Je to jako když muž narozený a vychovaný v Anglii, znající několik druhů zvířat: koně, krávy, prasata atd., cestuje do Afriky, uvidí hrocha a odmítá uznat, že je to nový druh zvířete. Místo toho zastává názor, že zvíře je „v jistém smyslu jako kůň a v jistém smyslu jako prase . Spíše než říkat „foton se chová trochu jako vlna a trochu jako částice , raději říkám „foton se chová přesně jako foton — toto chování není všedně známé a tedy nemůže na vás působit uspokojivým dojmem. Matematicky konzistentním způsobem popisuje elektromagnetické pole a jeho interakce s látkou část kvantové teorie zvaná kvantová elektrodynamika, a činí tak s přesností, která nemá v dějinách vědy obdoby.2 Součástí kvantové elektrodynamiky je kvantová optika. Nejúplnějším popisem světla v rámci nekvantové (klasické) optiky však zůstává elektromagnetická teorie. V předchozí kapitole jsme si ukázali, že elektromagnetické pole, resp. elektromagnetické záření má vektorový charakter (popisujeme jej vektorovými veli- činami −→ E a −→ B ), nicméně se ukazuje, že mnohé optické jevy lze vysvětlit pomocí teorie, v níž je světlo popsáno pomocí jediné skalární funkce — takto zjednodušené teorii říkáme vlnová optika. Zjednodušení vlnové optiky nám při zkoumání světelných jevů dovoluje užívat prakticky stejné pojmy, jaké jsme užívali při studiu mechanického vlnění v části 3.2. Blíží-li se vlnová délka oné skalární funkce k nule, nebo je zanedbatelná oproti typickým rozměrům předmětů kolem nichž se světlo šíří, dostáváme se k tzv. paprskové optice. Uspořádání teorií týkajících se světla co do objemu a hloubky popisu světelných jevů znázorňuje obr. 6.1. V následujícím se stručně seznámíme s několika jevy z oblasti paprskové a vlnové optiky. 6.2 Paprsková optika Paprsková optika (dříve často nazývaná geometrickou optikou) se zabývá zákony šíření světla založené na předpokladu přímočarého šíření světla ve stejnorodém (homogenním) prostředí, zákonech odrazu a lomu a na vzájemné nezávislosti chodu světelných paprsků. V souvislosti se zkoumání průchodu světelných paprsků různými prostředími se často zavádí pojem index lomu látky n , a to jako poměr mezi rychlostmi světla šířícího se ve 1 Volně přeloženo a aplikováno na fotony místo elektronů. 2 Na populární úrovni se o této úžasné teorii můžete dočíst v [15]. 135 Paprsková o. Vlnová o. Elektromagnetická o. Kvantová optika Obrázek 6.1: Obory optiky vakuu a v daném látkovém prostředí (n def = c/v), můžeme zákon lomu 3.2.4 přepsat: n1 sin α1 = n2 sin α2 kde n1 a n2 jsou indexy lomu příslušných prostředí (a samozřejmě stále platí, že lomený paprsek leží v rovině dopadu). Z platnosti zákona lomu i pro světlo je zřejmé, že při jeho přechodu z prostředí s indexem lomu n1 do prostředí s indexem lomu n2, kde n2 < n1, bude při úhlu dopadu, pro který platí sin αm > n2/n1 nastávat úplný odraz (viz odst. 3.2.4). Tento jev lze snadno pozorovat, pozorujete-li při potopení vodní hladinu bez potápěčských brýlí, nebude k vám světlo přicházet z celé vodní plochy, ale jen z určitého kruhu, vymezeného právě paprsky αm. 6.2.1 Optické zobrazování Z každého bodu A svítícího nebo osvětleného tělesa vychází rozbíhavý svazek světelných paprsků. Po dopadu na oko je jím tento svazek změněn na sbíhavý a v průsečíku paprsků A’ vznikne na sítnici obraz bodu A. Souhrn obrazů všech bodů pozorovaného tělesa (předmět) vytváří celkový obraz tělesa. Oko samozřejmě není jedinou možnou soustavou na vytváření optických obrazů osvětlených nebo svítících předmětů. Obecně optickou soustavou rozumíme uspořádání optických prostředí, která mění směr chodu paprsků. Postup, kterým získáváme optické obrazy předmětů, optické zobrazování. Zobrazujeme-li bod A pomocí optické soustavy, pak jestliže se paprsky při průchodu touto soustavou sbíhají do jednoho bodu, vznikne v jejich průsečíku obraz A’, který můžeme zachytit na stínítko (čtvrtka, fotografický film, ...). Takovýto obraz nazýváme skutečný. Naopak, jestliže při zobrazování bodu A optickou soustavou bude na jejím konci 136 svazek paprsků rozbíhavý, nebudeme moci jeho obraz na žádném stínítku zachytit. Obraz bodu A lze pak zaznamenat pouze v případě, když původně rozbíhavý svazek paprsků změníme opět na sbíhavý (např. okem nebo lupou). Obraz A’ se nám pak bude promítat do zpětného prodloužení původního rozbíhavého svazku. Takovému „neskutečnému obrazu říkáme obraz zdánlivý. Optické soustavy mohou být i značně složité, my se však na tomto místě seznámíme jen s jejich jednoduchými verzemi, které jsou válcově souměrné podél jedné osy, tzv. optické osy. Budeme uvažovat pouze jednoduchá zobrazení bodů nebo úseček kolmých na optickou osu, a to pomocí zrcadel (zobrazení v důsledku platnosti zákona odrazu světla) a (tenkých) čoček (zobrazení v důsledku platnosti zákona lomu světla na dvou rozhraních), přitom se omezíme pouze na studium paprsků šířících se v blízkosti optické osy.3 V tomto přiblížení považujeme zobrazení pomocí dutých zrcadel a čoček za ideální (odhlédneme-li od vlnové povahy světla) — zobrazí totiž bod opět na bod a tvar zobrazených předmětů se nedeformuje. Při matematickém studiu zobrazení je nutné se nejprve dohodnout jakým způsobem se co měří. Proto si nyní zavedeme několik pro náš účel důležitých pojmů a konvencí (dohod): • Vzhledem k válcové souměrnosti můžeme zkoumat optické soustavy jen ve dvou rozměrech (směr podél optické osy a kolmo k této ose). V nákresech zpravidla vstupuje světlo, resp. paprsky světla, do optické soustavy zleva. Při zobrazování pomocí za sebou jdoucích optických soustav se obraz z jedné soustavy stává předmětem v následující soustavě. • Hlavní rovina soustavy je rovina kolmá na optickou osu zobrazovací soustavy. U rovinného zrcadla splývá s odraznou plochou, u kulových zrcadel prochází jejich průsečíkem s optickou osou (tento průsečík nazýváme vrchol zrcadla) a u čoček se zanedbatelnou tloušťkou (jen takové nás budou zajímat) prochází jejich středem. • Orientovanou vzdálenost předmětu od hlavní roviny značíme a a vzdálenost jeho obrazu od této roviny a′ . Nachází-li se předmět před zrcadlem, volíme a > 0, pro předmět nacházející se za zrcadlem je voleno a < 04 . Obraz předmětu zobrazeného zrcadlem má vzdálenost a′ > 0, je-li předmět před zrcadlem a a′ < 0 zobrazí-li se za zrcadlo. Hlavní rovina nám tak prostor rozdělí na kladnou (před) a zápornou (za) část. U čoček opět platí, že vzdálenost předmětu a > 0, je-li předmět před čočkou a a < 0, nachází-li se v prostoru za čočkou. Pro obraz předmětu je však dohoda stanovena obráceně než u zrcadel — a′ < 0 v prostoru před čočkou a a′ > 0 v prostoru za čočkou. 3 Takovéto paprsky svírají s optickou osou úhly menší než zhruba 2◦ . V této oblasti také platí vztahy sin α ≈ tg α ≈ α, které velmi zjednodušují teoretické vztahy. 4 Jak se může předmět zobrazení dostat za zrcadlo? Pokud je zobrazovací soustava složitější, může se například stát, že se obraz nějakého tělesa stane předmětem pro zobrazení v zrcadle tak, že paprsky toto těleso vymezující se budou protínat v prostoru za zrcadlem 137 • Obrazové ohnisko je bod na optické ose (obvykle značený jako F’), ve kterém se sbíhají paprsky přicházející do soustavy rovnoběžně s optickou osou (předmět pro F’ leží v nekonečnu). Předmětové ohnisko (ozn. F) je bod na optické ose, jehož zobrazením získáme svazek paprsků jdoucích rovnoběžně s optickou osou (obraz F leží v nekonečnu). Orientovaná vzdálenost F od hlavní roviny se nazývá předmětová ohnisková vzdálenost a značí se f, podobně f′ značí obrazovou ohniskovou vzdálenost. Rovina kolmá na optickou osu a protínající ji v ohnisku se nazývá ohnisková rovina. Například obrazové ohnisko protíná rovina, na které se sbíhají navzájem rovnoběžné paprsky vstupující do soustavy. • Vzdálenost y zobrazovaného bodu (předmětu) od optické osy bereme jako kladnou, leží-li nad touto osou a jako zápornou, leží-li pod ní. Obdobně u vzdálenosti jeho obrazu y′ od optické osy. Z def = y′ /y definujeme tzv. příčné zvětšení, které určuje, kolikrát se obraz oproti předmětu vzdálil od optické osy a na jakou stranu (+ stejná, − opačná). 6.2.2 Zrcadla Rovinná zrcadla Obraz libovolného bodu v rovinném zrcadle lze jednoduše sestrojit např. zpětným prodloužením dvou paprsků, které z něj vystupují a odrážejí se podle zákona odrazu od plochy zrcadla. Obraz předmětu stojícího se před rovinným zrcadlem se nachází v prostoru za zrcadlem (a′ > 0) a je tedy zdánlivý, dále je vzpřímený a stejně velký jako předmět (Z = 1) — ověřte sami! Kulová zrcadla Zrcadlové plochy, které mají tvar vnitřní části povrchu koule (kulového vrchlíku) se nazývají dutá zrcadla, je-li jejich odraznou plochou část vnějšího pláště koule, nazývají se zrcadla vypuklá. Dutá zrcadla se kromě svého vrcholu vyznačují ještě dvěma význačnými body, které leží na optické ose zrcadla: středem křivosti C, což je geometrický střed koule opsané vrchlíku tvořícímu zrcadlo a ohniskem F (u kulových zrcadel leží předmětové i obrazové ohnisko v jednom bodě). Pro jejich orientované vzdálenosti r a f od hlavní roviny (resp. od vrcholu zrcadla) platí rovněž znaménková konvence — leží-li před zrcadlem jsou kladné, leží-li za ním, jsou záporné. Polohu obrazu A’ bodu A obvykle konstruujeme použitím dvou ze tří význačných paprsků (viz obr. 6.2): • paprskem jdoucím rovnoběžně s optickou osou zrcadla; • paprskem procházejícím ohniskem nebo do ohniska mířícím; • paprskem jdoucím nebo mířícím do středu křivosti kulového zrcadla. Jak již bylo uvedeno, při omezení se na studium paprsků blízkých optické ose nejsou jimi zobrazené předměty deformovány — snadno pak můžeme ze znalosti obrazů několika bodů předmětu odvodit vlastnosti celého obrazu předmětu. 138 C F y y‘ Obrázek 6.2: Geometrická konstrukce obrazu u dutého zrcadla Z geometrie zrcadla a ze zákona odrazu lze odvodit tzv. zobrazovací rovnici kulového zrcadla: 1 a + 1 a′ = 1 f = 2 r (6.2) jež svazuje veličiny a, a′ , f a r (pozor při počítání musíme dbát znaménkové konvence). 6.2.3 Čočky Čočky budeme považovat za skleněná tělesa ohraničená dvěma kulovými, případně rovinnými plochami, přitom budeme předpokládat, že jsou tak tenké, že můžeme průsečíky jejich lámavých ploch s optickou osou (vrcholy) považovat za splývající (tenké čočky). Obvykle rozlišujeme dva druhy čoček — spojky, mající u vrcholu větší tloušťku než na okraji a rozptylky, u kterých to je naopak. Na rozdíl od zrcadel leží u čoček předmětové a obrazové ohnisko v různých bodech. U tenkých čoček však leží po obou stranách hlavní roviny ve stejných vzdálenostech (f = f′ ). Předmětové ohnisko F se u spojek nachází před čočkou a je f > 0, u rozptylek leží za čočkou a je f < 0. Obrazové ohnisko F’ je u spojek obraz skutečný (f′ > 0) a u rozptylek je neskutečný (f′ < 0). Obrazy bodů opět konstruujeme pomocí dvou ze tří významných paprsků • paprskem jdoucím rovnoběžně s optickou osou čočky (láme se do F’); • paprskem procházejícím předmětovým ohniskem F nebo do tohoto ohniska mířícím (po lomu paprsek jde rovnoběžně s optickou osou); • paprskem jdoucím středem čočky (paprsek nemění směr). 139 Je zajímavé, že pro čočky umístěné ve vzduchu (přesněji vakuu) lze pro oblasti blízké optické ose sestavit rovnici formálně zcela stejnou jako u zrcadel, říkáme jí zobrazovací rovnice tenké čočky:5 1 a + 1 a′ = 1 f (6.3) jež svazuje veličiny a, a′ , f (opět pozor na znaménkovou konvenci). Z „ideálnosti zobrazení a ze znalosti chodu výše uvedených paprsků lze opět snadno konstruovat obrazy předmětů. V praxi se samozřejmě při zobrazování čočkami používají i široké svazky paprsků různých frekvencí. Potom nastávají odchylky od ideálního zobrazení a vznikají zobrazovací vady čoček. 6.3 Vlnová optika Chování světla jako vlnění můžeme z velké části popisovat pomocí pojmů, s nimiž jsme se seznámili v odst. 3.2. Vlnovou povahu světla potvrzuje zejména jeho schopnost interference (skládání) (viz odst. 3.2.2). S vlnovou povahou světla však souvisí i jev zvaný disperze (rozklad), zabývejme se nejprve jím. 6.3.1 Disperze Běžné bílé denní světlo je složeno z elektromagnetických vln různých frekvencí (a tedy i různých vlnových délek). Ukazuje se však, že (fázová) rychlost těchto jednotlivých vln může být, v závislosti na prostředí v němž se šíří, různá, tj. rychlost vlnění je obecně funkcí jeho frekvence (nebo vlnové délky) (v = v(f)). To ovšem znamená, že je na frekvenci vlny závislý i její index lomu, tj. n = n(f). Při přechodu elektromagnetického vlnění z jednoho prostředí do druhého tedy dochází k lomu každé (monofrekvenční) složky zvlášť (viz rov. 6.2) — tomuto jevu říkáme disperze (rozklad) a konkrétně pro světelné vlnové délky disperze světla. Například fázová rychlost světla šířícího se ve skle se vzrůstající frekvencí klesá (tj. funkce v = v(f) je klesající a funkce n = n(f) rostoucí) a proto se bude červené světlo při průchodu skleněným hranolem lámat nejméně a fialové světlo nejvíce (viz obr. 6.3). Hranol tak dokáže od sebe prostorově odlišit různé vlnové délky světla. Například úzký svazek paprsků bílého světla hranol rozloží na široké barevné spojité spektrum. Barvy z tohoto spektra již více rozložit nejdou. Obdobný jev můžeme pozorovat v přírodě ve formě duhy, kde disperzní prostředí tvoří kapičky vody, do nichž se světlo láme. Po několika odrazech uvnitř kapičky světlo vystupuje opět ven, ale díky disperzi již není bílé, ale je rozložené do spektrálních barev. 5 Najděte rozdíly mezi touto rovnicí a rovnicí 6.2. 140 bílá fialová cervená zelená zelená Obrázek 6.3: Rozklad světla hranolem 6.3.2 Interference světla Jak již bylo několikrát uvedeno, elektromagnetické pole splňuje velmi důležitý princip superpozice. Přichází-li tedy světlo z různých zdrojů do nějakého bodu v prostoru, sčítají se v něm okamžité hodnoty vektorů elektrické intenzity −→ E ze všech těchto zdrojů a stejně tak okamžité hodnoty vektorů magnetické indukce −→ B . Jsou-li zdroje světla zcela nezávislé, je výsledkem skládání obvykle rychle se měnící elektromagnetické pole. Změny tohoto pole prakticky nelze postřehnout, protože i velmi kvalitní detektory zaznamenají prakticky jen střední hodnoty dopadající energie. Vysílají-li (idealizované) zdroje elektromagnetické vlnění o stejné frekvenci a jejich fázový rozdíl se s časem nemění, je výsledkem jejich skládání časově stálé pole, které již pozorovatelné je. Monofrekvenční vlny, jejichž vzájemný fázový rozdíl se nemění nazýváme koherentní vlnění. Zdroje koherentních světelných vln nazýváme koherentní zdroje. Skládání různých koherentních světelných vln nazýváme interference světla. Zkoumejme nyní jaké jevy mohou nastat při skládání světelných vlnění šířících se ze dvou koherentních zdrojů v průhledném prostředí s indexem lomu n. Předpokládejme pro jednoduchost, že vektory elektrické intenzity těchto vln kmitají ve stejném směru (viz odst. 3.2.2 o skládání vlnění) — o takovém světle pak říkáme, že je lineárně polarizované.6 Výsledný vektor −→ E kmitá se stejnou frekvencí jako skládané vektory −→ E1 a −→ E2 obou vln a jeho amplituda závisí na rozdílu fází těchto vln. Tento rozdíl je v různých místech různý a tedy i amplituda výsledného vlnění se místo od místa mění (ale díky koherenci je časově stálá). Největší je v místech, kam vlnění z obou zdrojů přicházejí ve stejné fázi, vektory −→ E1 a −→ E2 pak mají stejnou orientaci a algebraicky se sčítají. Naopak v místech, kde fáze obou vlnění je opačná, mají oba vektory orientaci opačnou a elektrická (a samozřejmě i magnetická) složka vlny se ruší. V prvním případě opět říkáme, že v takových bodech nastává kon- 6 Protože vektory magnetické indukce jsou ve světelné vlně (v nevodivém prostředí) vždy kolmé na vektory elektrické intenzity, nemusíme se o ně nadále starat — nic nového nám totiž o problému neřeknou. 141 struktivní interference, rozdíl fází obou vln je zde tedy ∆ϕ = 2k π k ∈ Z (6.4) V případě druhém, hovoříme o interferenci destruktivní a v místech kde nastává, je rozdíl fází ∆ϕ = (2k + 1)π (6.5) Jinými slovy: konstruktivní interference nastává v místech, kde rozdíl fází je sudým násobkem π (stejná fáze) a destruktivní interference v místech v nichž je rozdílem fází vlnění lichým násobkem π (opačná fáze). Podmínky vzniku minim a maxim lze rovněž vyjádřit pomocí vzdáleností studovaného místa od zdrojů vlnění. Protože obě vlnění kmitají v jednom směru, nemusíme se starat o jejich vektorový charakter. Považujeme-li oba zdroje za bodové (kulové), můžeme kmitání elektrické intenzity v bodě, který se nachází ve vzdálenosti r od daného zdroje v čase t vyjádřit rovnicí E(r, t) = E0 r cos[ω(t − r vn ) + ϕ0] (6.6) kde E0 je amplituda elektrické intenzity, ω = 2πf je úhlová frekvence vlnění, vn = c/n je fázová rychlost šíření vlnění v prostředí s indexem lomu n a ϕ0 je počáteční fáze vlnění.7 Rozdíl fází obou vln pak bude ∆ϕ = ϕ1 − ϕ2 = ω r1 − r2 vn + (ϕ01 − ϕ02) kde značení je zřejmé z předchozího. Zvolíme-li si pro jednoduchost počáteční fáze nulové (ϕ01 = ϕ02 = 0), pak vzhledem k platnosti vztahu λn = vn/f, kde λn je vlnová délka světla v daném prostředí, můžeme psát8 ∆ϕ = 2πf vn (r1 − r2) = 2π λn ∆r = 2π pro konstruktivní interferenci (2k + 1)π pro destruktivní interferenci Z uvedeného ovšem vyplývá, že nachází-li se zdroj vlnění Z1 ve vzdálenosti r1 od studovaného místa B a zdroj Z2 ve vzdálenosti r2, bude (na čase nezávislá!) podmínka vzniku maxima vlnění v tomto místě dána vztahem r1 − r2 ≡ ∆r = 2k λn 2 při k ∈ Z (6.7) tj. rozdíl vzdáleností zdrojů od bodu B musí být roven sudému násobku půlvln. Aby v daném místě mělo vlnění minimum (tj. aby v něm elektromagnetická vlna (světlo) měla 7 Pokles amplitudy E0 způsobené členem r ve jmenovateli souvisí ze zákonem zachování energie a tím, že energie přenášená vlněním je úměrná E2 0 (viz diskuse o rozptylu energie v odst. 5.4.2). 8 Vlnová délka λn vlnění v prostředí s indexem lomu n je oproti vlnové délce λ tohoto vlnění ve vakuu zmenšena n-krát, protože platí λn = vn/f = c/(nf) = λ/n. Vzhledem k tomu, že n ≥ 1 pro všechny typy prostředí, vidíme, že se vlnová délka při přechodu z vakua (n = 1) do jiného prostředí vždy zkracuje. 142 nejmenší výslednou amplitudu elektrické intenzity i magnetické indukce), je nutné splnit podmínku ∆r = (2k + 1) λn 2 při k ∈ Z (6.8) tj. rozdíl vzdáleností daného místa od zdrojů musí být roven lichému násobku půlvln. V předchozím se předpokládalo, že zdroje i sledované „interferenční místo se nachází v prostředí charakterizovaném jediným indexem lomu n. V praxi se ovšem zdroje i studovaná oblast mohou nacházet v různých prostředích. Analýzu interference vln za těchto okolností zjednodušuje veličina zvaná optická dráha l. Tato veličina se přiřazuje vzdálenosti s, kterou urazí vlnění v prostředí s indexem lomu n za dobu ∆t tak, že l je vzdálenost, kterou toto vlnění urazí za stejnou dobu ve vakuu. Platí tedy ∆t = s v = l c ⇒ l = ns Z1 Z2 r11 r13 r21 r23 Obrázek 6.4: K výpočtu rozdílu optických drah Při vyšetřování interference v daném místě již nezkoumáme přímo rozdíl jeho vzdáleností od zdrojů, ale rozdíl odpovídajících optických drah (často říkáme dráhový rozdíl). Na obr. 6.4 se zdroj Z1 nachází v prostředí s indexem lomu n1 a zdroj Z2 v prostředí s indexem lomu n2. Zkoumáme-li interferenci v prostředí s indexem lomu n3, bude závislá na rozdílu optických drah ∆l = (n1r11 + n3r13) − (n2r22 + n3r23) Ze zkoumání fázových rozdílů vln procházejících různými prostředími lze vyvodit platnost vztahů: ∆l = 2k λ 2 (6.9) ∆l = (2k + 1) λ 2 (6.10) tentokrát je však λ rovna vlnové délce vlnění ve vakuu! Ověřte, že výrazy 6.7 a 6.8 jsou speciálními případy těchto vztahů pro jediné prostředí. 143 6.3.3 Difrakce Difrakce (ohyb) světla je jev vyplývající z vlnové povahy šíření světla a spočívající v pronikání světla do oblasti geometrického stínu (nastává odchylka od přímočarého šíření světelných paprsků). Princip jejího vzniku lze vyložit pomocí Huygensova principu (viz 3.2.3): body ležící na vlnoploše, do nichž dorazilo vlnění se stávají novými (elementárními) zdroji vlnění — výsledné vlnění (výslednou amplitudu) získáme jejich složením (superpozicí) v daném bodě a protože jsou tyto „nové zdroje vzájemně koherentní, budou vlnění buzená z těchto zdrojů spolu interferovat. V důsledku interference však jednotlivé směry šíření paprsků výsledné vlnoplochy nejsou zastoupeny stejně — některé směry se interferencí zesilují (konstruktivní interference), jiné zeslabují (destruktivní interference), proto se v ohybovém (difrakčním) obrazci vytvořeném na stínítku postaveném za štěrbinu střídají místa maximální a nulové intenzity (v závislosti na úhlu ohybu α — viz obr. 6.5). Tato intenzita v důsledku poklesu s 1/r s rostoucím úhlem α klesá. a d h a sina Obrázek 6.5: K vysvětlení ohybu vlnění Uvažujme rovinnou světelnou vlnoplochu, získanou jednobarevným (monofrekvenčním) plošným zdrojem světla (nebo bodovým zdrojem ve velké vzdálenosti), dopadající kolmo na úzkou štěrbinu o šířce a (viz obr. 6.5). Body v této štěrbině se stávají elementárními zdroji vln, které se za štěrbinou šíří všemi směry a navzájem interferují. Elementární zdroje světla po celé délce štěrbiny „kmitají se stejnou fází (rovinná světelná vlnoplocha k nim dorazila naráz), ale navzájem rovnoběžné paprsky odchylující se o nenulový úhel α od paprsků dopadajících mají fázi různou. Například paprsek h „vyprodukovaný zdrojem na horním okraji štěrbiny je dráhově (a tedy i fázově) zpožděn za paprskem d vzniklým v důsledku „kmitání zdroje na dolním okraji štěrbiny — musí tak ve směru určeném úhlem α urazit vzdálenost o δ = a sin α větší. Je zřejmé, že pro jiné směry paprsků je tato „zpožďovací vzdálenost jiná. Vybereme-li směr, ve kterém je dráhové zpoždění δ obou krajních paprsků rovno vlnové délce v daném prostředí (δ = λn), urazí dolní paprsek oproti střednímu paprsku navíc dráhu λn/2. Podobně každému paprsku vycházejícímu z jedné poloviny štěrbiny pod úhlem α, přísluší v druhé polovině štěrbiny s ním rovnoběžný paprsek opožděný o λn/2. Všechny 144 vzájemně rovnoběžné paprsky vystupující ze štěrbiny pod úhlem α tak můžeme „spárovat a pokud je svedeme např. spojkou do jednoho bodu (v její ohniskové rovině) na stínítko, interferencí se v tomto směru světlo úplně vyruší. Na stínítku bychom pak za podlouhlou štěrbinou viděli tmavý pruh. Destruktivní interference však nenastává pouze ve směru určeném úhlem α, pro který platí a sin α = λn, ale platí i pro všechny úhly αk, pro které je a sin αk = kλn, kde k ∈ N. Platnost této věty ověříme obdobnou úvahou: rozdělíme si štěrbinu na k stejných dílů tak, že krajní paprsky každého dílu mají rozdíl drah roven λn. Ale rozdělíme-li ještě každý z těchto dílů na polovinu, opět můžeme po dvou vybrat paprsky, jejichž dráhový rozdíl je λn/2 a tedy se interferencí ruší. Na stínítku tak po svedení těchto paprsků do jednoho bodu spojkou dostáváme celou soustavu tmavých (a samozřejmě světlých) proužků. Přímo naproti středu štěrbiny bude na stínítku maximum světla všech vlnových délek, neboť zde se všechny vlny z celé štěrbiny potkávají se stejnou fází, proto se zesilují. Interference na tenké vrstvě Představme si tenkou destičku o tloušťce d z průhledné látky s indexem lomu n. Umístíme-li tuto destičku do vzduchu a osvětlíme ji kolmo dopadajícími paprsky, bude se světlo na horním rozhraní částečně odrážet zpět a částečně pronikne do vrstvy, přičemž se další jeho část rozdělí na dolním rozhraní. Zajímejme se nyní o interfernci paprsků odražených od vrchního rozhraní mezi vzduchem a destičkou a paprsků odražených od dolního rozhraní a navíc prošlých zpět rozhraním horním. Z Maxwellovy teorie lze teoreticky dokázat, že při odrazu světla (elektromagnetického vlnění) na prostředí s větším indexem lomu, se změní fáze odraženého světla o π (fáze se změní na opačnou). Při odrazu vlnění na prostředí s indexem lomu nižším, stejně jako při průchodu rozhraním dvou prostředí, změna fáze nenastává. Mezi zmiňovanými paprsky tak vzniká fázový posun ∆ϕ = π + 2π λn 2d. Z podmínky vzniku interferenčního maxima 6.4 pak vyplývá (2k − 1) λn 2 = 2d (6.11) tj. aby se vlny odražené od obou rozhraní skládaly konstruktivně, musí se na dvojnásobnou tloušťku vrstvy naskládat lichý násobnek půlvln (které jsou, zkráceny oproti (půl)vlnám ve vakuu faktorem n).9 Kdybychom obdobně zkoumali interferenci prošlých paprsků, udávala by stejná podmínka interferenční minimum, takže světlo těchto vlnových délek by destičkou neprocházelo. Obdobně lze dokázat, že je-li nějaká vlnová délka λ = nλn interferenčně zesílena průchodem, bude ta samá vlnová délka potlačena při odrazu. Při osvětlení vrstvy bílým světlem, bude podmínku 6.11 splňovat jen světlo určité vlnové délky, a proto odražené světlo už nebude bílé, ale barevné, stejně tak i u světla 9 Kdybychom chtěli při odvozování tohoto vztahu vyjít z podmínky 6.9, museli bychom posun fáze o π nahradit posunem o λ/2 (proč?). 145 procházejícího, kde bude příslušná barva chybět. Tím se vysvětluje zbarvení např. tenkých mýdlových bublin, olejových vrstev nebo křídel motýlů. 146 Kapitola 7 Fyzika mikrosvěta 7.1 Odhalování struktury atomu Na přelomu 19. a 20. století již mnohým fyzikům začínalo být jasné, že atomy všech látek nejsou nedělitelné, ale že všechny obsahují velmi lehké, záporně elektricky nabité částečky stejného druhu — elektrony. Protože se vědělo, že atomy jsou za normálního stavu elektricky neutrální, bylo otázkou, co tvoří kladnou část atomů. Významný příspěvek do diskuse přinesl Novozélanďan Ernest Rutherford, který se svým týmem objevil existenci atomového jádra — nesmírně malé (v porovnání s rozměry atomu) a přitom velmi těžké (v porovnání s hmotností atomu) kladně nabité hrudky hmoty, sídlící uprostřed atomu. Princip experimentu, který tehdy Rutherford se svými kolegy prováděl, je široce užíván i v současnosti. Jeho podstatou je fyzikální analýza produktů srážky (nebo dostatečného přiblížení) studovaných kousků hmoty. V Rutherfordově experimentu šlo o srážky (rozptyl) částic α (jádra atomu hélia) na atomech zlata. Konkrétně se měřily úhly, pod kterými se α-částice po průchodu tenkou zlatou fólií odchylovaly od původního směru letu a počet těchto částic. Bylo nasnadě si představit, že atomy budou miniaturní planetární soustavy s jádrem jako Sluncem uprostřed a elektrony jako planetami kroužícími kolem, přičemž gravitaci nahradilo elektrické přitahování. Ukázalo se však, že díky elektromagnetickému vyzařování, které pro tento planetární model jednoznačně plyne ze spojení Newtonovy mechaniky a Maxwellovy teorie elektromagnetického pole, by elektrony musely rychle (10−9 s) spadnout na jádro — atom se podle klasických teorií hroutí! Vycházeje ze spektroskopických výsledků1 a představy o kvantování elektromagnetické energie (Planck, Einstein), nalezl dočasné řešení tohoto problému dánský fyzik Niels Bohr, 1 Spektroskopie je věda, která analyzuje elektromagnetické záření, vycházející z látek například při jejich zahřátí. Toto záření je pro jednotlivé druhy látek charakteristické, umožňuje totiž rozpoznat i velmi malá množství prvků nebo molekul obsažených v těchto látkách. Rozložíme-li světlo vycházející z určitého prvku například hranolem (viz odst. 6.3.1), nezískáme již spojitý pás vzájemně se prolínajích barev, ale řadu oddělených jednobarevných pásků. Studiem těchto pásků můžeme určit například druh, množství a teplotu zkoumaného prvku. Spektrální analýza umožňuje například i zjišťovat složení a pohyby Slunce a hvězd. 147 který tou dobou byl u Rutherforda na stáži. Jeho model struktury atomu na jednu stranu zachoval názornost planetárního modelu, ale zároveň do něj vnesl i představy klasickému náhledu cizí. Podle Bohrových představ se energie systému „jádro + elektrony nemůže měnit spojitě, ale pouze skokem, což je z hlediska klasické mechaniky (viz závěr odstavce 2.3.2) naprosto nepochopitelné. Vzato do důsledku, Bohrův model zachránil stabilitu planetárního modelu tím, že bez hlubšího důvodu prohlásil, že elektrony v atomech nemohou nabývat libovolných energií, ale jen určitou diskrétní sadu „dovolených energií, při kterých prostě nevyzařují. Velikým úspěchem však bylo, že Bohr byl díky svému modelu schopen velmi dobře teoreticky vysvětlit strukturu spektroskopických měření látek tvořených atomy s jedním elektronem (H, He+ , Li++ , . . .), přičemž mnohé empirické konstanty, které do té doby v spektroskopických vztazích figurovaly, uměl nahradit z jeho modelu vyplývající kombinací základních fyzikálních konstant (c, e, h, me, . . .). Dále pak zvláštní skokové chování elektrického proudu vedeného různými plyny, kdy se ukázalo, že elektrony při průchodu plynem ztrácejí vždy jen určitá množství energie (což svědčí o kvantování energie atomů). Po počátečním nadšení začaly silné problémy Bohrova modelu atomu vyplavávat stále více na povrch. Jak se nakonec ukázalo, jeho největším přínosem bylo zřejmě udání směru výzkumu, určeného kritikou tohoto modelu. Tento směr, po více než desetiletém intenzivním úsilí nejlepších fyziků světa, vedl nakonec k objevu moderní kvantové teorie, která se stala základem pro naše zatím nejdůkladnější pochopení struktury mikrosvěta. 7.2 Kvantová fyzika Jak již bylo zmíněno v úvodu, fyzika se stále zpřesňuje, tj. její pojmový a matematický popis světa se stává stále adekvátnějším přírodnímu dění. Například v Newtonových dobách (a ještě dlouho potom) se věřilo, že síly se přenášejí okamžitě na jakoukoli vzdálenost, dnes si naopak myslíme, že všechny druhy interakcí se šíří rychlostí maximálně světelnou. Rovněž se dříve soudilo, že látka má spojitou strukturu (je to tzv. kontinuum) a v současné době si již jsme přesvědčeni o její přetržité (diskrétní) struktuře. Pohled na světlo prezentovaný v předchozích kapitolách je také krásnou ukázkou tohoto procesu zpřesňování fyzikálního pohledu na svět. Při studiu elektromagnetismu a optiky jsme se dověděli o zvláštní povaze světla (elektromagnetického záření). Přestože jsme si nebyli schopni vytvořit žádnou konkrétní představu o tom, co to vlastně světlo je, víme jak se chová v různých situacích — při výměně energie s látkou se chová jako objekt omezený jen na velmi malou oblast prostoru, při šíření se z místa na místo se chová jako objekt schopný interference, kterou umíme vysvětlit jedině skládáním vzruchů, které se šíří prostorem po různých trajektoriích. Na začátku dvacátých let dvacátého století přišel francouzský šlechtic Louis de Broglie se smělou hypotézou, pomocí níž vysvětlil některé aspekty Bohrova modelu atomu. Uvažoval: Může-li se elektromagnetické vlnění v jistém smyslu chovat jako proud částic (fotonů), nemohly by být naopak částicím tvořícím látky přisouzeny i jisté vlnové vlast- 148 nosti?2 Počáteční zmatek v tom, jakým způsobem se má částicím toto vlnění přiřazovat, byl matematicky konzistentně rozřešen kvantovou mechanikou. Na tomto místě si neodpustím další Feynmanův citát (viz [16] str. 135): „Tento narůstající zmatek byl ukončen roku 1925 nebo 1926 nalezením správných rovnic kvantové mechaniky. Od té doby je známo, jak se elektrony a světlo chovají. Jak to ale nazvat? Řeknu-li, že se chovají jako částice, získáte špatnou představu, stejně jako když řeknu, že se chovají jako vlny. Chovají se svým nenapodobitelným způsobem. Chceme-li tedy používat nějaký termín, říkejme, že se chovají kvantově mechanicky. Nechovají se jako nic z toho, co jsme dosud viděli. naše předchozí zkušenost byla neúplná. Děje v mikrosvětě jsou prostě odlišné. Atom se nechová jako kývající se závaží. Správná není ani představa miniaturní napodobeniny sluneční soustavy s malými planetami. Také nevypadá jako oblak nebo mlha obklopující jádro. Máme však aspoň jedno zjednodušení. Elektrony se v tomto smyslu chovají naprosto stejně jako fotony; nezvykle, ale naprosto stejně. Skutečně, všechny problémy Bohrova modelu atomu a mnoha dalších klasickou fyzikou nevysvětlitelných jevů byly odstraněny jednotným pojímáním všech objektů v mikrosvětě. Zcela analogicky s tím, že pravděpodobnost výskytu fotonů v daném místě je úměrná druhé mocnině intenzity elektrického pole v tomto místě (viz diskuse u rovnice 6.1), byla k popisu vlnových vlastností částic zavedena funkce ψ, jejíž druhá mocnina určuje pravděpodobnost výskytu částice, tj. P ∼ |ψ|2 (7.1) Funkce ψ popisující částice látky nemá, narozdíl od vektorových funkcí −→ E a −→ B popisujících částice světla, tak názorný fyzikální význam (viz a 5.5). Je to obecně komplexní veličina3 a nelze jí přiřadit žádné silové ani nesilové pole. Skutečný význam této funkce (obvykle se jí říká vlnová funkce), tkví v tom, že poskytuje nejúplnější možnou informaci o fyzikálních systémech, které popisuje — tyto informace jsou však pouze pravděpodobnostního rázu. Popisuje-li ψ například elektron v atomu, můžeme z ní získat například předpovědi typu: Elektron se nachází s pravděpodobností 83 % ve vzdálenosti menší než 0,1 nm od jádra, s pravděpodobností 11 % ve vzdálenosti větší než 0,1 nm, ale menší než 0,2 nm a s pravděpodobností 6 %, že se nachází dále než 0,2 nm od jádra atomu. Obdobné pravděpodobnostní odpovědi můžeme očekávat například i u zkoumání hybnosti nebo energie částice popsané funkcí ψ. S tímto ústupem z Newtonových pozic, kdy se z řešení pohybových rovnic získaly jednoznačné předpovědi fyzikálních veličin (viz odstavec o determinismu a stavu systému na str. 60), se vědci (a filosofové) smiřovali dlouho (a tento proces ještě není dokončen :-)). 2 Abych zdůraznil smělost této myšlenky, ještě jednou připomínám propastný rozdíl mezi klasickými částicemi a vlnami — částici považujeme za tělísko velmi malých rozměrů u nichž spolehlivě můžeme ohraničit oblast prostoru, ve kterém se nachází, naproti tomu vlny jsou charakterizovány jako rozruch, který se šíří větší částí prostoru, jejich ohraničení je velmi obtížné. Navíc, vlny jsou schopné interference a například přítomnost dvou vln s opačnou fází v jednom bodě prostoru způsobuje jejich praktické vymizení z tohoto místa. Částice buď v daném místě je a nebo není, nic mezi tím. 3 Tj. každému místu −→r v prostoru přiřazuje komplexní číslo ψ(−→r ) a její druhou mocninou se tedy musí rozumět výraz ψ∗ ψ ≡ |ψ|2 . 149 Veškeré dosavadní zkušenosti však hovoří pro to, že pravděpodobnost je přírodě vlastní, resp. přesněji, že neumíme zkonstruovat rozumné deterministické (nepravděpodobnostní) teorie, které popisují přírodu přinejmenším stejně dobře, jako to umí (pravděpodobnostní) teorie kvantová. Podobně, jako se pohyb částic v Newtonově mechanice řídí jeho pohybovou rovnicí pro vektory −→r a −→v , resp. vývoj vektorů −→ E a −→ B popisujících elektromagnetické pole se řídí Maxwellovými rovnicemi, řídí se časový vývoj funkce ψ tzv. Schrödingerovou rovnicí, která byla nazvána po svém objeviteli, rakouském fyzikovi Erwinu Schrödingerovi. K jednoznačnému řešení této rovnice je nutné zadat počáteční podmínku, kterou je znalost funkce ψ v jednom okamžiku.4 Funkce ψ tak skutečně určuje stav systému, který popisuje a protože nepředstavuje žádné reálné vlnění, bylo by zřejmě bylo vhodnější, říkat jí stavová funkce. Přestože ψ samotná nemá přímý fyzikální význam (je to pomocná veličina), vlnové vlastnosti, kvůli kterým byla zavedena, popisuje detailně. Přímý experimentální důkaz vlnových vlastností látkových částic (elektronů) byl podán až čtyři roky po de Broglieově domněnce. Ukázalo se, že mikročástice jsou skutečně schopné svého druhu interference. Ta se projevuje například v tomto: Představte si, že postavíme zdroj Z elektronů před dvojštěrbinu, za kterou je stínítko (viz obr. 7.1). Zakryjeme-li horní štěrbinu, budou do detektoru D dopadat elektrony procházející skrz dolní štěrbinu. Zakryjeme-li dolní štěrbinu, budou do D dopadat elektrony prošlé skrz horní štěrbinu. Je-li však detektor postaven vhodně, pak při odkrytí obou štěrbin do něj nebudou dopadat žádné elektrony! Tento jev bude nastávat, i když elektrony budou ze zdroje vysílány po jednom. D Z Obrázek 7.1: K interferenčnímu chování částic Pomocí stavové funkce tento jev popíšeme tak, že přiřadíme elektronu šířícímu se horní 4 S nutností zadání počátečních podmínek jsme se setkali i při řešení Newtonovy pohybové rovnice — k jednoznačnému řešení se musela zadat poloha a rychlost (stav) v jednom okamžiku. 150 štěrbinou a dopadajícímu do D funkci ψh , elektronu šířícímu se dolní štěrbinou funkci ψd (při zakryté horní štěrbině) a výsledná stavová funkce, popisující elektron procházející oběma štěrbinami5 a dopadající do detektoru D, bude dána součtem ψh +ψd. Při vhodném umístění D bude tento součet nulový a tedy i pravděpodobnost dopadu elektronu do D bude nulová. 7.3 Fyzika elektronového obalu Jak již bylo uvedeno, kvantová teorie objasnila stabilitu atomů a její model struktury atomu prochází zatím bez zaváhání všemi experimentálními testy. Z Bohrova modelu atomu přechází do kvantového modelu představa o centrálním jádru (více o něm v následující kapitole) a elektronovém obalu. Pohyb elektronů však již nemůže být chápán analogicky k pohybu planet kolem Slunce. Jediné co o poloze elektronů můžeme říci je, že je lze najít někde v okolí jádra s pravděpodobností danou stavovou funkcí ψ. Tvar funkce ψ vyplyne z řešení Schrödingerovy rovnice pro elektrony nacházející se v elektrickém poli atomového jádra. Z řešení dále plyne, že stav každého elektronu lze jednoznačně popsat čtveřicí čísel, které nabývají pouze diskrétních hodnot a že každé takové čtveřici přísluší určitá energie. Zde nalézáme hlouběji neodůvodněné tvrzení Bohrova modelu, že elektrony v atomovém obalu nemohou nabývat libovolných, ale jen diskrétních hodnot energie. Poznatek, že žádná čtveřice těchto tzv. kvantových čísel nemůže být obsazena více než jedním elektronem zjistil, nejprve empirickou cestou a později i čistě teoretickou, fenomenální fyzik Wolfgang Pauli. Po něm byl nazván Pauliho vylučovací princip. Tento princip společně s algebrou kvantových čísel stojí za vysvětlením celé struktury periodické soustavy prvků, která byla chemiky odhalena více jak půl století před vznikem kvantové teorie (podívejte se do učebnic chemie a prostudujte její zákonitosti). 7.4 Jaderná a částicová fyzika Koncem 19. století vyvolal Röntgenův objev (tehdy) neznámého záření velkou senzaci nejen v odborných kruzích, ale i mezi laickou veřejností. Francouzský fyzik a krystalograf Henri Becquerel, ve snaze rozšířit výzkum Röntgenových paprsků, přišel několik měsíců po Röntgenově objevu náhodou na další druh záření neznámé povahy, který vysílaly uranové rudy. Později bylo Becquerelovo záření pozorováno i u jiných látek a jev, který k jeho uvolňování vedl byl nazván radioaktivitou. Studium radioaktivity otevřelo obsáhlou oblast výzkumu, který měl zcela zásadní vliv na budoucnost jaderné a částicové fyziky. Ještě do konce 19. století se ukázalo, že radioaktivní látky vysílají tři druhy záření — kladně nabité α, záporně nabité β a neutrální γ. O záření β bylo brzy dokázáno, že je 5 Šíření oběma štěrbinami není omyl, nevíme sice jak to jindy bodově se chovající elektron dělá, ale aby mohl interferovat sám se sebou, musí v nějakém smyslu „cítit obě štěrbiny najednou. 151 tvořeno proudem elektronů. Záření γ se ukázalo být nejzazším podoborem elektromagnetického spektra (viz odst. 5.4.1) a koncem prvního desetiletí 20. století Rutherford se svým asistentem nade vší pochybnost ukázal, že záření α je proudem jader atomů hélia. Právě důkladný výzkum α-částic umožnil Rutherfordovi a jeho spolupracovníkům fenomenální objev atomového jádra. Další vývoj jaderné a částicové fyziky byl rovněž v mnohém poplatný Rutherfordově energické duši. Rutherford byl především experimentální fyzik, proto se nevrhnul do víru hledání chyb a zlepšování Bohrových myšlenek a místo toho se snažil dál pomocí ostřelování látek částicemi α zjistit co nejvíce o struktuře objevených jader. Krátce po 1. světové válce přišel s dalším důležitým objevem: ostřeloval plynný dusík α-částicemi a po určité době zjistil, že tu a tam se v nádobě s dusíkem vyskytl kyslík a navíc vylétala částice, o které se časem zjistilo, že tvoří jádro atomu vodíku. Tuto částici Rutherford nazval proton a vyslovil hypotézu (1920), že vodíková jádra jsou základními stavebními kameny všech jader. Výše uvedenou reakci dnes fyzikové zapisují 4 He +14 N −→17 O + p+ kde p+ je označení protonu a levý horní index u značky prvků si vysvětlíme později. Tato reakce je první zaznamenanou přeměnou jedné látky (dusík) na jinou (kyslík) a představuje tak splnění dávného snu alchymistů (i když ti usilovali především o zlato :-). K registraci částic se tehdy užívalo počítání záblesků z dopadů na fluorescenční stínítko nebo tzv. mlžné komory.6 Velký posun vpřed nastal právě zdokonalením mlžné komory v polovině dvacátých let minulého století — její pomocí byl pořízen první vizuální záznam celého jaderného procesu. Ohromné rozdíly mezi mikrosvětem a makrosvětem nepanují pouze v hmotnostní a rozměrové škále, ale i ve škále energií. Upustíme-li například 10 dkg salámu z výšky 1 m na zem, ztratíme přibližně 1 J jeho mechanické energie. Naproti tomu jednotlivé elektrony v obalech atomů disponují přibližně energií pouhých 1 − 1 000 × 10−19 J a excitační energie atomových jader je v řádu 1 000 000 × 10−19 J, což je více než biliónkrát méně než u zmíněného salámu. Protože při umělém dodávání energie nabitým částicím velmi často pracujeme s elektrickým polem, vžila se jednotka elektronvolt (eV), což je energie, kterou získá částice nabitá elementárním nábojem (1, 6·10−19 C) při průletu potenciálovým rozdílem (napětím) 1 V (viz též odst. 5.1.2). Průletem elektrodami, mezi kterými je napětí U, tak elementární částice získá energii eU jouleů a U elektronvoltů. Jádra atomů jsou neobyčejně stabilní útvary a abychom mohli zkoumat jejich vnitřní strukturu, potřebujeme velmi účinné projektily — přírodní radioaktivní zdroje brzy přestaly stačit a Rutherford i ostatní si uvědomovali, že je potřeba zařízení, která budou produkovat částice s vyšší energií. V roce 1932 bylo sestrojeno vysokonapěťové zařízení 6 Mlžná komora je zhruba řečeno nádoba, ve které se nacházejí páry nějaké látky v tzv. podchlazeném stavu — vlétne-li do ní nabitá částice, vzniknou kolem ”trajektorie” jejího pohybu kondenzační jádra, na kterých se sráží kapičky této látky. Takto vzniklá mlha je pak pozorovatelná (podobný proces nastává například u letadel letících ve větších výškách). 152 (800 000 V) pohánějící protony získané z plynného vodíku svislou urychlovací trubicí vstříc lithiovému terči. Rozbor výsledků ukázal, že docházelo k přeměně lithia na helium, tj. toto zařízení bylo schopno uměle rozbít atom! Navíc šlo o první zcela uměle řízenou transformaci. Zdokonalené verze takovýchto zařízení7 byly schopny urychlovat částice na energie několika miliónů elektronvoltů. Ještě vyšších energií bylo možno dosáhnout pomocí tzv. lineárního vysokofrekvenčního urychlovače, v němž se částice neurychlují naráz, ale prochází řadou postupně se prodlužujících trubicových elektrod připojených na vysokofrekvenční napětí konstantní frekvence.8 V roce 1930 Američan Ernest Orlando Lawrence vynalezl urychlovač, ve kterém se pro urychlení použilo opět vysokofrekvenční napětí, ale částice se v něm pohybovaly po spirálovitých trajektoriích, na nichž byly udržovány silným magnetickým polem. Tento takzvaný cyklotron našel pro svou jednoduchost a prostorovou nenáročnost uplatnění zejména v medicíně (urychloval částice poprvé užité při ozařování zhoubných nádorů), pro částicovou fyziku se nakonec jeho zhruba 20 MeV maximálně dosažitelné energie ukázalo příliš omezující.9 Velmi důležitým zdrojem urychlených částic se ve třicátých letech stalo tzv. kosmické záření. Pečlivými experimenty bylo změřeno10 , že na Zemi dopadá odkudsi z kosmu velmi pronikavé záření. Dnes víme, že se skládá převážně z protonů o různých energiích, nicméně původ všech jeho složek je zatím zahalen tajemstvím. Už v roce 1920 Rutherford navrhl pro vysvětlení existence izotopů11 hypotézu, podle které se v atomovém jádře kromě protonů a elektronů nacházejí ještě neutrální částice s hmotností podobnou protonu — nazval je předběžně neutrony. Tuto domněnku se však vytrvale nedařilo dokázat — jeho asistent James Chadwick se o to pokoušel prakticky celá dvacátá léta. Úspěch se dostavil až po dlouhých dvanácti letech v roce 1932.12 Do tohoto objevu byl všeobecně přijímán model jádra složeného pouze z protonů a z elektronů, tento model ale trpěl značnými problémy. Po nalezení neutronů se však ukázalo, že po nahrazení jaderných elektronů neutrony se tyto problémy řeší. Tak byl v hrubých rysech dokončen moderní obraz původu a vlastností periodické soustavy prvků — počet protonů v atomech prvku určuje jeho pozici v periodické soustavě13 7 Vlastně šlo o obrovské Van de Graaffovy generátory. 8 Částice jsou urychlovány v mezerách mezi elektrodami, které se tak musí prodlužovat úměrně vzrůstající rychlosti částic. 9 Za to, že cyklotrony ve své původní podobě nebyly schopné dosáhnout vyšších energií urychlovaných částic, může relativistické „vzrůstání hmotnosti částic při vyšších rychlostech. Teorie relativity se tak nejspíš poprvé dostala z předmětu vědeckého výzkumu na místo inženýrské praxe. Při konstrukci silnějších urychlovačů s ní již musí být nadále počítáno. 10 Ve své době nejpečlivější pokus prováděl Rakušan Victor Hess v Ústí nad Labem v roce 1911, při výstupech v balónu. 11 Izotopy jsou prvky se stejnými chemickými vlastnostmi (sedí tedy v periodické soustavě prvků na stejném místě), ale různými fyzikálními (zejména hmotností). 12 Při studiu reakce 9 Be +4 He −→12 C + n kde „n je značka neutronu. 13 Někdy se zapisuje jako levý dolní index ke značce prvku, ale přísně vzato, je vlastně nadbytečný, 153 přičemž tomuto místu zpravidla přísluší různý počet neutronů, které pak tvoří izotopy tohoto prvku.14 Veškerých chemických reakcí se účastní pouze elektrony z obalu atomu, struktura obalu tak odpovídá za všechny chemické vlastnosti látek. Tento téměř idylický obraz mikrosvěta poněkud narušovala částice, kterou v roce 1930 předpověděl Wolfgang Pauli a která byla navržena kvůli zajištění zákona zachování energie při radioaktivním β-rozpadu jader. Částice, později nazvaná neutrino, měla mít téměř duchařské vlastnosti — nulový elektrický náboj, nulovou nebo téměř nulovou hmotnost a velmi malou schopnost být zachycena „normální hmotnou. Přímý důkaz existence neutrina byl podán až více než osm let po druhé světové válce. Přestože kvantová mechanika chrlila jeden fundamentální výsledek za druhým, byla stále nerelativistickou teorií — snaha o její relativistickou formulaci zaznamenala významný úspěch v roce 1928, kdy Angličan Paul Dirac formuloval kvantově relativistickou rovnici pro elektrony. Zpočátku se zdálo, že Diracova rovnice trpí vážnými nedostatky, vyplývalo z ní například, že volným elektronům může příslušet i záporná celková (relativistická) energie (viz rov. 2.78). Dirac se tohoto neduhu zbavil šikovným matematickým trikem (a zajímavou fyzikální úvahou), což jej nakonec dovedlo k předpovědi existence nových částic se stejnou hmotností, jakou mají elektrony, ale s opačným nábojem. Silná kritika Diracovy teorie rázem ustala, v roce 1932 byly při výzkumu složení kosmického záření objeveny v mlžných komorách stopy částic, které zanechávaly stejné „otisky jako elektrony, ale v magnetickém poli uhýbaly „na nesprávnou stranu — takto byly nalezeny pozitrony (ozn. e+ ), první částice pocházející z antisvěta.15 V dalším se totiž ukázalo, že ke každé částici náleží i příslušná antičástice, která má stejnou hmotnost, ale opačný elektrický náboj a některé další veličiny. Důležitým jevem, se kterým se u antičástic setkáváme je, že při střetu se svou částicí navzájem tzv. anihilují, což znamená, že se přemění na spršku neutrálního záření (například fotonů). Mají-li částice a antičástice každá hmotnost m, je celková energie záření vzniklého jejich anihilací určena relativistickým vztahem mezi energií a hmotností E = 2mc2 . Z jednoho gramu látky bychom tedy přibližně dostali 9×10 miliónů MJ ≈ 25 miliónů kWh, což je teplo, které by v mžiku dokázalo ohřát přes 200 tisíc tun vody z 0◦ C na 100◦ C. Hmotnosti samotných částic nejsou tak velké, proto příslušná energie není tak ohromující — elektronu přísluší ∼ 0,5 MeV ≈ 8 × 10−14 J, protonu a neutronu ∼ 940 MeV ≈ 1, 5 × 10−10 J. Již delší dobu se vědělo, že na udržení kladně nabitých protonů v malém objemu jádra je zapotřebí jiné síly než již dávno známé gravitační či elektromagnetické. Protože přitažlivá gravitační síla protonů je proti jejich odpudivé elektrostatické síle neuvěřitelně slabá (∼ 1037 ×), bylo nutné předpokládat existenci nové síly, která by byla schopna nad elektrickou zvítězit. Tato síla dostala přiléhavý název silná jaderná síla. protože tato pozice je již vyjádřena jménem prvku. 14 Nyní si již můžeme říci, že levý horní index u značky prvku udává součet počtu protonů a neutronů v jádře. 15 Termín „antisvět má spíše romantický nádech — antičástice jsou samozřejmě důležitou součástí našeho světa (jen stále pořádně nerozumíme tomu, proč je jich o tolik méně než částic, které jsou pro nás „normální ). 154 První úspěšnější kvantově mechanickou teorií této síly (interakce) byla teorie japonského fyzika Hidekiho Yukawy (1934), který se pokusil popsat krátkodosahové přitažlivé síly mezi protony a neutrony pomocí výměny další, zatím neznámé částice.16 Aby výpočty souhlasily se skutečností, bylo nutné předpokládat, že její hmotnost bude zhruba 200× větší, než hmotnost elektronu. V roce 1937 byla nalezena částice, jejíž hmotnost byla blízká Yukawově předpovědi. K velkému zklamání fyziků se však nakonec ukázalo, že tato částice nesplňuje všechny Yukawovy požadavky.17 Nyní fyzikové měli částici, o kterou vůbec nestáli — nevěděli totiž, jak by mohla zapadat do rámce základních stavebních prvků světa. Vypadala pouze jako těžší (zbytečná) kopie elektronu.18 Několik měsíců před Yukawovou předpovědí zkonstruoval významný italský fyzik Enrico Fermi relativistickou kvantovou teorii, která postulovala nový typ sil, tzv. slabé jaderné síly.19 Brzdou dalšího rozvoje se stala 2. světová válka. O cestě jaderné fyziky k sestrojení jaderné bomby existuje mnoho pěkných knih, např. [46, 47, 48, 36]. Po válce bylo nalezeno několik nových technik urychlování částic a metod jejich detekce, to umožnilo objev velkého množství nových částic a zrod nových teorií. Podařilo se odhalit vnitřní strukturu protonů a neutronů20 a spojit do jednotného matematického rámce elektromagnetickou a slabou jadernou sílu. O těchto otázkách se můžete více dovědět např. z knihy [29]. 16 Již dva roky předtím přišel geniální německý fyzik Werner Heisenberg s myšlenkou, že jádro drží pohromadě tzv. výměnná síla, která vzniká proto, že si protony a neutrony neustále vyměňují své role prostřednictvím elektronů. Tento mechanismus však na vysvětlení silné síly nestačil. Yukawa vypočítal, že na udržení protonů a neutronů v atomovém jádru by si protony a neutrony musely vyměňovat těžší částice než jsou elektrony. 17 Částice vhodných parametrů byla nalezena až po 2. světové válce. 18 Tato stále poněkud záhadná částice je dnes nazývána mion. 19 Tato teorie rovněž využívala princip výměnných sil (pomocí elektronů a neutrin), na udržení protonů v jádře ovšem nestačila, z toho vyplynul i její název. Účinkem těchto sil (nebo lépe interakcí) byl vysvětlen rozpad neutronu, β-radioaktivita jader a některé další jemné efekty. 20 Skládají se z tzv. kvarků, které na sebe působí pomocí výměny tzv. gluonů. Tyto gluony uvězňují kvarky v protonech a neutronech a „zbytková síla je pak původně objevenou silnou jadernou silou (podobně jako působení mezi neutrálními atomy lze vysvětlit zbytkovou elektromagnetickou silou.) 155 Literatura [1] Macháček M.: Fyzika. Sbírka úloh pro společnou část maturitní zkoušky. Tauris, Praha 2001 [2] Šantavý I., Trojánek A.: Fyzika. Příprava k přijímacím zkouškám na vysoké školy. Prometheus, Praha 2000 [3] Bartuška K.: Sbírka řešených úloh z fyziky pro střední školy I-IV. Prometheus, Praha 1997-2000 [4] Svoboda E. a kol.: Přehled středoškolské fyziky. Prometheus, Praha 1996 [5] Urgošík B.: Fyzika. SNTL, Praha 1987 [6] Javorskij B. M., Selezněv Ju. A.: Přehled elementární fyziky. SNTL, Praha 1989 [7] Westaway F. W.: Objevy bez konce I. Fr. Borový, Praha 1937 [8] Šantavý I.: Mechanika. SPN, Praha 1993 [9] Baník I., Baník R., Zámečník J.: Fyzika netradičně. Mechanika. Alfa, Bratislava 1989 [10] Kessner P., Tůma Z.: Zajímavé otázky z fyziky 1.díl. Mechanika. Molekulová fyzika a termodynamika. Rybníček Drahomír, Třebíč 1997 [11] Nahodil J.: Fyzika v běžném životě. Prometheus, Praha 1996 [12] Perelman J. I.: Zajímavá mechanika. Mladá fronta, Praha 1953 [13] Feynman R. P.: To snad nemyslíte vážně! Aurora, Praha 1999 [14] Feynman R. P.: Snad ti nedělají starosti cizí názory. Aurora, Praha 2000 [15] Feynman R. P.: Neobyčejná teorie světla a látky. Aurora, Praha 2001 [16] Feynman R. P.: O povaze fyzikálních zákonů. Aurora, Praha 1998 [17] Feynman R. P., Leighton R. B., Sands M.: Feynmanovy přednášky z fyziky 3/3. Fragment, Havlíčkův Brod 2002 156 [18] Feynman R. P.: Radost z poznání. Aurora, Praha 2003 [19] Kolektiv autorů: Filozofický slovník. Svoboda, Praha 1976 [20] Kolektiv autorů: Slovník spisovné češtiny pro školu a veřejnost. Academia, Praha 2003 [21] Obrdržálek J.: Fyzikální terminologická čítanka se slovníčkem česko-anglickým a anglicko-českým. Rozhledy mat.-fyz. 75 1998 [22] Brož J., Roskovec V.: Základní fyzikální konstanty. SPN, Praha 1987 [23] Hajko V. a kol.: Fyzika v experimentoch. Veda, Bratislava 1988 [24] Brož J. a kol.: Základy fyzikálních měření I. SPN, Praha 1983 [25] Macháček M.: Encyklopedie fyziky. Mladá fronta, Praha 1995 [26] Greene B.: Elegantní vesmír. Mladá fronta, Praha 2001 [27] Hawking S.: Stručná historie času v obrazech. Argo, Praha 2002 [28] Hawking S.: Vesmír v kostce. Argo, Praha 2002 [29] Fraser G., Lillestøl E., Sellev˚ag I.: Hledání nekonečna. Columbus, Praha 1996 [30] Styer D. F.: The Strange World of Quantum Mechanics. Cambridge University Press, Cambridge 2003 [31] Rektorys K.: Co je a k čemu je vyšší matematika. Academia, Praha 2001 [32] Zeľdovič J. B.: Vyššia matematika pre začiatočníkov. Alfa, Bratislava 1973 [33] Kvasnica J.: Matematický aparát fyziky. Academia, Praha 1997 [34] Gleick J.: Chaos. Ando Publishing, Brno 1996 [35] Prigogine I., Stengersová I.: Řád z chaosu. Mladá fronta, Praha 2001 [36] Bodanis D.: E = mc2 . Životopis nejslavnější rovnice na světě. Dokořán, Praha 2002 [37] Einstein A., Infeld L.: Fyzika jako dobrodružství poznání. Aurora, Praha 2000 [38] Horský J.: Úvod do teorie relativity. SNTL, Praha 1975 [39] Horský J., Bartoň S.: Relativistický vesmír. Ando Publishing, Brno 1997 [40] Feynman R. P., Leighton R. B., Sands M.: Feynmanovy přednášky z fyziky 1/3. Fragment, Havlíčkův Brod 2000 157 [41] Kolektiv autorů: Výkladový slovník fyziky pro základní vysokoškolský kurz. Prometheus, Praha 1999 [42] Štoll I.: Svět očima fyziky. Prometheus, Praha 1996 [43] Veselá E.: Co nám příroda nedovolí. ČVUT, Praha 1995 [44] Coveney P., Highfield R.: Šíp času. Oldag, Ostrava 1995 [45] Feynman R. P., Leighton R. B., Sands M.: Feynmanovy přednášky z fyziky 2/3. Fragment, Havlíčkův Brod 2001 [46] Jungk R.: Jasnější než tisíc sluncí. Mladá fronta, Praha 1963 [47] Herneck F.: Průkopníci atomového věku. Orbis, Praha 1974 [48] Borotský J., Kuneš A.: Vynálezci Damoklova meče. Naše vojsko, Praha 1985 158 Rejstřík absolutně černé těleso, 134 ampér, 121 amplituda výchylky, 96 anihilace, 154 anionty, 106 antisvět, 154 atomy, 106 Avogadrova konstanta, 109 Avogadrovo číslo, 109 bodová hmotnost, 12 coulomb, 118 cyklotron, 153 cylindrické souřadnice, 16 částic, 12 částice, 11 částice testovací, 84 číslo kombinační, 78 děj rovnovážný, 112 děj vratný, 112 destruktivní interference, 102 determinismus mechanický, 60 difrakce, 144 dimenze, 13 disperze, 140 dráha, 18 dráha optická, 143 dráhová rychlost, 19 dráhové zrychlení, 27, 40 duha, 140 dutá zrcadla, 138 dvojice sil, 86 ekvipotenciála, 73 ekvipotenciální hladiny, 85 elektrické pole, 118 elektrické siločáry, 120 elektrický náboj, 118 elektrický potenciál, 119, 120 elektrický proud, 120 elektrodynamika kvantová, 135 elektrodynamiky, 117 elektromagnetické vlnění, 127 elektronový obal, 151 elektronvolt, 120 elektrony, 106 elektrostatika, 117 elementární náboj, 118 energie, 62 energie kinetická, 71 energie klidová, 79 energie mechanická, 71, 76 energie pole, 129 energie potenciální, 73 energie potenciální gravitační, 84 energie relativistická, 78 energie vazebná, 80 energie vnitřní, 112 éter, 133 fázová rychlost, 103 foton, 134 frekvence, 49 fyzika molekulová, 107 gluony, 155 gravitační hmotnost, 83 gravitační konstanta, 82 gravitační náboj, 118 gravitační pole, 82 159 gravitační zákon, 82 harmonické vlnění, 98 harmonický oscilátor, 97 hlavní rovina, 137 hmotnost, 53 hmotnost gravitační, 83 hmotnost molární, 110 hmotnost relativní atomová, 109 hmotnost setrvačná, 83 hmotnostní schodek, 80 hmotný bod, 11 hustota částic, 110 hybnost, 62, 63 hybnost pole, 129 hybnost soustavy celková, 64 chaos, 60 ideální plyn, 111 ideální plyny, 107 impulz síly, 68 index lomu látky, 135 intenzita elektrického pole, 117, 119 intenzita gravitačního pole, 84 interference, 100 interference destruktivní, 142 interference konstruktivní, 102, 142 interference světla, 141 ionty, 106 izotopy, 153, 154 jednotkové vektory, 30 joule, 72 kationt, 106 kinematika, 11 klid absolutní, 61 kmitna, 103 konstanta atomová hmotnostní, 109 konstanta Avogadrova, 109 konstanta gravitační, 82 konstanta Planckova, 131 konstanta univerzální, 82 kontinuum, 92 kružnice oskulační, 39 kvanta energie, 131, 134 kvantová čísla, 151 kvantová elektrodynamika, 135 kvantová mechanika, 60 kvantování, 131 kvarky, 155 látkové množství, 109 látky diamagnetické, 123 látky feromagnetické, 123 látky paramagnetické, 123 magnetická indukce, 117, 122 magnetické indukční čáry, 122 magnetické siločáry, 122 magnetický indukční tok, 125 magnetický monopól, 121 makroskopické systémy, 106 Maxwell James Clerk, 117 mechanické vlnění, 98 mechanický determinismus, 60 mechanický pohyb, 11 mechanika, 11 mechanika kvantová, 60, 81 měrná tepelná kapacita, 114 mezní úhel, 104 mikrovlny, 128 mion, 155 molární hmotnost, 110 molekuly, 106 moment hybnosti, 62 moment setrvačnosti, 87, 92 moment síly, 86 náboj elektrický, 118 náboj elementární, 118 napětí, 120 napětí indukované, 126 neutrino, 154 neutrony, 153 okamžité dráhové zrychlení, 27 160 optická osa, 137 optika kvantová, 135 optika paprsková, 135 optika vlnová, 135 osa optická, 137 osa otáčení, 47 paprsek, 104 pascal, 93 perioda, 49 periodická soustava prvků, 151 permeabilita prostředí, 123 permeabilita relativní, 123 permeabilita vakua, 123 permitivita, 123 permitivita vakua, 119 plyn ideální, 108 počáteční fáze, 96 pohyb, 11 pohyb absolutní, 61 pohyb Brownův, 109 pohyb harmonický, 96 pohyb otáčivý, 47 pohyb posuvný, 47 pohyb přímočarý, 42 pohyb přímočarý rovnoměrně zpomalený, 42 pohyb přímočarý rovnoměrně zrychlený, 42 pohyb rotační, 47 pohyb rovnoměrný přímočarý, 40 pohyb tepelný, 108 pohyb translační, 47 pole centrální, 84 pole elektrické, 118 pole gravitační, 82 pole homogenní, 84 pole radiální, 84 pole stejnorodé, 84 polohový vektor, 28 póly magnetu, 121 potenciál elektrický, 119 potenciál gravitačního pole, 85 práce, 68, 112 princip druhý termodynamický, 115 princip Pauliho vylučovací, 151 princip první termodynamický, 113 princip relativity Galileiho , 61 princip superpozice, 83, 100, 120, 141 princip třetí termodynamický, 114 prostoročas, 14 proudění stacionární, 94 proudění ustálené, 94 prvky, 106 příčné zvětšení, 138 radioaktivita, 151 relativní, 18 relativní atomová hmotnost, 109 relativní permitivita prostředí, 119 rovina dopadu, 104 rovina hlavní, 137 rovnice Bernoulliova, 94 rovnice diferenciální, 56 rovnice kontinuity, 94 rovnice Newtonova pohybová, 54 rovnice pohybová, 54 rovnice Schrödingerova, 60, 150 rovnováha termodynamická, 111 rozměr prostorový, 13 rozptylky, 139 rychlost dráhová, 21 rychlost fázová, 103 rychlost grupová, 103 rychlost okamžitá, 33 rychlost okamžitá dráhová, 21 rychlost střední úhlová, 48 rychlost úhlová, 48 setrvačná hmotnost, 83 setrvačnost, 53 sférické souřadnice, 16 síla, 50 síla konzervativní, 73 síla odstředivá, 51 síla pružnosti, 51 síla silná jaderná, 154 síla tíhová, 50 161 síla třecí, 51 síla výměnná, 155 síla vztlaková, 94 siloměr, 51 silová dvojice, 86 síly neinerciální, 62 síly setrvačné, 62 síly slabé jaderné, 155 složené kmity, 100 součinitel klidového tření, 51 součinitel smykového tření, 51 souřadnice dvojrozměrné, 13 souřadnice jednorozměrné, 13 souřadnice kartézské, 13 souřadnice polární, 14 soustava heliocentrická, 52 soustava vztažná, 12 spojky, 139 stav, 60 stavová funkce, 150 stojaté vlnění, 103 střed hmotnosti, 65 střední dráhové zrychlení, 27 střední rychlost, 32 střední výkon, 70 střední zrychlení, 37 superpozice, 144 světlo, 127, 128 světlo polarizované lineárně, 141 systémy makroskopické, 106 tekutiny, 92 těleso tuhé, 12, 46 těleso vztažné, 12 teorie látek kinetická, 108 teorie relativity obecná, 82 teorie relativity speciální, 82 teplota, 113 termodynamická rovnováha, 111 termodynamika, 107 těžiště, 65, 89, 90 tlak, 93 tlak hydrostatický, 93 trajektorie, 17 transformace souřadnic, 14 tuhé těleso, 12, 46 tuhost pružiny, 51 úhlová dráha, 47 úhlová frekvence, 96 úhlová rychlost, 48 úhlové zrychlení, 49 úplný odraz, 105 urychlovač lineární, 153 uzel, 103 vektor polohový, 28 vektor posunutí, 31 vektor vázaný, 28 vektor volný, 29 vektorová přímka síly, 85 věta binomická, 78 viskozita, 93 vlnění harmonické, 98 vlnění koherentní, 141 vlnění lom, 104 vlnění mechanické, 98 vlnění odraz, 104 vlnění podélné, 98 vlnění postupné, 98 vlnění příčné, 98 vlnění stojaté, 103 vlnoplocha, 104 vlnová délka, 98 vlnová funkce, 149 vlny eletromagnetické, 117 volná částice, 52 volt, 120 výkon, 71 výkon střední, 70 vypuklá zrcadla, 138 vztažná soustava, 12 vztažná soustava absolutní, 61 vztažná soustava inerciální, 52 vztažné soustavy, 12 vztažné těleso, 12 162 watt, 71 zákon Archimédův, 93 zákon Avogadrův, 111 zákon Faradayův indukční, 126 zákon gravitační Newtonův, 82 zákon Lenzův, 126 zákon lomu, 104 zákon Newtonův druhý pohybový, 54 zákon Newtonův první pohybový, 52 zákon odrazu, 104 zákon setrvačnosti, 52 zákon síly, 54 zákon zachování elektrického náboje, 118 zákon zachování energie, 78, 113 zákon zachování hybnosti, 65 zákon zachování mechanické energie, 76, 92 zákony Newtonovy, 50 zákony zachování, 62 záření infračervené, 128 záření kosmické, 153 záření optické, 128 záření rádiové, 128 záření ultrafialové, 128 záření viditelné, 128 zdroj koherentní, 141 zrcadla dutá, 138 zrcadla vypuklá, 138 zrychlení, 37 zrychlení dráhové, 27, 40 zrychlení normálové, 39 zrychlení střední, 37 zrychlení střední dráhové, 27 zrychlení tečné, 38 163