Užití matematiky ve fyzikální optice Dušan Hemzal a Lenka Přibylová 28. prosince 2010 Obsah Úvod 2 Vektory v optice (fyzice) 2 Kolmý průmět vektoru na vektor 3 Kuželosečky a kvadriky 3 Maticová optika 5 Vlnová rovnice 7 Harmonická vlna 7 Užití Taylorova polynomu 7 Reprezentace vlnění komplexními čísly 8 Součtové vzorce, skládání vln a interference. 8 Vektorová pole 9 Rovinná vlna v prostoru 10 Poyntingův vektor a intenzita světelné vlny 11 Difrakce a Fourierova transformace 11 Determinanty 12 Klasifikace kuželoseček a eliptická polarizace 13 Řešení soustavy lineárních rovnic 14 Optimalizace 14 Snellův zákon 15 Metoda nejmenších čtverců 15 El Q ©Lenka Přibylová, 2010 Q Úvod Tento elektronický text není přednáškou z matematiky ani z optiky. Není ani běžnou sbírkou úloh z matematiky nebo z optiky. Je to podpůrný materiál pro obor Optometrie na MU a vznikl z potřeby propojit předměty týkající se optiky s Matematikou I. a II. a vytvořit souhrn úloh z různých částí optiky tak, aby je bylo možné použít v předmětu Matematika a ukázat na nich aplikace základních matematických pojmů a metod v optice. Na druhé straně v odborných předmětech lze nahlédnout zpět do matematiky, když už některé pojmy zůstaly zapomenuty v prvním ročníku Matematiky I. a II. ... Text tedy není členěn typicky - ani z hlediska zvyklostí v matematice ani z hlediska zvyklostí v optice. Je hypertextově propojen s přednáškou z Matematiky I. a II., úlohy v jednotlivých kapitolách jsou spojeny s minisbírkami řešených úloh (např. Užití matic), které lze vyvolat i samostatně, přičemž samotné kapitoly jsou špetkou teorie z optiky a špetkou z matematiky tak, aby do řešení úloh bylo vidět jak v předmětu Matematika I. a II. bez mnohých znalostí optiky, tak v odborných předmětech Optometrie po mírném pozapomenutí matematiky. V textu se navíc vyskytují bublinky (např. kružnice), které slouží k rychlému připomenutí matematického pojmu (rozbalí se kliknutím nebo jej najdete ve slovníčku). K textu dále patří interaktivní kvizy a testy a kartotéka optických přístrojů. Vektory v optice (fyzice) Fyzikální veličiny, které závisí na poloze v prostoru, popisujeme pomocí vektorů. Může jít např. o vlnový vektor, který popisuje směr šíření vlny, polohový vektor, který je průvodičem bodu v prostoru, apod. V optice nejčastěji používáme 3-rozměrný vektorový prostor s ortonormální bází, tj. množinou tří lineárně nezávislých" navzájem kolmých vektorů jednotkové délky^Tato báze je ve fyzice často označována přičemž vektor i = (1, 0, 0) určuje směr osy x (první souřadnice), j = (0,1, 0) směr osy y (druhá souřadnice) a k = (0, 0,1) směr osy z (třetí souřadnice). Nevím vůbec, co je vektor. . . Souřadnice polohového vektoru r= (x, y, z) můžeme zapsat také pomocí skalárního součimrr x = r-i, ,y = r-j, z = r-k. Úhel ip, který svírají dva vektory a a b, můžeme spočítat pomocí skalárního součinu jako a ■ b (p = arccos-—. \ä\\b\ 1. příklad: Najděte velikost vektoru (2, —3,1). 2. příklad: Najděte vektor kolmý k vektoru (3, 7). 3. příklad: Najděte vektor kolmý k vektoru (2, 3, —4). 4. příklad: Najděte vektor kolmý k rovině g dané vektory (1, 3, 0) a (1,1, —2). EBl Q 19 ©Lenka Přibylová, 2010 Q 5. příklad: Jaký úhel svírají vektory (—3,1,7) a (5,1, —2)? 6. příklad: Dokažte, že platí A cos a + S sin a = \/A2 + B2 cos(a — arctg^). Kolmý průmět vektoru na vektor Ve fyzice často potřebujeme znát vektor c, který je kolmým průmětem vektoru b na vektor a*Obecně platí a ■ b c = ——-a, a ■ a kde • značí skalární součin vektorů, tj. a ■ a = \a\2 je čtverec velikosti vektoru%. Pro velikost průmětu |c| tedy platí |c*| = \b\ cos (f, kde ip je úhel, který svírají vektory a a b. Nevím vůbec, co je vektor. . . 1. příklad: Najděte kolmý průmět vektoru (2, —2,1) na vektor (1, 0, 0). 2. příklad: Najděte kolmý průmět vektoru (1, 2) na vektor (3, —4). 3. příklad: Najděte kolmý průmět vektoru (3,1,1) na vektor (2, 2, 5). Kuželosečky a kvadriky V optice se často setkáváme s kuželosečkami* kvadrikami, zvlášť pak s kružnicemi* koulemi, jako čočkami se sférickými nebo jinými symetrickými povrchy s určitou křivostreentrovanými na optické ose. Chci vědět víc o kuželosečkách. Chci znát rovnice kvadrik. Pro ohniskovou vzdálenost / obecné čočky vrcholové tloušťky d s kulovými stěnami o poloměrech ve směru letu procházejícího světla postupně R\ a R2 umístěné ve vzduchu platí rovnice / \Rx R2J nRiR2 kde n je index lomu (pro vodu n = 1.33, pro sklo například n = 1.5). Zavádí se pojem optické mohutnosti čočky, D = 1/f (v dioptriích). Pro 1 dioptrii je / = 1 m, pro 2 dpt. je / = 0.5 m. Kladné mohutnosti odpovídají spojkám, záporné mohutnosti rozptylkám. Díky tomuto zavedení lze zvlášť zkoumat mohutnost prvního a druhého povrchu čočky „ n — 1 „ 1—n Bx =- D2 =- i?l i?2 EE1 El 19 199 ©Lenka Přibylová, 2010 Q a rovnici čočky lze přepsat do Gullstrandova tvaru, sčítajícího celkovou mohutnost čočky z mohutností jednotlivých jejích stěn D = D1+D2- -DXD2 n hodnoty R\, R2 jsou v absolutní hodnotě rovny příslušným velikostem poloměrů křivosti, přiřazuje se jim ale znaménko podle následující konvence: kladné, když paprsek dříve projde stěnou čočky než kolem jejího středu křivosti ( stěna je vůči paprsku vypuklá) a záporné, když paprsek dříve míjí střed křivosti a pak teprve narazí do jemu odpovídající stěny (stěna je vůči paprsku dutá). Přiblížení tenké čočky: Pokud platí d(n — l)2 0) a zároveň, každá čočka s plochou stěnou je tenká (viz Gullstrandova rovnice). Díky tomu mohutnost tenké čočky klasických tvarů nezávisí na jejím otočení. 1. příklad: Kružnice x2 + y2 = 1, (x — 0.9)2 + y2 = 0.04 tvoří řez kulovými povrchy čočky. Určete její mohutnost. Můžeme ji považovat za tenkou čočku? 2. příklad: Z průměru a výšky vodní kapky na podložce spočtěte, jakou čočku vytváří. V optice jsou z formálního hlediska velmi zajímavé systémy, které jsou osově souměrné. Kromě kulových povrchů tam tedy mohou patřit všechny ostatní kvadriky, které vznikají rotací symetrického profilu kolem jeho osy: y2 -2Rx + (l + k)x2 =0, zde rotací kolem osy x; parametr R představuje vrcholovou křivost, jednotlivé křivky jsou posány následovně: hyperboloid k < —1, paraboloid k = —1, elipsoid — 1 < k < 0, koule k = 0. Profily čtvrtého a vyšších řádů se používají zřídka kvůli obtížnosti dosažení mechanické kvality povrchu - podmínkou je přesnost na zlomek vlnové délky světla (čili cca 100 nm a lepší). 3. příklad: Nakreslete y2 - 2Rx + (1 + k)x2 = 0 pro k = 0, k = -1 a k = -2. 4. příklad: Ukažte, že y2 — 2Rx + (1 + k)x2 = 0 je hyperbola, elipsa, kružnice a parabola pro dříve uvedené hodnoty parametru k. 5. příklad: Nalezněte průsečíky s osami kuželosečky y2 — 2Rx + (1 + k)x2 = 0. 6. příklad: Ukažte, že R je vrcholová křivost profilu y2 — 2Rx + (1 + k)x2 = 0. ©Lenka Přibylová, 2010 Q Maticová optika Při průchodu světla optickými přístroji dochází k transformaci světelného paprsku, vlnový vektor mění úhel, který svírá s optickou osou, paprsek vychází v jiné vzdálenosti od optické osy, než při vstupu do optického přístroje. 2^2 optická osa vstup optický prvek výstup Elementární optické prvky popisujeme bud zobrazovacími rovnicemi nebo pomocí matic. Maticová optika se využívá především při použití více optických prvků za sebou. Označíme-li x± polohu vstupu optického prvku, x-i je polohu jeho výstupu, y\ tangens úhlu ipi na vstupu optického prvku a yi tangens úhlu Lpi na jeho výstupu (vzhledem k optické ose), můžeme obecně zapsat zobrazovací rovnice lineární soustavou rovnic x2 V2 pncemz A= — 1/1=0; xi Vi xi ■ l?/i=o Zobrazovací rovnice můžeme maticově zapsat takto: Axx + BVl Cxi + Dyi, \xi = Vi A B C D (2) kde • na pravé straně značí násobení maticr Nevím, vůbec, co je matice. . . Podívejme se blíže na důležité některé příklady matic z (2): • D = 0, pak yi = Cxi, tedy úhel výstupu záleží pouze na x± vstupu, proto objekt na vstupu leží v první ohniskové rovině, na výstupu jsou paprsky rovnoběžné. • A = 0, pak X2 = Byi, tedy naopak rovnoběžmě vstupující paprsky se zobrazují do stejné x-i výstupu, proto obraz objektu leží v druhé ohniskové rovině. • B = 0, pak x-i = Axi, tj. všechny paprsky na vstupu x± stejný výstup X2, proto jsou roviny vstupu a výstupu konjugované, objekt na vstupu ze zobrazuje na výstup. Navíc A = ^ je zvětšení systému. • C = 0, pak yi = Dyi, tj. paprsky vstupující rovnoběžně také rovnoběžně vystupují, jde o tzv. teleskopický systém. D pak představuje úhlové zvětšení. 1. příklad: Napište zobrazovací rovnice a přenosovou matici pro úsek volného prostoru o délce d. 2. příklad: Napište zobrazovací rovnice a přenosovou matici pro tenkou čočku o ohniskové vzdálenosti /. ©Lenka Přibylová, 2010 I Tabulka přenosových matic základních optických prvků: volný prostor GO d - délka úseku volného prostoru tenká čočka / - ohnisková vzdálenost čočky lom na rovné ploše (1 o\ ni - index lomu vstupu, ri2 - index lomu výstupu lom na zakřivené ploše ( 1 °] 1 nt-n.2 ni 1 \ R-U2 ri2 / R - poloměr křivosti (konvence: R > 0 pro konvexní povrch, tj. střed za vstupem) odraz v zrcadle jednotková matice odraz v zakřiveném zrcadle (4 0 R - poloměr křivosti (konvence: R > 0 pro konkávni zrcadlo) V případě složitějšího optického systému matice jednotlivých prvků maticově násobíme k dosažení popisu výsledného obrazu. 3. příklad: Vynásobte matice (* -1) • (* \ 4. příklad: Vynásobte matice ^ (l ^2 5. příklad: Napište přenosovou matici pro optický systém složený z tenké čočky o ohniskové vzdálenosti /i = 1 cm, úseku volného prostoru o délce d = 26 cm a další tenké čočky s ohniskovou vzdáleností ji = 5 cm. 6. příklad: Napište přenosovou matici pro optický systém složený z úseku volného prostoru o délce d = 1 m, konkávního zakřiveného zrcadla s poloměrem křivosti R = 2 m, úseku volného prostoru o délce d = 0.8 m, rovinného zrcadla, úseku volného prostoru o délce d = 0.3 m a tenké čočky o ohniskové vzdálenosti fi = 0.1 m. 7. příklad: Odvoďte přenosovou matici tenké čočky o poloměrech křivosti vstupu Ri a výstupu i?2, která je z materiálu o indexu lomu n, umístěná ve vzduchu. Určete její ohniskovou vzdálenost a mohutnost. 8. příklad: Odvoďte přenosovou matici obecné čočky o poloměrech křivosti vstupu R\ a výstupu i?2 a vrcholové tloušťce d, která je z materiálu o indexu lomu n, umístěná ve vzduchu. Určete její ohniskovou vzdálenost a mohutnost, porovnejte s (1). 9. příklad: Plastová tyč s indexem lomu n = 1.56 je ukončena sférickým povrchem o poloměru R = 2.8 cm. Objekt vysoký 2 cm je umístěn ve vzdálenosti d = 15 cm od tyče. Zjistěte umístění a velikost obrazu v tyči. Vstup do kartotéky optických přístrojů - lupa. Vstup do kartotéky optických přístrojů - světelný mikroskop. EBl Q 19 ©Lenka Přibylová, 2010 Q Vlnová rovnice Matematický popis skalární fyzikální veličiny, která se šíří prostorem jako vlnění je dán vlnovou rovnicí d2ip _ 1 d2ip dx2 v2 dt2 Nevím vůbec, co je derivace. . . Vzorce pro derivování a základní příklady na derivaci funkce. 1. příklad: Ukažte, že funkce tjj(x,t) = Acos^uj(t--je řešením vlnové rovnice* 2. příklad: Ukažte, že funkce ip(x, ť) = f(x ± vť) je řešením vlnové rovnice* 3. příklad: Pro které v ie funkce ib(x, ť) =--77;- řešením vlnové rovnice* J ^ ' ; (x - 2ť)2 + 1 4. příklad: Ukažte průběh vlnění, které je dáno funkcí ip(x, ť) =-- 2 ^ _^ pro í = 1,2,... Harmonická vlna Funkce tp(x,t) = Acos(ujt — kx), kde k = — vyhovuje vlnové rovnici^, představuje harmonické kmity, resp. šíření v harmonické vlny. Prozatím uvažujeme pouze vlnu šířící se ve směru osy x. Později budeme uvažovat vlny prostorové. Protože platí cos(x) = sin(x+ |-), můžeme stejně tak použít zápisu pomocí funkce sin, pouze s posunutou počáteční fází. Číslo A je maximální amplituda vlny, lo je úhlová frekvence a pro libovolné pevné t je nejmenší periodou tzv. vlnová délka A a platí k=2-ř. 1. příklad: Ukažte, že vlnové číslo splňuje rovnost k = 2. příklad: Ukažte, že se harmonická vlna tjj(x,t) = Acos(ujt — kx) šíří prostorem rychlostí v = y. Užití Taylorova polynomu Taylorův polynom stupně n příslušný funkci f(x) v bodě xq má tvar Tn(x) =f(x0) H--— (x-xo)H---—(x-xq) +... ... + /i!!íí!!)(l_Ioľ, ' 77.1 ©Lenka Přibylová, 2010 RJ Výpočtem lze ověřit, že má v bodě x0 stejnou funkční hodnotu a také všechny derivace až do řádu n jako funkce /, tj. platí Tn(x0) = f(x0), Tn'(x0) = f'(x0), Tn{n)(xo) = rn)(xo). V okolí bodu xq tedy Tn(x) aproximuje funkci f(x), mluvíme o rozvoji funkce do Taylorova polynomu (přesněji řady ale to vstupujeme za rámec osnov našeho předmětu). V optice je vhodné používat prvních členů tohoto polynomu pro aproximaci např. kulové vlnoplochy u sférické korekce a výpočtu astigmatizmu. 1. příklad: Spočtěte Taylorův polynom stupně 2 příslušný funkci y = sin(x2) v okolí xq = 0. 2. příklad: Spočtěte Taylorův polynom stupně 2 příslušný horní půlkružnici x2 + y2 = R2 v okolí xq = 0. 3. příklad: Spočtěte Taylorův polynom stupně 4 příslušný horní půlkružnici x2 + y2 = R2 v okolí x0 = 0. Vstup do kartotéky optických přístrojů - sférická korekce. Vstup do kartotéky optických přístrojů - cylindrická korekce a astigmatismus. Reprezentace vlnění komplexními čísly Komplexní číslo z = a + ib můžeme zapsat také v goniometrickém tvaru z = |z|(cos p + i sin ip), kde \z\ = \Ja2 + b2 je vzdálenost komplexního čísla v Gaussově rovině od počátku a p = arctg — je úhel, který svírá průvodič bodu z s reálnou a osou. Vzhledem k platnosti Eulerovy formule eLip = cos p + í sin p, můžeme komplexní číslo z psát také v exponenciálním tvaru z= \z\eiíp. Harmonické vlny ipi(x, ť) = Asm(ujt — kx) a ipr(x, ť) = Acos(ujt — kx) jsou tedy imaginární a reálnou složkou funkce ip(x, ť) = Ael{ujt~kx) = Acos{ujt -kx)+i ■ Asm{ujt - kx). Tato reprezentace harmonického vlnění má významnou výhodu oproti goniometrickému zápisu vzhledem ke zjednodušení výpočtů, např. při integraci. Součtové vzorce, skládání vln a interference. Komplexní zápis umožňuje rychlé a přehledné odvození součtových vzorců cos(2a) + i sin(2a) = ei2a = é{a+a) = éa ■ éa = = (cos(a) + i sin(oí)) • (cos(a) + i sin(a)) = = cos2 a — sin2 a + i 2 sin a cos a cos(a + j3)+i sm{a + 13)= e^a+l3) = eia ■ ei/B = = (cos(a) +ís'm(a)) ■ (cos(/3) + ís'm([3)) = = cos a cos (3 — sin a sin (3 + í (sin a cos (3 + cos a sin 0] 1. příklad: Pomocí Eulerova vzorce dokažte, že platí cos x = -—^—. 2. příklad: Dokažte nejkrásnější formuli matematiky: —1 = eí7r. 3. příklad: Dokažte, že platí cos a + cos (3 = 2 cos cos . 4. příklad: Složte vlnění s posunutou fází i/>i(:r, ŕ) = Acos(u>t — kx) a i/>2{x, ť) = Acos(ut — k(x — S)). Superpozicí harmonických vln ipi(x,t) a ip2(x,t) s posunutou fází dostáváme harmonickou vlnu ipi(x,t) + tp2(x,t) = 2Acos ^ cos(ut- kx+ !f). amplituda harmonická vlna Její amplituda bude nabývat interferenčního maxima pro cos -y- = ± 1 a minima pro cos ^ = 0, tj. vlna bude mít maximální amplitudu (zdvojnásobí se) pro kó 2 = mír a nulovou amplitudu pro ^ = 5- + tutt, kde m je celé číslo. Protože k = kde A je frekvence vlnění, bude k interferenčnímu maximu docházet pro posunutí fáze v násobcích frekvence S = m\. 5. příklad: Složte vlnění s opačným směrem šíření ipi(x,ť) = Acos(ujt — kx) a ip2(x, t) = Acos(ujt + kx) a ukažte, že jde o stojaté vlnění. Vstup do kartotéky optických přístrojů - metoda GDx. Vstup do kartotéky optických přístrojů - optická koherentní tomografie. Vstup do kartotéky optických přístrojů - fázová mikroskopie. Vektorová pole Pole je zobrazení, které každému bodu prostoru přiřadí dané hodnoty. Skalární pole je pole, které každému bodu v prostoru přiřazuje jedno číslo, vektorové pole přiřazuje vektor. Příkladem vektorového pole je rychlost atmosféry Země, tj. rychlost větru. Vektorová pole, která představují tekutinový model, mají bezprostřední fyzikální interpretaci: vektory v každém bodě v prostoru představují směr pohybu částic tekutiny a my můžeme vytvořit animaci takovéhoto pohybujícího se pole. Třebaže vektory elektromagnetického pole nepředstavují tok tekutiny, můžeme přenést mnoho pojmů, které se používají k popisu tekutinového pole i na popis pole elektromagnetického. Například mluvíme o toku elektromagnetického pole skrze plochu jako o množství "tekutiny"- energie, která proteče skrze danou plochu za jednotku času. Gradient funkce / v bodě (x, y, z): grad / = V/ = F(x,y,z) = (f1(x,y,z),f2(x,y,z),f3(x,y,z)) dl dl df dx1 dy1 dz ©Lenka Přibylová, 2010 I Divergence F: divF = V • F = —--h —--h ——. ox oy dz Fyzikálně si lze představit divergenci v daném bodě plochy jako zřídlo (je-li divergence kladná) a odtok (je-li divergence záporná), cirkulace odpovídá nulové divergenci. Fyzikálně znamená směr a rychlost otáčení víru okolo daného bodu. Statické elektrické pole je nevírové (má nulovou rotaci) a statické magnetické pole je nedivergující, nezdrojové (má nulovou divergenci). 1. příklad: Magnetické pole vodiče, kterým protéká stejnosměrný proud /, je dáno jako B = ^——, O^j (proud protéká ve směru osy z, /iq je permeabilita, r je vzdálenost od vodiče stejnosměrného proudu ). Spočtěte divergenci indukovaného magnetického. Rovinná vlna v prostoru Harmonická rovinná vlna v prostoru má tvar ip(r,ť) = Acos(ujt — k ■ r), kde k = (ki, k2, k%) je vektor šíření vlny, r = (x, y, z) je vektor prostorových souřadnic a • značí skalární součin*tj. V daném okamžiku t = ť leží body, které jsou ve stejné fázi ip, v rovině' k ■ r = k\x + k2y + k3z. ve stejné fázi ip, v rovině p = Luť — (kix + k2y + k3z), neboli k\X + k2y + k3z + p — Luť = 0, d jejímž normálovým vektorem je k. EBl Q 19 ©Lenka Přibylová, 2010 Q Poyntingův vektor a intenzita světelné vlny V teorii elektromagnetického pole je zvykem charakterizovat energii přenesenou za jednotku času a vztaženou na jednotkovou plochu kolmou na směr šíření ve vakuu tzv. Poyntingovým vektorem S. Ten je definován jako vektorový součin^ektoru elektrického pole a vektoru magnetického pole (magnetické indukce): Š = Ě x H. Protože vektory E a. H jsou na sebe kolmé, má Poyntingův vektor směr šíření elektromagnetického vlnění. Intenzita obecné světelné vlny je definována jako časová střední hodnota^elikosti Poyntingova vektoru, tj. I=(\Š\) = - [\Š\dt9 Jo Pro rovinnou monochromatickou vlnu Ě = (0,Ey,0) ve vakuu (dosazením do Maxwellových rovnic^platí I = ce0- í E2ydt, T Jo kde c je rychlost světla a s o je permitivita vakua. Nevím vůbec, co je integrál. . . Vzorce pro integrování a základní příklady na integraci funkce. 1. příklad: Určete intenzitu rovinné monochromatické vlny Ey = ip(x, ť) = Acos(ujt — kx). Vstup do kartotéky optických přístrojů - polarizátory. Vstup do kartotéky optických přístrojů - Malusův zákon. Vstup do kartotéky optických přístrojů - polarizační mikroskop. Difrakce a Fourierova transformace Fraunhoferova difrakce na stínítko kolmo dopadající vlny je taková difrakce, kdy obraz je "velmi"vzdálen od stínítka. Nechrne stranou přesné určení vzdálenosti, jde v prvé řadě o to, aby světlo z otvoru na stínítku dopadalo na rovinu obrazu pod stejným úhlem. Pak obraz je určen složením vln propuštěných stínítkem. Pokud tedy s(x,y) je funkce propustnosti stínítka, je obraz dán následujícím integrálem ("součtem"či složením): ip(tv)=AÍÍ s(x,y)e-ik&+^ dxdy Fraunhoferovu difrakci popisuje tzv. Fourierova transformace^unkce propustnosti s(x,y) difrakčního stínítka (funkce charakterizující osvětlující monochromatickou rovinnou vlnu v jejím komplexním tvaru je součástí Fourierovy transformace). Pro difrakci na obdélníkovém otvoru tedy s(x,y) = 1 próze (-§,§> aye (-§,§} 0 jinde fP/2 rq/2 tP(í„t])=A / e~ik^x+^ dydx -p/1 J-q/2 1. příklad: Popište obraz monochromatické vlny při Fraunhoferově difrakci na obdélníkovém otvoru. Intenzita monochromatické vlny při Fraunhoferově difrakci na obdélníkovém otvoru ve středu obrazu je dána vztahem j0 = |V(o,o)|2 = aVY- ©Lenka Přibylová, 2010 RJ Determinanty Determinanty^ sou pro mnoho studentů záhadná věc. Pokud se s nimi alespoň trochu setkali, rádi a často je zaměňují s maticemi^dá se, že je k tomu mnoho důvodů. Jednak vypadají na první pohled podobně - až na použité závorky okolo, a také se s nimi trošku podobně počítá - až na některá podlá pravidla a také na tvar výsledku. Tato kapitola bude sloužit hlavně k tomu, abychom vysvětlili rozdíl mezi maticemi a determinanty, je to opravdu něco jiného, rozdíly ve výpočtech a hlavně se pokusíme vysvětlit k čemu je vlastně můžeme použít. Nepůjde o úplný výčet, protože determinanty vyskakují z učebnic matematiky i fyziky (a spousty jiných oborů) na tolika různých místech, že to ani nejde. Ukážeme si ale některé jejich aplikace v optice (např. Cramerovo pravidlo pro řešení soustav rovnic v metodě nejmenších čtverců) nebo jejich užití při odvození teorie (např. pro klasifikaci kuželoseček u eliptické polarizace). Zařazeny jsou takto zvláštně až za použití derivací^roto, že determinanty složené z derivací jsou velmi časté a mají dokonce svá jména (hessián, wronskián apod.). Determinant je ČÍSLO přiřazené matici. Matice není číslo, ale tabulka více čísel. S maticemi jsme se setkali v sekci Maticová optika a víme tedy, že můžeme pomocí maticového násobení^apsat např. soustavu rovnic^Bylo by dobré rychle poznat, jestli má taková soustava řešení^iebo má-li jich víc, rychle je najít. I k tomu slouží záhadné číslo přiřazené matici - determinant. Jenže definice tohoto čísla je poněkud ... no ... nehezká. Chci definici determinantu. . . Proto se zde omezíme jen na jeho výpočet a začneme tím nejjednodušším - determinantem matice 2x2. det A = det «11 «12 — «n«22 — «i2«2i V«21 »22, Pro matici řádu 2 říkáme předpisu pro determinant křížové pravidlo, protože prvky matice násobíme do kříže: det A = au a±2 «21 «22 — «n«22 — «i2«2i 1. příklad: Spočtěte determinant matice 2. příklad: Spočtěte determinant matice 3. příklad: Spočtěte determinant matice 5 4 1 2 5 ■ 10 cos(2x) - sin(2x) sin(2x) cos(2x) Pro determinant matice 3 sloupců): 3 je výpočet pomocí Sarussova pravidla složitější, používá se pomocných řádků (nebo «n «21 «31 «12 «22 «32 «13 «23 «33 «11 «12 «13 «21 «22 «23 «31 «32 «33 «11 «12 «13 «21 «22 «23 «11«22«33 + «21«32«13 + «31«12«23 — «31«22«13 — «11«32«23 — «21«12«33 4. příklad: Spočtěte determinant matice 5. příklad: Spočtěte determinant matice EBl Q 19 ©Lenka Přibylová, 2010 Q Klasifikace kuželoseček a eliptická polarizace Každou kuželosečku můžeme napsat ve tvaru aux2 + 2aí2xy + a22y2 + 2aí3x + 2a23y + a33 = 0. Determinanty* A = det A - au 0,12 »12 a22 »11 a12 »13 0\2 022 »23 a t, »13 »32 »33 jsou tzv. invariantami kuželosečky (nemění se při transformaci souřadnic) a charakterizují ji, jinak řečeno, pomocí těchto determinantů lze kuželosečky klasifikovat: • A^O vlastní kuželosečky: elipsa pro 6 > 0, hyperbola pro 6 < 0 a parabola pro 6 = 0 • A = 0 nevlastní kuželosečky (degenerované), přímky Poznámka 1. Aby šlo o reálnou elipsu, nikoliv imaginární, musí být navíc (su +a22)A < 0. 1. příklad: Klasifikujte kuželosečku 2x2 — 2xy + 3y2 — x + y — 1 =0. 2. příklad: Klasifikujte kuželosečku x2 — Axy — by2 + 2x + Ay + 3 = 0. 3. příklad: Ukažte, že y2 — 2Rx + (1 + k)x2 = 0 je hyperbola, elipsa nebo parabola, určete, pro které hodnoty parametru k. Uvažujme nyní elektromagnetické pole E v prostoru a čase. Bez újmy na obecnosti můžeme předpokládat, že pro jeho složky platí E = (Ex,Ey,0), kde Ex = A1cos(r + (f1) Ey = A2 cos(t + ip2). Přitom t = Lut — k ■ r je v čase a prostoru proměnná část fáze a ipi resp. (p2 je počáteční fáze ve směru osy x resp. y. Harmonická vlna se šíří ve směru osy z. Podle součtových vzorců = cos t cos (fi — sin t sin Lpi ^ = cos t cos (f2 — sin t sin ip2. Vynásobením první rovnice cos (p2 a druhé rovnice cos ipi a odečtením dostaneme ff cos ip2 - |j cos v?i sin t sin if2 cos ipi — sm t sin ifi cos (f2 = sinTSÍn( 0 a maximum pokud f"x(xo,Vo) < 0 \H(x0,y0)\ = fxx(xo,yo) > • \H(xo,yo)\ < 0, extrém nenastává. 1. příklad: Najděte minimum funkce /(x, y) = x2 + xy + y2 — 2x + 1 2 2 2. příklad: Najděte extrémy funkce f(x,y) = ex ~v . > 0, pak je ve stacionárním bodě [xo,yo] extrém, a to minimum pokud ©Lenka Přibylová, 2010 I Snellův zákon Podle Fermatova principu se světlo šíří tak, že optická dráha mezi dvěma body, kterou projde paprsek světla, je dráha, kterou projde za nejkratší čas. V homogenním prostředí je to tedy nutně přímka. V případě, že světlo prochází z prostředí o indexu lomu n\ = ^- do prostředí o indexu lomu n2 = ^ (kde c je rychlost světla ve vakuu) bude jeho dráha dána minimalizací času t{x). Minimalizovat budeme podle proměnné x = \BD\, která je dle následujícího obrázku vzdáleností bodu D dopadu světla na rozhraní od kolmého průmětu C bodu A na rovinu rozhraní. Body A a B a rozhraní prostředí jsou pevné, známe tedy vzdálenosti a = \AC\, b = \BE\ a d = \CE\ (viz obrázek). a Tli N. Si a \. a d - x E C x D \ Ä b n-2 V R t{x) = \ (m Va2 + x2 + n2 y/(d — x)2 + b2) ť{x) = ^(n^ia2 +x2)-\~ ■ 2x + n2\{{d - x)2 + b2)-l ■ 2{d-x) ■ (-1)) Extrém funkce t{x) nastává ve stacionárním bodě, tj. musí platit ť(x) = 0. Odtud ni(a2 +x2)~^ ■ x = n2((d - x)2 + b2)~^ ■ (d-x), tj- x d — x n-i —, = n2— , Va2 + x2 y/(d-x)2+b2 což je tzv. Snellův zákon lomu: n\ sin a = n2 sin (3. Metoda nejmenších čtverců Metoda nejmenších čtverců využívá optimalizace pro nalezení přímky (nebo obecnější křivky), která je vhodnou aproximací naměřených závislých dat. Velice často při měření hodnot potřebujeme získat informaci o této závislosti ať už pro predikci nebo např. pro odhad chyb přístroje apod. Odvodíme nejjednodušší případ, budeme hledat přímku y = ax + b tak, aby naměřeným dvojicím dat [xi,yi], ..., [xn, yn] co nejlépe odpovídala. y • y = ax + b \ ax, + b -y, yi] x Minimalizujeme tedy vzdálenosti skutečně naměřených hodnot od hodnot na aproximující přímce. Přesněji použijeme nikoliv vzdálenost, tedy absolutní hodnotu rozdílu těchto hodnot, ale její čtverec, tedy druhou mocninu. Odtud název metody - metoda nejmenších čtverců. (Důvod je ten, že výpočet je podstatně jednodušší...) ~y^^(axj + b — yi)2 -> min i=l Uvědomme si, že známe Xi a. yi, to, co neznáme jsou parametry přímky: a a b. Minimalizovat tedy budeme vzhledem k těmto proměnným. Hledáme tedy stacionární body funkce dvou proměnných, nalezneme derivace^>odle obou proměnných a položíme je rovny nule: C^2(axi + b - yi)2)'a = 2(axj + b- y^Xj = 0 i=l i=l n n (J2(axi +b - vi?)'b = E 2(aXi +b - =0 i=i i=i Roznásobením a sloučením vhodných sčítanců dostaneme soustavu: a E-2+ĎE i=l i=l E x%y% nb = E^ i=l Tato soustava má vždy jediné řešení, protože /n n v E-? D = det i=l n \i=l i=l n = -E^-(E^)2>0- Jde o tzv. Jensenovu nerovnost, ostrá nerovnost je dána tím, že měříme alespoň ve dvou různých hodnotách x, z jednoho měření nebo měření v jednom x žádný závěr o závislosti y na x samozřejmě nedostaneme. Podle Cramerova pravidla je řešením soustavy /n n \ E xiVi EXi det v Ey* \ í=i i=i n , n n \ J2xí J2XiVi det \J2xi E^ \i=i í=i ) D ' D n n a je skutečně minimem, protože hessián*D > 0 a navíc (^^(ciXi + b — j/i)2)"a = 2 x2 > 0. i=l i=l 1. příklad: Najděte přímku aproximující body [0,5], [1,3], [3,3], [5,2], [6,1]. Často aproximujeme data například parabolou y = ax2 + b, u růstu živých organismů je časté použití exponenciální funkce y = eax+h (zlogaritmováním dat yi dostáváme aproximaci přímkou) apod. Výše uvedený princip je možné použít vždy, když hledané parametry mají mezi sebou pouze lineární vztahy. Mluví se proto také o metodě lineární regrese nebo hledání regresní přímky. Ze statistického hledika jde o tzv. bodové odhady. S pomocí statistických metod je také možné odhadovat intervaly, tedy nikoliv křivku, ale jakýsi pás, ve kterém měřené veličiny leží s vysokou (např. 95 %) pravděpodobností. Tyto poznatky ale zasahují daleko přes rámec základního kurzu matematiky do statistiky. Je však dobré o nich vědět a případně použít vzorce, které lze nalézt např. na Wolfram MathWorld www.weibull.com 2. příklad: Nalezněte kalibrační křivku spektrometru. 3. příklad: Určete materiálové konstanty skla. ©Lenka Přibylová, 2010 I