1. VEKTOROVÉ PROSTORY Jan Paseka Masarykova univerzita Brno 2. října 2006 Abstrakt V této kapitole zavedeme dva pojmy, které budou hrát v následujícím výkladu klíčovou úlohu a dokážeme o nich několik jednoduchých tvrzení. Půjde o pojem tělesa a vektorového prostoru. Prvky tělesa budeme nazývat skaláry a prvky vektorového prostoru vektory. Obsah přednášky I Úvod Základní číselné obory Q, R a C ; pojem tělesa. Tělesa Zp Geometrická interpretace vektorů v rovině a v třírozměrném prostoru Geometrická interpretace vektorů v R2 a R3 , rovnoběžníkové pravidlo Obsah přednášky II Vektorové prostory Příklady vektorových prostorů (řádkově a sloupcově uspořádané n-tice skalárů, polynomy, rozšírení těles, funkce z množiny do tělesa a vektorového prostoru) Číselné obory I N ­ množina všech přirozených čísel, Z ­ množina všech celých čísel, Q ­ množina všech racionálních čísel, R ­ množina všech reálnych čísel, C ­ množina všech komplexních čísel. Číselné obory II Nulu považujeme za přirozené číslo, t. j. 0 N. Imaginární jednotku (která je prvkem C - R) budeme značit i. Prvky výše uvedených číselných oborů Q, R, C nazýváme často skaláry. V tomto případě pak budeme mluvit o číselném tělese. Struktura číselných oborů I Na každé z těchto množin jsou definované dvě binární operace, sčítaní + a násobení . Obě tyto operace jsou asociativní a komutativní. Násobení je (z obou stran) distributivní vzhledem ke sčítání, t. j. pro všechny prvky x, y, z příslušné množiny platí x(y + z) = xy + xz, (x + y)z = xz + yz. Struktura číselných oborů II Číselný obor N je v porovnaní s obory Z, Q, R a C "chudší" ­ totiž rovnice tvaru x + a = b mají v oborech Z, Q, R, C řešení x = b - a pre libovolné a, b, ale v N je takováto rovnice řešitelná, pokud a b. Obory Q, R a C jsou však "bohatší" nejen v porovnání s N, ale i s Z ­ rovnice tvaru ax = b mají v oborech Q, R, C řešení pro libovolné a = 0 a b, přičemž v N či Z jsou řešitelné, pouze pokud a je dělitelem b. Axiomy tělesa I Tělesem nazýváme množinu K s dvěmi význačnými prvky ­ nulou 0 a jedničkou 1 ­ a dvěmi binárními operacemi na K ­ sčítáním + a násobením ­ takovými, že platí Axiomy tělesa II (a, b K)(a + b = b + a),(a, b K)(a b = b a), (a, b, c K)(a + (b + c) = (a + b) + c), (a, b, c K)(a (b c) = (a b) c), (a K)(0 + a = a), (a K)(1 a = a), (a K)( b K)(a + b = 0), (a K {0})( b K)(a b = 1), (a, b, c K)(a (b + c) = (a b) + (a c)), 0 = 1. Axiomy tělesa III Sčítání a násobení v tělese jsou komutativní a asociativní operace a násobení je distributivní vzhledem ke sčítání. 0 je neutrální prvek sčítání a 1 je neutrální prvek násobení a tyto prvky jsou navzájem různé. Prvek b K takový, že a + b = 0, je k danému a K určený jednoznačně. Tento jednoznačně určený prvek k danému a označujeme -a a nazýváme opačný prvek k a. Místo a + (-b) píšeme jen a - b. Axiomy tělesa IV Analogicky se lze přesvědčit, že i prvek b K takový, že a b = 1 je k danému 0 = a K určený jednoznačně ­ označujeme ho a-1 nebo 1 a , případně 1/a a nazýváme inverzní prvek k a alebo převrácená hodnota prvku a. Místo a b-1 píšeme též a b nebo a/b. Vlastnosti tělesa I Tvrzení Buď K těleso. Potom pro všechna n N a a, b, c, b1, . . . , bn K platí (a) a + b = a + c b = c, (b) (ab = ac & a = 0) b = c, (c) a 0 = 0, (d) a b = 0 (a = 0 b = 0), (e) -a = (-1) a, (f) a (b - c) = a b - a c, (g) a (b1 + . . . + bn) = a b1 + . . . + a bn. Vlastnosti tělesa II Doplňme, že podmínky (a) a (b) sa nazývají zákony o krácení pro sčítaní resp. násobení v tělese. Podmínka (e) nám umožňuje zavést libovolné celočíselné násobky prvků z tělesa. Pro a K, n N klademe (-n)a = -(na) = n(-a). Podobně lze pro nenulové prvky tělesa zavést i libovolné celočíselné mocniny. Pro 0 = a K, n N klademe a-n = (an)-1 = (a-1)n. Vlastnosti tělesa III 0a = 0, 1a = a, a0 = 1, a1 = a, n(a + b) = na + nb, (m + n)a = ma + na, (mn)a = m(na), (mn)(ab) = (ma)(nb), (ab)n = anbn, n < 0 a = 0 = b, am+n = aman, (m < 0 n < 0) a = 0, amn = (am)n, (m < 0 n < 0) a = 0 a, b K, m, n Z. Vlastnosti tělesa IV Nechť K je těleso a L K. Říkáme, že L je podtěleso tělesa K, pokud 0, 1 L a pro všechna a, b L platí a + b L, ab L, -a L a, pokud a = 0, tak i a-1 L. Podtěleso tělesa K je tedy jeho podmnožina L, která obsahuje nulu a jedničku a je uzavřená vzhledem ke sčítání, násobení, opačnému a inverznímu prvku. Zřejmě každé podtěleso tělesa K je s těmito operacemi zúženými z K na L i samo tělesem. Říkáme pak, že těleso K je rozšířením tělesa L. Vlastnosti tělesa V Zřejmě těleso Q je podtělesem tělesa R i tělesa C; těleso C je rozšířením těles Q a R. Charakteristikou tělesa K, píšeme charK, nazýváme nejmenší kladné celé číslo n takové, že n1 = 0; pokud takové n neexistuje, t. j. n1 = 0 pro každé celé n > 0, říkáme že K má charakteristiku (někteří autoři definují charK = 0). Vlastnosti tělesa VI Je-li těleso K rozšířením tělesa L, tak obě tělesa K a L mají tutéž jedničku i nulu, a proto charK = charL. Zřejmě charQ = charR = charC = . Věta Nechť K je těleso. Potom charK je rovna nebo prvočíslu. Konečná tělesa I V tomto odstavci si ukážeme příklady těles, jejichž charakteristika není . Z tohoto důvodu se tato tělesa podstatně liší od nám známých číselných těles. Totiž, pro každé prvočíslo p sestrojíme jisté konečné těleso Zp, které má p prvků a charakteristiku p. Naopak, dříve uvedená číselná tělesa jsou nekonečná. Konečná tělesa II Pro potřeby matematické analýzy, tedy i z hlediska fyzikálních aplikací, jsou nejdůležitějšími tělesy R a C. Konečná tělesa však v současnosti sehrávají důležitou úlohu např. v teorii kódování a kryptografii. Pro každé kladné celé číslo n označme Zn = {k N; k < n} = {0, 1, . . . , n - 1}. Konečná tělesa III Množinu Zn nazýváme množinou zbytkových tříd modulo n. Na této množině zavedeme dvě binární operace ­ sčítání a násobení (je nutné odlišit sčítání a násobení v Zn od příslušných operací v Z). Pro a, b Zn klademe a b = zbytek po dělení (a + b)/n, a b = zbytek po dělení (ab)/n. Konečná tělesa IV a jsou asociativní a komutativní operace na Zn, 0 je neutrální prvek sčítání a, pro n > 1, 1 je neutrální prvek násobení. Násobení je distributivní vzhledem ke sčítání a a = n - a je opačný prvek k a Zn. Věta Množina Zn s operacemi a je těleso právě tehdy, když n je prvočíslo. Konečná tělesa V + 0 1 2 3 4 0 0 1 2 3 4 1 1 2 3 4 0 2 2 3 4 0 1 3 3 4 0 1 2 4 4 0 1 2 3 0 1 2 3 4 0 0 0 0 0 0 1 0 1 2 3 4 2 0 2 4 1 3 3 0 3 1 4 2 4 0 4 3 2 1 Multiplikativní tabulky sčítání a násobení v tělese Z5. Interpretace I Vektory v rovině či v prostoru si představujeme jako orientované úsečky, t. j. úsečky, jejichž jeden krajní bod považujeme za počáteční a druhý za koncový ­ ten je označený obvykle šipkou. Interpretace II x y (x,y) Vektor v rovině Přitom dvě stejně dlouhé, rovnoběžné a souhlasně orientované úsečky představují ten stejný vektor ­ říkáme, že jsou umístění téhož vektoru. Interpretace III 1 1 v v v Umístění téhož vektoru Interpretace IV Zvolíme-li si nějaký pevný bod O, pak všechny vektory v rovině či v prostoru můžeme jednoznačně reprezentovat jako orientované úsečky - OA s počátkem v O. Jejich koncem může být libovolný bod A roviny či prostoru, bod O nevyjímaje ­ orientovaná úsečka - OO totiž představuje tzv. nulový vektor. Interpretace V Vektory v rovině či v prostoru můžeme sčítat pomocí tzv. vektorového rovnoběžníku. Součet vektorů u = - OA, v = - OB je potom znázorněný orientovanou uhlopříčkou u + v = - OC rovnoběžníka, jehož dvě přilehlé strany tvoří úsečky OA, OB. O ! E v u u + v Q rrrj T v u v - u Interpretace VI Vektory můžeme rovněž násobit libovolnými skaláry, t. j. v našem případě reálnými čísly: pokud c R a v je vektor, tak cv je vektor, t. j. orientovaná úsečka s počátkem v O, jejíž délka je |c|-násobkem délky úsečky v, leží na té stejné přímce jako v a je orientovaná souhlasně s v, pokud c > 0, resp. nesouhlasně s v, pokud c < 0 (je-li c = 0 nebo v je nulový vektor, tak, samozřejmě, i cv je nulový vektor, takže nezáleží na jeho směru ani orientaci). Interpretace VII 0v ) -v 0 2v Násobení vektoru skalárem Interpretace VII Pokud si mimo počátek O zvolíme v rovině či prostoru ještě dvě resp. tři souřadné osy, t. j. navzájem kolmé přímky procházející počátkem, a na každé z nich jeden bod ve stejné jednotkové vzdálenosti od počátku, dostaneme pravouhlý souřadnicový systém v rovině či v prostoru. Každý bod roviny či prostoru je potom jednoznačně určený uspořádanou dvojicí, resp. trojicí svých souřadnic a naopak, každá dvojice resp. trojice souřadnic jednoznačně určuje nějaký bod roviny či prostoru. Interpretace VIII Rovněž každý vektor v rovině či v prostoru je potom jednoznačně určený souřadnicemi svého koncového bodu a naopak libovolná uspořádaná dvojice resp. trojice souřadnic jednoznačně určuje nějaký vektor v rovině či prostoru. Při pevném souřadnicovém systému tak můžeme množinu všech vektorů v rovině ztotožnit s množinou R2 a množinu všech vektorů v prostoru s množinou R3. Interpretace IX Jsou-li (při takovémto ztotožnění) u = (u1, u2) R2 , v = (v1, v2) R2 dva vektory v rovině, tak snadno ověříme, že pro jejich součet u + v, daný vektorovým rovnoběžníkem, platí u + v = (u1, u2) + (v1, v2) = (u1 + v1, u2 + v2). Interpretace X Je-li c R, pak pro skalární násobek cu dostáváme cu = c(u1, u2) = (cu1, cu2). Podobně to můžeme ověřit pro vektory v prostoru, t. j. uspořádané trojice reálných čísel. Interpretace XI Navíc si všimněme, že předpoklady kolmosti souřadných os a rovnosti jednotkových délek v jednotlivých směrech nehrály v našich úvahách žádnou roli. Stačí, aby systém souřadných os tvořily dvě různoběžné přímky (v rovině) resp. tři přímky neležící v rovině (v prostoru) protínající se v počátku O. Za jednotkové délky ve směrech jednotlivých souřadných os můžeme zvolit délky libovolných (ne nutně stejně dlouhých) úseček. Vektorové prostory I Buď K (číselné) těleso. Vektorovým nebo též lineárním prostorem nad K nazýváme množinu V s význačným prvkem 0 a dvěma binárními operacemi ­ sčítáním + : V × V V a násobením : K × V V ­ takovými, že platí Vektorové prostory II (x, y, z V )(x + (y + z) = (x + y) + z)), (x, y V )(x + y = y + x), (x V )(x + 0 = x), (x V )(y V )(x + y = 0), (a, b K)(x V )(a (b x) = (ab) x), (x V )(1 x = x), (a K)(x, y V )(a (x + y) = (a x) + (a y)), (a, b K)(x V )((a + b) x = (a x) + (b x)). Vektorové prostory III Skaláry značíme "obyčejnými" malými latinskými písmeny a vektory tučnými malými latinskými písmeny. Poznámka. I když sčítání skalárů v (číselném( tělese K a sčítání vektorů značíme stejným znakem +, jde o různé operace. Podobně násobení v (číselném) tělese a násobení vektoru skalárem jsou různé operace, ačkoliv obě značíme . Později budeme stejně značit příslušné operace a nuly v různých vektorových prostorech. Vektorové prostory IV Z formálního hlediska připomínají axiómy vektorového prostoru vlastnosti (číselného) tělesa K: sčítání vektorů je opět asociativní a komutativní binární operace na V s neutrálním prvkem 0 V , operace násobení vektoru skalárem splňuje jakousi podmínku "asociativity", 1 K je její "neutrální prvek" a platí dva "distributivní zákony". Vektorové prostory V Jeden podstatný rozdíl ­ násobení v (číselném) tělese K je binární operací na množině K, t. j. zobrazením : K × K K, násobení ve vektorovém prostoru V nad číselným tělesem K není binární operace na V , ale binární operace : K × V V . Vektorové prostory VI To nám však nebrání zavést obdobné dohody jako pro operace v (číselném) tělese: násobení má přednost před sčítáním a znak násobení budeme většinou vynechávat, t. j. budeme např. psát ax + y namísto (a x) + y. Vektorové prostory VII Rovněž budeme vynechávat závorky, jejichž umístění neovlivní výslednou hodnotu výrazů jako např. v abx nebo a1x1 + . . . + anxn. Poslední výraz budeme taktéž značit n i=1 aixi a nazývat lineární kombinací vektorů x1, . . . , xn s koeficienty a1, . . . , an. Vektorové prostory VIII Speciálně pro n = 1 to znamená 1 i=1 ai xi = a1x1; kvůli úplnosti pro n = 0 ještě klademe prázdnou lineární kombinaci 0 i=1 ai xi rovnou 0. Tvrzení Nechť V je vektorový prostor nad (číselným) tělesem K. Pak pro libovolné n N, a, b, a1, . . . , an K a x, y, z, x1, . . . , xn V platí Vektorové prostory IX (a) x + y = x + z y = z, (b) (ax = ay& a = 0) x = y, (ax = bx& x = 0) a = b, (c) a0 = 0 = 0x, (d) ax = 0 (a = 0 x = 0), Vektorové prostory X (e) -x = (-1)x, (f) a(x - y) = ax - ay, (a - b)x = ax - bx, (g) a(x1 + . . . + xn) = ax1 + . . . + axn, (a1 + . . . + an)x = a1x + . . . + anx. Příklady I Zřejmě každé těleso K můžeme považovat za vektorový prostor nad sebou samým. Obecněji, pokud těleso L je rozšířením tělesa K, tak L můžeme považovat za vektorový prostor nad tělesem K (formálne stačí "zapomenout" na násobení některých dvojic prvků a, b L a součin ab připustit jen pro a K, b L). Příklady II Podobným způsobem můžeme vektorový prostor V nad tělesem L zúžením násobení L × V V na násobení K × V V změnit na vektorový prostor nad tělesem K. Příklady III Pro libovolné těleso K a n N je množina Kn = {(x1, . . . , xn); x1, . . . , xn K} všech uspořádaných n-tic prvků z K spolu s operacemi Příklady IV x + y =(x1, . . . , xn) + (y1, . . . , yn) =(x1 + y1, . . . , xn + yn), cx =c(x1, . . . , xn) = (cx1, . . . , cxn), kde x = (x1, . . . , xn) Kn , y = (y1, . . . , yn) Kn a c K, vektorový prostor nad tělesem K. Příklady V Zřejmě uspořádaná n-tice 0n = (0, . . . , 0) hraje úlohu nuly v Kn . Pokud bude potřebné rozlišit nulové vektory v prostorech Kn pro různá přirozená čísla n, budeme pro nulu v Kn používat označení 0n. Opačný prvek k x = (x1, . . . , xn) Kn je zřejmě -x = -(x1, . . . , xn) = (-x1, . . . , -xn). Příklady VI Říkáme, že operace na Kn jsou definované po složkách. Prvky tohoto vektorového prostoru nazýváme n-rozměrné řádkové vektory nad tělesem K. Vektorový prostor K0 sestává z jediného prvku , představujícího "uspořádanou nultici", která je nutně nulou v K0 . Příklady VII Někdy bude výhodnější pracovat s n-rozměrnými sloupcovými vektory nad tělesem K, t. j. s vektory tvaru x = x1 ... xn , kde x1, . . . , xn K. Píšeme rovněž Kn . Příklady VIII Polynomem nebo též mnohočlenem f stupně n, kde -1 n Z, v proměnné x nad tělesem K rozumíme formální výraz tvaru f (x) = a0 + a1x + . . . + an-1xn-1 + anxn = n i=0 ai xi , Příklady IX kde a0, a1, . . . , an-1, an jsou skaláry, nazývané koeficienty polynomu f , a an = 0. Nulu 0 K považujeme za polynom stupně -1 a nenulové skaláry a K za polynomy stupně 0. Zřejmě každý polynom f definuje (stejně označovanou) funkci f : K K danou předpisem c f (c), t. j. dosazením konkrétních hodnot c K za proměnnou x do polynomu f . Příklady X Množinu všech polynomů v proměnné x nad K stupně nejvýše n, kde -1 n Z, budeme značit K(n)[x]; množinu všech polynomů v proměnné x nad K značíme K[x]. Libovolný polynom g(x) = m i=0 bi xi K[x] stupně m < n můžeme psát ve tvaru g(x) = b0 + b1x + . . . + bmxm + 0xm+1 + . . . + 0xn , t. j. v tvaru g(x) = n i=0 bi xi , kde bi = 0 pro m < i n. Příklady XI S použitím této konvence lze definovat součet f + g polynomů f = n i=0 ai xi , g = m i=0 bi xi z K[x] předpisem (f + g)(x) = f (x) + g(x) = max(m,n) i=0 (ai + bi )xi . Příklady XII Pokud navíc c K, klademe (cf )(x) = cf (x) = n i=0 cai xi . Snadno ověříme, že s takto po složkách definovanými operacemi součtu a skalárního násobku tvoří každá z množin polynomů K(n)[x], kde -1 n Z, a zároveň i množina všech polynomů K[x] vektorový prostor nad tělesem K.