Náhodné veličiny Zavedení náhodné veličiny a transformované náhodné veličiny Náhodná veličina slouží k tomu, aby výsledky náhodného pokusu popsala reálnými čísly ( resp. reálnými vektory): zobrazení R:X →Ω je (skalární) náhodná veličina, tj. zobrazení, které možnému výsledku ω přiřadí číslo X(ω), zobrazení X = ( ) n n1 R:X,,X →ΩK je náhodný vektor, tj. zobrazení, které možnému výsledku ω přiřadí čísla X1(ω), …, Xn(ω). Např. při hodu kostkou lze poloze kostky číslem i nahoru (tj. možnému výsledku ωi) přiřadit číslo i, i = 1, 2, …, 6. Číslo X(ω) se nazývá číselná realizace náhodné veličiny X příslušná možnému výsledku ω. (Nehrozí-li nebezpečí nedorozumění, náhodnou veličinu i její číselnou realizaci značíme týmž symbolem X.) V některých situacích potřebujeme náhodnou veličinu X transformovat pomocí funkce g na transformovanou náhodnou veličinu Y = g(X). Např. X – průměr náhodně vybrané kuličky do kuličkového ložiska, 3 2 X 3 4 Y       π= - objem kuličky. Vztah mezi znakem a náhodnou veličinou Pojem „znak“, který jsme zavedli v popisné statistice, je sice blízký pojmu „náhodná veličina“, ale není s ním totožný. Znak může být považován za náhodnou veličinu, jestliže jeho hodnoty zjišťujeme na objektech, které byly vybrány ze základního souboru náhodně. Simultánní a marginální náhodný vektor Jestliže z náhodného vektoru (X1, …, Xn) vybereme některé složky, např. Xk, …, Xl, dostaneme marginální náhodný vektor (Xk, …, Xl). Původní náhodný vektor se v této souvislosti nazývá simultánní náhodný vektor. Např. výsledky pěti zkoušek na konci semestru považujeme za náhodné veličiny X1, …, X5, přičemž X3, X4 jsou známky ze dvou nejdůležitějších předmětů. Náhodný vektor (X1, …, X5) je simultánní, náhodný vektor (X3, X4) je marginální. Zapisování jevů pomocí náhodných veličin Zápis ( ){ }BX; ∈ωΩ∈ω znamená jev, že náhodná veličina X se realizovala v číselné množině B. Zkráceně píšeme { }BX ∈ . Je-li ( x,B ∞−= nebo { }xB = , jev { }xX ≤ znamená, že náhodná veličina X se realizovala hodnotou nejvýše x a jev { }xX = znamená, že náhodná veličina X se realizovala hodnotou x. Popis pravděpodobnostního chování náhodné veličiny Při pozorování realizací náhodné veličiny si povšimneme, že některé její hodnoty se vyskytují s větší pravděpodobností, jiné s menší. Pravděpodobnostní chování náhodné veličiny X budeme popisovat pomocí distribuční funkce, která udává pravděpodobnost jevu, že náhodná veličina X se realizuje hodnotou nejvýše x: ( ) ( )xXPx:Rx ≤=Φ∈∀ Je to zidealizovaný protějšek empirické distribuční funkce zavedené v popisné statistice: ( ) ( ) n xXN xF:Rx ≤ =∈∀ Lze očekávat, že s rostoucím rozsahem výběrového souboru se budou hodnoty empirické distribuční funkce F(x) ustalovat kolem hodnot distribuční funkce Ф(x). Vlastnosti empirické distribuční funkce se přenášejí i na distribuční funkci – je to funkce neklesající, zprava spojitá a normovaná v tom smyslu, že ∞→-xlim Ф(x) = 0, ∞→xlim Ф(x) = 1 Podobně se definuje i simultánní distribuční funkce náhodného vektoru (X1, …, Xn): ( ) ( ) ( )nn11n1 n n1 xXxXPx,,x:Rx,,x ≤∧∧≤=Φ∈∀ KKK Distribuční funkce libovolného marginálního náhodného vektoru se nazývá marginální distribuční funkce. Největší význam mají jednorozměrné marginální distribuční funkce Ф1(x1), …, Фn(xn) jednotlivých složek náhodného vektoru. Diskrétní náhodné veličiny V praxi mají značný význam náhodné veličiny, které nabývají pouze konečně nebo spočetně mnoha hodnot – jsou to diskrétní náhodné veličiny. Příklady diskrétních náhodných veličin: počet chyb, jichž se dopustí nějaké zařízení za určitou dobu, počet zákazníků ve frontě, počet zmetků v denní produkci apod. Pravděpodobnostní chování diskrétní náhodné veličiny popisujeme pravděpodobnostní funkcí: ( ) ( )xXPx:Rx ==π∈∀ . Je to zidealizovaný protějšek četnostní funkce zavedené v popisné statistice v souvislosti s bodovým rozložením četností: ( ) ( ) n xXN xp:Rx = =∈∀ . S rostoucím rozsahem výběrového souboru se budou hodnoty četnostní funkce ustalovat kolem hodnot pravděpodobnostní funkce. Vlastnosti četnostní funkce se přenášejí i na pravděpodobnostní funkci, tedy pravděpodobnostní funkce je nezáporná ( ) 0x:Rx ≥π∈∀ , je normovaná ( )∑ ∞ −∞= =π x 1x , s distribuční funkcí je spjata součtovým vztahem ( ) ( )∑≤ π=Φ∈∀ xt tx:Rx Ilustrace vztahu mezi četnostní funkcí a pravděpodobnostní funkcí Provedeme n hodů kostkou. Zajímáme se o četnostní funkci počtu ok. n = 60 0 1 2 3 4 5 6 7 x 0,00 0,05 0,10 0,15 0,20 p(x) n = 600 0 1 2 3 4 5 6 7 x 0,00 0,05 0,10 0,15 0,20 p(x) n → ∞ 0 1 2 3 4 5 6 7 x 0,00 0,05 0,10 0,15 0,20 pi(x) Diskrétní náhodný vektor Jestliže všechny složky náhodného vektoru (X1, …, Xn) jsou diskrétní náhodné veličiny, hovoříme o diskrétním náhodném vektoru. Jeho pravděpodobnostní chování je popsáno simultánní pravděpodobnostní funkcí: ( ) ( ) ( )nn11n1 n n1 xXxXPx,,x:Rx,,x =∧∧==π∈∀ KKK Pravděpodobnostní funkce libovolného diskrétního marginálního náhodného vektoru se nazývá marginální pravděpodobnostní funkce. Největší význam mají jednorozměrné marginální pravděpodobnostní funkce π1(x1), …, π n(xn) jednotlivých složek náhodného vektoru. Získáme je tak, že hodnoty simultánní pravděpodobnostní funkce sečteme přes všech n-1 přebývajících proměn- ných. Spojité náhodné veličiny Dalším velmi důležitým typem veličin jsou spojité náhodné veličiny – ty nabývají všech hodnot z nějakého intervalu. Příklady spojitých náhodných veličin: rozměry sériově vyráběných výrobků, hektarový výnos nějaké zemědělské plodiny, výsledky různých fyzikálních a chemických měření apod. Pravděpodobnostní chování spojité náhodné veličiny popisujeme hustotou pravděpodobnosti φ(x), což je zidealizovaný protějšek hustoty četnosti f(x) zavedené v popisné statistice v souvislosti s intervalovým rozložením četností. S rostoucím rozsahem výběrového souboru a klesajícími šířkami třídicích intervalů se budou hodnoty hustoty četnosti ustalovat kolem hodnot hustoty pravděpodobnosti. Vlastnosti hustoty četnosti se přenášejí i na hustotu pravděpodobnosti, tedy hustota pravděpodobnosti je nezáporná ( ) 0x:Rx ≥ϕ∈∀ , je normovaná ( )∫ ∞ ∞− =ϕ 1dxx , s distribuční funkcí je spjata integrálním vztahem ( ) ( )∫ ∞− ϕ=Φ∈∀ x dttx:Rx . Pozor – na rozdíl od pravděpodobnostní funkce diskrétní náhodné veličiny nemá hustota pravděpodobnosti spojité náhodné veličiny význam pravděpodobnosti! Její význam lze odvodit z integrálního vztahu mezi distribuční funkcí a hustotou pravděpodobnosti. Pravděpodobnost, že náhodná veličina se bude realizovat v intervalu (x, x+h], je: ( ) ( ) ( ) ( ) ( ) ( )∫∫∫ + ∞− + ∞− ϕ=ϕ−ϕ=Φ−+Φ=+≤< hx x xhx dttdttdttxhxhxXxP Bude-li h dostatečně malé číslo, lze plochu pod grafem hustoty nahradit obsahem obdélníka o stranách φ(x) a h, tj. ( ) ( ) hxhxXxP ⋅ϕ≈+≤< Ilustrace vztahu mezi hustotou četnosti a hustotou pravděpodobnosti Náhodně vybereme n sériově vyráběných součástek, změříme jejich délku a budeme se zajímat o hustotu četnosti odchylek těchto měření od deklarované délky součástky. n = 40, r = 4 x f(x) n = 400, r = 8 x f(x) n → ∞, r → ∞ x fi(x) Spojitý náhodný vektor Jestliže všechny složky náhodného vektoru (X1, …, Xn) jsou spojité náhodné veličiny, hovoříme o spojitém náhodném vektoru. Jeho pravděpodobnostní chování je popsáno simultánní hustotou pravděpodobnosti φ(x1, …, xn). Hustota pravděpodobnosti libovolného spojitého marginálního náhodného vektoru se nazývá marginální hustota pravděpodobnosti. Největší význam mají jednorozměrné marginální hustoty pravděpodobnosti φ1(x1), …, φn(xn) jednotlivých složek náhodného vektoru. Získáme je tak, že simultánní hustotu pravděpodobnosti integrujeme přes všech n-1 přebývajících proměnných. Stochasticky nezávislé náhodné veličiny Při provedení pokusu se může stát, že se realizace jedné náhodné veličiny Y dají jednoznačně určit ze známé realizace druhé náhodné veličiny X, tedy je mezi nimi funkční vztah Y = g(X). Takové náhodné veličiny se nazývají deterministicky závislé. Jejich protipólem jsou náhodné veličiny stochasticky nezávislé: informace o realizaci jedné z nich nijak nemění šance, s nimiž při témž pokusu očekáváme realizaci druhé. Např. náhodný pokus spočívá v hodu dvěma kostkami. Náhodná veličina X udává počet ok, která padla na 1. kostce a náhodná veličina Y udává počet ok, která padla na druhé kostce. Náhodné veličiny X, Y jsou stochasticky nezávislé. Stochastickou nezávislost náhodných veličin zavádíme na základě analogie s četnostní nezávislostí znaků v daném výběrovém souboru, která se používá v popisné statistice. Musí platit multiplikativní vztah: ( ) ( ) ( ) ( )ypxpy,xp:Ry,x 21 2 =∈∀ pro bodové rozložení četností, ( ) ( ) ( ) ( )yfxfy,xf:Ry,x 21 2 =∈∀ pro intervalové rozložení četností. V počtu pravděpodobnosti nahradíme četnostní funkci pravděpodobnostní funkcí resp. hustotu četnosti nahradíme hustotou pravděpodobnosti. Místo dvou náhodných veličin X, Y můžeme uvažovat n náhodných veličin: Náhodné veličiny X1, …, Xn jsou stochasticky nezávislé, když platí: ( ) ( ) ( ) ( )nn11n1 n n1 xxx,,x:Rx,,x π⋅⋅π=π∈∀ KKK v diskrétním případě, ( ) ( ) ( ) ( )nn11n1 n n1 xxx,,x:Rx,,x ϕ⋅⋅ϕ=ϕ∈∀ KKK ve spojitém případě, ( ) ( ) ( ) ( )nn11n1 n n1 xxx,,x:Rx,,x Φ⋅⋅Φ=Φ∈∀ KKK v obecném případě. Alternativní a binomické rozložení, normální rozložení a rozložení z něj odvozená Označení Známe-li distribuční funkci Φ(x) náhodné veličiny X (resp. pravděpodobnostní funkci π(x) v diskrétním případě resp. hustotu pravděpodobnosti φ(x) ve spojitém případě), pak řekneme, že známe rozložení pravděpodobností (zkráceně rozložení) náhodné veličiny X. Toto rozložení závisí na nějakém parametru ϑ , což nejčastěji je reálné číslo nebo reálný vektor. Zápis X ~ L(ϑ ) čteme: náhodná veličina X má rozložení L s parametrem ϑ. Alternativní rozložení: Náhodná veličina X udává počet úspěchů v jednom pokusu, přičemž pravděpodobnost úspěchu je ϑ . Píšeme X ~ A(ϑ ). π(x) =      =ϑ =ϑ− jinak0 1xpro 0xpro1 neboli π(x) = ( )    =ϑ−ϑ − jinak0 10,xpro1 x1x Binomické rozložení: Náhodná veličina X udává počet úspěchů v posloupnosti n nezávislých opakovaných pokusů, přičemž pravděpodobnost úspěchu je v každém pokusu ϑ . Píšeme X ~ Bi(n,ϑ). π(x) =      =ϑ−ϑ      − jinak0 n,0,xpro)1( x n xnx K (Alternativní rozložení je speciálním případem binomického rozložení pro n = 1. Jsou-li X1, ..., Xn stochasticky nezávislé náhodné veličiny, Xi ~ A(ϑ), i = 1, ..., n, pak X = ∑ = n 1i iX ~ Bi(n, ϑ).) Příklad na binomické rozložení pravděpodobností: V rodině je 10 dětí. Za předpokladu, že chlapci i dívky se rodí s pravděpodobností 0,5 a pohlaví se formuje nezávisle na sobě, určete pravděpodobnost, že v této rodině je a) právě 5 chlapců b) nejméně 3 a nejvýše 8 chlapců. Řešení: X … počet chlapců, X ~ Bi(10; 0,5) ad a) ( ) ( ) ( ) 2461,05,015,0 2 10 55XP 5105 =−      =π== − V systému STATISTICA: =Binom(5;0,5;10) ad b) ( ) ( ) ( ) ( ) 9346,05,05,0 8 10 5,05,0 4 10 5,05,0 3 10 8438X3P 286473 =      ++      +      =π++π+π=≤≤ KK V systému STATISTICA: = IBinom(8;0,5;10) - IBinom(2;0,5;10) = 0,934570 Normální rozložení: Tato náhodná veličina vzniká např. tak, že ke konstantě µ se přičítá velké množství nezávislých náhodných vlivů mírně kolísajících kolem nuly. Proměnlivost těchto vlivů je vyjádřena konstantou σ > 0. Píšeme X ~ N(µ, σ2 ), hustota φ(x) = 2 2 2 )-x( e 2 1 σ µ − πσ . Grafem této hustoty je tzv. Gaussova křivka. Ilustrace vzniku normálního rozložení pomocí Galtonovy desky: Deska obsahuje n řad pravidelně uspořádaných klínů, a to tak, že v k-té řadě je právě k klínů. Do otvoru nahoře padají kuličky, které jsou v každé řadě se stejnou pravděpodobností 1/2 vychylovány vlevo nebo vpravo. Pod poslední řadou je n - 1 přihrádek, ve kterých se kuličky shromaždují. Nasypeme-li do tohoto systému velké množství kuliček, vytvoří v přihrádkách jakýsi ”kopec”, jehož tvar je velmi podobný tvaru grafu hustoty náhodné veličiny s normálním rozložením. Náhodné vychylování kuliček jednotlivými řadami překážek je možno chápat jako speciální případ velkého množství chybových faktorů, náhodně působících na nějaký proces, jako působení mnoha blíže nespecifikovatelných vlivů, které ovlivňují zcela náhodně rozložení jeho výsledku. Obrázek Standardizované normální rozložení: Pro µ = 0, σ2 = 1 se jedná o standardizované normální rozložení, píšeme U ~ N(0, 1). Hustota pravděpodobnosti má v tomto případě tvar φ(u) = 2 u2 e 2 1 − π . Φ(u) = dte 2 1 2 tu 2 − ∞− ∫ π je tabelována pro u ≥ 0, pro u < 0 se používá přepočtový vzorec Φ(-u) = 1 - Φ(u). Příklad na normální rozložení: Výsledky u přijímacích zkoušek na jistou VŠ jsou normálně rozloženy s parametry µ = 550 bodů, σ = 100 bodů. S jakou pravděpodobností bude mít náhodně vybraný uchazeč aspoň 600 bodů? Řešení: X – výsledek náhodně vybraného uchazeče, X ~ N(550, 1002 ), P(X ≥ 600) = 1 – P(X ≤ 600) + P(X = 600) = 1 – P(X ≤ 600) = =1 – P       σ µ− ≤ σ µ− 600X = 1 - P       − ≤ 100 550600 U = 1 – Φ(0,5) = 1 – 0,69146 = 0,30854. Ve STATISTICE: výpočet pomocí funkce 1 - INormal(600;550;100) Náhodně vybraný uchazeč bude mít u zkoušek aspoň 600 bodů s pravděpodobností 0,31. Některé vlastnosti normálního rozložení: Jestliže X ~ ( )2 ,N σµ , pak σ µ− = X U ~ ( )1,0N . Jestliže X ~ ( )2 ,N σµ , a bXaY += , pak Y ~ ( )22 b,baN σµ+ . Jestliže n1 X,,X K jsou stochasticky nezávislé náhodné veličiny, iX ~ ( )2 ii ,N σµ , n,,1i K= , ∑= = n 1i iXY , pak Y ~       σµ ∑∑ == n 1i 2 i n 1i i ,N . Význam normálního rozložení: Normální rozložení hraje ústřední roli v počtu pravděpodobnosti i matematické statistice. Jeho význam spočívá jednak v tom, že normálním rozložením se řídí pravděpodobnostní chování mnoha náhodných veličin a jednak v tom, že za určitých podmínek konverguje k normálnímu rozložení součet nezávislých náhodných veličin s týmž rozložením (viz centrální limitní věta). Dvourozměrné normální rozložení:       2 1 X X ~ N2                 σσρσ σρσσ       µ µ 2 221 21 2 1 2 1 , Náhodný vektor       2 1 X X vzniká ve dvourozměrných situacích podobně jako skalární náhodná veličina v bodě (e). 2 )x,x(q 2 21 21 21 e 1 1 )x,x( − ρ−σσ =ϕ , kde               σ µ− + σ µ− ⋅ σ µ− ⋅ρ−      σ µ− ρ− = 2 2 22 2 22 1 11 2 1 11 221 xxx 2 x 1 1 )x,x(q . Pro µ1 = 0, µ2 = 0, σ1 2 = 1, σ2 2 = 1, ρ = 0 se jedná o standardizované dvourozměrné normální rozložení. Vrstevnice a graf hustoty standardizovaného dvourozměrného normálního rozložení Vrstevnice a graf hustoty dvourozměrného normálního rozložení s parametry µ1 = 0, µ2 = 0, σ1 2 = 1, σ2 2 = 1, ρ = -0,75 Upozornění: Následující tři rozložení – Pearsonovo, Studentovo a FisherovoSnedecorovo – jsou odvozena ze standardizovaného normálního rozložení. Mají velký význam především v matematické statistice při konstrukci intervalů spolehlivosti a testování hypotéz. Vyjádření hustot těchto rozložení neuvádíme, je příliš složité Pearsonovo rozložení chí-kvadrát s n stupni volnosti: Nechť X1, ..., Xn jsou stochasticky nezávislé náhodné veličiny, Xi ~ N(0, 1), i = 1, ..., n. Pak náhodná veličina X = X1 2 + ... + Xn 2 ~ χ2 (n). 0 5 10 15 20 25 30 35 40 -0,02 0,00 0,02 0,04 0,06 0,08 0,10 0,12 0,14 0,16 0,18 0,20 0,22 0,24 0,26 n=3 n=8 n=20 Studentovo rozložení s n stupni volnosti: Nechť X1, X2 jsou stochasticky nezávislé náhodné veličiny, X1 ~ N(0, 1), X2 ~ χ2 (n). Pak náhodná veličina X = n X X 2 1 ~ t(n). -3 -2 -1 0 1 2 3 xt -0,05 0,00 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 n=1 n=5 n=30 Fisherovo-Snedecorovo rozložení s n1 a n2 stupni volnosti: Nechť X1, ..., Xn jsou stochasticky nezávislé náhodné veličiny, Xi ~ χ2 (ni), i = 1, 2. Pak náhodná veličina X = 22 11 n/X n/X ~ F(n1, n2). 0 1 2 3 4 5 -0,2 0,0 0,2 0,4 0,6 0,8 1,0 n1=3, n2=4 n1=8, n2=12 n1=15, n2=25 Číselné charakteristiky náhodných veličin Motivace Doposud jsme poznali funkcionální charakteristiky náhodných veličin (např. distribuční funkce, pravděpodobnostní funkce, hustota pravděpodobnosti), které plně popisují pravděpodobnostní chování náhodné veličiny. Číselné charakteristiky vystihují pouze některé rysy tohoto chování, např. popisují polohu realizací náhodné veličiny na číselné ose či jejich proměnlivost (variabilitu). Jsou jednodušší než číselné charakteristiky, ale nesou jen částečnou informaci. Podobně jako v popisné statistice volíme vhodnou číselnou charakteristiku podle toho, jakého typu je daná náhodná veličina - zda je ordinální nebo intervalová či poměrová. Číselné charakteristiky znaků mají své teoretické protějšky v číselných charakteristikách náhodných veličin. Číselné charakteristiky spojité náhodné veličiny aspoň ordinálního typu Charakteristika polohy : α-kvantil Nechť X je spojitá náhodná veličina aspoň ordinálního typu s distribuční funkcí Φ(x) a hustotou pravděpodobnosti φ(x). Nechť α ∈(0, 1). Číslo Kα(X), které splňuje podmínku α = Φ(Kα(X)) = ∫ α ∞− ϕ )X(K dx)x( , se nazývá α-kvantil náhodné veličiny X. K0,50(X) - medián, K0,25(X) - dolní kvartil, K0,75(X) - horní kvartil, K0,10(X), ..., K0,90(X) - 1. až 9. decil, K0,01(X), ..., K0,99(X) - 1. až 99. percentil. Kterýkoliv α-kvantil je charakteristikou polohy číselných realizací náhodné veličiny na číselné ose. Charakteristika variability: kvartilová odchylka q = K0,75(X) - K0,25(X). Ilustrace Označení pro kvantily speciálních rozložení X ~ N(0, 1) ⇒ Kα(X) = uα, X ~ χ2 (n) ⇒ Kα(X) = χ2 α(n), X ~ t(n) ⇒ Kα(X) = tα(n), X ~ F(n1, n2) ⇒ Kα(X) = Fα(n1, n2). Tyto kvantily najdeme ve statistických tabulkách. Používáme vztahy: uα = - u1-α, tα(n) = - t1-α(n), Fα(n1, n2) = )n,n(F 1 121 α− . Význam kvantilu u0,25 = -0,6745 Význam kvantilu χ2 0,95(8) = 15,5073 Význam kvantilu t0,90(5) = 1,4759 Význam kvantilu F0,05(3,7) = ( ) 1125,0 8867,8 1 3,7F 1 95,0 == Příklad: Nechť U ~ N(0, 1). Pomocí systému STATISTICA najděte 2. decil a první a poslední percentil. První možnost: Použijeme Pravděpodobnostní kalkulátor. Do okénka průměr napíšeme 0, do okénka Sm. Odch. napíšeme 1, do okénka p napíšeme pro 2. decil 0,2, pro první percentil 0,01 a pro poslední percentil 0,99. V okénku X se objeví -0,841621 pro 2. decil, -2,326348 pro první percentil a 2,326348 pro poslední percentil. Ilustrace pro poslední percentil: Šedá plocha pod grafem hustoty má velikost 0,99 a hodnota distribuční funkce v bodě 2,326348 je 0,99 (značeno šrafovaně). Druhá možnost: Otevřeme nový datový soubor o třech proměnné a jednom případu. Do dlouhého jména první proměnné napíšeme =VNormal(0,2;0;1). Dostaneme -0,841621. Do dlouhého jména druhé proměnné napíšeme =VNormal(0,01;0;1). Dostaneme -2,326348. Do dlouhého jména třetí proměnné napíšeme =VNormal(0,99;0;1). Dostaneme 2,326348. Příklad: Nechť X ~ N(-1, 4). Pomocí systému STATISTICA najděte horní kvartil. První možnost: Spustíme Pravděpodobnostní kalkulátor, vybereme Rozdělení Normální. Do okénka průměr napíšeme -1, do okénka Sm. Odch. napíšeme 2, do okénka p napíšeme 0,75 a v okénku X se objeví 0,34898. Druhá možnost: Otevřeme nový datový soubor o jedné proměnné a jednom případu. Do dlouhého jména této proměnné napíšeme =VNormal(0,75;-1;2). Dostaneme 0,34898. Příklad: Pomocí systému STATISTICA určete χ2 0,05(5). První možnost: Spustíme Pravděpodobnostní kalkulátor, vybereme Rozdělení Chi 2. Do okénka sv. napíšeme 5 a do okénka p napíšeme 0,05. V okénku Chi 2 se objeví 1,145476. Druhá možnost: Otevřeme nový datový soubor o jedné proměnné a jednom případu. Do dlouhého jména této proměnné napíšeme =VChi2(0,05;5). Dostaneme 1,145476. Příklad: Pomocí systému STATISTICA určete t0,975(18) a t0,01(4). První možnost: Spustíme Pravděpodobnostní kalkulátor, vybereme Rozdělení t (Studentovo). Do okénka sv. napíšeme 18 (resp. 4) a do okénka p napíšeme 0,975 (resp. 0,01). V okénku t se objeví 2,100922 (resp. -3,746947). Druhá možnost: Otevřeme nový datový soubor o jedné proměnné a jednom případu. Do Dlouhého jména této proměnné napíšeme =VStudent(0,975;18) (resp. VStudent(0,01;4)). Dostaneme 2,100922 (resp. -3,746947). Příklad: Pomocí systému STATISTICA určete F0,975(3, 12) a F0,05(18, 20). První možnost: Spustíme Pravděpodobnostní kalkulátor, vybereme Rozdělení F (Fisherovo). Do okénka sv1 napíšeme 3 (resp. 18), do okénka sv2 napíšeme 12 (resp. 20) a do okénka p napíšeme 0,975 (resp. 0,05). V okénku F se objeví 4,474185 (resp. 0,456486). Druhá možnost: Otevřeme nový datový soubor o jedné proměnné a dvou případech Do Dlouhého jména první proměnné napíšeme =VF(0,975;3;12), do Dlouhého jména druhé proměnné napíšeme =VF(0,05;18;20).Dostaneme 4,474185 (resp. 0,456486). Číselné charakteristiky diskrétních a spojitých náhodných veličin aspoň intervalového typu Charakteristika polohy: střední hodnota E(X) – číslo, které charakterizuje polohu realizací náhodné veličiny na číselné ose s přihlédnutím k jejich pravděpodobnostem. Diskrétní případ: náhodná veličina X má pravděpodobnostní funkci π(x). Střední hodnota ( ) ( )∑ ∞ −∞= π= x xxXE , pokud je suma vpravo konečná. Fyzikální význam: střední hodnota je těžiště soustavy hmotných bodů, jejichž celková hmotnost je 1 a bod o souřadnici x má hmotnost π(x). Spojitý případ: náhodná veličina X má hustotu pravděpodobnosti φ(x). Střední hodnota ( ) ( )∫ ∞ ∞− ϕ= dxxxXE , pokud je integrál vpravo konečný. Fyzikální význam: střední hodnota je těžiště hmotné přímky, jejíž celková hmotnost je 1 a hmota je na přímce rozprostřena podle předpisu φ (x). Centrovaná náhodná veličina: Y = X - E(X). (Pro náhodnou veličinu Y platí: E(Y) = 0.) Střední hodnota transformované náhodné veličiny Y = g(X) ( ) ( ) ( ) ( ) ( )∫ ∑ ∞ ∞ ∞ −∞= ϕ π = - x dxxxg xxg YE Střední hodnota transformované náhodné veličiny Y = g(X1, X2) ( ) ( ) ( ) ( ) ( )∫ ∫ ∑ ∑ ∞ ∞− ∞ ∞− ∞ −∞= ∞ −∞= ϕ π = 212121 x x 2121 dxdxx,xx,xg x,xx,xg YE 1 2 Charakteristika variability: rozptyl D(X) - číslo, které charakterizuje proměnlivost realizací náhodné veličiny kolem její střední hodnoty s přihlédnutím k jejich pravděpodobnostem. Definiční vzorec: ( ) ( )[ ]( )2 XEXEXD −= (rozptyl je střední hodnota kvadrátu centrované náhodné veličiny). Výpočetní vzorec: ( ) ( ) ( )[ ]22 XEXEXD −= (rozptyl je střední hodnota kvadrátu mínus kvadrát středních hodnot). ( ) ( ) ( ) ( ) ( ) 2 -- 2 2 xx 2 dxxxdxxx xx-xx XD       ϕ−ϕ       ππ = ∫∫ ∑∑ ∞ ∞ ∞ ∞ ∞ −∞= ∞ −∞= Směrodatná odchylka ( )XD - vyjadřuje průměrnou variabilitu realizací náhodné veličiny X kolem její střední hodnoty. Standardizovaná náhodná veličina: ( ) ( )XD XEX Z − = (Pro náhodnou veličinu Z platí: E(Z) = 0, D(Z) = 1.) Příklad na výpočet střední hodnoty a rozptylu diskrétní náhodné veličiny: Střelec střílí do terče až do prvního zásahu. Má v zásobě 4 náboje. Pravděpodobnost zásahu je při každém výstřelu 0,6. Náhodná veličina X udává počet nespotřebovaných nábojů. Vypočtěte střední hodnotu a rozptyl náhodné veličiny X. Řešení: X nabývá hodnot 0, 1, 2, 3 a její pravděpodobnostní funkce je π(0) = P(X=0) = 0,44 + 0,43 *0,6 = 0,064, π(1) = P(X=1) = 0,42 *0,6 = 0,096, π(2) = P(X=2) = 0,4*0,6 = 0,24, π(3) = P(X=3) = 0,6, π(0) = 0 jinak E(X) = 0*0,064 + 1*0,096 + 2*0,24 + 3*0,6 = 2,376 D(X) = 02 *0,064 + 12 *0,096 + 22 *0,24 + 32 *0,6 – 2,3762 = 0,8106 Kovariancí náhodných veličin X1, X2, které mají střední hodnoty E(X1), E(X2), rozumíme číslo C(X1, X2) = E([X1 - E(X1)] [X2 - E(X2)]) (pokud střední hodnoty vpravo existují). (Kovariance je číslo, které charakterizuje proměnlivost realizací náhodných veličin X1, X2 kolem jejich středních hodnot s přihlédnutím k jejich pravděpodobnostem. Je-li kovariance kladná (záporná), pak to svědčí o existenci jistého stupně přímé (nepřímé) lineární závislosti mezi realizacemi náhodných veličin X1, X2. Je-li kovariance nulová, pak říkáme, že náhodné veličiny X1, X2 jsou nekorelované a znamená to, že mezi jejich realizacemi není žádný lineární vztah. Pozor – z nekorelovanosti nevyplývá stochastická nezávislost, zatímco ze stochastické nezávislosti plyne nekorelovanost. Kovariance je teoretickým protějškem vážené kovariance. Je vhodnější počítat kovarianci podle vzorce ( ) ( ) ( ) ( )212121 XEXEXXEX,XC −= .) Koeficientem korelace náhodných veličin X1, X2 rozumíme číslo R(X1, X2) = jinak0 0)X(D)D(Xpro )X(D )X(EX )X(D )X(EX E 21 2 22 1 11      >        − ⋅ − , pokud střední hodnoty vpravo existují. (Koeficient korelace je číslo, které charakterizuje těsnost lineární závislosti realizací náhodných veličin X1, X2. Čím bližší je 1, tím těsnější je přímá lineární závislost, čím bližší je -1, tím těsnější je nepřímá lineární závislost. Je vhodnější počítat koeficient korelace podle vzorce ( ) ( ) ( ) ( )21 21 21 XDXD X,XC X,XR = .) V diskrétním případě je kovariance dána vzorcem ( ) ( )[ ] ( )[ ] ( ) ( ) ( ) ( )21 x x 2121 x x 21221121 XEXEx,xxx x,xXExXExX,XC 1 2 1 2 ∑ ∑ ∑ ∑ ∞ −∞= ∞ −∞= ∞ −∞= ∞ −∞= −π= =π−⋅−= a ve spojitém případě vzorcem ( ) ( )[ ] ( )[ ] ( ) ( )21212121 2121121121 XEXEdxdx)x,x(xx dxdx)x,x(XExXExX,XC −ϕ= =ϕ−⋅−= ∫ ∫ ∫ ∫ ∞ ∞− ∞ ∞− ∞ ∞− ∞ ∞− Příklad na výpočet koeficientu korelace: Diskrétní náhodný vektor (X1, X2) má simultánní pravděpodobnostní funkci s hodnotami: π(0,-1) = c, π(0,0) = π(0,1) = π(1,-1) = π(2,-1) = 0, π(1,0) = π(0,1) = π(2,1) = 2c, π(2,0) = 3c, π(x1,x2) = 0 jinak. Určete konstantu c a vypočtěte R(X1, X2). Řešení: Hodnoty simultánní pravděpodobnostní funkce a obou marginálních pravděpodobnostních funkcí uspořádáme do kontingenční tabulky. x2x1 -1 0 1 π1(x1) 0 c 0 0 c 1 0 2c 2c 4c 2 0 3c 2c 5c π2(x2) c 5c 4c 1 Z normovanosti pravděpodobnostní funkce diskrétního náhodného vektoru dostáváme: 10 c = 1, tedy c = 0,1. Po dosazení za c vznikne tabulka: x2x1 -1 0 1 π1(x1) 0 0,1 0 0 0,1 1 0 0,2 0,2 0,4 2 0 0,3 0,2 0,5 π2(x2) 0,1 0,5 0,4 1 ( ) 1,42.0,51.0,40.0,1)x(xXE 2 0x 1111 1 =++=π= ∑= , ( ) 0,31.0,40.0,51.0,1)x(xXE 1 1x 2222 2 =++=π= ∑−= ( ) ( )[ ] 44,04,15,024,01XE)x(xXD 2222 1 2 0x 11 2 11 1 =−⋅+⋅=−π= ∑= , ( ) ( )[ ] ( ) 41,03,04,011,01XE)x(xXD 2222 2 1 1x 22 2 22 1 =−⋅+⋅−=−π= ∑−= ( ) ( ) ( ) ( ) 18,03,04,12,0122,011XEXEx,xxxX,XC 21 2 0x 1 1x 212121 1 2 =⋅−⋅⋅+⋅⋅=−π= ∑ ∑−= −= ( ) ( ) ( ) ( ) 42,0 41,044,0 18,0 XDXD X,XC X,XR 21 21 21 === Střední hodnoty a rozptyly vybraných diskrétních a spojitých rozložení X ~ A(ϑ ) ⇒ E(X) = ϑ , D(X) = ϑ (1-ϑ ) X ~ Bi(n, ϑ ) ⇒ E(X) = nϑ , D(X) = nϑ (1-ϑ ) X ~ N(µ, σ2 ) ⇒ E(X) = µ, D(X) = σ2 X ~ ( )n2 χ ⇒ ( ) nXE = , ( ) n2XD = X ~ ( )nt ⇒ ( ) 0XE = pro 2n ≥ (pro 1n = střední hodnota neexistuje) , ( ) 2n n XD − = pro 3n ≥ (pro 2,1n = rozptyl neexistuje). X ~ ( )21 n,nF ⇒ ( ) 2n n XE 2 2 − = pro 3n2 ≥ (pro 2,1n2 = střední hodnota neexistuje) , ( ) ( ) ( ) ( )4n2nn 2nnn2 XD 2 2 21 21 2 2 −− −+ = pro 5n2 ≥ (pro 4,3,2,1n2 = rozptyl neexistuje). Centrální limitní věta: Jsou-li náhodné veličiny X1, …, Xn stochasticky nezávislé a všechny mají stejné rozložení se střední hodnotou µ a rozptylem σ2 , pak pro velká n (n ≥ 30) lze rozložení součtu ∑= n 1i iX aproximovat normálním rozložením N(nµ, nσ2 ). Zkráceně píšeme ( )2 n 1i i n,nNX σµ≈∑= . Pokud součet ∑= n 1i iX standardizujeme, tj. vytvoříme náhodnou veličinu n nX U n 1i i n σ µ− = ∑= , pak rozložení této náhodné veličiny lze aproximovat standardizovaným normálním rozložením. Zkráceně píšeme Un ≈ N(0,1) Normální rozložení je tedy rozložením limitním, k němuž se blíží všechna rozložení, proto hraje velmi důležitou roli v počtu pravděpodobnosti a matematické statistice. Ilustrace centrální limitní věty – opakované hody kostkou