Statistika 4.1 Základní pojmy - statistická jednotka, statistický soubor a znak Statistika se zabývá shromažďováním a vyhodnocováním údajů získaných na dostatečně velkém souboru objektů. Těmito „objekty" mohou být nejrůznější lidské výrobky (šroubky, auta, počítače, ...), předměty živé i neživé přírody kolem nás (zemina, stromy, ryby, zvěř,...), ale i lidé (obyvatelé určitého města, klienti určité banky,....). Základní úlohou statistiky je ze zjištěných údajů získat přehledný obraz o celku, ze kterého soubor pochází, a pokusit se popsat zákonitosti, kterými se tento celek řídí. Statisticky soubor je souhrn objektu, které statisticky zkoumáme, od kterých máme k dispozici údaje o jejich určité vlastnosti nebo jevu. Tato vlastnost nebojev je tzv. statisticky znak. Jednotlivé prvky statistického souboru jsou statistické jednotky, jejich počet udává tzv. rozsah souboru. Zkoumáme přesnost soustruhu vyrábějícího matice. Co bude pro nás statistickým souborem, statistickou jednotkou a zkoumaným znakem? ŘEŠENÍ: Statistický soubor bude množina matic vysoustružených testovaným strojem, u kterých provedeme přeměření. Jednotkami j sou jednotlivé matice z tohoto souboru. Zkoumaný statistický znak může být např. vnitřní průměr závitu. V rámci předvolebního průzkumu si u skupiny respondentů zaznamenáváme pohlaví, ptáme se na věk, vzdělání a preferovanou politickou stranu. Co je zde statistickým souborem, statistickou jednotkou a zkoumaným znakem? ŘEŠENÍ: Statistický soubor je skupina lidí (respondentů), od kterých získáme potřebné údaje. Statistické jednotky jsou jednotlivé osoby v tomto souboru. Statistické znaky zjišťované u každé jednotky jsou zde čtyři: pohlaví, věk, vzdělání a preferovaná politická strana. 148 Statistika Již jsme uvedli, že /.úkladní statistickou úlohou je získat přehledný obra/, o celku, ze kterého zkoumaný soubor pochází. Na základě údajů z daného souboru chceme činit věrohodné závěry o důležitých vlastnostech tohoto celku. V úloze A je tímto celkem (tzv. základním .souborem) množina úplně všech matic vyrobených zkoumaným soustruhem. Proto zkoumaný statistický soubor bude jen malou podmnožinou tohoto celku. Přesně změřit všechny vyrobené matice by bylo velmi pracné. Přesto bychom rádi na základě dat naměřených na omezeném souboru učinili spolehlivý závěr o kvalitě všech vyrobených matic, např. bychom chtěli odhadnout podíl deléktních matic. V úloze B je základním souborem množina všech voličů v naší republice. Opět není dost dobře možné o každém člověku z tohoto základního souboru zjistit všechny výše uvedené znaky, zkoumaný statistický soubor bude sestávat z množiny několika set (náhodně) vybraných osob. Na základě zjištěných údajů bychom však chtěli odhadnout volební výsledky jednotlivých stran, zjistit, jak závisí preference těchto stran na pohlaví, věku a vzdělání apod. Statistické znaky zkoumané na jednotkách statistického souboru mohou být nejrůz-nější povahy. Z hlediska statistických metod, o kterých budeme v dalších článcích pojednávat, je důležité porozumět následujícímu členění. Statistický znak je kvantitativní, jestliže ho lze vyjádřit číselnou hodnotou. V úloze A je zkoumaným znakem průměr závitu, který je samozřejmě kvantitativní -je vyjádřen číselně, např. v mm. V úloze B je kvantitativním znakem věk respondenta. U kvantitativního znaku musíme znát jednotky, ve kterých je vyjádřen, můžeme jednotlivé statistické jednotky (matice, respondenty, ...) seřadit podle velikosti tohoto znaku, má smysl určovat průměrnou hodnotu tohoto znaku pro celý statistický soubor atd. Statistický znak je kvalitativní, jestliže jeho hodnoty nejsou čísla, ale určité kategorie. V úloze B jsou všechny znaky s výjimkou věku kvalitativní - znak pohlaví má dvě možné hodnoty (muž, žena), znak vzdělání může nabývat několika hodnot (základní, středoškolské, vysokoškolské, jiné), znak preferované strany pak má jako své možné hodnoty názvy všech registrovaných politických stran. U kvalitativních znaků nemůžeme jednotlivé statistické jednotky přirozeně seřadit podle velikosti, nemá smysl počítat např. průměrné pohlaví apod. Cvičeni MB Majitel autobazaru m dělá každý měsíc záznam) o všech prodaných vozech. U každého vozu zaeviduje mimo jiné značku vozu, model, barvu, stáří vozu, po- 4.1 základní pojmy - statistická jednotka, statistický soubor a znak 149 čet najetých kilometrů a počet dnů, po které byl vůz v bazaru od jeho převzetí do prodeje. Které ze zkoumaných znaků jsou kvantitativní a které jsou kvalitativní? U každého vyrobeného přístroje v určité továrně se zaznamenává mimo jiné linka, na které byl přístroj sestaven, celková doba montáže, hmotnost přístroje a ohodnocení kvality přístroje ve škále „1. jakost", „2. jakost", „nevyhovuje". Které ze zkoumaných znaků jsou kvantitativní a které jsou kvalitativní? 4.2 Rozdělení četností a jeho grafické znázornění Budeme se nyní zabývat jedním statistickým znakem a některými, převážně grafickými metodami zpracování jeho naměřených hodnot. Začneme nejjednodušší situací, se kterou se setkáváme zejména (ale nejen) u kvalitativních znaků. Pro tyto znaky je typické, že nabývají zpravidla jen malého počtu různých hodnot, tyto hodnoty se však často opakují. Hlavním účelem těchto metod je data zpřehlednit, ukázat, které hodnoty jsou nejtypičtější, obecně řečeno zobrazit tzv. rozložení dat. Do prvního ročníku vysoké školy bylo přijato 320 studentů středních škol různých typů. Počty studentů jednotlivých typů škol uvádí následující tabulka. Ze získaných údajů sestrojme histogram četností. Vypočítejme relativní četnosti a zobrazme je pomocí kruhového diagramu. Škola Počet studentů Gymnázium 48 Obchodní akademie 20 SOŠ 160 SOU 92 Celkem 320 řešení: Zkoumaným znakem je zde typ střední školy, ze které student pochází. Jde o kvalitativní znak, který může nabývat jen čtyř různých hodnot, jež jsou uvedeny v levém sloupci tabulky. Tyto hodnoty se v daném souboru opakují s četnostmi, které jsou uvedeny v pravém sloupci tabulky. Celé tabulce říkáme tabulka četností. Četností hodnoty znaku rozumíme počet statistických jednotek v daném souboru, pro které nabývá zkoumaný znak této hodnoty. Histogram četností (také se mu říká sloupkový diagram, v angličtině bar chart) je grafickou podobou tabulky četností. Tabulkou četností či histogramem četností je souhrnně vyjádřeno tzv. rozdělení četností. Způsob sestrojení histogramu je zřejmý. Na vodorovnou osu vynášíme jednotlivé hodnoty znaku, nad každou z nich je sestrojen sloupek o výšce odpovídající příslušné 150 4. Statistika četnosti. Pokud bychom měli k dispozici jen tento histogram a ne původní tabulku četností, mohli bychom jednotlivé četnosti zhruba odhadovat pomocí měřítka na svislé ose. 180 v:r:!rTr^- 160 |~ 140 I 120 | 100 80 j 60 j 40 i 20 j i-1 0 i ._ 1-1 — I- Gymnázium Obchodní akademie Obr. 4.1: Histogram četností studentů z jednotlivých typů škol Relativní četnosti jsou podíly (absolutních) četností a rozsahu souboru. V našem případě je rozsah souboru roven 320 a např. relativní četnost studentů gym-48 názia je rovna = 0,15, tj. 15 %. Doplníme nyní snadno tabulku četností o sloupec s relativními četnostmi. Škola Četnost /ij Relativní četnost Gymnázium 48 15,00% Obchodní akademie 20 6,25 % SOŠ 160 50,00 % SOU 92 28,75 % Celkem 320 100,00 % Relativní četnosti se většinou vyjadřují v procentech. Všimněte si, že jejich součet musíbýt roven l,tj. 100%. Kruhový diagram je pak grafickým zobrazením relativních četností. -------------- SOŠ sou 4.2 Rozdělení četností a jeho grafické znázornění 151 M Gymnázium B Obchodní akademie □ SOŠ □ SOU Obr. 4.2: Grafické znázornění relativních četností Kruhový diagram (v angličtiněpie chart, doslovně přeloženo „koláčovýgraf") se zkonstruuje tak, že se kruh rozdělí na výseče, jejichž obsahy jsou úměrné relativním četnostem. Středové úhly jednotlivých výsečí kruhového diagramu získáme vynásobením celkového středového úhlu 360° příslušnými relativními četnostmi - např. středový úhel výseče odpovídající studentům gymnázia je roven 360° 0,15 = 54°. Všimněte si, že z kruhového diagramu nezjistíme původní (absolutní) četnosti, ale můžeme jen vyčíst četnosti relativní. V úloze A jsme se zabývali rozdělením četností u kvalitativního znaku. Stejné metody se dají použít i pro kvantitativní znak, pokud nenabývá příliš velkého počtu různých hodnot - viz následující úloha. V prodejně oděvů prodali během jednoho týdne celkem 46 obleků. Velikosti prodaných obleků jsou uvedeny níže. Zpracujme dané údaje do tabulky četností, vypočtěme též kumulativní četnosti, relativní četnosti a kumulativní relativní četnosti. Sestrojme pro tato data histogram a polygon četností. 39 41 40 42 41 40 42 42 40 43 42 41 43 39 42 41 42 39 41 37 43 41 38 43 42 41 40 41 38 40 40 39 41 40 42 40 41 42 40 43 38 39 41 41 42 45 Řešení: Vidíme, že nejmenší prodaná velikost byla 37, největší45. Pro každou hodnotu od 37 do 45 je třeba určit počet opakování (můžeme si např. čísla 37 až 45 zapsat pod 152 Statistika sebe do sloupce a vedle nich dělat čárky za každý výskyt v souboru). Výsledkem je následující tabulka četností: Velikost obleku Počet prodaných kusů (četnost) 37 1 38 3 39 5 40 9 41 12 42 10 43 5 45 1 Celkem 46 Histogram četností následuje na dalším obrázku. Všimněte si, že před posledním sloupkem je mezera, neboť hodnota 44 v našem souboru chybí (má nulovou četnost). Neudělat tuto mezeru v histogramu by bylo chybou. Zde vyšetřujeme kvantitativní znak, a jeho různé hodnoty je tedy třeba vynášet na vodorovnou osu v měřítku (na rozdíl od úlohy A, kde jsme vyšetřovali kvalitativní znak, a proto žádné měřítko na vodorovné ose nebylo). Obr. 4.3: Histogram četností prodaných obleků Z histogramu (ale samozřejmě i z tabulky četností) vidíme, že nejčastěji prodávaná velikost byla 41, histogram má téměř symetrický tvar. 4.2 Rozdělení četnost! a jeho grafické znázornění 153 Polygon četností (nebo také spojnicový diagram) je graf mající stejný význam jako histogram četností. Pouze místo sloupků zobrazujeme body, jejichž x-ovou souřadnicí je hodnota znaku a y-ovou souřadnicí je četnost. Tyto body se pak spojí lomenou čarou. Všimněte si, že hodnotě 44 s nulovou četností odpovídá bod na ose x. Obr. 4.4: Polygon četností prodaných obleků Stejně jako v předchozí úloze vypočteme relativní četnosti. Kumulativní četnost určité hodnoty kvantitativního znaku je součtem četnosti této hodnoty a četností všech hodnot menších. Např. kumulativní četnost hodnoty 40 je rovna součtu všech prodaných obleků s velikostmi od 37 do 40 včetně, tj. 1+3+5 + 9 = 18. Kumulativní relativní četnosti jsou podíly kumulativních četností a rozsahu souboru. Kumulativní relativní četnost hodnoty 40 je rovna — = 0,391 3, tj. 39,13 %. Tento údaj nám říká, že přibližně 39 % prodaných obleků mělo velikost 40 nebo menší. Všechny tyto druhy četností jsou uvedeny v následující souhrnné tabulce (údaje v procentech jsou zaokrouhleny na dvě desetinná místa). 154 4. Statistika Velikost obleku Četnost Relativní Kumulativní Kumulativní relativní X* m četnost četnost četnost 37 1 2,17 % 1 2,17 % 38 3 6,52 % 4 8,70 % 39 5 10,87 % 9 19,57 % 40 9 19,57 % 18 39,13 % 41 12 26,09 % 30 65,22 % 42 10 21,74 % 40 86,96 % 43 5 10,87 % 45 97,83 % 45 1 2,17 % 46 100,00 % Celkem 46 100,00% — — Všimněte si, že poslední kumulativní četnost je rovna rozsahu souboru, tj. číslu 46, poslední kumulativní relativní četnost logicky musí být rovna 1, tj. 100 %. (Nemá smysl uvádět hodnotu „Celkem" pro poslední dva sloupce tabulky.) Shrneme si nyní teorii, která se vztahuje k předchozím příkladům. Zkoumáme-li určitý znak na souboru o rozsahu n jednotek, pak jednotlivé (ne nutně navzájem různé) hodnoty znaku značímex\, xi, x„. Navzájem různé hodnoty znaku, v případě kvantitativního znaku uspořádané vzestupně podle velikosti, značíme x*, xjj, .... x*, kde rje počet těchto navzájem se lišících hodnot. Musí samozřejmě být r < n. Četnosti hodnot jťj\ x*. .... x* značíme n\. n2, ■ • • • nr. Musí platit n = n\ +ri2 + r H-----hn,-, vyjádřeno tzv. sumační symbolikou: n = ^tij. i=1 Relativní četnost libovolné hodnoty x* vypočteme jako podíl —. Součet všech relativních četností je roven jedné. Pro kvantitativní znak definujeme kumulativní četnost libovolné hodnoty x* jako i «1 +n2 + - •■ + «/, tj. VJny. 7=1 Kumulativní relativní četnost této hodnoty je i Ľ n i nx +»2 + ■••+»/: {. 7=1_ n n Cvičení MM Po volbách v roce 2010 h\ lo 200 křesel v Poslanecké sněmovně ČR rozděleno následovně: 4.2 Rozdělení četností a jeho grafické znázornění 155 ČSSD ODS KSČM TOP 09 VV 56 53 26 41 24 Znázorněte tyto údaje pomocí kruhového diagramu. U 127 zaměstnanců určité firmy byl zjištěn počet jejich rodinných příslušníků. Výsledky jsou shrnuty v tabulce: Počet rodinných příslušníků 1 2 3 4 5 6 7 Počet zaměstnanců 9 19 30 42 23 3 1 Načrtněte polygon četností. KM Získali jsme údaje o zařazení do pracovních tříd a počtu odpracovaných hodin u souboru 75 dělníků v jisté akciové společnosti. Pořad, číslo dělníka Prac. třída Počet odprac, hodin Pořad, číslo dělníka Prac. třída Počet odprac, hodin Pořad, číslo dělníka Prac. třída Počet odprac, hodin 1 5 206 26 7 220 51 5 101 2 6 177 27 5 180 52 4 185 5 6 231 28 6 159 53 4 188 4 6 190 29 4 216 54 4 196 5 6 187 30 6 231 55 5 194 6 5 168 31 5 211- 56 7 187 7 7 200 32 4 169 57 6 178 8 7 194 33 6 192 58 4 194 9 4 124 34 5 238 59 6 160 10 4 218 35 6 256 60 3 191 U 6 219 36 7 204 61 5 139 12 7 197 37 6 211 62 6 158 13 4 162 38 6 161 63 6 228 14 6 210 39 6 140 64 5 165 15 7 191 40 6 213 65 7 212 16 6 170 41 4 171 66 6 218 17 5 208 42 5 212 67 7 181 18 7 198 43 6 201 68 5 196 19 6 215 44 5 246 69 6 209 20 7 172 45 5 184 70 4 183 21 5 187 46 7 160 71 7 176 22 7 180 47 5 210 72 3 216 23 6 170 48 6 213 73 6 172 24 7 163 49 5 202 74 7 196 25 6 196 50 6 198 75 5 180 156 4. Statistika Zpracujte údaje o pracovních třídách dělníků do tabulky četností. Načrtněte histogram četností. Určete též kumulativní, relativní a kumulativní relativní četnosti. Ve všech předchozích příkladech jsme se zabývali rozdělením četností hodnot statistického znaku, které se v daném souboru poměrně často opakovaly. V praxi se však dosti často setkáváme s rozsáhlými soubory dat, kde se hodnoty vůbec neopakují nebo se opakují jen velmi zřídka. I vtákových situacích má smysl hledat rozdělení četností, postupujeme však trochu jinak - data nejprve seskupíme do intervalů, tzv. tříd. Proto mluvíme o tzv. skupinovém (intervalovém) rozdělení četností. Zpracujme údaje o odpracovaných hodinách dělníků z tabulky ve cvičení 3 do tabulky skupinového rozdělení četností. Načrtněme histogram. Určeme též kumulativní, relativní a kumulativní relativní četnosti. ŘEŠENÍ: Data, která máme zpracovat, jsou hodnoty z 3., 6. a 9. sloupce tabulky. Jde sice o celá čísla, ale jednotlivé hodnoty se opakují jen výjimečně (např. dělníci č. 46 a 59 odpracovali 160 hodin), drtivá většina údajů se navzájem liší. Mohli bychom teoreticky sestavit tabulku podobnou tabulce v úloze B, tj. ke každému počtu odpracovaných hodin najít četnost (čili počet dělníků), ale výsledkem by byla tabulka o možná šedesáti, možná sedmdesáti řádcích, která by nám k zpřehlednění dat příliš nepomohla. Místo toho data nejprve rozdělíme do intervalů a pak najdeme četnosti těchto intervalů. Ukážeme obvykle používaný postup: • Nejprve rozhodneme, do kolika intervalů data rozdělíme. Počet těchto intervalů k se doporučuje volit podle tzv. Sturgesova pravidla: k = 1 +3.3 log«, kde n je rozsah souboru. V naší úloze je 1 + 3,31og75 = 7,19, zvolme proto k = l. • V dalším kroku zvolíme šířku jednotlivých intervalů. Intervaly se volí tak, aby byly stejně široké, aby na sebe navazovaly a aby každé číslo ze souboru dat patřilo přesně do jednoho intervalu. Není těžké si rozmyslet, že šířka / jednoho intervalu musí být tudíž větší nebo rovna rozdílu maximální a minimáln í hodnoty počtu odpracovaných . .. , , „ ,o . , max(ř)-min(ř) ,T hodin t v souboru delenému poetem intervalu, tj. I > -. V našem k případě je maximální počet odpracovaných hodin 256, minimální počet je 101, jeden interval tedy musí mít šířku alespoň---h = 22,14 h. Zvolme / = 23 h. • Jednotlivé na sebe navazující intervaly, které obsahují všechna data, zvolíme takto: 100h-122h, 123h-145h, 146h-168h, 238h-260h. Všimněte si, že intervaly na sebe přímo nenavazují, jsou mezi nimi hodinové mezery. Nicméně vzhledem k tomu, že data jsou celá čísla, máme jistotu, že v těchto mezerách nemůže žádná hodnota ze souboru být. Pokud jsou intervaly odděleny mezerami (které ovšem musí mít stejnou šířku), pak do šířky intervalu započítáváme i tuto mezeru. V našem případě je tedy opravdu šířka intervalů v tomto smyslu rovna 23 hodinám. 4.2 Rozdělení četností a jeho grafické znázorněn 157 • V posledním kroku je třeba zjistit, kolik dat je v každém intervalu, tj. četnosti těchto intervalů. Můžeme si napřed jednotlivé intervaly napsat do sloupečku pod sebe, potom procházet soubor s daty a každou hodnotu zaznamenat pomocí čárky vedle intervalu, do kterého patří, a nakonec čárky u každého intervalu sečíst. Nakonec zcela stejně jako v předchozích příkladech najdeme relativní, kumulativní a kumulativní relativní četnosti. Výsledky jsou shrnuty v tabulce: Počet odprac, hodin Četnost Relativní četnost Kumulativní četnost Kumulativní relativní četnost 100-122 1 1,33 % 1 1,33 % 123-145 3 4,00 % 4 5,33 % 146-168 9 12,00% 13 17.33 <7< 169-191 23 30,67 % 36 48,00 % 192-214 26 34,67 % 62 82,67 % 215-237 10 13,33 % 72 96,00 % 238-260 3 4,00 % 75 100,00 % Celkem 75 100,00 % — — Histogram dat je na následujícím obrázku. Můžeme z něj nebo i z tabulky vyčíst mnoho potřebných údajů. Např. vidíme, že nejčastěji se počet odpracovaných hodin pohybuje v rozmezí od 192 do 214. Můžeme si všimnout, že data nejsou symetricky rozložená. Několik výrazně menších hodnot způsobilo, že první tři sloupky zleva jsou nízké (napravo jsou nízké jen dva). V takovém případě říkáme, že data jsou „sešikmená doleva". V naší úloze však není toto sešikmení příliš výrazné. II] il_ 100-122 123-145 146-168 169-191 192-214 215-237 238-260 Počet odpracovaných hodin Obr. 4.5: Rozdělení pracovníků podle počtu odpracovaných hodin 158 4. Statistika Následující údaje shrnují průměrné kupní ceny bytů ve 27 největších městech České republiky v roce 2007. Ceny jsou uvedeny v Kč za m2 plochy bytu. 45 061 29031 25 436 25 078 24 567 22 768 22 425 21794 21 456 20894 20319 20162 19221 18200 17 217 16369 16 343 14 897 14546 14 316 13 829 22 215 22083 17 332 17 327 12 975 12736 Zpracujme údaje do tabulky skupinového rozdělení četností, vypočtěme relativní, kumulativní a kumulativní relativní četnosti. Načrtněme histogram četností a znázorněme relativní četnosti kruhovým diagramem. ŘEŠENÍ: Data, která máme zpracovat, jsou seřazena podle velikosti (první údaj zjevně odpovídá Praze a druhý Brnu). Budeme postupovat podobně jako v úloze C. Opět použijeme Sturgesovo pravidlo: 1 +3,3log27 = 5,72, zvolíme počet -j. • j , • , , . 45061-12736 , tnd k = 6. Sirka jednoho intervalu musí být alespoň---= 5 387,5. Zvolme / = 5400. Jednotlivé intervaly pak můžeme zvolit např. takto: 12700 Kč-18 100 Kč, 18100 Kč-23 500 Kč, 39700 Kč-45 100 Kč. Všimněte si, že jsme mezi zvolenými intervaly tentokrát neponechali žádné mezery. V našem příkladu se totiž ani jedna průměrná kupní cena nerovná některé z krajních hodnot zvolených intervalů, a proto nemohou vzniknout pochybnosti, do kterého intervalu kterou cenu zařadit. Nakonec snadno zjistíme četnosti jednotlivých intervalů a výsledky uspořádáme do přehledné tabulky: Cena Četnost Relativní četnost Kumulativní četnost Kumulativní relativní četnost 12 700-18100 11 40,74 % 11 40,74 % 18 100-23 500 11 40,74 % 22 81,48 % 23 500-28 900 3 11,11 % 25 92,59 % 28 900-34 300 1 3,70 % 26 96,30 % 34300-39700 0 0,00 % 26 96,30 % 39 700-45 100 1 3,70 % 27 100,00 % Celkem 27 100,00 % — — Z tabulky i z uvedeného histogramu (obr. 4.6) vidíme velmi výrazné sešikmení dat, tentokrát doprava. Vysoká průměrná cena bytů v Praze a Brně v porovnání se zbylými městy způsobila, že v pravé části histogramu pozorujeme dva nízké sloupky a sloupek odpovídající předposlednímu intervalu cen dokonce chybí - má nulovou výšku. V levé části histogramu vidíme dva nejvyšší sloupky, reprezentující podstatnou většinu dat. Z posledního sloupce tabulky vyčteme, že 81,5 % cen bytů bylo v rozmezí od 12 700 Kč/m2 do 23 500 Kč/m2. 4.2 Rozdělení četností a jeho grafické znázornění 159 10 8 O S 6 2 0 I-1-1-1-1 ..........-.....- 12700-18100 18100-23500 23500-28900 28900-34300 34300-39700 39700-45100 Cena/Kč -m-2 Obr. 4.6: Ceny bytů ve 27 největších městech ČR v roce 2007 Na dalším obrázku uvádíme kruhový diagram relativních četností. ■ 12700 KČ-18100KČ ■ 18100KČ-23500KČ B23500KČ-28900KČ □ 28900Kč^34300Kč □ 39700 Kč-45100 Kč Obr. 4.7: Rozdělení 27 největších měst ČR podle kupní ceny bytů v roce 2007 160 4. Statistika Shrneme si nyní zásady pro zpracování dat do skupinového (intervalového) rozdělení četností: 1. Počet intervalů, do kterých data rozdělujeme, volíme podle Sturgesova pravidla jako celé číslo k, které je co nejblíže hodnotě 1 +3,3 log n, kde nJe celkový počet dat. , . w. , , v~ , max(f)-mm(í) , , v. ,. , 2. Intervaly volíme stejné siroke o sirce / >---, kde v čitateli zlomku je rozdíl maximální a minimální hodnoty / ze souboru dat. Je vhodné tuto šířku volit jako celé nebo vhodně zaokrouhlené číslo, se kterým se bude dobře počítat. 3. Intervaly volíme tak, aby každá hodnota ze souboru dat patřila právě do jednoho z intervalů. 4. Mezi intervaly mohou být mezery o stejné šířce, ale v těchto mezerách se nesmějí nacházet žádná data. V takovém případě do šířky intervalu započítáváme i jednu mezeru. Mezery mezi intervaly nemusíme dělat, máme-li jistotu, že ani jedna hodnota ze souboru dat není rovna některému z krajních bodů těchto intervalů. 5. V histogramu skupinového rozdělení četností zpravidla neděláme mezery mezi jednotlivými sloupky. Je tomu tak proto, že tyto sloupky reprezentují celé, na sebe navazující intervaly, ne jednotlivé hodnoty. Při rozdělování dat do skupinového rozdělení četností máme určitou libovůli. Při stanovení počtu intervalů není chybou se od Sturgesova pravidla mírně odchýlit, někteří statistici používají pro stanovení k i jiné postupy. Konkrétně v úloze C bychom mohli místo sedmi volit 6,8 nebo i 9 intervalů. Při stanovení šířky / máme „, ,., - , . . ■ , , , max(ŕ)-minO) často několik rozumných mo/nosti,jak hodnotu---zaokrouhlit. Konkrétně v úloze D bychom mohli šířku intervalu místo 5 400 volit 5 388 (trochu nepohodlně na počítání) nebo 5 390. (Hodnota 5 500 by byla od vypočtené hodnoty 5 387,5 již příliš vzdálená.) Konečně při stanovení jednotlivých intervalů můžeme začátek prvního z nich též volit (v úloze D by první interval mohl začínat např. hodnotou 12 710 nebo 12720, popř. i 12730). Musíme však vždy dbát na to, aby minimální hodnota ze souboru dat byla v prvním a maximální hodnota v posledním intervalu. Cvičení | Je dán soubor 20 žáků jedné třídy, u kterých byla změřena výška v cm: 179 184 166 172 189 174 181 185 172 170 171 183 177 176 176 175 179 178 178 180 4.2 rozděle 161 Zpracujte údaje do tabulky skupinového rozdělení četností, vypočtěte kumu- která lativní, relativní a kumulativní relativní četnosti. Načrtněte histogram četností hodn a znázorněte relativní četnosti kruhovým diagramem. Vykazují data výrazné sešikmení? ;\j Na 32 zkušebních vzorcích ocelové výztuže byla měřena pevnost oceli v tahu za ohybu; uvedené číselné hodnoty jsou v MPa: 12,597 13,976 13,779 13,999 12,973 14,197 14,012 13,324 13,532 13,085 13,250 13,065 13,213 13,435 13,425 12,767 13,546 11,811 14,189 12,627 13,476 14,153 14,175 13,315 2. 13,092 14,027 13,280 12,817 12,612 12,600 12,708 13,184 Zpracujte údaje do tabulky skupinového rozdělení četností a načrtněte histogram četností. Vykazují data výrazné sešikmení? 4.3 Charakteristiky polohy V předchozím článku jsme uvedli některé metody, jak popsat určitý kvantitativní statistický znak pomocí přehledných tabulek nebo grafů. Často je však zapotřebí určit čísla, která by co nejlépe charakterizovala jeho průměrnou hodnotu nebo jeho „typickou" hodnotu, popř. jeho „střední" hodnotu. Snažíme se tedy číselně vyjádřit „polohu" znaku na číselné ose. Nejčastěji používanou charakteristikou polohy je aritmetický průměr. Aritmetický průměr hodnot znaku x je součet hodnot znaku zjištěných u všech jednotek souboru dělený počtem všech jednotek souboru. Značíme ho x (čti „x s pruhem") a vypočteme jej podle vzorce: 1 | « x= -(x\ +x2 + ---+x„), i].x=-Y,Xi, n n i=1 kdexi, xi,..., xn jsou všechny zjištěné (ne nutně navzájem různé) hodnoty znaku. U dvanácti přístrojů určitého typu byla zjištěna doba od uvedení do provozu do první poruchy. Získané hodnoty jsou vyjádřeny v celých dnech: 59 72 64 68 2 38 68 42 61 57 84 66 Určeme průměrnou dobu do první poruchy. Řešení: x= — ■ (59+72 + 64 + -•-+66) = — =56,75. Průměrná doba do první poruchy je tedy 56 dnů a 18 hodin. Podíváme-li se znovu na zjištěné hodnoty z úlohy A, můžeme si všimnout, že podstatná většina přístrojů v daném souboru měla dobu do poruchy větší než zjištěný průměr, jenom tři přístroje fungovaly bez poruchy dobu kratší než 56,75 dne. V podobné situaci může být užitečné vedle aritmetického průměru určit též „prostřední hodnotu" znaku, 162 4 Statistika 4.3 C která je překročena právě polovinou naměřených hodnot, zatímco zbývající polovina hodnot je menší. K tomuto účelu nám slouží tzv. medián, jehož definice je následující: Medián znaku x je číslo, které značíme x a vypočteme jej takto: I. Všechny zjištěné (ne nutně navzájem různé) hodnoty znaku X\,X2<....xn uspořádáme podle velikosti, výsledkem je uspořádaný soubor hodnot *(i) <*(2) < ••• <■*(«)• 2. Je-li n liché číslo, pak x = x 3. Je-li n sudé číslo, pak x- Určeme medián doby do první poruchy pro data z úlohy A. Řešení: Uspořádáme-li hodnoty znaku podle velikosti, dostaneme čísla: 2 38 42 57 59 61 64 66 68 68 72 84 Tato čísla reprezentují uspořádaný soubor hodnoty), xq), z definice mediánu, tj. ve smyslu zavedeného označení platí = 2, xq) = 38, x^ = 42 atd. Všimněte si, že hodnota 68 se v původním souboru vyskytla dvakrát a musí se se stejnou četností objevit i v uspořádaném souboru - zde je x@) = x(k» = 68. Počet hodnot v souboru je n = 12, což je sudé číslo, musíme proto použít vzorec pro n sudé z definice mediánu. Snadno zjistíme, že x^ ~x(6) = 61 a x(j>+{j =XU) = ^4> tudíž x= I (61+64) = 62,5. Medián doby do první poruchy je tedy 62,5 dne. Postup hledání mediánu můžeme bez použití vzorců shrnout názorně takto: Hodnoty znaku uspořádáme podle velikosti. Je-li počet hodnot lichý, pak je mediánem prostřední hodnota v uspořádaném souboru. Je-li počet hodnot sudý, pak mediánem rozumíme aritmetický průměr prostředních dvou hodnot. Medián libovolného znaku má vždy následující vlastnost: Alespoň polovina (tj. alespoň 50 %) hodnot tohoto znaku je menší nebo rovna mediánu a současně alespoň polovina hodnot je větší nebo rovna mediánu. Uvažujme znovu zjištěné hodnoty doby do první poruchy z úlohy A. Předpokládejme nyní, že přístroj se zjištěnou dobou do první poruchy 2 dny pochází od jiného výrobce, a proto musí být ze souboru vyloučen. Vypočtěme znovu průměrnou dobu do první poruchy a medián této doby. Řešení: Vyloučíme hodnotu 2 ze souboru a vypočteme ze zbývajících 11 hodnot 4.3 Charakteristiky polohy 163 znovu aritmetický průměr: x = —- = 61,727. Průměrná doba do první poruchy je nyní přibližně 61,727 dne. Uspořádáme-li těchto 11 hodnot znaku podle velikosti, dostaneme čísla: 38 42 57 59 61 64 66 68 68 72 84. Nyní je počet hodnot v souboru n = 11, což je liché číslo, musíme proto použít vzorec pro n liché z definice mediánu: x = x/n+] \ -x^ = 64. Medián doby do první poruchy je nyní 64 dnů. \ 2 J Úloha C ilustruje důležitý rozdíl mezi aritmetickým průměrem a mediánem. Po vynechání extrémně malé hodnoty ze souboru dat se medián změnil jen mírně - z hodnoty 62,5 dne vzrostl na 64 dnů. Naopak aritmetický průměr se změnil podstatněji - z hodnoty 56,75 dne vzrostl na 61,727 dne. Toto pozorování se dá zobecnit: Aritmetický průměr je „citlivý" na odlehlé (tj. velmi malé nebo velmi velké) hodnoty - přidáme-li je nebo odebereme-li je ze souboru, průměr se výrazně změní. Naopak medián takto citlivý není. V úloze A je x = 56,75 < x = 62,5. Je tomu tak proto, že velmi malá hodnota (číslo 2) silně ovlivňuje průměr. I toto pozorování se dá zobecnit: ()bsahuje-li soubor hodnot jednu či více velmi malých hodnot v porovnání s ostatními, pak je aritmetický průměr menší než medián. Obsahuje-li naopak soubor hodnot jednu či více velmi velkých hodnot v porovnání s ostatními, pak je aritmetický průměr větší než medián. Podívejme se nyní, jak se vypočítá aritmetický průměr a medián v případě, kdy jsou hodnoty uspořádány do tabulky četností. Určeme průměrnou velikost prodaných obleků a medián velikosti prodaných obleků pro data z úlohy B předchozího článku. ŘEŠENÍ: Mohli bychom aritmetický průměr vypočítat z původních 46 hodnot ze zadání úlohy jejich sečtením a vydělením číslem 46. To je však zbytečně pracné. Lepší je využít tabulku rozdělení četností, kterou jsme v první části řešení úlohy sestavili. Z této tabulky vidíme, že při hledání součtu všech hodnot musíme číslo 37 započítat jednou, číslo 38 třikrát atd. - tj. každou hodnotu x* stačí vynásobit příslušnou četností«, a získané součiny sečíst. Dostaneme výsledek: 1 1 878 x = — - (37 • 1+38 ■ 3+39 • 5 + - • -+45 • 1) = —— = 40.826. 46 46 Pro nalezení mediánu je třeba nejdříve data seřadit podle velikosti. Jelikož n = 46 je sudé číslo, medián bude průměrem dvou prostředních hodnot v uspořádaném souboru (konkrétně jde o hodnoty x^) a x^a))- Nemusíme však všechny prvky uspořádaného souboru vypisovat. Doplníme si do tabulky četností hodnoty kumulativní četnosti: 164 4. Statistika Velikost obleku x* Četnost ni Kumulativní četnost 37 1 1 38 3 4 39 5 9 40 9 18 41 12 30 42 10 40 43 5 45 45 1 46 Celkem 46 — Vidíme, že kumulativní četnost hodnoty 40 je 18 a kumulativní četnost následující hodnoty 41 je 30. To znamená (dobře si rozmyslete!), že přesně 18 prodaných obleků mělo velikost 40 nebo menší a dalších 30 -18 = 12 prodaných obleků mělo velikost 41 (zbývající obleky pak měly velikost 42 a větší). Tedy hodnoty xq^ ax^4) v uspořádaném souboru musí být obě rovny 41, a tedy x = 41. Všimněte si, že v této úloze jsou hodnoty aritmetického průměru a mediánu téměř stejné. To souvisí s tím, že histogram četností (viz obr. 4.3 v řešení úlohy B minulého článku) nevykazuje výrazné sešikmení. Jsou-li x* < x\ < ■ ■ ■ < x* navzájem různé hodnoty znaku x a n\, ...,nr jsou četnosti těchto hodnot, potom aritmetický průměr hodnot znaku x lze vypočítat 1 r r podle vzorce x = - ^2x* ■«,-, kde n = YJtt; je rozsah souboru. n /=i (=i Vzorce pro medián zůstávají nezměněny. Při hledání prostřední hodnoty, resp. prostředních dvou hodnot v uspořádaném souboru můžeme použít následující obecný postup: Hodnota v uspořádaném souboru, kde k je libovolné přirozené číslo 1 .w„ ',nm w i=\ r kde w - wi Je součet vah. '=1 X, Všimněte si, že vzorec pro vážený průměr se shoduje se vzorcem pro výpočet aritmetického průměru hodnot znaku uspořádaných do tabulky četností. Roli vah wi ve vzorci pro výpočet aritmetického průměru hrají četnosti n{. Definice váženého průměru je však o něco obecnější, v některých aplikacích váhy nemusí nutně být přirozená čísla. Určitá firma má tři pobočky. V následující tabulce je uveden průměrný měsíční příjem zaměstnanců každé pobočky v Kč a počet jejích zaměstnanců. Vypočtěme průměrný měsíční příjem zaměstnanců celé firmy. Pobočka Počet zaměstnanců Průměrný příjem A 7 22 786 B 25 19764 C 18 20468 ŘEŠENÍ: Můžeme postupovat přímo jednoduchou úvahou. Aritmetický průměr hodnot znaku (znakem je zde měsíčnípříjem zaměstnance firmy) je roven součtu všech hodnot znaku dělenému počtem těchto hodnot (tj. počtem všech zaměstnanců). Součet příjmů zaměstnanců pobočky A dostaneme snadno tak, že průměrný příjem v této pobočce vynásobíme počtem jejích zaměstnanců, obdobně tomu je i ve zbývajících pobočkách. Dostaneme tedy výsledek: 22786-7+19764-25 + 20468-18 1022026 x = 20440,52. 7 + 25+18 50 Průměrný měsíční příjem zaměstnanců celé firmy je 20440,52 Kč. Uvědomte si, že výsledný průměrný příjem je roven váženému průměru dílčích průměrných příjmů na jednotlivých pobočkách (tj. hodnot 22786, 19764 a 20468), kde váhy jsou počty zaměstnanců v těchto pobočkách (tj. čísla 7, 25 a 18). Při zkoumání časových řad se někdy používá místo aritmetického průměru tzv. geometrický průměr. 168 4.3 Jsou-li všechna čísla -\. zj. čísel je roven = {/z~- zi -7 , zH kladná, potom geometrický průměr těchto zj.....z.n menší • z.n - (Je-li alespoň jedno z číse nebo rovno nule, geometrický průměr nedefinujeme.) Tento druh průměru se používá zejména tehdy, když jednotlivá čísla zí znamenají průměrná tempa růstu určité veličiny x za jednotlivá časová období. Tj. • z\ - —, kde xo Je počáteční hodnota zkoumané veličiny (na počátku 1. období), x0 x\ je hodnota této veličiny na konci 1. období; • Z2 = —, kde x2 je hodnota této veličiny na konci 2. období; x\ X*K • z3 = —, kde X3 je hodnota této veličiny na konci 3. období atd. x2 Není těžké si uvědomit, že v tomto případě je geometrický průměr čísel z\, 22, • • •, Zn roven I X n X\ X2 X3 x0 X\ X2 ZG = x(6í) = 9, a proto xg5 = 8,35. Cvičení JIH Pro 20 hodnot pH roztoku připraveného k neutralizaci ze cvičení 5 tohoto článku vypočtěte 40 a 60procentní kvantil. Pro hodnoty koeficientu tření ze cvičení 6 tohoto článku vypočtěte dolní a horní kvartil. 4.4 Charakteristiky variability Charakteristiky polohy, o kterých jsme mluvili v předchozím článku, jsou v podstatě určitá reprezentativní čísla, kolem kterých naměřené hodnoty znaku kolísají. Abychom daný statistický soubor popsali podrobněji, nestačí nám pouhá znalost průměru, mediánu atd., potřebujeme též nějak rozumně popsat míru kolísání dat. Ukažme si motivační úlohu. ^™ Uvažujme dvě montážní linky v určité továrně. Následující tabulka uvádí počty smontovaných výrobků na těchto linkách během pěti po sobě jdoucích pracovních dnů: Pondělí Úterý Středa Čtvrtek Pátek Linka A 20 22 19 21 18 Linka B 14 26 18 20 22 Liší se tyto linky z hlediska počtu smontovaných výrobků? ReŠenI: Otázka není zcela jednoznačně formulovaná, pokusíme se přesto o rozumnou odpověď. Vypočítáme-li průměrný počet smontovaných výrobků na lince A ve sledovaném týdnu, dostaneme číslo 20. Stejný je ale i průměrný počet smontovaných výrobků na lince B. Můžeme též snadno zjistit, že i mediány jsou pro tyto dvě linky stejné - též rovny 20. Modus ani v jednom případě neexistuje, můžeme tedy říci, že z hlediska charakteristik polohy mezi linkami není žádný rozdíl. Přesto však při pozornějším pohledu na data rozdíl vidíme. Počet smontovaných výrobků na lince A se pohybuje od 18 do 22, počty na lince B se pohybují mezi 14 a 26. Vidíme, že linka A je „stabilnější", počty smontovaných kusů méně kolísají, říkáme, 174 Statistika že vykazují menší variabilitu. Z praktického hlediska lze říci, že linka A je lepší -velké výkyvy ve výrobě jsou nežádoucí. Pro podrobnější popsání souborů si zavedeme některé důležité charakteristiky variability, což budou čísla charakterizující míru kolísání hodnot statistického znaku. Nejjednodušší možnou takovou charakteristikou je rozpětí: Rozpětím R statistického znaku rozumíme rozdíl maximální a minimální hodnoty tohoto znaku. Matematicky zapsáno: K =\|„,-.vo,, kde X(n) podle již zavedeného označení znamená poslední, tj. maximální hodnotu v uspořádaném výběruax(i) znamená první, tj. minimální hodnotu v uspořádaném výběru. Určeme rozpětí pro počty smontovaných výrobků na montážních linkách z úlohy A. Řešení: Rozpětí pro linku A je RA = 22-18 = 4, rozpětí pro linku B je /?B = 26-14 = = 12. Tento jednoduchý výpočet ukazuje, že variabilita vyjádřená rozpětím je u linky B trojnásobná v porovnání s linkou A. Určeme rozpětí pro dobu do první poruchy přístrojů z úlohy A minulého článku. Řešení: R = 84-2 = 82, tj. rozpětí hodnot je 82 dnů. Úloha C ukazuje jednu z nevýhod rozpětí, jinak velmi jednoduché a názorné charakteristiky. Rozpětí je v této úloze veliké, a to především díky extrémně malé hodnotě 2 v souboru. Kdybychom tuto hodnotu v souboru neměli (viz též úloha C minulého článku), rozpětí by se značně zmenšilo - z 82 na hodnotu 46. Obecněji řečeno, rozpětí je charakteristika závisející pouze na dvou hodnotách souboru - maximu a minimu, ostatní hodnoty nemají na rozpětí žádný vliv. Rozpětí je tudíž citlivé na odlehlé (extrémní) hodnoty v souboru dat. Tuto nevýhodu odstraňuje další používaná charakteristika variability - mezikvartilové rozpětí. Mezikvartilovým rozpětím MKR statistického znaku rozumíme rozdíl horního a dolního kvartilu. Matematicky zapsáno: MKR=x75-X2$. Určeme rozpětí a mezikvartilové rozpětí pro velikosti prodaných obleků z úlohy B článku 4.2. Řešení: Použijeme souhrnnou tabulku odvozenou v řešení citované úlohy: 4.4 Charakteristiky variabilis Velikost obleku A Četnost «/ Relativní četnost Pi Kumulativní četnost Kumulativní relativní četnost 37 1 2,17 % 1 2,17 % 38 3 6,52 % 4 8,70 % 39 5 10,87 % 9 19,57 % 40 9 19,57 % 18 39,13 % 41 12 26,09 % 30 65,22 % 42 10 21,74% 40 86,96 % 43 5 10,87 % 45 97,83 % 45 1 2,17 % 46 100,00 % Celkem 46 100,00 % — — Výpočet rozpětí je triviální: R = 45-37 = 8. K výpočtu mezikvartilového rozpětí potřebujeme nejprve určit kvartily, postupujme již trochu stručněji, kontrolujte detaily výpočtu sami: • Dolní kvartil: r = 11.75, x25 = 40. • Horní kvartil: r = 35,25, x75 = 42. • Mezikvartilové rozpětí: MKR - 2. Cvičení I Pro 20 hodnot pH roztoku připraveného k neutralizaci ze cvičení 5 minulého článku vypočtěte rozpětí a mezikvartilové rozpětí. WM Pro hodnoty koeficientu tření ze cvičení 6 minulého článku vypočtěte rozpěli a mezikvartilové rozpětí. KcM Jak by se změnil) hodnot} rozpěn' a mezikvartilového rozpětí velikostí prodaných obleků z úlohy D, kdybychom ze souboru dat vynechali nejmenší a největší velikost obleku, tj. kdybychom předpokládali, že se obleky o velikostech 37 a 45 neprodávaly? Uvedeme nyní dvě v aplikacích statistiky nejčastěji používané charakteristiky variability, které jsou na rozdíl od rozpětí založené na odchylkách jednotlivých hodnot znaku od aritmetického průměru. Rozptylem statistického znaku rozumíme aritmetický průměr druhých mocnin odchylek jednotlivých hodnot znaku od jejich aritmetického průměru. Značíme jej a°- a vypočteme jej podle vzorce: 1 " n i=\ Směrodatnou odchylkou rozumíme druhou odmocninu z rozptylu, označujeme ji který jsme uvedli v minulém článku. Dostaneme tedy výsledek: x= — ■ 1 878 = 40,826087. 46 Poslední sloupec můžeme použít k výpočtu rozptylu. Jeho součet totiž přesně odpovídá r , sumě (x*) ■ ni z posledního výpočtového tvaru vzorce pro rozptyl. i=l Dostaneme: 0-2 _ L., 76788-40.8260872 = 2,53497, "46 49%- 2 • 2743200 Výsledky pro ženy jsou: _ . 22800 „ x=~mT = n4m - 200 průměr po opravě: x = 114,00-0,05 = 113,95 142 = 720; o-„ = V720 = 26,833; 26,833 v- = 23.55 %. 113,95 Průměrná hodinová mzda mužů u dané firmy je přibližně 122,15 Kč, průměrná hodinová mzda žen je zhruba 113,95Kč. Směrodatné odchylky jsou přibližně rovny 28,69 Kč u mužů a 26,83 Kč u žen. Variační koeficienty jsou pak téměř stejné: asi 23,49 % u mužů a 23,55 % u žen. 190 4. Statistika Cvičení Obchodní podnik roztřídil svých 33 prodejen podle počtu pracovníků. Rozdělení četností je uvedeno v následující tabulce. Vypočtěte přibližně průměrný počet pracovníků připadajících na jednu prodejnu, rozptyl a směrodatnou odchylku tohoto počtu. Počet pracovníků Počet prodejen 1-5 9 6-10 8 11-15 8 16-20 5 21-25 2 26-30 1 Celkem 33 Vypočtěte přibližně průměrný počet odpracovaných hodin a směrodatnou odchylku tohoto počtu pro soubor 75 dělníků ze cvičení 3 článku 4.2. Návod: Použijte k tomuto výpočtu tabulku skupinového rozdělení četností odvozenou v řešení úlohy c citovaného článku. Na určitém místě dálnice byly automatickým zařízením měřeny časové odstupy mezi dvěma po sobě jedoucími vozidly v pravém jízdním pruhu. Výsledné hodnoty (v sekundách) zjištěné během půlhodinového intervalu byly uspořádány do tabulky skupinového rozdělení četností: Časový odstup Počet vozidel 0-0,95 8 1-1,95 87 2-2,95 224 3-3,95 173 4-4,95 54 5-5,95 31 6-6,95 8 7-7,95 1 8 a více 2 Celkem 588 Určete přibližně průměrnou hodnotu časového odstupu, směrodatnou odchylku a variační koeficient časového odstupu. Až dosud jsme se v tomto článku zabývali odhadováním průměru, rozptylu či směrodatné odchylky z tabulky skupinového rozdělení četností. Jak můžeme odhadovat ostatní používané charakteristiky, jako je modus, medián či obecněji kvantily? 4.5 přibližný výpočet charakteristik polohy a variability Uspořádáme-li soubor hodnot do tabulky skupinového rozdělení četností, nemáme již sebemenší možnost z této tabulky zpětně vyčíst, kolikrát se která hodnota v púvodn:: souboru opakovala a jestli vůbec k nějakému opakování došlo. Původní data reprezentovaná takovouto tabulkou jsou často desetinná čísla, která se vůbec neopakují ne: se opakují jen výjimečně, a proto modus původního souboru hodnot zpravidla neexistuje. Přesto má smysl určovat z tabulky skupinového rozdělení modálni interval tj. interval, ve kterém se vyskytuje nejvíce hodnot původního souboru. Hledání mediánu nebo obecněji kvantilůje složitější - viz následující popis doporučen e metody. Hodnotu xp, tj. /7-procentní kvantil statistického znaku, odhadujeme na základě tabulky skupinového rozdělení četností takto: 1. Stejně jako v obecné definici kvantilu (viz článek 4.3) určíme pořadí r v uspo-řádaném souboru, ve kterém se nachází hledaný kvantil: r - ■ (n+1). 2. Z tabulky skupinového rozdělení četností určíme kvantilový interval, tj. interval, ve kterém se nachází hledaný kvantil. Je to takový interval, jehož kumulativní četnost (označme ji c\) je větší nebo rovna číslu r, přičemž kumulativní četnost předchozího intervalu v tabulce (označme ji cq) je menší než r. Jinými slovy - hledáme ve sloupci kumulativních četností dvě po sobě jdoucí hodnoty cq a c\ tak, aby platilo: cq < r < c\. Pokud je číslo r menší nebo rovno kumulativní četnosti prvního intervalu v tabulce, pak je tento první interval kvantilovým intervalem a klademe cq = 0. 3. Polohu hledaného kvantilu uvnitř kvantilového intervalu odhadneme tak, že k dolní mezi kvantilového intervalu přičteme poměrnou část jeho šířky podle vzorce: x,,-ii+- (b-a). "i V tomto vzorci a označuje dolní a b horní mez kvantilového intervalu, b-a je pak šířka tohoto intervalu a ti] je jeho četnost. Tato četnost musí vždy být rovna rozdílu kumulativních četností cj a cq, tj. ti] =c\ -r() (rozmyslete si!). Uvažujme znovu průměrné kupní ceny bytů ve 27 největších městech ČR - viz úloha A. Můžeme z tabulky skupinového rozdělení četností použité v řešení úlohy A určit modálni interval? Vypočtěme z této tabulky přibližně medián a oba kvartily. Řešení: První dva intervaly mají stejnou a současně největší četnost v tabulce -rovnu 11. Proto modálni interval přísně vzato neexistuje (není jednoznačně určen). Můžeme však samozřejmě říci, že průměrné ceny bytů se nejčastěji pohybovaly od 12 700 Kč/m2 do 23 500 Kč/m2. Odhadněme z tabulky medián, tj. hodnotu x$q. Pořadí mediánu v uspořádaném souboru je r = • (27+ 1) = 14. Mediánovým intervalem je druhý interval v tabulce, neboť jeho kumulativní četnost je 22, přičemž kumulativní četnost předchozího (zde prvního) 192 4. Statistika intervalu je 11. S použitím zavedeného označení můžeme psát: c0 = 11, C\ = 22, n\ = 11, a=18 100, ž> = 23500, a proto JČ50=Jč= 18100+ l4~11 (23500-18100)= 19573. Medián je tedy přibližně 19573 Kč/m2. 25 Pro dolní kvartil dostaneme: r- —- (27+l) = 7. Intervalem pro dolní kvartil je první interval v tabulce, neboť jeho kumulativní četnost jeli, což je více než 7. Platí: c0 = 0, ej = 11, nx = 11, a = 12700, b = 18 100, a proto % = 12700+5400= 16136. 11 Pro horní kvartil platí: r = 21, cq = 11, Ci = 22, n\ = 11 (horní kvartilový interval je v tomto příkladu stejný jako mediánový interval), a proto JČ75 = 18 100 + ■ 5 400 = 23 009. Dolní kvartil je tedy přibližně 16 136 Kč/m2 a horní kvartil je přibližně 23 009 Kč/m2. Uvědomte si, že hodnoty kvantilů vypočtené z tabulky četností podle uvedeného postupu jsou pouze odhady skutečných kvantilů. Vypočtcme-li z původních cen bytů (jsou uvedeny v úloze D článku 4.2) skutečné hodnoty mediánu a kvartilú, dostaneme trochu odlišné hodnoty: x = 20 162 Kč/m2. x25 = 16343 Kč/m2 a x75 = 22425 Kč/m2. Následující tabulka udává rozdělení měsíčních příjmů v Kč zaměstnanců jisté firmy. V jakém rozmezí se nejčastěji pohybuje měsíční příjem zaměstnanců? Odhadněme, jaký minimální měsíční příjem by měl pracovník mít, aby patřil do horní poloviny lépe placených zaměstnanců. Zhruba jaký minimální měsíční příjem by mu zabezpečil příslušnost mezi 10 % nejlépe placených zaměstnanců? Měsíční příjem/Kč Počet pracovníků 16000 a méně 8 16001-17 500 25 17501-19000 32 19 001-20 500 26 20501-22 000 15 22 001-23 500 6 23 501-25 000 3 Více než 25 000 1 Celkem 116 Řešení: Odpovědí na první otázku jemodální interval, tj. podle tabulky interval příjmů od 17 501 Kč do 19000 Kč. 4.5 přibližný výpočet charakteristik poloh V zadané tabulce upřesníme první a poslední interval a doplníme kumulativní četnosti: Měsíční příjem/Kč Počet pracovníků (četnost) Kumulativní četnost 14 501-16000 8 8 16 001-17 500 25 33 17501-19000 32 65 19001-20 500 26 91 20 501-22 000 15 106 22 001-23500 6 112 23 501-25 000 3 115 25 001-26500 1 116 Celkem 116 — Odpovědí na druhou otázku je medián. Při jeho přibližném výpočtu postupně dostaneme: 58 5-33 r = 58,5, c0 = 33, c,=65, «,=32, x=17501 + - '-1499=18696. Příslušnost k horní polovině lépe placených zaměstnanců je tedy zajištěna minimálním měsíčním příjmem ve výši 18 696 Kč. Odpovědí na třetí otázku je 90procentní kvantil (rozmyslete si!): r= 105,3, c0 = 9i, ci = 106, «, = 15, jč90 = 20501 + — 5;3~91 ■ 1499 = 21930. Příslušnost mezi 10 % nej lépe placených zaměstnanců je tedy zabezpečena minimálním měsíčním příjmem ve výši 21 930 Kč. Cvičení El Vypočtěte přibližně medián, dolní kvartil a horní kvart i 1 počtu odpracovaných hodin pro soubor 75 dělníků ze cvičení 3 článku 4.2. Návod: Použijte k tomuto výpočtu tabulku skupinového rozděleni četností odvozenou v řešení úlohy C citovaného článku. Na základě tabulky údajů ze cvičení 3 tohoto článku odhadněte kritickou hodnotu časového odstupu, kterou na daném úseku 10 % řidičů nedodrží a 90 % řidičů ji překročí. Nápověda: Tato doba odpovídá určitému kvantilu, rozmyslete si jakému. Ve třídě je pět žáků s prospěchem lepším než 1,5, osm žáků má prospěch 1,5 nebo horší, avšak lepší než 2, jedenáct žáků má prospěch 2 nebo horší, avšak lepší než 2,5, čtyři žáci mají prospěch 2,5 nebo horší, avšak lepší než 3 a dva žáci mají prospěch 3 nebo horší. a) Sestavte tabulku skupinového rozdělení četností včetně kumulativních četností a odhadněte průměrný prospěch celé třídy. Při sestavování tabulky četností předpokládejte, že průměrný prospěch jednotlivých žáků byl zaokrouhlován na dvě desetinná místa. b) Odhadněte, jaká hodnota prospěchu odděluje 20 % nejlepších žáků od zbytku třídy. I ES 194 V předchozích článcích jsme zkoumali vždy jen jeden statistický znak. Tímto znakem byl např. měsíční příjem zaměstnanců firmy a hledali jsme průměrnou hodnotu, směrodatnou odchylku atd. Často však u statistických jednotek daného souboru můžeme zjistit hodnoty několika znaků zároveň. V takových případech nás mimo jiné zajímá i míra závislosti mezi hodnotami těchto znaků. V tomto článku se budeme zabývat situacemi, kdy máme na daném souboru statistických jednotek zjištěny hodnoty dvou kvantitativních znaků. Uveďme možné příklady: U souboru žáků jedné třídy můžeme třeba zjistit známky z matematiky a známky z fyziky. Kromě zjištění průměrných známek z těchto dvou předmětů, mediánů apod. nás může též zajímat, zda platí mlčky předpokládaná „pozitivní závislost" mezi těmito známkami, tj. zda žáci, kteří jsou dobří v matematice, jsou zpravidla dobří i ve fyzice a naopak. V několika po sobě jdoucích provozních hodinách můžeme sledovat výrobu kyseliny dusičné a získat záznamy o průměrné teplotě chladicí kapaliny a o celkovém úniku čpavku. Určitě by nás mělo zajímat, jak na sobě tyto dva znaky závisí - dochází při nižší teplotě spíše k menšímu úniku čpavku? Nebo je tomu naopak? Je vůbec nějaká měřitelná závislost mezi těmito dvěma znaky? V tomto článku si ukážeme dvě nejpoužívanější metody, jak takovou závislost statisticky zjišťovat a vyhodnocovat. První metoda bude grafická, druhá pak početní. Máme-li zjištěny hodnoty dvou kvantitativních znaků x a v u souboru n statistických jednotek, pak tyto hodnoty můžeme zapisovat jako uspořádané dvojice reálných čísel (x\; ji), (xj', yz) atd„ až (x„; yn). Každou tuto uspořádanou dvojici můžeme chápat jako bod v rovině. Zobrazíme-li (ve vhodném měřítku) všechny tyto body, dostaneme tzv. bodový graf nebo bodový diagram (v angličtině scatter plot nebo scatter diagram). Následující tabulka udává známky z matematiky a fyziky na pololetním vysvědčení u 14 žáků jedné třídy. Zakresleme tyto hodnoty do bodového grafu. Co můžeme z grafu vyčíst o statistické závislosti mezi prospěchem v matematice a prospěchem ve fyzice? Matematika 1 2 2 1 3 3 2 2 2 1 3 1 4 2 Fyzika 1 3 2 2 4 3 1 2 2 2 3 2 4 3 řešení: Na následujícím obrázku je bodový graf zjištěných hodnot. V grafu vidíme jen 8 bodů, což je méně, než je celkový počet žáků. Je tomu tak proto, že některé uspořádané dvojice známek se objevily u více žáků (např. 3 žáci měli z matematiky dvojku a současně z fyziky trojku). Tyto shodné dvojice pak v grafu odpovídají jednomu bodu. To, že daný bod v grafu odpovídá několika dvojicím z původního souboru, je 4.6 Korelace 195 možno graficky vyznačit např. tím, že je tento bod výrazněji zobrazen - tento přístup jsme zvolili i my. 5 4 1 j A. A. A á r i r r --• í 1 ---------------- '-----------J 0 1 2 3 4 5 Matematika Obr. 4.8: Závislost mezi známkami z matematiky a známkami z fyziky Z grafu na obr. 4.8 vidíme celkem jasnou závislost mezi známkami z těchto předmětů. Čím je žák lepší v jednom z těchto předmětů, tím je zpravidla lepší i ve druhém a naopak. V takovém případě mluvíme o pozitivní (kladné) statistické závislosti. Body v diagramu jsou v takovém případě zhruba rozmístěny v pásu, který směřuje od levého dolního do pravého horního rohu. Při výrobě asfaltu byl zjišťován bod měknutí ve stupních Celsia a penetrace asfaltové směsi v mm při 25 °C. Následující tabulka udává hodnoty těchto veličin zjištěné u deseti vzorků asfaltové směsi. Zakresleme tyto hodnoty do bodového grafu. Na vodorovnou osu vyneseme hodnoty penetrace, na svislou osu pak odpovídající body měknutí. Co můžeme z grafu vyčíst o statistické závislosti těchto dvou veličin? Bod měknutí/°C 46.5 48,0 46,5 47,5 47,0 47.5 49,0 48,0 48,0 48,5 Penetrace/mm 9,9 9,1 9,8 9.4 9.8 9,5 8,4 8.8 9,6 8,7 řešení: Vidíme, že body grafu (obr. 4.9) jsou tentokrát (ve srovnání s úlohou A) rozmístěny v pásu, který směřuje od levého horního do pravého dolního rohu. To znamená, že čím větší je penetrace, tím menší je zpravidla bod měknutí a naopak. Existují výjimky z tohoto pravidla (např. 6. vzorek v tabulce má menší bod měknutí 196 4. Statistika než 9. vzorek a současně penetrace 6. vzorkuje menší než u 9. vzorku), ale pro většinu dvojic vzorků toto pravidlo platí. V takovém případě mluvíme o negativní (záporné) statistické závislosti. 49,5 49,0 ^ 48,5 1 48,0 47,5 47,0 46,5 46,0 -a o 8,2 ♦ ♦ ♦ ♦ ♦ S,4 8,6 8,8 9,0 9,2 9,4 9,6 9,8 10,0 Penetrace/mm Obr. 4.9: Závislost mezi bodem měknutí a penetrací V úlohách A a B jsme se zabývali grafickým vyhodnocením statistické závislosti dvou znaků. Je však neméně užitečné míru statistické závislosti vyjádřit číselně. Za tímto účelem se počítá tzv. koeficient korelace. -\5 ►.6 8.7 Koeficient korelace rxy (říkáme také korelační koeficient) mezi znaky x a y se vypočte ze souboru n uspořádaných dvojic hodnot (x|; y|), fe; y2), ■ • •, (x„\y„) podle vzorce: 1 " -J2(xi~x)(yi-y) xr n yr n Ve jmenovateli zlomku jsou směrodatné odchylky hodnot znaků x a y, které můžeme počítat pomocí výpočtových vzorců: 2 > -x\ Výraz v čitateli zlomku lze také vyjádřit ve výhodnějším výpočtovém tvaru: 1 n ( 1 " - H (*i "V) (V/ V) = - X].X:.V, | -X V. "w V"/=l 19 Vypočítejme koeficient korelace mezi bodem měknutí a penetrací asfaltové směsi pro soubor hodnot z úlohy B. Řešení: Dvojice pozorovaných hodnot zapíšeme do prvních dvou sloupců tabulky a doplníme ji pomocnými sloupci. Pro výpočet koeficientu korelace není důležité, který znak označíme jako x a který jako y, v následujícím řešení toto pořadí zvolíme tak, aby odpovídalo volbě os v grafu na obr. 4.9. Číslo vzorku Penetrace/mm Xi Bod měknutí/°C yi Hodnota Hodnota yf Hodnota 1 9,9 46,5 98.01 2 162,25 460,35 2 9,1 48,0 82,81 2304,00 436,80 3 9,8 46,5 96,04 2 162,25 455,70 4 9,4 47,5 88,36 2 256,25 446,50 5 9,8 47,0 96,04 2209,00 460,60 6 9,5 47,5 90,25 2256,25 451,25 7 8-4 49,0 70,56 2401,00 411,60 8 8,8 48,0 77,44 2 304,00 422,40 9 9,6 48,0 92,16 2304,00 460,80 10 8,7 48,5 75,69 2 352,25 421,95 Celkem 93,0 476,5 867,36 22 711,25 4 427,95 Postupně vypočteme: ^-9,32 = 0,49598; 22711.25 -—>--47.652 =0.77621; 1 " \ 4427 95 - E-w -*y = -^ír1-9-3 ■41-65 = -°>35> -0.35 r" = 0.49598 0,77621 = ~°^909 1' Koeficient korelace je tedy záporný a je přibližně roven -0,909. Všimněte si, že koeficient korelace v minulém příkladu vyšel záporný a současně bodový graf ukázal negativní závislost mezi zkoumanými hodnotami znaků. To není náhoda, ale jedna z vlastností koeficientu korelace - viz následující přehled jeho důležitých vlastností. 198 4. Statistika Koeficient korelace rn mezi znaky x a y má následující' vlastnosti: 1. -I < ;;n i 1, tj. tento koeficient je vždy číslo z intervalu (-1; 1). 2. rrv = 1 právě tehdy, když všechny body v bodovém grafu leží na společné přímce, která je rostoucí, tj. má kladnou směrnici. 3- rxy = -1 právě tehdy, když všechny body v bodovém grafu leží na společné přímce, která je klesající, tj. má zápornou směrnici. 4. rxy je bezrozměrné číslo, tj. vynásobíme-li nebo vydělíme-li všechny hodnoty znaku x nebo znaku y toutéž nenulovou konstantou, koeficient korelace se nezmění. Koeficient korelace se též nezmění, odečteme-li nebo přičteme-li ke všem hodnotám znaku x nebo znaku y tutéž konstantu. 5. Ukazuje-li bodový diagram pozitivní závislost, je koeficient korelace kladný. Čím je tato závislost „těsnější" (tj. čím je „rostoucí" pás, ve kterém jsou body rozmístěny, užší), tím blíže je rsv k číslu 1. 6. Ukazuje-li bodový diagram negativní závislost, je koeficient korelace záporný. Čím je tato závislost „těsnější" (tj. čím je „klesající" pás, ve kterém jsou body rozmístěny, užší), tím blíže je rxy k číslu -1. 7. Neukazuje-li bodový diagram žádnou zřejmou závislost, bývá zpravidla hodnota rAV blízká nule. Vypočítejme koeficient korelace mezi známkami z matematiky a známkami z fyziky pro soubor žáků z úlohy A. řešení: V daném souboru bylo celkem 14 dvojic, některé se však vyskytovaly vícekrát. Výpočty můžeme mírně zkrátit, když nejprve určíme všechny navzájem se lišící uspořádané dvojice hodnot spolu s odpovídajícími četnostmi - myšlenka je velmi podobná výpočtu průměru a rozptylu z tabulky četností, viz např. úloha G z článku 4.4. Známka z matem. X, Známka l fyziky y*i Četnost dvojice m Hodnota xfni Hodnota (*f) m Hodnota y*fii Hodnota (yf) ni Hodnota X* >'*/!,- 1 i 1 1 i 1 i 1 1 2 -> 3 3 6 12 6 2 1 1 2 4 1 1 2 2 2 3 6 12 6 12 12 2 3 2 4 8 6 18 12 3 3 2 6 18 6 18 18 3 4 1 3 9 4 16 12 4 4 1 4 16 4 16 16 Celkem 14 29 7! 34 94 79 29 _ 34 17 Postupne vypočteme: x - —; y = — = —; 6 Korelace 199 = 0,88352 •v/J, 0,90351 0,61224; = 0.767. • 0.88352-0,90351 Koeficient korelace mezi známkami z matematiky a známkami z fyziky je u zkoumaného souboru žáků roven přibližně 0,767. Potvrdila se tedy pozitivní statistická závislost z bodového grafu. Cvičení | Zobrazte počet najetých km a provozní výdaje osmi dealerů z úlohy K článku 4.4 do bodového grafů (najeté km vynášejte na osu x a provozní výdaje na osu v). Co můžete z grafu vyčíst o závislosti mezi těmito znaky? Vypočtěte korelační koeficient. WŕM Patnáct maturantů bylo v rámci určité studie vyzváno, ah\ uvedli svoji výšku a výšku otce. Následující tabulka udává hodnoty obou znaků v cm. Výška otce 175 170 185 176 168 167 171 176 176 166 169 177 184 185 173 Výška syna 172 168 183 182 174 166 173 170 180 171 165 171 179 189 177 a) Porovnejte oba znaky pomocí vhodných charakteristik polohy a variability. b) Zobrazte hodnoty do bodového diagramu. Co můžete z grafu vyčíst o závislosti mezi těmito znaky? c) Vypočtěte korelační koeficient mezi uvedenými znaky. Vyberte ve vaší třídě 8-10 studentů stejného pohlaví a u každého zaznamenejte výšku v cm a hmotnost v kg. Zobrazte získané hodnoty do bodového grafu. Co můžete z grafu vyčíst o závislosti mezi těmito znaky? Vypočtěte korelační koeficient. Následující tabulka udává měsíční výdaje na reklamu a měsíční tržby určité velké firmy za jeden kalendářní rok. Hodnoty jsou vyjádřeny v tisících Kč a zaokrouhleny. Výdaje 11 13 7 10 21 15 30 24 18 32 40 35 Tržby 2 800 1 900 2 900 1 200 1 600 2 600 1 800 1 900 2 900 2 700 3 500 3 900 a) Vypočtěte korelační koeficient mezi měsíčními výdaji na reklamu a tržbami. Co nám toto číslo říká? Návod: Je vhodné hodnoty tržeb před výpočtem vydělit číslem 100, tj. vyjádřit je ve statisících Kč. Korelační koeficient nebude touto změnou jednotek ovlivněn - viz uvedené vlastnosti koeficientu korelace. b) Vedení firmy předpokládá, že tržby pozitivně reagují na reklamu se zpožděním zhruba jednoho měsíce. Potvrzují data tento předpoklad? Návod: Vypočtěte korelační koeficient mezi výdaji na reklamu v daném měsíci a tržbami v měsíci následujícím, tj. pracujte s dvojicemi hodnot (11; 1 900), (13; 2 900) atd., až (40; 3 900). 4, 200 4. Statistika Bl Následující tabulka udává, jak si žáci jisté školy volili cizí jazyk. Každý žák si musel zvolit právě jeden z jazyků uvedených v tabulce: Jazyk Angličtina Němčina Ruština Počet žáků 182 111 27 Načrtněte polygon četností. Vypočtěte relativní četnosti a zobrazte je pomocí kruhového diagramu. WM Při zkušebním provozu automatického zařízení, které odměřuje kilogramová množství mouky, bylo převáženo 30 odměřených dávek. Byly získány následující hodnoty v kg: 0,98 0,99 1,03 1,01 0,96 1,00 0,98 1,01 1,02 0,97 0,96 1,00 1,00 1,03 0,99 0,97 0,98 0,96 1,00 1,02 0,96 0,98 1,01 0,97 0,98 1,03 1,00 0,99 1,00 0,99 HHI Uspořádejte data do tabulky rozdělení četností, určete kumulativní, relativní a kumulativní relativní četnosti. Zobrazte histogram četností a polygon četností. KcB V tabulce je uvedena hustota obyvatel, tj. průměrný počet obyvatel na I kur, a celková rozloha v km2 pěti středoevropských států: Polsko Česko Slovensko Rakousko Maďarsko Hustota 124 131 110 97 110 Rozloha 312700 78 900 49 000 84 900 93 000 Jaká je průměrná hustota obyvatel v této části Evropy? | Na pokerovém turnaji momentálně hraje 8 hráčů u stolu A, průměrný počet žetonů na hráče je 3 750. U stolu B hraje též 8 hráčů s průměrným počtem 4 250 žetonů na hráče. U stolu C hraje 10 hráčů s průměrným počtem 3 600 žetonů na hráče. Jaký je průměrný počet žetonů na hráče v celém turnaji? M^U V roce 2007 byla spotřeba určitého druhu zboží dvakrát vyšší než spotřeba v roce předchozím. V roce 2008 stoupla spotřeba tohoto druhu zboží o 70 % v porovnání s rokem 2007. V roce 2009 byla spotřeba opět vyšší, tentokrát o 50 % než v roce 2008. Vypočtěte průměrné tempo růstu za celé zkoumané časové období. Kolikrát větší byla spotřeba v roce 2009 než v roce 2006? M^M Určitá firma plánuje, že za 5 let zdvojnásobí svoje tržby. O kolik procent by měly každoročně tržby průměrně růst, aby bylo cíle dosaženo? 4.7 úlohy k opaková P01 WfM Na šesti různých místech válcové tyče byl změřen její průměr a b\ ly získány následující hodnoty v centimetrech: 5,24 5,18 5,10 5,25 5,14 5,19 Vypočtěte aritmetický průměr, medián, směrodatnou odchylku a variační koeficient průměru tyče. M"'U Jedenáct opakovaných měření určité fyzikální konstanty dalo následující výsledky: 2,11 2,01 2,09 2,11 2,02 2,03 2,03 2,03 2,10 2,05 2,05 Vypočtěte aritmetický průměr a medián naměřených hodnot. Určete též rozpětí a směrodatnou odchylku. M^M Anglický matematik Weldon opakoval 4096kráthod dvanácti kostkami. V každém hodu zaznamenal počet šestek, které padly. Rozdělení četností tohoto znaku bylo následující: Počet šestek 0 1 2 3 4 5 6 7 8 9 10 11 12 Četnost 447 1 145 1 ISI 796 380 115 24 7 1 0 0 0 0 a) Vypočtěte aritmetický průměr, modus a medián počtu šestek. b) Vypočtěte rozptyl a směrodatnou odchylku počtu šestek. c) Určete relativní četnosti hodnot tohoto znaku. d) Porovnejte relativní četnosti hodnot 0, 1 a 2 s teoretickými pravděpodobnostmi, že při hodu 12 kostkami nepadne žádná, padne právě jedna, nebo padnou právě dvě šestky. Návod: Použijte binomické rozdělení (Bernoulliovo schéma) z článku 3.5. EM Tabulka rozdělení četností (převzatá ze statistické ročenky ^ ČR 2011) udává věk ženicha, resp. nevěsty při uzavření ty prvního sňatku pro všechny sňatky uzavřené v ČR v roce Wk «. 2010. MŘ Věk v letech Četnost mužů Četnost žen 19 a méně 104 573 20-24 2983 7 376 25-29 12791 16 313 30-34 12761 8215 35-39 4 063 1 745 40-44 953 299 45^19 379 109 50-54 193 47 55 a více 187 57 Vypočtěte přibližně aritmetický průměr, medián a modus věku při uzavření prvního sňatku pro muže a pro ženy a porovnejte výsledné hodnoty. 202 4. Statistika iil Následující tabulka udává hodnoty životnosti souboru 96 žárovek. Data byla zaokrouhlena na celé hodiny a seřazena podle velikosti: 164 273 380 549 677 890 942 1022 1 242 1353 1 609 1 786 187 273 402 598 690 902 955 1031 1 263 1365 1676 1 827 222 277 495 634 728 906 986 1033 1298 1380 1687 1 887 225 278 529 639 728 906 989 1037 1 304 1392 1 690 2053 237 319 535 641 744 908 994 1055 1327 1 427 1696 2078 240 346 544 653 746 909 997 1060 1327 1451 1 699 2 327 262 361 546 660 823 921 1005 1083 1 340 1 581 1709 2426 264 371 548 667 857 921 1016 1 141 1 352 1 605 1748 2434 a) Uspořádejte data do tabulky skupinového (intervalového) rozdělení četností. Načrtněte histogram. Co můžeme říci o tvaru rozdělení? b) Odhadněte bez výpočtu, jaký je vztah mezi průměrem a mediánem. c) Na základě tabulky skupinového rozdělení četností vypočtěte přibližně aritmetický průměr, medián, modus, rozptyl a směrodatnou odchylku životnosti. d) Určete přesnou hodnotu mediánu z původních dat a porovnejte ji s předchozím přibližným výsledkem. e) Na základě tabulky skupinového rozdělení četností určete přibližně mezikvar-tilové rozpětí životnosti. f) Určete přesnou hodnotu mezikvartilového rozpětí z původních dat a porovnejte ji s předchozím přibližným výsledkem. 1K1 Rozdělení účastníku výročního závodu Běchovice - Praha (muži, kategorie příchozích) podle věku je uvedeno v tabulce: Věk 20-29 30-39 40-49 50-59 60-69 70-79 80-89 Četnost 344 447 787 525 149 37 4 a) Načrtněte histogram tohoto rozdělení. Co můžeme říci o tvaru tohoto rozdělení? b) Vypočtěte přibližně průměrný věk účastníků. c) Dokážete bez výpočtu odhadnout, je-li medián věku účastníků větší, či menší než průměrný věk? Ověřte přibližným výpočtem. d) Jaký věk zhruba vymezuje 10 % nejmladších, resp. 10 % nej starších účastníků? Ze šesti zemí máme k dispozici zaokrouhlené údaje o průměrné roční spotřebě cigaret na 1 obyvatele (znak x) a o roční míře úmrtnosti na plicní rakovinu na 100 000 obyvatel (znak y). Vypočtěte korelační koeficient mezi těmito znaky. X 3 400 2600 2 200 2400 2 900 2100 y 24 20 17 19 26 20 Při kontrolním měření rozměrů silikátových štítových dílců bylo náhodně vybráno osm dílců vykazujících vesměs kladné odchylky v délce i výšce od normových hodnot. Odchylka délky/mm 3 4 4 5 8 10 6 3 Odchylka výšky/mm 4 6 5 6 7 13 9 4 Zakreslete údaje do bodového grafu. Co můžeme z grafu vyčíst o statistické závislosti mezi těmito znaky? Vypočtěte korelační koeficient mezi nimi. U deseti vzorků betonu z jedné záměsi byla po různém počtu dnů (znak T) zjišťována pevnost betonu v tahu (znak Y) v N-cm . T 2 2 3 3 7 7 28 28 28 28 Y 219 245 298 242 345 331 418 357 403 373 Zakreslete údaje do bodového grafu. Co můžeme z grafu vyčíst o statistické závislosti pevnosti betonu v tahu na době zrání? Vypočtěte korelační koeficient mezi těmito znaky. Rychlost výrobní linky (znak x) se nastavuje pro každou směnu podle potřeby na stupeň 1 nebo 1,5 nebo 2. Během každé směny se zaznamenává počet poruch linky (znak y). Následující tabulka udává hodnoty těchto dvou znaků za 365 směn. Počet poruch v 0 1 2 3 Rychlost linky X 1 45 20 8 0 1,5 38 62 32 14 2 10 22 58 56 Vypočtěte koeficient korelace mezi rychlostí linky a počtem poruch. Co nám toto číslo říká? Návod: Sestavte si pomocnou tabulku jako v řešení úlohy D minulého článku. 204 4. Statistika Exkurze do historie Galileo Galilei C. F. Gauss První statistické pojmy se objevovaly již v 17. století. Angličan Petty Graunt zpracoval statistická data týkající se úmrtnosti obyvatel Londýna - lze říci, že šlo o první publikovanou úmrtnostní tabulku. Roger Boscovich rozvinul pro účely geodetických měření vyrovnávací počet, který začal původně v astronomii používat Galileo Galilei. Osmnácté a devatenácté století přineslo další rozvoj metod teorie pravděpodobnosti a rodící se matematické statistiky. Pierre Simon de Lapiace a Carl Friedrich Gauss odvodili model normálního rozdělení (Gaussovu křivku), při zpracovávání astronomických údajů poprvé použili metodu nejmenších čtverců. Gauss ji zřejmě použil již roku 1801 při výpočtu dráhy planetky Ceres, ale poprvé byla uveřejněna roku 1805 Adrien-Marie Legen-drem, který ji objevil nezávisle na Gaussovi. V 19. století se metody matematické statistiky začaly z fyzikálních věd šířit i do oblasti věd biologických a humanitních. Sir Francis Galton používal statistické metody v psychologii a antropologii, přičítá se mu např. zavedení pojmu korelace. Charles Sanders Peirce v pojednáních lllustrations of the Logic of Science (1877-1878) a A Theory of Probable Inference (1883) formuloval mnohé základní prvky matematické statistiky, zejména položil základy teorie testování hypotéz. Ch'S'Peirce Překotný rozvoj statistiky pak nastal ve 20. století. Práce Carla Pearsona rozvinuly matematickou statistiku v oblasti biologie, epidemiologie, antropometrie, medicíny i sociálních dějin. V roce 1901 spolu s Weldonem a Galtonem založil časopis Biometrika, jehož předmětem byl vývoj statistických teorií. Vlastním zakladatelem moderní matematické statistiky se stal britský biolog Ronald Fisher. Napsal vlivné učebnice Stati tistical Methods for Research Workers (1925) a The Design of 'Ú 'Šííf/ Experiments i 1935) a objevil či podstatně prohloubil celou řadu ™ ~'^r - klíčových metod a pojmu jako analýza rozptylu, metoda maximální věrohodnosti, diskriminační analýza, informace a plánování R. Fisher experimentů. Kolem poloviny 20. století se matematická statistika stala samostatným oborem na pomezí čisté a aplikované matematiky a rozvíjí se řadou směrů. Uveďme alespoň některé průkopníky moderních matematicko-statistických metod: Frank Wilcoxon (neparametrické testování), William Kruskal a W.Allen Wallis (ekonomové - neparametrická varianta analýzy rozptylu), Charles Spearman, David Kendall, John Tukey a další. Nástup počítačů v posledních desetiletích se projevil usnadněním rozsáhlých výpočtů, které s sebou matematická statistika přináší, a umožnil tak i vznik výpočetně náročných metod. Exkurze Výsledky úloh a cvičení ■iiiiiiiiiiiiiiiiHiiiiiiiiiiiiiiiiiiiiiiiii.....i......i'in'iiiiiiiiiiiiimiiiiiiiiiiiii'iiii'iiiiiNiiiiiiHiiiiľiiľ............ifiľiciiiii ii^iiitÉiimiwiMwii«»mHniiiiiiiiWÉiif/5; d) 0. ; Např. a) [-5; -5]; b) LO; -3]; c) [1; 0]; d) [1; 5]; e) [—1; 1]; f) [10; 9]. C Počátek soustavy souřadnic. 1 a) Přímka, která je osou 1. a 3. kvadrantu; b) imaginární osa; c) reálná osa; d) polorovina bez hraniční přímky, která je osou 1. a 3. kvadrantu, obsahující zápornou poloosu x; e) 2. a 3. kvadrant včetně záporné poloosy x a bez osy y; f) 1. a 2. kvadrant včetně kladné poloosy y a bez osy x. 8 a) x = 1; b) x = 0; c) x = 2. 9 a) x2 = 0, tj. pro reálná čísla; b) x\ = 0, tj. pro ryze imaginární čísla; c) L0; OJ; d) komplexní čísla, která mají reálnou část rovnou imaginární části. 10 a) Body ležící na ose 2. a 4. kvadrantu; b) počátek soustavy souřadnic. 11 a) c + d = [6; -4], c — d = [-2; -6], cd = [13; -18]; b) c+d = [-1; -3], c—d = [-1; 9], cd = [18; 6]. 1.2 Absolutní hodnota komplexního čísla 1 A Ano. 1 a) 0; b) 2; c) ;d)-. 2a)v/2;b)3;c) l; d) 3. 3 Např. [1; 3], [-3; 1], [0; V10]. B Ano Li; l], 4 _ 7 TI' n a)x = 0;b)x=±l; c)x=±—;d)* = ±- C 1. 7 Kružnice se středem v počátku a poloměrem 1. 8 Např. [0; 2], [-2; 0], [1; y/3]. 9 a) Kružnice se středem v počátku a poloměrem 4; b) kruh se středem v počátku a poloměrem v2; c) mezikruží ohraničené kružnicemi se středy v počátku a poloměry 2 a 5; d) mezikruží ohraničené kružnicemi se středy v počátku a poloměry 0,5 a 2 bez hraničních kružnic. a) jaj < 3; b) 2 < jaj < 3. 1.3 Algebraický tvar komplexního čísla A Ano. ? a)Rea = 3;b)Reb = -2;c)Rec = -4; d)Rec/ = 0. 2a)Ime = l; b) Im / = -y; c) Im g = 4; d) Im h=y—5. 4 a) Viz obr. V.la; b) viz obr. V.lb; c) viz obr. V.lc; d) viz obr. Vid. a) x = 2, y = 2; b) x = -5, y = -1; c) x= - , j = --; d) x = 4, y = 2; e) x = 1, y = 1; f) x = 3, y = -2. B a) 2-i; b) —1 —3i; c) 4 + i; 3 d) -2 + 3i; e) -2; f) —3i. 6 a) Ano; b) ano; c) ne; d) ano. a) 2 + 2i; b) -1 - -i; c) |+i; d) 0; e) -—; f) -i. 8 a) 6; b) 3; c) 0; d) 4. 9 Pro reálná čísla. 10 Platí 206 r \7ýqi Fnk"v in oi \ a cvičeni jaj = |ä|. a) v^ÍO; b) 5; c) 6; d) 3. 11 Návod: Napište algebraické tvary čísel a, ä, pro každé vypočítejte absolutní hodnotu a výsledky porovnejte. C a) -4-i; b) 2 —3i; c)-l+i;d)2+i;e)-l;f)2i. 12 a) Ano; b) ano; c) ne; d) ano. 13a)-4,2-i; b) 15-3i; c) -l,4+2i; d) 5 + i; e) 0; f) -I. 14 Pro číslo 0. 15 Platí \a\ = \-a\. a) \/2; b) v/74; c) 5; d) 1; e) 9; f) 2. 16 Návod: Napište algebraické tvary čísel a, -a, pro každé vypočítejte absolutní hodnotu a výsledky porovnejte. a) Im 3 2 1 b) Im. 3 2' 1 -2 -1 -1--2 012: ! 4Re -2 -1 -1 0 1 2 3 4 Re -2 0 Im i 3-2-1- dl Im ■■■■■ -2 - 1 -1-»-2 0 1 2 3 4 Re -2-1 _2 Obr. V.l 0 2 3 4 Re 1.4 Sčítání a odčítání komplexních čísel v algebraickém tvaru Aa)-2+8i;b)-7+5i;c)-8-3i;d)7-15i. 1 a) 7-44i; b)-y-4i; c)-1; 2 d)-ll+4i. 2a)-l;b)-12,24;c)-;d)0. 3 a) 0; b) 0; c) 0; d) 0. 4 Návod: Použijte algebraické tvary čísel a, a. *5 a) Pro a2 - -by, b) pro opačná komplexní čísla; c) pro a2 i--b2; d) pro a\ --b\ A a2 ^-b2. 6 a) 3; b) 5; c) 2; d) 5\/2. a)-2 + 3i;b)-10+5i;c)4 + i:d)8 + 2i. 8 a) u= 10, v = 4; b) u= 11, v = -3; c)m = -8,v = -l;d)« = 3,v = -l. Ba) 12-4i:b) 1 +7i; c)-13i: d) 15 — 5i. 1. Komplexní čísla 2 j 9 a) -14+13Í; b) 7i; c) 2; d) -7 +i. 10 a) -6i; b) -/lír, c) -li; d) 8i. 22 4 r- 12 a) -— - 12i; b) -- +6i; c) 4a/3-í; d) -32i. *13 a) Pro a2 = by, b) pro stejná komplexní čísla; c) pro a2 ý-by, d) pro a\ = b\ A «2^2' 14 a) v/26; b) 5; c) 36; d)55. 15a)6~6i; b)-9 + 5ir;c) 16 + 5i; d)-8-2i. 16 a) u = 0, v = 2; b) u = -4, v = -l;c)iť=l,v = 0;d)« = -2,v = -2. C Ano. 17 Z = (10-1 l,4j)íí, |Z| = 15,20. 18ReZ=tf,ImZ = a;L- 1.5 Násobení a dělení komplexních čísel v algebraickém tvaru A a) -i; b) 1; c) i; d) -1; e) -i; f) 1. la) -i; b) 1; c) -i; d) i; e) -i; f) 1. 2a)-l+2i;b)3i;c) l-i;d) 1+i. 3 a) 4-2i; b) 9 + i; c) 1; d) -3 + 2i. B a) Ano; b) ano; c) ne, 31-51; d) ne, -27-681. 4 a) -20; b) 2-8i; c) 7 + 3i; d) -24-3Í. 3 15 5 85 5a) ^-i;b)-—+2i;c)2;d) 121. a) 45; b)-; c)--; d) 0. *7 Návod: Vyjádřete 2 4 čísla a, a v algebraickém tvaru a vypočítejte jejich součin. 8 a) 16— 12i; b) - + -i; c) 4+26i; d)-2 + 2i. la) --; b) ~ - ~i; c) 1 -i; d) a e C; e) 0; f) 0. *10Pro komplexní čísla a = a\ +a2Í, b = b\ + b{\ je jejich součin (a\b\ -a2^2) + (ai^2 + fl2^i)i číslo a) reálné pro ci\b2 = -a2b\; b) imaginární pro a\b2 ^--aoby; c) ryze imaginární X>ro ayb\= a2b2 A a\b2 ¥~a2^i- 11 a) 16; b)-27i; c) 65-72i; d) 2-11i. 12 a) -8- 19i; b) 81 +2i; c) -13-4Í; d) -2+ 127i. 3 a) 12+ 16i; b) -18+ 18i; c)-15 + 20i;d)-4. 14 a) 10; b) 5VW; c) vTŤ"; d) 221. 15 a) a2+4; b) 9b2 + c2; c) 2a2 + 62; d) 562 + 3c2. 16 a) (a+ib){a-ib); b) (3a+5i) (3a-5i); c) (l lfc+4ic)(112>-4ic); d) (Vlb+ic) (y/Ťb-ic);é) (VŠa + V^ib) (V5a-V3ib); f) (VT\b + 2ic) (vTTfe-2ic). F a) Ne; b) ano; c) ne; d) ano. G Ano. 17 a)-1+i; b) -3-3i; c) _l+4i;d)I-|i. 18 a) --i; b) \ - l-i; c) -1 - ^ d) -1 + * L 3443 5 12 3 4 V"2 19.)-l;b)5+5i;c)! + !i;d)-n-nL 20 a) -1; b) -; c) --; d) \. 3 1 1 4 3 9 13 7 4 21.a>-+2i;W----l;c)-2+l0i;d,i. .a) g + ji: b) 5 + Ti; c) 5 + ľ^^íT1. 25 (18,7+j0,4)í2. 2 6 (2,2+jO,8)A. H Ano. 27a)-2 + 5i; b) -ll)-10i;c)2i;d)-|-^ 23 a) -15 + 8i; b) I - |i; c) -16-24Í; 4) | -f li. 29 a 30 Návod: Vyjádřete komplexní čísla z, resp. a, b, c v algebraickém tvaru a vypočítejte výrazy na levé a pravé straně dokazované rovnosti. 3 - a) 40; b) 10; c) 1; d) 30. *32 Návod: Použijte postup z důkazu v odstavci J. *33. Návod: Použijte definici absolutní hodnoty komplexního čísla a čísel -a, a. 34 a) Kružnice se středem v počátku a poloměrem \/TÔ~; b) kruh se středem v počátku a poloměrem 5; c) mezikruží ohraničené kružnicemi se středem v počátku a poloměry 1 a 2; d) prázdná 208 5. výsledky úloh a cvičení množina. 35 a) Osa úsečky s krajními body, které jsou obrazy čísel -1 a i; b) polorovina obsahující počátek s hraniční přímkou, která je osou úsečky s krajními body v obrazech čísel i a -3i; c) úsečka, která je částí osy x, s krajními body, které jsou obrazy čísel -3 a 3; d) průnik kruhu se středem v počátku a r = 4 s polorovinou, jejíž hraniční přímkou je osa x a do níž patří obraz čísla 4i. 36 a) Množina bodů, které mají od bodů [-2; 0] a [2; 0] konstantní součet vzdáleností roven 8, tj. elipsa se středem v počátku, poloosou a = 4a excentricitou e = 2; b) množina bodů, pro které je absolutní hodnota rozdílu jejich vzdáleností od bodů [-5; 0] a [5; 0] rovna 8, tj. hyperbola se středem v počátku, poloosou a - 4 a excentricitou e = 5. 37 Nulový vektor. /125 25 \ 40 d) Návod: Nejdříve vypočítejte Z, Z = I —— - —j íl. 1.6 Goniometrický a exponenciální tvar komplexního čísla 1 a) ti; b) |; c) 0; d) e) T-; f) |ir, g) 108°26'; h) 341°34'. 9 „ ....... 3 . . 3 a) -7c(cos0 + isin0); b) cos J-Ti + isin -tc; c) 4V2 cos - +isin 5 5 d) 6\/2 ( cos-n + isin-'. 2 2 ;e) ^ (cos 305° 16' + i sin 305° 16'); f) ^j- (cos229°6/ + isin229°6/). 3 a) ^ (cos|+isin^); b) 10(cosl43o8/ + isinl43o8');c)2( cos ^it + isin |tc ); d) ^ I cos^Tt+isin^Tt ); 3 2 3 3 e) ( cos-x + isin-7t ); f) v'2 3 cos ■ 3 a/2 í TI Tc + isin-Ti . a) 4\/2 í cos - +i . 3 sin 4/' b)5(cos53°8' + isin53°8');c) -j- cos-Ti + isin-ti ; d) -~ (cos288°26/ + isin288°26'). B Ano. a) Ano; b) ano; c) ne; d) ne. 5 5y/3. . v a/3 1. 6 a) Ano; b) ne; c) ano; d) ne. C a) Ano; b) ano. 7 a)---—i; b) i; c) - /3 1 3 /3 3 d) -5,6382-2,052 li. a)-1; b) ^- --i; c) ~ + -i; d) -V5-L 2 — _ i; a) a = 4 l^cos -tc+i sin - ti J;b) -a = 4 |^cos - + i sin *10 Platí: ~ä = \a\(cosa-isina) = ja| [cos(-a) + isin(-a)l, -a = \a\ (-cosa-isina) = \a \ [cos(a + Ti) + isin(a + Tt)]. a) cos - + isin -: , 3 . . 3 \ 1 / 5 ..5^,/ 11 ..11 b) 2 cos-Tt + isin—tc ; c) - I cos-Ti + isin-ti ; d)2 cos-—-Tc + isin—ti aje'ŤT; b) 5ei]l; c) Te1?71; d) y/2Jln. 13 a) -1; b) -i; c) -9 + 9\/3i; d) | + ^i. 1 ,2, 14 a) « = e 3 , -<2 = e 3'-; b) a= -ef -a = -e e , c) a = 5e i , -a = 5e 2 d)a = 2e1S7t,-a = 2e14T i) 5\/2e*i- O: b) 3.61eJ326° A. 1.7 Násobení a dělení komplexních čísel v goniometrickém a exponenciálním tvaru 1 a) v^Ccosótr+isinóO0); b) 4 ^cos 7^ + isin ; c) 5(cos300° +isin300°); d) ~ ^cos^Tc + isin^. a) 10 (cos 240° +i sin 240°); b) 5 ^cos^rc + isin ^; 2/^7 7 ^ t~ 3 tc c)2v/2(cos45° + isin45°);d) - í cos — 71 +i sin — ti J. a) 0, |, tc, -k, 0; b) ^,tc, 3 „ti ^ tc 3 5 7 tc ,N 2 7 5 tc 2 , . , „ , —tc, 0, -; c) -, -tc, -tc, — tc, -; d) -tc, -tc, -tc, -, -tc. Jedna se o otočeni kolem 2 2 4 4 4 4 4 3 6 3 6 3 počátku o ^. 4 a) \[Š ^cos ^ic + isin ^tc^; b) 5 ^cos y^Tc + isin Jq^J '■• c) 2\/2| cos^Tc + isin^Tc );d) i cos ^rc + isin -ti). B a) e'71; b) 3e1^IC; c) ^e1?71; \ 20 20 / \ 6 6/ 2 d) 3V2VK 5 a) Ano; b) ano. a) Se^71; b) e1?; c) 9eÍTl; d) 2eiTiTC. a) ^ (cos 180° + i sin 180°); b) f cos ^Tc + isin^x 3 2^66 c) ~ (cos225°+isin225°); d) ^cos yTc+isinyTc^ . a) 0,5(cosTc + isinTc); b) cosTc + isinic; c) 0,2 ^cos^+isin^j; d) ~ ^cos f^Tc+isin^tc^ ; e) 2 ^cos ^Tc + isin^Tc^j; f) ^cos ^Tc + isin ^tc^J . "11 Návod: Vyjádřete číslo 1 v goniometrickém tvaru a použijte vztah pro dělení komplexních čísel. / 3 . 3 \ 12 a) cos(—a) + isin(-o;); b) cos a + i sin a. 13 a) 4 I cos -7c + isin-k 1; b) 2 ^cos~ +isin^; c) ^ ^cos ^Tc + isin^tc^ ; d) 2 ^cos ^ic + isin^k^. Návod: Použijte definice daných čísel a vlastnosti goniometrických funkcí. D a) e1 3; b) 3e'iK c) d) ^e'f. 5 a) 2ei57C; b) lóe1!; c) 7ei37t; d) l^e1!. 16 a) 0,5^; b) -U1!rc; c) L1?71; d) J^i71. Z = Sv^e-i"0 O, / = 2v/5eJ297° A, 16 7 3 t/ = 50eJ°° V. Z = 2v/2ej8° íí, tf = 12\/5e-i27° V, / = 3\ZT0eJ,9° A. 1.8 Moivreova věta, mocniny a odmocniny A Vztahy odvodíme pomocí věty o násobení komplexních čísel v goniometrickém tvaru. 1 Pro každé přirozené číslo n a pro každé nenulové komplexní číslo a = \a\ela ( 7 7 \ je an = \a\n&"a. 2 a) Ano; b) ne, 32 I cos-Tc+isin-tc 1. 3 a) cosTc+isimi; b)25()(cos2Tc + isin2Tc); c) 125 ^cos ^k + isín ^tc^ ;d)cosTc+isinTc; e)25(cosTc + isin:c); 210 5. výsledky úloh a cvičení _ 16 / 4 . . 4 q-ícoS-K-rlSUl-K a) a3 - 64 f cos ^Tt + isin ^it V 4 4 Ja)3 = 64 ( cos ^n + isin ^tc ); b) a3 («)3 = 108 7 7 v/2 / k . . Tí TÔ8lCOS4+1Sm4 3 cos - tí + i sin-% ); c) tr = 24 v 3 j cos - it + i sin-tí /Tí Tí\ I (ä)3 = 24\/3 ycos - +isin - J; d) a3 = - (cos tí + i sin k) - (a)3. Návod: Použijte vztah ä=\a\ [cos(-a) + isin(-a)]. : a) ei2ix; b) e'71; c) 16eÍT:; d) 16ei2Tt. 3 . . 3 125 7 a) cos2:i+isin2Ti; b) cos-K + isin-u; c) —- 2 5 . . 5 COS-rK + lSin-TC 3 3 a)-2-6;b)-|-^i;c)ii;d) 1 1. E a) l;b) 1; c) 1. d) (cos 2tí + i sin 2tc) . 625 9 a) cos 2a = cos2 a-sin2 a, sin 2a = 2 sin a cos a; b) cos4a = cos4a-6cos2asin2a + sin4a, sin 4a = 4cos3 asina-4cosasin3 a. , \/2. s a/2 V2. V2 v/2. a)0;b)±i;c) ±i;d)±— ±— ,;e)-—+ —i, — -yi- a 11 Pro komplexní číslo s argumentem a jsou argumenty jeho druhých odmocnin —, ^ +tc, tj. jejich obrazy jsou středově souměrné podle počátku. a) 2ei27X, 2ei5,L, 2ei371; b) 3S,3él11, 3^*; c) V2V7, y/2é%*, v/Že^; d) e*?71, e1^, e>^. Návod: Použijte vyjádření hodnot bt, foj+j n-té odmocniny z komplexního čísla z odstavce E a porovnejte argumenty čísel a fe^+i. 5 a) Ano; b) ano. a) el2i; i Z* e'2, e,r\ ev2K; viz obr. V.2a; b) e1-*, e1*71, e1*11, e1**"; viz obr. V.2b; c) e*s, e*8'", e viz obr. V.2c; d) e'*::, e's" 2ei5TI, 2ei2lt; viz obr. V.3. e s ,l, e s '•; viz obr. V.2d. že1?, 2ei571, lm 1 Im 1 /' \ -iK 0 / 1 Re -1\ 0 /l Re -i % -i 2eľ Obr. V.2a Obr. V.2b 1.9 Řešení rovnic v množině komplexních čísel A Používali jsme pouze ekvivalentní úpravy. 1 a) 0,5 + 0,5i; b) 1 +4i; c) -1 -0,5i; d) 8 + 2i. a) -l+8i; b) i; c) 1; d) 6-4i. a) -1 -2i; b) -3+6i; c) -3i, 2-3i; 3 13 1 2 \/2 d)-4-5i. C Ano. - a) 2+i, 2-i; b)-1 +3i,-1 ~3i; c) - + -i, - --i; d)-- + ^-i, 2 J2 _ 4 ---^-i. ;;':Plati;žex2 + c = .r2 + \/c2= (x+iy/c) (x-iy/č). a) ±3i; b) ±-i; c) ±i; d) ±y/2i. 7a)-4+2v/2i,-4-2\/2i;b) l + Vě\, l-VEi; c) -1-V2i, -1 + d) ±y/3i. a) (z-2+3i)(z-2-3i); b) (z-5+4i)(z-5-4i); c) (z + 3+v/2i) (z + 3-v/2i); d) (z-^ + ^fi) (^""T*)" a) Kořeny reálné pro q e (—oo; 4), imaginární pro q £ (4; co); b) reálné pro q G (—oo; 0) U (8; co), imaginární pro q £ (0; 8); c) reálné pro q e (-3; 3), imaginární pro q e (-oo; -3) U (3; oo); d) reálné pro q € (0; 1), imaginární pro q e (-oo; 0) U(l; oo). : a) 2, -1 + \/3i, -1 -\/3i; b) 4, -2+2VŽI -2-2v/3i; c) ±\/3, ±\/3i; d) ±2, ±2i. 11 a) ei25X, e^K, 212 edky úloh a cvičení e1!*; b) ete, e1!, e1!K; c) c^.e'*". e'i71; d) e1!, e1^, e^71. 12 a)-5, | + y^i, J-^i; b) 3.-^^ i. 3Y> i;c) 2, -2, 1 - VŠi, 1 + VŠÍ,-1 -VŠi,-1 + VŠi; 2 22 22 2 / 7t + 2fcn: iz + 2kn\ 1 v/3 ď)xk = 2 cos +isin—j— ]. Ä - O.....7. la) ±1, ±i; b) ±1, - + y 8 8 J 22 1 ^i, l+^i, l_^i;c) ±3 3 ;d)2,-l + VŠi,-l-V3i. 2 22 22 222' 1.10 Úlohy k opakování a)-3;b) 1; c) 0,2; d) -2,8. a) 10; b) -5- 15i; c) -1,5-0,5i; d) 0,5-G,5i. *3 Návod: Použijte algebraické tvary čísel u, v, u, v. 4 a) \/ľ7; b) 5%/2; c) vTÔ; d) V2Ô~- 5 a) Neexistuje žádné a; b) body náležející kruhu se středem v obrazu čísla -i a poloměrem 6; c) body roviny bez kruhu se středem v obrazu čísla 3 +i a poloměrem 4; d) mezikruží se středem v obrazu čísla 3 a s hraničními kružnicemi o poloměrech 1 a4. 8 a) |z-1 -i| = 2; b) |z-l+i| > 7; c) \z- 1 -i| = \z- 1 +i|; d)2< lz-1+ij < |z-l-i|. a)2 + i:b)-6 + i;c) 14; d) 35+1,5i. a) l±3i; 7 7 b) -2±4i. 9 a) 2i; b) 0, nelze vyjádřit v goniometrickém tvaru; c) cos y+ 1 sin -tc; d) cos ^Tt+isin^rc. 0 a) -y/2; b) -2. 1 a) eli\ b) 2ei57t; c) 0,5e'i"; d) V2VK 12 a) 16 -5i; b) - + y i; c) 1; d) i +2i. 13 a) Trojúhelník; b) čtyřúhelník; 3 c) pětiúhelník; d) osmiúhelník. 14a) ±2i, VŠ±i,-VŠ±i;b)-4i, 2 (±VŠ+i); c)--, \ (l ± VŠi); d) ^ ± ^i, ± ^i. ■ a) 1 -i; b) 3-i; c)* = a+(«-2)í, VŠ. .. . s/6. .- . /5 a G R; d)-0,5+0,51 16a) - : -y i: b) l ■ \ i. ' a)m e 00J ;b)m e (1; 00). 18 a) ±2i, ±V5; b) ±V2, ±VŠi; c) -l, 2, X-± ™i, -1 ± x/Ši; d) ±1, \ ± —i, 1 /"K ÍO /'I 1 F~K -x ± ~-i. 19 a) 0, ±1, ±i; b) 1, ±--- ± ~-i. -- í ^-i; c) 2, -1 ± VŠi, ±1, ±i; 2 2 2 2 2 2 d)±V2,±V2í,-3y±^i. 2. Kombinatorika 2.1 Základní kombinatorická pravidla 1 5-3-4,3-2-4. 25-4. 3 9-8-7-6. 4 32-28,32-24. Jisté to není. 2.2 Permutace I 61-2-5!. 5!7!. 3n = 4. 42-4!. 5 a) 3 • 10! (1-2 • 11+3 • 11 • 12); *\ n « + 3 b) , c) —r-; d) n. (n+1)! n-2 2.3 Variace 1V(3,8). 2V(l>5)+V(2,5)+V(3,5)+2-V(3,4). 3V(3,5). 4V(6,10). 5V(3,5). 2.4 Kombinace í)-Q- i 10\ .„ /6\ , _ /14 2 " U'+4 2.5 Vlastnosti kombinačních čísel, Pascalův trojúhelník * = 8' (o '700\ /699 ,690 J > l 9 1,8, 28, 56, 70, 56, 28, 8, 1. 2.6 Binomická věta j3 3a2 2<2 1 a) x]S- 10x12 +40x9-80-r6 + 80x3-32; b) 99 + 70\/2; c)—- — + —-- —+ . 16 2b 2bz bó b4 d) 1 - 9x+27x2 - 27jc3 . 2 0,90. 3 y/3 64 72 = " 3_V3 ~~64~' I2)-S9. 4 Čtvrtý člen,-T 23-43. 2.7 Úlohy k opakování I 1 10 účastníků. 2 - • 5!, 4!. 3 4!. 4 Prvků bylo původně 5. 5 2. 12 Všech podmnožin je 26, tříprvkových je 15 b) 15 16 32-24. 12\ v8 14 V(4,5). 19 a) ( " )3!3!; 2.8 Permutace s opakováním 8! 8! II! 2!2!2!' 2!2!2!' 7! 5!2!2! 2!2!' „5! ,5! ä 2---2- —. 2!2! 2! II! 10! 4!4!2! 4!4!2! 214 sledky úloh a cvičení 2.9 Variace s opakováním V/(6.2) + V/(5,2) + V'(4.2) + V'(3,2) + y/(2.2) + V/(l,2). 24-54. 3 35. 4jc=10. 5 45. 2.10 Kombinace s opakováním AAAA, AAAB, AAAC, AABB, A ABC, AACC, ABBB, ABBC, ABCC, ACCC, BBBB, BBBC, BBCC, BCCC, CCCC. 2#'(5,2). 3 A'(3.5>-1. 4K'(4,3)-\. 5^(3.6). 2.11 Úlohy k opakování II 6' 7' 8' 10' 12!4f 24!3f 34!4!" 4 2Í2T3! 5K'^ 6 8 Všech možných pokusů je V'(5,15). 9£'(3,4)-4. 16 \ 431 2 j" ~7Ä~ / 'T\ •25 + \ 2 3. Pravděpodobnost 3.1 Náhodné pokusy a náhodné jevy 1 16 (čtyřčlenné variace s opakováním ze dvou prvků). 2 a) 21 (dvoučlenné kombinace s opakováním ze šesti prvků); b) 36 (dvoučlenné variace s opakováním ze šesti prvků). 3 1 320 (tříčlenné variace bez opakování z 12 prvků). 8! = 40320 (permutace z 8 prvků). D c) 11 příznivých elementárních jevů: C = {(1.6), (2,6), (3,6), (4,6), (5,6), (6,6), (6,5), (6,4), (6,3), (6,2), (6,1)}. E b) Je celkem 6 příznivých elementárních jevů: (A4,A¥), (A^,A4), (A^,A#), (AV,A4), (AV.AA), (A4.A*). a) A c B, C c B, mezi jevy A a C není žádný vztah (např. 14 není dělitelné 4, např. 12 je dělitelné 4, ale nemá na konci 4); b) musí být sudá. 6 a) B = {(1,5), (2,4), (3,3), (4,2), (5,1)}; b) padne součet alespoň 7; c) A c C; d) jsou neslučitelné; e) B c C; f) padne součet menší než 6. i a) 15 (jednotlivé navzájem odlišné výsledky lze popsat např. pomocí čísel tahů, ve kterých byla vybrána bílá koule - to jsou dvoučlenné kombinace ze šestiprvkové množiny); b) 5 (tyto výsledky si můžeme představit jako uspořádané šestice (B,B,C,C,C,C), (B,C,B,C,C,C), (B,C,C,B,C,C), (B,C,C,C,B,Č), (B,C,C,C,C,B)); c) 3 (tyto výsledky si můžeme představit jako uspořádané šestice (B,B,C,C,C,C), (B,C,B,C,C,C), (C,B,B,C,C,Q); d) „během prvních tří tahů byla vylosována nejvýše jedna bílá koule" nebo také „v posledních třech tazích byla tažena alespoň jedna bílá koule"; e) 10 (obě bílé koule musí být taženy v prvních pěti tazích, tj. jde o dvoučlenné kombinace z pětiprvkové množiny); 1) B c C; g) bílé koule byly taženy v prvním a čtvrtém nebo v prvním a pátém tahu. a) ( * | =210; b) \\ ■ [Z \ = 90 (k libovolné dvojici chlapců vybrané z jejich celkového počtu šesti lze připojit libovolnou dvojici dívek vybranou z jejich celkového počtu čtyř): c) ( \ } • \\ + ( 6 j =95. 9 a) An B' n C'; b) An B n C; 3. Pravděpodobnost c)(AnB'nC^uíA'nBnC^uCA'nB'nOjd)(A B' iC') iA' B C') (A' B' Ci (A B C') (A B' C) iA' B C) íA B Ci = A B C: e) (A n B n C') u (A n B' n C) u (A' n B n C); f) (AnBnC')u(AnB'nC)u(A'nBnC)u(AnBnC);g) AnBnC; h) (A'nB'nC')u(AnB'nC)u(A'nBnC')u(A'nB'nC)u(AnBnC')u u (A n B' n C) u (A' n B n C) = (A n B n C)'. 3.2 Pravděpodobnost - základní pojmy 2 a) ™; b) 7 (padne s pravděpodobností ^). 3 |. 4 a) 1,21 %; b) 0,45 %; c) 5,88 %. 5 P(A) = 0,770, P(B) = 0,164, P(C) = 0,066. 6 4,3 %. 0.4. Bji. 3.3 Základní pravidla pro výpočet pravděpodobnosti 6,1 %. 2 62,5 %. 3 a) 39,91 %; b) 46,05 %; c) 13,16 %; d) 0,88 %; e) 0 (nemožný jev); f) 60,09 %. 4 P(A) = P(umí právě dvě) + P(umívšechny) = 0,4680 + 0,2808 = 74,88 %. M8^ „ ti(12,52-2.52) „ I 8 ) 9 5 v 3g2 ; =38,47 %. 6 9,75%. 7 a) 5 • ý—^- = — = 18,37 %; 47\ /900 K) -^ = 3,06%. 8 a) 10 %; b) 1 - A j^ = 41,02 %; loj ( 5 J 900\ /900\ /13 c) 1- ,v —i- =65,31 %;d) 1- / 2° \ =88.10%. 9 a)4-^—f- =0,198 %; /1000\ ' /1000\ ' f 52^ \ 10 ) V, 20 J 4\ /4 x5 48 V 3 7 V 2 / b) 13 ■ -y- = 0,024 %; c) 13 ■ 12 ■ = 0,144 %; d) nejpravděpodobnější 5/ V5 je jev a), nejméně pravděpodobný je jev b). 10 a) 74,83 %; b) 69,02 %, 4\ /8\ U\ /8\ /288N -3'2M4'^ =15.15%. 12a)l-Ä = '12\ /12\ /300x 5 7 V5 / V 20 288\ /12\ /288\ /282 40 / \ 1 / \ 39 / \ 20 b) 1" )nnn( - —^r^—1- = 49,23 %; c) A-f = 27,81 %; x300\ /300\ /300N 40 7 V 40 7 V 20 216 5. výsledky úloh a cvičení d) /282x V40/ /300 l 40 18 282 39 /300 V 40 = 27,78 %, 3.4 Podmíněná pravděpodobnost □ 29,58 %. 1|. 2 a) f; b) A. 3 ±. b) a) 11,54 %; P(problém zn áčka) Problém motor převodovka výfuk karoserie ostatní Značka H 19,59% 39,00 % 12,38 % 24,58 % 4,44 % L 11,54 % 63,19 % 8,79 % 13,19 % 3,30 % Vozy značky H mají častější poruchy motoru, výfuku a karoserie oproti vozům značky L. Vozy značky L mají zdaleka nejčastěji poruchy převodovky - tyto poruchy ..... 2 , , , , „ , „ _ 46 45 ,54 t v on temer — ze záručních oprav těchto vozu. 5 — • —. ba) b)— — — -' 13 ' 12 + 13 ' 12 e) -, tj. přibližně 33,33 % (1-0,04) -0,75 = 0,72. 50 49' 13 12' a) 1 %; b) 6 %; c) 3 %; d) 94 %; 3.5 Nezávislost jevů Ano. 2 Ne. 3 a) Ano; b) ano; c) ne. 430 350 P(A) = - = 0,86^(A|C)=_ = 0,875. Nejsou, protože např.: a) 1 -0,53 * 3 -0,53 = --;b) 4' /IV 1 c) I - I = —7; d) ne, počet losování muže být teoreticky libovolně velký. 0,8-0,9-0,7 = 0,504. 52,67 %. a) 0,1 ■ 0,85 • 0,95 + 0,9 - 0,15 ■ 0,95 + 0,9 ■ 0,85 • 0,05 = 0,247 25; b) 0,24725 + 0,9 ■ 0,85 ■ 0,95 = 0,974. a) 2 • 0,55 • 0,02 + 2 ■ 0,35 ■ 0,05 = b) 3 ■ 0.552 ■ 0,05 + 3 • 0,552 ■ 0,35 + 0,553 = 0,529 4. i i 0,9 ■ (1 -0,2 ■ 0,3) = 0,9 + 0,1-0,8-0,7 = 0,956. a) 24,61 %;b) 17,62 %; c) 14,45%. 14 a) 32,77 %;b) 20,48%. 15 a) 18,40 %; b) 26,42 %. 16 92,98%. 1 ~ 16' 16 %. 0,057; = 0,846. 11,30%. a)JcT2'5%; 3.6 Upíná pravděpodobnost, Bayesův vzorec 10 _ 5 10 10 6 10 8 9 10 _ 5 a)24~T2' ^3'C) 23'24 + 23'24 + 23 ' 24 ~ 12' 5 5 b)y— -0,5 + — -0,5 = 2.67%. 3a)0,1 • 0,8• 0,7+0,9• 0,2• 0,7+0,9• 0,8• 0,3 = 0,398; b) 0,1 ■ 0,2 ■ 0,7 + 0,1 • 0,8 • 0,3 + 0,9 • 0,2 • 0,3 = 0,092; c) 0,1 - 0,2 • 0,3 = 0,006; d) 0,25 • 0,398 + 0,6 ■ 0,092 + 0,9 • 0,006 = 0,1601 = 16,01 %. 0,0005 0 9009 E a) n nnn'c „ nAnc - 1 %, tyto jevy jsou nezávislé; b) „ - = 99,97 %. 0.0005 + 0,0495 0.0003 + 0.9009 3. Pravděpodobnost 217 Sdruženou pravděpodobnost u první větve vydělíme součtem sdružených pravděpo- 0.9 • 0.95 dobností u první, třetí a páté větve; viz obr. V.4. 5 — „ ' _———= 97,71 %. 0,9-0,75 0,9-0.75 + 0.2-0,25 = 93,1 %. není v normě linka A 0,05 0,40 je v normě 0,95 není v normě linka B 0,04 0,45 je v normě 0.96 není v normě linka C 0.02 0,15 je v normě 0,98 Obr. V.4 0,9-0,95+0,1-0,2 0,020 0,380 0,018 0,432 0,003 0,147 3.7 Úlohy k opakování 1 a) Vybereme-li rezavý šroub s pravotočivým závitem; b) jsou-li všechny šrouby rezavé a mají-li všechny levotočivý závit; c) jsou-li všechny součástky s pravotočivým závitem rezavé; d) jsou-li všechny matice rezavé a není-li ani jeden šroub rezavý; 14 e) ne; f) vybraná součástka je šroub nebo rezavá matice. 2 0,02. 7 (200-25\/2)2 4 a) 25 %; b) — = 43,75 %; c) 1 - ^-—2—'— = 32,23 %, ano; 63" 5 a) 38,4 %; b) 9,6 %; c) 0,8 %; d) 51,2 %. 16 d) 2-0,3223- —= 58,21 %, ano. 16 4 6 Pro dvě kostky je pravděpodobnost rovna — = 11,11%; pro tři kostky je pravděpo- 25 72 dobnost o něco větší, je rovna — = 11,57 %. 7 — = 83,7 %. 8 a) 82 %; b) 11 %; c) 47,8 %, předpokládalo se, že se jednotliví zákazníci rozhodují nezávisle na sobě; d) z daných informací ne - není rozumné předpokládat, že by jednotlivá rozhodnutí jednoho zákazníka byla na sobě nezávislá. 9 a) 8,46 %; b) 42 %. 10 a) 0,001 84 %;b) 0,09686 %; c) 1,765 %. 11—. 12 Ne. 13 83,35 %, vzrostla by o 2,2 %. 1411. 15 99,5 %. 16 0,49 %. 17 a) 2,77 %; 0 87 ■ 0 72 • 0 35 b) 32,83 %. 18 087.072.0,35 + 0,87 • 0,28 ■ 0,65 + 0,13 • 0,72 • 0,65 = 50,01 %' 218 5. výsledky úloh a cvičení 19 a) 0,8-0,8+0,2-0,75 = 0,79 = 79%; b) ^=^- = 81,01 %. 0.79 20 0,3 0,92 0,3-0,92+ 0.7-0,78 = 33,58 %. 4. Statistika WBĚĚĚĚ fr-:;;-'-;:-',-:- fĚĚBBĚĚ 4.1 Základní pojmy - statistická jednotka, statistický soubor a znak 1 Kvantitativní znaky jsou stáří vozu, počet najetých kilometrů a počet dnů, po který byl vůz v bazaru od jeho převzetí do prodeje; kvalitativní znaky jsou značka vozu, model a barva. 2 Kvantitativní znaky jsou doba montáže a hmotnost; kvalitativní jsou linka a ohodnocení kvality. 4.2 Rozdělení četností a jeho grafické znázornění 1 Viz obr. V.5. 2 Viz obr. V.6. " □ ČSSD □ ODS □ KSČM □ TOP 09 □ vv Obr. V.5: Složení Poslanecké sněmovny ČR po volbách v roce 2010 4. Statistika -1 q o 5 o 3 4 5 6 Počet rodinných příslušníků Obr. V.6: Rozdělení zaměstnanců firmy podle počtu rodinných příslušníků 3 Viz obr. V.7. Prac. třída Četnost Relativní četnost Kumulativní četnost Kumulativní relativní četnost 3 2 2,67 % 2 2,67 % 4 11 14,67 % 13 17,33 % 5 18 24,00 % 31 41,33% 6 28 37,33 % 59 78,67 % 7 16 21,33 % 75 100,00% Celkem 75 100,00% — — 30 25 20 15 10 5 0 .Ľ_J 3 Pracovní třída Obr. V.7: Rozdělení pracovníků do pracovních tříd 220 5. výsledky úloh a cvičení 4. Rozložení dat je téměř symetrické (histogram ukazuje jen nepatrné sešikmení doprava); viz obr. V.8 a V.9. Výška Četnost Relativní četnost Kumulativní četnost Kumulativní relativní četnost 166-170 10,00 % 2 10,00 % 171-175 5 25,00 % 7 35,00 % 176-180 8 40,00 % 15 75,00 % 181-185 4 20,00 % 19 95,00 % 186-190 1 5,00 % 20 100,00 % Celkem 20 100,00 % — — 9 T 8 7 6 I § 5 J I 4 I 166-170 171-175 176-180 181-185 186-190 Výška/cm Obr. V.8: Rozdělení studentů podle výšky □ 166-170 H 171-175 □ 176-180 □ 181-185 □ 186-190 Obr. V.9: Relativní četnosti vvšek studentů 5 Data vykazují poměrně výrazné sešikmení doleva; viz obr. V. 10. Pevnost Četnost 11,8-12,2 1 12,2-12,6 2 12,6-13.0 6 13,0-13,4 9 13,4-13,8 6 13,8-14,2 8 Celkem 32 4.3 Charakteristiky polohy 1 Kepr, neboťxi = 40,06 kg • cnT1 < x2 - 40,62kg • cm-1; medián pro pevnost plátna: x] = 40,3kg • cm"1, medián pro pevnost kepru: x2 = 41,0kg • cm-1. 2 x - 12 dnů, x - 3 dny, x = 0 dnů; medián je zde nej vhodnější (průměr je příliš velký díky extrémní hodnotě; modus není reprezentativní, protože jen jediné číslo se v souboru opakuje, a to jen jednou, ostatní hodnoty se navzájem liší). 3 x = 3,504, x = 4, x = 4. 4 x = 5,6, x = 6, x = 6. x = 7.61 pH, x = 7,6 pH, x neexistuje. 6x = 0,1685, x = 0,170, x = 0,170. Koeficient trení Četnost Kumulativní četnost 0,150 3 3 0,155 2 5 0,160 9 14 0,165 10 24 0,170 11 35 0,175 6 41 0,180 5 46 0,185 2 48 0,190 1 49 0,195 1 50 Celkem 50 — 7x = 2752,18Kč. 8x = 2,135. 9 a) 1,238, tedy 123,8 %; b) 101 500 Kč a 125 700 Kč; c) 1,414, tedy 141,4 %; d) 115 900Kča 163 900 Kč. 10x40 =*(8)+0,4- [x(9)-X(8)] = 7,54pH, x60 = x(12)+0,6- [x(13)-x(i2)] = 7,7pH. 11 x25 = 0,16, x75 = 0,175. 4.4 Charakteristiky variability 1 fl = 0,8, MATA = 7,8-7,4 = 0,4. 2 R = 0,045, MKR = 0,175-0,16 = 0,015. Rozpětí se zmenší o 2 velikosti, z 8 na 6; mezikvartilové rozpětí se nezmění, zůstane rovno dvěma. 4 cr2 = 0,0599, a,, = 0,2447. 5 a2 = 6,0335, an = 2,4563. 6 rr„ =0,009811. x = 4,6699, x-4,x = 4, R = 6, MKR = 6-3 = 3, a2 = 3,1338, 222 úloh a cvičení 10 o c 1.1,8-12,2 12,2-12,6 12,6-13,0 13,0-13,4 13,4-13,8 13,8-14,2 Pevnost/MPa Obr. V. 10: Histogram četností hodnot pevnosti v tahu za ohybu a„ = 1,770 2. Průměrný obsah látky v zemině v celé oblasti je asi 0,285 9 mg • kg~x; rozptyl odhadujeme číslem 0,054 0804 (pozor - k tomuto odhadu je třeba použít výběrový rozptyl!); směrodatná odchylka je asi 0,234 1 mg - kg"' (opět je třeba použít výběrovou směrodatnou odchylku). 9 V = 3,22%. V = 5,82%. 11 Porovnejte variační koeficienty! 12 Va = 43,7 % > VB =24,8 %, výroba tedy byla rovnoměrnější v závodě B. 4.5 Přibližný výpočet charakteristik polohy a variability x = 10,88, al = 45,5005, an = 6,7454. 2 x = 191,35 h, an = 27,181 h. 3x = 3,0192s, an = 1,1937s, V = 39,54%. 4% = 192+ 38~36 ■ 22 = 193,7, 26 x25 = 169+ ~ • 22 = 174,7, x75 = 192+ _~ • 22 = 209," _ . 62,35 30 23 58,9-8 87 = 2,078; 26 0,95 = 1,556. a) Průměrný prospěch třídy odhadujeme jako Interval Střední hodnota Četnost Kumulativní Součin prospěchu intervalu x* «i četnost x* ■ m 1,0-1,49 1,245 5 6,225 1,5-1,99 1,745 8 13 13,960 2,0-2,49 2,245 11 24 24,695 2,5-2,99 2,745 4 28 10,980 3,0-3,49 3,245 2 30 6,490 Celkem — 30 — 62,350 b) x2o = 1,5+ • 0.49 = 1.574. 4.6 Korelace Graf neukazuje silnou závislost, ale jen slabou pozitivní vazbu, rxy = 0,4148; viz obr. V.ll. 2a)Jč = 174,53 cm, y = 174,67 cm, výška synů v porovnání s jejich otci tedy v průměru neklesla ani nevzrostla; xan = 6,109 cm, yan = 6,600 cm, variabilita výšky synů je tedy trochu větší než variabilita výšky jejich otců; b) graf ukazuje poměrně výraznou pozitivní závislost - větší výška otce má zpravidla za následek větší výšku syna a naopak (i když v daném souboru je řada výjimek); viz obr. V. 12; c) rxy = 0,7717. u "ó? > "E Si o > o 3500 3000 SI 2500 ♦ ♦ 2000 1500 1000 500 200 400 600 800 1000 Najeté kilometry Obr. V. 11: Závislost mezi provozními výdaji a najetými kilometry 190 185 5 180 Z 175 > 170 165 ♦ 160 160 165 170 175 180 185 Výška otce/cm Obr. v. 12: Závislost výšky syna na výšce otce 190 224 ýsledky úloh a cvičen 4 a) rxy = 0.4325, tedy mezi výdaji na reklamu a tržbami je určitá pozitivní závislost, není však příliš silná; b) ano, statistická závislost mezi měsíčními výdaji na reklamu a tržbami v následujícím měsíci je výrazněji pozitivní - příslušný korelační koeficient je rxv = 0,7711, což je větší hodnota než v a). 4.7 Úlohy k opakování Viz obr. V. 13 a V. 14. 0 4-------- --------------- -------- Angličtina Němčina Ruština Obr. V. 13: Polygon četností volených jazyků □ Angličtina □ Němčina □ Ruština Obr. V. 14: Relativní četnosti volených jazyků 4. Statistika Viz obr. V. 15 a VI6. Hmotnost dávky/kg Četnost Relativní četnost Kumulativní četnost Kumulativní relativní četnost 0,96 4 13,33 % 4 13,33 % 0,97 3 10,00 % 7 23,33 % 0,98 5 16,67 % 12 40,00 % 0,99 4 13,33 % 16 53,33 % 1,00 6 20,00 % 22 73,33 % 1,01 3 10,00 % 25 83,33 % 1,02 2 6,67 % 27 90,00 % 1,03 3 10,00 % 30 100,00 % Celkem 30 100,00 % — — 7 6 5 tá 4 c c S 3 72966000 618500 - 118' 0,96 0,97 0,98 0,99 1,00 1,01 Hmotnost dávky/kg Obr. V. 15: Histogram četností 100000 1,02 1,03 26 = 3 846. 5 Průměrné tempo růstu bylo zg = \/2-1,7-1,5 = 1.721, spotřeba v roce 2009 byla 5,lkrát větší než v roce 2006. 6 14,87 %. 7 x = 5,183 3 cm,* = 5,185 cm, a„ =0,052493cm, V= 1,01 %. 8 x = 2,0573,x = 2,05, R = 0,1, 400 U 300 - 200 - 100 - 0 - J? «5 Věk Obr. V. 18: Rozdělení mužských účastníků výročního závodu Běchovice - Praha podle věku 228 výsledky úloh a cvičení Seznam užitých symbolů a značek i imaginární jednotka j imaginární jednotka (v elektrotechnice) Re a reálná část komplexního čísla a Im a imaginární část komplexního čísla a \a\ absolutní hodnota čísla a a komplexně sdružené číslo k číslu a a* komplexně sdružené číslo k číslu a (v elektrotechnice) -a opačné číslo k číslu a a' převrácené číslo k nenulovému číslu a převrácené číslo k nenulovému číslu a a {/ä n-tá odmocnina z nezáporného reálného čísla a (ij/a)c n-tá odmocnina z komplexního čísla a a = {a\, 0-2) vektor o má souřadnice a\, 02 D diskriminant kvadratické rovnice p A q konjunkce výroků p, q (p a zároveň q) p ^ q ekvivalence výroků p, q (p je ekvivalentní s q; p právě když q) P(ri) počet všech permutací z n prvků n! n faktoriál V(k, ri) počet všech ^-členných variací z n prvků K(k, ri) počet všech ^-členných kombinací z n prvků n\ kombinační číslo n nad k k) P'(k\,k2, ■■■■,kn) počet všech permutací z n prvků, v nichž se jednotlivé prvky opakují ^! -krát, &2-krát, ..., &„-krát V'(k. n) počet všech ^-členných variací s opakováním z n prvků K'(k,ri) počet všech ^-členných kombinací s opakováním z n prvků Q jistý jev 0 nemožný jev A, B, ... náhodné jevy uěA elementární jev tu je příznivý jevu A A C B jev A je podjevem jevu B A' opačný jev k jevu A Au B sjednocení jevů A a B AnB průnik jevů A a B 230 Seznam užitých symbolů a značek A\B rozdíl jevů A a B PÍA) pravděpodobnost jevu A n počet všech stejně možných výsledku náhodného pokusu "(A) počet výsledků příznivých jevu A /V počet nezávislých opakování náhodného pokusu yV(A) počet výskytů jevu A v sérii N nezávislých opakování náhodného pokusu M(A) míra množiny A P(A|B) podmíněná pravděpodobnost jevu A jevem B pravděpodobnost zdaru v binomickém rozdělení pravděpodobnost nezdaru v binomickém rozdělení, q-\-p n rozsah statistického souboru -M j -^2; • • • > -^n jednotlivé (ne nutně navzájem různé) hodnoty znaku x, tvořící statistický soubor ■X"| » ? " * " í "^j" navzájem různé hodnoty znaku x četnost hodnoty x* aritmetický průměr hodnot znaku x .Ť medián hodnot znaku x X(D- *(2)j • • •; x(n) (vzestupně) uspořádaný soubor hodnot znaku x X modus hodnot znaku x W\, W2, • • •, Wr váhy navzájem různých hodnot znaku x •W vážený průměr hodnot znaku x ŽG geometrický průměr čísel z.\, zo, ■ ■ ■, zn X p /^-procentní kvantil hodnot znaku x % dolní kvartil hodnot znaku x *75 horní kvartil hodnot znaku x i? rozpětí statistického souboru MKR mezikvartilové rozpětí statistického souboru °l rozptyl hodnot znaku On směrodatná odchylka hodnot znaku -U výběrový rozptyl hodnot znaku 0"«-! výběrová směrodatná odchylka hodnot znaku y variační koeficient hodnot znaku koeficient korelace mezi znaky x a y Seznam užitých symbolů a značek 231 Literatura Calda, E., Dupač, V.: Matematika pro gymnázia - Kombinatorika, pravděpodobnost. statistika. Prometheus, Praha, 2012. Calda, E.: Matematika pro gymnázia - Komplexní čísla. Prometheus, Praha, 2011. Calda, E.: Matematika pro netechnické obory SOS a SOU, 3. díl. Prometheus, Praha, 2012. Calda, E.: Matematika pro netechnické obory SOS a SOU, 4. díl. Prometheus, Praha, 2010. Calda, E., Hebák, P, Petránek, O.: Matematika pro SOS a studijní obory SOU, 4. část. Prometheus, Praha, 2011. De Veaux, R. D., Velleman, P. E, Bock, D. E.: Intro Stats. Pearson International Edition, Addison Wesley, 2009. Groebner, D. E, Shannon, P. W., Fry, P. C, Smith, K. D.: Business Statistics. Prentice- -Hall, Upper Saddle River, New Jersey, 2001. Hála, M., Jarušková, D.: Pravděpodobnost a matematická statistika 12 - Příklady. ČVUT, Praha, 1998. Hátle, J., Kahounová, J.: Úvod do teorie pravděpodobnosti. SNTL, Praha, 1987. Hildebrand, D. K., Ott, R. L.: Statistical Thinking for Managers. Duxbury Press, Pacific Grove, California, 1998. Plocki, A., Tlustý, P.: Pravděpodobnost a statistika pro začátečníky a mírně pokročilé. Prometheus, Praha, 2007. Ráb, M.: Komplexní čísla v elementární matematice. 2. přeprac. vyd. Masarykova univerzita, Brno, 1996. Rublík, F: Základy pravdepodobnosti a statistiky. ALFA, Bratislava, 1983. Pro exkurze do historie Bečvář, J., Fuchs, E. (ed.): Matematika v 16. a 17. století. Dějiny matematiky, svazek 12. Prométheus, Praha, 1999. Inspirace pro příklady z fyziky Blahovec, A.: Elektrotechnika I. Informatorium, Praha, 2010. © Zdeněk Drozd - str. 22, 23 © Alessandro Contadin/Fotky&Foto - str. 67 © BVDC/Fotky&Foto - str. 73 © Andy-pix/Foťky&Foto - str. 74 © Jimi King/Fotky&Foto - str. 91 horní fotografie © Imre Forgo/Fotky&Foto - str. 98 horní fotografie © Alex/Fotky&Foto - str. 119 © Milan Surkala/Fotky&Foto-str. 140 © Trevor Allen/Fotky&Foto - str. 202 © Jaroslav Nezbeda - str. 95 © Robert Kubín - str. 99 © Veronika Nešverová - str. 68, 91 dolní fotografie, 98 dolní fotografie, 102, 105, 110, 112, 121, 131, 138, 144, 145, 148, 152, 159, 191, 201 Fotografii na str. 203 ze závodu Běchovice - Praha poskytl časopis Atletika. Rejstřík bsolutní hodnota komplexního čísla, 14 anagram, 92 argument komplexního čísla, 35 - základní, 35 Bernoulliovo schéma, 134 binomické rozdělení, 134 binomický rozvoj, 85 bod Gaussovy roviny, 10 četnost hodnoty znaku, 150 - jevu relativní, 111 - kumulativní, 154 - kumulativní relativní, 154 - relativní, 151 číslo imaginární, 11 - kombinační, 76 - komplexně sdružené, 17 - komplexní, 10 - opačné, 18 - převrácené (reciproké), 27 - ryze imaginární, 12 diagram bodový, 195 - kruhový, 152 - sloupkový, 150 - spojnicový, 154 aktoriál 69 geometrická definice pravděpodobnosti, 112 geometrický význam absolutní hodnoty, 15 graf bodový, 195 - koláčový, 152 i istogram četností, 150 - skupinového rozdělení četností, 161 arakteristika polohy, 162 maginární část komplexního čísla, 10 - osa, 10 interval kvantilový, 192 - modálni, 192 ■ednotka imaginární, 15 - komplexní, 15 jev elementární, 103 - jistý, 104 - náhodný, 104 - nemožný, 104 - opačný, 105 - složený, 104 jevy neslučitelné, 105 - nezávislé, 127 -tice neuspořádaná, 76 - uspořádaná, 65 klasická definice pravděpodobnosti, 108 koeficient binomický, 85 - korelace, 197 - korelační, 197 - variační, 183 kombinace fe-členná z n prvků, 76 - Ä-členná s opakováním z n prvků, 96 kombinatorické pravidlo součinu, 65 - pravidlo součtu, 66 kvantil p-procentní, 172 kvartil dolní, 173 - horní, 173 edián, 163 míra množiny, 112 modus, 165 Morseova abeceda, 94 -tá mocnina komplexního čísla, 26 n-tá odmocnina komplexního čísla, 49 náhodný pokus, 102 d lehlé hodnoty, 164 Pascalův trojúhelník, 81 permutace z n prvků, 69 - s opakováním z n prvků, 89 podíl komplexních čísel, 28 podjev, 105 polygon četností, 154 pravděpodobnost náhodného jevu, 107 - jistého jevu, 114 - nemožného jevu, 114 - podmíněná jevu, 124 - sdružená, 125 pravděpodobnostní strom, 141 problém čtyř barev, 100 průměr aritmetický, 162 - geometrický, 169 - vážený, 168 průměrné tempo růstu, 169 přihrádkový princip, 67 •eálná část komplexního čísla, 10 - osa, 10 rovina Gaussova, 10 - komplexních čísel, 10 rovnice algebraická n-tého stupně, 60 - binomická, 57 - kvadratická se záporným diskriminantem, 56 - lineární, 54 rovnost komplexních čísel, 12 rozdělení četností, 150 234 RejstřIk Re - skupinové (intervalové), 157 rozdíl komplexních čísel, 13 rozpětí statistického znaku, 175 - mezikvartilové, 175 rozptyl, 176 - výběrový, 180 - základního souboru, 180 rozsah souboru, 148 sešikmení dat, 158 směrodatná odchylka, 176 - výběrová, 180 - základního souboru, 180 soubor statistický, 148 - uspořádaný, 163 - základní, 149 součet komplexních čísel, 13 součin komplexních čísel, 13 statistická definice pravděpodobnosti, 111 - jednotka, 148 statistický znak, 148 - kvalitativní, 149 - kvantitativní, 149 Sturgesovo pravidlo, 157 abulka četností, 150 - skupinového rozdělení četností, 157 tvar algebraický komplexního čísla, 16 - exponenciální komplexního čísla, 39 - goniometrický komplexního čísla, 35 plný systém vylučujících se jevů, 137 uspořádaná dvojice, 10 áhy hodnot, 168 variace ^-členná z n prvků, 72 - /.--členná s opakováním z n prvků, 93 vektor v Gaussově rovině, 33 věta binomická, 85 - Moivrova, 47 - o nezávislosti jevů, 127 - o úplné pravděpodobnosti, 137 - Velká Formátová, 100 - základní věta algebry, 60 výsledek příznivý, 105 vzorce Cardanovy, 63 - pro výpočet rozptylu, 172 - pro výpočet výběrového rozptylu, 181 vzorec Bayesův, 140 - obecný pro násobení pravděpodobností, 125 - obecný pro sčítání pravděpodobností, 117 - pro pravděpodobnost opačného jevu, 115 - pro sčítání pravděpodobností neslučitelných jevů, 115 Pp IQTŘÍI RNDr. Jarmila Robova, CSc. RNDr. Martin Hála, CSc. doc. RNDr. Emil Calda, CSc. Matematika pro střední školy Komplexní čísla, kombinatorika, pravděpodobnost a statistika Obálku a grafickou úpravu navrhl Miloš Jirsa Vydalo nakladatelství Prométheus, spol. s r. o., Čestmírova 10, 14000 Praha 4, roku 2013 teh/fax: 241740172 e-mail: odbyt@prometheus-nakl.cz http://www.prometheus-nakl.cz Edice Učebnice pro střední školy Odpovědná redaktorka RNDr. Eva Nešverová Sazbu programem MgX a obrázky programy GeoGebra a GIMP připravili RNDr. Vlasta Moravcová a RNDr. Luboš Moravec Vytiskly Tiskárny Havlíčkův Brod, a. s., Husova 1881, 58001 Havlíčkův Brod 1.vydání 0621418 ISBN 978-80-7196-425-4 Ml C£ I Modely a vědeckými funkcemi ^^#^^^31 a dvouřádkovým displeiem Příklady výpočtu komplexních čísel ve formátu pravoúhlých souřadnic (« * M Přiklad 1: 2 * (V3+/) = 2V3 + 2í = 3.464101615 ♦ 2í JMATHJ £}EtTIS!llJ®83mC0II) Příklad 2: *S /. 45 = 1 + í J**™J . (Úhlová jednotka: Deg) twin * 12H5 1+i displej s bodovou maticí 10 + 2 míst • 7 variabilních paměti • opravné funkce • výpočet zlomků • výpočty a převody v šedesátkové soustavě • statistické výpočty (standardní odchylka, regresní analýzy) • variace, kombinace • hyperbolické, inverzní hyperbolické funkce • transformace souřadnic • ENG konverze • editor statistických dat • exponenciální zobrazení • odhalení chyb • komplexní čísla • maticové výpočty • výpočty s vektory • integrály • diferenciály • výpočty rovnic • 40 vědeckých konstant • 20 metrických přepočtů • automatické vypnutí • 417 funkcí • bateriové napájení FX-570 ES PLUS GRAFICKÉ PROGRAMOVATELNÉ KALKULAČKY plně barevný podsvětlený LCD displej 216 x 384 • 61 kB RAM • 15 MB paměť typu Flash • ikonové menu • základní matematické funkce • komplexní čísla • Integrální a diferenciální počet • výpočty s maticemi • řešení rovnic i jejich soustav • pokročilá statistika • finanční matematika • výpočty s fyzikálními konstantami • grafické funkce s pamětí na 20 grafů vč. dynamických grafů - regresní grafy, grafy nerovností, dynamický graf, grafy kuželoseček, parametrický graf • analýza | na základě reálných obrázků • USB připojení k PC • propojení mezi jinými grafickými kalkulačkami CASIO FX-CG 20 Přiklad Statist Cke výpočty 0 3 E5DEIÍSHEET she a b c istatis Ialgebb calcul 2 kate bo 25 j 22 3 jack 60 841 68 4 bob 85 58 37 bill BS 901 80 60 UI9B!UPI!lBU9llia5M!IBSfL_Ě_J Príklady - grafy funkcí ta y -6 -5 -'i \iö lŕOÍÍER=-l>5-i---^ ;dx=-7.1468333 a=7. =2!......i-14583333 Analýza průběhu i obrázku 1 info@fastcr.cz GL m m 3 í i PROMETHEUS 0621418 isbn 978-80-7196-425-4 198.00' 9788071964254