Statistika
4.1  Základní pojmy - statistická jednotka, statistický soubor a znak
Statistika se zabývá shromažďováním a vyhodnocováním údajů získaných na dostatečně velkém souboru objektů. Těmito „objekty" mohou být nejrůznější lidské výrobky (šroubky, auta, počítače, ...), předměty živé i neživé přírody kolem nás (zemina, stromy, ryby, zvěř,...), ale i lidé (obyvatelé určitého města, klienti určité banky,....). Základní úlohou statistiky je ze zjištěných údajů získat přehledný obraz o celku, ze kterého soubor pochází, a pokusit se popsat zákonitosti, kterými se tento celek řídí.
Statisticky soubor je souhrn objektu, které statisticky zkoumáme, od kterých máme k dispozici údaje o jejich určité vlastnosti nebo jevu. Tato vlastnost nebojev je tzv. statisticky znak. Jednotlivé prvky statistického souboru jsou statistické jednotky, jejich počet udává tzv. rozsah souboru.
Zkoumáme přesnost soustruhu vyrábějícího matice. Co bude pro nás statistickým souborem, statistickou jednotkou a zkoumaným znakem?
ŘEŠENÍ: Statistický soubor bude množina matic vysoustružených testovaným strojem, u kterých provedeme přeměření. Jednotkami j sou jednotlivé matice z tohoto souboru. Zkoumaný statistický znak může být např. vnitřní průměr závitu.
V rámci předvolebního průzkumu si u skupiny respondentů zaznamenáváme pohlaví, ptáme se na věk, vzdělání a preferovanou politickou stranu. Co je zde statistickým souborem, statistickou jednotkou a zkoumaným znakem?
ŘEŠENÍ: Statistický soubor je skupina lidí (respondentů), od kterých získáme potřebné údaje. Statistické jednotky jsou jednotlivé osoby v tomto souboru. Statistické znaky zjišťované u každé jednotky jsou zde čtyři: pohlaví, věk, vzdělání a preferovaná politická strana.
148
Statistika
Již jsme uvedli, že /.úkladní statistickou úlohou je získat přehledný obra/, o celku, ze kterého zkoumaný soubor pochází. Na základě údajů z daného souboru chceme činit věrohodné závěry o důležitých vlastnostech tohoto celku.
V úloze A je tímto celkem (tzv. základním .souborem) množina úplně všech matic vyrobených zkoumaným soustruhem. Proto zkoumaný statistický soubor bude jen malou podmnožinou tohoto celku. Přesně změřit všechny vyrobené matice by bylo velmi pracné. Přesto bychom rádi na základě dat naměřených na omezeném souboru učinili spolehlivý závěr o kvalitě všech vyrobených matic, např. bychom chtěli odhadnout podíl deléktních matic.
V úloze B je základním souborem množina všech voličů v naší republice. Opět není dost dobře možné o každém člověku z tohoto základního souboru zjistit všechny výše uvedené znaky, zkoumaný statistický soubor bude sestávat z množiny několika set (náhodně) vybraných osob. Na základě zjištěných údajů bychom však chtěli odhadnout volební výsledky jednotlivých stran, zjistit, jak závisí preference těchto stran na pohlaví, věku a vzdělání apod.
Statistické znaky zkoumané na jednotkách statistického souboru mohou být nejrůz-nější povahy. Z hlediska statistických metod, o kterých budeme v dalších článcích pojednávat, je důležité porozumět následujícímu členění.
Statistický znak je kvantitativní, jestliže ho lze vyjádřit číselnou hodnotou.
V úloze A je zkoumaným znakem průměr závitu, který je samozřejmě kvantitativní -je vyjádřen číselně, např. v mm. V úloze B je kvantitativním znakem věk respondenta. U kvantitativního znaku musíme znát jednotky, ve kterých je vyjádřen, můžeme jednotlivé statistické jednotky (matice, respondenty, ...) seřadit podle velikosti tohoto znaku, má smysl určovat průměrnou hodnotu tohoto znaku pro celý statistický soubor atd.
Statistický znak je kvalitativní, jestliže jeho hodnoty nejsou čísla, ale určité kategorie.
V úloze B jsou všechny znaky s výjimkou věku kvalitativní - znak pohlaví má dvě možné hodnoty (muž, žena), znak vzdělání může nabývat několika hodnot (základní, středoškolské, vysokoškolské, jiné), znak preferované strany pak má jako své možné hodnoty názvy všech registrovaných politických stran.
U kvalitativních znaků nemůžeme jednotlivé statistické jednotky přirozeně seřadit podle velikosti, nemá smysl počítat např. průměrné pohlaví apod.
Cvičeni
MB Majitel autobazaru m dělá každý měsíc záznam) o všech prodaných vozech. U každého vozu zaeviduje mimo jiné značku vozu, model, barvu, stáří vozu, po-
4.1 základní pojmy - statistická jednotka, statistický soubor a znak
149
čet najetých kilometrů a počet dnů, po které byl vůz v bazaru od jeho převzetí do prodeje. Které ze zkoumaných znaků jsou kvantitativní a které jsou kvalitativní?
U každého vyrobeného přístroje v určité továrně se zaznamenává mimo jiné linka, na které byl přístroj sestaven, celková doba montáže, hmotnost přístroje a ohodnocení kvality přístroje ve škále „1. jakost", „2. jakost", „nevyhovuje". Které ze zkoumaných znaků jsou kvantitativní a které jsou kvalitativní?
4.2 Rozdělení četností
a jeho grafické znázornění
Budeme se nyní zabývat jedním statistickým znakem a některými, převážně grafickými metodami zpracování jeho naměřených hodnot. Začneme nejjednodušší situací, se kterou se setkáváme zejména (ale nejen) u kvalitativních znaků. Pro tyto znaky je typické, že nabývají zpravidla jen malého počtu různých hodnot, tyto hodnoty se však často opakují. Hlavním účelem těchto metod je data zpřehlednit, ukázat, které hodnoty jsou nejtypičtější, obecně řečeno zobrazit tzv. rozložení dat.
Do prvního ročníku vysoké školy bylo přijato 320 studentů středních škol různých typů. Počty studentů jednotlivých typů škol uvádí následující tabulka. Ze získaných údajů sestrojme histogram četností. Vypočítejme relativní četnosti a zobrazme je pomocí kruhového diagramu.
Škola	Počet studentů
Gymnázium	48
Obchodní akademie	20
SOŠ	160
SOU	92
Celkem	320
řešení: Zkoumaným znakem je zde typ střední školy, ze které student pochází. Jde o kvalitativní znak, který může nabývat jen čtyř různých hodnot, jež jsou uvedeny v levém sloupci tabulky. Tyto hodnoty se v daném souboru opakují s četnostmi, které jsou uvedeny v pravém sloupci tabulky. Celé tabulce říkáme tabulka četností.
Četností hodnoty znaku rozumíme počet statistických jednotek v daném souboru, pro které nabývá zkoumaný znak této hodnoty. Histogram četností (také se mu říká sloupkový diagram, v angličtině bar chart) je grafickou podobou tabulky četností. Tabulkou četností či histogramem četností je souhrnně vyjádřeno tzv. rozdělení četností.
Způsob sestrojení histogramu je zřejmý. Na vodorovnou osu vynášíme jednotlivé hodnoty znaku, nad každou z nich je sestrojen sloupek o výšce odpovídající příslušné
150
4. Statistika
četnosti. Pokud bychom měli k dispozici jen tento histogram a ne původní tabulku četností, mohli bychom jednotlivé četnosti zhruba odhadovat pomocí měřítka na svislé ose.
180 v:r:!rTr^-
160 |~
140 I
120 | 100
80 j
60 j
40 i
20 j i-1
0 i ._ 1-1     — I-
Gymnázium Obchodní akademie
Obr. 4.1: Histogram četností studentů z jednotlivých typů škol
Relativní četnosti jsou podíly (absolutních) četností a rozsahu souboru.
V našem případě je rozsah souboru roven 320 a např. relativní četnost studentů gym-48
názia je rovna = 0,15, tj. 15 %. Doplníme nyní snadno tabulku četností o sloupec s relativními četnostmi.
Škola	Četnost /ij	Relativní četnost
Gymnázium	48	15,00%
Obchodní akademie	20	6,25 %
SOŠ	160	50,00 %
SOU	92	28,75 %
Celkem	320	100,00 %
Relativní četnosti se většinou vyjadřují v procentech. Všimněte si, že jejich součet musíbýt roven l,tj. 100%. Kruhový diagram je pak grafickým zobrazením relativních četností.
			
	--------------		
			
			
			
			
			
SOŠ sou
4.2 Rozdělení četností a jeho grafické znázornění
151
M Gymnázium
B Obchodní akademie
□ SOŠ
□ SOU
Obr. 4.2: Grafické znázornění relativních četností
Kruhový diagram (v angličtiněpie chart, doslovně přeloženo „koláčovýgraf") se zkonstruuje tak, že se kruh rozdělí na výseče, jejichž obsahy jsou úměrné relativním četnostem.
Středové úhly jednotlivých výsečí kruhového diagramu získáme vynásobením celkového středového úhlu 360° příslušnými relativními četnostmi - např. středový úhel výseče odpovídající studentům gymnázia je roven 360° 0,15 = 54°. Všimněte si, že z kruhového diagramu nezjistíme původní (absolutní) četnosti, ale můžeme jen vyčíst četnosti relativní.
V úloze A jsme se zabývali rozdělením četností u kvalitativního znaku. Stejné metody se dají použít i pro kvantitativní znak, pokud nenabývá příliš velkého počtu různých hodnot - viz následující úloha.
V prodejně oděvů prodali během jednoho týdne celkem 46 obleků. Velikosti prodaných obleků jsou uvedeny níže. Zpracujme dané údaje do tabulky četností, vypočtěme též kumulativní četnosti, relativní četnosti a kumulativní relativní četnosti. Sestrojme pro tato data histogram a polygon četností.
39	41	40	42	41	40	42	42	40	43	42	41
43	39	42	41	42	39	41	37	43	41	38	43
42	41	40	41	38	40	40	39	41	40	42	40
41	42	40	43	38	39	41	41	42	45		
Řešení: Vidíme, že nejmenší prodaná velikost byla 37, největší45. Pro každou hodnotu od 37 do 45 je třeba určit počet opakování (můžeme si např. čísla 37 až 45 zapsat pod
152
Statistika
sebe do sloupce a vedle nich dělat čárky za každý výskyt v souboru). Výsledkem je následující tabulka četností:
Velikost obleku	Počet prodaných kusů (četnost)
37	1
38	3
39	5
40	9
41	12
42	10
43	5
45	1
Celkem	46
Histogram četností následuje na dalším obrázku. Všimněte si, že před posledním sloupkem je mezera, neboť hodnota 44 v našem souboru chybí (má nulovou četnost). Neudělat tuto mezeru v histogramu by bylo chybou. Zde vyšetřujeme kvantitativní znak, a jeho různé hodnoty je tedy třeba vynášet na vodorovnou osu v měřítku (na rozdíl od úlohy A, kde jsme vyšetřovali kvalitativní znak, a proto žádné měřítko na vodorovné ose nebylo).
Obr. 4.3: Histogram četností prodaných obleků
Z histogramu (ale samozřejmě i z tabulky četností) vidíme, že nejčastěji prodávaná velikost byla 41, histogram má téměř symetrický tvar.
4.2 Rozdělení četnost! a jeho grafické znázornění
153
Polygon četností (nebo také spojnicový diagram) je graf mající stejný význam jako histogram četností. Pouze místo sloupků zobrazujeme body, jejichž x-ovou souřadnicí je hodnota znaku a y-ovou souřadnicí je četnost. Tyto body se pak spojí lomenou čarou. Všimněte si, že hodnotě 44 s nulovou četností odpovídá bod na ose x.
Obr. 4.4: Polygon četností prodaných obleků
Stejně jako v předchozí úloze vypočteme relativní četnosti.
Kumulativní četnost určité hodnoty kvantitativního znaku je součtem četnosti této hodnoty a četností všech hodnot menších.
Např. kumulativní četnost hodnoty 40 je rovna součtu všech prodaných obleků s velikostmi od 37 do 40 včetně, tj. 1+3+5 + 9 = 18.
Kumulativní relativní četnosti jsou podíly kumulativních četností a rozsahu souboru.
Kumulativní relativní četnost hodnoty 40 je rovna — = 0,391 3, tj. 39,13 %. Tento
údaj nám říká, že přibližně 39 % prodaných obleků mělo velikost 40 nebo menší.
Všechny tyto druhy četností jsou uvedeny v následující souhrnné tabulce (údaje v procentech jsou zaokrouhleny na dvě desetinná místa).
154
4. Statistika
Velikost obleku	Četnost	Relativní	Kumulativní	Kumulativní relativní
X*	m	četnost	četnost	četnost
37	1	2,17 %	1	2,17 %
38	3	6,52 %	4	8,70 %
39	5	10,87 %	9	19,57 %
40	9	19,57 %	18	39,13 %
41	12	26,09 %	30	65,22 %
42	10	21,74 %	40	86,96 %
43	5	10,87 %	45	97,83 %
45	1	2,17 %	46	100,00 %
Celkem	46	100,00%	—	—
Všimněte si, že poslední kumulativní četnost je rovna rozsahu souboru, tj. číslu 46, poslední kumulativní relativní četnost logicky musí být rovna 1, tj. 100 %. (Nemá smysl uvádět hodnotu „Celkem" pro poslední dva sloupce tabulky.)
Shrneme si nyní teorii, která se vztahuje k předchozím příkladům.
Zkoumáme-li určitý znak na souboru o rozsahu n jednotek, pak jednotlivé (ne nutně navzájem různé) hodnoty znaku značímex\, xi, x„.
Navzájem různé hodnoty znaku, v případě kvantitativního znaku uspořádané vzestupně podle velikosti, značíme x*, xjj, .... x*, kde rje počet těchto navzájem se lišících hodnot. Musí samozřejmě být r < n.
Četnosti hodnot jťj\ x*. .... x* značíme n\. n2, ■ • • • nr. Musí platit n = n\ +ri2 +
r
H-----hn,-, vyjádřeno tzv. sumační symbolikou: n = ^tij.
i=1
Relativní četnost libovolné hodnoty x* vypočteme jako podíl —. Součet všech relativních četností je roven jedné.
Pro kvantitativní znak definujeme kumulativní četnost libovolné hodnoty x* jako
i
«1 +n2 + - •■ + «/, tj. VJny.
7=1
Kumulativní relativní četnost této hodnoty je
i
Ľ n i
nx +»2 + ■••+»/: {. 7=1_
n n
Cvičení
MM Po volbách v roce 2010 h\ lo 200 křesel v Poslanecké sněmovně ČR rozděleno následovně:
4.2 Rozdělení četností a jeho grafické znázornění
155
ČSSD	ODS	KSČM	TOP 09	VV
56	53	26	41	24
Znázorněte tyto údaje pomocí kruhového diagramu.
U 127 zaměstnanců určité firmy byl zjištěn počet jejich rodinných příslušníků. Výsledky jsou shrnuty v tabulce:
Počet rodinných příslušníků	1	2	3	4	5	6	7
Počet zaměstnanců	9	19	30	42	23	3	1
Načrtněte polygon četností.
KM Získali jsme údaje o zařazení do pracovních tříd a počtu odpracovaných hodin u souboru 75 dělníků v jisté akciové společnosti.
Pořad, číslo dělníka	Prac. třída	Počet odprac, hodin	Pořad, číslo dělníka	Prac. třída	Počet odprac, hodin	Pořad, číslo dělníka	Prac. třída	Počet odprac, hodin
1	5	206	26	7	220	51	5	101
2	6	177	27	5	180	52	4	185
5	6	231	28	6	159	53	4	188
4	6	190	29	4	216	54	4	196
5	6	187	30	6	231	55	5	194
6	5	168	31	5	211.	56	7	187
7	7	200	32	4	169	57	6	178
8	7	194	33	6	192	58	4	194
9	4	124	34	5	238	59	6	160
10	4	218	35	6	256	60	3	191
11	6	219	36	7	204	61	5	139
12	7	197	37	6	211	62	6	158
13	4	162	38	6	161	63	6	228
14	6	210	39	6	140	64	5	165
15	7	191	40	6	213	65	7	212
16	6	170	41	4	171	66	6	218
17	5	208	42	5	212	67	7	181
18	7	198	43	6	201	68	5	196
19	6	215	44	5	246	69	6	209
20	7	172	45	5	184	70	4	183
21	5	187	46	7	160	71	7	176
22	7	180	47	5	210	72	3	216
23	6	170	48	6	213	73	6	172
24	7	163	49	5	202	74	7	196
25	6	196	50	6	198	75	5	180
156
4. Statistika
Zpracujte údaje o pracovních třídách dělníků do tabulky četností. Načrtněte histogram četností. Určete též kumulativní, relativní a kumulativní relativní četnosti.
Ve všech předchozích příkladech jsme se zabývali rozdělením četností hodnot statistického znaku, které se v daném souboru poměrně často opakovaly. V praxi se však dosti často setkáváme s rozsáhlými soubory dat, kde se hodnoty vůbec neopakují nebo se opakují jen velmi zřídka. I vtákových situacích má smysl hledat rozdělení četností, postupujeme však trochu jinak - data nejprve seskupíme do intervalů, tzv. tříd. Proto mluvíme o tzv. skupinovém (intervalovém) rozdělení četností.
Zpracujme údaje o odpracovaných hodinách dělníků z tabulky ve cvičení 3 do tabulky skupinového rozdělení četností. Načrtněme histogram. Určeme též kumulativní, relativní a kumulativní relativní četnosti.
ŘEŠENÍ: Data, která máme zpracovat, jsou hodnoty z 3., 6. a 9. sloupce tabulky. Jde sice o celá čísla, ale jednotlivé hodnoty se opakují jen výjimečně (např. dělníci č. 46 a 59 odpracovali 160 hodin), drtivá většina údajů se navzájem liší. Mohli bychom teoreticky sestavit tabulku podobnou tabulce v úloze B, tj. ke každému počtu odpracovaných hodin najít četnost (čili počet dělníků), ale výsledkem by byla tabulka o možná šedesáti, možná sedmdesáti řádcích, která by nám k zpřehlednění dat příliš nepomohla. Místo toho data nejprve rozdělíme do intervalů a pak najdeme četnosti těchto intervalů. Ukážeme obvykle používaný postup:
• Nejprve rozhodneme, do kolika intervalů data rozdělíme. Počet těchto intervalů k se doporučuje volit podle tzv. Sturgesova pravidla: k = 1 +3.3 log«, kde n je rozsah souboru. V naší úloze je 1 + 3,31og75 = 7,19, zvolme proto k = l.
• V dalším kroku zvolíme šířku jednotlivých intervalů. Intervaly se volí tak, aby byly stejně široké, aby na sebe navazovaly a aby každé číslo ze souboru dat patřilo přesně do jednoho intervalu. Není těžké si rozmyslet, že šířka / jednoho intervalu musí být tudíž větší nebo rovna rozdílu maximální a minimáln í hodnoty počtu odpracovaných
.   .. , ,        „ ,o   . ,    max(ř)-min(ř) ,T
hodin t v souboru delenému poetem intervalu, tj. I > -. V našem
k
případě je maximální počet odpracovaných hodin 256, minimální počet je 101, jeden interval tedy musí mít šířku alespoň---h = 22,14 h. Zvolme / = 23 h.
• Jednotlivé na sebe navazující intervaly, které obsahují všechna data, zvolíme takto:
100h-122h,   123h-145h,   146h-168h, 238h-260h.
Všimněte si, že intervaly na sebe přímo nenavazují, jsou mezi nimi hodinové mezery. Nicméně vzhledem k tomu, že data jsou celá čísla, máme jistotu, že v těchto mezerách nemůže žádná hodnota ze souboru být. Pokud jsou intervaly odděleny mezerami (které ovšem musí mít stejnou šířku), pak do šířky intervalu započítáváme i tuto mezeru. V našem případě je tedy opravdu šířka intervalů v tomto smyslu rovna 23 hodinám.
4.2 Rozdělení četností a jeho grafické znázorněn
157
• V posledním kroku je třeba zjistit, kolik dat je v každém intervalu, tj. četnosti těchto intervalů. Můžeme si napřed jednotlivé intervaly napsat do sloupečku pod sebe, potom procházet soubor s daty a každou hodnotu zaznamenat pomocí čárky vedle intervalu, do kterého patří, a nakonec čárky u každého intervalu sečíst. Nakonec zcela stejně jako v předchozích příkladech najdeme relativní, kumulativní a kumulativní relativní četnosti. Výsledky jsou shrnuty v tabulce:
Počet odprac, hodin	Četnost	Relativní četnost	Kumulativní četnost	Kumulativní relativní četnost
100-122	1	1,33 %	1	1,33 %
123-145	3	4,00 %	4	5,33 %
146-168	9	12,00%	13	17.33 <7<
169-191	23	30,67 %	36	48,00 %
192-214	26	34,67 %	62	82,67 %
215-237	10	13,33 %	72	96,00 %
238-260	3	4,00 %	75	100,00 %
Celkem	75	100,00 %	—	—
Histogram dat je na následujícím obrázku. Můžeme z něj nebo i z tabulky vyčíst mnoho potřebných údajů. Např. vidíme, že nejčastěji se počet odpracovaných hodin pohybuje v rozmezí od 192 do 214. Můžeme si všimnout, že data nejsou symetricky rozložená. Několik výrazně menších hodnot způsobilo, že první tři sloupky zleva jsou nízké (napravo jsou nízké jen dva). V takovém případě říkáme, že data jsou „sešikmená doleva". V naší úloze však není toto sešikmení příliš výrazné.
II]
il_
100-122 123-145  146-168  169-191   192-214 215-237 238-260 Počet odpracovaných hodin
Obr. 4.5: Rozdělení pracovníků podle počtu odpracovaných hodin
158
4. Statistika
Následující údaje shrnují průměrné kupní ceny bytů ve 27 největších městech České republiky v roce 2007. Ceny jsou uvedeny v Kč za m2 plochy bytu.
45 061 29031 25 436 25 078 24 567 22 768 22 425 21794 21 456 20894 20319 20162 19221 18200 17 217    16369    16 343    14 897    14546    14 316    13 829
22 215 22083 17 332 17 327 12 975 12736
Zpracujme údaje do tabulky skupinového rozdělení četností, vypočtěme relativní, kumulativní a kumulativní relativní četnosti. Načrtněme histogram četností a znázorněme relativní četnosti kruhovým diagramem.
ŘEŠENÍ: Data, která máme zpracovat, jsou seřazena
podle velikosti (první údaj zjevně odpovídá Praze
a druhý Brnu). Budeme postupovat podobně jako
v úloze C. Opět použijeme Sturgesovo pravidlo: 1 +3,3log27 = 5,72, zvolíme počet
-j.             • j   ,   •       ,              ,     . 45061-12736 , tnd k = 6. Sirka jednoho intervalu musí být alespoň---= 5 387,5. Zvolme
/ = 5400. Jednotlivé intervaly pak můžeme zvolit např. takto:
12700 Kč-18 100 Kč,   18100 Kč-23 500 Kč, 39700 Kč-45 100 Kč.
Všimněte si, že jsme mezi zvolenými intervaly tentokrát neponechali žádné mezery. V našem příkladu se totiž ani jedna průměrná kupní cena nerovná některé z krajních hodnot zvolených intervalů, a proto nemohou vzniknout pochybnosti, do kterého intervalu kterou cenu zařadit.
Nakonec snadno zjistíme četnosti jednotlivých intervalů a výsledky uspořádáme do přehledné tabulky:
Cena	Četnost	Relativní četnost	Kumulativní četnost	Kumulativní relativní četnost
12 700-18100	11	40,74 %	11	40,74 %
18 100-23 500	11	40,74 %	22	81,48 %
23 500-28 900	3	11,11 %	25	92,59 %
28 900-34 300	1	3,70 %	26	96,30 %
34300-39700	0	0,00 %	26	96,30 %
39 700-45 100	1	3,70 %	27	100,00 %
Celkem	27	100,00 %	—	—
Z tabulky i z uvedeného histogramu (obr. 4.6) vidíme velmi výrazné sešikmení dat, tentokrát doprava. Vysoká průměrná cena bytů v Praze a Brně v porovnání se zbylými městy způsobila, že v pravé části histogramu pozorujeme dva nízké sloupky a sloupek odpovídající předposlednímu intervalu cen dokonce chybí - má nulovou výšku. V levé části histogramu vidíme dva nejvyšší sloupky, reprezentující podstatnou většinu dat. Z posledního sloupce tabulky vyčteme, že 81,5 % cen bytů bylo v rozmezí od 12 700 Kč/m2 do 23 500 Kč/m2.
4.2 Rozdělení četností a jeho grafické znázornění
159
10
8
O
S 6
2
0 I-1-1-1-1 ..........-.....-
12700-18100 18100-23500 23500-28900 28900-34300 34300-39700 39700-45100
Cena/Kč -m-2 Obr. 4.6: Ceny bytů ve 27 největších městech ČR v roce 2007
Na dalším obrázku uvádíme kruhový diagram relativních četností.
■ 12700 KČ-18100KČ
■ 18100KČ-23500KČ B23500KČ-28900KČ
□ 28900Kč^34300Kč
□ 39700 Kč-45100 Kč
Obr. 4.7: Rozdělení 27 největších měst ČR podle kupní ceny bytů v roce 2007
160
4. Statistika
Shrneme si nyní zásady pro zpracování dat do skupinového (intervalového) rozdělení četností:
1. Počet intervalů, do kterých data rozdělujeme, volíme podle Sturgesova pravidla jako celé číslo k, které je co nejblíže hodnotě 1 +3,3 log n, kde nJe celkový počet dat.
, . w.  , ,  v~   ,   max(í)-min(ř) , ,    v.    ,. ,
2. Intervaly vol uneste j neširoké o sirce / >---, kde v čitateli zlomku
je rozdíl maximální a minimální hodnoty / ze souboru dat. Je vhodné tuto šířku volit jako celé nebo vhodně zaokrouhlené číslo, se kterým se bude dobře počítat.
3. Intervaly volíme tak, aby každá hodnota ze souboru dat patřila právě do jednoho z intervalů.
4. Mezi intervaly mohou být mezery o stejné šířce, ale v těchto mezerách se nesmějí nacházet žádná data. V takovém případě do šířky intervalu započítáváme i jednu mezeru. Mezery mezi intervaly nemusíme dělat, máme-li jistotu, že ani jedna hodnota ze souboru dat není rovna některému z krajních bodů těchto intervalů.
5. V histogramu skupinového rozdělení četností zpravidla neděláme mezery mezi jednotlivými sloupky. Je tomu tak proto, že tyto sloupky reprezentují celé, na sebe navazující intervaly, ne jednotlivé hodnoty.
Při rozdělování dat do skupinového rozdělení četností máme určitou libovůli. Při
stanovení počtu intervalů není chybou se od Sturgesova pravidla mírně odchýlit,
někteří statistici používají pro stanovení k i jiné postupy. Konkrétně v úloze C
bychom mohli místo sedmi volit 6,8 nebo i 9 intervalů. Při stanovení šířky / máme
„,  ,.,           , ,      „     , . , ,   , max(ř)-min(/) často několik rozumných možnosti, jak hodnotu---zaokrouhlit.
Konkrétně v úloze D bychom mohli šuku intervalu místo 5 400 volit 5 388 (trochu nepohodlně na počítání) nebo 5 390. (Hodnota 5 500 by byla od vypočtené hodnoty 5 387,5 již příliš vzdálená.) Konečně při stanovení jednotlivých intervalů můžeme začátek prvního z nich též volit (v úloze D by první interval mohl začínat např. hodnotou 12 710 nebo 12720, popř. i 12730). Musíme však vždy dbát na to, aby minimální hodnota ze souboru dat byla v prvním a maximální hodnota v posledním intervalu.
Cvičení
| Je dán soubor 20 žáků jedné třídy, u kterých byla změřena výška v cm:
179 184 166 172 189 174 181 185 172 170 171    183   177   176   176   175   179   178   178 180
4.2 rozděle
161
Zpracujte údaje do tabulky skupinového rozdělení četností, vypočtěte kumu- která
lativní, relativní a kumulativní relativní četnosti. Načrtněte histogram četností hodn a znázorněte relativní četnosti kruhovým diagramem. Vykazují data výrazné
sešikmení? ;\j
Na 32 zkušebních vzorcích ocelové výztuže byla měřena pevnost oceli v tahu za ohybu; uvedené číselné hodnoty jsou v MPa:
12,597 13,976 13,779 13,999 12,973 14,197 14,012 13,324
13,532 13,085 13,250 13,065 13,213 13,435 13,425 12,767
13,546 11,811 14,189 12,627 13,476 14,153 14,175 13,315 2.
13,092 14,027 13,280 12,817 12,612 12,600 12,708 13,184
Zpracujte údaje do tabulky skupinového rozdělení četností a načrtněte histogram četností. Vykazují data výrazné sešikmení?
4.3 Charakteristiky polohy
V předchozím článku jsme uvedli některé metody, jak popsat určitý kvantitativní statistický znak pomocí přehledných tabulek nebo grafů. Často je však zapotřebí určit čísla, která by co nejlépe charakterizovala jeho průměrnou hodnotu nebo jeho „typickou" hodnotu, popř. jeho „střední" hodnotu. Snažíme se tedy číselně vyjádřit „polohu" znaku na číselné ose.
Nejčastěji používanou charakteristikou polohy je aritmetický průměr.
Aritmetický průměr hodnot znaku x je součet hodnot znaku zjištěných u všech jednotek souboru dělený počtem všech jednotek souboru. Značíme ho x (čti „x s pruhem") a vypočteme jej podle vzorce:
1 | «
x= -(x\ +x2 + ---+x„), i].x=-Y,Xi, n n i=1
kdexi, xi,..., xn jsou všechny zjištěné (ne nutně navzájem různé) hodnoty znaku.
U dvanácti přístrojů určitého typu byla zjištěna doba od uvedení do provozu do první poruchy. Získané hodnoty jsou vyjádřeny v celých dnech:
59    72    64    68    2    38    68    42    61    57    84 66 Určeme průměrnou dobu do první poruchy. Řešení:
x= — ■ (59+72 + 64 + -•-+66) = — =56,75. Průměrná doba do první poruchy je tedy 56 dnů a 18 hodin.
Podíváme-li se znovu na zjištěné hodnoty z úlohy A, můžeme si všimnout, že podstatná většina přístrojů v daném souboru měla dobu do poruchy větší než zjištěný průměr, jenom tři přístroje fungovaly bez poruchy dobu kratší než 56,75 dne. V podobné situaci může být užitečné vedle aritmetického průměru určit též „prostřední hodnotu" znaku,
162
4 Statistika
4.3 C
která je překročena právě polovinou naměřených hodnot, zatímco zbývající polovina hodnot je menší. K tomuto účelu nám slouží tzv. medián, jehož definice je následující:
Medián znaku x je číslo, které značíme x a vypočteme jej takto:
I. Všechny zjištěné (ne nutně navzájem různé) hodnoty znaku xy,Xzi■■■ -,Xn uspořádáme podle velikosti, výsledkem je uspořádaný soubor hodnot
*(i) <*(2) < ••• <■*(«)•
2. Je-li n liché číslo, pak x = x
3. Je-li n sudé číslo, pak x-
Určeme medián doby do první poruchy pro data z úlohy A.
Řešení: Uspořádáme-li hodnoty znaku podle velikosti, dostaneme čísla:
2    38    42    57    59    61    64    66    68    68    72 84
Tato čísla reprezentují uspořádaný soubor hodnoty), xq), z definice mediánu,
tj. ve smyslu zavedeného označení platí = 2, xq) = 38, x^ = 42 atd. Všimněte si, že hodnota 68 se v původním souboru vyskytla dvakrát a musí se se stejnou četností objevit i v uspořádaném souboru - zde je x@) = x(k» = 68.
Počet hodnot v souboru je n = 12, což je sudé číslo, musíme proto použít vzorec pro n sudé z definice mediánu. Snadno zjistíme, že x^ ~x(6) =61 a x(j>+{j =XU) = ^4,
tudíž
x= I (61+64) = 62,5. Medián doby do první poruchy je tedy 62,5 dne.
Postup hledání mediánu můžeme bez použití vzorců shrnout názorně takto: Hodnoty znaku uspořádáme podle velikosti. Je-li počet hodnot lichý, pak je mediánem prostřední hodnota v uspořádaném souboru. Je-li počet hodnot sudý, pak mediánem rozumíme aritmetický průměr prostředních dvou hodnot.
Medián libovolného znaku má vždy následující vlastnost:
Alespoň polovina (tj. alespoň 50 %) hodnot tohoto znaku je menší nebo rovna
mediánu a současně alespoň polovina hodnot je větší nebo rovna mediánu.
Uvažujme znovu zjištěné hodnoty doby do první poruchy z úlohy A. Předpokládejme nyní, že přístroj se zjištěnou dobou do první poruchy 2 dny pochází od jiného výrobce, a proto musí být ze souboru vyloučen. Vypočtěme znovu průměrnou dobu do první poruchy a medián této doby.
Řešení: Vyloučíme hodnotu 2 ze souboru a vypočteme ze zbývajících 11 hodnot
4.3 Charakteristiky polohy
163
znovu aritmetický průměr: x = —- = 61,727. Průměrná doba do první poruchy je nyní približne 61,727 dne.
Uspořádáme-1 i těchto 11 hodnot znaku podle velikosti, dostaneme čísla:
38    42    57    59    61    64    66    68    68    72 84. Nyní je počet hodnot v souboru n = 11, což je liché číslo, musíme proto použít vzorec pro n liché z definice mediánu: x = x/n+] \ -x^ = 64. Medián doby do první poruchy je nyní 64 dnů. \ 2 J
Úloha C ilustruje důležitý rozdíl mezi aritmetickým průměrem a mediánem. Po vynechání extrémně malé hodnoty ze souboru dat se medián změnil jen mírně - z hodnoty 62,5 dne vzrostl na 64 dnů. Naopak aritmetický průměr se změnil podstatněji - z hodnoty 56,75 dne vzrostl na 61,727 dne. Toto pozorování se dá zobecnit:
Aritmetický průměr je „citlivý" na odlehlé (tj. velmi malé nebo velmi velké) hodnoty - přidáme-li je nebo odebereme-li je ze souboru, průměr se výrazně /.mění. Naopak medián takto citlivý není.
V úloze A je x = 56,75 < x = 62,5. Je tomu tak proto, že velmi malá hodnota (číslo 2) silně ovlivňuje průměr. I toto pozorování se dá zobecnit:
()bsahuje-li soubor hodnot jednu či více velmi malých hodnot v porovnání s ostatními, pak je aritmetický průměr menší než medián. Obsahuje-li naopak soubor hodnot jednu či více velmi velkých hodnot v porovnání s ostatními, pak je aritmetický průměr větší než medián.
Podívejme se nyní, jak se vypočítá aritmetický průměr a medián v případě, kdy jsou hodnoty uspořádány do tabulky četností.
Určeme průměrnou velikost prodaných obleků a medián velikosti prodaných obleků pro data z úlohy B předchozího článku.
ŘEŠENÍ: Mohli bychom aritmetický průměr vypočítat z původních 46 hodnot ze zadání úlohy jejich sečtením a vydělením číslem 46. To je však zbytečně pracné. Lepší je využít tabulku rozdělení četností, kterou jsme v první části řešení úlohy sestavili. Z této tabulky vidíme, že při hledání součtu všech hodnot musíme číslo 37 započítat jednou, číslo 38 třikrát atd. - tj. každou hodnotu x* stačí vynásobit příslušnou četností«, a získané součiny sečíst. Dostaneme výsledek:
1 1 878
x = — - (37 • 1+38 ■ 3+39 • 5 + - • -+45 • 1) = —— = 40.826. 46 46
Pro nalezení mediánu je třeba nejdříve data seřadit podle velikosti. Jelikož n = 46 je
sudé číslo, medián bude průměrem dvou prostředních hodnot v uspořádaném souboru
(konkrétně jde o hodnoty x^) a X(24))- Nemusíme však všechny prvky uspořádaného
souboru vypisovat. Doplníme si do tabulky četností hodnoty kumulativní četnosti:
164
4. Statistika
Velikost obleku x*	Četnost ni	Kumulativní četnost
37	1	1
38	3	4
39	5	9
40	9	18
41	12	30
42	10	40
43	5	45
45	1	46
Celkem	46	—
Vidíme, že kumulativní četnost hodnoty 40 je 18 a kumulativní četnost následující hodnoty 41 je 30. To znamená (dobře si rozmyslete!), že přesně 18 prodaných obleků mělo velikost 40 nebo menší a dalších 30 -18 = 12 prodaných obleků mělo velikost 41 (zbývající obleky pak měly velikost 42 a větší). Tedy hodnoty xq^ ax^4) v uspořádaném souboru musí být obě rovny 41, a tedy x = 41.
Všimněte si, že v této úloze jsou hodnoty aritmetického průměru a mediánu téměř stejné. To souvisí s tím, že histogram četností (viz obr. 4.3 v řešení úlohy B minulého článku) nevykazuje výrazné sešikmení.
Jsou-li x* < x\ < ■ ■ ■ < x* navzájem různé hodnoty znaku x a n\, ...,nr jsou četnosti těchto hodnot, potom aritmetický průměr hodnot znaku x lze vypočítat
1   r r
podle vzorce x = -       ' nu kde n = YJtt,- je rozsah souboru.
n /=i (=i Vzorce pro medián zůstávají nezměněny. Při hledání prostřední hodnoty, resp. prostředních dvou hodnot v uspořádaném souboru můžeme použít následující obecný postup:
Hodnota v uspořádaném souboru, kde k je libovolné přirozené číslo 1 <k<n, je rovna takové hodnotě znaku x*, jejíž kumulativní četnost poprvé dosáhne nebo překročí číslo k.
V případě, kdy se hodnoty zkoumaného znaku často opakují, je užitečné určit nejty-pičtější hodnotu, tj. hodnotu, která se v souboru vyskytuje nejčastěji. Ve statistické terminologii jde o tzv. modus.
Jsou-li x*, A"2..... .v* navzájem různé hodnoty znaku x&n\.ri2.....nr jsou četnosti těchto hodnot, potom modus znaku x (budeme ho značit i) je roven té hodnotě x*, jejíž četnost n j je větší než všechny zbývající četnosti. Je-li v souboru více hodnot se stejnou maximální četností, pak řekneme, že modus neexistuje.
4.3 Charakteristik
165
Modus velikosti prodaných obleků v úloze B minulého článku je zřejmě roven x = 41. To znamená, že nejčastěji žádaná velikost obleku byla 41.
Určeme aritmetický průměr, medián a modus, máme-li k dispozici tyto údaje:
Hodnota znaku	Četnost
1	2
2	3
3	4
4	5
5	6
6	7
7	10
8	15
9	9
10	8
11	1
ŘEŠENÍ:
h = 2 + 3+4 + ---+1 =70, x=        - 2+2-3+3-4+-•• + 11-1) = 6,77. Pro nalezení mediánu si do tabulky doplníme kumulativní četnosti:
Hodnota znaku	Četnost	Kumulativní četnost
1	2	2
2	3	5
3	4	9
4	5	14
5	6	20
6	7	27
7	10	37
8	15	52
9	9	61
10	8	69
11	1	70
Celkem	70	—
166
4. Statistika
Rozsah souboru n = 70 je sudé číslo, proto x= - [xq$) +*(36)] ■ Podle uvedeného návodu je hodnota x@5) rovna sedmi (7 je první hodnota znaku, u které je kumulativní četnost větší nebo rovna 35). Analogicky vidíme, že i xq&) je rovno sedmi. Proto x = 1. Z tabulky četností je zřejmé, že modus x = 8.
Všimněte si, že v této úloze je x < x < x. Tato situace nastává zpravidla tehdy, je-li rozdělení hodnot sešikmené doleva. Toto sešikmení uvidíte v histogramu nebo v polygonu četností - načrtněte si sami!
Cvičení
Při měření pevnosti dvou druhů látek byly zjištěny tyto hodnoty v kg • cm"1:
Plátno	Kepr
40,9	40,0
39,4	41,0
38,0	38,7
40,3	42,2
41,7	41,2
Která látka má větší průměrnou pevnost? Určete též medián pevnosti pro každou z látek.
WM Na sedmičlenném pracovišti měli jednotliví pracovníci za čtvrtící í tyto počty dnů absence: 3, 0, 2, 0, 66, 8, 5. Určete aritmetický průměr, medián a modus. Která z těchto charakteristik nejlépe reprezentuje úroveň absencí na daném pracovišti a proč?
MtM Určete průměrný počeí rodinných příslušníků zaměstnanců firmy ze cvičení 2 z minulého článku. Určete též medián a modus.
I Určete průměrnou pracovní třídu u souboru dělníků ze cvičení 3 z minulého článku. Určete též medián a modus.
M*U Statistický soubor je tvořen 20 záznamy o pH roztoku připraveného k neutralizaci:
7,7 7,3 7,4 7,2 7,4 7,3 7,5 7,6 7,4 8,0 7,3    7,6    7,8    7,7    7,6    7,8    7,8    7,9    8,0 7,9
Vypočtěte aritmetický průměr, medián a modus.
WLiM Koeficient tření by! měřen na papíru napuštěném parafinem a každá hodnota byla měřena na novém vzorku, který následoval ve směru toku výroby papíru metodou klouzání po vodorovné rovině. Byly naměřeny tyto hodnoty:
0,160 0,150 0,180 0,190 0,160 0,165 0,160 0,165 0,175 0,165
0,155 0,170 0,150 0,160 0,170 0,170 0,170 0,160 0,165 0,150
0,180 0,160 0,175 0,185 0,180 0,160 0,170 0,165 0,185 0,175
0,195 0,175 0,170 0,180 0,180 0,175 0,165 0,160 0,170 0,165
0,165 0,175 0,160 0,170 0,170 0,155 0,165 0,165 0,170 0,170
Určete četnosti a kumulativní četnosti jednotlivých hodnot zkoumaného znaku a vypočtěte aritmetický průměr, medián a modus.
4.3 Charakteristiky polo
167
Ve statistice je někdy třeba pracovat s jinými typy průměrů, než je průměr aritmetický.
Uvedeme nejprve definici tzv. váženého průměru. Jsc
čís
Jsou-li X]. xt,.....Kr navzájem různé hodnoty a w\ , wj,..-., Wr daná kladná čísla, ne'
tzv. váhy těchto hodnot, potom vážený průměr hodnot X\,X2, • ■ •,xr vzhledem
k daným váhám w\,w27 ■ ■ ■■ wr je roven Tento
xw=X-±.xrWi, |,nm
w i=\
r
kde w -    wi Je součet vah.
Všimněte si, že vzorec pro vážený průměr se shoduje se vzorcem pro výpočet aritmetického průměru hodnot znaku uspořádaných do tabulky četností. Roli vah wi ve vzorci pro výpočet aritmetického průměru hrají četnosti n{. Definice váženého průměru je však o něco obecnější, v některých aplikacích váhy nemusí nutně být přirozená čísla.
Určitá firma má tři pobočky. V následující tabulce je uveden průměrný měsíční příjem zaměstnanců každé pobočky v Kč a počet jejích zaměstnanců. Vypočtěme průměrný měsíční příjem zaměstnanců celé firmy.
Pobočka	Počet zaměstnanců	Průměrný příjem
A	7	22 786
B	25	19764
C	18	20468
řešení: Můžeme postupovat přímo jednoduchou úvahou. Aritmetický průměr hodnot znaku (znakem je zde měsíčnípříjem zaměstnance firmy) je roven součtu všech hodnot znaku dělenému počtem těchto hodnot (tj. počtem všech zaměstnanců). Součet příjmů zaměstnanců pobočky A dostaneme snadno tak, že průměrný příjem v této pobočce vynásobíme počtem jejích zaměstnanců, obdobně tomu je i ve zbývajících pobočkách. Dostaneme tedy výsledek:
22786-7+19764-25 + 20468-18 1022026
x =
20440,52.
7 + 25+18 50 Průměrný měsíční příjem zaměstnanců celé firmy je 20440,52 Kč.
Uvědomte si, že výsledný průměrný příjem je roven váženému průměru dílčích průměrných příjmů na jednotlivých pobočkách (tj. hodnot 22786, 19764 a 20468), kde váhy jsou počty zaměstnanců v těchto pobočkách (tj. čísla 7, 25 a 18).
Při zkoumání časových řad se někdy používá místo aritmetického průměru tzv. geometrický průměr.
168
4.3
Jsou-li všechna čísla -\. z2. čísel je roven ľ<; = {/z~-z2 -7
, zn kladná, potom geometrický průměr těchto
zj.....z,n menší
• zn- (Je-li alespoň jedno z číse nebo rovno nule, geometrický průměr nedefinujeme.)
Tento druh průměru se používá zejména tehdy, když jednotlivá čísla z,i znamenají průměrná tempa růstu určité veličiny x za jednotlivá časová období. Tj.
• z\ - —, kde xo Je počáteční hodnota zkoumané veličiny (na počátku 1. období),
x0
x\ je hodnota této veličiny na konci 1. období;
• zz = —, kde x2 je hodnota této veličiny na konci 2. období;
x\
x*k
• Z3 = —, kde X3 je hodnota této veličiny na konci 3. období atd.
x2
Není těžké si uvědomit, že v tomto případě je geometrický průměr čísel z\, z%, • • •, Zn roven
I X n
x\ x2 X3 x0   x\ x2
zg = </z] ■ 2,2 ■ ,,
xn-\      V Xl)
Z tohoto vztahu můžeme snadno odvodit vzorec pro výpočet hodnoty zkoumané veličiny na konci posledního období pomocí geometrického průměru a hodnoty zkoumané veličiny na počátku 1. období:
x„=x0-(zg)n-
eeo-
Čtvrtletní hodnoty růstu celkové produkce v určitém odvětví vyjádřené v procentech byly za jednotlivá čtvrtletí let 2006 a 2007 následující:
102,3    104,8    103,1    98,5    100,3    106,7    111,1 107,4
Vypočtěme průměrné kvartální (čtvrtletní) tempo růstu. Byla-li produkce v posledním čtvrtletí roku 2005 rovna 2 165 455 jednotkám, kolik jednotek se vyprodukovalo v posledním čtvrtletí roku 2007?
Řešení: Nejprve vysvětleme přesný význam daných čísel. První údaj říká, že čtvrtletní produkce v prvním čtvrtletí roku 2006 (můžeme ji označit x\) byla rovna 102,3 %
předchozí čtvrtletní produkce (označme ji xq), tj
x\
x0
,023 = z\ ■ Podobně druhý údaj
říká, že čtvrtletní produkce x? ve druhém čtvrtletí roku 2006 byla rovna 104,8 % předchozí čtvrtletní produkce x\, tj. — = 1,048 = z,2 atd.
x\
Průměrné kvartální tempo růstu produkce je rovno geometrickému průměru daných hodnot:
zG = ^1,023-1,048-... -1,074 = 1,042052. Kvartální produkci v posledním čtvrtletí roku 2007 (v našem označení jde o veličinuxg) pak vypočteme podle posledního odvozeného vzorce:
x8 = x0 ■ (žG)8 = 2165 455 ■ 1.04 2 0 528 = 3 0 1 0 6 7 8.
4.3 Charakteristiky polohy
169
H
Průměrná roční míra inflace vyjadřuje procentní změnu průměrné cenové hladiny za daný rok proti průměrné cenové hladině předchozího roku. Následující tabulka udává hodnoty průměrné roční míry inflace v České republice za roky 1999-2008:
1999	2000	2001	2002	2003	2004	2005	2006	2007	2008
2,1 %	3,9 %	4,7 %	1,8 %	0,1 %	2,8 %	1,9 %	2,5 %	2,8 %	6,3 %
Vypočtěme průměrnou míru inflace za celé období. O kolik procent se zvýšila průměrná cenová hladina od roku 1998 do roku 2008?
Řešení: Např. první údaj - roční míra inflace 2,1 % v roce 1999 znamená, že „průměrné" zboží, které stálo v předchozím roce (tj. v roce 1998) 100 Kč, stálo v roce 1999 o 2,1 % více, tj. 102,10Kč. Jinak řečeno, je-li zkoumanou veličinou průměrná cenová hladina, pak její roční hodnoty růstu jsou čísla 1,021; 1,039; 1,047;...; 1,063. Průměrné roční tempo růstu cenové hladiny za celé desetileté období je tedy třeba určit obdobně jako v minulé úloze geometrickým průměrem:
ŽG= 71,021-1,039-... • 1,063 = 1,02877. Této hodnotě odpovídá průměrná roční míra inflace 2,877 %.
Poměr průměrné cenové hladiny v roce 2008 (můžeme ji označit x\$) a průměrné cenové hladiny v roce 1998 (v našem označení xq) je pak roven podle dříve odvozeného vzorce desáté mocnině geometrického průměru:
i1^ =(žc)10 = 1.028 7710= 1.328.
x0
Průměrná cenová hladina v ČR se tedy od roku 1998 do roku 2008 zvýšila cca o 32,8 %.
Určitá firma vykázala za posledních 5 let následující hodnoty čistého zisku (v milionech Kč): 1,0; 2,5; 4,4; 9,2; 18,0. Jaké bylo průměrné roční tempo růstu firmy?
ŘEŠENÍ: Ze zadaných hodnot bychom mohli nejprve vypočítat jednotlivá roční tempa růstu:
°-n-™
a z těchto čtyř hodnot pak určit geometrický průměr. Mnohem jednodušší však je
fx~ /18 0
použít vzorec z,q - \/—, z něhož v tomto případě dostáváme z.g - \ —jr = 2.06.
V *0 V 1 fl
Zisk firmy byl tedy každým rokem v průměru 2,06násobkem zisku v roce minulém. Můžeme také říci, že zisk firmy se každým rokem zvětšoval v průměru o 106 %.
Cvičení
M Vypočítejte průměrné náklady najeden výrobek za celou výrobu, máte-li k dispozici tyto údaje:
170
4. Statistika
Série	Počet výrobku	Průměrné náklady najeden výrobek v Kč
01	200	2 900
02	250	2 850
03	500	2 700
04	430	2650
05	180	2 850
06	730	2750
B:M Na určité základní škole jsou v 6. ročníku čtyři třídy. V tabulce je uveden počet žáků v každé třídě a průměrná známka z matematiky.
Třída	Počet žáků	Průměrná známka z matematiky
6. A	28	2,21
6. B	24	1,82
6. C	32	2,33
6. D	30	2,11
Vypočítejte průměrnou známku z matematiky v celém ročníku. M Čtvrtletní výdaje (v tisícich Kč) určité firmy na reklamu jsou dány tabulkou:
Rok	2008				2009				2010	
Čtvrtletí	1	II	III	IV	I	II	III	IV	I	II
Výdaje	12	18	22	31	38	49	58	55	58	82
a) Vypočtěte průměrné čtvrtletní tempo růstu výdajů této firmy na reklamu.
b) Odhadněte pomocí průměrného čtvrtletního tempa růstu výdaje na reklamu ve zbývajících dvou čtvrtletích roku 2010.
c) Jaká je poslední hodnota čtvrtletního tempa růstu zjištěná z tabulky?
d) Vypočtěte znovu pomocí této hodnoty odhady výdajů na reklamu ve zbývajících dvou čtvrtletích roku 2010.
Zobecníme nyní již zavedený pojem mediánu. Uvedli jsme, že medián libovolného znaku má vždy následující vlastnost: Alespoň polovina (tj. alespoň 50 %) hodnot tohoto znaku je menší nebo rovna mediánu a současně alespoň polovina hodnot je větší nebo rovna mediánu.
V aplikacích statistiky je důležité hledat obecnější hodnoty, např. takové číslo x, že alespoň 85 % hodnot daného znaku je menších nebo rovných x a současně alespoň 15 % hodnot je větších nebo rovných x. Místo 85 % můžeme zvolit jakýkoli údaj mezi 0 % a 100 %. Tato úvaha vede k následující definici:
3 Charakteristiky poloh
Je-li p libovolné číslo mezi 0 a 100, pak p-procentním kvantilem statistického znaku rozumíme hodnotu xp mající následující vlastnost: Alespoň p % hodnot tohoto znaku je menších nebo rovných xp a současně alespoň (100 — /?) % hodnot je větších nebo rovných xp.
Hodnotu xp určujeme takto:
1. Všechny zjištěné (ne nutně navzájem různé) hodnoty znaku x\,X2, ■■■■xn uspořádáme podle velikosti. Vznikne tak uspořádaný soubor hodnot
X(i) <X(2) <■"■•• <x(„).
2. Určíme pořadí r v tomto uspořádaném souboru, na kterém se nachází hledaný kvantil, podle vztahu: r =      ■ (/; +1).
3. Je-li r celé číslo, pak xp =X(r) (tedy hledaný kvantil je přímo roven hodnotě na pozici r v uspořádaném souboru hodnot).
4. Není-li r celé číslo, pak určíme zaokrouhlením dolů na nejbližší menší celé číslo jeho tzv. celou část - označme ji c. Zbytek při tomto zaokrouhlení označme z-r—c. Hledaný kvantil xp je pak číslo, které leží mezi hodnotami X(ľ) a X(c+i). Určíme ho tak, že k hodnotě X(c) přičteme poměrnou část rozdílu hodnot X(c) a x(c+i) :
Xp - X(C)+Z ■ [x(c+\) -X(c)] ■
Je možné ukázat, že 50procentní kvantil, tj. veličina X50, a medián x jsou totožná čísla.
Je-li např. n = 9, pak pro p = 50 dostáváme r =      ■ (9+ 1) = 5, a tedy podle bodu 3
předchozí definice je JČ50 = x(5), tedy 50procentní kvantil je 5. hodnota v pořadí podle velikosti. To je ale právě prostřední hodnota v daném souboru 9 hodnot, jde tedy přesně o medián.
Je-li např. n - 10, pak pro p- 50 dostáváme r = • (10+1) = 5,5 a musíme postupovat podle bodu 4 předchozí definice. Zde je c = 5 (číslo 5,5 jsme zaokrouhlili dolů), z = 5,5-5 = 0,5, a konečně %) =*(5) +0,5 • [*(6)-#(5)] = ^X(6), Dostali jsme tedy přesně aritmetický průměr dvou prostředních hodnot čili opět medián.
Lze ukázat, že pro jakýkoli rozsah souboru n je vždy x = .v-sii-
Uvažujme znovu dobu do první poruchy u dvanácti přístrojů z úlohy v části A tohoto článku. Určeme 25, 75 a 90procentní kvantily pro tato data, tj. čísla X25, X75 aiígo.
ŘEŠENÍ: Uspořádané hodnoty znaku podle velikosti jsou:
2    38    42    57    59    61    64    66    68    68    72 84 25
Pro p = 25 je r =      ■ (12+1) = 3,25, tedy c = 3 a z = 0,25. Dostaneme proto výsledek: Jč25=X(3)+0,25- [.r(4)-x(3)] =42 + 0,25-(57-42) = 45,75.
172
Statistika
Pro p = 75 je r = 9,75, a tedy x75 = x{9)+0,75 • [xm -x{9)] = 68+0,75 • (68-68) = 68. Pro p = 90 je r = 11,7, a tedy x9Q=x(U)+0J ■ [xa2)-x0 ()] = 72 + 0,7 • (84-72) = 80,4.
Uvedeme nyní dva důležité příklady kvantilů:
Dolním kvartilem statistického znaku rozumíme číslo xi-,. Horním kvartilem
pak rozumíme číslo X75.
Jak plyne z předchozích poznámek, dolní kvartil zpravidla odděluje „dolní čtvrtinu" dat. tj. zpravidla alespoň 25 '7c hodnot znaku je menších nebo rovných dolnímu kvartil u a alespoň 75 9ž je větších nebo rovných tomuto kvartilu. V obdobném smyslu horní kvartil odděluje „horní čtvrtinu" dat.
Uvažujme znovu data z úlohy A a předpokládejme, stejně jako v úloze C, že přístroj s dobou 2 dny do první poruchy byl od jiného výrobce, a proto je ze souboru vyloučen. Určeme dolní a horní kvartil.
řešení: Uspořádané hodnoty znaku podle velikosti jsou:
38    42    57    59    61     64    66    68    68    72 84 25
Tôo
Pro p = 25 je r =
x25
(11 +1) = 3, což je celé číslo, proto je dolní kvartil roven
x(3) = 57. Pro p = 75 je r = 9, a proto je horní kvartil roven X75 = x^ - 68. Připomeňme si tabulku dat z úlohy E doplněnou o kumulativní četnost:
Hodnota znaku	Četnost	Kumulativní četnost
1	2	2
2	3	5
3	4	9
4	5	14
5	6	20
6	7	27
7	10	37
8	15	52
9	9	61
10	8	69
11	1	70
Celkem	70	—
Určeme dolní a horní kvartily a 85procentní kvantil.
IBTIKA
4.3 Charakteristiky poloh
173
Řešení: Pro p = 25 je r =
25
Toô
(70+ 1) = 17,75, celá část čísla r je c =17 a zbytek je
z = 0,75. Tedy ^25 = X(i7)+0,75 • [jC(ig) ~*(17)1 • Obě hodnoty x^n) &X(\%) jsou však rovny číslu 5 (viz obecný postup pro hledání hodnoty x(k) pomocí kumulativních četností, který jsme uvedli před úlohou E). Dolní kvartil je tedy roven jejich společné hodnotě x25 = 5.
Pro p = 75 je r = 53,25, a tedy X75 = x^)+0,25 • [^(54) ~-«(53)] • Obě hodnoty x^ a ^(54) jsou opět stejné, rovnají se číslu 9, tudíž horní kvartil je roven jejich společné hodnotě % = 9.
Pro p = 85 je r = 60,35, a tedy x$$ = a"(6u)+0,35 • [^(61)_^(60)] • Z tabulky kumulativních četností a výše zmíněného návodu vyčteme, že x(60) = 8> x(6í) = 9, a proto xg5 = 8,35.
Cvičení
JIH Pro 20 hodnot pH roztoku připraveného k neutralizaci ze cvičení 5 tohoto článku vypočtěte 40 a 60procentní kvantil.
Pro hodnoty koeficientu tření ze cvičení 6 tohoto článku vypočtěte dolní a horní kvartil.
4.4 Charakteristiky variability
Charakteristiky polohy, o kterých jsme mluvili v předchozím článku, jsou v podstatě určitá reprezentativní čísla, kolem kterých naměřené hodnoty znaku kolísají. Abychom daný statistický soubor popsali podrobněji, nestačí nám pouhá znalost průměru, mediánu atd., potřebujeme též nějak rozumně popsat míru kolísání dat. Ukažme si motivační úlohu.
^™ Uvažujme dvě montážní linky v určité továrně. Následující tabulka uvádí počty smontovaných výrobků na těchto linkách během pěti po sobě jdoucích pracovních dnů:
	Pondělí	Úterý	Středa	Čtvrtek	Pátek
Linka A	20	22	19	21	18
Linka B	14	26	18	20	22
Liší se tyto linky z hlediska počtu smontovaných výrobků?
řešení: Otázka není zcela jednoznačně formulovaná, pokusíme se přesto o rozumnou odpověď. Vypočítáme-li průměrný počet smontovaných výrobků na lince A ve sledovaném týdnu, dostaneme číslo 20. Stejný je ale i průměrný počet smontovaných výrobků na lince B. Můžeme též snadno zjistit, že i mediány jsou pro tyto dvě linky stejné - též rovny 20. Modus ani v jednom případě neexistuje, můžeme tedy říci, že z hlediska charakteristik polohy mezi linkami není žádný rozdíl. Přesto však při pozornějším pohledu na data rozdíl vidíme. Počet smontovaných výrobků na lince A se pohybuje od 18 do 22, počty na lince B se pohybují mezi 14 a 26. Vidíme, že linka A je „stabilnější", počty smontovaných kusů méně kolísají, říkáme,
174
Statistika
že vykazují menší variabilitu. Z praktického hlediska lze říci, že linka A je lepší -velké výkyvy ve výrobě jsou nežádoucí.
Pro podrobnější popsání souborů si zavedeme některé důležité charakteristiky variability, což budou čísla charakterizující míru kolísání hodnot statistického znaku. Nejjednodušší možnou takovou charakteristikou je rozpětí:
Rozpětím R statistického znaku rozumíme rozdíl maximální a minimální hodnoty tohoto znaku. Matematicky zapsáno:
K =\|„,-.vo,,
kde x(n) podle již zavedeného označení znamená poslední, tj. maximální hodnotu v uspořádaném výběruax(i) znamená první, tj. minimální hodnotu v uspořádaném výběru.
Určeme rozpětí pro počty smontovaných výrobků na montážních linkách z úlohy A.
Řešení: Rozpětí pro linku A je RA = 22-18 = 4, rozpětí pro linku B je /?B = 26-14 = = 12. Tento jednoduchý výpočet ukazuje, že variabilita vyjádřená rozpětím je u linky B trojnásobná v porovnání s linkou A.
Určeme rozpětí pro dobu do první poruchy přístrojů z úlohy A minulého článku. Řešení: R = 84-2 = 82, tj. rozpětí hodnot je 82 dnů.
Úloha C ukazuje jednu z nevýhod rozpětí, jinak velmi jednoduché a názorné charakteristiky. Rozpětí je v této úloze veliké, a to především díky extrémně malé hodnotě 2 v souboru. Kdybychom tuto hodnotu v souboru neměli (viz též úloha C minulého článku), rozpětí by se značně zmenšilo - z 82 na hodnotu 46.
Obecněji řečeno, rozpětí je charakteristika závisející pouze na dvou hodnotách souboru - maximu a minimu, ostatní hodnoty nemají na rozpětí žádný vliv. Rozpětí je tudíž citlivé na odlehlé (extrémní) hodnoty v souboru dat. Tuto nevýhodu odstraňuje další používaná charakteristika variability - mezikvartilové rozpětí.
Mezikvartilovým rozpětím MKR statistického znaku rozumíme rozdíl horního a dolního kvartilu. Matematicky zapsáno:
MKR=x75~X2s.
Určeme rozpětí a mezikvartilové rozpětí pro velikosti prodaných obleků z úlohy B článku 4.2.
Řešení: Použijeme souhrnnou tabulku odvozenou v řešení citované úlohy:
4.4 Charakteristiky variabilis
Velikost obleku A	Četnost «/	Relativní četnost Pi	Kumulativní četnost	Kumulativní relativní četnost
37	1	2,17 %	1	2,17 %
38	3	6,52 %	4	8,70 %
39	5	10,87 %	9	19,57 %
40	9	19,57 %	18	39,13 %
41	12	26,09 %	30	65,22 %
42	10	21,74%	40	86,96 %
43	5	10,87 %	45	97,83 %
45	1	2,17 %	46	100,00 %
Celkem	46	100,00 %	—	—
Výpočet rozpětí je triviální: R - 45-37 = 8.
K výpočtu mezikvartilového rozpětí potřebujeme nejprve určit kvartily, postupujme již trochu stručněji, kontrolujte detaily výpočtu sami:
• Dolní kvartil: r = 11.75, x25 = 40.
• Horní kvartil: r = 35,25, x75 = 42.
• Mezikvartilové rozpětí: MKR - 2.
Cvičení
I Pro 20 hodnot pH roztoku připraveného k neutralizaci ze cvičení 5 minulého článku vypočtěte rozpětí a mezikvartilové rozpětí.
WM Pro hodnoty koeficientu tření ze cvičení 6 minulého článku vypočtěte rozpěli a mezikvartilové rozpětí.
KcM Jak by se změnil) hodnot} rozpěn' a mezikvartilového rozpětí velikostí prodaných obleků z úlohy D, kdybychom ze souboru dat vynechali nejmenší a největší velikost obleku, tj. kdybychom předpokládali, že se obleky o velikostech 37 a 45 neprodávaly?
Uvedeme nyní dvě v aplikacích statistiky nejčastěji používané charakteristiky variability, které jsou na rozdíl od rozpětí založené na odchylkách jednotlivých hodnot znaku od aritmetického průměru.
Rozptylem statistického znaku rozumíme aritmetický průměr druhých mocnin odchylek jednotlivých hodnot znaku od jejich aritmetického průměru. Značíme jej a°- a vypočteme jej podle vzorce:
1 " n i=\
Směrodatnou odchylkou rozumíme druhou odmocninu z rozptylu, označujeme ji <r„, a platí tedy
176
4. Statistika
Vypočítejme rozptyl a směrodatnou odchylku počtu smontovaných výrobků pro jednotlivé montážní linky z úlohy A.
řešení: Aritmetický průměr hodnot je pro obě linky stejný a je roven x - 20. Pro linku A dostaneme:
(j2 _ 1 [(20-20)2 + (22-20)2 + (19-20)2 + (21 -20)2 + (18-20)2] =
= ^(0 + 4+1+1+4) = 2,
o-,, = v/2 = 1,4142. Pro linku B dostaneme:
cr2=I [(l4-20)2 + (26-20)2 + (18-20)2 + (20-20)2 + (22-20)2] =
= i (36+36+4+0+4) = 16,
a„ = VTó = 4.
Vidíme tedy, že i z hlediska rozptylu, resp. směrodatné odchylky je variabilita produkce linky B výrazně větší než u linky A.
Lze ukázat, že výpočtový vzorce pro rozptyl můžeme upravit do početně zpravidla výhodnějšího tvaru:
Můžeme ověřit již vypočítaný rozptyl produkce u linky B vzorcem z poznámky: a2 = 1 (142 + 262 +182 + 202 + 222) - 202 = ^ • 2 080-400 = 16.
V této konkrétní úloze byl původní výpočet rychlejší; výhodnost nového vzorce se projeví zejména, jsou-li hodnoty znaku celá čísla, zatímco jejich aritmetický průměr je desetinné číslo — viz následující úlohy.
Vypočítejme směrodatnou odchylku doby do poruchy přístrojů z úlohy A minulého článku.
řešení: Aritmetický průměr hodnot znaku, vypočtený v řešení citované úlohy, je desetinné číslo 56,75. Použijeme proto výhodnější výpočtový vzorec rozptylu z předchozí poznámky:
a2n = -L (592+722 + 642 + -- - + 662) -56,752 = —43603-3220,5625 = 413,0208. Směrodatná odchylka je tedy přibližně rovna an = y/413.0208 = 20.3229.
4.4 Charakteristiky variabilit
177
V aplikacích statistiky se jako míra variability používá spíše směrodatná odchylka než rozptyl. Hlav ním důvodem je fakt, že při výpočtu rozptylu hodnoty znaku umocňujeme, a proto výsledné fyzikální jednotky rozptylu jsou druhé mocniny původních jednotek. Jsou-li např. hodnoty znaku v kg, pak jednotka rozptylu je kg2. Směrodatná odchylka je však odmocninou z rozptylu, a vyjadřuje se proto opět v původních jednotkách.
Tedy v předchozí úloze můžeme říci, že doba do poruchy sledovaných přístrojů kolísá
3 3 kolem průměru 56- dne se směrodatnou odchylkou zhruba 20— dne.
Jsou-li hodnoty znaku uspořádány do tabulky četností, můžeme vzorec pro rozptyl vyjádřit ve tvaru využívajícím tyto četnosti.
Vzorce pro výpočet rozptylu
1. Jsou-li X] ,X2.....xn všechny (ne nutně navzájem různé) hodnoty znaku, pak
rozptyl tohoto znaku můžeme počítat pomocí základního vzorce
1 "
" ,= \
nebo pomocí jeho výpočtového tvaru
-x2.
Jsou-li x*\ <x\ <•••'< x* navzájem různé hodnoty znaku an\,ri2,.... nr jsou
r
četnosti těchto hodnot, přičemž n = ]T /?,-je rozsah souboru, pak rozptyl tohoto
(=]
znaku můžeme počítat pomocí upraveného základního vzorec
o?s5-ž(*r~jf)2-'*i
" (= i
nebo pomocí jeho výpočtového tvaru
1
!=t
-x2.
Určeme rozptyl a směrodatnou odchylku velikostí prodaných obleků pro data z úlohy B článku 4.2.
řešení: Aritmetický průměr velikostí jsme již vypočítali - viz řešení úlohy D minulého článku, vyšlo přibližně číslo 40,826. V průběhu následujícího výpočtu toto číslo ověříme. Pro zpřehlednění výpočtů je výhodné doplnit již odvozenou tabulku četností hodnot o dva pomocné sloupce:
178
Statistika
Velikost obleku *;	Četnost rij	Součin * xt -lij	Součin
37	1	37	1 369
38	3	114	4 332
39	5	195	7 605
40	9	360	14400
41	12	492	20172
42	10	420	17 640
43	5	215	9 245
45	1	45	2025
Celkem	46	1878	76788
Předposlední sloupec můžeme použít k výpočtu aritmetického průměru. Jeho součet
r ] r
totiž přesně odpovídá sumě Ylx*' ni ze vzorce x - ~^2X* ' nr> který jsme uvedli
i=i n í=i
v minulém článku. Dostaneme tedy výsledek:
x= — ■ 1 878 = 40,826087. 46
Poslední sloupec můžeme použít k výpočtu rozptylu. Jeho součet totiž přesně odpovídá
r ,
sumě    (x*) ■ ni z posledního výpočtového tvaru vzorce pro rozptyl. i=l
Dostaneme:
0-2 _ _L, 76788-40.8260872 = 2,53497, "46
<t„ = ^2,53497 = 1,592. Rozptyl velikostí obleků je tedy přibližně 2,535 a směrodatná odchylka 1,592.
Možná vás napadlo, proč jsme v řešení předchozí úlohy počítali aritmetický průměr na tolik (dokonce 6) desetinných míst. Nebylo to samoúčelné. Výpočtové verze vzorců pro rozptyl jsou totiž velmi citlivé na zaokrouhlování. Kdybychom aritmetický průměr zaokrouhlili na 1 desetinné místo (x = 40,8), pak bychom po dosazení do vzorce
pro rozptyl dostali    = — • 76 788 - 40,82 = 4,664 3, což je zcela nepřijatelná, téměř
dvojnásobná hodnota. Dokonce i při zaokrouhlení průměru na 2 desetinná místa (x =
= 40,83) se výsledná hodnota a\ = — ■ 76788-40,832 = 2.215 od dříve vypočtené
hodnoty výrazně liší. Nejlepší je při použití výpočtového vzorce pro rozptyl vstupní hodnoty nezaokrouhlovat, tj. dosadit za průměr jeho přesné vyjádření ve tvaru zlomku:
1 878 939
x =
46      23 '
4.4 Charakteristiky variabilit
1"?
Vzorec pro rozptyl cr„ by se správně měl používat jen v situaci, kdy máme k dispozici všechny možné hodnoty zkoumaného znaku. Velmi často je statistický soubor, který máme k dispozici, pouze malou částí celku, je tzv. náhodným výběrem ze základního souboru. V takovém případě, chceme-li co nejpřesněji odhadnout neznámý rozptyl základního souboru, je nejlepší z dostupných dat vypočítat tzv. výběrový rozptyl. Vzorec pro výběrový rozptyl se liší od zavedeného vzorce pro rozptyl jen hodnotou jmenovatele, je však bohužel nemožné na úrovni středoškolské matematiky tuto odlišnost jednoduše zdůvodnit.
Výběrový rozptyl souboru hodnot statistického znaku značíme a vypočteme jej podle vzorce: , „
^ -~Ete-^)2.
'n-\
n-
(=1
Výběrovou směrodatnou odchylkou rozumíme druhou odmocninu z výběro-
vého rozptylu, označujeme ji <r„_i. a platí tedy a„_i = Jcr^
-ľ
Mezi rozptylem a výběrovým rozptylem platí následující jednoduché převodní vztahy:
Aby se předešlo nedorozumění, veličina se někdy nazývá rozptylem základního souboru, veličina cfci je. jak jsme již uvedli, výběrový rozptyl. Podobně n„ je tzv. směrodatná odchylka základního souboru, zatímco a„ | je výběrová směrodatná odchylka.
My nebudeme tuto podrobnou terminologii používat. Udělejme následující úmluvu: Rozptylem, resp. směrodatnou odchylkou v této učebnici vždy rozumíme charakteristiku 17,7, resp. o„. Výběrovým rozptylem, resp. výběrovou směrodatnou odchylkou pak samozřejmě rozumíme charakteristiku     r resp. an-\.
Poslední poznámka ke značení:
Symboly an a alt..\ se běžně používají na statistických kalkulačkách. V některých učebnicích a na některých typech kalkulaček se můžete setkat se stručnějším označením - místo an se píše a a místo cr„_| se píše .v.
Pozor! Symbol s tedy označuje výběrovou směrodatnou odchylku, tj. číslo počítané podle vzorce \ = <r„ .| = J <7;,_] - 1 / —-7    Uy -.v)2.
180
Statistik,
Vypočítejme výběrovou směrodatnou odchylku doby do poruchy přístrojů z úlohy A minulého článku.
Řešení: V řešení úlohy F tohoto článku jsme vypočítali rozptyl    tohoto souboru. Výběrový rozptyl můžeme proto rychle vypočítat pomocí výše uvedeného převodního 9        n      9 12
vztahu       =--       • <r„ = — -413,0208 = 450.568 I. Výběrová směrodatná odchylka
je pak přibližně rovna an-\ = \/450,568 1 = 21,2266.
Jak plyne ze vzorců, pro libovolný soubor hodnot je výběrový rozptyl vždy větší než rozptyl, a tedy i výběrová směrodatná odchylka je vždy větší než směrodatná odchylka. Tyto rozdíly se však zmenšují s rostoucím rozsahem souboru. Pro soubory o rozsahu stovek, nebo dokonce tisíců jednotek jsou tyto rozdíly prakticky zanedbatelné.
I pro výpočet výběrového rozptylu je možné odvodit výpočtové tvary vzorců - viz následující shrnutí:
Vzorce pro výpočet výběrového rozptylu
1. Jsou-li x\,x2, ■ ■ ■,xn všechny (ne nutně navzájem různé) hodnoty znaku, pak výběrový rozptyl tohoto znaku můžeme počítal pomocí vzorce
\ — —_"^2
- --r E(*/-*)2 nebo    = —r X>;
2. Jsou-li x* < x* < ■ ■ ■ < x* navzájem různé hodnoty znaku a«i, «2, ..., nr jsou četnosti těchto hodnot, přičemž n = ^7J«,; je rozsah souboru, pak výběrový rozptyl tohoto znaku můžeme počítat pomocí vzorce
l
7Íi =7tE «-*Y-nt nebo = n-i ,= 1
1 r
n _9 —tX~
U dvaceti náhodně vybraných zaměstnanců velké firmy byl zjištěn počet absencí za uplynulý rok. Hodnoty (vyjádřené v celých dnech) byly uspořádány do tabulky četností:
Počet absencí	Počet zaměstnanců
0	6
1	4
2	3
3	2
4	1
6	1
4.4 Charakteristiky varia
9	1
11	1
23	1
Celkem	20
Odhadněme průměrný počet absencí za rok na jednoho pracovníka celé firmy. Odhadněme též směrodatnou odchylku počtu absencí za rok v celé firmě.
řešení: Průměrný počet absencí za rok na jednoho pracovníka celé firmy odhadneme nejlépe aritmetickým průměrem dostupných dat. Směrodatnou odchylku tohoto počtu v celé firmě, tj. v celém základním souboru, pak odhadneme nejlépe pomocí výběrové směrodatné odchylky.
Tabulku četností si doplníme stejně jako v řešení úlohy G o dva pomocné sloupce.
Počet absencí A	Četnost «i	Součin * *i - ni	Součin {xff-m
0	6	0	0
i	4	4	4
2	3	6	12
3	2	6	18
4	1	4	16
6	1	6	36
9	1	9	81
11	1	11	121
23	1	23	529
Celkem	20	69	817
69
Z předposledního sloupce vypočteme aritmetický průměr: x - — = 3,45.
Z posledního sloupce pak pomocí výpočtového vzorce vypočteme výběrový rozptyl:
'n-l
1
i=l
-x2
1
19
■817-
20 19
3,452 = 30,471
Výběrová směrodatná odchylka je pak přibližně rovna a„_i = y/30,471 =5,52. Průměrný počet absencí za rok připadající na jednoho pracovníka celé firmy odhadujeme tedy údajem 3,45 dne a směrodatnou odchylku tohoto počtu hodnotou 5,52 dne.
V úloze I, kde byly všechny hodnoty souboru nezáporná čísla, vyšla směrodatná odchylka dokonce větší než aritmetický průměr dat. To je poměrně neobvyklé. Je to způsobeno výrazným zešikmením dat (polovina pracovníků neměla žádnou nebo měla jen jednu absenci, někteří však měli velký počet absencí - všimněte si hodnot 11, a zejména 23). Tyto extrémní hodnoty ovlivní i průměr, jejich vliv na směrodatnou odchylku je však ještě výraznější.
182
Statistik,
Cvičení
11 Pro 20 hodnot pH roztoku připraveného k neutralizaci ze cvičení 5 minulého článku vypočtěte rozptyl a směrodatnou odchylku.
M*M Vypočtěte rozptyl a směrodatnou odchylku pro data z úlohy E minulého článku.
W'U Vypočtěte směrodatnou odchylku koeficientu tření ze cvičení 6 minulého článku.
WM Ve 103 po sobě jdoucích pracovních směnách byl zjištěn počet vadných výrobků vyrobených určitým přístrojem - viz následující tabulka:
Počet vadných	Četnost výskytu
výrobků	(počet směn)
2	13
3	15
4	25
5	18
6	12
7	12
8	8
Celkem	103
Vypočtěte aritmetický průměr, medián, modus, rozpětí, mezikvartilové rozpětí, rozptyl a směrodatnou odchylku počtu vadných výrobků.
M'-U V devíti náhodně odebraných vzorcích zeminy v oblasti plánované výstavby byl laboratorní zkouškou zjištěn obsah určité agresivní látky. Zjištěné hodnoty (v mg na 1 kg odebrané zeminy) byly:
0,125   0,880   0,214   0,312   0,198   0,101    0,235   0,194 0,314
Odhadněte průměrný obsah této látky v zemině v celé oblasti. Odhadněte též rozptyl a směrodatnou odchylku obsahu látky v oblasti.
Rozpětí, mezikvartilové rozpětí i směrodatnou odchylku můžeme vyjadřovat ve stejných fyzikálních jednotkách, ve kterých byly měřeny hodnoty znaku. Fyzikální jednotky rozptylu jsou druhé mocniny původních jednotek. Všechny výše uvedené charakteristiky vyjadřují tzv. absolutní variabilitu. Někdy však potřebujeme vyjádřil variabilitu bezrozměrným číslem. Takové číslo pak charakterizuje tzv. relativní variabilitu. Nejčastěji se k tomuto účelu používá variační koeficient.
Variačním koeficientem statistického znaku rozumíme podíl směrodatné odchylky a aritmetického průměru vyjádřený v procentech. Značíme jej symbolem V a vypočteme jej podle vzorce:
V = ^-100%.
x
Variační koeficient je definován jen tehdy, je-li aritmetický průměr hodnot znaku nenulový.
i Charakteristiky variability
Variační koeficient používáme zejména tehdy, chceme-li porovnat variabilitu dvou či více souborů, jejichž hodnoty se výrazně liší z hlediska aritmetického průměru, nebojsou dokonce vyjádřeny ve zcela jiných jednotkách.
Následující tabulka udává měsíční počty objednávek dvou typů bezpečnostních dveří za uplynulý půlrok u jisté stavební firmy:
Standardní typ	11	8	19	12	12	7
Luxusní typ	2	0	8	3	2	0
Který z typů dveří vykazuje z hlediska prodeje větší variabilitu?
Řešení: Vypočteme-li pro každý typ směrodatnou odchylku, dostaneme čísla:
• standardní typ:   an= 3,8622;
• luxusní typ:   a„- 2,6926.
Standardní typ má tedy větší absolutní variabilitu. Oba typy dveří se však výrazně liší z hlediska průměrného počtu objednávek. V podobné situaci je vhodnější porovnat relativní variabilitu obou souborů. Vypočteme proto aritmetické průměry a variační koeficienty:
3 8622
• standardní typ:   jč = 11,5;   V=~\i5  • 100 % = 33,58 %.
• luxusní typ:   jč = 2,5;   V=  '       ■ 100 % = 107,7 %.
Relativní variabilita prodeje luxusního typu bezpečnostních dveří je tedy více než třikrát větší než u standardního typu. Kolísání hodnot prodeje luxusního typu vyjádřené směrodatnou odchylkou činí více než 100 % průměrného prodeje.
Osm dealerů určité farmaceutické firmy vykázalo za poslední týden následující provozní výdaje v Kč a počty najetých kilometrů služebními auty:
Dealer	A	B	C	D	E	F	G	H
Provozní výdaje	2940	1 650	810	1 860	2 360	2 650	910	2040
Počet najetých km	890	740	360	960	540	880	870	860
Který z obou znaků, provozní výdaje nebo počet najetých kilometrů, vykazuje větší variabilitu?
řešení: V tomto případě evidentně nemá smysl porovnávat absolutní variabilitu -každý znak je vyjádřen v jiných jednotkách. Vypočítáme proto variační koeficienty:
• cestovní náklady:   x= 1902,50 Kč;   a„ = 716,55 Kč;   V = 37,66 %.
• najeté kilometry:   x = 762,5km;   an = 194,34 km;   K = 25,49%. Cestovní náklady mají tedy větší (relativní) variabilitu.
184
Statistika
Cvičení
Vypočtěte variační koeficient souboru 20 hodnot pH roztoku ze cvičení 5 minulého článku.
I Vypočtěte variační koeficient hodnot koeficientu tření ze cvičení 6 minulého článku.
Vyberte ve vaší třídě 8—10 studentů stejného pohlaví a u každého zaznamenejte výšku v centimetrech a hmotnost v kilogramech. U každého z těchto dvou znaků vypočtěte aritmetický průměr a směrodatnou odchylku. Který ze znaků vykazuje větší variabilitu?
Uvažujme produkci dvou závodů. Produkce závodu A se vyjadřuje v kusech, závodu B v tunách. Na základě údajů v tabulce posuďte, ve kterém ze závodů byla během příslušné dekády výroba rovnoměrnější.
Den	Produkce závodu A tisíce ks	Produkce závodu B tuny
1	1	6
2	2	6
3	2	5
4	3	8
5	2	9
6	4	4
7	2	4
8	1	6
9	2	7
10	4	7
Celkem	23	62
I
4.5 Přibližný výpočet charakteristik polohy a variability
V předchozích dvou článcích jsme se zabývali metodami výpočtu charakteristik polohy a variability v případě, kdy známe přesně všechny hodnoty ve zkoumaném souboru, tj. když máme k dispozici „původní" data. Pokud je však těchto výchozích hodnot znaku velké množství a tyto hodnoty se až na výjimky liší, pak je přesný výpočet většiny charakteristik podle zavedených vzorců velmi pracný a bez použití počítače v omezeném čase prakticky neproveditelný.
Máme-li však k dispozici tabulku skupinového rozdělení četností pro zkoumaný soubor, můžeme potřebné charakteristiky vypočítat alespoň přibližně. V následujících
4.5 přibližný výpočet
<teristik
a variabii
18:
dvou motivačních úlohách si ukážeme, jak postupovat při přibližném výpočtu aritmetického průměru a rozptylu.
Uvažujme znovu data z úlohy D článku 4.2 - jedná se o průměrné kupní ceny bytů ve 27 největších městech ČR v roce 2007. Pomocí tabulky skupinového rozdělení četností, odvozené v řešení citovaného příkladu, vypočtěme přibližně průměrnou kupní cenu, rozptyl a směrodatnou odchylku ceny v těchto 27 městech v daném roce. Řešení: Nejprve znovu uveďme tabulku skupinového rozdělení četností, odvozenou v řešení citované úlohy.
Cena Kč/m2	Četnost	Relativní četnost	Kumulativní četnost	Kumulativní relativní četnost
12700-18100	11	40.74 %	11	40,74 %
18 100-23 500	11	40,74 %	22	81,48 %
23 500-28 900	3	11,11 %	25	92,59 %
28 900-34 300	1	3,70 %	26	96,30 %
34 300-39 700	0	0,00 %	26	96,30 %
39700-45100	1	3,70 %	27	100,00%
Celkem	27	100,00 %	—	—
Jak můžeme na základě této tabulky odhadnout průměr? Myšlenka je celkem jednoduchá. Např. první řádek tabulky říká, že v 11 městech byla průměrná kupní cena bytů v rozmezí od 12 700 Kč za m2 do 18 100 Kč za m2. Nechceme-li kvůli pracnosti použít původnídata, pro zjednodušenípředpokládáme, že všech těchto 11 hodnotje rovno prostřední hodnotě daného intervalu. Ta ie rovna---Kč/m2 = 15400Kč/m2.
2
Obdobným způsobem interpretujeme i další řádky tabulky. Tímto postupem vlastně z původní tabulky skupinového rozdělení četností vytvoříme tabulku četností pro opakující se hodnoty znaku.
Tuto tabulku doplníme o dva pomocné sloupce a hledaný aritmetický průměr a rozptyl vypočteme podle vzorců z předchozího článku - viz např. řešení úlohy G.
Střední hodnota	Četnost	Součin	Součin
intervalu x*	ni	xf-rii	
15 400	11	169400	2 608 760 000
20800	11	228 800	4 759 040000
26200	3	78 600	2 059 320 000
31 600	1	31 600	998 560000
37 000	0	0	0
42400	1	42400	1797 760000
Celkem	27	550 800	12 223440000
186
4. Statistika
Tedy podle již zavedených výpočtových vzorců platí:
x = — ■ 550 800 = 20 400,     u\ = — • 12 223 440000 - 20 4002 = 36 560 000. 27 "27
an = 736560000 = 6046,49.
Průměrnou kupní cenu bytů v těchto městech v roce 2007 tedy odhadujeme hodnotou 20400 Kč za m2 plochy bytu a směrodatná odchylka ceny je asi 6046,50 Kč za m2 plochy bytu.
Uvědomte si, že hodnoty průměru, rozptylu a směrodatné odchylky vypočtené výše uvedeným postupem jsou pouze odhady skutečných charakteristik. Kdybychom vypočetli přesnou hodnotu průměru z původních 27 čísel v úloze D článku 4.2. dostali bychom 20318,41 Kč/m2. (Zkuste si sami ověřit!) Náš odhad 20400 Kč je tedy poměrně přesný. Kdybychom vypočetli z původních dat přesnou hodnotu směrodatné odchylky, výsledek by byl 6 362,00 Kč/m2. (Do ověřování se ale asi bez počítače raději nepouštějte.) Náš odhad směrodatné odchylky 6 046,50 Kč, vypočtený z tabulky, tedy již tak přesný není. ale jako hrubý odhad je použitelný.
V řešení úlohy A jsme při použití výpočtových vzorců pracovali s velkými čísly. Mohli jsme si trochu usnadnit práci, kdybychom ceny bytů vyjádřili místo v korunách ve stokorunách. (V praxi běžnější je vyjádření v tisícikorunách, to by ale v naší úloze vedlo na počítání s desetinnými čísly a tomu se chceme vyhnout.) Je velmi snadné ověřit, že potom by tabulka sloužící k výpočtu průměru a rozptylu vypadala takto:
Střední hodnota intervalu x*	Četnost	Součin	Součin
100 Kč/m2	ni	Xj ■ tli	(x*)2-m
154	11	1 694	260876
208	11	2288	475 904
262	3	786	205 932
316	1	316	99 856
370	0	0	0
424	1	424	179 776
Celkem	27	5 508	1 222 344
Průměr pak vyjde x=  ^  = 204, rozptyl je a2 =-—--2042 = 3 656 a směrodatná
odchylka an = \/3 656 = 60,4649. Výsledky jsou samozřejmě stejné, jen jsou vyjádřeny v jiných jednotkách (204 stokorun = 20400 Kč apod.).
V každé z 10 vybraných prodejen byl při kontrole zjišťován počet zbývajících dnů do data doporučené spotřeby u 10 vybraných potravinářských výrobků od určitého výrobce. Údaje zpracované do tabulky skupinového rozdělení četností jsou následující:
4.5 přibližný výpočet charakteristik polohy a variabilit
187
Počet zbývajících dnů	Četnost
0-9	5
10-19	35
20-29	27
30-39	14
40-49	8
50-59	5
60-69	4
70 a více	2
Celkem	100
Vypočtěme přibližně průměrný počet zbývajících dnů do data spotřeby a směrodatnou odchylku tohoto počtu.
Řešení: Především si všimněte, že šířka posledního intervalu není konkrétně specifikovaná. V takovém případě pro potřebu výpočtů i pro případnou potřebu zakreslení histogramu mlčky předpokládáme, že tento interval má stejnou šířku jako všechny ostatní, tj. že jde o interval 70 dnů-79 dnů.
Dále budeme postupovat obdobně jako v úloze A. Musíme dát jen pozor na to, že mezi intervaly jsou tentokrát mezery - např. střed prvního intervalu je aritmetický průměr jeho krajních hodnot, tj. číslo 4,5, nikoliv 5.
Střední hodnota	Četnost	Součin	Součin
intervalu x*	«;	xf-rii	«)%
4,5	5	22,5	101,25
14,5	35	507,5	7 358,75
24,5	27	661,5	16 206,75
34,5	14	483,0	16663,5"
44,5	8	356,0	15 842,00
54,5	5	272,5	14 851,25
64,5	4	258,0	16 641,00
74,5	2	149,0	11 100,50
Celkem	100	2 710,0	98 765,00
*=W=27'1;    ^ = ľTôtT-^l2-253,24;    an = V^24= 15,91. Tedy průměrný počet dnů do doporučeného data spotřeby je přibližně 27 dnů a směrodatná odchylka je přibližně 16 dnů.
V řešení úlohy B jsme pracovali s poněkud nepohodlnými hodnotami středů intervalů. Kdybychom si nevšimli mezer mezi intervaly, pracovali bychom s nesprávnými, ale
188
4. Statistika
pohodlnějšími hodnotami středů intervalů: 5, 15, 25 atd. Výpočet by pak vypadal následovně:
Střední hodnota	Četnost	Součin	Součin
intervalu x*	«i	X* ■ H;	
5	5	25	125
15	35	525	7 875
25	27	675	16 875
35	14	490	17 150
45	8	360	16200
55	5	275	15 125
65	4	260	16 900
75	2	150	11 250
Celkem	100	2760	101 500
x= ~ = 27,6;    al = 1^ -27,62 = 253,24;    an = s/2532A =15,91.
Všimněte si, že rozptyl a směrodatná odchylka vyšly zcela stejně jako v původním výpočtu, aritmetický průměr je však o 0,5 větší. Není těžké ukázat, že platí následující obecné tvrzení:
Přičteme-li ke všem středním hodnotám intervalů stejnou konstantu (nebo ještě obecněji, přičteme-li ke všem hodnotám znaku stejnou konstantu), pak se průměrná hodnota znaku zrnění právě o tuto konstantu. Rozptyl a směrodatná odchylka se přitom nezmění.
V úvaze za řešením úlohy B bylo touto konstantou číslo 0,5, proto zákonitě nová hodnota aritmetického průměru vyšla o 0,5 větší než původní, správná hodnota. Této vlastnosti můžeme využívat:
Jsou-li středy intervalů desetinná čísla, můžeme k nim přičíst vhodnou konstantu tak. abychom dostali čísla pohodlná na počítání. S těmito novými středy intervalů provedeme přibližný výpočet průměru, rozptylu a směrodatné odchylky. Výslednou hodnotu průměru opravíme odečtením konstanty, kterou jsme k původním středům přičetli, zatímco rozptyl ani směrodatnou odchylku neopravujeme.
V podniku, který má 700 zaměstnanců, máme k dispozici hodinové mzdy jednotlivých pracovníků:
Interval hodinových mezd/Kč	Muži	Ženy
60-79,90	40	24
80-99,90	80	36
100-119,90	100	60
120-139,90	150	48
140-159,90	90	20
160-179,90	25	12
180 a více	15	0
Celkem	500	200
Určeme zvlášť pro muže a zvlášť pro ženy průměrnou hodinovou mzdu, směrodatnou odchylku a variační koeficient hodinové mzdy.
Řešení: Poslední interval pro potřeby výpočtů chápemejako 180 Kč-199,90 Kč. Přesné středy intervalů hodinových mezd jsou 69,95 Kč, 89,95 Kč atd., až 189,95 Kč. S těmito hodnotami by se však špatně pracovalo, proto ke každé z nich přičteme číslo 0,05, čímž dostaneme hodnoty pohodlnější pro výpočet. Nesmíme však zapomenout v závěru výpočtů hodnotu průměru opravit - viz předchozí poznámka.
Posunutá střední hodnota intervalu x*	Četnost mužů rit	Součin x* ■ nt	Součin (x*f -tlí	Četnost žen mi	Součin x, -nij	Součin (x*Y -mi
70	40	2 800	196 000	24	1680	117 600
90	80	7 200	648 000	36	3 240	291 600
110	100	11 000	1 210000	60	6 600	726000
130	150	19 500	2 535 000	48	6 240	811 200
150	90	13 500	2025 000	20	3 000	450000
170	25	4250	722500	12	2 040	346 800
190	15	2 850	541500	0	0	0
Celkem	500	61 100	7 878 000	200	22 800	2 743 200
Výsledky pro muže jsou:
-•61 100    n, on x - -^rxrr- = 122.20; a
500
průměr po opravě: x
2 - 7 878 000 -122,22 = 823,16; an = ^823^16 = 28,691
500 122,20-0,05
122,15;   V = J^^=23>49%-
2 •
ai =
2743200
Výsledky pro ženy jsou: _ . 22800 „
x=~mT = n4m   - 200
průměr po opravě: x = 114,00-0,05 = 113,95
142 = 720;     o-n=V720 = 26,833; 26,833
V ■■
= 23.55 %.
113,95
Průměrná hodinová mzda mužů u dané firmy je přibližně 122,15 Kč, průměrná hodinová mzda žen je zhruba 113,95Kč. Směrodatné odchylky jsou přibližně rovny 28,69 Kč u mužů a 26,83 Kč u žen. Variační koeficienty jsou pak téměř stejné: asi 23,49 % u mužů a 23,55 % u žen.
190
4. Statistika
Cvičení
Obchodní podnik roztřídil svých 33 prodejen podle počtu pracovníků. Rozdělení četností je uvedeno v následující tabulce. Vypočtěte přibližně průměrný počet pracovníků připadajících na jednu prodejnu, rozptyl a směrodatnou odchylku tohoto počtu.
Počet pracovníků	Počet prodejen
1-5	9
6-10	8
11-15	8
16-20	5
21-25	2
26-30	1
Celkem	33
Vypočtěte přibližně průměrný počet odpracovaných hodin a směrodatnou odchylku tohoto počtu pro soubor 75 dělníků ze cvičení 3 článku 4.2.
Návod: Použijte k tomuto výpočtu tabulku skupinového rozdělení četností odvozenou v řešení úlohy c citovaného článku.
Na určitém místě dálnice byly automatickým zařízením měřeny časové odstupy mezi dvěma po sobě jedoucími vozidly v pravém jízdním pruhu. Výsledné hodnoty (v sekundách) zjištěné během půlhodinového intervalu byly uspořádány do tabulky skupinového rozdělení četností:
Časový odstup	Počet vozidel
0-0,95	8
1-1,95	87
2-2,95	224
3-3,95	173
4-4,95	54
5-5,95	31
6-6,95	8
7-7,95	1
8 a více	2
Celkem	588
Určete přibližně průměrnou hodnotu časového odstupu, směrodatnou odchylku a variační koeficient časového odstupu.
Až dosud jsme se v tomto článku zabývali odhadováním průměru, rozptylu či směrodatné odchylky z tabulky skupinového rozdělení četností. Jak můžeme odhadovat ostatní používané charakteristiky, jako je modus, medián či obecněji kvantily?
4.5 přibližný výpočet charakteristik polohy a variability
Uspořádáme-li soubor hodnot do tabulky skupinového rozdělení četností, nemáme již sebemenší možnost z této tabulky zpětně vyčíst, kolikrát se která hodnota v původn:: souboru opakovala a jestli vůbec k nějakému opakování došlo. Původní data reprezentovaná takovouto tabulkou jsou často desetinná čísla, která se vůbec neopakují ne: se opakují jen výjimečně, a proto modus původního souboru hodnot zpravidla neexistuje. Přesto má smysl určovat z tabulky skupinového rozdělení modálni interval tj. interval, ve kterém se vyskytuje nejvíce hodnot původního souboru.
Hledání mediánu nebo obecněji kvantilůje složitější - viz následující popis doporučen _ metody.
Hodnotu xp, tj. /7-procentní kvantil statistického znaku, odhadujeme na základě tabulky skupinového rozdělení četností takto:
1. Stejně jako v obecné definici kvantilu (viz článek 4.3) určíme pořadí r v uspo-řádaném souboru, ve kterém se nachází hledaný kvantil: r -      ■ (n+1).
2. Z tabulky skupinového rozdělení četností určíme kvantilový interval, tj. interval, ve kterém se nachází hledaný kvantil. Je to takový interval, jehož kumulativní četnost (označme ji c\) je větší nebo rovna číslu r, přičemž kumulativní četnost předchozího intervalu v tabulce (označme ji cq) je menší než r. Jinými slovy - hledáme ve sloupci kumulativních četností dvě po sobě jdoucí hodnoty cq a c\ tak, aby platilo: cq < r < c\. Pokud je číslo r menší nebo rovno kumulativní četnosti prvního intervalu v tabulce, pak je tento první interval kvantilovým intervalem a klademe cq = 0.
3. Polohu hledaného kvantilu uvnitř kvantilového intervalu odhadneme tak, že k dolní mezi kvantilového intervalu přičteme poměrnou část jeho šířky podle vzorce:
x,,-ii+- (b-a). "i
V tomto vzorci a označuje dolní a b horní mez kvantilového intervalu, b-a je pak šířka tohoto intervalu a ti] je jeho četnost. Tato četnost musí vždy být rovna rozdílu kumulativních četností cj a cq, tj. ti] =c\ -r() (rozmyslete si!).
Uvažujme znovu průměrné kupní ceny bytů ve 27 největších městech ČR - viz úloha A. Můžeme z tabulky skupinového rozdělení četností použité v řešení úlohy A určit modálni interval? Vypočtěme z této tabulky přibližně medián a oba kvartily.
Řešení: První dva intervaly mají stejnou a současně největší četnost v tabulce -rovnu 11. Proto modálni interval přísně vzato neexistuje (není jednoznačně určen). Můžeme však samozřejmě říci, že průměrné ceny bytů se nejčastěji pohybovaly od 12 700 Kč/m2 do 23 500 Kč/m2.
Odhadněme z tabulky medián, tj. hodnotu x$q. Pořadí mediánu v uspořádaném souboru je r = • (27+ 1) = 14. Mediánovým intervalem je druhý interval v tabulce, neboť jeho kumulativní četnost je 22, přičemž kumulativní četnost předchozího (zde prvního)
192
4. Statistika
intervalu je 11. S použitím zavedeného označení můžeme psát: c0 = 11, C\ = 22, n\ = 11, a=18 100, ž> = 23500, a proto
Jč50 = Jč = 18100+ l4~11 (23500-18100)= 19573.
Medián je tedy přibližně 19 573 Kč/m2.
25
Pro dolní kvartil dostaneme: r- —- -(27+l) = 7. Intervalem pro dolní kvartil je první
interval v tabulce, neboť jeho kumulativní četnost jeli, což je více než 7. Platí: c0 = 0, ej = 11, nx = 11, a = 12700, b = 18 100, a proto
jč25 = 12700+~-5400 = 16136. 11
Pro horní kvartil platí: r = 21, cq = 11, Ci = 22, n\ = 11 (horní kvartilový interval je v tomto příkladu stejný jako mediánový interval), a proto
JČ75 = 18 100 + ■ 5 400 = 23 009.
Dolní kvartil je tedy přibližně 16 136 Kč/m2 a horní kvartil je přibližně 23 009 Kč/m2.
Uvědomte si, že hodnoty kvantilů vypočtené z tabulky četností podle uvedeného postupu jsou pouze odhady skutečných kvantilů. Vypočtcme4i z původních cen bytů (jsou uvedeny v úloze D článku 4.2) skutečné hodnoty mediánu a kvartilů, dostaneme trochu odlišné hodnoty:
x = 20 162 Kč/m2. x25 = !6343 Kč/m2 a x75 = 22425 Kč/m2.
Následující tabulka udává rozdělení měsíčních příjmů v Kč zaměstnanců jisté firmy. V jakém rozmezí se nejčastěji pohybuje měsíční příjem zaměstnanců? Odhadněme, jaký minimální měsíční příjem by měl pracovník mít, aby patřil do horní poloviny lépe placených zaměstnanců. Zhruba jaký minimální měsíční příjem by mu zabezpečil příslušnost mezi 10 % nejlépe placených zaměstnanců?
Měsíční příjem/Kč	Počet pracovníků
16000 a méně	8
16001-17 500	25
17501-19000	32
19 001-20 500	26
20501-22 000	15
22 001-23 500	6
23 501-25 000	3
Více než 25 000	1
Celkem	116
Řešení: Odpovědí na první otázku jemodální interval, tj. podle tabulky interval příjmů od 17 501 Kč do 19000 Kč.
4.5 přibližný výpočet charakteristik poloh
V zadané tabulce upřesníme první a poslední interval a doplníme kumulativní četnosti:
Měsíční příjem/Kč	Počet pracovníků (četnost)	Kumulativní četnost
14 501-16000	8	8
16 001-17 500	25	33
17501-19000	32	65
19001-20 500	26	91
20 501-22 000	15	106
22 001-23500	6	112
23 501-25 000	3	115
25 001-26500	1	116
Celkem	116	—
Odpovědí na druhou otázku je medián. Při jeho přibližném výpočtu postupně dostaneme: 58 5-33
r = 58,5,   c0 = 33,   ci=65,   «,=32,   Jč= 17501+ ' '-1499=18696.
Příslušnost k horní polovině lépe placených zaměstnanců je tedy zajištěna minimálním měsíčním příjmem ve výši 18 696 Kč.
Odpovědí na třetí otázku je 90procentní kvantil (rozmyslete si!): r= 105,3, c0 = 9l, ci = 106, «i = 15, š90 = 20501 + — 5;3~91 ■ 1499 = 21930.
Příslušnost mezi 10 % nej lépe placených zaměstnanců je tedy zabezpečena minimálním měsíčním příjmem ve výši 21 930 Kč.
Cvičení
El Vypočtěte přibližně medián, dolní kvartil a horní kvart i 1 počtu odpracovaných hodin pro soubor 75 dělníků ze cvičení 3 článku 4.2.
Návod: Použijte k tomuto výpočtu tabulku skupinového rozděleni četností odvozenou v řešení úlohy C citovaného článku.
Na základě tabulky údajů ze cvičení 3 tohoto článku odhadněte kritickou hodnotu časového odstupu, kterou na daném úseku 10 % řidičů nedodrží a 90 % řidičů ji překročí.
Nápověda: Tato doba odpovídá určitému kvantilu, rozmyslete si jakému.
Ve třídě je pět žáků s prospěchem lepším než 1,5, osm žáků má prospěch 1,5 nebo horší, avšak lepší než 2, jedenáct žáků má prospěch 2 nebo horší, avšak lepší než 2,5, čtyři žáci mají prospěch 2,5 nebo horší, avšak lepší než 3 a dva žáci mají prospěch 3 nebo horší.
a) Sestavte tabulku skupinového rozdělení četností včetně kumulativních četností a odhadněte průměrný prospěch celé třídy. Při sestavování tabulky četností předpokládejte, že průměrný prospěch jednotlivých žáků byl zaokrouhlován na dvě desetinná místa.
b) Odhadněte, jaká hodnota prospěchu odděluje 20 % nejlepších žáků od zbytku třídy.
I
ES
194
V předchozích článcích jsme zkoumali vždy jen jeden statistický znak. Tímto znakem byl např. měsíční příjem zaměstnanců firmy a hledali jsme průměrnou hodnotu, směrodatnou odchylku atd. Často však u statistických jednotek daného souboru můžeme zjistit hodnoty několika znaků zároveň. V takových případech nás mimo jiné zajímá i míra závislosti mezi hodnotami těchto znaků. V tomto článku se budeme zabývat situacemi, kdy máme na daném souboru statistických jednotek zjištěny hodnoty dvou kvantitativních znaků.
Uveďme možné příklady:
U souboru žáků jedné třídy můžeme třeba zjistit známky z matematiky a známky z fyziky. Kromě zjištění průměrných známek z těchto dvou předmětů, mediánů apod. nás může též zajímat, zda platí mlčky předpokládaná „pozitivní závislost" mezi těmito známkami, tj. zda žáci, kteří jsou dobří v matematice, jsou zpravidla dobří i ve fyzice a naopak.
V několika po sobě jdoucích provozních hodinách můžeme sledovat výrobu kyseliny dusičné a získat záznamy o průměrné teplotě chladicí kapaliny a o celkovém úniku čpavku. Určitě by nás mělo zajímat, jak na sobě tyto dva znaky závisí - dochází při nižší teplotě spíše k menšímu úniku čpavku? Nebo je tomu naopak? Je vůbec nějaká měřitelná závislost mezi těmito dvěma znaky?
V tomto článku si ukážeme dvě nejpoužívanější metody, jak takovou závislost statisticky zjišťovat a vyhodnocovat. První metoda bude grafická, druhá pak početní.
Máme-li zjištěny hodnoty dvou kvantitativních znaků x a y u souboru n statistických jednotek, pak tyto hodnoty můžeme zapisovat jako uspořádané dvojice reálných čísel (x\; ji), (xj', yz) atď, až (x„; yn). Každou tuto uspořádanou dvojici můžeme chápat jako bod v rovině. Zobrazíme-li (ve vhodném měřítku) všechny tyto body, dostaneme tzv. bodový graf nebo bodový diagram (v angličtině scatter plot nebo scatter diagram).
Následující tabulka udává známky z matematiky a fyziky na pololetním vysvědčení u 14 žáků jedné třídy. Zakresleme tyto hodnoty do bodového grafu. Co můžeme z grafu vyčíst o statistické závislosti mezi prospěchem v matematice a prospěchem ve fyzice?
Matematika	1	2	2	1	3	3	2	2	2	1	3	1	4	2
Fyzika	1	3	2	2	4	3	1	2	2	2	3	2	4	3
řešení: Na následujícím obrázku je bodový graf zjištěných hodnot. V grafu vidíme jen 8 bodů, což je méně, než je celkový počet žáků. Je tomu tak proto, že některé uspořádané dvojice známek se objevily u více žáků (např. 3 žáci měli z matematiky dvojku a současně z fyziky trojku). Tyto shodné dvojice pak v grafu odpovídají jednomu bodu. To, že daný bod v grafu odpovídá několika dvojicím z původního souboru, je
4.6 Korelace
195
možno graficky vyznačit např. tím, že je tento bod výrazněji zobrazen - tento přístup jsme zvolili i my.
5
4
				
	1 j A. A.			
A á		r i	r	
		r		--• í
1		----------------		'-----------J
0 1 2 3 4 5
Matematika
Obr. 4.8: Závislost mezi známkami z matematiky a známkami z fyziky
Z grafu na obr. 4.8 vidíme celkem jasnou závislost mezi známkami z těchto předmětů. Čím je žák lepší v jednom z těchto předmětů, tím je zpravidla lepší i ve druhém a naopak. V takovém případě mluvíme o pozitivní (kladné) statistické závislosti. Body v diagramu jsou v takovém případě zhruba rozmístěny v pásu, který směřuje od levého dolního do pravého horního rohu.
Při výrobě asfaltu byl zjišťován bod měknutí ve stupních Celsia a penetrace asfaltové směsi v mm při 25 °C. Následující tabulka udává hodnoty těchto veličin zjištěné u deseti vzorků asfaltové směsi. Zakresleme tyto hodnoty do bodového grafu. Na vodorovnou osu vyneseme hodnoty penetrace, na svislou osu pak odpovídající body měknutí. Co můžeme z grafu vyčíst o statistické závislosti těchto dvou veličin?
Bod měknutí/°C	46.5	48,0	46,5	47,5	47,0	47.5	49,0	48,0	48,0	48,5
Penetrace/mm	9,9	9,1	9,8	9.4	9.8	9,5	8,4	8.8	9,6	8,7
ŘEŠENÍ: Vidíme, že body grafu (obr. 4.9) jsou tentokrát (ve srovnání s úlohou A) rozmístěny v pásu, který směřuje od levého horního do pravého dolního rohu. To znamená, že čím větší je penetrace, tím menší je zpravidla bod měknutí a naopak. Existují výjimky z tohoto pravidla (např. 6. vzorek v tabulce má menší bod měknutí
196
4. Statistika
než 9. vzorek a současně penetrace 6. vzorkuje menší než u 9. vzorku), ale pro většinu dvojic vzorků toto pravidlo platí. V takovém případě mluvíme o negativní (záporné) statistické závislosti.
49,5 49,0 ^ 48,5 1 48,0 47,5 47,0 46,5 46,0
-a
o
8,2
♦ ♦
♦
♦ ♦
S,4     8,6     8,8     9,0     9,2     9,4     9,6     9,8 10,0 Penetrace/mm
Obr. 4.9: Závislost mezi bodem měknutí a penetrací
V úlohách A a B jsme se zabývali grafickým vyhodnocením statistické závislosti dvou znaků. Je však neméně užitečné míru statistické závislosti vyjádřit číselně. Za tímto účelem se počítá tzv. koeficient korelace.
	-\5
►.6	8.7
Koeficient korelace rxy (říkáme také korelační koeficient) mezi znaky x a y se vypočte ze souboru n uspořádaných dvojic hodnot (x|; y|), fe; .V2X ■ • •, (x„\y„) podle vzorce:
1 "
-J2(xí-x) (>',■-)')
rxy
Ve jmenovateli zlomku jsou směrodatné odchylky hodnot znaků x a y, které můžeme počítat pomocí výpočtových vzorců:
■Exj
2 » -x\
Výraz v čitateli zlomku lze také vyjádřit ve výhodnějším výpočtovém tvaru: 1 n ( 1 "
- H ix j -.v) (v/    v) =     - X>:.v, | -x v.
"(=i V"/=i
19
Vypočítejme koeficient korelace mezi bodem měknutí a penetrací asfaltové směsi pro soubor hodnot z úlohy B.
Řešení: Dvojice pozorovaných hodnot zapíšeme do prvních dvou sloupců tabulky a doplníme ji pomocnými sloupci. Pro výpočet koeficientu korelace není důležité, který znak označíme jako x a který jako y, v následujícím řešení toto pořadí zvolíme tak, aby odpovídalo volbě os v grafu na obr. 4.9.
Číslo vzorku	Penetrace/mm Xi	Bod měknutí/°C yi	Hodnota	Hodnota yf	Hodnota
1	9,9	46,5	98.01	2 162,25	460,35
2	9,1	48,0	82,81	2304,00	436,80
3	9,8	46,5	96,04	2 162,25	455,70
4	9,4	47,5	88,36	2 256,25	446,50
5	9,8	47,0	96,04	2209,00	460,60
6	9,5	47,5	90,25	2256,25	451,25
7	8-4	49,0	70,56	2401,00	411,60
8	8,8	48,0	77,44	2 304,00	422,40
9	9,6	48,0	92,16	2304,00	460,80
10	8,7	48,5	75,69	2 352,25	421,95
Celkem	93,0	476,5	867,36	22 711,25	4 427,95
Postupně vypočteme:
^-9,32 = 0,49598;
22711.25
-—>--47.652 =0.77621;
1 "     \ 4427 95
- E-w -*y = ^rrr^ ~9-3 •41-65 = -°>35> «1=1   / 10
-0.35
r" = 0.49598 0,77621 = ~°^909 1' Koeficient korelace je tedy záporný a je přibližně roven -0,909.
Všimněte si, že koeficient korelace v minulém příkladu vyšel záporný a současně bodový graf ukázal negativní závislost mezi zkoumanými hodnotami znaků. To není náhoda, ale jedna z vlastností koeficientu korelace - viz následující přehled jeho důležitých vlastností.
198
4. Statistika
Koeficient korelace rn mezi znaky x a v má následující' vlastnosti:
1. -I < ;n < I. tj. tento koeficient je vždy číslo z intervalu (-1; 1).
2. rrv = 1 právě tehdy, když všechny body v bodovém grafu leží na společné přímce, která je rostoucí, tj. má kladnou směrnici.
3- rxy = -1 právě tehdy, když všechny body v bodovém grafu leží na společné přímce, která je klesající, tj. má zápornou směrnici.
4. rxy je bezrozměrné číslo, tj. vynásobíme-li nebo vydělíme-li všechny hodnoty znaku x nebo znaku y toutéž nenulovou konstantou, koeficient korelace se nezmění. Koeficient korelace se též nezmění, odečteme-li nebo přičteme-li ke všem hodnotám znaku x nebo znaku y tutéž konstantu.
5. Ukazuje-li bodový diagram pozitivní závislost, je koeficient korelace kladný. Čím je tato závislost „těsnější" (tj. čím je „rostoucí" pás, ve kterém jsou body rozmístěny, užší), tím blíže je rsv k číslu 1.
6. Ukazuje-li bodový diagram negativní závislost, je koeficient korelace záporný. Čím je tato závislost „těsnější" (tj. čím je „klesající" pás, ve kterém jsou body rozmístěny, užší), tím blíže je rxy k číslu -1.
7. Neukazuje-li bodový diagram žádnou zřejmou závislost, bývá zpravidla hodnota rAV blízká nule.
Vypočítejme koeficient korelace mezi známkami z matematiky a známkami z fyziky pro soubor žáků z úlohy A.
řešení: V daném souboru bylo celkem 14 dvojic, některé se však vyskytovaly vícekrát. Výpočty můžeme mírně zkrátit, když nejprve určíme všechny navzájem se lišící uspořádané dvojice hodnot spolu s odpovídajícími četnostmi - myšlenka je velmi podobná výpočtu průměru a rozptylu z tabulky četností, viz např. úloha G z článku 4.4.
Známka z matem. X,	Známka l fyziky y*i	Četnost dvojice m	Hodnota xfni	Hodnota (4) m	Hodnota y*fii	Hodnota (yf) ni	Hodnota X* >'*/!,-
1	i	1	1	1	1	i	1
1	2	->	3	3	6	12	6
2	1	i	2	4	1	1	2
2	2	3	6	12	6	12	12
2	3	2	4	8	6	18	12
3	3	2	6	18	6	18	18
3	4	1	3	9	4	16	12
4	4	1	4	16	4	16	16
Celkem		14	29	71	34	94	79
29    _   34 17 Postupne vypočteme:   x - —;   v = — = —:
6 Korelace
199
= 0,88352
•v/J,
0,90351
0,61224;
= 0.767.
• 0.88352-0,90351 Koeficient korelace mezi známkami z matematiky a známkami z fyziky je u zkoumaného souboru žáků roven přibližně 0,767. Potvrdila se tedy pozitivní statistická závislost z bodového grafu.
Cvičení
| Zobrazte počet najetých km a provozní výdaje osmi dealerů z úlohy K článku 4.4 do bodového grafu (najeté km vynášejte na osu x a provozní výdaje na osu v). Co můžete z grafu vyčíst o závislosti mezi těmito znaky? Vypočtěte korelační koeficient.
WŕM Patnáct maturantů bylo v rámci určité studie vyzváno, ab\ uvedli svoji výšku a výšku otce. Následující tabulka udává hodnoty obou znaků v cm.
Výška otce	175	170	185	176	168	167	171	176	176	166	169	177	184	185	173
Výška syna	172	168	183	182	174	166	173	170	180	171	165	171	179	189	177
a) Porovnejte oba znaky pomocí vhodných charakteristik polohy a variability.
b) Zobrazte hodnoty do bodového diagramu. Co můžete z grafu vyčíst o závislosti mezi těmito znaky?
c) Vypočtěte korelační koeficient mezi uvedenými znaky.
Vyberte ve vaší třídě 8-10 studentů stejného pohlaví a u každého zaznamenejte výšku v cm a hmotnost v kg. Zobrazte získané hodnoty do bodového grafu. Co můžete z grafu vyčíst o závislosti mezi těmito znaky? Vypočtěte korelační koeficient.
Následující tabulka udává měsíční výdaje na reklamu a měsíční tržby určité velké firmy za jeden kalendářní rok. Hodnoty jsou vyjádřeny v tisících Kč a zaokrouhleny.
Výdaje	11	13	7	10	21	15	30	24	18	32	40	35
Tržby	2 800	1 900	2 900	1 200	1 600	2 600	1 800	1 900	2 900	2 700	3 500	3 900
a) Vypočtěte korelační koeficient mezi měsíčními výdaji na reklamu a tržbami. Co nám toto číslo říká?
Návod: Je vhodné hodnoty tržeb před výpočtem vydělit číslem 100, tj. vyjádřit je ve statisících Kč. Korelační koeficient nebude touto změnou jednotek ovlivněn - viz uvedené vlastnosti koeficientu korelace.
b) Vedení firmy předpokládá, že tržby pozitivně reagují na reklamu se zpožděním zhruba jednoho měsíce. Potvrzují data tento předpoklad?
Návod: Vypočtěte korelační koeficient mezi výdaji na reklamu v daném měsíci a tržbami v měsíci následujícím, tj. pracujte s dvojicemi hodnot (11; 1 900), (13; 2 900) atd., až (40; 3 900).
4,
200
4. Statistika
Bl Následující tabulka udává, jak si žáci jisté školy volili cizí jazyk. Každý žák si musel zvolit právě jeden z jazyků uvedených v tabulce:
Jazyk	Angličtina	Němčina	Ruština
Počet žáků	182	111	27
Načrtněte polygon četností. Vypočtěte relativní četnosti a zobrazte je pomocí kruhového diagramu.
WM Při zkušebním provozu automatického zařízení, které odměřuje kilogramová množství mouky, bylo převáženo 30 odměřených dávek. Byly získány následující hodnoty v kg:
0,98 0,99 1,03 1,01 0,96 1,00 0,98 1,01 1,02 0,97 0,96 1,00 1,00 1,03 0,99 0,97 0,98 0,96 1,00 1,02 0,96 0,98  1,01 0,97 0,98  1,03  1,00 0,99  1,00 0,99 HHI
Uspořádejte data do tabulky rozdělení četností, určete kumulativní, relativní a kumulativní relativní četnosti. Zobrazte histogram četností a polygon četností.
KcB V tabulce je uvedena hustota obyvatel, tj. průměrný počet obyvatel na I kur, a celková rozloha v km2 pěti středoevropských států:
	Polsko	Česko	Slovensko	Rakousko	Maďarsko
Hustota	124	131	110	97	110
Rozloha	312700	78 900	49 000	84 900	93 000
Jaká je průměrná hustota obyvatel v této části Evropy?
| Na pokerovém turnaji momentálně hraje 8 hráčů u stolu A, průměrný počet žetonů na hráče je 3 750. U stolu B hraje též 8 hráčů s průměrným počtem 4 250 žetonů na hráče. U stolu C hraje 10 hráčů s průměrným počtem 3 600 žetonů na hráče. Jaký je průměrný počet žetonů na hráče v celém turnaji?
M^U V roce 2007 byla spotřeba určitého druhu zboží dvakrát vyšší než spotřeba v roce předchozím. V roce 2008 stoupla spotřeba tohoto druhu zboží o 70 % v porovnání s rokem 2007. V roce 2009 byla spotřeba opět vyšší, tentokrát o 50 % než v roce 2008. Vypočtěte průměrné tempo růstu za celé zkoumané časové období. Kolikrát větší byla spotřeba v roce 2009 než v roce 2006?
M^M Určitá firma plánuje, že za 5 let zdvojnásobí svoje tržby. O kolik procent by měly každoročně tržby průměrně růst, aby bylo cíle dosaženo?
4.7 úlohy k opaková
P01
WfM Na šesti různých místech válcové tyče byl změřen její průměr a b\ ly získány následující hodnoty v centimetrech:
5,24    5,18    5,10    5,25    5,14 5,19
Vypočtěte aritmetický průměr, medián, směrodatnou odchylku a variační koeficient průměru tyče.
M"'U Jedenáct opakovaných měření určité fyzikální konstanty dalo následující výsledky:
2,11   2,01    2,09   2,11   2,02   2,03   2,03   2,03   2,10   2,05 2,05
Vypočtěte aritmetický průměr a medián naměřených hodnot. Určete též rozpětí a směrodatnou odchylku.
M^M Anglický matematik Weldon opakoval 4096kráthod dvanácti kostkami. V každém hodu zaznamenal počet šestek, které padly. Rozdělení četností tohoto znaku bylo následující:
Počet šestek	0	1	2	3	4	5	6	7	8	9	10	11	12
Četnost	447	1 145	1 ISI	796	380	115	24	7	1	0	0	0	0
a) Vypočtěte aritmetický průměr, modus a medián počtu šestek.
b) Vypočtěte rozptyl a směrodatnou odchylku počtu šestek.
c) Určete relativní četnosti hodnot tohoto znaku.
d) Porovnejte relativní četnosti hodnot 0, 1 a 2 s teoretickými pravděpodobnostmi, že při hodu 12 kostkami nepadne žádná, padne právě jedna, nebo padnou právě dvě šestky.
Návod: Použijte binomické rozdělení (Bernoulliovo schéma) z článku 3.5.
EM Tabulka rozdělení četností (převzatá ze statistické ročenky ^
ČR 2011) udává věk ženicha, resp. nevěsty při uzavření ty
prvního sňatku pro všechny sňatky uzavřené v ČR v roce Wk «.
2010. MŘ
Věk v letech	Četnost mužů	Četnost žen
19 a méně	104	573
20-24	2983	7 376
25-29	12791	16 313
30-34	12761	8215
35-39	4 063	1 745
40-44	953	299
45^9	379	109
50-54	193	47
55 a více	187	57
Vypočtěte přibližně aritmetický průměr, medián a modus věku při uzavření prvního sňatku pro muže a pro ženy a porovnejte výsledné hodnoty.
202
4. Statistika
iil Následující tabulka udává hodnoty životnosti souboru 96 žárovek. Data byla zaokrouhlena na celé hodiny a seřazena podle velikosti:
164	273	380	549	677	890	942	1022	1 242	1353	1 609	1 786
187	273	402	598	690	902	955	1031	1 263	1365	1676	1 827
222	277	495	634	728	906	986	1033	1298	1 380	1687	1 887
225	278	529	639	728	906	989	1037	1 304	1392	1 690	2053
237	319	535	641	744	908	994	1055	1327	1 427	1696	2078
240	346	544	653	746	909	997	1060	1327	1451	1 699	2 327
262	361	546	660	823	921	1005	1083	1 340	1 581	1709	2426
264	371	548	667	857	92]	1016	1 141	1 352	1 605	1748	2434
a) Uspořádejte data do tabulky skupinového (intervalového) rozdělení četností. Načrtněte histogram. Co můžeme říci o tvaru rozdělení?
b) Odhadněte bez výpočtu, jaký je vztah mezi průměrem a mediánem.
c) Na základě tabulky skupinového rozdělení četností vypočtěte přibližně aritmetický průměr, medián, modus, rozptyl a směrodatnou odchylku životnosti.
d) Určete přesnou hodnotu mediánu z původních dat a porovnejte ji s předchozím přibližným výsledkem.
e) Na základě tabulky skupinového rozdělení četností určete přibližně mezikvar-tilové rozpětí životnosti.
f) Určete přesnou hodnotu mezikvartilového rozpětí z původních dat a porovnejte ji s předchozím přibližným výsledkem.
1K1 Rozdělení účastníků výročního závodu Běchovice - Praha (muži, kategorie příchozích) podle věku je uvedeno v tabulce:
Věk	20-29	30-39	40-49	50-59	60-69	70-79	80-89
Četnost	344	447	787	525	149	37	4
a) Načrtněte histogram tohoto rozdělení. Co můžeme říci o tvaru tohoto rozdělení?
b) Vypočtěte přibližně průměrný věk účastníků.
c) Dokážete bez výpočtu odhadnout, je-li medián věku účastníků větší, či menší než průměrný věk? Ověřte přibližným výpočtem.
d) Jaký věk zhruba vymezuje 10 % nejmladších, resp. 10 % nej starších účastníků?
Ze šesti zemí máme k dispozici zaokrouhlené údaje o průměrné roční spotřebě cigaret na 1 obyvatele (znak x) a o roční míře úmrtnosti na plicní rakovinu na 100 000 obyvatel (znak y). Vypočtěte korelační koeficient mezi těmito znaky.
X	3 400	2600	2 200	2400	2 900	2100
y	24	20	17	19	26	20
Při kontrolním měření rozměrů silikátových štítových dílců bylo náhodně vybráno osm dílců vykazujících vesměs kladné odchylky v délce i výšce od normových hodnot.
Odchylka délky/mm	3	4	4	5	8	10	6	3
Odchylka výšky/mm	4	6	5	6	7	13	9	4
Zakreslete údaje do bodového grafu. Co můžeme z grafu vyčíst o statistické závislosti mezi těmito znaky? Vypočtěte korelační koeficient mezi nimi.
U deseti vzorků betonu z jedné záměsi byla po různém počtu dnů (znak T) zjišťována pevnost betonu v tahu (znak Y) v N-cm .
T	2	2	3	3	7	7	28	28	28	28
Y	219	245	298	242	345	331	418	357	403	373
Zakreslete údaje do bodového grafu. Co můžeme z grafu vyčíst o statistické závislosti pevnosti betonu v tahu na době zrání? Vypočtěte korelační koeficient mezi těmito znaky.
Rychlost výrobní linky (znak x) se nastavuje pro každou směnu podle potřeby na stupeň 1 nebo 1,5 nebo 2. Během každé směny se zaznamenává počet poruch linky (znak y). Následující tabulka udává hodnoty těchto dvou znaků za 365 směn.
		Počet poruch v			
		0	1	2	3
Rychlost linky X	1	45	20	8	0
	1,5	38	62	32	14
	2	10	22	58	56
Vypočtěte koeficient korelace mezi rychlostí linky a počtem poruch. Co nám toto číslo říká?
Návod: Sestavte si pomocnou tabulku jako v řešení úlohy D minulého článku.
204
4. Statistika
Exkurze do historie
Galileo Galilei
C. F. Gauss
První statistické pojmy se objevovaly již v 17. století. Angličan Petty Graunt zpracoval statistická data týkající se úmrtnosti obyvatel Londýna - lze říci, že šlo o první publikovanou úmrtnostní tabulku. Roger Boscovich rozvinul pro účely geodetických měření vyrovnávací počet, který začal původně v astronomii používat Galileo Galilei. Osmnácté a devatenácté století přineslo další rozvoj metod teorie pravděpodobnosti a rodící se matematické statistiky. Pierre Simon de Lapiace a Carl Friedrich Gauss odvodili model normálního rozdělení (Gaussovu křivku), při zpracovávání astronomických údajů poprvé použili metodu nejmenších čtverců.
Gauss ji zřejmě použil již roku 1801 při výpočtu dráhy planetky Ceres, ale poprvé byla uveřejněna roku 1805 Adrien-Marie Legen-drem, který ji objevil nezávisle na Gaussovi. V 19. století se metody matematické statistiky začaly z fyzikálních věd šířit i do oblasti věd biologických a humanitních. Sir Francis Galton používal statistické metody v psychologii a antropologii, přičítá se mu např. zavedení pojmu korelace. Charles Sanders Peirce v pojednáních lllustrations of the Logic of Science (1877-1878) a A Theory of Probable Inference (1883) formuloval mnohé základní prvky matematické statistiky, zejména položil základy teorie testování hypotéz. Ch'S'Peirce Překotný rozvoj statistiky pak nastal ve 20. století. Práce Carla Pearsona rozvinuly matematickou statistiku v oblasti biologie, epidemiologie, antropometrie, medicíny i sociálních dějin. V roce 1901 spolu s Weldonem a Galtonem založil časopis Biometrika, jehož předmětem byl vývoj statistických teorií. Vlastním zakladatelem moderní matematické statistiky se stal britský biolog Ronald Fisher. Napsal vlivné učebnice Stati tistical Methods for Research Workers (1925) a The Design of 'Ú 'Šííf/ Experiments i 1935) a objevil či podstatně prohloubil celou řadu ™ ~'^r - klíčových metod a pojmu jako analýza rozptylu, metoda maximální věrohodnosti, diskriminační analýza, informace a plánování R. Fisher experimentů. Kolem poloviny 20. století se matematická statistika stala samostatným oborem na pomezí čisté a aplikované matematiky a rozvíjí se řadou směrů. Uveďme alespoň některé průkopníky moderních matematicko-statistických metod: Frank Wilcoxon (neparametrické testování), William Kruskal a W.Allen Wallis (ekonomové - neparametrická varianta analýzy rozptylu), Charles Spearman, David Kendall, John Tukey a další. Nástup počítačů v posledních desetiletích se projevil usnadněním rozsáhlých výpočtů, které s sebou matematická statistika přináší, a umožnil tak i vznik výpočetně náročných metod.
Exkurze
Výsledky úloh a cvičení
■illlllllllllllilHlIlllllllllllllllllllllil.....I......1'in'llillliillllimillllllllllil'llli'illllNllllilHllllľilľ............I>iľIfllll li^ilikÉllllWmillWIMI1WIBIillBlimW*lfcMllll lMŕfllll«MHIIIIBI»lHI1HIBI—IHII—
1. Komplexní čísla
1.1 Zavedení komplexních čísel jako uspořádaných dvojic Aa)0eN,      Z; b) tg 60°, vť"; c) x2 +1 = 0.   B Ano.   1 a) 0; b)-3; c) v^;
d) 0.      a) 7; b) ~; c) -V3; d) 0.   ; Např. a) [-5; -5]; b) LO; -3]; c) [1; 0]; d) [1; 5];
e) [—1; 1]; f) [10; 9].   C Počátek soustavy souřadnic.    1 a) Přímka, která je osou
1. a 3. kvadrantu; b) imaginární osa; c) reálná osa; d) polorovina bez hraniční přímky, která je osou 1. a 3. kvadrantu, obsahující zápornou poloosu x; e) 2. a 3. kvadrant včetně záporné poloosy x a bez osy y; f) 1. a 2. kvadrant včetně kladné poloosy y a bez osy x.   8 a) x = 1; b) x = 0; c) x = 2.   9 a) x^ = 0, tj. pro reálná čísla; b) x\ = 0, tj. pro ryze imaginární čísla; c) L0; OJ; d) komplexní čísla, která mají reálnou část rovnou imaginární části.   10 a) Body ležící na ose 2. a 4. kvadrantu; b) počátek soustavy souřadnic.   11 a) c + d = [6; -4], c —d - [-2; -6], cd = [13; -18]; b) c+d = [-1; -3], c—d = [-1; 9], cd = [18; 6].
1.2 Absolutní hodnota komplexního čísla
1
A Ano.   1 a) 0; b) 2; c)
;d)-.    ľ a) \/2; b) 3; c) l; d) 3.   3 Např. [1; 3],
[-3; 1], [0; V10].   B Ano
[i; U,
4 _ 7
TI' TT
a)x = 0;b)x = ±l:
c)x = ± —;d)x = ±-
C 1.   7 Kružnice se středem v počátku a poloměrem 1.
8 Např. [0; 2], [-2; 0], [1; VŠ].   9 a) Kružnice se středem v počátku a poloměrem 4; b) kruh se středem v počátku a poloměrem v2; c) mezikruží ohraničené kružnicemi se středy v počátku a poloměry 2 a 5; d) mezikruží ohraničené kružnicemi se středy v počátku a poloměry 0,5 a 2 bez hraničních kružnic.       a) jaj < 3; b) 2 < jaj < 3.
1.3 Algebraický tvar komplexního čísla
A Ano.   ? a)Rea = 3;b)Reb = -2;c)Rec = -4; d)Rec/ = 0.   2a)Ime = l;
b) Im / = -y; c) Im g = 4; d) Im h=y—5.   4 a) Viz obr. Via; b) viz obr. V.lb;
c) viz obr. V.lc; d) viz obr. V. Id.      a) x = 2, y = 2; b) x = -5, y = -1; c) x= - , y = --;
d) x = 4, y = 2; e) x = 1, y = 1; f) x = 3, y = -2.   B a) 2-i; b) —1 —3i; c) 4 + i;
3
d) -2 + 3i; e) -2; f) -3i.   6 a) Ano; b) ano; c) ne; d) ano.      a) 2 + 2i; b) -1 - -i; c) |+i; d) 0; e) -—; f) -i.   8 a) 6; b) 3; c) 0; d) 4.   9 Pro reálná čísla.   10 Platí
206
R   V/ÝQI FflKY III Ol
\ a cvičeni
jaj = |ä|. a) v^lO; b) 5; c) 6; d) 3.   11 Návod: Napište algebraické tvary čísel a, ä, pro každé vypočítejte absolutní hodnotu a výsledky porovnejte.   C a) -4-i; b) 2 —3i; c)-l+i;d)2+i;e)-l;f)2i.   12 a) Ano; b) ano; c) ne; d) ano. 13a)-4,2-i; b) 15-31; c) -l,4+2i; d) 5 + i; e) 0; f) -i.   14 Pro číslo 0.   15 Platí \a\ = \-a\. a) \/2; b) \Zl4; c) 5; d) 1; e) 9; f) 2.   16 Návod: Napište algebraické tvary čísel a, -a, pro každé vypočítejte absolutní hodnotu a výsledky porovnejte.
a) im 3 2 1			b) Im. 3 2' 1		
-2 -1 -1--2		012:	!    4Re      -2 -1 -1	0   1    2    3    4 Re	
			-2		
0	Im i 3-2-1-	d) Im ■■■■■			
-2 -	1 -1-»-2	0   1    2    3    4 Re -2-1 _2 Obr. V.l		0	2    3    4 Re
1.4 Sčítání a odčítání komplexních čísel v algebraickém tvaru
Aa)-2+8i;b)-7+5i;c)-8-3i;d)7-15i.   1 a) 7-44i; b)-y-4i; c)-1;
2
d)-ll+4i.   2a)-l;b)-12,24;c)-;d)0.   3 a) 0; b) 0; c) 0; d) 0.   4 Návod:
Použijte algebraické tvary čísel a, a. *5 a) Pro ai - -by, b) pro opačná komplexní čísla; c) pro a2 ^-b2; d) pro a\ - -b\ A a2 ^-b2.   6 a) 3; b) 5; c) 2; d) 5\/2.
a)-2 + 3i;b)-10+5i;c)4 + i:d)8 + 2i.   8 a) u= 10, v = 4; b) u= 11, v = -3; c)M = -8,v = -l;d)« = 3,v = -l.   Ba) 12-4i:b) l+7i; c)-13i; d) 15 — 5i.
1. Komplexní čísla
2 j
9 a) -14+13Í; b) 7i; c) 2; d) -7 +i.   10 a) -6i; b) s/TTi; c) -li; d) 8i.
22 4 ^
12 a) -— - 12i; b) -- +6i; c) 4a/3-í; d) -32i.   *13 a) Pro a2 =     b) pro stejná
komplexní čísla; c) pro a2 ¥b2; d) pro a\ = b\ ř\ a2¥b2. 14 a) \/26; b) 5; c) 36; d)55. 15a)6~6i; b)-9 + 5ir;c) 16 + 5i; d)-8-2i. 16 a) u = 0, v = 2; b) u = -4, v = -l;c)iť=l,v = 0;d)« = -2,v = -2.   C Ano.   17 Z = (10-1 l,4j)íí, |Z| = 15,20.
18ReZ=tf,ImZ = a;L-
1.5 Násobení a dělení komplexních čísel v algebraickém tvaru A a) -i; b) 1; c) i; d) -1; e) -i; f) 1.   la) -i; b) 1; c) -i; d) i; e) -i; f) 1. 2a)-l+2i;b)3i;c) l-i;d) 1+i.   3 a) 4-2i; b) 9 + i; c) 1; d) -3 + 2i.   B a) Ano;
b) ano; c) ne, 31-51; d) ne, -27-681.   4 a) -20; b) 2-8i; c) 7 + 3i; d) -24-31
3 15 5 85
5a) ^-i;b)-—+2i;c)2;d) 121.     a) 45; b)-; c)--; d) 0.   *7 Návod: Vyjádřete
2 4
čísla a, a v algebraickém tvaru a vypočítejte jejich součin.   8 a) 16— 12i; b) — + -i;
c) 4 + 26i; d)-2 + 2i.      a) --; b) ~ - ~i- c) 1 -i; d) a G C; e) 0; f) 0. *10Pro
komplexní čísla a = a\ +a2i, b = b\ + b2i je jejich součin (a\b\ -a2b'2) + (a\b2 + a2b\)\ číslo a) reálné pro a\b2 = —a2b\; b) imaginární pro a\b2 ý-a2b\, c) ryze imaginární yro ayb\= a2b2 A «1^2 ¥~a2^i-   11 a) 16; b)-27i; c) 65-72Í; d) 2-lli. 12 a) -8- I9i; b) 81 +2i; c) -13-4Í; d) -2+127L     3 a) 12+161; b) -18+ 18i; c)-15 + 20i;d)-4.   14 a) 10; b) 5VW; c) vT7; d) 221.   15 a) a2+4; b) 9b2 + c2; c) 2a2 + 62; d) 562 + 3c2.   16 a) (a + ib)(a-ib); b) (3a + 5i)(3a-5i); c) (l lb + 4ic)(llZ?-4ic); d) (Vlb+ic) (V2b-ic);e) (V5a+V3ib) (VŠ.a-V3ib); f) (vTT/7 + 2ic) (vTTfe-2ic).   F a) Ne; b) ano; c) ne; d) ano.   G Ano.   17 a)-1+i;
b) -3-3i; c) -1+41; d) i - f i.    18 a) -li; b) \ - Ii; c) -1 - li; d) -± + \,
3443 5    12 3       4 V"2
19.)-l;b)5+5i;c)! + !i;d)-n-nL   20 a) -1; b) -; e) --; d)
3 11 4   3      9   13      7 4
21.a>-+2i;W----l;c)-2+l0i;d,i.      .a) ^f, b) - + Ti; c)- +
Y=^ST1.   25 (18,7+j0,4)í2.   2 6 (2,2+jO,8)A.   H Ano.   27a)-2 + 5i;
b) -k^-l(,i;C)2i;d)-|-^       a)-15 + 8i;b)i-I1;c)-,6-241;d)2 + ii. 29 a 30 Návod: Vyjádřete komplexní čísla z, resp. a, b, c v algebraickém tvaru
a vypočítejte výrazy na levé a pravé straně dokazované rovnosti.   3 - a) 40; b) 10;
c) 1; d) 30.   *32 Návod: Použijte postup z důkazu v odstavci J.   *33. Návod: Použijte definici absolutní hodnoty komplexního čísla a čísel -a, a.   34 a) Kružnice se středem v počátku a poloměrem VTÔ; b) kruh se středem v počátku a poloměrem 5; c) mezikruží ohraničené kružnicemi se středem v počátku a poloměry 1 a 2; d) prázdná
208
5. výsledky úloh a cvičení
množina.   35 a) Osa úsečky s krajními body, které jsou obrazy čísel -1 a i; b) polorovina obsahující počátek s hraniční přímkou, která je osou úsečky s krajními body v obrazech čísel i a -3i; c) úsečka, která je částí osy x, s krajními body, které jsou obrazy čísel -3 a 3; d) průnik kruhu se středem v počátku a r = 4 s polorovinou, jejíž hraniční přímkou je osa x a do níž patří obraz čísla 4i.   36 a) Množina bodů, které mají od bodů [-2; 0] a [2; 0] konstantní součet vzdáleností roven 8, tj. elipsa se středem v počátku, poloosou a = 4a excentricitou e = 2; b) množina bodů, pro které je absolutní hodnota rozdílu jejich vzdáleností od bodů [-5; 0] a [5; 0] rovna 8, tj. hyperbola se středem v počátku, poloosou a - 4 a excentricitou e = 5.   37 Nulový vektor.
/125   25 \
40 d) Návod: Nejdříve vypočítejte Z, Z = I —— - —j íl.
1.6 Goniometrický a exponenciální tvar komplexního čísla
1 a) ti; b) |; c) 0; d) ^n; e) T-; f) ^; g) 108°26'; h) 34F34'. 9        „ ....... 3    . . 3
a) -7i(cos0 + isin0); b) cos f-n + i sin -tc; c) 4V2 cos - +isin
5 5 d) 6\/2 ( cos-71+i sin-:
2 2 ;e) ^ (cos 305° 16' + i sin 305° 16');
f) ^j- (cos229°6/ + isin229°6/).   3 a) ^ (cos|+isin^); b) 10(cosl43o8/ + isinl43o8');c)2( cos ^it + isin |tc ); d) f- I cos^Tc+isinfrTt );
3
2
3
3
e) ( cos-Tc+isin-7t ]; f)
v'2
3
cos ■
3v2
( 71
Tt+isin-Kj.     a) 4V2 ( cos - +i
. 3
sin
4/'
b)5(cos53°8' + isin53°8');c) ~   cos-rc + isin-t: ;
d) -~ (cos288°26/ + isin288°26').   B Ano.      a) Ano; b) ano; c) ne; d) ne.
5   5y/3.     .   v   a/3 1.
6 a) Ano; b) ne; c) ano; d) ne.   C a) Ano; b) ano.   7 a)---—i; b) i; c) -
/3   1       3 /3 3 d) -5,6382-2,052 li.     a)-1; b) ^- --i; c) ~ + -i; d)-VŠ-i.
2
— _ 1;
a) a = 4 |^cos - tc + i sin - 71 j ; b) —a = 4 |^cos - + i sin
*10 Platí: ~ä = \a\(cosa-isina) = \a\ [cos(-a)+isin(-a)],
-a = |a| (-cosa-isina) = \a \ [cos(a + Tt) + isin(a + it)].       a) cos - + isin -;
, ^ /     3    . .  3 \      I /     5    ..5\        /     11 ..11 b) 2  cos-71+1 sin-71 ; c) - I cos-71 + 1 sin-ti ; d)2  cos — tc + 1 sin— ti
a)eitr;b)5ei,l;c)7ei37l;d) y/2Jln.   13 a) -1; b) -i; c) -9+9a/3í; d) t + ^i-
1 ,2,
14 a) « = e 3 , -<2 = e 3'"; b) a = -ef
1 í¥tc.
-a = -e e , c) a = 5e 7    -a = 5e 2
d)a = 2e1S7t,-a = 2e14T
i) 5\/2e*i- O; b) 3.61eJ326° A.
1.7 Násobení a dělení komplexních čísel v goniometrickém a exponenciálním tvaru
1 a) v^CcosóO^isinóO0); b) 4 ^cos ^ + isin ; c) 5(cos300° +isin300°); d) ~ ^cos^it + isin^.      a) 10 (cos 240° +i sin 240°); b) 5 ^cos^n + isin ^ ;
c)2v/2(cos45° + isin45°);d) - í cos — 71 +i sin — ti J.      a) 0, |, ti, -ti, 0; b) ^,7t,
3   „ tc   . ti 3    5    7    tí,n2   7    5    v. 2 , „ ,
-tc, 0, -; c) -, -ti, -tc, -n, -; d) -tc, -tc, -71, -, -ti. Jedna se o otočeni kolem
2 2     4 4   4   4   4     3    6    3    6 3
počátku o ^.   4 a) VŠ ^cos ^ic+isin ^x^ ; b) 5 ^cos y^Ti+isin Jq^J '■•
c) 2\/2[ cos^n+isin^Tt ); d) [ cos^Tt+isin-rt ).   B a) e'71; b) 3e1^IC; c) "^e1?71;
(     20 20 /      \    6 6/ 2
d) Sv^K   5 a) Ano; b) ano.      a) Se^71; b) e1?; c) 9eÍTl; d) 2eirK
a) ^ (cos 180° + i sin 180°); b) ?^L? ( cos ^Tt + isin^x 3 2^66
c) ~ (cos225°+isin225°); d) ^cos yx+isinyTc^. a) 0,5 (costc + í sinu); b) cosic + isinic; c) 0,2 ^cos^+isin^j; d) ~ ^cos ^n+isin^ji^ ;
e) 2 ^cos ^Ti + isin^Tt^; f)        ^cos ^n + isin ^ir^.   "11 Návod: Vyjádřete číslo 1
v goniometrickém tvaru a použijte vztah pro dělení komplexních čísel.
/     3    .     3 \ 12 a) cos(—a) + isin(-Q;); b) cos a + i sin a.   13 a) 4 I cos -x + isin-Tc I;
b) 2 ^cos ~ +isin ^; c) ^ ^cos ^ 71 + i sin      ; d) 2 ^cos ~K + isin^K^. Návod:
Použijte definice daných čísel a vlastnosti goniometrických funkcí.   D a) e1 3;
b)        c) ie'írK; d) ^e'f.     5 a) 2ei57C; b) lóe1!; c) 7ei37t; d) l,5é?.
16 a) 0,5^1"; b) -U1!*; c) L1?71; d) j^K       Z = 5v^eJ63° íl, / = 2v/5eJ297° A, 16 7 3
t/ = 50eJ°° V.       Z = 2V2eJ8°a V= 12\/5eJ27° V, / = 3\ZT0eJ,9° A.
1.8 Moivreova věta, mocniny a odmocniny
A Vztahy odvodíme pomocí věty o násobení komplexních čísel v goniometrickém tvaru.   1 Pro každé přirozené číslo n a pro každé nenulové komplexní číslo a = \a\ela
(    7 7 \
je an = \a\n&"a.   2 a) Ano; b) ne, 32 í cos-x+isin-x ).   3 a) cosx+isinx; b)25()(cos2x + isin2x); c) 125 ^cos ^x + isín -i:^ ;d) cosx+isinx; e) 25 (cosx + isinx);
210 5. výsledky úloh a cvičení
_ 16 /     4    . . 4 f, /cos^+lsm_,
a) a3 - 64 f cos ^Tt + isin ^it V     4 4
Ja)3 = 64 ( cos ^n + isin ^tc ); b) a3
(«)3 =
108
7
7
v/2  /        k     .   . Tí
lÔ8vC°S4+1Sm4
3
cos - tí + i sin-% ); c) tr = 24 V 3 j cos - it + i sin-tí
/Tí Tí\ I
(ä)3 = 24\/3 ycos - +isin - J; d) a3 = - (cos tí + i sin k) - (a)3.       Návod: Použijte
vztah ä=\a\ [cos(-a) + isin(-a)].    : a) ei2lí; b) e'71; c) 16eÍ7T-; d) 16ei271.
3    . . 3 125 7 a) cos2n:+isin2n:; b) cos-k + isin-u; c) ——-
2
5    . . 5
COS-rK + lSin-tc
3 3
a)-2-6;b)-|-^i;c)ii;d)
1 1.
E a) l;b) 1; c) 1.
d)      (cos 2tí + i sin 2tc) . 625
9 a) cos 2a = cos2 a-sin2 a, sin 2a = 2 sin a cos a;
b) cos4a = cos4a-6cos2asin2a + sin4a, sin 4a = 4cos3 asina-4cosasin3 a.
,    s/l    s/l.   ,   \/2   \/2. \/2 \/2. a)0;b)±l;c) ±i; d) ±— ± — i; e) -— + —x, — -yi-
a
11 Pro komplexní číslo s argumentem a jsou argumenty jeho druhých odmocnin —,
^ +tc, tj. jejich obrazy jsou středově souměrné podle počátku.       a) 2ei2Tt, 2ei5,L,
2ei371; b) 3^2, 3^, Se^71; c) s/2e^, v'ŽVM* v^S71; d) Sn, ér*,
Návod: Použijte vyjádření hodnot bt, foj+j n-té odmocniny z komplexního čísla z odstavce E a porovnejte argumenty čísel    a fe^+i.     5 a) Ano; b) ano.       a) el2lľ-ií
%fl-ižlT
e'2, e,7C, e'z71; viz obr. V.2a; b) e1-*, e1*71, e1*71, e1**"; viz obr. V.2b; c) e*s, e*8'", e
viz obr. V.2c; d) e1!71, e's" 2ei5IC, 2ei2lt; viz obr. V.3.		e s ,l, e s '•;	viz obr. V.2d.		že1?, 2ei57C,	
lm 1				Im 1		
			/			\
	0	1 Re	-ľ.		0	/l Re
-í			-i			
2eľ
Obr. V.2a
Obr. V.2b
1.9 Řešení rovnic v množině komplexních čísel
A Používali jsme pouze ekvivalentní úpravy.   1 a) 0,5 + 0,5i; b) 1 +4i; c) -1 -0,5i;
d) 8 + 2i.     a) -l+8i; b) i; c) 1; d) 6-4i.     a) -1 -2i; b) -3+6i; c) -3i, 2-3i;
3   13   1        2 \/2 d)-4-5i.   C Ano.   - a) 2+i, 2-i; b) -1+3L -l-3i; c) - + -i, - --i; d)-- + ^-i,
2   j2 _ 4
---^-i.   5" Platí, žex2 + c = x2 + Vc1 = (x+iy/c) (x-iy/č).   a) ±3i; b) ±-i; c) ±i;
d) ±y/2i.   7a)-4+2v/2i,-4-2\/2i;b) l + Vě\, 1 -VEi; c) -1 - V2i, -1 + /2i; d) ±y/3i.     a) (z-2+3i)(z-2-3i); b) (z-5+4i)(z-5-4i);
c) (z+3 + V2i)(z+3-V2i);ď) íz-^ + ^-ij (^"X*)"      a) Kořeny reálné
pro q e (—oo; 4), imaginární pro q £ (4; oo); b) reálné pro q G (—oo; 0) U (8; oo), imaginární pro q £ (0; 8); c) reálné pro q e (-3; 3), imaginární pro q e (-oo; -3) U (3; oo);
d) reálné pro q € (0; 1), imaginární pro q e (-oo; 0) U(l; oo).     : a) 2, -1 + \/3i,
-1 - V3v, b) 4, -2+2\/3i, -2-2v/3i; c) ±^3, ±\/3i; d) ±2, ±2i.   11 a) ei25X, e^K,
212
EDKY ÚLOH A CVIČENÍ
e1!*; b) ete, e1!, e1!K; c) e* V e1*". e'i71; d) e1!, e1^, e^71.   12 a)-5, | + y^i,
J-^i; b) + i. 3Y> i;c) 2, -2, 1 - VŠi, 1 + VŠÍ,-1 -VŠi,-1 + VŠi; 2     22     22 2
/     7t + 2fcn: iz + 2kn\ 1 VŠ
ď)xk = 2  cos +isin—j— ]. Ä - O.....7.      la) ±1, ±i; b) ±1, - + ~Vi,
\ 8 8    J 22
1 i y|   i 3 3
2 22    22 222'
1.10 Úlohy k opakování
a)-3;b) 1; c) 0,2; d) -2,8.      a) 10; b) -5- 15i; c) -1,5-0,5i; d) 0,5-0,5i. *3 Návod: Použijte algebraické tvary čísel u, v, u, v.   4 a) \/l7; b) 5%/2; c) vTÔ; d) V2Ô~.   5 a) Neexistuje žádné a; b) body náležející kruhu se středem v obrazu čísla -i a poloměrem 6; c) body roviny bez kruhu se středem v obrazu čísla 3 +i a poloměrem 4; d) mezikruží se středem v obrazu čísla 3 a s hraničními kružnicemi o poloměrech 1 a4.   8 a) |z-1 -i| = 2; b) |z-l+i|>7;c) \z- 1 -i| = \z- 1 +i|; d)2< lz-1+ij < |z-l-i|.      a)2 + i:b)-6 + i;c) 14; d) 35+1,5i.      a) l±3i;
7 7
b) -2±4i. 9 a) 2i; b) 0, nelze vyjádřit v goniometrickém tvaru; c) cos -tz + j sin -tc; d) cos ^Tt+isin^rc. 0 a) -y/2; b) -2. 1 a) eli\ b) 2eis7t; c) 0,5e'i"; d) y/2ellr\ 12 a) 16 -5i; b) - + y i; c) 1; d) i +2i.   13 a) Trojúhelník; b) čtyřúhelník;
c) pětiúhelník; d) osmiúhelník. 14a) ±2i, VŠ±i,- VŠii;b)-4i, 2 (±VŠ+i); c)--, \ (l ± VŠi); d) ^ ± 3V1 _ V2 ± 3V2.     . a) ] _.. b) 3_.. c)x = a+{a_2yu
VŠ. .. .    s/6.    .- .      ŕ 5
a G R; d)-0,5+0,51   16a) - : -y i: b) l ■ \ i.     ' a)m e       ooj ;b)m e (1; oo).
18 a) ±2i, ±V5; b) ±VŽ, ±VŠi; c) -1, 2, ~± y^i, -1 ± VŠi; d) ±1, \ ± —i,
-x ± 19 a) 0, ±1, ±i; b) 1, ±--- ± ~-i. -- í ^-i; c) 2, -1 ± VŠi, ±1, ±i;
2     2 2      2      2 2
d)±V2,±V2í,-3y±^i.
2. Kombinatorika
2.1 Základní kombinatorická pravidla
1 5-3-4,3-2-4.    25-4.    3 9-8-7-6.    4 32-28,32-24.
Jisté to není.
2.2 Permutace
I 61-2-5!.      5!7!.    3n = 4.    42-4!.   5 a) 3 • 10! (1-2 • 11+3 • 11 • 12);
*\    n « + 3
b) j—.prríc) —-;d) n. (n+1)! n-2
2.3 Variace
1V(3,8).   2V(l>5)+V(2,5)+V(3,5)+2-V(3,4).   3V(3,5).   4V(6,10). 1(3.5).
2.4 Kombinace
1
10\ .„ Í6\ A . /14 2   " U'+4
2.5 Vlastnosti kombinačních čísel, Pascalův trojúhelník
* = 8' (o
'700\ /699 ,690 J > l 9
1,8, 28, 56, 70, 56, 28, 8, 1.
2.6 Binomická věta
j3   3a2 2<2
1 a) x]S- 10x12+40^9-8Qx6 + &0x3-32; b) 99+70\/2; c)—- — + —^--5- + -,
16   2b   2bL   bó b4
d) 1 - 9x+27x2 - 27jc3 .   2 0,90.
V3 64
y2 = -
3_V3 ~~64~'
4 Čtvrtý člen,-T
23-43.
2.7 Úlohy k opakování I
1 10 účastníků.   2 - • 5!, 4!.   3 4!.   4 Prvků bylo původně 5.    5 2.
12 Všech podmnožin je 26, tříprvkových je
15
b)
15
16 32-24.
12\ v8
14 V(4,5).
19 a) ( " )3!3!;
2.8 Permutace s opakováním
8!
8!
II!
2!2!2!'
2!2!2!'
7!
5!2!2! 2!2!'
-.5! ,5!
ä 2---2- —.
2!2! 2!
II!
I0!
4!4!2! 4!4!2!
214
SLEDKY ÚLOH A CVIČENÍ
2.9 Variace s opakováním
V/(6.2) + V/(5,2) + V'(4.2) + V'(3,2) + y/(2.2) + V/(l,2). 24-54. 3 35. 4jc=10. 5 45.
2.10 Kombinace s opakováním
AAAA, AAAB, AAAC, AABB, A ABC, AACC, ABBB, ABBC, ABCC, ACCC, BBBB, BBBC, BBCC, BCCC, CCCC.   2#'(5,2).   3 A'(3.5>-1.   4K'(4,3)-\. 5^(3.6).
2.11 Úlohy k opakování II
6' 7' 8' 10'
12!4f   24!3f   34!4!"   4 2!2!3f 5K'^ 6
8 Všech možných pokusů je V'(5,15). 9£'(3,4)-4.
16	\	431
2	j"	~7Ä~
/	'T\	•25 +
		
\	2	
3. Pravděpodobnost
3.1 Náhodné pokusy a náhodné jevy
1 16 (čtyřčlenné variace s opakováním ze dvou prvků).   2 a) 21 (dvoučlenné kombinace s opakováním ze šesti prvků); b) 36 (dvoučlenné variace s opakováním ze šesti prvků).    3 1 320 (tříčlenné variace bez opakování z 12 prvků).      8! = 40320 (permutace z 8 prvků).   D c) 11 příznivých elementárních jevů: C = {(1.6), (2,6), (3,6), (4,6), (5,6), (6,6), (6,5), (6,4), (6,3), (6,2), (6,1)}.   E b) Je celkem 6 příznivých elementárních jevů: (A4,A¥), (A4,A4), (A^,A#), (AV,A4), (AV.AA), (A4.A*).      a) A c B, C c B, mezi jevy A a C není žádný vztah (např. 14 není dělitelné 4, např. 12 je dělitelné 4, ale nemá na konci 4); b) musí být sudá. 6 a) B = {(1,5), (2,4), (3,3), (4,2), (5,1)}; b) padne součet alespoň 7; c) A c C; d) jsou neslučitelné; e) B c C; f) padne součet menší než 6.    i a) 15 (jednotlivé navzájem odlišné výsledky lze popsat např. pomocí čísel tahů, ve kterých byla vybrána bílá koule - to jsou dvoučlenné kombinace ze šestiprvkové množiny); b) 5 (tyto výsledky si můžeme představit jako uspořádané šestice (B,B,C,C,C,C), (B,C,B,C,C,C), (B,C,C,B,C,C), (B,C,C,C,B,Č), (B,C,C,C,C,B)); c) 3 (tyto výsledky si můžeme představit jako uspořádané šestice (B,B,C,C,C,C), (B,C,B,C,C,C), (C,B,B,C,C,Q); d) „během prvních tří tahů byla vylosována nejvýše jedna bílá koule" nebo také „v posledních třech tazích byla tažena alespoň jedna bílá koule"; e) 10 (obě bílé koule musí být taženy v prvních pěti tazích, tj. jde o dvoučlenné kombinace z pětiprvkové množiny); 1) B c C; g) bílé koule byly taženy v prvním a čtvrtém nebo v prvním a pátém tahu.     a) ( *   | =210; b) \\ ■ [Z \ = 90 (k libovolné dvojici chlapců vybrané
z jejich celkového počtu šesti lze připojit libovolnou dvojici dívek vybranou z jejich celkového počtu čtyř): c) ( \ } • \\ + ( 6 j =95.   9 a) An B' n C'; b) An B n C;
3. Pravděpodobnost
c)(AnB'nC^uíA'nBnC^uCA'nB'nQjd)(A B' iC') iA' B C') (A'   B'  Ci  (A  B  C')  (A  B'  C)  iA'   B  C)  íA  B  Ci = A  B C:
e) (A n B n C') u (A n B' n C) u (A' n B n C);
f) (AnBnC')u(AnB'nC)u(A'nBnC)u(AnBnC);g) AnBnC;
h) (A'nB'nC')u(AnB'nC)u(A'nBnC')u(A'nB'nC)u(AnBnC')u u (A n B' n C) u (A' n B n C) = (A n B n C)'.
3.2 Pravděpodobnost - základní pojmy
2 a) ™; b) 7 (padne s pravděpodobností ^).   3 |.   4 a) 1,21 %; b) 0,45 %; c) 5,88 %.   5 P(A) = 0,770, P(B) = 0,164, P(C) = 0,066.   ::: 4,3 %. 0.4. Bii.
3.3 Základní pravidla pro výpočet pravděpodobnosti
6,1 %.   2 62,5 %.   3 a) 39,91 %; b) 46,05 %; c) 13,16 %; d) 0,88 %; e) 0 (nemožný jev); f) 60,09 %.
4 P(A) = P(umí právě dvě) + P(umívšechny) = 0,4680 + 0,2808 = 74,88 %.
M8^
„ Tc(l2,52-2.52) „ I 8 ) 9
5   v   ' g2      ; =38,47 %.   6 9,75%.   7 a) 5 •      ^- = — = 18,37 %;
47\ /900
10
i 3,06%.   8 a) 10%; b) 1-^^=41,02%;
loj {  5 J
900\ /900\ /13
c) 1- ,v        =65,31 %;d) 1- /     , =88.10%.   9 a) 4--^-f = 0,198 %; /1000\       ' /1000\ '    f 52^
\ 10 ) { 20 J
4\ /4
x5
48 V 3 7 V 2 /
b) 13 ■ -7—- = 0,024 %; c) 13 ■ 12 ■ 7 = 0,144 %; d) nejpravděpodobnější
5/ V5 je jev a), nejméně pravděpodobný je jev b).   10 a) 74,83 %; b) 69,02 %,
4\   /8\    U\   /8\ /288N
-3'2M4'^ =15,15%.   12a)l-Ä = '12\ /12\ /300x
5 J \5 J V 20
288\    Í12\  /288\ /282
40 /    \ 1 /   \ 39 / \ 20
b) 1" )nnn( - —4r^x—— = 49,23 %; c) A-f = 27,81 %;
x300\ /300\ /300N
40 7        V 40 7 V 20
216
5. VÝSLEDKY ÚLOH A CVIČENÍ
d)
/282x
V40/ /300 l 40
18
282 39
/300 V 40
= 27,78 %,
3.4 Podmíněná pravděpodobnost
□ 29,58 %.   1|.   2 a) f; b) A.   3 ±.
b)
a) 11,54 %;
P(problém zn áčka)		Problém				
		motor	převodovka	výfuk	karoserie	ostatní
Značka	H	19,59%	39,00 %	12,38 %	24,58 %	4,44 %
	L	11,54 %	63,19 %	8,79 %	13,19 %	3,30 %
Vozy značky H mají častější poruchy motoru, výfuku a karoserie oproti vozům značky L. Vozy značky L mají zdaleka nejčastěji poruchy převodovky - tyto poruchy
..... 2      ,   , , , „ , „    _ 46 45 ,54
t v on temer — ze záručních oprav těchto vozu.   5 — • —. ba)
M — —   — -' 13 ' 12 + 13 ' 12
e) -, tj. přibližně 33,33 %
(1-0,04)-0,75 = 0,72.
50 49' 13 12'
a) 1 %; b) 6 %; c) 3 %; d) 94 %;
3.5 Nezávislost jevů
Ano.   2 Ne.   3 a) Ano; b) ano; c) ne.
430 350 P(A) = - = 0,86^(A|C)=_ = 0,875.
Nejsou, protože např.:
a) 1 -0,53
* 3 -0,53 = --;b) 4'
c) I - I = —7; d) ne, počet losování muže být teoreticky libovolně velký. 0,8-0,9-0,7 = 0,504.      52,67 %.
a) 0,1 ■ 0,85 • 0,95 + 0,9 - 0,15 ■ 0,95 + 0,9 ■ 0,85 • 0,05 = 0,247 25; b) 0,24725 + 0,9 ■ 0,85 ■ 0,95 = 0,974.       a) 2 • 0,55 • 0,02 + 2 ■ 0,35 ■ 0,05 = b) 3 ■ 0.552 ■ 0,05 + 3 • 0,552 ■ 0,35 + 0,553 = 0,529 4.   i i 0,9 ■ (1 -0,2 ■ 0,3) =
0,9 + 0,1 0,8-0,7 = 0,956.       a) 24,61 %;b) 17,62 %;c) 14,45%. 14 a) 32,77 %;b) 20,48%.   15 a) 18,40 %; b) 26,42 %.   16 92,98%.
1
~ T6; 16 %.
0,057; = 0,846.
11,30%.
a)JcT2'5%;
3.6 Upíná pravděpodobnost, Bayesův vzorec
10 _ 5      10     10   6    10   8    9   10 _ 5
a)24~T2' } 23'C) 23'24 + 23'24 + 23 '24-l2' 5 5
b)y— '0>5 + — -0,5 = 2.67%.  3a)0,1 • 0,8• 0,7+0,9• 0,2• 0,7+0,9• 0,8• 0,3 = 0,398;
b) 0,1 ■ 0,2 ■ 0,7 + 0,1 • 0,8 • 0,3 + 0,9 • 0,2 • 0,3 = 0,092; c) 0,1 • 0,2 • 0,3 = 0,006;
d) 0,25 • 0,398 + 0,6 ■ 0,092 + 0,9 • 0,006 = 0,1601 = 16,01 %.
0,0005 0 9009
E a) n nnn'c  „ nAnc - 1 %, tyto jevy jsou nezávislé; b) „ „r^\   - rsrs~ = 99,97 %.
0.0005 + 0,0495
0.0003 + 0.9009
3. Pravděpodobnost
217
Sdruženou pravděpodobnost u první větve vydělíme součtem sdružených pravděpo-
0.9 • 0.95
dobností u první, třetí a páté větve; viz obr. V.4.   5 — „ ' _———= 97,71 %.
0,9-0,75
0,9-0.75 + 0.2-0,25
= 93,1 %.	není v normě
linka A	0,05
0,40	je v normě
	0,95
	není v normě
linka B	0,04
0,45	je v normě
	0.96
	není v normě
linka C	0.02
0,15	je v normě
	0,98
	Obr. V.4
0,9-0,95+0,1-0,2
0,020 0,380 0,018 0,432 0,003 0,147
3.7 Úlohy k opakování
1 a) Vybereme-li rezavý šroub s pravotočivým závitem; b) jsou-li všechny šrouby rezavé a mají-li všechny levotočivý závit; c) jsou-li všechny součástky s pravotočivým závitem rezavé; d) jsou-li všechny matice rezavé a není-li ani jeden šroub rezavý;
14
e) ne; f) vybraná součástka je šroub nebo rezavá matice.   2 0,02.
7 (200-25\/2)2 4 a) 25 %; b) — = 43,75 %; c) 1 - ^-—2—'— = 32,23 %, ano;
63"
5 a) 38,4 %; b) 9,6 %; c) 0,8 %; d) 51,2 %.
16
d) 2-0,3223- —= 58,21 %, ano. 16
4
6 Pro dvě kostky je pravděpodobnost rovna — = 11,11%; pro tři kostky je pravděpo-
25 72 dobnost o něco větší, je rovna — = 11,57 %.   7 — = 83,7 %.   8 a) 82 %;
b) 11 %; c) 47,8 %, předpokládalo se, že se jednotliví zákazníci rozhodují nezávisle na sobě; d) z daných informací ne - není rozumné předpokládat, že by jednotlivá rozhodnutí jednoho zákazníka byla na sobě nezávislá.   9 a) 8,46 %; b) 42 %.
10 a) 0,001 84 %;b) 0,09686 %; c) 1,765 %.   11—.   12 Ne.   13 83,35 %,
vzrostla by o 2,2 %.   1411.   15 99,5 %.   16 0,49 %.  17 a) 2,77 %;
0 87 ■ 0 72 • 0 35
b) 32,83 %.   18 087.072.0,35 + 0,87 • 0,28 ■ 0,65 + 0,13 • 0,72 • 0,65 = 50,01 %'
218
5. výsledky úloh a cvičení
19a) 0,8-0,8 + 0,2-0,75=0,79 = 79 %; b) PAM = 81,01 %.
0.79
20
0,3 0,92
0,3-0,92 + 0.7-0,78
= 33,58 %.
4. Statistika
WBĚĚĚĚ
fr-:;;-'-;:-',-:--
fĚĚBBĚĚ
4.1 Základní pojmy - statistická jednotka, statistický soubor a znak 1 Kvantitativní znaky jsou stáří vozu, počet najetých kilometrů a počet dnů, po který byl vůz v bazaru od jeho převzetí do prodeje; kvalitativní znaky jsou značka vozu, model a barva.   2 Kvantitativní znaky jsou doba montáže a hmotnost; kvalitativní jsou linka a ohodnocení kvality.
4.2 Rozdělení četností a jeho grafické znázornění 1 Viz obr. V.5.    2 Viz obr. V.6. "
□ ČSSD
□ ODS
□ KSČM
□ TOP 09
□ vv
Obr. V.5: Složení Poslanecké sněmovny ČR po volbách v roce 2010
4. Statistika
-1 q
o 5
o
3 4 5 6
Počet rodinných příslušníků
Obr. V.6: Rozdělení zaměstnanců hrmy podle počtu rodinných příslušníků
3 Viz obr. V.7.
Prac. třída	Četnost	Relativní četnost	Kumulativní četnost	Kumulativní relativní četnost
3	2	2,67 %	2	2,67 %
4	11	14,67 %	13	17,33 %
5	18	24,00 %	31	41,33%
6	28	37,33 %	59	78,67 %
7	16	21,33 %	75	100,00%
Celkem	75	100,00%	—	—
30 25 20 15 10 5 0
.Ľ_J
3
Pracovní třída Obr. V.7: Rozdělení pracovníků do pracovních tříd
220
5. VÝSLEDKY ÚLOH A CVIČENÍ
4.
Rozložení dat je téměř symetrické (histogram ukazuje jen nepatrné sešikmení doprava); viz obr. V.8 a V.9.
Výška	Četnost	Relativní četnost	Kumulativní četnost	Kumulativní relativní četnost
166-170		10,00 %	2	10,00 %
171-175	5	25,00 %	7	35,00 %
176-180	8	40,00 %	15	75,00 %
181-185	4	20,00 %	19	95,00 %
186-190	1	5,00 %	20	100,00 %
Celkem	20	100,00 %	—	—
9 T
8
7
6 I
§  5 J
I  4 I
166-170     171-175      176-180     181-185 186-190 Výška/cm
Obr. V.8: Rozdělení studentů podle výšky
□ 166-170 H 171-175
□ 176-180
□ 181-185
□ 186-190
Obr. V.9: Relativní četnosti vvšek studentů
5 Data vykazují poměrně výrazné sešikmení doleva; viz obr. V. 10.
Pevnost	Četnost
11,8-12,2	1
12,2-12,6	2
12,6-13.0	6
13,0-13,4	9
13,4-13,8	6
13,8-14,2	8
Celkem	32
4.3 Charakteristiky polohy
1 Kepr, neboťxi = 40,06 kg • cnT1 < x2 = 40,62kg • cm-1; medián pro pevnost plátna: xj = 40,3 kg • cm"1, medián pro pevnost kepru: x2 = 41,0kg • cm-1. 2 . v = 12 dnů, x = 3 dny, x = 0 dnů; medián je zde nej vhodnější (průměr je příliš velký díky extrémní hodnotě; modus není reprezentativní, protože jen jediné číslo se v souboru opakuje, a to jen jednou, ostatní hodnoty se navzájem liší). 3 x = 3,504, x = 4, x = 4. 4 x = 5,6, x= 6, x = 6. x = 7.61 pH,x = 7,6pH,xneexistuje. 6x = 0,1685, x = 0,170,x = 0,170.
Koeficient trení	Četnost	Kumulativní četnost
0,150	3	3
0,155	2	5
0,160	9	14
0,165	10	24
0,170	11	35
0,175	6	41
0,180	5	46
0,185	2	48
0,190	1	49
0,195	1	50
Celkem	50	—
7x = 2752,18Kč.   8x = 2,135.   9 a) 1,238, tedy 123,8 %; b) 101 500 Kč a 125 700 Kč; c) 1,414, tedy 141,4 %; d) 115 900Kča 163 900 Kč. 10x40 =*(8)+0,4- [x(9)-x(8)] = 7,54pH, x60 = x(12)+0,6- [x(13)-x(i2)] = 7,7pH. 11 x25 = 0,16, x75 = 0,175.
4.4 Charakteristiky variability
1 fl = 0,8, MATA = 7,8-7,4 = 0,4.   2 R = 0,045, MKR = 0,175-0,16 = 0,015.
Rozpětí se zmenší o 2 velikosti, z 8 na 6; mezikvartilové rozpětí se nezmění, zůstane rovno dvěma.   4 cr2 = 0,0599, a,, = 0,2447.   5 ct2 = 6,0335, an = 2,4563. 6 rr„ =0,009811.     x = 4,6699, x = 4, x = 4, R = 6, MKR = 6-3 = 3, a2 = 3,133 8,
222
ÚLOH A CVIČENÍ
10
o c
1.1,8-12,2 12,2-12,6 12,6-13,0 13,0-13,4 13,4-13,8 13,8-14,2
Pevnost/MPa
Obr. V. 10: Histogram četností hodnot pevnosti v tahu za ohybu
a„ = 1,770 2. Průměrný obsah látky v zemině v celé oblasti je asi 0,285 9 mg • kg~x; rozptyl odhadujeme číslem 0,054 0804 (pozor - k tomuto odhadu je třeba použít výběrový rozptyl!); směrodatná odchylka je asi 0,234 1 mg - kg"' (opět je třeba použít výběrovou směrodatnou odchylku). 9 V = 3,22%. V = 5,82%. 11 Porovnejte variační koeficienty! 12 Va = 43,7 % > VB =24,8 %, výroba tedy byla rovnoměrnější v závodě B.
4.5 Přibližný výpočet charakteristik polohy a variability
x = 10,88, al = 45,5005, an = 6,7454.   2 x = 191,35 h, a„ = 27,181 h.
3x = 3,0192s, an = 1,1937s, V = 39,54%.   4% = 192+ 38~36 ■ 22 = 193,7,
26
x25 = 169+    ~    • 22 = 174,7, x75 = 192+   _~    • 22 = 209,"
xw = 1 + _ . 62,35
30
23 58,9-8
87 = 2,078;
26
0,95 = 1,556.      a) Průměrný prospěch třídy odhadujeme jako
Interval	Střední hodnota	Četnost	Kumulativní	Součin
prospěchu	intervalu x*	«i	četnost	x* ■ m
1,0-1,49	1,245		5	6,225
1,5-1,99	1,745	8	13	13,960
2,0-2,49	2,245	11	24	24,695
2,5-2,99	2,745	4	28	10,980
3,0-3,49	3,245	2	30	6,490
Celkem	—	30	—	62,350
b) x2o = 1,5+ • 0.49 = 1.574.
4.6 Korelace
Graf neukazuje silnou závislost, ale jen slabou pozitivní vazbu, rxy = 0,4148; viz obr. V.ll. 2a)Jč = 174,53 cm, y - 174,67 cm, výška synů v porovnání s jejich otci tedy v průměru neklesla ani nevzrostla; xan = 6,109 cm, yan = 6,600 cm, variabilita výšky synů je tedy trochu větší než variabilita výšky jejich otců; b) graf ukazuje poměrně výraznou pozitivní závislost - větší výška otce má zpravidla za následek větší výšku syna a naopak (i když v daném souboru je řada výjimek); viz obr. V. 12; c) rxy = 0,7717.
u "ó?
>
"E
Si
o
> o
3500
3000
SI 2500
♦
♦
2000
1500
1000
500
200
400        600        800 1000 Najeté kilometry
Obr. V. 11: Závislost mezi provozními výdaji a najetými kilometry
190
185
g 180 Z 175
>
170
165
♦
160
160    165    170    175    180 185
Výška otce/cm
Obr. V. 12: Závislost výšky syna na výšce otce
190
224
ÝSLEDKY ÚLOH A CVIČEN
4 a) rxy = 0.4325, tedy mezi výdaji na reklamu a tržbami je určitá pozitivní závislost, není však příliš silná; b) ano, statistická závislost mezi měsíčními výdaji na reklamu a tržbami v následujícím měsíci je výrazněji pozitivní - příslušný korelační koeficient je rxv = 0,7711, což je větší hodnota než v a).
4.7 Úlohy k opakování Viz obr. V. 13 a V. 14.
0 4-------- --------------- --------
Angličtina Němčina Ruština
Obr. V. 13: Polygon četností volených jazyků
□ Angličtina
□ Němčina
□ Ruština
Obr. V. 14: Relativní četnosti volených jazyků
4. Statistika
Viz obr. V. 15 a VI6.
Hmotnost dávky/kg	Četnost	Relativní četnost	Kumulativní četnost	Kumulativní relativní četnost
0,96	4	13,33 %	4	13,33 %
0,97	3	10,00 %	7	23,33 %
0,98	5	16,67 %	12	40,00 %
0,99	4	13,33 %	16	53,33 %
1,00	6	20,00 %	22	73,33 %
1,01	3	10,00 %	25	83,33 %
1,02	2	6,67 %	27	90,00 %
1,03	3	10,00 %	30	100,00 %
Celkem	30	100,00 %	—	—
7 6 5
tá 4
c
c
S 3
72966000 618500  - 118'
0,96    0,97    0,98    0,99    1,00 1,01 Hmotnost dávky/kg Obr. V. 15: Histogram četností
100000
1,02 1,03
26
= 3 846.   5 Průměrné tempo růstu bylo
zg = y2 -1,7-1,5 = 1,721, spotřeba v roce 2009 byla 5,lkrát větší než v roce 2006.
6 14,87 %.   7 x = 5,183 3 cm,* = 5,185 cm, a„ =0,052493cm, V= 1,01 %.
8 x = 2,0573, x = 2,05, i? = 0,1, a„ = 0,036204.    9 a) x = 1,9998, x = 2, x= 5,185;
b) al= 1,6794, a„ = 1,2959;
c)
Počet švestek	0	1	2	3	4	5	6	7	8
Relativní četnost	10,91 %	27,95 %	28.83 %	19,43 %	9,28 %	2,81 %	0,59 %	0,17 %	0,02 %
d)
Počet šestek	0	1	2
Relativní četnost	10,91 %	27,95 %	28,83 %
Teoretická pravděpodobnost	11,22 %	26,92 %	29,61 %
226
5. výsledky úloh a cvičení
4.
7
6 5
« 4
m O
£ o
2 1 0
A
0,95   0,96 0,97
0,98 0,99 1,00 Hmotnost dávky/kg
Obr. V. 16: Polygon četností
1,01    1,02    1,03 1,04
Muži: x = 30,51 let, x = 30,42 roku, modálni interval: 25 let-29 let; ženy: x = 27,73 let, x = 27,31 roku, modálni interval: 25 let-29 let; muži v ČR tedy v roce 2010 vstupovali do prvního manželství v průměru o 2,8 roku později než ženy; rozdíl mezi mediány byl přibližně 3,1 roku; muži i ženy vstupovali do prvního manželství nejčastěji mezi 25. a 29. rokem.   11a) Rozdělení dat je sešikmené doprava; viz obr. V. 17;
Životnost/h	Četnost	Relativní četnost	Kumulativní četnost	Kumulativní relativní četnost
160-444	18	18,75 %	18	18,75 %
445-729	18	18,75 %	36	37,50 %
730-1014	19	19,79 %	55	57,29 %
1 015-1 299	12	12,50 %	67	69,79 %
1 300-1584	12	12,50 %	79	82,29 %
1 585-1 869	11	11,46 %	90	93,75 %
1 870-2 154	3	3,13 %	93	96,88 %
2155-2439	3	3,13 %	96	100,00 %
Celkem	96	100,00 %	—	—
b) z bodu a) plyne, že průměr je větší než medián; c) x = 996,69 h,
, .,,0+48,5-36 284\ h ^ 9i6;g h, modálni interval je 730 h-1 014h,
1<
tI = 299199,9 tr, an = 546,99 h; d) x =
1
-(921+942)
h = 931.5 h, liší se od odhadnuté
hodnoty o cca 15 h; e) MKR = (1436,1-543,6)h = 892.5 h;
f) MKR = (1352,75-548,25)h = 804.5 h, liší se od odhadnuté hodnoty o 88 h.
12 a) Rozdělení není symetrické, výrazné sešikmení doleva či doprava však také není
patrné; viz obr. V.18; b) x= 43.69 let: c) z histogramu žádný zřejmý vztah neplyne:
20
16 -
í 12
o*/ aQ'
Životnosl/h
Obr. V. 17: Rozdělení hodnot životnosti žárovek
x =   40 +
■9   let = 44,07 let, tedy podle přibližného výpočtu je medián
1 147-791 787
nepatrně větší než průměr; d) 26, resp. 58,3 roku. 13 rxy = 0,7873. 14 Z grafu plyne, že mezi oběma odchylkami je silná pozitivní závislost - čím větší je jedna z odchylek, tím větší je zpravidla i druhá z nich; rxy = 0,9046; viz obr. V. 19. 15 Z grafu plyne, že mezi pevností betonu v tahu a dobou zrání je pozitivní závislost -s rostoucím časem pevnost též roste, tato závislost však není lineární - s rovnoměrně rostoucím časem je průměrný nárůst pevnosti stále menší; rxy — 0,8617; viz obr. V.20. 16^ = 0,577 9; čím vyšší je tedy rychlost linky, tím větší je zpravidla i počet poruch; míra této závislosti není extrémně silná, ale není ani zanedbatelná.
	900
	800 -
	700
	600
c	500 -
X>	400
U	
	300 -
	200 -
	100 -
	0 -
j?
«5
Věk
Obr. V. 18: Rozdělení mužských účastníků výročního závodu Běchovice - Praha podle věku
228
výsledky úloh a cvičení
Seznam užitých symbolů a značek
i imaginární jednotka
j imaginární jednotka (v elektrotechnice)
Re a reálná část komplexního čísla a
Im a imaginární část komplexního čísla a
\a\ absolutní hodnota čísla a
a komplexně sdružené číslo k číslu a
a* komplexně sdružené číslo k číslu a (v elektrotechnice)
-a opačné číslo k číslu a
a' převrácené číslo k nenulovému číslu a
převrácené číslo k nenulovému číslu a
a
{/ä n-tá odmocnina z nezáporného reálného čísla a
(\/a)c n-tá odmocnina z komplexního čísla a
a = {a\, 0-2) vektor o má souřadnice a\, a-i
D diskriminant kvadratické rovnice
p A q konjunkce výroků p, q (p a zároveň q)
p ^ q ekvivalence výroků p, q (p je ekvivalentní s q; p právě když q)
P(ri) počet všech permutací z n prvků
n\ n faktoriál
V(k, ri) počet všech ^-členných variací z n prvků
K(k, n) počet všech ^-členných kombinací z n prvků n\
kombinační číslo n nad k
k)
P'(k\,k2, ■■■■,kn)   počet všech permutací z n prvků, v nichž se jednotlivé prvky opakují ^! -krát, &2-krát, ..., &„-krát
V'(k. n) počet všech ^-členných variací s opakováním z n prvků
K'(k,n) počet všech ^-členných kombinací s opakováním z n prvků
Q jistý jev
0 nemožný jev
A, B, ... náhodné jevy
uěA elementární jev tu je příznivý jevu A
A C B jev A je podjevem jevu B
A' opačný jev k jevu A
Au B sjednocení jevů A a B
AnB průnik jevů A a B
230
Seznam užitých symbolů a značek
A\B	rozdíl jevů A a B
P{A)	pravděpodobnost jevu A
n	počet všech stejně možných výsledku náhodného pokusu
"(A)	počet výsledku příznivých jevu A
A/	počet nezávislých opakování náhodného pokusu
N(A)	počet výskytu jevu A v sérii N nezávislých opakování náhodného
	pokusu
M(A)	míra množiny A
P(A|B)	podmíněná pravděpodobnost jevu A jevem B
	pravděpodobnost zdaru v binomickém rozdělení
	pravděpodobnost nezdaru v binomickém rozdělení, q-\-p
n	rozsah statistického souboru
-M j -^2; • • • > -^n	jednotlivé (ne nutně navzájem různé) hodnoty znaku x, tvořící
	statistický soubor
■X-| »         ? " * " í "^j"	navzájem různé hodnoty znaku x
	četnost hodnoty x*
	aritmetický průměr hodnot znaku x
.Ť	medián hodnot znaku x
*(2)j • • •; x(n)	(vzestupně) uspořádaný soubor hodnot znaku x
X	modus hodnot znaku x
w\, w2, • • •, wr	váhy navzájem různých hodnot znaku x
X\y	vážený průměr hodnot znaku x
ŽG	geometrický průměr čísel z.\, zo, ■ ■ ■, zn
X p	/^-procentní kvantil hodnot znaku x
%	dolní kvartil hodnot znaku x
*75	horní kvartil hodnot znaku x
R	rozpětí statistického souboru
MKR	mezikvartilové rozpětí statistického souboru
°l	rozptyl hodnot znaku
On	směrodatná odchylka hodnot znaku
-U	výběrový rozptyl hodnot znaku
	výběrová směrodatná odchylka hodnot znaku
V	variační koeficient hodnot znaku
r„	koeficient korelace mezi znaky x a y
Seznam užitých symbolů a značek
231
Literatura
Calda, E., Dupač, V.: Matematika pro gymnázia - Kombinatorika, pravděpodobnost.
statistika. Prometheus, Praha, 2012. Calda, E.: Matematika pro gymnázia - Komplexní čísla. Prometheus, Praha, 2011. Calda, E.: Matematika pro netechnické obory SOS a SOU, 3. díl. Prometheus, Praha,
2012.
Calda, E.: Matematika pro netechnické obory SOS a SOU, 4. díl. Prometheus, Praha, 2010.
Calda, E., Hebák, P, Petránek, O.: Matematika pro SOS a studijní obory SOU, 4. část.
Prometheus, Praha, 2011. De Veaux, R. D., Velleman, P. F., Bock, D. E.: Intro Stats. Pearson International Edition,
Addison Wesley, 2009. Groebner, D. F, Shannon, P. W., Fry, P. C, Smith, K. D.: Business Statistics. Prentice-
-Hall, Upper Saddle River, New Jersey, 2001. Hála, M., Jarušková, D.: Pravděpodobnost a matematická statistika 12 - Příklady.
ČVUT, Praha, 1998. Hátle, J., Kahounová, J.: Úvod do teorie pravděpodobnosti. SNTL, Praha, 1987. Hildebrand, D. K., Ott, R. L.: Statistical Thinking for Managers. Duxbury Press, Pacific
Grove, California, 1998. Plocki, A., Tlustý, P.: Pravděpodobnost a statistika pro začátečníky a mírně pokročilé.
Prometheus, Praha, 2007. Ráb, M.: Komplexní čísla v elementární matematice. 2. přeprac. vyd. Masarykova
univerzita, Brno, 1996. Rublík, F: Základy pravdepodobnosti a statistiky. ALFA, Bratislava, 1983.
Pro exkurze do historie
Bečvář, J., Fuchs, E. (ed.): Matematika v 16. a 17. století. Dějiny matematiky, svazek 12. Prométheus, Praha, 1999.
Inspirace pro příklady z fyziky
Blahovec, A.: Elektrotechnika I. Informatorium, Praha, 2010.
© Zdeněk Drozd - str. 22, 23
© Alessandro Contadin/Fotky&Foto - str. 67
© BVDC/Fotky&Foto - str. 73
© Andy-pix/Foťky&Foto - str. 74
© Jimi King/Fotky&Foto - str. 91 horní fotografie
© Imre Forgo/Fotky&Foto - str. 98 horní fotografie
© Alex/Fotky&Foto - str. 119
© Milan Surkala/Fotky&Foto-str. 140
© Trevor Allen/Fotky&Foto - str. 202
© Jaroslav Nezbeda - str. 95
© Robert Kubín - str. 99
© Veronika Nešverová - str. 68, 91 dolní fotografie, 98 dolní fotografie, 102, 105, 110, 112, 121, 131, 138, 144, 145, 148, 152, 159, 191, 201
Fotografii na str. 203 ze závodu Běchovice - Praha poskytl časopis Atletika.
Rejstřík
bsolutní hodnota komplexního čísla, 14 anagram, 92
argument komplexního čísla, 35
- základní, 35
Bernoulliovo schéma, 134 binomické rozdělení, 134 binomický rozvoj, 85 bod Gaussovy roviny, 10
četnost hodnoty znaku, 150
- jevu relativní, 111
- kumulativní, 154
- kumulativní relativní, 154
- relativní, 151 číslo imaginární, 11
- kombinační, 76
- komplexně sdružené, 17
- komplexní, 10
- opačné, 18
- převrácené (reciproké), 27
- ryze imaginární, 12
diagram bodový, 195
- kruhový, 152
- sloupkový, 150
- spojnicový, 154
aktoriál 69
geometrická definice pravděpodobnosti, 112 geometrický význam absolutní hodnoty, 15 graf bodový, 195
- koláčový, 152
i ■istogram četností, 150
- skupinového rozdělení četností, 161
arakteristika polohy, 162
maginární část komplexního čísla, 10
- osa, 10
interval kvantilový, 192
- modálni, 192
■ednotka imaginární, 15
- komplexní, 15 jev elementární, 103
- jistý, 104
- náhodný, 104
- nemožný, 104
- opačný, 105
- složený, 104
jevy neslučitelné, 105
- nezávislé, 127
-tice neuspořádaná, 76
- uspořádaná, 65
klasická definice pravděpodobnosti, 108 koeficient binomický, 85
- korelace, 197
- korelační, 197
- variační, 183
kombinace fe-členná z n prvků, 76
- Ä-členná s opakováním z n prvků, 96 kombinatorické pravidlo součinu, 65
- pravidlo součtu, 66 kvantil p-procentní, 172 kvartil dolní, 173
- horní, 173
edián, 163 míra množiny, 112 modus, 165 Morseova abeceda, 94
-tá mocnina komplexního čísla, 26 n-tá odmocnina komplexního čísla, 49 náhodný pokus, 102
d lehlé hodnoty, 164
Pascalův trojúhelník, 81 permutace z n prvků, 69
- s opakováním z n prvků, 89 podíl komplexních čísel, 28 podjev, 105
polygon četností, 154 pravděpodobnost náhodného jevu, 107
- jistého jevu, 114
- nemožného jevu, 114
- podmíněná jevu, 124
- sdružená, 125 pravděpodobnostní strom, 141 problém čtyř barev, 100 průměr aritmetický, 162
- geometrický, 169
- vážený, 168 průměrné tempo růstu, 169 přihrádkový princip, 67
■eálná část komplexního čísla, 10
- osa, 10
rovina Gaussova, 10
- komplexních čísel, 10
rovnice algebraická n-tého stupně, 60
- binomická, 57
- kvadratická se záporným diskriminantem, 56
- lineární, 54
rovnost komplexních čísel, 12 rozdělení četností, 150
234
RejstřIk
Re
- skupinové (intervalové), 157 rozdíl komplexních čísel, 13 rozpětí statistického znaku, 175
- mezikvartilové, 175 rozptyl, 176
- výběrový, 180
- základního souboru, 180 rozsah souboru, 148
sešikmení dat, 158 směrodatná odchylka, 176
- výběrová, 180
- základního souboru, 180 soubor statistický, 148
- uspořádaný, 163
- základní, 149
součet komplexních čísel, 13 součin komplexních čísel, 13 statistická definice pravděpodobnosti, 111
- jednotka, 148 statistický znak, 148
- kvalitativní, 149
- kvantitativní, 149 Sturgesovo pravidlo, 157
abulka četností, 150
- skupinového rozdělení četností, 157
tvar algebraický komplexního čísla, 16
- exponenciální komplexního čísla, 39
- goniometrický komplexního čísla, 35
plný systém vylučujících se jevů, 137 uspořádaná dvojice, 10
áhy hodnot, 168 variace ^-členná z n prvků, 72
- /.--členná s opakováním z n prvků, 93 vektor v Gaussově rovině, 33
věta binomická, 85
- Moivrova, 47
- o nezávislosti jevů, 127
- o úplné pravděpodobnosti, 137
- Velká Formátová, 100
- základní věta algebry, 60 výsledek příznivý, 105 vzorce Cardanovy, 63
- pro výpočet rozptylu, 172
- pro výpočet výběrového rozptylu, 181 vzorec Bayesův, 140
- obecný pro násobení pravděpodobností, 125
- obecný pro sčítání pravděpodobností, 117
- pro pravděpodobnost opačného jevu, 115
- pro sčítání pravděpodobností neslučitelných jevů, 115
Pp IQTŘÍI
RNDr. Jarmila Robova, CSc. RNDr. Martin Hála, CSc. doc. RNDr. Emil Calda, CSc.
Matematika pro střední školy
Komplexní čísla, kombinatorika, pravděpodobnost a statistika
Obálku a grafickou úpravu navrhl Miloš Jirsa Vydalo nakladatelství Prométheus, spol. s r. o., Čestmírova 10, 14000 Praha 4, roku 2013
telifax: 241740172
e-mail: odbyt@prometheus-nakl.cz
http://www.prometheus-nakl.cz
Edice Učebnice pro střední školy
Odpovědná redaktorka RNDr. Eva Nešverová
Sazbu programem I4Tg;X a obrázky programy GeoGebra a GIMP
připravili RNDr. Vlasta Moravcová a RNDr. Luboš Moravec
Vytiskly Tiskárny Havlíčkův Brod, a. s.,
Husova 1881, 58001 Havlíčkův Brod
1.vydání
0621418
ISBN 978-80-7196-425-4
Ml C£ I Modely a vědeckými funkcemi
^^#^^^31 a dvouřádkovým displejem
Příklady výpočtu komplexních čísel ve formátu pravoúhlých souřadnic (« * M
Přiklad 1: 2 * (V3 + ť) = 2V3 + 2í = 3.464101615 ♦ 2í JMATHJ
Příklad 2: *S /. 45 = 1 + i
J**™J        . (Úhlová jednotka: Deg)
	twin *
12H5	
	1+i
displej s bodovou maticí 10 + 2 míst • 7 variabilních paměti • opravné funkce • výpočet zlomků • výpočty a převody v šedesátkové soustavě • statistické výpočty (standardní odchylka, regresní analýzy) • variace, kombinace • hyperbolické, inverzní hyperbolické funkce • transformace souřadnic • ENG konverze • editor statistických dat • exponenciální zobrazení • odhalení chyb • komplexní čísla • maticové výpočty
• výpočty s vektory • integrály • diferenciály
• výpočty rovnic • 40 vědeckých konstant • 20 metrických přepočtů • automatické vypnutí • 417 funkcí • bateriové napájení
FX-570 ES PLUS
GRAFICKÉ PROGRAMOVATELNÉ KALKULAČKY
plně barevný podsvětlený LCD displej 216 x 384 • 61 kB RAM • 15 MB paměť typu Flash • ikonové menu • základní matematické funkce • komplexní čísla • Integrální a diferenciální počet • výpočty s maticemi • řešení rovnic i jejich soustav • pokročilá statistika • finanční matematika • výpočty s fyzikálními konstantami • grafické funkce s pamětí na 20 grafů vč. dynamických grafů - regresní grafy, grafy nerovností, dynamický graf, grafy kuželoseček, parametrický graf • analýza |   na základě reálných obrázků • USB připojení k PC • propojení mezi jinými grafickými kalkulačkami CASIO
FX-CG 20
Příklad  statist cke výpočty
0		3 rďfcH3SHEET		
she	a	b	c	
		istatis	Ialgebb	calcul
2	kate	bo	25 j 22	
3	jack	60	841 68	
4	bob	85	58	37
	bill	BS	901 80	
				60
UI9B!lVI!lBU9llia5M!IBSfL_Ě_J				
Příklady - grafy funkcí
	ÜB			
	y			
				
				
-6    -5    -'i \iö lŕOÍÍER=-l>5-i---^ ;dx=-7.1468333	a=7.	=2!......i-14583333		
Analýza průběhu i obrázku
1
info@fastcr.cz
m m 3
í i
PROMETHEUS
0621418
ISBN 978-80-7196-425-4
198.00'
9788071964254