BPM.STAE: Sbírka úloh - cvičení 4, kapitola 3 Příklad 1 Máme údaje o ziscích deseti největších společností podle žebříčku Fortune 500 za rok 2014 (zdroj: www.fortune.com). Vaším úkolem je: Najít průměr a medián z těchto dat a zjistit, zda tato data obsahují modus (pokud ano, určete ho). Společnost Zisky (milióny dolarů) Wal-Mart Stores 16 022 Exxon Mobil 32 580 Chevron 21 423 Berkshire Hathaway 19 476 Apple 37 037 Phillips 66 3 726 General Motors 5 346 Ford Motor 7 155 General Electric 13 057 Valero Energy 2 720 Příklad 2 Následující data uvádějí náklady na elektřinu pro 12 náhodně vybraných domácností z malého města, náklady byly zaznamenány v listopadu 2023. Spočtěte průměr a medián pro tato data. Obsahují tato data modus? Vysvětlete. 205 265 176 314 243 192 357 238 281 342 259 Příklad 3 Dvacet náhodně vybraných manželských párů bylo dotázáno, kolik let již žijí v manželství. Jejich odpovědi jsou uvedeny níže. Spočtěte průměr, medián a modus pro tato data. Spočtěte 10% oříznutý průměr pro tato data. 12 27 8 15 5 9 18 13 35 23 19 33 41 59 3 26 5 34 27 51 Příklad 4 Následující data uvádějí výše bonusů pro 10 náhodně vybraných manažerů na Wall Street (v tisících dolarech). Vaším úkolem je spočítat průměr a medián těchto hodnot, a zároveň určit 10% oříznutý průměr. Zjistěte, zda se v těchto datech nachází modus, a vysvětlete, proč tomu tak je nebo není. Data obsahují také jednu odlehlou hodnotu - zamyslete se nad tím, které shrnující ukazatele jsou v tomto případě vhodnější pro přesnější popis. 127 82 45 99 153 3 261 77 108 68 278 Příklad 5 Následující data uvádějí celkové výdaje na potraviny pro vzorek 20 rodin (v dolarech) za poslední měsíc. Vaším úkolem je spočítat průměr, medián a 20% oříznutý průměr. 1125 530 1234 595 427 872 1480 699 1274 1187 933 1127 716 1065 934 930 1046 1199 1353 441 Příklad 6 Následující data uvádějí ceny (v tisících dolarech) 10 domů, které byly prodány v Blansku v minulém roce. Vaším úkolem je spočítat průměr, medián a 10% oříznutý průměr. 205 214 265 195 283 188 251 325 219 295 1 Příklad 7 Následující data uvádějí roční platy (v tisících dolarech) 20 náhodně vybraných pracovníků v oblasti zdravotní péče. Vaším úkolem je spočítat průměr, medián, modus a 15% oříznutý průměr. 50 71 57 39 45 64 38 53 35 62 74 40 67 44 77 61 58 55 64 59 Příklad 8 Následující data uvádějí počet pacientů, kteří navštívili pohotovostní kliniku během 20 náhodně vybraných dní. Vaším úkolem je spočítat průměr, medián, modus a 15% oříznutý průměr. 23 37 26 19 33 22 30 42 24 26 28 32 37 29 38 24 35 20 34 38 Příklad 9 Následující data představují hodnoty systolického krevního tlaku (to je horní číslo v běžném krevním tlaku) v mmHg pro každého z 20 náhodně vybraných mužů středního věku užívající léky na tlak. Vaším úkolem je spočítat průměr, medián, modus a 10% oříznutý průměr. 139 151 138 153 134 136 141 126 109 144 111 150 107 132 144 116 159 121 127 113 Příklad 10 V anketě mezi 640 rodiči 360 uvedlo, že nechtějí, aby jejich děti hrály fotbal, protože to považují za velmi nebezpečný sport. Dalších 210 rodičů souhlasilo, že by svým dětem fotbal dovolili hrát, a 70 rodičů nemělo na tuto otázku žádný názor. Na základě těchto údajů určete modus, tedy nejčastěji se vyskytující názor rodičů. Příklad 11 Profesorka sestavuje konečné skóre na základě několika kategorií: kvizy, skupinové práce, domácí úkoly, pololetní zkouška a závěrečná zkouška. Každá kategorie přispívá k finálnímu skóre jiným procentuálním podílem. Honzovy získané body (z maximálních 100) a jednotlivé váhy úkolů potřebné pro určení finálního skóre jsou uvedeny v tabulce. Úkol Honzovo skóre (Celkový počet bodů) Procentuální váha pro finální známku Kvizy 75 30 Skupinová práce 52 5 Domácí úkoly 85 10 Pololetní zkouška 74 15 Závěrečná zkouška 81 40 Vaším úkolem je za profesorku spočítat Honzovo konečné skóre (z maximálních 100 bodů) na základě jeho výsledků v jednotlivých úkolech a jejich procentuální váhy. Nápověda: Převod procentuálních vah na desetinná čísla, například 30 % = 0.30, může výpočet zjednodušit. Příklad 12 Jednou z vlastností průměru je, že pokud známe průměry a velikosti vzorků dvou (nebo více) datových sad, můžeme snadno spočítat jejich kombinovaný průměr. Pro dvě datové sady se kombinovaný průměr vypočítá pomocí vzorce: , — n{xi + n2X2 Kombinovaný průměr = x = -, ni + n2 2 kde ni a ni jsou velikosti vzorků dvou datových sad & x\ a "x-i jsou průměry těchto datových sad, odpovídající. Představme si, že vzorek 10 knih o statistice měl průměrnou cenu 140 dolarů a vzorek 8 knih o matematice měl průměrnou cenu 160 dolarů. Najděte kombinovaný průměr cen těchto knih. (Nápověda: Pro tento příklad: ri\ = 10, ni = 8, x\ = 140 dolarů, x^ = 160 dolarů.) Příklad 13 Obchod s oděvy zakoupil v loňském roce 8000 košil od pěti různých firem. V následující tabulce jsou uvedeny počty košil zakoupených od každé firmy a cena zaplacená za každou košili. Spočítejte vážený průměr, který představuje průměrnou cenu zaplacenou za 8000 košil. Počet Cena košile Společnost zakoupených košil (v dolarech) Best Shirts 1200 30 Top Wear 1900 45 Smith Shirts 1400 40 New Design 2200 35 Radical Wear 1300 50 Příklad 14 Pro libovolná data platí, že součet všech hodnot je roven součinu velikosti vzorku a průměru, tedy T,x = rix. Předpokládejme, že průměrná částka utracená za nákupy 10 osobami během jednoho týdne byla 105.5 dolaru. Určete celkovou částku peněz, kterou těchto 10 osob utratilo. Příklad 15 Průměrný příjem pro rodiny v roce 2015 byl 99 520 dolarů. Jaký byl celkový příjem pěti rodin v roce 2015? Příklad 16 Průměrný věk šesti osob je 46 let. Věky pěti z těchto šesti osob jsou 57, 39, 44, 51 a 37 let. Určete věk šesté osoby. Příklad 17 Sedm pasažérů na stejném letu v ekonomické třídě zaplatilo za lístek v průměru 361 dolarů. Protože lístky byly zakoupeny v různých časech a od různých zdrojů, ceny se lišily. Prvních pět pasažérů zaplatilo 420, 210, 333, 695 a 485 dolarů. Šestý a sedmý lístek zakoupil pár, který zaplatil stejnou částku. Kolik každý z nich zaplatil? Příklad 18 Při zkoumání jevů, jako je inflace nebo změny populace, které zahrnují pravidelný nárůst nebo pokles, se často používá geometrický průměr k určení průměrné změny za celou sledovanou dobu. Geometrický průměr se počítá tak, že vynásobíme všechny hodnoty a následně z tohoto součinu vypočítáme n-tou odmocninu. Vypadá to takto: Geometrický průměr = ^Jx\ ■ x^ ■ x% ■ ... ■ xn. Předpokládejme, že míry inflace za posledních pět let byly 4%, 3%, 5%, 6% a 8%. To znamená, že na konci prvního roku bude index cen 1.04krát vyšší než na začátku roku, a podobně pro další roky. Vaším úkolem je najít průměrnou míru inflace za období 5 let výpočtem geometrického průměru datové sady 1.04, 1.03, 1.05, 1.06 a 1.08. (Nápověda: V tomto případě je n = 5, x\ = 1.04, x^ = 1.03 a podobně. Průměrnou míru inflace získáte odečtením 1 od vypočítaného geometrického průměru.) 3 Příklad 19 Následující data uvádějí ceny sedmi náhodně vybraných učebnic z univerzitního knihkupectví. Nejprve spočítejte průměr těchto dat a následně odchylky jednotlivých hodnot od tohoto průměru. Zjistěte, zdaje součet těchto odchylek nulový. Poté vypočítejte rozpětí, rozptyl, směrodatnou odchylku a variační koeficient těchto cen učebnic. $89 $170 $104 $113 $56 $161 $147 Příklad 20 Následující data uvádějí počet let zaměstnání 20 zaměstnanců malé firmy. Vaším úkolem je nejprve spočítat rozpětí, rozptyl a směrodatnou odchylku těchto dat. Dále spočítejte variační koeficient. Nakonec se zamyslete nad tím, zda hodnoty těchto shrnujících měr představují parametry populace nebo statistiky vzorku, a vysvětlete svůj závěr. 23 9 12 21 24 6 33 34 17 3 12 31 5 10 27 9 15 16 30 38 Příklad 21 Následující data uvádějí roční platy (v tisících $) 20 náhodně vybraných pracovníků. Vaším úkolem je nejprve spočítat rozpětí, rozptyl a směrodatnou odchylku těchto dat. Dále spočítejte variační koeficient. Nakonec se zamyslete nad tím, zda hodnoty těchto shrnujících měr představují parametry populace nebo statistiky vzorku, a vysvětlete svůj závěr. 50 71 57 39 45 64 38 53 35 62 74 40 67 44 77 61 58 55 64 59 Příklad 22 Následující data představují počet pacientů, kteří navštívili pohotovostní kliniku každý z 20 náhodně vybraných dnů. Vaším úkolem je nejprve spočítat rozpětí, rozptyl a směrodatnou odchylku těchto dat. Dále spočítejte variační koeficient. 23 37 26 19 33 22 30 42 24 26 28 32 37 29 38 24 35 20 34 38 Příklad 23 Následující data představují doby jednosměrných jízd (v minutách) z domova do práce 12 zaměstnanců malé firmy. Vaším úkolem je spočítat rozpětí, rozptyl a směrodatnou odchylku těchto časů. Dále spočítejte variační koeficient. Na závěr se zamyslete, co vám říká hodnota směrodatné odchylky o rozptýlenosti dat. 35 10 22 38 31 27 53 44 16 44 25 12 Příklad 24 Následující data představují počet minut pro dokončení úkolu 10 studentů. Vaším úkolem je spočítat rozpětí, rozptyl a směrodatnou odchylku těchto časů. Dále spočítejte variační koeficient. Na závěr se zamyslete, co vám říká hodnota směrodatné odchylky o rozptýlenosti dat. 15 26 16 36 31 13 29 18 21 39 Příklad 25 Následující data představují hodinové sazby (v $) osmi zaměstnanců společnosti. Spočítejte směrodatnou odchylku. Je její hodnota nulová? Pokud ano, proč? 22 22 22 22 22 22 22 22 4 Příklad 26 Roční platy všech zaměstnanců v určité společnosti mají průměr 62 350 dolarů a směrodatnou odchylku 6 820 dolarů. Doba pracovní zkušenosti má průměr 15 let a směrodatnou odchylku 2 roky. Vaším úkolem je zjistit, zda je relativní variabilita mezd větší nebo menší než relativní variabilita v pracovních zkušenostech zaměstnanců. Příklad 27 Skóre SAT (Scholastic Aptitude Test) u 100 studentů má průměr 975 a směrodatnou odchylku 105. Průměr GPA (grade point average) týchž 100 studentů je 3.16 a směrodatná odchylka 0.22. Vaším úkolem je zjistit, zda je relativní variabilita SAT skóre větší nebo menší než relativní variabilita v GPA. Příklad 28 Uvažujte následující dvě sady dat, přičemž každá hodnota druhé sady je získána přičtením sedmi k odpovídající hodnotě první sady. Vaším úkolem je spočítat směrodatnou odchylku pro každou z těchto dvou sad pomocí vzorce pro výběrová data. Poté se zamyslete nad vztahem mezi oběma směrodatnými odchylkami a komentujte, jak přičtení konstantní hodnoty ovlivňuje směrodatnou odchylku obou datových sad. Sada dat I: 12 25 37 8 41 Sada dat II: 19 32 44 15 48 Příklad 29 Průměrný čas všech účastníků běžeckého závodu byl 220 minut s rozptylem 20 minut. Vaším úkolem je pomocí Chebyshevovy věty zjistit minimální procento běžců, kteří dokončili závod v následujících časových rozmezích: 1. za 180 až 260 minut 2. za 160 až 280 minut 3. za 170 až 270 minut Příklad 30 Doby jednosměrné jízdy z domova do práce pro zaměstnance pracující ve velké společnosti mají průměr 34 minut a směrodatnou odchylku 8 minut. 1. Pomocí Chebyshevovy věty určete minimální procento zaměstnanců této společnosti, kteří mají dobu jednosměrné jízdy v následujících intervalech. (a) 14 až 54 minut (b) 18 až 50 minut 2. Pomocí Chebyshevovy věty určete interval, který obsahuje doby jednosměrné jízdy mající alespoň 89 % zaměstnanců této společnosti. Příklad 31 Průměrná měsíční splátka hypotéky, kterou platí majitelé domů ve městě, činí 2365 dolarů se směrodatnou odchylkou 340 dolarů. 1. Pomocí Chebyshevovy věty určete minimální procento všech majitelů domů v tomto městě, kteří platí měsíční splátku hypotéky ve výši (a) od 1685 do 3045 dolarů (b) od 1345 do 3385 dolarů 2. Pomocí Chebyshevovy věty určete interval, který obsahuje výši měsíční splátky hypotéky alespoň 84 % všech majitelů domů v tomto městě. 5 Příklad 32 Jednosměrné doby jízdy z domova do práce pro všechny zaměstnance mají rozložení ve tvaru zvonu s průměrem 34 minut a směrodatnou odchylkou 8 minut. Pomocí empirického pravidla určete přibližné procentuální podíly zaměstnanců této společnosti, kteří mají jednosměrné doby jízdy v následujících intervalech: 1. 10 až 58 minut 2. 26 až 42 minut 3. 18 až 50 minut Příklad 33 Ceny všech univerzitních učebnic mají rozdělení ve tvaru zvonu s průměrem $180 a směrodatnou odchylkou $30. 1. Pomocí empirického pravidla určete (přibližný) procentní podíl všech univerzitních učebnic s cenami mezi (a) 150 a 210 dolary (b) 120 a 240 dolary 2. Pomocí empirického pravidla určete interval, který obsahuje ceny (přibližně) 99,7 % univerzitních učebnic. Příklad 34 Následující data uvádějí rychlosti 13 aut (v mílích za hodinu) naměřené radarem při jízdě po dálnici 1-84. Vaším úkolem je spočítat hodnoty tří kvartilů (Ql, Q2, Q3) a mezikvartilového rozpětí (IQR). Poté vypočítejte přibližnou hodnotu 35. percentilu. Nakonec určete percentilové pořadí pro hodnotu 71. 73 75 69 68 78 69 74 76 72 79 68 77 71 Příklad 35 Následující data uvádějí dobu čekání (v minutách) 20 studentů, kteří stáli ve frontě u univerzitní knihovny na zaplacení učebnic. Vaším úkolem je sestrojit krabicový graf pro tato data. Po sestavení grafu komentujte případné zešikmení těchto dat na základě tvaru grafu a pozorovaných vlastností, jako jsou odlehlé hodnoty či asymetrie. 15 8 23 21 5 17 31 22 34 6 5 10 14 17 16 25 30 3 31 19 Příklad 36 Následující data uvádějí bonusy za rok 2015 (v tisících dolarech) 15 náhodně vybraných manažerů ze Wall Street. Vaším úkolem je sestrojit krabicový graf pro tato data. Po vytvoření grafu určete, zda jsou tato data zešikmení, a pokud ano, komentujte, zda je zešikmení směrem nahoru (k vyšším hodnotám) nebo dolů (k nižším hodnotám). 107 122 175 89 53 361 67 258 61 781 136 208 391 247 71 Příklad 37 Následující data uvádějí počet pacientů, kteří navštívili pohotovostní kliniku v každém z 24 náhodně vybraných dnů. Sestrojte krabicový graf. Komentujte zešikmení těchto dat. 23 37 26 19 33 22 30 42 24 26 64 8 28 32 37 29 38 24 35 20 34 38 28 16 Příklad 38 Následující data uvádějí počet dopravních přestupků, které byly uděleny za poslední tři roky 12 řidičům. Vaším úkolem je najít průměr, medián a modus. Poté spočítejte rozpětí, rozptyl a směrodatnou odchylku. Nakonec se zamyslete nad tím, zda jsou některé z vypočítaných hodnot populačními parametry, nebo jestli představují statistiky vzorku. 4803 11 74 14 8 13 79 6 Příklad 39 Obchod TVshop prodal loňský rok 4828 televizí. Následující tabulka uvádí počet různých modelů televizí prodaných a ceny, za které byly prodány. Spočítejte vážený průměr, který představuje průměrnou cenu, za kterou bylo těchto 4828 televizí prodáno. Model televize Počet prodaných TV Cena (v dolarech) RRV5023 483 1630 TSU7831 1324 625 WEV4920 856 899 HEG7609 633 1178 YOX6938 394 1727 LXT2384 1138 923 Příklad 40 Firma vyrábí pět různých modelů fotoaparátů. Minulý měsíc prodali 13 884 fotoaparátů všech pěti modelů. Následující tabulka uvádí počet různých modelů fotoaparátů prodaných během posledního měsíce a ceny, za které byly prodány. Spočítejte vážený průměr, který představuje průměrnou cenu, za kterou bylo prodáno těchto 13 884 fotoaparátů. Model kamery Počet prodaných kamer Cena (v dolarech) B110 3216 425 Z310 1828 1299 N450 4036 369 J150 3142 681 L601 1662 1999 Příklad 41 Průměrný čas potřebný k naučení základů softwarového programu studenty je 200 minut s směrodatnou odchylkou 20 minut. 1. Pomocí Chebyshevovy věty najděte minimální procento studentů, kteří se naučili základy softwarového programu za: (a) 160 až 240 minut (b) 140 až 260 minut 2. Pomocí Chebyshevovy věty najděte interval, který obsahuje časy potřebné k naučení softwarového programu alespoň 84% všech studentů. Příklad 42 Časy čekání pacientů v pohotovostní klinice mají zkreslené rozložení se střední hodnotou 30 minut a směrodatnou odchylkou 6 minut. 1. Pomocí Chebyshevovy věty najděte minimální procento pacientů v této pohotovostní klinice, kteří budou čekat: (a) 15 až 45 minut (b) 12 až 48 minut 2. Pomocí Chebyshevovy věty najděte interval, který obsahuje čekací časy alespoň 75% pacientů. 7 Příklad 43 Průměrný čas potřebný k naučení základů softwarového programu všemi studenty má zvonovité rozložení se střední hodnotou 200 minut a směrodatnou odchylkou 20 minut. 1. Pomocí empirického pravidla najděte přibližný procentní podíl studentů, kteří se naučili základy softwarového programu za: (a) 180 až 220 minut (b) 160 až 240 minut 2. Pomocí empirického pravidla najděte interval, který obsahuje časy potřebné k přibližným 99,7% všech studentů k naučení softwarového programu. Příklad 44 Každý rok fakulta na Metro Business College vybere 10 členů aktuálního absolventského ročníku, kteří mají největší šanci na úspěch v budoucím zaměstnání. Níže jsou uvedena data o současném ročním příjmu (v tisících dolarech) 10 členů ročníku 2009, kteří byli vybráni jako nejpravděpodobnější k úspěchu. Vaším úkolem je určit hodnoty tří kvartilů (Ql, Q2, Q3) a mezikvartilového rozpětí (IQR). Zjistěte, kde se nachází hodnota 74 vzhledem k těmto kvartilům. Dále spočítejte přibližnou hodnotu 70. percentilu a poskytněte stručnou interpretaci tohoto percentilu. Nakonec najděte percentilové pořadí hodnoty 97 a poskytněte stručnou interpretaci tohoto percentilového pořadí. 59 68 84 78 107 382 56 74 97 60 Příklad 45 Následující data uvádějí stav tachometru (zaokrouhlený na tisíc mil) pro 20 aut, která jsou určena k prodeji u nedalekého obchodníka. Vaším úkolem je spočítat hodnoty tří kvartilů (Ql, Q2, Q3) a mezikvartilového rozpětí (IQR). Dále zjistěte, kde se číslo 77 nachází vzhledem k těmto kvartilům. Poté najděte přibližnou hodnotu 18. percentilu a poskytněte stručnou interpretaci tohoto percentilu. Nakonec spočítejte percentilové pořadí hodnoty 72 a poskytněte stručnou interpretaci tohoto percentilového pořadí. 62 86 58 84 72 40 27 38 50 43 27 40 90 43 94 36 28 48 86 77 Příklad 46 Hodnocení Moniky v matematickém kurzu se určuje třemi testy s možnými 100 body za každý a závěrečnou zkouškou s možnými 200 body. K určení známky studenta v tomto kurzu instruktor sečte všechny čtyři skóre a tuto sumu vydělí 5, aby získal procenta. Tato procentuální hodnota musí být nejméně 80 pro získání známky B. Pokud jsou tři testové skóre Moniky 75, 69 a 87, jaké je minimální skóre, které potřebuje na závěrečné zkoušce, aby získala známku B? Příklad 47 Jeffrey zasedá v šestičlenné porotě ve sporu o odškodnění za zranění. Všech šest porotců chce přidělit žalobci odškodné, ale nemohou se shodnout na jeho výši. Porotci se rozhodli, že každý z nich navrhne částku, kterou si myslí, že by měla být žalobci přidělena. Poté použijí průměr těchto šesti čísel jako doporučenou částku, kterou by měl žalobce dostat. 1. Jeffrey si myslí, že by žalobce měl dostat 20 000 dolarů, ale domnívá se, že průměr doporučení ostatních pěti porotců bude asi 12 000 dolarů. Rozhodne se navrhnout vyšší částku, aby průměr pro všech šest porotců byl 20 000 dolarů. Jakou částku by musel Jeffrey navrhnout? 2. Jak by tato porota mohla revidovat svůj postup, aby zabránila tomu, aby porotce jako Jeffrey měli neopodstatněný vliv na výši uděleného odškodnění žalobci? Může například místo průměru využít medián? Zamyslete se co by tato změna metodiky výpočtu znamenala. 8 Příklad 48 Během své 300milové automobilové cesty dosáhla Líza průměrné rychlosti 52 mph během prvních 100 mil, 65 mph během druhých 100 mil a 58 mph během posledních 100 mil. Vaším úkolem je nejprve spočítat, jak dlouho celá 300milová cesta trvala. Poté se zamyslete, zda je možné určit průměrnou rychlost Lízy během celé cesty jednoduchým průměrem rychlostí (52+65+58)/3, nebo zda je nutné použít jiný přístup. Pokud je nutné použít jiný přístup určete správnou průměrnou rychlost cesty. Příklad 49 Anketa o nákupech mladých lidí ve městě během letních měsíců roku 2015 ukázala následující: Nakupující ve věku 12 až 14 let podnikli průměrně 8 výletů za nákupy měsíčně a utratili průměrně 14 dolarů za výlet. Nakupující ve věku 15 až 17 let podnikli průměrně 11 výletů měsíčně a utratili průměrně 18 dolarů za výlet. Předpokládejte, že ve městě je 1100 nakupujících ve věku 12 až 14 let a 900 nakupujících ve věku 15 až 17 let. 1. Najděte celkovou částku, kterou měsíčně utratí všichni tito 2000 nakupující ve všech věkových skupinách. 2. Najděte průměrný počet výletů za nákupy na osobu měsíčně pro tyto 2000 nakupujících. 3. Najděte průměrnou částku (na osobu), kterou utratí měsíčně nakupující ve věku 12 až 17 let ve městě. Příklad 50 Následující tabulka ukazuje celkový počet obyvatel a počet úmrtí (v tisících) z důvodu infarktu myokardu pro dvě věkové skupiny (v letech) v zemích A a B v roce 2015. Věk 30 a méně Věk 31 a více A B A B Populace 40 000 25 000 20 000 35 000 Úmrtí na infarkt 1 000 500 2 000 3 000 1. Vypočtěte míru úmrtí z důvodu infarktu myokardu na 1000 obyvatel pro věkovou skupinu 30 let a mladší pro obě země. Která země má nižší míru úmrtí v této věkové skupině? 2. Vypočtěte míry úmrtnosti z důvodu infarktu myokardu na 1000 obyvatel pro věkovou skupinu 31 let a starší pro obě země. Která země má nižší míru úmrtí v této věkové skupině? 3. Vypočtěte míru úmrtí z důvodu infarktu myokardu pro celkovou populaci v zemi A; poté proveďte stejný výpočet pro zemi B. Která země má celkově nižší míru úmrtí? 4. Jak může země s nižší mírou úmrtí ve všech věkových skupinách mít vyšší celkovou míru úmrtí? (Tento jev je známý jako Simpsonův paradox.) Příklad 51 Finální skóre studentů Statistiky pro ekonomy mají neznámé rozdělení s průměrem 70 a směrodatnou odchylkou 10. 1. Najděte k tak, aby alespoň 50 % skóre bylo v mezích k směrodatných odchylek od průměru. 2. Najděte k tak, aby nejvýše 10 % skóre bylo více než k směrodatných odchylek nad průměrem. Příklad 52 Finální skóre studentů Statistiky pro ekonomy mají zvonovité rozdělení s průměrem 70 bodů. 1. Pokud 16 % všech studentů v třídě získalo více než 85 bodů, jaká je směrodatná odchylka skóre? 2. Pokud 95 % skóre leží mezi 60 a 80 body, jaká je směrodatná odchylka? 9 Příklad 53 Místní golfový klub má letní ligy pro muže a ženy. Následující data uvádějí výsledky kola 18 jam golfu pro 17 mužů a 15 žen náhodně vybraných z jejich příslušných lig. Vytvořte krabicový graf pro každou sadu dat a použijte je k diskusi o podobnostech a rozdílech mezi výsledky mužů a žen golfistů. Vypočtěte různé deskriptívni míry, které jste se naučili, pro každý vzorek. Jak se liší? Muži Zeny 87 68 92 79 83 67 71 101 100 87 95 98 81 117 92 112 75 77 102 79 78 85 75 72 107 103 97 90 100 99 94 94 Příklad 54 Odpovězte na následující otázky. 1. Celková váha všech zavazadel naložených na letadlo je 12 372 liber, což představuje průměrnou hmotnost 51.55 liber na kus. Kolik zavazadel je na palubě letadla? 2. Skupina sedmi přátel, právě když obdržela zpět výsledky chemického testu, diskutuje o svých známkách. Šest studentů z týmu sděluje, že obdrželi známky 81, 75, 93, 88, 82 a 85, ale sedmý student nechce sdělit, jakou známku obdržel. Po nějakém přemýšlení oznámí, že skupina dosáhla průměrné známky 81. Jaká je jeho známka? Příklad 55 Následující data uvádějí váhy (v librách) náhodného vzorku 44 studentů vysokých škol, kde F označuje ženy a M označuje muže. Vaším úkolem je vypočítat průměr, medián a směrodatnou odchylku pro váhy všech studentů, pouze mužů a pouze žen. Poté posuďte, která z těchto měr - průměr nebo medián - je informativnější jako ukazatel středu. Na závěr napište stručnou poznámku, která porovná průměr, medián a směrodatnou odchylku pro všechny studenty, pouze muže a pouze ženy. 123 F 195 M 189 M 175 M 128 F 159 M 182 M 174 M 138 M 108 F 193 M 102 F 115 F 193 M 204 M 123 F 179 M 114 F 125 F 99 F 119 F 179 M 133 F 161 M 148 F 147 M 115 F 162 M 147 F 108 F 168 M 155 F 180 M 128 F 123 F 202 M 146 F 179 M 164 F 174 M 183 M 116 F 110 F 132 M Příklad 56 Následující stem-and-leaf diagram ukazuje vzdálenosti (v tisících mil), které během posledního roku ujeli řidiči ve vzorku z velkého města. 6 9 8 5 1 6 1 0 5 1. Vypočtěte průměr, medián a modus pro data o ujetých vzdálenostech. 2. Vypočtěte rozpětí, rozptyl a směrodatnou odchylku. 3. Vypočtěte první a třetí kvartil. 4. Vypočtěte mezikvartilové rozpětí. Popište vlastnosti mezikvartilového rozpětí. Kdy by bylo vhodnější použít mezikvartilový rozpětí než směrodatnou odchylku při měření variability? 10 Příklad 57 I když standardní pracovní týden je 40 hodin, mnoho lidí pracuje mnohem více než 40 hodin týdně. Následující data uvádějí počet hodin odpracovaných minulý týden 50 lidmi. 40.5 41.3 41.4 41.5 42.0 42.2 42.4 42.4 42.6 43.3 43.7 43.9 45.0 45.0 45.2 45.8 45.9 46.2 47.2 47.5 47.8 48.2 48.3 48.8 49.0 49.2 49.9 50.1 50.6 50.6 50.8 51.5 51.5 52.3 52.3 52.6 52.7 52.7 53.4 53.9 54.4 54.8 55.0 55.4 55.4 55.4 56.2 56.3 57.8 58.7 1. Pro tento datový soubor jsou průměr vzorku a směrodatná odchylka vzorku 49.012 a 5.080. Pomocí Chebysheho věty spočtěte intervaly, které obsahují alespoň 75%, 88.89% a 93.75% dat. 2. Určete skutečné procentuální hodnoty daných dat, které spadají do každého z intervalů spočítaných v předchozí části Vypočítejte také procento dat, která spadají do jednoho směrodatného odchylky od průměru. 3. Myslíte si, že dolní hodnoty poskytnuté Chebysheho větou v první části jsou k něčemu užitečné? Vysvětlete svou odpověď. 4. Představte si, že jednotlivec s prvním číslem (54.4) ve pátém řádku dat je workoholik, který vlastně minulý týden pracoval 84.4 hodin, ne 54.4 hodin. S touto změnou jsou nyní shrnující statistiky x = 49.61 a s = 7.10. Přepočtěte intervaly. Změnily se procenta hodně nebo málo? 5. Kolik směrodatných odchylek nad průměrem byste museli jít, abyste zahrnuli všech 50 datových hodnot? Pomocí Chebyshevovy věty spočtěte dolní mez pro procento dat, která by měla spadnout do intervalu. 11