STATISTIKA PRO EKONOMY Renáta Bednárová ZÁKLADNÍ STATISTICKÉ POJMY  Statistika  Statistický soubor  Statistická jednotky  Statistický znak STATISTIKA  Vědní obor, který se zabývá hromadnými jevy  Hromadné jevy jsou přírodní, společenské či jiné jevy sledované ne jednotlivě, ale ve velkém počtu případů.  Popisná statistika – ryzí základy STATISTICKÝ SOUBOR  Množina všech objektů statistického pozorování shromážděných na základě toho, zda mají jisté společné vlastnosti (též. datový soubor). STATISTICKÁ JEDNOTKA  Prvky množiny (statistického souboru).  Značíme n STATISTICKÝ ZNAK  Společná vlastnost prvků statistického souboru, jejíž proměnlivost je předmětem statistického zkoumání.  Značí se x  Jednotlivé údaje statistického znaku se nazývají hodnoty znaku  Dělíme na kvalitativní a kvantitativní SCHÉMA ZÁKLADNÍCH STATISTICKÝCH POJMŮ ROZDĚLENÍ ČETNOSTÍ  Absolutní četnost  Relativní četnost  Skupinové rozdělení četnosti  Formy grafického znázornění rozdělení četností ABSOLUTNÍ ČETNOST  Absolutní četností hodnoty xj znaku x rozumíme počet nj statistických jednotek jistého statistického souboru, které mají stejnou hodnotu xj znaku x.  Součet všech četností je rozsah statistického souboru. RELATIVNÍ ČETNOST  Relativní četnost hodnoty xj je rovna podílu absolutní četnosti xj a rozsahu n celého statistického souboru.  Označujeme ji symbolem vj  Součet všech relativních četností všech různých hodnot statistického znaku je roven jedné  RČ vyjadřujeme v praxi velice často v procentech. TABULKA ROZDĚLENÍ ČETNOSTÍ A RELATIVNÍCH ČETNOSTÍ  Pro přehledné znázornění absolutních a relativních četností hodnot znaků statistického souboru se využívají tabulky. Takovým tabulkám se říká tabulky rozdělení četností a relativních četností. Obecně tato tabulka může při zavedeném označení vypadat následovně: TABULKA ROZDĚLENÍ ČETNOSTÍ A RELATIVNÍCH ČETNOSTÍ PŘÍKLAD 1 U domácností byl zjišťován počet obytných místností s možnými výsledky: 1; 2; 3; 4; 5+ (5+ znamená 5 a více místností). Při tomto zjišťování bylo náhodné vybráno 25 respondentů s následujícími výsledky: 1,3,2,5+,2,2,3,5+,4,2,1,3,3,3,5+,2,3,3,4,4,2,3,4 ,2,3. Vytvořte tabulku rozdělení četností a relativních četností. SKUPINOVÉ ROZDĚLENÍ ČETNOSTÍ  POČET TŘÍDICÍCH INTERVALŮ V ZÁVISLOSTI NA ROZSAHU SOUBORU URČENÝCH STURGESOVÝM PRAVIDLEM PŘÍKLAD 2 U obcí Moravskoslezského kraje s počtem obyvatel větším než tisíc a menším než deset tisíc byl zjištěn počet narozených dětí za rok 2008. Výsledky jsou následující: 28; 28; 23; 51; 21; 25; 9; 6; 30; 18; 16; 15; 65; 14; 9; 40; 16; 23; 12; 21; 10; 10; 40; 38; 10;21; 31; 48; 19; 17; 16; 16; 11; 11; 27; 19; 20; 46: Pomocí Sturgesova pravidla určete počet třídicích intervalů, vytvořte tabulku skupinového rozdělení četností a relativních četností. Závěrem se pokuste získané výsledky interpretovat. FORMY GRAFICKÉHO ZNÁZORNĚNÍ ROZDĚLENÍ ČETNOSTÍ  V případě kvantitativního znaku se pro grafické znázornění četností používá především polygon četností nebo histogram  Rozdělení četností hodnost kvalitativního znaku se graficky znázorňuje pomocí kruhového diagramu, kde různým hodnotám xj statistického znaku odpovídají kruhové výseče, jejichž obsahy jsou přímo úměrné relativním četnostem vj v procentech. POLYGON ČETNOSTÍ  Jinak zvaný spojnicový graf  Propojení všech bodů v pravoúhlé soustavě, kde osa x vyjadřuje hodnoty znaků a osa y znázorňuje odpovídající četnost POLYGON ČETNOSTÍ HISTOGRAM ČETNOSTÍ  Jinak zvaný sloupkový diagram  Osy stejně pojmenované jako u polygonu četností  Používá se především pro skupinové rozdělení četností, je tvořen zpravidla rovnoběžníky, jejich základny mají délku zvolených intervalů a jejich výšky mají velikost příslušných třídních četností HISTOGRAM ČETNOSTÍ KRUHOVÝ DIAGRAM CHARAKTERISTIKY ZNAKU  Typy statistických znaků podle stupně kvantifikace  Aritmetický průměr  Harmonický průměr  Modus  Medián  Kvantily  Rozptyl  Směrodatná odchylka  Variační koeficient  Mezikvartilová odchylka TYPY STATISTICKÝCH ZNAKŮ PODLE STUPNĚ KVANTIFIKACE  Kvantitativní a kvalitativní  Mezi kvalitativní znaky řadíme nominální a ordinální znaky  Kvantitativní znaky naopak rozlišujeme intervalové a poměrové znaky NOMINÁLNÍ ZNAKY  Dovolují nám konstatovat pouze to, zda se nějaká hodnota statistického znaku rovná nějaké další hodnotě znaku jiné statistické jednotky, či nikoliv. Hodnotami mohou být slovní pojmenování nebo číselné kódy. ORDINÁLNÍ ZNAKY  jsou na škále znaků o stupínek výše než znaky nominální. Proto umožňují kromě posouzení rovnosti dvou hodnot znaku statistických jednotek také posouzení, zda je některá hodnota znaku větší nebo menší než hodnota znaku jiné statistické jednotky. To znamená, že hodnoty statistického znaku lze uspořádat do pořadí. U tohoto typu znaku nemá smysl se ptát, o kolik je daná hodnota znaku větší; smysl má pouze zeptat se, zda je větší nebo menší, případně zda se hodnoty rovnají. Ordinálními znaky mohou být čísla, text nebo i datum. INTERVALOVÉ ZNAKY  Jsou znovu o stupínek výše a lze s nimi provádět všechny operace, které jsme prováděli u znaků nominálních a ordinálních. Tyto znaky již patří do skupiny znaků kvantitativních. Intervalové znaky nám navíc umožňují interpretovat rozdíly mezi jednotlivými intervaly. To znamená, že rozdíl mezi hodnotami jedna a tři je stejný jako rozdíl mezi hodnotami pět a sedm. Intervalové znaky nám dovolují vypočítat, o kolik je jedna hodnota statistického znaku větší než druhá. POMĚROVÉ ZNAKY  jsou z těchto kategorií nejvýše, takže všechno, co platilo u znaků předchozích typů, platí i zde. Navíc u tohoto typu znaků platí, že stejný poměr mezi jednou dvojicí hodnot a druhou dvojicí hodnot znaku znamená i stejný podíl v rozpětí dané vlastnosti. Jinak řečeno má smysl uvažovat fakt, že hodnota je několikrát větší než jiná hodnota. ALTERNATIVNÍ ZNAKY  Alternativními znaky rozumíme znaky, které mohou nabývat pouze dvou hodnot a žádná další hodnota statistického znaku není možná. Do této kategorie bychom zařadili znaky, které vyjadřují přítomnost či absenci určitého jevu (přítomnost = 1, absence = 0) nebo například znak rozlišující pohlaví zkoumaných jedinců. CHARAKTERISTIKA POLOHY  Charakteristikami polohy (zvané také úrovně či střední hodnoty) hodnot znaku rozumíme čísla, která nám podávají určitou informaci o "střední hodnotě" sledovaného znaku. Patří mezi ně zejména aritmetický, geometrický a harmonický průměr, modus, medián a kvantily. Charakteristiky polohy se musíme naučit také vhodně volit. Kdybychom měli k dispozici statistický soubor a měli bychom ho jedním číslem charakterizovat, musíme obezřetně zvolit správnou charakteristiku, aby nedošlo k nesprávné představě o daném statistickém souboru ARITMETICKÝ PRŮMĚR PŘÍKLAD 3 Na základě statistických hlášení o narození a úmrtí a souborů stěhování zpracovává Český statistický úřad v návaznosti na výsledky posledního sčítání lidu každoroční bilanci počtu obyvatel České republiky za všechny obce. My máme nyní k dispozici počet obyvatel v jednotlivých krajích (pro zlepšení práce s daty byly počty obyvatel zaokrouhleny a jsou uváděny v tisících): Hlavní město Praha 1 233, Středočeský 1 230, Jihočeský 636, Plzeňský 569, Karlovarský 308, Ústecký 835, Liberecký 437, Královéhradecký 554, Pardubický 515, Vysočina 515, Jihomoravský 1147, Olomoucký 642, Zlínský 591, Moravskoslezský 1 250. Vypočtěte aritmetický průměr počtu obyvatel žijících v jednom kraji České republiky. HARMONICKÝ PRŮMĚR PŘÍKLAD 4  Auto jede rychlostí 100 km/h z bodu A do bodu B a nazpátek z bodu B do A rychlostí 160 km/h. Jaká je "korektní" průměrná rychlost, za jakou řidič auta urazil celou vzdálenost? GEOMETRICKÝ PRŮMĚR PŘÍKLAD 5 Farmář má pole pro pěstování svých plodin obdélníkového tvaru z rozměry 9 m a 4 m. Nyní však farmář z nějakého důvodu potřebuje, aby mělo pole čtvercový tvar. Jaké jsou rozměry tohoto čtverce, jestliže má plocha zůstat stejná? POUŽITÁ LITERATURA  FIEDOR, David. Bakalářská práce - Statistika pro střední školy, Brno. Masarykova univerzita 2010.  BUDÍKOVÁ, Marie; MIKOLÁŠ, Štěpán; OSECKÝ, Pavel. Popisná statistika. Brno: Masarykova univerzita v Brně, 2001.