Editace dat a příprava dat
Příprava dat před statistickou analýzou je klíčová pro zajištění přesnosti, spolehlivosti a relevance výsledků analýzy. Data mohou například obsahovat chyby, duplicity nebo nesprávné hodnoty, které mohou zkreslit výsledky analýzy. Může se také stát, že vám budou nějaká data chybět.
Chybějící hodnoty mohou ovlivnit statistické výpočty. Příprava dat proto zahrnuje identifikaci a ošetření těchto hodnot. Můžete se také setkat s extrémínimi hodnotami (outliery), které mohou
významně ovlivnit statistické výsledky. Je důležité je identifikovat a rozhodnout, zda by měly být odstraněny nebo zvlášť analyzovány. Tento proces zahrnuje několik důležitých kroků, které zajišťují, že data jsou vhodná pro analýzu a že získané závěry budou platné a užitečné.
V první opět spíše technické kapitole se naučíme upravovat názvy proměnných a filtrovat data. Ze znalostního úhlu pohledu bude důležitá práce s odlehlými hodnotami. Nad rámec potřebných znalostí a dovedností je pak vytváření nových proměnných. V druhé kapitole se zaměříme na přípravu dat ve formě čištění a kontrolu odlehlých hodnot.