Dataskepticismus NassimTalebredux Mám data. Data samotná jsou v pořádku. Data interpretuji do formálně správné vizualizace. Něco je špatně, lidé se smějí. Proč? ? Otázky Mám opravdu kompletní data? Nepřehlížím něco? Nezapomněl jsem na nějaký skrytý vliv? Nedělám nějakou naivní chybu? 1 ceteris paribus „Ostatní stejné“ — zafixujeme všechny veličiny kromě těch, které sledujeme. Vynikající v laboratorních podmínkách. V reálném světě princip ceteris paribus prakticky nefunguje. Reálný svět je totiž komplexní systém. subjektivní poznání známé známé data známé neznámé hypotéza neznámé známé lidé neznají sami sebe neznámé neznámé !!! V datech nemusí být všechno. Vždy si uvědomte, že existují věci, jevy, skutečnosti, o kterých nevíte, že je nevíte. Mohou být (a často jsou) ve skutečnosti důležitější, než to co víte. Neznámé neznámé může být subjektivní. To, že nevíme, že něco nevíme, nutně neznamená, že to neví někdo jiný. -> America’s epidemic of unnecesary care Příklad 2 predikce Nesnažte se předpovídat (extrapolovat) na základě historických dat. Techniky na předpovídání existují, ale vyžadují úplně jiný přístup. -> Superforcasting „Nejužitečnější problém“ Abychom poznali jaké rozložení data mají, musíme mít dostatek datových bodů. Abychom poznali, kolik je dostatek datových bodů, musíme znát rozložení dat. konfirmační zkreslení -> Confirmation bias klam narativity Klam narativity se týká naší omezené schopnosti podívat se na sekvenci faktů a nesplétat přitom ihned nějaké vysvětlení nebo — což je víceméně totéž — je nevnímat jako logický řetězec se vztahem příčiny a následku. Vysvětlení fakta stmeluje. Lépe se však pamatuje; dávají větší smysl. Taková náchylnost nám však může uškodit ve chvíli, kdy v nás vytváří dojem, že jsme daným faktům porozuměli. — Nassim Taleb, Černá labuť korelace × kauzalita -> Spurious Correlations Vědci zjistili, že… problém přeživších v| v| v| v| In a study performed in 1987 it was reported that cats who fall from less than six storeys, and are still alive, have greater injuries than cats who fall from higher than six storeys. It has been proposed that this might happen because cats reach terminal velocity after righting themselves at about five storeys, and after this point they relax, leading to less severe injuries in cats who have fallen from six or more storeys. Another possible explanation for this phenomenon would be survivorship bias. Cats that die in falls are less likely to be brought to a veterinarian than injured cats, and thus many of the cats killed in falls from higher buildings are not reported in studies of the subject. — Wikipedia: Survivorship bias Ale Diagoras, zvaný „neznaboh”, když přišel na Samothraku a jakýsi přitel se ho tázal, nepoznává-li on, který přičitá bohům nezájem o věci lidské, z tolika obrazů, kolik lidí uniklo slibem prudké bouři a šťastně dorazilo do přistavu, odpověděl: ,,To se tak dělá, nikde však nejsou namalováni, kteří ztroskotali a na moří zahynuli.” — Cicero, O přirozenosti bohů big dada -> Big data: are we making a big mistake? Co si odnést Nezapomeňte na to, že existuje svět i mimo vaše data. Náhoda může hrát mnohem větší roli než si myslíte. Kam dál? Nassim Nicholas Taleb — Zrádná nahodilost — Černá labuť — Antifragilita