1 Správnost měření Typický příklad experimentu, zatíženého systematickou odchylkou, je měření odporu metodou přímou podle obr. L1a . Je zřejmé, že ani při sebevětší přesnosti přístrojů ani při libovolném opakování měření, neobdržíme správnou hodnotu napětí, kterou potřebujeme pro výpočet odporu R podle Ohmova zákona. Vždy naměříme více o napětí na ampérmetru. Ten totiž není ideální a jeho vnitřní odpor RA tedy není nulový. Poměr naměřeného napětí a proudu bude roven součtu R+RA. Kdybychom vnitřní odpor RA znali, snadno bychom hodnotu každého neznámeho odporu R vypočítali. Na odstranění systematické chyby stačí určit v našem případě jeden parametr - RA. Ten můžeme nalézt experimentálně, když uskutečníme navíc minimálně jedno měření, při kterém bude na místě neznámého odporu rezistor známé hodnoty (nejlépe přesný odpor - normál). Zobecníme-li tento postup, je v první řadě nutné analyzovat experiment a umět odhadnout příčiny systematické chyby, její velikost a počet parametrů, jimiž ji lze popsat. Tyto parametry zpravidla určujeme kalibrací, proměřením jednoho nebo několika známých vzorků (standardů). Minimální počet kalibračních měření je dán počtem příslušných parametrů. Pomocí nich následně provádíme korekci měření na vzorcích neznámých. Výsledná systematická chyba přitom bude dána přesností kalibrace. Proto provedení více kalibračních měření, než je minimum, není na závadu. Kalibraci tedy definujeme jako experiment, zvláštní v tom, že měříme známý vzorek, abychom získali informace o metodě. V rámci řešení laboratorních úloh budeme provádět řadu kalibrací. Například při určování měrného tepla látek spočívá systematická chyba v tom, že určité tepelné energie je potřeba k zahřátí samotné vnitřní nádoby kalorimetru, míchadla a teploměru, i když jsou jinak dokonale izolovány od okolí. Tuto odchylku stačí kvantifikovat jedním parametrem - tepelnou kapacitou kalorimetru a pro její určení stačí provést navíc jediné měření. Při něm se v přístroji smísí dvě známá množství látky o známém měrném teple a různé teplotě. Častější jsou situace, kdy je nutno určit kalibračních parametrů více. K nejobtížnější situaci dochází, není-li počet parametrů (stupňů volnosti) problému znám. Zde je nutno proměřit větší množství kalibračních vzorků a použít postupů faktorové analýzy. V jednodušších případech je možné odhadnout kalibrační závislost z grafu nebo přesněji použitím regresních metod. Například u kalibrace tónového generátoru nebo kalibrace galvanometru docházíme k lineárním závislostem. U složitějších přístrojů obvykle provádí kalibraci výrobce a uvádí příslušné parametry a grafy v dokumentaci. 2 Správný odhad velikosti systematické chyby nám umožní posoudit, zda je významná či nikoli. Kritériem je, zda je možné ji zanedbat vzhledem k přesnosti měření. V našem původním příkladě to předpokládá přibližnou znalost hledaného odporu R, odporu ampérmetru RA a třídy přesnosti použitých přístrojů. Třídou přesnosti δ se rozumí podíl maximální odchylky ∆max přístroje k maximálnímu rozsahu stupnice Xmax 1. Udává se obvykle v procentech, přičemž symbol % se neuvádí. Naměříme-li na takovém přístroji hodnotu X, je její maximální relativní odchylka 2. Tu musíme minimalizovat, proto je nutné provádět měření na takovém rozsahu, aby výchylka X byla co nejblíže hornímu okraji stupnice nebo u digitálních přístrojů maximální hodnotě příslušného rozsahu. Používáme-li například přístrojů třídy přesnosti 1.5, je zřejmé, že pro RA R/50, bude přístroj schopen napětí na ampérmetru zaregistrovat a jeho údaj bude tedy nesprávný. Například u běžného ampérmetru na rozsahu 20 mA, může být RA až několik desítek ohmů. To je od nuly dosti daleko. Přesto odpory o velikosti řádově několik tisíc ohmů celkem přesně změříme. Informace o významnosti systematické chyby je též možné získat srovnáním s výsledky jiné měřící metody. V případě měření odporů metodou přímou můžeme například použít zapojení podle obr. L2 . Zde se ovšem dopouštíme jiné systematické chyby, tentokrát při měření proudu. Je-li i v tomto zapojení systematická chyba signifikantní, získáme každopádně lepší představu o skutečné hodnotě odporu díky faktu, že první zapojení poskytuje vždy horní odhad R, zatímco druhé zapojení odhad spodní. Je ale nutné zdůraznit, a ilustruje to i náš příklad s terčem, že zde se jedná o výjimečně příznivý případ, kdy obě "pušky" zanáší přesně na opačnou stranu. Ovšem nesymetricky! Obecně není zaručeno, že správná hodnota leží mezi hodnotami naměřenými různými metodami a ani jejich aritmetický průměr nemusí být ke správné hodnotě blíže než některá měření a má proto smysl pouze orientační. Je-li například jedno měření téměř správné ovlivní ostatní nesprávná měření průměr nevhodně. Příkladem je měření velkého odporu v zapojeních obr. L1 a L2. Typickým příkladem, kdy aritmetický průměr nemá smysl, je měření specifického náboje . Zde jsou jednotlivé hodnoty získány za různých podmínek a jsou tedy nutně ovlivněny systematickými vlivy například nehomogenitou magnetického pole. Podobně je nutné velmi opatrně iterpretovat průměr z několika postupů například u měření hustoty kapalin, ohniskové vzdálenosti tenkých čoček nebo odporu rezistorů. Výsledek jedné metody může být zcela odlehlý od ostatních a přesto správný. 3 Přesnost měření Náhodné chyby jsou způsobeny velkým množstvím vlivů, které nejsme schopni přesně popsat. a neznáme jejich příčinu. Důležité ale je, že obvykle můžeme předpokládat, že mají určité rozdělení. Často mají náhodné chyby takzvané rozdělení normální nebo-li Gaussovo. Je to důsledkem platnosti centrálního limitního teorému statistiky, který říká, že rozdělení systému, majícího velký počet stupňů volnosti, které mohou mít třeba i jiné než normální rozložení, konverguje k rozložení normálnímu. Vliv náhodných chyb lze principiálně ovlivnit opakováním počtu měření a statistika poskytuje metody, jak tyto chyby kvantifikovat. Lze říci, že statistika nám umožňuje odhadnout na základě relativně malého počtu měření, k jakým výsledkům bychom došli při počtu velkém (nekonečném). Její výpověď má tedy charakter pravděpodobnosti a s roustoucím počtem měření se upřesňuje . Příkladem je známá situace, kdy se na základě průběžných volebních výsledků v několika obvodech provádí odhad konečných výsledků voleb. V další poměrně obtížné části se snažíme vysvětlit, na jakých principech statistiké metody pracují. Je to v rozsahu, který umožní kvalifikovaně používat některé počítačové programy nebo kalkulátory, nabízející statistické funkce. Čtenářům doporučujeme ji podrobně prostudovat. K řadě definic a pojmům je možné se vrátit po pochopení ilustrativního příkladu na konci. Základy statistického zpracování výsledků Nejpropracovanější výsledky poskytuje statistika právě pro náhodné proměnné, které mají normální rozložení. Začněme však obecnými pojmy. Rozložení f(x) náhodné proměnnné x bychom teoreticky získali, kdybychom proměnnou nekonečně krát změřili a vynesli křivku četnosti. Tedy závislost, jak často se proměnná vyskytuje v nekonečně malém okolí příslušných hodnot x bychom znormalizovali (vydělili celkovým počtem měřní), aby 3. O proměnné x předpokládáme, že může nabývat jakékoli reálné hodnoty. Rozdělení f(x) potom vyjadřuje skutečnost, že určité hodnoty x se vyskytuji častěji než jiné. Snadno se to ilustruje na proměnných nabývajících diskrétních hodnot. Házejme dvěma kostkami a a» je naše proměnná součtem hodnot, které padly. Proměnná může nabývat všech hodnot v intervalu <2,12>, ale součtu 2 bude například dosaženo jen při jedné z 36 možných konfigurací(1+1), zatímco třeba součtu 6 při pěti (1+5,2+4,3+3,4+2,5+1). f(6) bude tedy pětkrát větší než f(1). 4 Hodnotu f(x) lze chápat jako pravděpodobnost výskytu náhodné proměnné v intervalu . Potom pravděpodobnost p výskytu proměnné x mezi hodnotami x1 a x2 je 4. Pro každé rozdělení existuje jednoznačná kumulativní neboli distribuční funkce F(x) 5. Jejím oborem hodnot je interval <0,1>. Má význam pravděpodobnosti, že náhodná proměnná dosáhne hodnoty menší nebo rovné x. Zjevně platí obdoba rovnice(4): p(x1 lze vyjádřit jako 6. Speciál. případem jsou nejdůležitější parametry každého rozdělení, jeho střední hodnota µ 7 a dále takzvané obecné momenty αr a centrální momenty µr 8. Není-li funkce f(x) normovaná, je nutné vztahy pro výpočet momentů dělit výrazem . Nejdůležitější z momentů je první obecný moment α1 = µ a druhý centrální moment µ2. V podrobnějších pracích se dokazuje, že každé rozdělení lze vyjádřit jako rozvoj svých momentů. Ten může být základem pro odvození vlastností rozdělení veličin, které jsou speciálními funkcemi náhodných proměnných. Jsou-li například x a y náhodné proměnné a a, b, c konstanty, platí 9 a jsou-li x a y navíc nezávislé, je 10. 6 Dále se budeme soustředit již jen na náhodné proměnné, které mají normální rozložení definované vztahem 11. Lze ukázat, že rozdělení G splňuje normalizační podmínku (3), µ je jeho střední hodnota (tradiční označení je ve shodě s 7) a takzvaná variance σ2 je jeho druhým centrálním momentem. Přitom její druhá odmocnina, standardní odchylka σ , má význam pološířky rozdělení (tedy jeho šířky v poloviční výšce). Na obrazku jsou rozdělení G(µ=0, σ ;x) a jim odpovídající distribuční funkce F(0,σ ;x) pro σ= 2 a 4. Mohou například odpovídat rozdělením náhodných chyb dvou různých měření. Jsou patrny nejdůležitější vlastnosti: 1) střední hodnota je 0 2) rozdělení jsou symetrická 3) pravděpodobnost velkých chyb se asymptoticky blíží 0 4) pološířka σ může charakterizovat přesnost měření Chápeme-li rozdělení jako pravděpodobnost, je zřejmé, proč je rozdělení odpovídající menšímu σ přesnější. Menší chyby jsou u něj totiž více pravděpodobné a větší méně. Pravděpodobnost, že náhodná proměnná x bude v intervalu µ±σ je 12. Podobně pravděpodobnost, že hodnota měření bude v intervalu µ±2σ a µ±3σ je 0.9554 resp. 0.9974. Parametry µ a σ plně charakterizují normální rozdělení náhodné veličiny x. Jsou to také veškeré informace, potřebné pro použití veličiny v dalších výpočtech. K jejich přesnému určení by ovšem bylo nutné uskutečnit nekonečný počet měření. Při konkrétním n-krát opakovaném měření provádíme tzv. výběr rozsahu n z náhodného rozložení (x1, x2 ... xn). Jedním z hlavních cílů teorie pravděpodobnosti je aproximovat parametry µ a σ rozdělení pomocí takzvaných statistik, tedy parametrů získaných z výběru. Lze ukázat, že nejlepším odhadem střední hodnoty µ rozdělení je výběrový průměr 13. a nejlepším odhadem variance σ2 je výběrový rozptyl výběrový rozptyl 7 14. Jeho odmocnina s se nazývá střední chyba jednoho měření. Kdybychom mohli měření opakovat nekonečně krát, znali bychom přesně rozdělení a z těchto vztahů (pro nekonečné n) bychom získali přesné hodnoty výrazů µ a σ. Pro konečný počet měření nám statistika umoľňuje nalezt intervaly, kde skutečné hodnoty µ a σ leľí na určité hladině věrohodnosti.. To se prakticky provádí pomocí výběrových rozdělení Studentova a Pearsonova. Platí totiľ, ľe veličina 15 má takzvané Studentovo rozdělení a veličina 16 rozdělení Pearsonovo neboli χ2 (chí kvadrát). Přesná vyjádření těchto výběrových rozdělení je moľné nalézt v podrobnějąí literatuře, ale pro praktické pouľití je není nutno podrobně znát. I tato rozdělení jsou nyní dostupná v řadě matematických programů. Zde ukáľeme na příkladu (simulovaného) měření jejich pouľití. Pokusíme se take ukázat, v jakém smyslu je vícekrát opakované měření přesnějąí. Příklad zpracování výsledků Předpokládejme, že měření má normální rozložení G(20,3;x). Vygenerujme dva výběry o rozsahu 17 a 1700. Ty pro nás reprezentují dvě sady opakovaných měření. Nyní se snažme učinit odhad µ a σ na hladině věrohodnosti 95% a 99%. Ukážeme si podrobně postup výpočtu pro rozsah n=17 a hladinu věrohodnosti 95%. Hodnoty náhodné proměnné jsou v tabulce I. Tabulka I. 19.5410 19.0631 20.4183 22.7683 18.1377 20.2179 24.0228 21.2487 15.6172 20.2601 17.5074 22.3542 22.9094 19.7104 20.5752 19.7533 25.5580 8 Podle rovnic 13 a 14 vypočteme výběrové parametry: aritmetický průměr a výběrový rozptyl . V dalším kroku určíme interval, v němž se vyskytuje střední hodnota rozdělení µ na hladině věrohodnosti 95%. Podle rovnice 15 k tomu potřebujeme znát oblast Studentova rozdělení pro počet stupňů volnosti m=n-1=16, která má obsah (integrál) 0.95. Ta je ohraničena zdola kvantilem t0.025 a shora kvantilem t0.975, jak je patrné z obr. 3 . Z tabulek nebo pomocí matematického programu zjistíme, že hodnoty kvantilů jsou t0.025 = - 2.12 a t0 .975 = +2.12 (Studentovo rozdělení je symetrické). Vyřešíme rovnici a přes úpravu 17 dojdeme k nerovnosti 17.72 < µ < 20.94. Protože se jedná o simulovaná data a my víme, že µ = 20, můžeme ověřit, že v intervalu, který jsme vypočítali, µ skutečně leží. Kdybychom ale tuto simulaci mnohokrát opakovali, zjistili bychom, že v 5% případů µ v daném intervalu ležet nebude. V tom spočívá význam hladiny věrohodnosti. Obdobně postupujeme při odhadu intervalu pro varianci σ2 rozložení podle i rovnice 16. Nyní používáme rozložení Pearsonovo pro m=n-1=16 podle obr. 4. Opět najdeme příslušné kvantily ξ0.025 = 6.91 a ξ0.975 = 28.845. Pomocí hodnoty s vypočteme součet kvadrátů odchylek 9 a řešíme rovnici . Po úpravě obdržíme nerovnost 3.31 < σ 2 < 13.83. Opět můžeme ověřit, že hodnota použitá při simulaci σ2 = 9, ve vypočteném intervalu leží. Obdobně by tomu bylo v 95 % případů z velkého počtu simulací. Pro hladinu věrohodnosti 99 % použijeme stejná rozložení, ale určíme kvantily t0.005 , t0.995 respektive ξ0.005, ξ0.995 . Pro zpracování druhé sady dat o rozsahu 1700 je nutné použít rozdělení pro m = 1699. Jinak je postup obdobný. Výsledky: rozsah věrohodnost 95% 99% pro 17: µ <19.31, 21.83> <18.84, 22.30> σ <1.82, 3.72> <1.67, 4.31> 1700. µ <19.85, 20.13> <19.80, 20.17> σ <2.87, 3.10> <2.84, 3.14> Z tabulky II, kde je odhad µ a σ na hladině věrohodnosti 95 % a 99 % pro výběry obou rozsahů, jsou patrné další důležité závěry: 1) Když pro výběr určitého rozsahu požadujeme vyšší věrohodnost, vede to k rozšíření intervalů, v nichž se parametry mohou vyskytovat. 2) Zvýšení rozsahu výběru vede naopak ke zúžení těchto intervalů na stejné hladině věrohodnosti. Z uvedeneho příkladu vyplývá, že pro odhad střední hodnoty rozdělení µ pomocí parametrů výběru o rozsahu n je významná tzv. standardní odchylka průměru nebo střední chyba aritmetického průměru sx 18, protože je rovna hodnotě koeficientu u kvantilů na obou stranách nerovnice 17. Tuto hodnotu tedy používáme k vyjádření chyby měření a veličinu získanou zpracováním výběru o rozsahu n zapisujeme jako 10 19. Pro dostatečně velký rozsah výběru n leží v 68.3 % případů střední hodnota µ v tomto intervalu. Plyne to z faktu, že kvantil t0.1585≅ -1 a ze symetrie Studentova rozdělení. Uvědomte si též souvislost s rovnicí 12. Odchylka vyjádřená jako sx má rozměr a jednotku měřené veličiny, a proto se nazývá chybou absolutní. Vztáhne-li se chyba k měřené hodnotě, lze ji vyjádřit pomocí bezrozměrné veličiny jako chybu relativní 20. Pomocí této chyby je možné navzájem srovnávat měření různých veličin. Obecně platí, že měření s menší relativní chybou je přesnější. Tím je například odůvodněno známé tvrzení, že vážení je nejpřesnější měření. V našem příkladě vychází sn = 0.59 a δx = 0.029. U méně přesných měření, kde δx > 1 % uvádíme absolutní odchylku na jednu platnou číslici. Průměrnou hodnotu na tomto řádu zaokrouhlujeme. Výsledek našeho příkladu, kde je relativní chyba přibližně 3 %, bychom tedy zapsali x = 20.6 ± 0.6. Absolutní a relativní vyjádření chyby má význam při odhadu odchylek veličin vypočítávaných pomocí veličin naměřených. Předpokládejme, že náhodné veličiny x a y mají normální rozdělení, jsou na sobě nezávislé a platí 21. Potom 22. To plyne z vlastností normálního rozložení, kde a skutečnosti, že s je nejlepším odhadem parametru σ. Je-li veličina z součinem nebo podílem nezávislých veličin x a y, tedy 23, platí 24. 11 Oba vztahy je samozřejmě možné rozšířit na libovolný počet sčítanců, resp. činitelů. Z rovnic 21 a 22 je také patrný problém metod, kde výsledek je rozdílem měřených veličin. Kriteriem přesnosti metody je totiž relativní chyba 25. Jsou-li si hodnoty veličin x a y blízké, je jmenovatel malý a k dosažení uspokojivé přesnosti z je nutné změřit veličiny x a y s mnohem vyšší přesností, než kdyby se používaly samy o sobě. Vyskytují-li se v součinu veličiny s vyšší mocninou, tedy například 26, musí se využít obecnější vlastnosti rozptylu pro funkci z náhodných veličin xi, kteté mají rozptyl σi a normální rozložení 27. Po výpočtu příslušných derivací platí 28. Odchylka veličiny s k-tou mocninou se tedy uplatní k-násobně a ne - násobně, jak by odpovídalo prosté aplikaci rovnice 24. Důvodem je skutečnost, že veličina x je sama se sebou korelována.