KALIBRAČNÍ KŘIVKA:POSTUP ZPRACOVÁNÍ DAT POMOCÍ LINEÁRNÍ REGRESE 300524 /jp 1/ ZOBRAZENÍ DAT Vstupem je tabulka X-Y dat: Nezávislá proměnná (X) může být: koncentrace standardu (mg/l, ug/ml nebo mol/l), objem standardu (uL, ml), miligramy nebo milimoly standardu atd. Počet X (různých koncentračních úrovní) je typicky 5-7. Jelikož experimenty by měly být vždy opakovány (aspoň 3x), první otázkou je: kolik bodů se objeví v grafu kalibrační křivky? Odpověď je: v grafu by se měla objevit všechna naměřená data (N=24). Neprůměrujeme hodnoty naměřené při stejných koncentracích (řádky)! Takový přístup vede k zamaskování odlehlých bodů a také ke zmenšení stupňů volnosti! Pokud máme opakovaná měření v řádcích, je nejjednodušší přepsat data do dvou sloupců (kvůli Excelu) a vytvořit x-y graf. Grafické zobrazení dat pomůže odhalit zjevně odlehlé body (outliers, často hrubé chyby), které by měly být předem vyloučeny. Pozn.: v tomto kroku také vyplyne silná korelace mezi Y a X, což není překvapivé: od počátku jsme totiž zamýšleli vytvořit kalibrační křivku, která těsnou závislost přepokládá! Tuto závislost si tudíž není nutno ověřovat např. Spearmanovým testem pořadové korelace. 2/ PRVNÍ MODEL LINEÁRNÍ REGRESE Y = b * X + a Naším konečným cílem je nalézt rovnici přímky, kterou nejlépe proložíme získané body a kterou nazýváme „kalibrační křivka“. Pro první odhad použijeme buď nabídku z pravého kliku na grafu (Přidej Spojnici trendu + lineární + zobrazit rovnici v grafu – viz šipky níže) anebo použijeme dialog Data – Analýza dat – Regrese: Druhý způsob je vhodnější, jelikož zároveň velmi pomůže dalšímu postupu, protože TOHLE NENÍ KONEC PŘÍBĚHU!!! 3/ Je úsek na ose Y VÝZNAMNÝ? Poněvadž naše měření je zatíženo náhodnými chybami, může se stát, že jiná série měření za stejných podmínek, by poskytla rovnici např. Y=0.1417*x + 0.001 a další takové měření třeba Y=0.1417*x – 0.111. Toto znamená, že hodnota (i znaménko) úseku na ose Y nemají žádný význam, jsou to jen náhodná čísla. Je-li to pravda, učiníme důležitý závěr: ÚSEK BY MĚL BÝT ROVEN NULE. Tabulka, kterou poskytla Analýza dat nese informaci, zda je úsek -0.7083 našeho regresního modelu Y = 0.1417 * X – 0.7083 významně odlišný od 0. Abychom verifikovali nulovou hypotézu a=0 (na hladině významnosti =0.05), srovnáme poměr |a|/sa s t(krit.) (viz žlutá políčka výše: 0.532<2.0739) nebo, jednodušeji, srovnáme P-hodnotu s 0,05 (0.613 > 0.05). V našem případě, obě hodnoty v tabulce potvrzují nulovou hypotézu. Jednoduhé pravidlo říká: považujeme úsek za nulový, pokud P-hodnota je větší než 0.05. V takovém případě zapomeneme na náš původní regresní model resp. změníme jej na jednodušší tvar s jednodušší rovnicí Y = b*X, což znamená, že postup nalezení nové rovnice musíme zopakovat s podmínkou Y(0)=0 (směrnice se o něco změní, také se změní statistické hodnoty): Všimněme si, že grafického vyhodnocení Přidej spojnici trendu vrací nesprávnou hodnoru R2 . Proto používejme zásadně Data – Analýza dat – Regrese, což poskytne správné hodnoty jak R=0.998993, tak směrnice=0.139728: 4/ VÝPOČET V NEZNÁMÉM VZORKU Ať už úsek byl vynulován nebo ne, kalibrační křivka se používá k určení neznámé koncentrace (množství) ve vzorku. Pro to použijeme správný regresní model a vypočítáme X pro dané Y: X = Y / b (byl-li úsek nevýznamný) anebo, pokud úsek a byl významný: X = ( Y – a ) / b Obvykle je i vzorek měřen opakovaně; po otestování na odlehlé hodnoty pak dosadíme za Y průměr.