* 1 STATISTIKA © Biochemický ústav LF MU (V.P.) 2007 2 Účelem není znát vzorce a výpočty (to by bylo zcela zbytečné), ale vědět, co to znamená ! The purpose is not the knowledge of formulas and calculations (it would be useless), however to know what it means ! 3 Některé technické ievv konstantnost „jistota u . i ^N' t. N Biologické jevy —> variabilita —» pravděpodobnost živý organismus —» biologická variabilita rozdělení četnosti biologických jevů symetrické, asymetrické „normální rozdělení" „Gaussovské rozdělení" 6 Carl Friedrich Gauß (1777-1855) nemecký matematik the German mathematician AY475S071D1 I,—■■.— ■- _________-■■-.■-- ---"V : A^4S7 5 8 071K1 DC < LU U I— ĽU NJ Gaussova křivka the Gaussian curve 7 03 r» Křivka rozložení funkce pravděpodobnosti je symetrická a zvonovitého tvaru (= „normální rozdělení", „Gaussovské rozdělení") > ■N ■'m ífi ¥ p ■ H-l ■ ■ h m m n í7s %1 jn.ift-itii^i—r- The curve of the probability density function is symmetrical and bell-shaped (= „normal distribution", „the Gaussian distribution") 8 Intervaly pravděpodobnosti rozložení v % jsou dány aritmetickým průměrem (x) a standardními odchylkami (s) . x + Is 63.27% 55,45% ——--------— >: + 2s 99,73% ---------=-------- -»*- K + 3s „Normální hodnoty66 : x + 1,96s = 2.5% O-'«) .___:> p a 5 % <---1 v medicínských a biologických studiích je to dohodnuté rozpětí hodnot vymezené 95 % intervalem spolehlivosti (oboustranně ohraničený interval spolehlivosti) 10 14 Normální hodnoty44 („referenční hodnoty44) : od do 2.5% d-'<°) Podle běžné konvence referenční hodnoty zahrnují celou populaci. Interval je však ohraničen oboustranně 2,5 % pásmem očekávaných hodnot. Ve skutečnosti tedy 5 % výsledků „normální" zdravé populace bude ležet mimo referenční hodnoty. n Nesymetrické rozdelení: X modus X median o v X levostranne asymetrické rozdělení, „logaritmicko-normální" (lognormální) rozdělení Nesymetrické rozdělení: X > X pravostranné asymetrické rozdělení, „logaritmicko-normální" (lognormalní) rozdělení u symetrického rozdělení: x = X = 95 % interval spolehlivosti odvozený z jednotlivých hodnot, seřazených podle své velikosti 2,5 % ----; t X . *J2 mm jrrf1111 I 50 % w~% ^y 95 % 100 % (n) 97,5 1 i T*T !xmax _^/ Dohodnutá symbolika / conventional symbolism : základní soubor population výběrový soubor sample průměr mean, average P X směrodatná odchylka standard deviation G S °n-l \ n \n-l 15 Směrodatná odchylka výukový vzorec praktický vzorec „s" nebo „on_i" = pro výberový soubor, v angl. literatuře také SD (standard deviation) 16 Statistika potřebuje nenulové hodnoty : (+) (-) x (x odchylky od aritmetického průměru mají kladné a záporné hodnoty Y(x-x) = 0 součet prostých odchylek jednotlivých hodnot od aritmetického průměru je nulový s —\2 (x-x)z* 0 součet čtverců odchylek se nerovná nule, proto je tento typ součtu používán pro výpočty 17 Jak získá statistika nenulové hodnoty ? 1/ druhé mocniny všech čísel (kladných nebo záporných) jsou kladné, proto vidíte: 2>-x)2 nebo VK'+VK' ...... 2/ po provedených výpočtech jsou druhé mocniny „vráceny" do původního stavu druhou odmocninou, proto vzorce: Z(*-*)2 z 2 —2 x - nx n-1 v n-1 KJVK^+VK* 18 Spolehlivost = správnost + přesnost správně, přesně Charakteristikou přesnosti je variabilita. Mírou variability je např. rozptyl (s2) nebo variační koeficient (VK). VK = 4- * 100 (%) x 19 Spolehlivost = správnost + přesnost Nesprávné výsledky jsou dány odchylkou od správné hodnoty (nenáhodná, systematická chyba) přesně, nesprávně 20 Spolehlivost = správnost + přesnost • ••• • • • • • • • • • • • správně, nepresne 21 biologické jevy variabilita pravděpodobnost: 1/ prostá (nepodmíněná) 2/ podmíněná Pravděpodobnost prostá (nepodmíněná): ( hra v kostky ) p = - = 0,166 = 16,6% Počet hodů: 100/16,66 = 6 P = - • - = 0,166 • 0,166 = 0,1662= 0,027 = 2,7% 6 6 Počet hodů: 100/2,7 = 37 P = -•-•- = 0,1663 = 0,004 = 0,4% 6 6 6 Počet hodů: 100/0,4 = 250 23 Pravděpodobnost prostá (nepodmíněná): - • - = 0,166 • 0,166 = 0,1662 = 0,027 = 2,7% 6 6 • • • • • • • • P = l Počet hodů: 100/2,7 = 37 navzájem nezávislé jevy " součin pravděpodobností (nikoliv součet! ) 24 Pravděpodobnost prostá (nepodmíněná) P = 16.6% p — 2 1°/ Cím více jevu, tím nižší celková pravděpodobnost! P = 0.4 % 25 Pravděpodobnost prostá (nepodmíněná): w P = 0.951 = 95 % W W P = 0.952 = 90.25 % Cím více současně požadovaných laboratorních stanovení, tím menší pravděpodobnost, že výsledek jediného z nich bude ležet uvnitř 95 % intervalu spolehlivosti (u zdravého jedince). www P = 0.953 = 85.74 % 26 Pravděpodobnost prostá (nepodmíněná) pravděpodobnost výskytu 1 výsledku (zdravý jedinec): - uvnitř - mimo i 95 % interval spolehlivosti l obecně: P = 0,95" p = (1 - 0,95)" 0 -i * P = 0,95* p = (1 - 0,95)* = 95 % = 5 % tt ^> ^> W \J \y U v> n = 10 ......► P = 0,95*" P = (1 - 0,95) = 0,5987 = 0,4013 ~ 60% ~ 40% 10 27 Podmíněná pravděpodobnost: P (T/D) = pravděpodobnost jevu „T" za podmínky „D" podmínka ,,D" i e vždv přítomna T = test T+ = positivní test T- = negativní test D = diagnóza, nemoc (disease) D+ = daná diagnóza je přítomna, nemoc je přítomna D- = daná diagnóza není přítomna, 28 nemoc není přítomna l/ALIDITU DIAGNOSTICKÝCH TBSTU. Aéere' dávají'pouze dra druhy odpovedi' (tese aeaaéfir*/' a čert p0*itAré*r)t /gg yy/ddnt dvěma, mdkt&ď*é**/ pemerňym/ uka&aůe// ^ seMsnťtWtou a speaWciů&u,. 29 D+ T— dvě překrývající se křivky D- 30 kritická hodnota pro diferenciaci D+ spravna pozitivita 7- —> D-d \ správná - jř ^^ negativita i -------X ■ ^^^^^^^fa. + b ■ 31 falešná pozitivita f falešná negativita 32 D+ spravna pozitivita D- ú správná negativita falešná pozitivita \ falešná negativita 33 pacient s nemocí (D+) pacient bez nemoci (D-) test je pozitivní (T+) a c test je negativní (T-) b d a = správná pozitivita cx _ , ( , v i ry i v r ,- - , ^l --- ŽI / (íl """ Dl b = ialesna negativita v 7 c = falešná pozitivita d = správná negativita SF = d / (c + d) 34 Podmíněná pravděpodobnost: P (T-/D-) = správná negativita, specifičnost, specificita (SF) SF = 0,7 —» použitelná metoda SF > 0,95 —» velmi dobrá metoda P (T+/D+) = správná pozitivita, senzitivita (ST) efektivita (vydatnost) = nejvyšší pravděpodobnost shody testu s diagnózou 35 Senzitivita = podíl správné pozitivity testu „senzitivita" ST= P(T+/D+) -„pozitivita" = podmíněná pravděpodobnost P (T+/D+), že pacient s hledanou nemocí (D+) má pozitivní výsledek testu (T+) = pravděpodobnost pozitivního testu (T+) u pacientů s nemocí (D+) = schopnost testu dát pozitivní odpověď (T+) v případě, že vyšetřovaná osoba trpí danou nemocí (D+) 36 Specificita = podíl správné negativity testu SF = P (T/D) = podmíněná pravděpodobnost P (T-/D-), že pacient bez hledané nemoci (D-) má negativní výsledek testu (T-) = pravděpodobnost negativního testu (T-) u pacientů bez nemoci (D-) = schopnost testu dát zápornou odpověď (T-) v případě, že vyšetřovaná osoba nemá danou nemoc (D-) 37 Operativní charakteristická křivka 1.00 I nespecifita 1,00 1-SF senzitivita „ST", citlivost = správná pozitivita = 1 - falešná negativita „1 - FN" ROC - křivka 1 - specifická „1 - SP" = nespecifická = falešná positivita „FP" 39 « ideální bod (nedosažitelný) ~ 100 % správné pozitivity a 0 % falešné pozitivity ROC - křivka ST 1,0 0,5-1 27,5 0,S 10 l-SF 41 40 frekvence normální hodnoty albumin (9/0 Dva soubory S-albuminu : 1 D+ 2 D- D+: hnisání rány, dehiscence rány, bronchopneumonie, sepse, tvorba dekubitů 42 frekvence normální hodnoty albumin (9/1) 1,0 l-SF Kritická hodnota pro diferenciaci a ROC křivka (1): 43 frekvence normální hodnoty albumin (9/1) 1,0 l-SF Kritická hodnota pro diferenciaci a ROC křivka (2): 44 frekvence normální hodnoty albumin (9/1) 1,0 l-SF Kritická hodnota pro diferenciaci a ROC křivka (3): 45 29,95 , * - TT 40 35 / / / / / / / / / 0,5 LO P(T+) 46 Kriticky rozdíl je veličina k posouzení statisticky významné odlišnosti dvou srovnávaných hodnot u stejného pacienta („sám sobě kontrolou") kritický rozdíl = K- ^VK2A + VK2B A = analytická variabilita (reprodukovatelnost po dnech) B = biologická variabilita (proměnlivost u daného jedince) K= 2,77 = 1,96 • V2 2 srovnávané hodnoty X ± 1,96 S (95 % interval spolehlivosti) 47 Kritický rozdíl: Cholesterol: minulé stanovení 8,0 mmol/1 (~ 100 %) - 25 % (pokles) dnešní stanovení 6,0 mmol/1 (~ 75 %) 48 Kriticky rozdíl: Cholesterol: minulé stanovení 8,0 mmol/1 (~ 100 %) - 25 % (pokles) dnešní stanovení 6,0 mmol/1 (~ 75 %) Laboratoří sdělený kritický rozdíl pro cholesterol byl 19 % . Rozdíl u našeho pacienta (25 %) je větší než kritický rozdíl. Rozdíl u pacienta je tedy statisticky významný, (je větší než součet analytické a biologické variability). Pouhou náhodou může být způsoben jen výjimečně (s pravděpodobností < 5 %) 49 Referenční hodnotv („normální hodnoty") : referenční jedinec —» NE: 1. těhotné ženy 2. dítě / věk ? muž / žena ? 3. jedinci po fyzické námaze / po vystavení stresu 4. po požití potravy (výjimka: zátěžové stavy) 5. po podání léků 6. nemoc / rizikové faktory 7..... „zdraví dárci krve" 50 Preanalvtická variabilita : Standardní odběr: • poloha (vleže vs. ambulantně) • denní doba • nalačno • komprese žíly / prstu • doba a způsob srážení (druh a koncentrace antikoagulantu) • skladování (teplota, UV,...) • doba dodání do laboratoře 51 KONTROLA PROVOZU 52 \ fotirok presnosti®' faj • • j • • , * / i • \ " í * ■■—■ \\Z_ ' %V7 <=y z^ 53 Regulační diagram 55 Kontr. dat Westgard uvolni sérii ANO mimo kontrolu odvrhni sérii 12s kontroluje se, jestli alespoň jeden výsledek kontroly překročil ± 2s !3s kontroluje se, jestli alespoň jeden výsledek kontroly překročil ± 3s 22s R4s kontroluje se, jestli dva po sobě jdoucí výsledky kontroly překročily buď2s nebo -2s_________________________ kontroluje se, jestli rozdíl (variační rozpětí) mezi dvěma výsledky kontrolního vzorku > 4s___________________ 4 kontroluje se, jestli 4 po sobě jdoucí výsledky téhož kontrolního vzorku přesahují buď4 x Is nebo 4 x (-Is) 10x kontroluje se, zda 10 po sobě jdoucích výsledku stanovení téhož kontrolního vzorku je na jedné nebo druhé straně průměru__________________________________________ 57 Analvtv moce, G426 Cyklus: 010/98, strana 2 z 3 Vzorek B mtnol/l Kreatinin Mimo: 8 12,38 -9,58 • 6,78 -"í os ■ ^m i « — _ ■ m m* m m m 1 --■--; m ■ i • : ■ ■ < 1 8, 83 I 13,53 i 18,23 Vzorek A 1 22,93 1 27,63 Analvťv" krevního séra, G426 Cyklus: 002/93, strana 4 z 6 fikati 13,10 -- CQ CD 10,30 -- O > 7,50 - 4,70 -L 1,90 0,814 ALP Mimo: 1 2,414 —i— 4,014 5,614 Vzorek A 59 \>-btlfa Nedorozumění laboratorních a klinických oddělení: 1/ 95 % interval spolehlivosti 2/ „kvalita samotného laboratorního výsledku nikdy nemůže být lepší než kvalita dodaného vzorku !" 3/ biochemický „make up" 61 62