MIQE - Minimum standard for the provision of information in quantitative PCR Kvantifikační strategie Statistické vyhodnocení Nulová hypotéza (není rozdíl), kterou se test buď potvrdí nebo vyvrátí Základní statistické parametry – průměr  SD nebo medián  x-percentil Parametrické testy - Normální rozložení - Stejný rozptyl - Dva vzorky t-test (one/two tailed) - Různé nezávislé proměnné - ANOVA (i tehdy, není-li rozložení úplně Gaussovské) Genová exprese (expresní poměry) mívá obvykle normální rozložení, pokud je vyjádřena v log scale. Neparametrické testy - Neznáme parametry rozložení - Testování rozdílů mezi nezávislými skupinami (Independent samples) dva vzorky, u kterých porovnáváme průměry některé z proměnných - Mann-Whitey U test; Kolmogorov-Smirnov test více skupin - Kruskal-Wallis test; Mediánový test -Testování rozdílů mezi závislými skupinami - Porovnávání proměnných, zjišťovaných na jednom vzorku - Wilcoxonův test (parametrická alternativa – t-test/ANOVA) - Hodnoty typu „mRNA přítomná/nepřítomná“ (dichotomické hodnoty) – McNemarův 2 test -Testování vztahů mezi proměnnými - Regrese a korelace (Spearmanův/Pearsonův korelační koeficient) - Standardní křivky Kvantifikační strategie Statistické vyhodnocení Kdy použít který test Parametrické vs. neparametrické testy RT-PCR Obvykle malý počet hodnot, s velkým rozptylem, většinou nesledujících normální rozložení -> neparametrické testy V případě většího počtu hodnot (>100), lze použít parametrické testy Neparametrické testy jsou méně náchylné k -chybám (nesprávné zamítnutí nulové hypotézy), ale jsou méně citlivé než parametrické (např. srovnání p u para < p u neparametrických testů), jako signifikantní označí větší rozdíl než parametrické testy. Kvantifikační strategie Statistické vyhodnocení Statistické vyhodnocení Kvantifikační strategie Analýza více genů/vzorků (clustering) Dvourozměrný graf Třírozměrný graf 0 50 100 150 200 250 300 0 20 40 60 80 100 Statistické vyhodnocení Kvantifikační strategie Analýza více genů/vzorků (hledání trendů, clustering) N různých genů – n různých proměnných – n rozměrný graf ? Př. 10000 genů… (microarray) Principal component analysis (PCA) Redukce počtu rozměrů (dimenzionality) na základě výpočtu kovariance mezi jednotlivými vzorky. Původní osy jdou nahrazeny tzv. komponentami Kontrola dat (outliers) Úprava efektivity PCR Kompenzace variability mezi jednotlivými PCR (inter-plate calibration) Normalizace na stejné množství vzorku (RNA/DNA) Průměrování technických replikátů Výpočet množství/poměrů Vlastní statistická analýza Kritická místa statistického vyhodnocení MIQE guidelines jednoduchá, snadná, rychlá, citlivá metoda → Popularita ve vědecké komunitě adaptace, úpravy, specifikace protokolů… → Publikace dat s různou kvalitou problematická data zpochybňují i oprávněné interpretace → Nutnost standardů Standardy MIQE PCR & qPCR …there is a lamentable lack of transparency of reporting, with the material and methods sections of many publications, especially those with high impact factors, not fit for the purpose of evaluating the quality of any reported qPCR data. This poses a challenge to the integrity of the scientific literature with serious consequences not just for basic research but potentially calamitous implications for drug development and disease monitoring…. Bustin 2009 Variabilita a její příčiny Biologická variabilita – experimenty odrážejí různorodost reality – nebudou nikdy identické Technická variabilita – chyby v měření, znemožňující adekvátní popis reality Experimentální design – chybná hypotéza vedoucí k výsledků platným pouze v rámci experimentu – biologické nebo klinické významnosti – data overestimation Bustin SA. 2010. Methods 50(4):217-226. Biologická variabilita • hallmark of life • kombinace genotypových a fenotypových variací mezi jedinci • tkáně a buňky – dynamické systémy se schopností komplexní adaptace a reakce na různé podmínky Genetická variabilita polymorfismy, copy-number variace, alternativní splicing, posttranskripční a posttranslační regulace, epigenetické modifikace Fenotypová variabilita environmentální interakce, intra- a extraindividuální faktory (věk, životní/reprodukční cyklus, pohlaví, čas, nutriční stav…) Stochastická variabilita na úrovni kinetického šumu biochemických reakcí uvnitř jediné buňky = dynamické chování jediné buňky není přesně reprodukovatelné Biologická variabilita Expresní profily jednotlivých buněk se liší, i v rámci homogenní kultury Interakce mezi regulačními molekulami a DNA Lokalizace mRNA a proteinů v rámci buňky Epigenetické modifikace I geneticky identické buňky ve stejném prostředí mohou mít různý fenotyp Biologické informační dráhy jsou robustní, redundantní, závislé na buněčném, tkáňovém i environmentálním kontextu Biologická variabilita Biologicky relevantní interpretace pozorovaného jevu a jeho odlišení od přirozené variability a heterogenity v daném systému vyžaduje správný experimentální design, analytické metody a vhodný statistický model Slepě nepřejímat cizí protokoly, přemýšlet Technická variabilita • Mnoho protokolů, které se liší v každém kroku = rozdíly ve výsledcích • Meticulous attention to sample isolation, storage and preparation, množství replikátů, design assays, samotný qPCR proces, normalizace a statistická analýza • Sample size je relativně malá, statistické analýzy mají malou sílu, fold change je málo precizní a zvýšená pravděpodobnost falešně pozitivních výsledků roste Proč je to problém? • Původní jednoduchý protokol se změnil na mnoho složitějších špatně popsaných protokolů, které je těžké zkontrolovat • qPCR = neadekvátní standardizace, komplexní a nekonsistentní technika vedoucí ke špatným výsledkům Bustin SA. 2010. Methods 50(4):217-226. Technická variabilita Bustin SA. 2010. Methods 50(4):217-226. Cíle standardizace Bustin SA. 2010. Methods 50(4):217-226. Technická variabilita Bustin et al 2009 Experimentální design Derveaux S. et al. 2010. Methods 50(4):227-230. 1. Plán 2. Izolace RNA 3. RT 4. qPCR Typický experiment Minimalizace propagace technických chyb (errors of measurement) v experimentu Gene vs. sample maximization Technické chyby jsou nezávislé v každém experimentálním kroku a aditivní Subjekty Vzorky RT PCR Schéma: např. 2 x 3 x 3 x 3 2 3 3 3 myši 3 odběry vzorků a izolace RNA 3 RT ze každého vzorku 3 PCR replikáty z každé RT 2 6 18 54 Plánování experimentu – příklad: exprese jednoho genu ve dvou myších: Kitchen RR et al. 2010. Methods 50(4):231-236. Conclusion Jak navrhnout správný experiment? – Definovat jej před vlastním začátkem experimentu – Brát v úvahu hypotézu – Být maximálně jednoduchý (co nejméně komplexní) – Maximálně kontrolovatelný – Technicky a ekonomicky proveditelný, statisticky vyhodnotitelný Nežádoucí Technická: zpracování vzorku (sampling, izolace, RT-PCR) Řešení: replikáty, normalizace k internímu standardu Biologická: rozdíly mezi vzorky (bazální exprese, odpověď na treatment) Řešení: opakovaná měření, normalizace ke kontrolní skupině Hledaná Rozdíly mezi testovanými skupinami Náhodný sampling, velký soubor Variabilita dat Hodně štěstí