Statistické hodnocení biodiverzity Jiří Jarkovský, Danka Haruštiaková Institut biostatistiky a analýz, Masarykova univerzita, 2014 Program kurzu •25.9 Biodiverzita jako pojem + Biodiverzita a biostatistika •2.10. Vizualizace biodiverzity •9.10. Indexy diverzity a jejich statistická spolehlivost •16.10. Species-abundance křivky a stochastické modely •23.10. Niche-oriented species - abundance modely •30.10. Aplikovatelnost parametrických a neparametrických statistických technik při hodnocení biodiversity •6.11. Aplikovatelnost parametrických a neparametrických statistických technik při hodnocení biodiversity •13.11. Možnosti frakcionace biologických společenstev a následná analýza biodiversity získaných podjednotek •20.11. Parametrické hodnocení biodiversity ve vícerozměrných analýzách •27.11. Parametrické hodnocení biodiversity ve vícerozměrných analýzách • 4.12. Případová studie: Parazitární společenstva •11.12. Případové studie: Lišejníky a znečištění ovzduší •18.12. předtermín IV. Indexy biodiverzity a jejich spolehlivost Indexy diverzity: výhody a nevýhody •Indexy diverzity je možné brát jako analogii k popisné statistice • •Celé společenstvo je agregováno jediným číslem, které reprezentuje počet druhů a/nebo jejich dominanci ve společenstvu • •Pro popisnou statistiku diverzity je možné získat intervaly spolehlivosti a dostupné jsou i statistické testy • • •Výhody: •Měření diverzity v jediném čísle • •Nevýhody: •Redukce individuality taxonů •V některých případech nejasná interpretace (stejná hodnota indexu může být spočítána z velmi odlišných společenstev) • X Problémy s biodiverzitou – co znamená větší diverzitu ? ? Indexové hodnocení diverzity Počet druhů Dominance Počet druhů a jejich vyrovnanost Indexy S, ‘species richness’ McIntosh, 1967 R1 = (S-1)/ln N Margalef, 1958 R2 = S/ÖN Menhinick, 1964 H´ = -åi(pi.lnpi) Shannon & Weaver, 1949 N1 = eH´ Simpson, 1949 N2 = 1/åipi2 Hill, 1973 E1 = H´/ln S = H´/ H´max Pielou, 1969 E2 = N1/S Sheldon, 1969 E3 = (N1-1)/(S-1) Heip, 1974 E4 = N2/N1 Hill, 1973 E5 = (N2-1)/(N1-1) Alatalo, 1981 H´adj Hutcheson, 1970 D = (N-Öåini2)/(N-ÖN) McIntosh, 1967 DE = (N-Öåini2)/[N-(N/ÖS)] Pielou, 1969 Indexy diverzity I PIE = 1-åipi2 Hurlbert, 1971 NMS = åi(Ripi-1) Fager, 1972 HB = (ln N!-åiln ni!)N Brillouin, 1956 HBe = HB/HBmax Pielou, 1969 G = E5.(arcsin E5/90) G = (E5)3 1/d = N/nmax Berger & Parker, 1970 Q = (0.5nQ25+ånr+0.5nQ75)/ln(Q75/Q25) Kempton&Taylor, 1978 Molinari, 1989 Indexy diverzity II Molinari, 1989 Hurlbert, 1971 R100 = åi 1- N-ni n n N Indexy druhové bohatosti •Počet druhů (druhová bohatost) S •Počet druhů vztažený na počet jedinců nebo biomasu • v případě, že není možné zajistit stejnou velikost vzorku (počet druhů narůstá s velikostí vzorku a vzorkovacím úsilím) => RAREFACTION – metoda výpočtu počtu druhů očekávaných ve vzorku standardní velikosti (např. 1000 jedinců) •Hustota druhů – počet druhů v dané oblasti • • Margalefův index • Menhinickův index • •Nevýhody indexů druhové bohatosti: křivka společenstva není uvažována ve výpočtu R1 = (S-1)/ln N R2 = S/ÖN Počet druhů je vážen počtem jedinců. Druhová bohatost •Druhová bohatost narůstá s velikostí vzorku. primula Plocha (čtverečná míle) Relationship between number of species and area for flowering plants in England. Redrawn from Krebs (1985) after Williams (1964). Velikost vzorku a počet druhů •Počet druhů nelineárně závisí na počtu jedinců ve vzorku Počet jednotek vzorkování •Jak srovnat druhovou bohatost ve vzorku různé velikosti? • • RAREFACTION Rarefaction •Metoda řešící problém srovnání druhové bohatosti ve vzorcích o různé velikosti •Standardizuje oba vzorky na velikost menšího vzorku sample Metoda výpočtu odhadu počtu druhů v náhodném výběru o n jedincích ze vzorku Je možno spočítat jak bodové, tak intervalové odhady Rarefaction: výpočet •Kde E(Sn) je odhadnutý počet druhů ve vzorku o n jedincích, N je celkový počet jedinců, Ni je počet jedinců druhu i a n je počet jedinců pro které je odhad počítán. •Variabilita odhadu je vypočtena: Rarefaction: předpoklady •Společenstva porovnávaná pomocí rarefaction mají mít podobné taxonomické složení •Srovnatelné metody vzorkování •Rarefaction křivka nemůže být extrapolována za sumu jedinců největšího vzorku •Jedinci jsou ve společenstvu náhodně rozmístěni •Ve skutečnosti jsou častější shluky jedinců a za těchto podmínek dává rarefaction nadsazené odhady Software •PAST software • • • • • •Diversity software od IBA Příklady 1.Předpokládejte stejné vzorkovací úsilí a stejné přírodní podmínky u dat v souboru example_set.xls 2.Zjistěte největší velikost vzorku použitelnou pro výpočet rarefaction 3.Vypočtěte rarefaction odhady pro výběr 5 lokalit a interpretujte je Vyrovnanost společenstva a počet druhů •Doplňkem těchto indexů je tzv. evenness, která je počítána jako podíl indexu skutečného společenstva a teoretické maximální hodnoty pro daný počet druhů (tj. pokud by měly zcela vyrovnané abundance) – evennes vlastně vyjadřuje jak moc je reálné společenstvo vzdáleno od maximální vyrovnanosti • • • • • • • • •Do této skupiny patří Shannonův a Brillouinův index, liší se od sebe použitím, Brillouinův index by měl být používán pouze pro skutečně vzorkovanou část společenstva (příkladem mohou být infrakomunity parazitů, kdy sesbíráme všechny parazity na hostiteli), Shannonův index při výpočtu uvažuje, že část společenstva vzorkována nebyla Shannon index •ni je abundance i-tého druhu, N celkový počet jedinců a S počet druhů Shannonův index Shannon evenness Shannonův index s korekcemi Shannon index Species Abundance Shannon index of diversity pi ln(pi) pi*ln(pi) Baetis alpinus 736 0.9472 -0.0542 -0.0513 Rhithrogena semicolorata 28 0.0360 -3.3232 -0.1198 Epeorus sylvicola 8 0.0103 -4.5760 -0.0471 Baetis rhodani 4 0.0051 -5.2691 -0.0271 Ephemerella mucronata 1 0.0013 -6.6554 -0.0086 Total number of individuals 777 Shannon index of diversity (using natural logarithm) 0.2539 Rhitr_semic Bae_rho Shannon index ni … abundance i-tého druhu N … celkový počet jedinců Shannon index je mezi ekology nejpopulárnější index. Shannon index Species Abundance Shannon index of diversity pi*log2(pi) pi*ln(pi) pi*log(pi) Baetis alpinus 736 -0.0741 -0.0513 -0.0223 Rhithrogena semicolorata 28 -0.1728 -0.1198 -0.0520 Epeorus sylvicola 8 -0.0680 -0.0471 -0.0205 Baetis rhodani 4 -0.0391 -0.0271 -0.0118 Ephemerella mucronata 1 -0.0124 -0.0086 -0.0037 Total number of individuals 777 Shannon index of diversity 0.3663 0.2539 0.1103 Rhitr_semic Bae_rho Shannon index ln ? log2? log ? Báze logaritmu Shannon index Shannon index Báze logaritmu Shannon index Shannon index f(x) x Brillouinův index •Možným problémem při výpočtu je neschopnost Excelu spočítat faktoriál více než 160, lze obejít použitím logaritmu Brillouinův index Brillouin evenness kde je celá část a Q statistic I •Měřítko sklonu křivky abundancí kumulativního počtu druhů • • • • • • • •Snr – celkový počet druhů mezi kvartily •S – celkový počet druhů ve vzorku •R1 a R2 – 25% a 75% kvartil •nR1 – počet druhů ve třídě, do níž spadá dolní kvartil počtu druhů •nR2 – počet druhů ve třídě, do níž spadá horní kvartil počtu druhů •R1 – počet jedinců ve třídě, do níž spadá dolní kvartil počtu druhů •R2 – počet jedinců ve třídě, do níž spadá horní kvartil počtu druhů Q statistic II •Dalším způsobem výpočtu je odhad hodnoty Q • • • • • • • •je počítán pro všechny páry Sj a S j´ a Nj a N j´ (j > j´ , j=1,2, …….r) •S – kumulativní počet druhů •N – počet jedinců ve třídě •r – počet tříd a (i=1,2,……r(r-1)/2) • •Z vzniklé řady čísel je Q zjištěno jako medián nebo geometrický průměr Dominance •Tyto indexy zjišťují, zda jsou ve společenstvu přítomny silně dominantní druhy nebo je společenstvo spíše vyrovnané •Hodnoty indexů jdou opačným směrem než v případě indexů počítajících s vyrovnaností a počtem druhů (Shannon, Brillouin) a proto se často používá jejich odpočet od jedné nebo převrácená hodnota Simpson index Berger Parker index Berger – Parker index •Berger-Parker index Species Abundance Baetis alpinus 736 Rhithrogena semicolorata 28 Epeorus sylvicola 8 Baetis rhodani 4 Ephemerella mucronata 1 Total number of individuals 777 Berger-Parker index 0.9472 Rhitr_semic Bae_rho N max … počet jedinců nejpočetnějšího druhu N … celkový počet jedinců 1 – d je často použito namísto d Shannon diversity Berger-Parker index Algoritmy v MS Office •Programy MS Office obsahují plnohodnotný programovací jazyk MS Visual Basic – v tomto jazyce jsou také psána makra •Pomocí maker (Visual Basicu) lze ovládat všechny části programů Office – tabulky, databáze, grafy atd. a ve spojení s formuláři vytvářet i složitější aplikace •Pro zjištění složitějších příkazů je vhodné analyzovat klasická makra • •Proměnné slouží pro ukládání výsledků, dat atd., je vhodné je definovat, definice se skládá z jména proměnné a jejího typu •Základní typy proměnných: •Double – reálná čísla •Long – celá čísla •String – text •Objekty – jako proměnná mohou být definovány například grafy, listy Excelu atd., s každým objektem je spjata sada jeho parametrů, které je možné nastavit, např. data a formát grafu • •Dim jménoProměnné As Double • definice proměnné •Dim jménoPole() As Double • definice dynamického pole (pole=matice, tabulka), následuje jeho dimenzování ReDim jménoPole(1 to 10, 1 to 2) – dvourozměrné pole 10x2 buněk • Proměné Základní příkazy Sub jméno_Makra() … End Sub Ohraničení programu/makra For i = 1 To r … Next i Cyklus s počtem opakování If (podmínka) Then … Else … End if Podmínka - větvení Do … Loop Until (podmínka) Do While (podmínka … Loop Cyklus s podmínkou Načtení dat •Sub InputDat() • • ' pocet radku a sloupcu • • r = Selection.Rows.Count • s = Selection.Columns.Count • • ' nacteni matice druhu • • ReDim Matice(r + 1, s + 1) • • For i = 1 To r • For j = 1 To s • Matice(i, j) = Selection.Cells(i, j) • Next j • Next i • •End Sub uData označená v listu jsou označena jako Selection, jednotlivé buňky oblasti mohou být adresovány pomocí Selection.Cells(i, j), kde i a j jsou souřadnice ve vybraných datech (obdoba A1 adresování v listu Excelu) a načteny do normálních proměnných uVelikost selekce jako základ informace pro její načtení je zajištěna příkazy Selection.Rows.Count Selection.Columns.Count Výpis dat •Worksheets.Add after:=Worksheets("Input") •ActiveSheet.Name = "Indices„ • •Cells(1, 1) = "Locality" •Cells(1, 2) = "Number of species„ •Cells(1, 3) = "Number of parasites„ • •První dva příkazy vytváří v sešitu nový list a pojmenovávají jej, jednotlivé buňky listu jsou adresovány pomocí příkazu Cells(i, j), kde i, j představují souřadnice buněk v listu (obdoba A1 adresování)