Cvičení 12 Galtonův – Watsonův proces větvení Definice: Nechť jedinec tvořící nultou generaci může dát vznik 0, 1, 2, ... jedincům (potomkům) první generace. Analogicky každý jedinec z první generace může dát vznik 0, 1, 2, ... jedincům druhé generace atd. Přitom předpokládáme, že a) počet potomků X náhodně zvoleného jedince má pravděpodobnostní funkci ( )    = == jinak0 0,1,2,...kprop kXP k , která nezávisí na zvoleném jedinci ani na generaci, do níž přísluší; b) jedinci z dané generace dávají vzniknout svým potomkům vzájemně nezávisle. Označme Xn počet jedinců n-té generace (speciálně je X0 = 1). Za uvedených předpokladů posloupnost náhodných veličin { }0n Nn;X ∈ tvoří homogenní markovský řetězec s množinou stavů J = {0, 1, 2, ...}. Tento řetězec se nazývá Galtonův – Watsonův proces větvení. Vlastnosti: 1. Matice přechodu má tvar               + = KKKK K K K 20 2 110 2 0 210 pp2ppp2p ppp 001 P , tj. { }*i jij pp:Jj,i =∈∀ . 2. Pro pravděpodobnostní vytvořující funkci náhodné veličiny Xn+1 platí:    = = =+ 0pron0 ,2,1pron))z(g(g )z(g XX X n 1n K , kde gX(z) je pravděpodobnostní vytvořující funkce náhodné veličiny X1. 3. Pro střední hodnotu a rozptyl náhodné veličiny Xn platí: ,)X(E n n µ= ( )      =µσ ≠µ −µ −µµσ = − 1pron 1pro 1 1 )X(D 2 n1n2 n , kde ( ) ( )1 2 1 XD,XE =σ=µ 4. Pro pravděpodobnost vyhynutí v n-té generaci platí: ( ) )0(gq0XP nXnn === 5. Pro limitní pravděpodobnost vyhynutí platí: a) Je-li µ ≤ 1, pak 1qlim n n = ∞→ . b) Je-li µ > 1, pak ξ= ∞→ n n qlim , kde ( )1,0∈ξ je nejmenší kladný kořen rovnice z = gX(z). Příklad: Uvažme G – W proces, v němž 0p, 5 3 p, 5 1 p, 5 1 p k210 ==== , k = 3,4,… a) Vypočtěte prvky matice přechodu P pro i = 0, 1, 2 a j = 0, 1, 2, 3, 4. b) Najděte pravděpodobnostní vytvořující funkci počtu jedinců ve 2. generaci. c) Pomocí pravděpodobnostní vytvořující funkce počtu jedinců ve 2. generaci vypočtěte pravděpodobnostní funkci. d) Najděte střední hodnotu a rozptyl počtu jedinců ve 2. generaci. e) Vypočtěte limitní pravděpodobnost vyhynutí. Výsledky: Ad a)                 = KKKKKK K K K 25 9 25 6 25 7 25 2 25 1 00 5 3 5 1 5 1 00001 P Ad b) ( ) 432 X z 125 27 z 125 18 z 125 36 z 125 11 125 33 zg 2 ++++= Ad c) ( ) 125 33 0XP 2 == , ( ) 125 11 1XP 2 == , ( ) 125 36 2XP 2 == , ( ) 125 18 3XP 2 == , ( ) 125 27 4XP 2 == Ad d) ( ) 96,1 25 49 XE 2 == , ( ) 15,2 625 1344 XD 2 == Ad e) Limitní pravděpodobnost vyhynutí je 3 1 . Praktická aplikace Galtonova – Watsonova procesu větvení v demografii Výchozí data Budeme vyšetřovat sled generací ženské populace Československa. Máme k dispozici údaje z roku 1961, které popisují rozdělení žen ve věkovém intervalu (45 let, 50 let) (tedy na konci reprodukčního období) podle počtu živě narozených dětí. Žen v tomto věkovém intervalu bylo 450259. Tabulka 1 - výchozí data počet dětí označení počet žen 0 c0 65387 1 c1 78901 2 c2 136150 3 c3 79878 4 c4 39387 5 c5 19856 6 c6 15365 7 c7 7683 8 c8 3841 9 c9 1921 10 c10 960 11 c11 480 12 c12 240 13 c13 120 14 c14 60 15 c15 30 Stanovení pravděpodobnosti narození dcery, která se dožije reprodukčního věku 25 let Zajímají nás pouze potomci ženského pohlaví. Je známo, že v r. 1961 byl poměr počtu živě narozených chlapců k počtu živě narozených dívek 1,055 (tzv. ukazatel maskulinity). Tedy pravděpodobnost narození dívky je 055,11 1 + . Dále je známo z úmrtnostních tabulek ČSR pro rok 1961, že pravděpodobnost dožití 25 let pro ženu je 0,96788. Tedy hodnotu h = 0,96788 . 055,11 1 + = 0,470988 lze považovat za pravděpodobnost, že živě narozený potomek je dcera, která se dožije věku 25 let. Rozložení počtu žen podle počtu dcer, které se dožijí reprodukčního věku 25 let Nechť ci je počet žen s i potomky. Z vlastností binomického rozložení plyne, že z počtu ci připadá (1-h)i ci na ženy s žádnou 25 letou dcerou, ih(1-h)i-1 ci na ženy s právě jednou 25 letou dcerou atd. Tabulka 2 – rozdělení p0, p1, ... žen podle počtu 0, 1, ... 25 letých dcer konstruované na základě počtů c0, c1, ... žen s 0, 1, ... potomky. rozdělení žen podle počtu 25 letých dcerpočet potomků počet žen 0 1 2 … 0 c0 c0 0 0 … 1 c1 (1-h)c1 hc1 0 … 2 c2 (1-h) 2 c2 2h(1-h)c2 h 2 c2 … 3 c3 (1-h) 3 c3 3h(1-h) 2 c3 3h 2 (1-h)c3 … 4 c4 (1-h) 4 c4 4h(1-h) 3 c4 6h 2 (1-h) 2 c4 … . . . . . … . . . . . … . . . . . … suma c p0c p1c p2c Numerické vyhodnocení rozdělení žen podle počtu 25 letých dcerpočet potomků počet žen 0 1 2 3 4 … 0 65387 65387 0 0 0 0 … 1 78901 41740 37161 0 0 0 … 2 136150 38102 67846 30202 0 0 … 3 79878 11826 31586 28121 8645 0 … 4 39387 3045 10985 14671 8708 1938 0 . . . . . … . . . . . … . . . . . … suma 450259 161420 153833 85789 31330 11549 ,358504,0 450259 161420 p0 == p1 = 0,3416544, p2 = 0,1905325, p3 =0,0695821, … Střední hodnota µ = p1 + 2p2 + 3p3 + ... = 0,341655 + 2.0,190533 + 3.0,069583 + ... = 1,111166 >1 Matice pravděpodobností přechodu               + = LLLL L L L 10 2 110 2 0 210 pp2ppp2p ppp 001 P . V našem případě tedy dostáváme:                 = LLLLL L L L L 206734,0199067,0131733,0046077,0 180085,0253342,0244969,0128525,0 069583,0190533,0341655,0358504,0 0001 P . Pravděpodobnostní rozložení počtu 25 letých dcer v n-té generaci Pro vektor absolutních pravděpodobností platí zákon evoluce: p(n) = p(0).Pn . V následující tabulce jsou uvedeny složky vektoru p(n) pro n = 0, 1, ..., 10 Tabulka 3 – pravděpodobnostní rozložení pi(n) počtu i 25 letých dcer v n-té generaci n i 0 1 2 3 4 5 6 7 ... 0 1,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 ... 1 0,358504 0,341655 0,190533 0,065830 0,025651 0,009428 0,003191 0,001013 ... 2 0,509170 0,174495 0,131214 0,078222 0,046294 0,026754 0,015134 0,008447 ... 3 0,593159 0,105974 0,090446 0,064523 0,045799 0,031962 0,022014 0,015040 ... 4 0,646756 0,071021 0,065064 0,051054 0,039920 0,030799 0,023537 0,017881 ... 5 0,683843 0,050729 0,048627 0,040485 0,033619 0,027604 0,022493 0,018246 ... 6 0,710930 0,037884 0,037477 0,032484 0,028103 0,024071 0,020485 0,017367 ... 7 0,731494 0,029234 0,029590 0,026409 0,023533 0,020781 0,018246 0,015970 ... 8 0,747563 0,023131 0,023824 0,021736 0,019805 0,017894 0,016085 0,014416 . 9 0,760402 0,018665 0,019489 0,180087 0,016768 0,015422 0,014117 0,012887 . 10 0,770845 0,015300 0,016151 0,015194 0,014281 0,013322 0,012371 0,011460 . . . . . . . . . . V prvním sloupci jsou pravděpodobnosti vyhynutí (v ženské linii). Je vidět, že v 10. generaci je pravděpodobnost vyhynutí p0(10) = 0,770845 hodně vysoká. Naproti tomu pravděpodobnosti libovolného nenulového počtu dcer jsou velice malé (např. pro jednu dceru p1(10) = 0,015300 a s rostoucím počtem generací se stále snižují. Vytvořující funkce počtu 25 letých dcer v n-té generaci ∑ ∞ = = 0k k nkX zp)z(g n Tabulka 4 – hodnoty vytvořující funkce gn(z) počtu 25 letých dcer v n-té generaci z g1(z) g2(z) g3(z) g4(z) g5(z) 0,0 0,358504 0,509170 0,593159 0,646756 0,683843 0,1 0,394647 0,528015 0,604730 0,654564 0,689446 0,2 0,435057 0,550027 0,618573 0,664047 0,696322 0,3 0,480260 0,575893 0,635302 0,675717 0,704892 0,4 0,530872 0,606507 0,655773 0,690318 0,715785 0,5 0,587619 0,643056 0,681205 0,708964 0,729979 0,6 0,651360 0,687140 0,713398 0,733401 0,749073 0,7 0,723115 0,740967 0,755101 0,766513 0,775872 0,8 0,804109 0,807566 0,810729 0,813400 0,815726 0,9 0,895811 0,891733 0,887770 0,883881 0,880022 1,0 1,000000 1,000000 1,000000 1,000000 1,000000 Průběhy vytvořujících funkcí Pravděpodobnost vyhynutí Limitní hodnotu pravděpodobnosti vyhynutí lze získat jako nejmenší kladný kořen rovnice z=g(z), kde g(z) = g1(z) = p0 + p1z + p2z2 + ... V našem případě řešíme rovnici z = 0,358504 + 0,341655z + 0,190533z2 + 0,069583z3 + ... Výsledek: 834043,0=ξ . Je zajímavé posoudit rychlost konvergence posloupnosti qn pravděpodobnosti vyhynutí potomků v ženské linii v jednotlivých generacích k příslušné limitní hodnotě 834043,0=ξ viz 1. sloupec v tabulce 3. Pro zajímavost ještě uvedeme limitní hodnoty pravděpodobnosti vyhynutí potomků v ženské linii pro různé země (údaje jsou z roku 1960). země ξ Peru 0,2620 Japonsko 0,3242 Mexiko 0,4066 Maďarsko 0,7130 USA 0,8209