Praktická aplikace Galtonova – Watsonova procesu větvení v demografii Výchozí data Budeme vyšetřovat sled generací ženské populace Československa. Máme k dispozici údaje z roku 1961, které popisují rozdělení žen ve věkovém intervalu (45 let, 50 let) (tedy na konci reprodukčního období) podle počtu živě narozených dětí. Žen v tomto věkovém intervalu bylo 450259. Tabulka 1 - výchozí data počet dětí označení počet žen 0 c0 65387 1 c1 78901 2 c2 136150 3 c3 79878 4 c4 39387 5 c5 19856 6 c6 15365 7 c7 7683 8 c8 3841 9 c9 1921 10 c10 960 11 c11 480 12 c12 240 13 c13 120 14 c14 60 15 c15 30 Stanovení pravděpodobnosti narození dcery, která se dožije reprodukčního věku 25 let Zajímají nás pouze potomci ženského pohlaví. Je známo, že v r. 1961 byl poměr počtu živě narozených chlapců k počtu živě narozených dívek 1,055 (tzv. ukazatel maskulinity). Tedy pravděpodobnost narození dívky je 055,11 1 + . Dále je známo z úmrtnostních tabulek ČSR pro rok 1961, že pravděpodobnost dožití 25 let pro ženu je 0,96788. Tedy hodnotu h = 0,96788 . 055,11 1 + = 0,470988 lze považovat za pravděpodobnost, že živě narozený potomek je dcera, která se dožije věku 25 let. Rozložení počtu žen podle počtu dcer, které se dožijí reprodukčního věku 25 let Nechť ci je počet žen s i potomky. Z vlastností binomického rozložení plyne, že z počtu ci připadá (1-h)i ci na ženy s žádnou 25 letou dcerou, ih(1-h)i-1 ci na ženy s právě jednou 25 letou dcerou atd. Tabulka 2 – rozdělení p0, p1, ... žen podle počtu 0, 1, ... 25 letých dcer konstruované na základě počtů c0, c1, ... žen s 0, 1, ... potomky. rozdělení žen podle počtu 25 letých dcerpočet potomků počet žen 0 1 2 … 0 c0 c0 0 0 … 1 c1 (1-h)c1 hc1 0 … 2 c2 (1-h) 2 c2 2h(1-h)c2 h 2 c2 … 3 c3 (1-h) 3 c3 3h(1-h) 2 c3 3h 2 (1-h)c3 … 4 c4 (1-h) 4 c4 4h(1-h) 3 c4 6h 2 (1-h) 2 c4 … . . . . . … . . . . . … . . . . . … suma c p0c p1c p2c Numerické vyhodnocení rozdělení žen podle počtu 25 letých dcerpočet potomků počet žen 0 1 2 3 4 … 0 65387 65387 0 0 0 0 … 1 78901 41740 37161 0 0 0 … 2 136150 38102 67846 30202 0 0 … 3 79878 11826 31586 28121 8645 0 … 4 39387 3045 10985 14671 8708 1938 0 . . . . . … . . . . . … . . . . . … suma 450259 161420 153833 85789 31330 11549 ,358504,0 450259 161420 p0 == p1 = 0,3416544, p2 = 0,1905325, p3 =0,0695821, … Střední hodnota µ = p1 + 2p2 + 3p3 + ... = 0,341655 + 2.0,190533 + 3.0,069583 + ... = 1,111166 >1 Matice pravděpodobností přechodu               + = LLLL L L L 10 2 110 2 0 210 pp2ppp2p ppp 001 P . V našem případě tedy dostáváme:                 = LLLLL L L L L 206734,0199067,0131733,0046077,0 180085,0253342,0244969,0128525,0 069583,0190533,0341655,0358504,0 0001 P . Pravděpodobnostní rozložení počtu 25 letých dcer v n-té generaci Pro vektor absolutních pravděpodobností platí zákon evoluce: p(n) = p(0).Pn . V následující tabulce jsou uvedeny složky vektoru p(n) pro n = 0, 1, ..., 10 Tabulka 3 – pravděpodobnostní rozložení pi(n) počtu i 25 letých dcer v n-té generaci n i 0 1 2 3 4 5 6 7 ... 0 1,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 ... 1 0,358504 0,341655 0,190533 0,065830 0,025651 0,009428 0,003191 0,001013 ... 2 0,509170 0,174495 0,131214 0,078222 0,046294 0,026754 0,015134 0,008447 ... 3 0,593159 0,105974 0,090446 0,064523 0,045799 0,031962 0,022014 0,015040 ... 4 0,646756 0,071021 0,065064 0,051054 0,039920 0,030799 0,023537 0,017881 ... 5 0,683843 0,050729 0,048627 0,040485 0,033619 0,027604 0,022493 0,018246 ... 6 0,710930 0,037884 0,037477 0,032484 0,028103 0,024071 0,020485 0,017367 ... 7 0,731494 0,029234 0,029590 0,026409 0,023533 0,020781 0,018246 0,015970 ... 8 0,747563 0,023131 0,023824 0,021736 0,019805 0,017894 0,016085 0,014416 . 9 0,760402 0,018665 0,019489 0,180087 0,016768 0,015422 0,014117 0,012887 . 10 0,770845 0,015300 0,016151 0,015194 0,014281 0,013322 0,012371 0,011460 . . . . . . . . . . V prvním sloupci jsou pravděpodobnosti vyhynutí (v ženské linii). Je vidět, že v 10. generaci je pravděpodobnost vyhynutí p0(10) = 0,770845 hodně vysoká. Naproti tomu pravděpodobnosti libovolného nenulového počtu dcer jsou velice malé (např. pro jednu dceru p1(10) = 0,015300 a s rostoucím počtem generací se stále snižují. Vytvořující funkce počtu 25 letých dcer v n-té generaci ∑ ∞ = = 0k k nkX zp)z(g n Tabulka 4 – hodnoty vytvořující funkce gn(z) počtu 25 letých dcer v n-té generaci z g1(z) g2(z) g3(z) g4(z) g5(z) 0,0 0,358504 0,509170 0,593159 0,646756 0,683843 0,1 0,394647 0,528015 0,604730 0,654564 0,689446 0,2 0,435057 0,550027 0,618573 0,664047 0,696322 0,3 0,480260 0,575893 0,635302 0,675717 0,704892 0,4 0,530872 0,606507 0,655773 0,690318 0,715785 0,5 0,587619 0,643056 0,681205 0,708964 0,729979 0,6 0,651360 0,687140 0,713398 0,733401 0,749073 0,7 0,723115 0,740967 0,755101 0,766513 0,775872 0,8 0,804109 0,807566 0,810729 0,813400 0,815726 0,9 0,895811 0,891733 0,887770 0,883881 0,880022 1,0 1,000000 1,000000 1,000000 1,000000 1,000000 Průběhy vytvořujících funkcí Pravděpodobnost vyhynutí Limitní hodnotu pravděpodobnosti vyhynutí lze získat jako nejmenší kladný kořen rovnice z=g(z), kde g(z) = g1(z) = p0 + p1z + p2z2 + ... V našem případě řešíme rovnici z = 0,358504 + 0,341655z + 0,190533z2 + 0,069583z3 + ... Výsledek: 834043,0=ξ . Je zajímavé posoudit rychlost konvergence posloupnosti qn pravděpodobnosti vyhynutí potomků v ženské linii v jednotlivých generacích k příslušné limitní hodnotě 834043,0=ξ viz 1. sloupec v tabulce 3. Pro zajímavost ještě uvedeme limitní hodnoty pravděpodobnosti vyhynutí potomků v ženské linii pro různé země (údaje jsou z roku 1960). země ξ Peru 0,2620 Japonsko 0,3242 Mexiko 0,4066 Maďarsko 0,7130 USA 0,8209