4. Bodové a intervalové odhady parametrů a parametrických funkcí 4.1. Motivace: Vycházíme z náhodného výběru X[1], ..., X[n] z rozložení L( ), které závisí na parametru . Parametr neznáme a chceme ho odhadnout pomocí daného náhodného výběru (případně chceme odhadnout nějakou parametrickou funkci h( )). Bodovým odhadem parametrické funkce h( ) je statistika T[n] = T(X[1], ..., X[n]), která nabývá hodnot blízkých h( ), ať je hodnota parametru jakákoliv. Existují různé metody, jak konstruovat bodové odhady (např. metoda momentů či metoda maximální věrohodnosti) a také různé typy bodových odhadů. Omezíme se na odhady nestranné, asymptoticky nestranné a konzistentní. Intervalovým odhadem parametrické funkce h(υ) rozumíme interval (D, H), jehož meze jsou statistiky D = D(X[1], ..., X[n]), H = H(X[1], ..., X[n]) a který s dostatečně velkou pravděpodobností pokrývá h( ), ať je hodnota parametru jakákoliv. 4.2. Definice: Definice parametrického prostoru a parametrické funkce Nechť X[1], ..., X[n] je náhodný výběr z rozložení L( ). Množina všech hodnot, jichž může parametr nabývat, se nazývá parametrický prostor a značí se Ξ. Libovolná funkce h( ) se nazývá parametrická funkce. 4.3. Definice: Definice nestranného odhadu, lepšího nestranného odhadu, posloupnosti asymptoticky nestranných odhadů a konzistentních odhadů Nechť X[1], ..., X[n] je náhodný výběr z rozložení L( ), h( ) je parametrická funkce, T, T[1], T[2], ... jsou statistiky. a) Řekneme, že statistika T je nestranným odhadem parametrické funkce h( ), jestliže E(T) = h( ). (Význam nestrannosti spočívá v tom, že odhad T nesmí parametrickou funkci h( ) systematicky nadhodnocovat ani podhodnocovat. Není-li tato podmínka splněna, jde o vychýlený odhad.) b) Jsou-li T[1], T[2] nestranné odhady téže parametrické funkce h( ), pak řekneme, že T[1] je lepší odhad než T[2], jestliže D(T[1]) < D(T[2]). c) Posloupnost se nazývá posloupnost asymptoticky nestranných odhadů parametrické funkce h( ), jestliže (Význam asymptotické nestrannosti spočívá v tom, že s rostoucím rozsahem výběru klesá vychýlení odhadu.) d) Posloupnost se nazývá posloupnost konzistentních odhadů parametrické funkce h( ), jestliže (Význam konzistence spočívá v tom, že s rostoucím rozsahem výběru klesá pravděpodobnost, že odhad se bude realizovat „daleko“ od parametrické funkce h( ).) 4.4. Důsledek: Vztah mezi jednotlivými typy bodových odhadů Lze dokázat, že z nestrannosti odhadu vyplývá jeho asymptotická nestrannost a z asymptotické nestrannosti vyplývá konzistence, pokud posloupnost rozptylů odhadu konverguje k nule. 4.5. Věta: Věta o vlastnostech bodových odhadů odvozených z jednoho náhodného výběru. Nechť X[1], ..., X[n ]je náhodný výběr z rozložení se střední hodnotou μ, rozptylem σ^2 a distribuční funkcí Φ(x). Nechť n ≥ 2. Označme M[n] výběrový průměr, S[n]^2 výběrový rozptyl a pro libovolné, ale pevně dané označme F[n](x) hodnotu výběrové distribuční funkce. Pak pro libovolné hodnoty parametrů μ, σ^2 a libovolnou hodnotu distribuční funkce Φ(x) platí: a) M[n] je nestranným odhadem μ (tj. E(M[n]) = μ) s rozptylem D(M[n]) = , b) S[n]^2 je nestranným odhadem σ^2 (tj. E(S[n]^2) = σ^2) s rozptylem D(S[n]^2) = , kde γ[4] je 4. centrální moment c) pro libovolné, ale pevně dané je výběrová distribuční funkce F[n](x) nestranným odhadem Φ(x) (tj. E(F[n](x)) = Φ(x)) s rozptylem . d) Posloupnost je posloupnost asymptoticky nestranných a konzistentních odhadů μ, e) je posloupnost asymptoticky nestranných a konzistentních odhadů σ^2, f) pro libovolné, ale pevně dané je posloupnost asymptoticky nestranných a konzistentních odhadů Φ(x). 4.6. Poznámka: Výběrová směrodatná odchylka S není nestranným odhadem směrodatné odchylky σ. To by platilo, pokud S by byla náhodná veličina s degenerovaným rozložením, tj. nabývala by pouze konstantní hodnoty. Pak totiž D(S) = E(S^2) – [E(S)]^2 = σ^2 – [σ]^2 = 0. Ilustrace: Vlastnosti výběrového průměru a výběrového rozptylu budeme ilustrovat na náhodném výběru rozsahu 100 z rozložení Rs(0,1). V tomto případě E(X[i]) = 1/2, D(X[i]) = 1/12, i = 1, …, 100. Pomocí systému STATISTICA vygenerujeme pro každou z náhodných veličin X[1], …, X[100] 100 realizací a uložíme je do proměnných v[1], …, v[100]. Dále vypočítáme průměr a rozptyl těchto realizací, uložíme je do proměnných PRUMER a ROZPTYL. Graficky znázorníme hodnoty některé z proměnných v[1], …, v[100] (např. v[1]) a hodnoty proměnné PRUMER: Vidíme, že hodnoty proměnné v[1]^ kolísají od 0 do 1, zatímco hodnoty proměnné PRUMER se nacházejí v úzkém pásu kolem 1/2. Dále vypočteme průměr a rozptyl např. proměnné v1 a proměnné PRUMER a dále vypočtěte průměr proměnné ROZPTYL. Průměr proměnné v1 by měl být blízký 0,5, rozptyl 1/12 = 0,083. Průměr proměnné PRUMER by se měl blížit 0,5, zatímco rozptyl by měl být n = 100 x menší než 1/12, tj. 0,00083. Dále průměr proměnné ROZPTYL by se měl blížit 1/12 = 0,083. Nestrannost výběrové distribuční funkce budeme ilustrovat na náhodném výběru rozsahu 1000 z rozložení N(0,1). Získáme výběrovou distribuční funkci tohoto výběru a její graf porovnáme s grafem distribuční funkce náhodné veličiny se standardizovaným normálním rozložením. Graf výběrové distribuční funkce má černou barvu, graf distribuční funkce standardizovaného normálního rozložení má červenou barvu. Průběh výběrové distribuční funkce F[1000](x) je velmi podobný průběhu distribuční funkce Ф(x). Pokud bychom postup zopakovali s podstatně menším rozsahem náhodného výběru (např. n = 100), průběh obou funkcí by se lišil výrazněji: 4.7. Věta: Věta o vlastnostech bodových odhadů odvozených z r ≥ 2 nezávislých náhodných výběrů. Nechť , ..., je r stochasticky nezávislých náhodných výběrů o rozsazích n[1] ≥ 2, ..., n[r] ≥ 2 z rozložení se středními hodnotami μ[1], ..., μ[r] a rozptylem σ^2. Celkový rozsah je . Nechť c[1], ..., c[r] jsou reálné konstanty, aspoň jedna nenulová. Označme lineární kombinaci výběrových průměrů a vážený průměr výběrových rozptylů. Pak pro libovolné hodnoty parametrů μ[1], …, μ[r] a σ^2 platí: , E(S[*]^2) = σ^2. Znamená to, že lineární kombinace výběrových průměrů je nestranným odhadem lineární kombinace středních hodnot a vážený průměr výběrových rozptylů je nestranným odhadem rozptylu σ^2. 4.8. Věta: Věta o vlastnostech bodových odhadů odvozených z jednoho dvourozměrného náhodného výběru. Nechť (X[1],Y[1]), ..., (X[n],Y[n]) je náhodný výběr z dvourozměrného rozložení s kovariancí σ[12] a koeficientem korelace ρ. Označme S[12] výběrovou kovarianci a R[12] výběrový koeficient korelace. Pak pro libovolné hodnoty parametrů σ[12 ]a ρ platí: E(S[12]) = σ[12], E(R[12]) ≈ ρ (shoda je vyhovující pro n ≥ 30). Znamená to, že výběrová kovariance S[12] je nestranným odhadem kovariance σ[12], avšak výběrový koeficient korelace R[12] je vychýleným odhadem koeficientu korelace ρ. 4.9. Definice: Definice intervalu spolehlivosti Nechť X[1], ..., X[n] je náhodný výběr z rozložení L( ), h( ) je parametrická funkce, α (0,1), D = D(X[1], ..., X[n]), H = H(X[1], ..., X[n]) jsou statistiky. a) Interval (D, H) se nazývá 100(1-α)% (oboustranný) interval spolehlivosti pro parametrickou funkci h( ), jestliže: P(D < h( ) < H) ≥ 1-α. b) Interval (D, ∞) se nazývá 100(1-α)% levostranný interval spolehlivosti pro parametrickou funkci h( ), jestliže: P(D < h( )) ≥ 1-α. c) Interval (-∞, H) se nazývá 100(1-α)% pravostranný interval spolehlivosti pro parametrickou funkci h( ), jestliže: P(h( ) < H) ≥ 1-α. Číslo α se nazývá riziko (zpravidla α = 0,05, méně často 0,1 či 0,01), číslo 1 – α se nazývá spolehlivost. 4.10. Poznámka: Doporučený postup při konstrukci intervalu spolehlivosti a) Vyjdeme ze statistiky V, která je nestranným bodovým odhadem parametrické funkce h( ). b) Najdeme tzv. pivotovou statistiku W, která vznikne transformací statistiky V, je monotónní funkcí h( ) a přitom její rozložení je známé a na h( ) nezávisí. Pomocí známého rozložení pivotové statistiky W najdeme kvantily w[α/2], w[1-α/2], takže platí: : P(w[α/2] < W < w[1-α/2]) ≥ 1 – α. c) Nerovnost w[α/2] < W < w[1-α/2] převedeme ekvivalentními úpravami na nerovnost D < h( ) < H. d) Statistiky D, H nahradíme jejich číselnými realizacemi d, h a získáme tak 100(1-α)% empirický interval spolehlivosti, o němž prohlásíme, že pokrývá h( ) s pravděpodobností aspoň 1 – α. (Tvrzení, že (d,h) pokrývá h( ) s pravděpodobností aspoň 1 – α je třeba chápat takto: jestliže mnohonásobně nezávisle získáme realizace x[1], ..., x[n] náhodného výběru X[1], ..., X[n] z rozložení L( ) a pomocí každé této realizace sestrojíme 100(1-α)% empirický interval spolehlivosti pro h( ), pak podíl počtu těch intervalů, které pokrývají h( ) k počtu všech sestrojených intervalů bude přibližně 1 – α.) (Volba oboustranného, levostranného, nebo pravostranného intervalu závisí na konkrétní situaci. Např. oboustranný interval spolehlivosti použije konstruktér, kterého zajímá dolní i horní hranice pro skutečnou délku μ nějaké součástky. Levostranný interval spolehlivosti použije výkupčí drahých kovů, který potřebuje znát dolní mez pro skutečný obsah zlata μ v kupovaném slitku. Pravostranný interval spolehlivosti použije chemik, který potřebuje znát horní mez pro obsah nečistot μ v analyzovaném vzorku.) Ilustrace: Jestliže 100x nezávisle na sobě uskutečníme náhodný výběr z rozložení se střední hodnotou μ a pokaždé sestrojíme 95% empirický interval spolehlivosti pro μ, pak přibližně v 95-ti případech bude ležet parametr μ v intervalech spolehlivosti a asi v 5-ti případech interval spolehlivosti μ nepokryje. 4.11. Příklad: Nechť X[1], ..., X[n] je náhodný výběr z N(μ,σ^2), kde n ≥ 2 a rozptyl σ^2 známe. Sestrojte 100(1-α)% interval spolehlivosti pro neznámou střední hodnotu μ. Řešení: V tomto případě parametrická funkce h( ) = μ. Nestranným odhadem střední hodnoty je výběrový průměr M = . Protože M je lineární kombinací normálně rozložených náhodných veličin, bude mít také normální rozložení se střední hodnotou E(M) = μ a rozptylem D(M) = . Pivotovou statistikou W bude standardizovaná náhodná veličina ~ N(0,1). Kvantil w[α/2] = u[α/2] = -u[1-α/2], w[1-α/2] = u[1-α/2]. : 1 – α ≤ P(-u[1-α/2] < U < u[1-α/2]) = . Meze 100(1-α)% intervalu spolehlivosti pro střední hodnotu μ při známém rozptylu σ^2 tedy jsou: D = , H = . Při konstrukci jednostranných intervalů spolehlivosti se riziko nepůlí, tedy 100(1-α)% levostranný interval spolehlivosti pro μ je a pravostranný je . Dosadíme-li do vzorců pro dolní a horní mez číselnou realizaci m výběrového průměru M, dostaneme 100(1-α)% empirický interval spolehlivosti. 4.12. Příklad: 10 krát nezávisle na sobě byla změřena jistá konstanta μ. Výsledky měření byly: 2 1,8 2,1 2,4 1,9 2,1 2 1,8 2,3 2,2. Tyto výsledky považujeme za číselné realizace náhodného výběru X[1], ..., X[10] z rozložení N(μ, 0,04), kde parametr μ neznáme. Najděte 95% empirický interval spolehlivosti pro μ, a to a) oboustranný, b) levostranný, c) pravostranný. Řešení: m = 2,06, σ^2 = 0,04, σ = 0,2, α = 0,05, u[0,975] = 1,96, u[0,95] = 1,64. ad a) d = m - u[1-α/2] = 2,06 - 1,96 = 1,94 h = m + u[1-α/2] = 2,06 + 1,96 = 2,18 1,94 < μ < 2,18 s pravděpodobností aspoň 0,95. ad b) d = m - u[1-α] = 2,06 - 1,64 = 1,96 1,96 < μ s pravděpodobností aspoň 0,95. ad c) h = m + u[1-α] = 2,06 + 1,64 = 2,16 μ < 2,16 s pravděpodobností aspoň 0,95. 4.13. Poznámka: (o šířce intervalu spolehlivosti) Nechť (d, h) je 100(1-α)% empirický interval spolehlivosti pro h( ) zkonstruovaný pomocí číselných realizací x[1], ..., x[n] náhodného výběru X[1], ..., X[n] z rozložení L( ). a) Při konstantním riziku klesá šířka h-d s rostoucím rozsahem náhodného výběru. b) Při konstantním rozsahu náhodného výběru klesá šířka h-d s rostoucím rizikem. Ilustrace: ad a) Grafické znázornění závislosti dolních a horních meze 95% empirických intervalů spolehlivosti pro střední hodnotu normálního rozložení při známém rozptylu na rozsahu náhodného výběru: Vidíme, že šířka intervalu spolehlivosti klesá se zvětšujícím se rozsahem náhodného výběru, zprvu rychle a pak stále pomaleji. ad b) Grafické znázornění závislosti dolních a horních mezí 100(1-α)% empirických intervalů spolehlivosti pro střední hodnotu normálního rozložení při známém rozptylu a konstantním rozsahu výběru na riziku: Vidíme, že šířka intervalu spolehlivosti s rostoucím rizikem klesá. 4.14. Příklad: (stanovení minimálního rozsahu výběru z normálního rozložení) Nechť X[1], ..., X[n] je náhodný výběr z N(μ, σ^2), kde σ^2 známe. Jaký musí být minimální rozsah výběru n, aby šířka 100(1-α)% empirického intervalu spolehlivosti pro střední hodnotu μ nepřesáhla číslo Δ? Řešení: Požadujeme, aby Δ ≥ h – d = . Z této podmínky dostaneme, že . Za rozsah výběru zvolíme nejmenší přirozené číslo vyhovující této podmínce. Odvozený vzorec použijeme v této situaci: v příkladu 4.12. (a) se uživateli zdá 95% empirický interval spolehlivosti (1,94; 2,18) pro střední hodnotu μ příliš široký. Přál by si, aby šířka 95% empirického intervalu spolehlivosti nepřesáhla číslo 0,16. Dostáváme tedy n ≥ = = =24,01. Podmínku tedy splňuje číslo 25.