Bayesiánská analýza
III. Normální lineární regresní model s přirozeně konjugovanou apriorní
hustotou (více vysvětlujících proměnných)
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 1 / 41
Obsah tématu
1 Lineární regresní model
2 Věrohodnostní funkce a apriorní hustota
3 Posteriorní hustota
4 Porovnání modelů
5 Intervaly nejvyšší posteriorní hustoty
6 Predikce
7 Monte Carlo integrace
8 Empirická ilustrace
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 2 / 41
Úvod
Koop (2003) – kapitola 3
Normální lineární regresní model s více vysvětlujícími proměnnými.
Použití maticové algebry.
Přirozeně konjugovaný prior ⇒ analytické výsledky (podobně jako u
modelu s jedinou vysvětlující proměnnou).
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 3 / 41
Lineární regresní model
Obsah tématu
1 Lineární regresní model
2 Věrohodnostní funkce a apriorní hustota
3 Posteriorní hustota
4 Porovnání modelů
5 Intervaly nejvyšší posteriorní hustoty
6 Predikce
7 Monte Carlo integrace
8 Empirická ilustrace
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 4 / 41
Lineární regresní model
LRM v maticovém vyjádření I
k vysvětlujících proměnných xi1, . . . , xik pro i = 1, . . . , N a model:
yi = β1 + β2xi2 + . . . + βkxik + i .
Úrovňová konstanta: xi1 = 1.
Vektory N × 1 a k × 1:
y =







y1
y2
·
·
yN







=







1
2
·
·
N







β =







β1
β2
·
·
βk







Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 5 / 41
Lineární regresní model
LRM v maticovém vyjádření II
Matice vysvětlujících proměnných rozměru N × k
X =







1 x12 · · x1k
1 x22 · · x2k
· · ·· ·
· · ·· ·
1 xN2 · · xNk







Regresni model:
y = Xβ + .
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 6 / 41
Lineární regresní model
Předpoklady
Předpoklady o a X determinují formu věrohodnostní funkce.
Klasické předpoklady (později uvolněny):
1 ∼ N(0N, h−1
IN), kde h = σ−2
;
2 všechny prvky X jsou nenáhodné veličiny.
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 7 / 41
Věrohodnostní funkce a apriorní hustota
Obsah tématu
1 Lineární regresní model
2 Věrohodnostní funkce a apriorní hustota
3 Posteriorní hustota
4 Porovnání modelů
5 Intervaly nejvyšší posteriorní hustoty
6 Predikce
7 Monte Carlo integrace
8 Empirická ilustrace
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 8 / 41
Věrohodnostní funkce a apriorní hustota
Věrohodnostní funkce I
Věrohodnostní funkce s využitím OLS odhadů:
ν = N − k,
β = (X X)−1
X y,
s2
=
(y − Xβ) (y − Xβ)
ν
.
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 9 / 41
Věrohodnostní funkce a apriorní hustota
Věrohodnostní funkce II
Věrohodnostní funkce:
p(y|β, h) =
1
(2π)
N
2
h
1
2 exp −
h
2
(β − β) X X(β − β)
× h
ν
2 exp −
hν
2s−2
.
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 10 / 41
Věrohodnostní funkce a apriorní hustota
Apriorní hustota
Normální-gama rozdělení, kdy β|h z vícerozměrného normálního
rozdělení, h je stále z gama rozdělení:
β|h ∼ N(β, h−1
V ),
h ∼ G(s−2
, ν.)
Přirozeně konjugovaný prior pro β a h:
β, h ∼ NG(β, V , s−2
, ν).
β: k-rozměrný vektor apriorních středních hodnot pro k regresních
koeﬁcientů, β1, . . . , βk.
V : je pozitivně deﬁnitní apriorní část kovarianční matice rozměru
k × k.
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 11 / 41
Posteriorní hustota
Obsah tématu
1 Lineární regresní model
2 Věrohodnostní funkce a apriorní hustota
3 Posteriorní hustota
4 Porovnání modelů
5 Intervaly nejvyšší posteriorní hustoty
6 Predikce
7 Monte Carlo integrace
8 Empirická ilustrace
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 12 / 41
Posteriorní hustota
Posterior I
Posteriorní hustota – proporcionální součinu věrohodnostní funkce a
apriorní hustoty
Obdobné NLRM s jedinou vysvětlující proměnnou (použití matic).
Posteriorní hustota parametrů:
β, h|y ∼ NG(β, V , s−2
, ν).
Přičemž platí:
V = (V −1
+ X X)−1
,
β = V (V −1
β + X Xβ),
ν = ν + N.
s−2 je implicitně deﬁnováno následovně:
νs2
= νs2
+ νs2
+ (β − β) [V + (X X)−1
](β − β).
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 13 / 41
Posteriorní hustota
Vlastnosti posteriorní hustoty I
Marginální posteriorní hustota pro β má vícerozměrné t-rozdělení:
β|y ∼ t(β, s2
V
2
, ν).
Z deﬁnice t-rozdělení:
E(β|y) = β,
var(β|y) =
νs2
ν − 2
V .
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 14 / 41
Posteriorní hustota
Vlastnosti posteriorní hustoty II
Platí intuice z NLRM s jednou vysvětlující proměnnou (jen vektory
resp. matice).
β je vektor.
Matice (X X)−1: podobná role jako skalár 1
x2
i
v jednoduchém LRM.
V : matice rozměru k × k.
Posteriorní střední hodnota parametru β, β: maticově vážený průměr
apriorní a datové informace.
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 15 / 41
Posteriorní hustota
Neinformativní prior I
Nastavení ν = 0 a V −1
„blížící“ se hodnotou k nule.
Obvykle V −1
= cIk, kde c je skalár blížící se nule.
Nepravá apriorní hustota:
p(β, h) ∝
1
h
.
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 16 / 41
Posteriorní hustota
Neinformativní prior II
Získáme OLS odhady:
β, h|y ∼ NG(β, V , s−2
, ν),
kde
V = (X X)−1
,
β = β,
ν = N,
νs2
= νs2
.
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 17 / 41
Porovnání modelů
Obsah tématu
1 Lineární regresní model
2 Věrohodnostní funkce a apriorní hustota
3 Posteriorní hustota
4 Porovnání modelů
5 Intervaly nejvyšší posteriorní hustoty
6 Predikce
7 Monte Carlo integrace
8 Empirická ilustrace
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 18 / 41
Porovnání modelů
Omezení ve tvaru nerovnosti
Předpokládáme omezení ve tvaru nerovnosti:
Rβ ≥ r.
R je známá matice rozměru J × k a r je známý J-rozměrný vektor.
Porovnáváme dva modely:
M1 : Rβ ≥ r,
M2 : Rβ ≥ r.
Značení v deﬁnici M2 znamená, že jedno nebo více z J omezení v M1
není splněno.
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 19 / 41
Porovnání modelů
Posteriorní podíl šancí I
Snadný výpočet posteriorního podílu šancí, použití neinformativních
priorů není problém:
PO12 =
p(M1|y)
p(M2|y)
=
p(Rβ ≥ r|y)
p(Rβ ≥ r|y)
.
Posteriorní hustota pravděpodobnosti pro β je z vícerozměrného
t-rozdělení ⇒ p(Rβ|y) je z vícerozměrného t-rozdělení.
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 20 / 41
Porovnání modelů
Omezení ve tvaru rovnosti
Případ 1: M1 obsahující omezení Rβ = r a M2, u kterého toto
omezení neplatí (vnořené modely – nested models).
Případ 2: M1 : y = X1β(1) + 1 vzhledem k M2 : y = X2β(2) + 2, kde
X1 a X2 jsou matice obsahující i různé vysvětlující proměnné
(nevnořené modely – non-nested).
Oba případy v deﬁnicí modelů pro j = 1, 2:
Mj : yj = Xjβ(j) + j.
Porovnání nevnořených modelů zahrnuje y1 = y2
Porovnání vnořených modelů deﬁnuje M2 jako neomezenou regresi a
M1 obsahuje omezení Rβ = r (vyžaduje předeﬁnování vysvětlované a
vysvětlujících proměnných).
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 21 / 41
Porovnání modelů
Posteriorní podíl šancí II
Posteriorní podíl šancí – využití marginálních věrohodností.
Marginální věrohodnost:
p(yj|Mj) = cj
|V j|
|V j|
1
2
(νjs2
j )−
νj
2 ,
pro j = 1, 2, kde
cj =
Γ
νj
2 (νjs2
j )
νj
2
Γ
νj
2 π
N
2
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 22 / 41
Porovnání modelů
Posteriorní podíl šancí III
Posteriorní podíl šancí porovnávájící M1 s M2:
PO12 =
c1
|V 1|
|V 1|
1
2
(ν1s2
1)−
ν1
2 p(M1)
c2
|V 2|
|V 2|
1
2
(ν2s2
2)−
ν2
2 p(M2)
.
Posteriorní podíl šancí závisí na apriorním podílu šancí, zvýhodňuje
soulad modelu s daty, koherenci mezi apriorní a datovou informací a
šetrnost pokud jde o počet vysvětlujících proměnných.
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 23 / 41
Porovnání modelů
Porovnání modelů – neinformativní priory
Neformální pravidlo: použití neinformativních priorů pro společné
parametry a čistě informativní priory pro všechny ostatní parametry.
Nastavením ν1 = ν2 = 0: posteriorní podíl šancí má rozumnou
interpretaci (soulad modelu s daty, koherenci mezi apriorní a datovou
informací, atd.)
Rozumné užití neinformativního prioru pro přesnost chyby.
Užití neinformativního prioru pro β(j) – vážné problémy v případě
k1 = k2.
Neinformativní prior pro β(j) založený na V −1
j = cIkj a c → 0.
|V j| = 1
ckj
se vzájemně nevyruší.
Jesliže k1 < k2, PO12 je nekonečno, v případě k2 > k1, PO12 se blíží k
nule bez ohledu na data.
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 24 / 41
Intervaly nejvyšší posteriorní hustoty
Obsah tématu
1 Lineární regresní model
2 Věrohodnostní funkce a apriorní hustota
3 Posteriorní hustota
4 Porovnání modelů
5 Intervaly nejvyšší posteriorní hustoty
6 Predikce
7 Monte Carlo integrace
8 Empirická ilustrace
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 25 / 41
Intervaly nejvyšší posteriorní hustoty
Přípustné intervaly
Volná analogie ke konﬁdenčním intervalům (testování hypotéz).
Deﬁnice pro jediný regresní koeﬁcient βj.
95% přípustný interval pro βj je interval [a, b] takový že:
p(a ≤ βj ≤ b|y) = 0.95.
Existuje nekonečně mnoho přípustných intervalů.
Např. βj|y ∼ N(0, 1) ⇒ 95% přípustné intervaly [−1.96, 1.96],
[−1.75, 2.33], [−1.64, ∞] atd.
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 26 / 41
Intervaly nejvyšší posteriorní hustoty
Highest Posterior Density Intervals
95% HPDI je 95% přípustný interval, který má nejmenší rozsah oproti
jekémukoliv jinému 95% přípustnému intervalu.
Např. [−1.96, 1.96] je nejkratší přípustný interval.
HPDI existuje vždy, když existuje posteriorní hustota
pravděpodobnosti.
Lze jej využít i při neinformativním prioru.
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 27 / 41
Predikce
Obsah tématu
1 Lineární regresní model
2 Věrohodnostní funkce a apriorní hustota
3 Posteriorní hustota
4 Porovnání modelů
5 Intervaly nejvyšší posteriorní hustoty
6 Predikce
7 Monte Carlo integrace
8 Empirická ilustrace
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 28 / 41
Predikce
Prediční hustota
Chceme předpovědět:
y∗
= X∗
β + ∗
.
Předpověď je založena na:
p(y∗
|y) = p(y∗
|y, β, h)p(β, h|y)dβdh.
Lze ukázat:
y∗
|y ∼ t(X∗
β, s2
{IT + X∗
V X∗
}, ν).
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 29 / 41
Monte Carlo integrace
Obsah tématu
1 Lineární regresní model
2 Věrohodnostní funkce a apriorní hustota
3 Posteriorní hustota
4 Porovnání modelů
5 Intervaly nejvyšší posteriorní hustoty
6 Predikce
7 Monte Carlo integrace
8 Empirická ilustrace
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 30 / 41
Monte Carlo integrace
Monte Carlo integrace pro NLRM
Porovnání modelů, predikci a posteriorní analýzu týkající se β lze
provést analyticky (netřeba posteriorních simulátorů).
Theorem (Monte Carlo integrace)
Nechť β(s) pro s = 1, . . . , S je náhodný výběr (vzorek) z p(β|y) a g(·) je
funkce a deﬁnujme
gS =
1
S
S
s=1
g(β(s)
),
potom gS konverguje k E[g(β)|y] pro S jdoucí k nekonečnu.
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 31 / 41
Monte Carlo integrace
Algoritmus
1 Vygenerujeme náhodný výběr β(s) z posteriorní hustoty pro β
použitím generátoru náhodných čísel pro vícerozměrné t-rozdělení.
2 Spočítáme g(β(s)) a zachováme tento výsledek.
3 Opakujeme předchozí kroky S-krát.
4 Spočítáme průměr S náhodných výběrů g(β(1)), . . . , g(β(S)).
Těmito kroky získáme odhad E[g(β)|y] pro jakoukoliv funkci parametrů,
která nás zajímá.
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 32 / 41
Monte Carlo integrace
Numerická standardní chyba
Monte Carlo integrace: aproximace E[g(β)|y] (volbou S řídíme
velikost chyby aproximace).
Číselné měřítko chyby aproximace – využitím centrální limitní věty:
√
S {gS − E[g(β)|y]} → N(0, σ2
g ),
pro S jdoucí k nekonečnu, přičemž σ2
g = var[g(β)|y].
Aproximativní 95% konﬁdenční interval pro E[g(β)|y]
gS − 1.96
σg
√
S
, gS + 1.96
σg
√
S
.
Alternativně lze využít i numerickou standardní chybu (NSE)
σg
√
S
(obsahuje stejnou informaci v kompaktnější podobě).
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 33 / 41
Empirická ilustrace
Obsah tématu
1 Lineární regresní model
2 Věrohodnostní funkce a apriorní hustota
3 Posteriorní hustota
4 Porovnání modelů
5 Intervaly nejvyšší posteriorní hustoty
6 Predikce
7 Monte Carlo integrace
8 Empirická ilustrace
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 34 / 41
Empirická ilustrace
Reálná data
Reálná data o prodejích domů ve Windsdoru, Kanada v roce 1987,
N = 546.
Proměnné:
yi = prodejní cena i-tého domu (v Kanadských dolarech),
xi2 = rozloha i-tého domu (ve čtverečních stopách),
xi3 = počet ložnic v i-tém domě,
xi4 = počet koupelen v i-tém domu,
xi5 = počet pater v i-tém domu.
Hlavní soubory chapter03.m + skript chapter03_neinf.m + řada
dalších podpůrných funkcí.
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 35 / 41
Empirická ilustrace
Reálná data
Předpokládámě vliv rozlohy mezi 0 a 20 dolary za stopu čtvereční ⇒
var(β2) = 25; pro ostatní koeﬁcienty volíme var(β3) = 25002 a
var(β4) = var(β5) = 50002.
var(β) =
νs2
ν − 2
V .
„Téměř“ neinformativní prior a informativní prior s s−2 = 4.0 × 10−8,
ν = 5 a
β =







0.0
10
5000
10000
10000







V =







2.40 0 0 0 0
0 6.0 × 10−7 0 0 0
0 0 0.15 0 0
0 0 0 0.60 0
0 0 0 0 0.60







.
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 36 / 41
Empirická ilustrace
Apriorní a posteriorní střední hodnoty pro β (směrodatné
odchylky v závorkách)
Prior Posterior
Informativní (Inf. prior) (Neinf. prior)
β1
0
(10000)
−4035.05
(3530.16)
−4009.55
(3590.11)
β2
10
(5)
5.43
(0.37)
5.43
(0.37)
β3
5000
(2500)
2886.81
(1184.93)
2824.61
(1210.43)
β4
10000
(5000)
16965.24
(1708.02)
17105.18
(1728.18)
β5
10000
(5000)
7641.23
(997.02)
7634.90
(1004.34)
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 37 / 41
Empirická ilustrace
Apriorní a posteriorní střední hodnoty pro h (směrodatné
odchylky v závorkách)
Prior Posterior
Informativní (Inf. prior) (Neinf. prior)
Stř. hodnota 4 × 10−8 3.05 × 10−9 3.03 × 10−9
Sm. odchylka 2.53 × 10−8 1.84 × 10−10 1.83 × 10−10
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 38 / 41
Empirická ilustrace
Porovnání modelů zahrnující parametr β
Post. podíl šancí
p(βj > 0|y) 95% HPDI 99% HPDI pro βj = 0
Informativní apriorní hustota
β1 0.13 [-10969.27,2899.17] [-13159.75,5089.64] 4.14
β2 1.00 [4.71,6.15] [4.49,6.38] 0.00
β3 0.99 [559.29,5214.34] [-175.96,5949.58] 0.39
β4 1.00 [13610.20,20320.27] [12550.37,21380.10] 0.00
β5 1.00 [5682.82,9599.65] [5064.16,10218.30] 0.00
Neinformativní apriorní hustota∗
β1 0.13 [-11061.65,3042.54] [-13289.45,5270.34] —
β2 1.00 [4.71,6.15] [4.48,6.38] —
β3 0.99 [446.96,5202.27] [-304.15,5953.38] —
β4 1.00 [13710.50,20499.85] [12638.10,21572.25] —
β5 1.00 [5662.07,9607.73] [5038.84,10230.96] —
* Jako neinformativní apriorní hustota byla použita apriorní hustota blížící se čistě
neinformativní hustotě. Podíl šancí tak bylo možno spočítat, ale není zde uváděn.
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 39 / 41
Empirická ilustrace
Predikční hustota pro dům o rozloze 5000 čtverečních stop.
0 2 4 6 8 10 12 14
x 10
4
0
0.5
1
1.5
2
2.5
x 10
−5
Predikovana cena domu, y*
Hustotapravdepodobnosti
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 40 / 41
Empirická ilustrace
Posteriorní výsledky pro parametr β2 spočítané
alternativním způsobem
Směrodatná
Stř. hodnota odchylka NSE
Analyticky 5.43 0.37 —
Počet replikací
S = 10 5.44 0.27 0.085
S = 100 5.43 0.38 0.038
S = 1000 5.44 0.36 0.011
S = 10000 5.44 0.36 0.004
S = 100000 5.43 0.37 0.001
Bayesiánská analýza (BAAN) III. NLRM s NCP (více) Podzim 2011 41 / 41