PLÁNOVANIE REGRESNÉHO EXPERIMENTU Predložený text bol spracovaný hlavne podľa [5],[6],[7]. 1. ZÁKLADNÉ POJMY prípravy experimentu spočíva v stanovení cieľových parametrov a pokiaľ tieto nie su priamo observovateľné (merateľné), v stanovení dostatočného počtu takých priamo observovateľných parametrov, ktoré sú vo vhodnom (vysvetlíme neskôr) známom funkčnom vzťahu s cieľovými parametrami. Vektor cieľových parametrov označme ß. Budeme predpokladať, že ß £ 1Z . Priamo observovateľné (merateľné) teoreticky bezchybné parametre (veličiny) označme //i, //2, •••, /Wjv0, teda počet priamo merateľných veličín je Vo. Ďalej predpokladáme, že poznáme funkciu f(-) : Kk -► KN° (vyjadruj úcu merateľné parametre ako funkcie cieľových parametrov). Túto situáciu popisuje teoretický model V = f(/3) / hiß) \ f Aß) \fN0(ß)J Príklad 1.1. Úlohou je stanoviť súradnice ßi,ß2 bodu A vzdialenosti i^i ^ 1^2-, l^z (daných) bodov B bodu A. Teoretický model merania je [x\,yi, C = (ßi i ß2), keď meriame [x2,y2) D = (x3,y3) od V y/(ßi-*i)2 + (ß2-yiy VW X2, + {fh m, V(/5i-^)2 + (/32-y3; Príklad 1.2. Treba určiť váhu troch predmetov ß\, ß2, ßz na ručičkových váhach (majú jednu misku). Vážiť môžeme veličiny //i, ...,//g, pričom teoretický model váženia je //il\ í ß° \ fJ-2 ßo + ßi fJ-3 ßo + ß2 fl4 ßo + ßz fJ-5 ßo+ßi+ ß2 fJ-6 ßo + ßl + ßs fi7 ßo + ß2 + ßs V/LÍ8/ V/5o +/3i +/?2 +/537 1 z kde napr. /lo znamená, že vážime prázdne váhy, /!$ znamená, že vážime spolu prvé a druhé závažie, atd. Stretli sme sa tu aj s novým fenoménom, a síce parametrom ßo. Je to nulový údaj váh (prázdne váhy). Voláme ho tzv. rušivým parametrom. Z našich úvah ho vylúčime, hoci z modelu merania ho vylúčiť nemôžeme. V nasledujúcom budeme predpokladať, že teoretický model merania je lineárny (alebo linearizovaný) v cieľových parametroch, t.j. /5\ ;i.i) r = t(ß) = Fß w ß, kde F je známa No x k matica plánu, í- je jej i—ty riadok. Model z príkladu 1.2 je lineárny. Model z príkladu 1.1 vieme linearizovať. Ako ? Príklad 1.1 - pokračovanie. Nech x\ = 0,00m, y\ = 0,00m; x2 = 2365,22m, j/2 = 0,00m; xs = 3603,67m, j/3 = 823,35m. Približné (namerané) hodnoty fj.1 w 1980,102m, /i2 ~ 2040, 243m, /i3 ss 2598, 878m. Z rovníc 1980,102 = V(/?io-0,00)2 + (/?2O-0,00)2 2040, 243 = V(/?io - 2365, 22)2 + (ß20 - 0, 00)2 spočítame hodnoty /?io a ß2o, z čoho dostávame /?io = 1131,5m a ß2o = 1625, 0m. Funkciu f linearizujeme (rozvinieme do Taylorovho radu a zanedbáme členy rádu druhého a vyšších) okolo hodnôt /?io a ß2o, teda m « V(ßio-xty + (ß2o-yt)2 + l(a ßl°-x;==sß1 VÍPio - % i) + (P20 - Vi)2 ßlQ - Vi r n ■ 1 o Q dß2, i = 1,2,3. VÍÄO - X%f + (ß20 - ž/z)2 Dostávame linearizovaný model (1.1) Vi-1980,131 \ / 0,571%+0,821% \ / 0,571 0,821' /i2 - 2040, 267 = -0, 605% + 0, 796% = -0,605 0,796 /ii -2598,897/ \-0, 951% + 0, 308% / \-0,951 0,308 % s (novými) parametrami %l a %2- Observovateľný parameter /ii samozrejme nepoznáme presne. Výsledok jeho zmerania je číslo m, ktoré považujeme za realizáciu náhodnej veličiny Y{. Váha tohto merania je A^ a je nepriamo úmerná disperzii T>(Yi). Všetky merania považujeme v nasledujúcom za neskorelované. Dostávame sa k stochastickému modelu merania. V prípade, že práve jedenkrát (nezávisle) meriame každý priamo observovateľný ó parameter /^, i = 1,2, ...,iVo a váhy jednotlivých meraní sú A^, i = 1, 2,..., iVo, stochastický model merania je lineárny regresný model (Yjv0,i, ^N0,kßk,i^ c2A_1). Observačný vektor (vektor meraní) Y má vektor stredných hodnôt F/3 a kova-riančnú maticu *-ir o 0 nZ2Az. 0 \ /^\ o i I f;2 V o a2 (X^A-VÍ -1 V^/J Zadefinujme si niektoré základné pojmy. 5 Definícia 1.5. Funkcia 8 : {l,2,...,iVo} -> <0,1> pre ktorú platí X]i=i 0} nazývame spektrom (suportom, nosičom) návrhu S. Samozrejme Sp(S) C {1, 2,..., No}. Meráme tie veličiny /ii1, /ii2,..., /iir spomedzi všetkých experimentálnych bodov (observovateľných veličín, parametrov), teda z množiny S = {//i,..., /Wjv0}, ktorých indexom plán S priradil nenulovú hodnotu, čiže pre ktoré S (i j) > 0. Definícia 1.7. Matica M(S)= J2 *(0W/, i£Sp(S) kde í- je daný vektor, pre ktorý platí i[ß = /ii, sa nazýva informačná matica experimentu pri návrhu S. Definícia 1.8. Majme S = {//i,...,//jv0} (množinu priamo observovateľných parametrov) a návrh S. Celkový počet meraní je N. Cieľové parametre sú ß G 1Z . Poznáme f i - vektor, pre ktorý platí í-ß = /ii a \i - váhu merania veličiny /ii, i = 1,2, ...,iVo. Rešpektujeme plán S, t.j. opakujeme n i = N 5 (i) krát meranie veličiny /ii, ak prirodzené číslo i G Sp(S). Potom lineárny regresný model experimentu s (presným) návrhom S je (1.2) (Ys,Fsß, spĺňajúcich podmienku X]i=i TZ je lineárny pozitívny funkcionál definovaný na priestore Sk symetrických matíc typu k x k, pre ktorý platí (i) V{A, B G Sk} L(A + B) = L(A) + L(B), (ii) V{a G "K}V{A G S*} L(aA) = aL(A), (iii) V{A G 0. Definícia 2.2. Návrh 8*D G Ares je D—optimálny ak deť[M_1(^)] = mm{deí[M_1(č)] : í G Ares}. Definícia 2.3. Návrh SA G Ares je A—optimálny ak Tr[M-\S*A)] mm {TriM-^S)] : č G Are5}. Definícia 2.4. Návrh 8*L G Ares je L—optimálny ak LiM-^Sl)] mm {LpVT1^)] : SeAreg}. Nech je vektorový parameter ß G 1Z vyjadrený v tvare ßi ßi kde ßi (užitočný parameter) je k\ rozmerný a /?2 (rušivý parameter) je &2 rozmerný, pričom k\-\-k2 = k. V súlade s týmto rozkladom je rozložená aj informačná matica a jej inverzia. Teda platí, že pri použití plánu S a celkovom počte meraní N je 2 kovariančná matica cov(ß\) = — M1'1 (í), kde Definícia 2.5. Návrh 8*D G Areg je reštringovane D—optimálny ak det[Mhl(S*Dr)] = mm{det[Mhl(S)] : S G Areg}. Definícia 2.6. Návrh SA G Areg je reštringovane A—optimálny ak Tr[Mhl(SAr)] = mm{Tr[Mhl(S)] : í G Areg}. Trochu odlišné je kritérium S—optimality. Definícia 2.7. Návrh 5^ G Areg je S — optimálny ak a s-^m-1^; mm a V--M-\5) SeArea,N = 1,2, 'reg j 9 kde S je dopredu zadaná cieľová kovariančná matica výsledného odhadu vektorového parametra ß, pričom ||A|| = yTr(AA'). V prípade S—optimality hľadáme nielen plán í£, ale aj optimálny počet meraní N*. Kritérium D—optimality má nasledovnú interpretáciu: Ak Ys ~ Nn(Fsß, sAsFs)] ** ^det[M.-1(8)}: D—optimalita návrhu zaručuje minimálny objem konfidenčného elipsoidu. Pri použití tohoto kritéria je niekedy potrebné kontrolovať približnú guľatosť konfidenčného elipsoidu. Príliš veľké rozdiely medzi veľkosťami jeho hlavných poloosí môžu niekedy signalizovať nežiadúce vlastnosti návrhu. Na druhej strane D—optimalita má tzv. minimaxnú vlastnosť (pozri vetu 3.1 v kapitole 3). Táto vlastnosť návrhu S môže byť v niektorých prípadoch veľmi dôležitá. Preto sa D—optimalita v praxi pomerne často používa. Pretože 2 cov[ßs] = ^M-1(8), A—optimálny plán minimalizuje súčet disperzií odhadov zložiek vektora ß. Kritérium A (A—optimalita) je špeciálnym prípadom L—optimality, lebo Tr(-) je lineárny a pozitívny funkcionál. Pri riešení odhadu lineárnej funkcie h(ß) = h'ß s minimálnou disperziou odhadu (pozri začiatok tejto kapitoly) ide zase o L—optimálny plán, lebo funkcionál L(-) definovaný vzťahom L(A) = h'Ah (h je daný pevný vektor) je opäť pozitívny lineárny funkcionál. Špeciálnym prípadom L—optimality je aj reštringovaná A—optimalita, keď minimalizujeme TrfM1'1^)] (pozri (1.2)) vhodnou voľbou S £ Areg. Matica M1'1 (S) patrí parametrom, pre ktoré chceme minimalizovať súčet disperzií ich odhadov. V prípade S—optimality ide o maximálne priblíženie (v danej norme) matice 2 cov(ß) = —M-1 (S) k cieľovej matici S. Okrem uvedených kritérií sa objavujú kritériá motivované špeciálnymi požiadavkami užívateľa. Obyčajne majú konvexnú (alebo konkávnu) kriteriálnu funkciu. Niekedy sa použije kritérium, ktoré je konvexnou kombináciou uvedených kritérií. Jedná sa o snahu udržať dobré vlastnosti oboch kritérií, alebo potlačiť nežiadúcu lU vlastnosť návrhu optimálneho podľa jedného kritéria priblížením k návrhu optimálneho podľa iného kritéria. Podrobná teória o kritériách optimality je napr. v [7], kde je uvedená aj bohatá literatúra o optimálnom navrhovaní regresného experimenta. 3. Vety o ekvivalencii pre niektoré kritériá optimality Veta 3.1. Nasledujúce tvrdenia sú ekvivalentné. 1. Návrh 8*D G Areg je D—optimálny, teda detlM'1 (S*D)] = mm{deť[M-1(í)] : S G Areg}. 2. Návrh 8*D G Areg minimalizuje d(S) = max{\if-M.~1(S)fi : i = 1, 2,..., No}, teda d(8*D) = min{d(S) : S G Areg}. 3. d(8*D) = k (dimenzia vektora ß). Dôkaz. Dôkaz vety realizujeme nasledovným spôsobom: 1. =>- 2. a súčasne 2. <^ 3. a 2. =*► 1. 1. =>■ 2. a súčasne 2. <^ 3. Nech 8*D G Areg je D-optimálny, teda de^M'1 (5*D)] = mm{deť[M-1(í)] : S G -o da THM-^M-MO^) + M(č)]} = -TrIM + TrM"1^)]^) lim Tr{[(l - a)M(^) + aMÍÍ)]"1 h~((l - a)M(S*D) + aM(í))]} = Tr[M"1(^) J] 5(0Aifif/]-Ä;= ]T Č^A^M"1^^ - A; ^ 0, i£Sp(S) iesp(S) teda (3.1) ]T íCOAif/M-^í^fi^A;. Ak vezmeme jednobodový návrh S so Sp(í) = {«o}, tak z (3.1) pre io = 1, 2,..., Vo 11 čiže (3.2) d(S*D) = max{\li'iM-1{8*D)il : i = 1, 2,..., N0} S k. Pravda pre každý regulárny návrh S G Areg platí Wo Wo (3.3) k = TrM-1 (S)M(S) = Tr[M_1(5) J] A^Oftf/] = ^ Č^Ajť/M-1^. Okrem toho pre každý í G Ares je (3.4) maxiXifiM'1 (8)fi : i = 1,2, ...,iV0} ^ fc. Dôkaz tvrdenia (3.4) vykonáme sporom. Ak by pre nejaký návrh r\ G Areg bolo max{A,f/M-1(í/)fj : i = l,2,...,iV0} < k, tak Wo Wo Y/^)^M-1{r])fl S ^T^ma^A^M"1^ : i = l,2,...,iV0} = i=l i=l Wo = maxiX^M-1 (r?)fř : z = 1, 2,..., iV0} ]T r,{i) = i=l = maxiXifiM'1 (ri)fi : i = l,2,...,iV0} < k, čo je v spore s (3.3). Z (3.2) a (3.4) pre 8*D (pretože 8*D G Areg) dostávame k ^ d(8*D) ^ A;, čiže ^(^d) = k = min{d(S) : í G Ares}. Dokázali sme 1. =£> 2. a tiež 2. <š4> 3. 2.=^ 1. Ak teda máme regulárny návrh S G Ares, tak (/(í) = max{\tťlM-1(S)ít : z = l,2,...,iV0} ^ d(^) = fc, kde í£, je (ľubovoľný) D—optimálny návrh. Nech S G Areg minimalizuje d(S) =max{\li'iM-1{8)il : i = l,2,...,iV0} na množine Areg. Musí byť (3.5) d(S) = k, 12 (lebo podľa (3.4) pre každý S G Areg je d(S) ^ k a pre (ľubovoľný) D—optimálny návrh 8*D je d(8*D) = k). Platí (pretože 8*D je D—optimálny) 0 < detM-1^) S detM-1^), teda (podľa lemy 8.9) k (3.6) 1 ^ deíM^deíM-1^) = deipVE^M-1^)] = JJtí i=l (71,...,, 7fe sú vlastné hodnoty matice M($£>)M-1($), ktoré sú podľa lemy 8.8 reálne a kladné), čiže k \ k (3.7) ^irbi • Na druhej strane podľa lemy 8.10, lemy 8.9 a (3.5) je (k \ k 1 k i=i / i=i = ÍTrM(^)M-1(í) = ÍTrM-1(í) ]T í|,(0Wi = 1 E ^(OAif/M-1^^ = 1 S ^(OmasíAif/M-1^: i = 1,2, ...,JV0} = (3.8) =1 y, s*D(i)d(s) = ^k y, ^(0 = 1, z čoho dostávame k (3.9) n^=i- i=l Zo vzťahov (3.6) a (3.9) máme 1 S detMiS^detM-1 (S) S 1, teda detM(S*D) = detM(8), čo znamená, že deťM.(S) = max{deťM.(/i) : /i G Ares}, alebo ekvivalentne (/etM_1(í) = mm{deťM-1(/i) : /i G Ares}. Dokázali sme 2. =£> 1. a aj celú vetu. D 13 Veta 3.2. Nasledujúce tvrdenia sú ekvivalentné. 1. Návrh S*A G Areg je A-optimálny, teda Tr[M_1(^)] = mm{Tr[M-1(č)] : 8 G Ares}. 2. JVávri <^ G Ares minimalizuje A(8) = max{\li[[M-1{8)]2il : ž = 1,2,..., iV0}; teda A(8A) = min{A(8) : í G Ares}. 3. A(^) = TrM"1(^). Dôkaz. Dôkaz vety realizujeme nasledovným spôsobom: 1. =>■ 2., 1. =>■ 3., 2. =>■ 1., 3. => 1. 1.^2. Nech <^ G Ares je A-optimálny, teda TrM-1((%) = mm{TrM_1(i) : í G Ares}. Vezmime ľubovoľný návrh 8 a a G< 0, 1). Návrh 8 = (1 — ct)<^ + aí je podľa lemy 8.11 regulárny, pričom M(Š)= J2 [(l-a)SA(i) + aS(i)]\títťt = (l-a)M(S*D) + aM(S). iesp(š) Pre a G< 0, 1) je funkcia h(a) = TrM-1 (8) spojitá diferencovatelná, pričom h(0) = min{h(a) : a G< 0, 1)}. Teda h{0) ú h(a) pre a G< 0, 1) a musí byť lim —h(a) > 0 a^o da (ide o deriváciu sprava). Pomocou dôsledku 8.4 (položíme tam C = I) dostávame d lim — rrM_1((l - a)8*A + a8) = t*->-o da lim TrM'1 ((l - a)S*A + aS) a—>-0 d — M((l -a)8A + a8) da M-1 ((1 - a)8*A + aS) lim TrM-1 ((1 - a)S*A + aS) a—>-0 |[(l-a)M(^)|aM(í)] da M_1((l -a)SA + aS) -TrM'1 (5A)[-M(5A) + M^M"1^ A, (3.10) TrM"1(^)[M(^) - M(5)]M_1(^) ^ 0. Ak si vezmeme jednobodový návrh S so spektrom Sp(S) = {io}} tak z (3.10) pre z0 = 1,2, ...,iV0 je TrM-1 (SA)[M(SA) - XíJíJIJM-^SZ) = TrM-1(^)-TrM-1(^)Ařofřof;oM-1(^; = TrM-1(^)-Ařof;nM-2(^)fřo^0, 14 čiže pre i = 1,2,..., No TrM-1(^)^Ařf;M-2(^)fř, teda (3.11) TrM"1^) ^max{Ařf;M-2(^)fř : z = 1, 2,..., iV0} = A(S*A). Pre ľubovoľný regulárny návrh S G Ares platí Wo Wo YJS(i)[XlTrM-1(S)flťtM-1(S)] =Tr J] ^)AíM-1(í)fíf;M-1(í) = (3.12) Wo = TrM"1 (S) Y^ S^X^M'1 (S) = TrM"1 (Í)M(Í)M"1 (S) = TrM"1 (í), i=l teda pre ľubovoľný regulárny návrh S G Ares je Wo TrM-^S) = ^2S(i)[XlTrM-1(S)flf'lM-1(S)] ^ i=l Wo ^ ^í(z)max{AzTrM-1(í)fzf;M-1(í) : i = l,2,...,iV0} = i=l = maxiXÚiM-1^)]2^ : i = l,2,...,iV0} = A(8), čiže Z predpokladu TrM_1(í^) = mm{TrM_1 (í) : í G Ares} teda TrM'1 (S*A) = miniTrM-1 (S) : S G Ares} S mm{A(S) : í G Ares}. Ale z (3.11) máme TrM"1^) ^ A(S*A). Dostávame A(^) ^ TrM"1^) S mm{A(S : í G Ares}, čím sme dokázali 1. =>■ 2. Súčasne musí byť (3.13) A(S*A) S TrM'1 (S*A) = min{A(S : S G Ares}, teda (3.14) A(^) = TrM"1(<^) 15 a dokázali sme 1. =>■ 3. Teraz 2. =>■ 1. Nech í* G Ares minimalizuje A(S) na množine Ares.Z predpokladu (3.15) TrM_1(r) > mzn{TrM_1(í) : í G AreJ = TrM_1^) vyplynie spor. Potom totiž musí existovať návrh S} že pre funkciu s(a) = TrlVr1((l - a)A* + a8), a G< 0, 1) platí -o da Keďže S* minimalizuje A(5), je maxiXÚiM-1^)]2^ : z = l,2,...,iV0} S S maxiX^iM-1 (S*A)]2ít : i = 1, 2,..., iV0} = = TrM"1 ((%) = mznjTrM"1 (í) : í G Areg} a súčasne z platnosti (3.15) vyplýva (analogickou cestou ako odvodzovanie (3.10)), že lim -^-TrM^Ul - a)S* + aS) = «-►o da = TrM_1(r)[M(r) - M(í)]M"1(r) = Wo = TrM"1 (S*) - TrM"1 («HE A^^f^M"1 (S*) ^ i=l ^ TrM_1(r) - max{XiTrM-1(8)fifiM-1(8*)} = (3.17) = TrM_1(r) - A( TrM"1^), čiže (3.18) TrlVr1^*) ^ mm{rrM_1(i) : S G Ares} = TrM"1^). Samozrejme (3.19) m!ri{TrM_1(i) : í G Arej} ^TrM_1(í*) a dostávame, že TrM"1^*) = miniTrM-1 (S) : č G Ares}. lö Dokázali sme 2. =>■ 1. Konečne dokážeme sporom 3. =>■ 1. Nech í** G Ares je taký návrh, ktorý neminimalizuje TrM_1($), čiže TrM"1^**) > TrlVr1^) = mi^TrM-1^) : í G Ares}. Potom ale musí existovať návrh S} že S = (1 — a)S** + aS má vlastnosť, že o da Podobnou cestou ako pri odvodzovaní (3.17) a s využitím (3.12) a (3.21) dostávame Wo d= lim —TrM^rô) = TrM"1^**) - V A^(z)TrM"1(r*)f,f;M-1(r*) ^ i=i ^TrM^Or^-mazíAif/pM-1^**)]2^ : i = 1, 2,..., iV0}, d + maxiXJliM-1 (S**)]2ít : i = l,2,...,iV0} ^TrM"1^**; alebo -TrM'1 (S**) + maxiX^iM-^S**)]2^ : z = l,2,...,iV0} ^ -d > 0, teda A((T*) = max{Azf;[M-1(r*)]2f, : i = l,2,...,iV0} > TrM"1^**). Dokázali sme 3. =>■ 1. aj celú vetu. D A—optimalita je špeciálnym prípadom L—optimality, keď funkcionál L(-) je definovaný pre daný pevný vektor h G 1Z ako L (A) = h'Ah (pozri záver 2. kapitoly). Vetu o ekvivalencii pre L—optimálny návrh dokazujeme analogicky ako pre A—optimálitu (pozri [5], str. 68). Tu šiju len sformulujeme. Veta 3.3. Nasledujúce tvrdenia sú ekvivalentné. 1. Návrh S*L G Areg je L-optimálny, teda LfM"1^)] = min{I[M_1(í)] : S G 2. Návrh Ó*L G Areg minimalizuje l(ó) = maic^LfM"1 (í)fťf/M"1 (ó)] : i = 1,2,..., N0}, teda l(8*L) = min{l(8) : S G Areg}. 3. l(Sl) = L[M-\Sl)]. Veta o ekvivalencii pre reštringovaný A—optimálny plán vyplýva z vety 3.3, keď minimalizujeme L[M_1 (S)] = Tr[Wl1,1(S)] (pozri (2.1). Teraz si ešte uvedieme vetu o ekvivalencii pre reštringovaný D—optimálny plán. lY Veta 3.4. Nasledujúce tvrdenia sú ekvivalentné. 1. Návrh 8*D G Areg je reštringovane D—optimálny, teda det\NV-,x (8*D )] = min{det[M1^{8)]: 5 £ Areg}. 2. Návrh 8*D G Areg minimalizuje dr(8) = max{\if-M~1 (8) f i — \z(f(t2)yM-i(8)f(t2) : i = 1,2,...,A0}; teda dr(S*Dr) = min{dr{8) : 8 G Areg}. Tu ß = (ß'n ß'2)' a rozklad M($) a f^ zodpovedá rozkladu vektora ß na jednotlivé suhvektory, m2i1(í) m2i2(í);' h-{f^J- 3. dr(8*D ) = k\ (dimenzia vektora ß\). Dôkaz, je zložitejší a vynechávame ho (pozri [2], str. 115). Skúsený užívateľ môže na základe intuície alebo predchádzajúcich skúseností vypracovať taký návrh, že je blízko optimálneho (podľa zvoleného kritéria opti-mality). Napr. ak max {Aif/M-1(í*)fi : i = l,2,...,iV0} je len nepodstatne väčší ako dimenzia k vektora /3, potom návrh 8* je z hľadiska praktického použitia D—optimálny a nemusíme ho už nijako vylepšovať. Podobne uvažujeme i pri ostatných vyššieuvedených kritériách. Používame pritom 3. tvrdenia viet o ekvivalencii. Ak predbežný návrh výrazne nespĺňa požiadavku 3. tvrdenia príslušnej vety o ekvivalencii, potom tento návrh iteračne vylepšíme postupom uvedeným v ďalšej kapitole. 4. Iteračne určenie optimálneho návrhu Lema 4.1. Nech d(i,8) = f/M-1(č)fj, pričom 8 G Areg a i G {1, 2,..., N0}. Pre ľubovoľný plán 8 G Ares, i G {1,2,..., No} a a G (0, 1) platí detUl - ct)M(5) + aAifif/] = (1 - a)* j 1 + . " ,\zd(i, 8) 1 detMÍS). { (1-a) J Dôkaz. Ak si zvolíme v leme 8.14 A = (1 — a)M(8), B = y/aXifi, C = — y/aXif-, D = 1, dostávame z rovnosti detAdet(D - CA_1B) = detľ)det(A - BD_1C) tvrdenie lemy. D Lema 4.2. Nech 8 G Areg, 8 ^ 8*D. Potom max{det[(l - a)M(S) + aX&f-] : a G (0, 1), i = 1, 2,..., N0} = pričom i* je také číslo z množiny {1,2,..., No}, že \i*d(i*, 8) = max{\id(i, 8) : i = 1, 2,..., No}. M(8) 18 Dôkaz. Z lemy 4.1 je vidieť, že det[(l — a)M(í) -\-a\ifif-] je rastúca funkcia veličiny \id(i,8) (táto veličina nezávisí od a). Aby sme (pre daný plán 8 G Areg) dosiahli maximum det[(l — a)M(í) + aXiíií-], musíme použiť hodnotu \i*d(i*,S) a maximalizovať (1 — a) < 1 +----------\i*d(i*,5) > deťM.(8) vzhľadom na a. Budeme l (1-a) J maximalizovať lndet[(l — a)M(í) + a\i*fi*f-*] vzhľadom na a. d — IndetUl - a)M(8) + aAť.fi.f/.] = da = — \ k ln(l - a) + In \ 1 + " . Až* t/(z*, í) l + ZradeíM(č) aa [ [ (1 — a) J A; 1 A,* 0, teda a* > 0. Ľahko sa presvedčíme, že d2 ;lndet[(l - a)M(8) + a\z*fz*f-*~ <0, a=a* čiže takto určený extrém je maximum. Teda max{det[(l - a)M(S) + aX&f-] : a G (0, 1), i = 1, 2,..., iV0} mai{(l - «f <^ 1 +---------r\id(i, 8) } detM(8) : a G (0,1), i = 1, 2,..., iV0} (1 — a) *x* ' - a = (1 - a*)k l 1 +-------—\i.d(i*,8) \ detM(S) = bi^hl*ľ) k ( k~l ) k" detM(8) > detM(8). D k J \\t*d(i*,d) - 1) Veta 4.3. Nech pre postupnosť plánov 5o,5i,... platí 8S+1 = (1 - o*+1)8s + a*+1Az*+ifz*+if;*+i, pričom z*+1 je určené z rovnice \i*+id(i*s+1,8s) = max{\td(i,Ss) : i = 1,2,..., N0} = = maxiXd-M-1 (8s)fr. i = l,2,..., N0} 19 * _ ^:+1d(i*s+l7Ss) -k as+1 ~ [Ať:+1d(i:+1,ía)-i]fc' Nech Si ť^ 5p, i = 1, 2,..., potom lim deíM(ča) = deiM(c|,). Dôkaz, je zložitý a potrebuje hlbšie vniknúť do teórie, pozri napr. [7],[2]. Preto ho tu vynecháme. V predchádzjúcich tvrdeniach opísaná optimálna voľba čísel a*, s = 1,2,..., je dosť zložitá. Jednoduchší postup pre voľbu čísel as a tiež iteračný postup, ktorý sa osvedčil v praxi je nasledovný. Nech So je štartovací návrh. Prvé zlepšenie, ktoré vedie k návrhu 8\ je konvexná kombinácia plánu So a vhodne zvoleného "jednobodového" návrhu 8* so spektrom Sp(8*) = {«*}, teda S1 = (1 - a0)S0 + aQ8*, a0 G (0, 1). Návrh 82 je opäť konvexná kombinácia plánu 8\ a vhodne zvoleného "jednobodového" návrhu í| so spektrom Sp(í|) = {«2)5 teda £2 = (1 — 0-1)81 + «1^2, «i G (0, 1). Takto postupujeme, až získame návrh Sopt} ktorý spĺňa zvolené kritérium optimality dostatočne presne. Voľba štartovacieho návrhu 80, voľba čísel «o, cti,... a voľba postupnosti i*, ií,}..., je daná nasledujúcimi pravidlami. Nech Sp(ío) = {&i, *2, •••, i k} a hodnoty návrhu $0 v bodoch spektra nech sú So(i) = -r, i G Sp(ío)- Je vhodné, aby štartovací plán mal v spektre práve k indexov, alebo len o málo väčší počet indexov ako k {k je dimenzia vektora parametrov ß). Voľba štartovacieho plánu So musí byť taká aby jeho informačná matica M($o) bola regulárna. Regularita tejto matice je ekvivalentná nevychýlenej (nestrannej) odhadnuteľnosti vektora parametrov ß (pozri vetu 1.9). V ďalšom budeme pokračovať tak, že počet bodov spektra štartovacieho plánu bude rovný k. ľahko sa dajú upraviť nižšie uvedené vzťahy pre prípad inej voľby (väčšieho počtu) bodov spektra štartovacieho plánu. Ak i* G Sp(So)} potom zrejme Sp(Si) = Sp(So). Hodnoty 8\(j) zvolíme podľa nasledujúceho pravidla SM ak j k + 1 --------, ak j ť^ i* a súčasne j G Sp(So] , 0, inak. Zu Ak i\ (£ Sp(So), potom Sp(Si) = Sp(So) U {i^} a 1 SiU)={ k + 1 1 ak j = i*. -, ak j ^ i* a súčasne j G Sp(ío} /C "p l , 0, inak. Úplne analogicky postupujeme v ďalších iteraciach. Ak Sp(Sp) = {i1,i2,...,ikp} aij+1 G Sp(Sp), potom Sp(8p+1) = Sp(8p), 6p+1(i*+1) a pre ostatné indexy j G Sp(Sp) je (k + p)8p(í;+1) +1 k + p+l SP+i(J) (k+p)8p(j) k+p+l Ak i*+1 <£ Sp(8p), potom a pre j G Sp(8p) je a pre ip+1 je Sp(6p+1) = Sp(6p)\J{i;+1} (k+p)8p(j) yM^(8s)fy>] ■. j = i,2,...,n0}, 2Í A—optimalita: Ai:+1f/. ^M-1^)]2^ = maxiX^iM-1^)]2^: j = 1, 2,..., iV0}, s = 0,1,2, L—optimalita: Xi:+iL[M-\Sa)fi:+JÍ. M-^Ss)] {XjL[M-1(8a)fjťjM-1(8a)]: j = l,2,...,iVo}, 11 v yJj *As i^*7 -■—* i-1-*-"- \vjs/-B-7-B-'j s = 0,1,2,... . Pri uvedenom sekvenčnom vylepšovaní štartovacieho návrhu So je potrebné na každom ďalšom kroku znovu určiť inverziu príslušnej informačnej matice plánu. Pri väčšom počte parametrov k a väčšom počte iterácií (niekedy rádovo 100 — 1000 iterácií) je iterovanie informačných matíc náročnou numerickou úlohou. Poznámka 4.4. Pri iteratívnom vylepšovaní štartovacieho návrhu So s výhodou používame vzťah M-U+.) = [M(í.) + uuT> = M-U) - M-(Í.)»»'M-(Í.) l + u'M-i^u (pozri Lemu 8.15). V našom prípade (ak v štartovacom návrhu holo práve k experimentálnych hodov) je M(SS+1)= ]T W^+iíO = i£Sp(Ss + 1) = J2 Wifystt) k + 3 +1 + A»:+if':+if»:+1^+l(^+i) = i£Sp(Ss + 1) *#*3+l = 1k + S M(SS) +-------------A,* f,* f' . k + s + 1 y J k + S + 1 *.+l *.+l «.+1 Preto ... ,v/i-,♦.. f A/r-i k + s "' ]fe + s + a,* f;, M-^f,* 1 3+1 »s+1 V ' 3+1 5. Pravidlá pre zastavenie iterácií Pravidlá z predchádzjúcej kapitoly zaručujú konvergenciu iteračne vylepšovaných návrhov k návrhu optimálnemu. Konvergencia nemusí vždy postupovať tak rýchle, ako by sme si to priali, ale na druhej strane ani nepotrebujeme, aby proces dokonvergoval. Postačí nám vyhovujúce priblíženie k optimálnemu plánu. Toto zz priblíženie si stanovíme pravidlom zastavenia pomocou dostatočne malého kladného čísla e > 0. Iterácie zastavíme pri návrhu, ktorý označíme Spos[ (posledný). D—optimalita: Posledný návrh Spos[ bude ten, pre ktorý platí maxi-Xjf^M-^Sposi)^ : j = l,2,...,iV0} < 1 + e. Dá sa dokázať, že v tomto prípade platí detM-^Spo posl) detM.-1(8*D) k 1 < ™„™ r \ f'i\/r-i maxi-Xjf'M-^Spo^fj : j = 1, 2,..., N0}. A—optimalita: Posledný návrh Spos[ bude ten, pre ktorý platí max {XjťAM-^Spos^fj : j = 1,2,..., No} -TrM"1^^) < e. L—optimalita: Posledný návrh Spos[ bude ten, pre ktorý platí maxiXjLiM-^Spos^M-^Spos^] : j = 1,2,..., N0} - LpVT1^,)] < e. Reštringovaná D—optimalita (určujeme prvých k\ súradníc vektora ß): Posledný návrh Spos[ bude ten, pre ktorý platí maxi f(2)vi\/t-i {-A^fjM-^Of,- - (f y})'M-\(8posl)í Z)] : j = 1,2,..., N0} yyi-^8posl)iy>] ■. 3 = i,2,...,n0}. 6. S-OPTIMALITA Podľa definície 2.7 návrh 5^ G Ares je S—optimálny ak a s-^m-1^; min a S.-M-1^) : SeAreg,N = 1,2,..., , kde S je dopredu zadaná cieľová kovariančna matica výsledného odhadu vektorového parametra ß. Hľadáme 5^ a N*. Označme g* G U, i = 1,2,..., No Zó G' (gi:g2:...,:gjv0 o Pri nejakom N a návrhu 5^ má NNLO ß kovariančnú maticu —M 1(S^), ktorej inverzia je N —M(^) = G'N aA o V o *Ž(2) 0 o o \ S^No)/ G. ^0 Ak existujú nezáporné čísla 5^,(1), 5^,(2),..., 5^, (No), (pre ktoré X]i=i ^ľ(0 = -0 že platí (6.1; G'iV 0 0 ^(2) 0 o \ G = S-1. V 0 0 8£(N0)/ tak sme našli 5^, aj N* = N. Podľa lemy 8.18 sa dá systém (6.1) prepísať ako \ ÍG'(8)G>ec 0 0 ^(2) 0 0 V 0 uecS 0 6Z(No)/ ktorý sa dá ešte zjednodušiť tým, že sa vynechajú rovnice pre {S 1}íj, pre ktoré i < j (dostaneme k(k rovníc). Ak označíme y taký vektor, ktorý dostaneme keď vo vektore uecS-1 vynecháme súradnice {S_1}íj, pre i < j a A takú maticu, ktorú dostaneme keď v matici G' (x) G' vynecháme práve tie isté riadky, ktoré zodpovedajú súradniciam vynechaným vo vektore uecS-1, tak nájsť S—optimálny návrh (pri nejakom N) je ekvivalentné hľadaniu vektora x £ 1Z H M, kde No M = {xeF°: Xl^0,x2^0,...,x Nr > X j N}, ktorý (vektor) minimalizuje veličinu K(x.) = x'A'Ax - 2y'Ax. Problém riešime ako úlohu kvadratického programovania (pozri napr. [3], str. 118). Riešenie Xo = N (5^,(1), 5^,(2),..., S^(No))' nám dáva optimálny návrh 5^, pridanom počte meraní N. Uvažujme teraz dva návrhy s rôznym počtom meraní. Pri prvom experimente nech je tento počet iVi, pri druhom N2. V obidvoch experimentoch nech sú matica Zi A a vektor y rovnaké. Nech Xi je riešenie našej úlohy pre prvý experiment a X2 je riešenie úlohy pre druhý experiment. Môže nastať situácia, že if(xi) < Ä"(x2), teda s menším počtom meraní sa v prvom experimente lepšie priblížime k predpísanej matici S-1. Samozrejme dáme prednosť návrhu prvého experimentu. Táto úvaha nás vedie k nasledovnej modifikácii definície S—optimálneho návrhu, s ktorou v praxi vystačíme. Vektor Xo = Nopt6^ nazveme približne S—optimálnym, ak minimalizuje veličinu K(x.) = x'A'Ax — 2y'Ax, jeho komponenty 2:0,1, xo,2, •••, ^o,JV0 su nezáporné a pre komponenty vektora 6^ platí X]i=i ^ľ(0 = 1- Číslo Nopt je optimálny počet meraní, pričom Nopt ^ NmaX} kde Nmax je maximálny počet meraní, ktorý v danom experimente ešte pripúšťame. Zrejme Wo <%(0 = ^No\ ' Nopt = ^2x0l. i=l EiVo z=1x0t Ak použijeme označenie K(x.) = x'A'Ax - 2y'Ax, B !iVo,iVo A u - f °wo,l 1,1,...,!/' KNr, 1 tak Xo minimalizuje Ä"(x), pričom spĺňa podmienky Bxo ^ b (toto označenie chápeme tak, že pre zvolený komponent vektora na ľavej strane zodpovedajúci komponent vektora na pravej strane nie je menší). Problém riešime opäť metódami kvadratického programovania. 7. Určenie optimálneho návrhu experimentu v niektorých špeciálnych prípadoch Niekedy máme za úlohu určiť optimálny návrh experimentu, keď množina priamo observovatelných parametrov nie je konečná. Predpokladajme, že množina priamo observovate'lných parametrov je {/jx = f'xß : x G< a, b >}, 1 (T2(x ] kde íx = (1, x, x2,..., x 1)'. Majme tiež dané váhy A^ ako A^ = , pričom (72{X) 0-2 (') Je polynóm, ktorý nemá korene v intervale < a, b > a jeho stupeň je menší alebo sa rovná 2{k — 1). V tomto prípade existuje D—optimálny návrh 8*D, že Sp(8*D) = {x^^x^, ...,x^}. Pre návrh 8*D platí 8*D{x(l)) = \, i = l,2,...,k. Dôkaz tvrdenia nájdete v [7]. Ako určiť body x^1', x^2\ ..., x^ > spektra tohto D—optimálneho návrhu ? Dostaneme ich riešením maximalizačnej úlohy k k TTa-2(^)) TT x^e,...,xWefJi A^ i>j max I I g [xyj/ 1 I I \x%> — xJ> Zb za podmienky x^1' < x^2' < ... < x^ '. Ide o úlohu maximalizácie reálnej funkcie k reálnych premenných. Iný prípad, keď vieme napísať optimálny návrh je ak {jix = i'xß : x G< a,b >}, kde fj. = (1 . tí/ . tí/ . . . . . tí/ J ÍUj váhy A^ sú konštantné. Nech y £ 1Z— < a^b >. Odhadujeme hodnotu i'ß = ^7=1 yJ~1ßj (predikcia, alebo extrapolácia). Optimálny návrh experimentu v tomto prípade je ten, ktorý vedie k minimalizácii disperzie odhadu f'/3, čiže je to L—optimálny návrh, kde lineárny funkcionál L(-) je definovaný ako L(A) = í'Aíy. Označme z^ = COS k — i k-ľ -TT % — X . Zi. .... K . Hľadaný L— optimálny návrh pre extrapoláciu 8*L má spektrum pozostávajúce z bodov a + b+(b-a)zW Ái) % — X . Zi. .... í\i takých, že platí *L(s(o)=n [x(l) -y) (x(i) - x^)) Dôkaz pozrite v [7], kde sú dokázané aj iné podobné tvrdenia pre nájdenie optimálnych návrhov v niektorých špeciálnych situáciách. 8. Pomocné tvrdenia Nech B je regulárna n x n matica, ktorej prvky sú diferencovatelnými funkciami premennej t, čiže {B}íj = bij = bij (t), i, j = 1,2,..., n, dB . . , dbijCt) . . , n -—— je n x n matica, ktorej prvky su —------, i,j = 1,2,..., n ot ot ddetB . . ddetB . . je n x n matica, ktorej prvky su ——-----, i,j = 1,2,..., n, dB db u diagB Lema 8.1. Platí /{B}i,i 0 ... 0 \ 0 {B}2,2 ... 0 V 0 {B}n,n/ dB"1 dt B ^ľB Vo Dôkaz. Prvky matice B 1 označme b\- , i, j = 1,2,..., n. Tiež sú diferencova- telnými funkciami premennej t, čiže b- = b- (t),i, j = 1,2 1,2,..., n je %) -ZJ y-n-u -,-,...,rc. ťre i,j {BB-1}hJ = YJbtk(t)b{-1\t)=St k=i (Si j je tzv. Kroneckerovo delta, čiže Si j = 0 pre i ^ j a $íj = 1 pre i = j ■) Preto 0=|{BB-}j d 1 ^ dt k=i í"1), t>ik(my'(t) fc=i «,j 1,2,...,n, fc=i čo v maticovom zápise je <9B„ -, „aß-1 äľB +B—=°- cize «51 = -B-™B-. D at at Lema 8.2. JVeci C je n x n matica konštánt. Platí dTrBC m dB Dôkaz. dTrBC ät a ^EE5'^^ = SS 06ťi(í) i=l J = l i=l J = l aß aB D Z predchádzajúcich dvoch liem priamo dostávame Dôsledok 8.3. Platí dTrB m aB —^— = Tr——. dt dt Dôsledok 8.4. Platí aTrB-^C dt -TrCB' -i3B(í) j li Lema 8.5. Platí ddetB í (det B)(B-1)', ak je B nesymetrická dB ~ \ (detB)(2B_1 - diagB'1), ak je B symetrická. Dôkaz. Determinant regulárnej n x n matice B sa dá písať ako detB = {B}hlBhl + {B}h2Bh2 + ... + {B}hnBhn pre i G {1,2, ...,re}, pričom Bst je doplnok (n — l)-ho stupňa determinantu detB patriaci k prvku {B}Sjí (pozri napr. [4], str. 270). Preto ddetB d d{B}ij d{B}ij Dostávame ({B}i,i-5i,i + {B}i;2-Bi,2 + ••• + {B}ljHBl ddetB d{B} Bi, hj ddetB dB lebo B /-Bl,l Bl,2 ■■■ Bl,n\ B2)l B22 ■ ■ ■ B2)n \Bn i Bn2 ... Bn n/ / Bi,i B2jl detB detB -Si,2 B22 detB detB (detB)(B" Bn,i \ detB Bn,2 detB -i\/ B\^n B2)7l Bn,n V det B detB '" det B / (pozri napr. [4], str. 320). Toto platí o nesymetrickej matici B. V prípade, že B je symetrická, teda {B}rjŕj = {B(&ii, &12,..., bin, b22, &23, • • •, b2n,..., bn-i n-i, bn-i n, bnn)}r,s = brS} ak r ú s, Pre symetrickú maticu teda B /{B}M {B}li2 {B}2,i {B}2,2 \{B}nil {B}n,2 bsr, ak r > s. {B}l,n\ /bn bi2 bi2 b22 {B}2,n {B}n,n/ bin \ b2n \bln b2n ■ ■ ■ bnn ' Preto ddetB _ v^ v^ ddetB <9{B}M _ ddetB d{B}t ~ tť,^ d{B}kJ ba ~ d{B}hZ bü db,. ZS d d{B}ht Pre i < j'je 3detB [{B}M5M + {B}l)2Bl)2 + ... + {B}l)nBhn} .1 = 5ťii, z = 1, 2,..., n. db u EE ödetB <9{B}M _ ddetB d{B}hJ ddetB d{B}ht ^<9{B}M bij d{B}ij bij d{B}J:l btJ d d{B} hj [{B}M5M + {B}l)2Bl)2 + ... + {B}l)nBhn} .1 + + «řJi— [{B^i^-i + {B};,2£i,2 + - + {B}i,nSi,n] -1 a{B} J,« -"«,.? ~r -".?,«• Úplne rovnako pre i > j dostaneme ddetB dbtj BjA + B% ]i cize / ddetB dB ddetB ddetB ddetB dbn ddetB db12 ddetB dbln ddetB db12 db22 db2n ddetB ddetB ddetB dbln db2n dbnn \ (detB)(2B_1 -diagB'1). D Lema 8.6. Pre symetrickú regulárnu n x n maticu B platí dlndetB(t) -, dB(t) v - = TrB"1 v ; dt dt Dôkaz. Ak si uvedomíme, že B aj B 1 sú symetrické matice, teda pre i > j platí {dB 1 f dB 1 ~ďt í = I ~ďt í a tvrclenie predchádzjúcej lemy, čií cize ,3 V y J: ödetB _ f 2{B-1}ZjJ(/etB, ak z < j, d&ij ~ l {B-^i^deťB, ak i = j, dost avame dlndetB{t) _ 1 ddetB _ 1 ^.^. ddetB dbtJ _ ľ dB dt detB dt detB EE i=i j=i dbj,- dt dt >%3 2\) Lema 8.7. A, B nech sú symetrické mxm matice, A je pozitívne defínitná. Potom existuje nesingulárna mxm matica U taká, že platí UAU' = I, UBU' = A, pričom A je diagonálna. Dôkaz. Označme Wi,...,wm ortonormálně charakteristické vektory matice A a jej charakteristické čísla prislúchajúce týmto charakteristickým vektorom. Teda Awj = diWi, i = 1,2,..., m. Cize existujú matice W = (wi:w2:... :wm) a D /di 0 0 d2 0 V 0 0 ... dmJ ze alebo AW = WD, WW' = WW = I, W'AW = D, WDW = A, WD1W' = A1 O značme Di (\ßl o 0 y^ V 0 o 0 \ o cim / D* 0 0 \ 0 o o ... -l-J C = WD5W'. Matica C je regulárna, symetrická, pričom C2 = WD5 WWD5 W' = WDW' = A, teda WD-2-W' = C"1 a C"2 = A"1. Matica S = C^BC1 je symetrická. Nech Si,...,sm sú jej ortonormálně charakteristické vektory a Ai,...,Am charakteristické čísla prislúchajúce týmto vektorom, teda O značme C BC Si = XiSi, i = 1,2,..., m Z £ — V-^ S^, % — 1, A, ..., Tfl. Zrejme A_1Bz,- = A^BC^sí = A^CC^BC^sí = A_1CA,-s,- = C_1A,-s,- = A,-z,-. au Preto Zi, i = 1, 2,..., m sú charakteristické vektory matice A 1R&\i, i sú im prislúchajúce charakteristické čísla, čiže 1, 2,..., m A 1Bzz = \tzt, i = 1,2,..., m. Pre maticu U' = {2,1.2,2'-■ ■■'■2,m) platí UAU' /Z \ V z' / A(zi:z2:...:zr / z'xAzi z'xAz2 z2Azi z2Az2 Zi-A-Zm \ z2Az V z' Azí z' Az2 ... z' Azm/ lebo z'jAzj = z'jC'Czj = s'^Sj = $ij. Ďalej UBU' /Z \ B(zi:z2:...:zr /Ai 0 0 A2 V z' / 0 \0 0 ... Xm/ lebo zJBzj = z^AA^Bz, = z^A^Bz, = s^CT^C^BC"^- = = síC^BC^Sj = Aj-s'iSj. D Lema 8.8. JVeci Mi,M2 sú m x m symetrické a pozitívne defínitné matice, Ai,...,Am sú charakteristické čísla matice MiM2~ . Potom sú Ai,...,Am reálne a kladné. Dôkaz. Ai,..., Am sú riešením rovnice de^MiM"1 -AI) = 0, ktorá je ekvivalentná nasledujúcim rovniciam det[(M1 - AM2)M2"1] = 0, det(M1 - AM2) = 0, deť[M|(M^^MiM^^ - AI)Mj] = 0, tó(M2"%iM2^ - AI) = 0. _ 1 _i Pretože M2 2MiM2 2 je pozitívne definitná matica, všetky jej vlastné čísla, teda _ 1 _ 1 riešenia rovnice n i=i / i=i Dôkaz. Ak a ^ 0, b ^ 0, tak (8.6) ab<,^(a2+b2), lebo (a - b)2 ^ 0, teda postupne a2 - 2ab + b2 ^ 0 a2 + 62 > 2a& ÓZ — (a + b2) >ab. Nech Ai ^ O, A2 ^ O, a položme v (8.6) a = yAi ? b = VÄ2 • Potom z (8.7) Nech ďalej Ai,A2,A3,A4 sú nezáporné. Podľa (8.7) platí 1.6) ^fhT2 = ab<. -(A1 + A2). VÄ^^ -(Ai + A2) a VÄÔI^ -(A3 + A4), čiže (znovu využijúc (8.7)) ^aia2a3a4 = \jyx^yxäi s Jg(Ai + A2)-(A3 + a4) s < 2(Ai+A2) + -(A3 + A4) Ai + A2 + A3 + A4 4 Matematickou indukciou dokážeme, že (8.5) platí pre n = 2 (k je prirodzené číslo). Pre k = 2 (8.5) platí. Nech platí (8.5) pre n = 2 , ukážeme, že platí aj pre n = 2 +1. Teda nech platí 2K 9« < n h **i> , i=l i=l Vezmime Ai,A2,...,A2fe,A2fe_|_1,...,A2fe+i=22fe. Naozaj ,2fe+1 \ 2fe+1 n a, i=i \ 2k nA) (iia^+í < vl=l \ 7 z ^zCAí^zCA2fe+J i=l J=l . < < -i- 2 2k 2k 2k \ 2fe + 1 /C Aí + ^ /C A2fe+J = ^I+I /C Aí i=l J = l i=l Teraz ukážeme, že ak (8.5) platí pre nejaké n ^ 2, tak platí aj pre n — 1 (spätná indukcia). Uvažujme Ai, A2,..., An_i, \n = -----------------------------. Všetky A^ sú nezáporné. n — 1 Teda ak nerovnosť (8.5) platí pre (nejaké) n ^ 2, má tvar AiA2...An_ Ai +A2 + ... + An. < 1 n Ai +A2 + ... + An_i + n — 1 Ai + A2 + ... + An_i n — 1 n — 1 (Ai +A2 + ... + An_i; óó Nerovnosť (8.8) sa dá písať tiež ako n-l r _J_1 ~^T~ (n-l \ n-l L5*) . čiže (ak aspoň jedno A^ > 0) n-l p i (n-l \ n-l L S-) TI Umocnením na -------- dostávame n — 1 i (n — l \ n —1 1 n — l n M š^ev i=l / i=l Tým sme lemu dokázali pre každé n = 1, 2,... . D Lema 8.11. Majme dva návrhy $i,$2, pričom Si £ Areg. Pre a £< 0,1) patrí S = (1 — a)$i + a$2 do Ares a M(č) = (1 - a)M(íi) + aM(í2). Dôkaz. Najprv ukážeme, že S je návrh. Skutočne S je zobrazenie z {1,2,..., iVo} —> < 0, 1 >, pre ktoré platí Wo ]T^)= ]T (1-<*)(*! (0 + a 0 a In(-) je všade na (0,oo) spojitá, diferencovatelná a konkávna, je (/(•) (ako funkcia a) na < 0, 1) spojitá, diferencovatelná a konkávna. D Uveďme jednu z charakteristických vlastností funkcie lndeťM.(6) na množine {M{6) : 6 G Areg}. Lema 8.13. Funkcia lndet(.) je na množine {M($) : 6 £ Areg} konkávna. Dôkaz. Vezmime ľubovoľné $1, $2 G Ares. Podľa lemy 8.7 existuje regulárna matica U, že UM(íi)U' = I a UM(í2)U' = A (diagonálna). Pretože In(-) je na (0, 00) (rýdzo)konkávna funkcia, dostávame pre každé a £< 0, 1 > lndet[(l - a)M(či) + aM(í2)] = ZradeťU_1[(l - a)I + aA]U'_1 = k = ln{detU~2det[(l - a)I + aA]} = lndet\J~2 + In JJ[(1 - a)l + aAz] = i=l A: k = lndeť\J~2 + ^ ln[(l - a)\ + aAz] ^ lndeť\J~2 + ^[(1 - «)/nl + aZnAz] = i=l i=l = lndet\J~ + alndetA = (1 — a)lndet\J~ + a[/n