logo-IBA logo-MU © Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ logo-MU SIGNÁLY A LINEÁRNÍ SYSTÉMY prof. Ing. Jiří Holčík, CSc. holcik@iba.muni.cz, Kamenice 3, 4. patro, dv.č.424 logo-IBA logo-MU © Institut biostatistiky a analýz XIV. ANALÝZA ČASOVÝCH ŘAD levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz ČASOVÁ ŘADA þČasová řada jsou věcně a prostorově srovnatelná pozorování (dat), která jsou jednoznačně uspořádána z hlediska času ve směru minulost – přítomnost. levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz ČASOVÁ ŘADA þČasová řada jsou věcně a prostorově srovnatelná pozorování (dat), která jsou jednoznačně uspořádána z hlediska času ve směru minulost – přítomnost. þ þČasová řada ≡ časově závislá posloupnost hodnot sledované veličiny v diskrétních časových okamžicích ≡ diskrétní signál levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz PŘÍKLADY http://www.cssd.cz/image.php?id=16790 þPreference politických stran v ČR v období od 8/2004 do 3/2008 levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz PŘÍKLADY počty nezaměstnaných v Německu – 07.1975 – 09.1979 (po měsících) levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz PŘÍKLADY levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz ČASOVÉ ŘADY – CO S NIMI? þstručný popis jejích vlastností (pomocí několika některých souhrnných parametrů (statistik)) ß þ k popisu spíše funkce než jednoduchá hodnota, např. klouzavý průměr než střední hodnota; þ složky řady – trend, sezónní změny, pomalé a rychlé změny, nepravidelné oscilace – frekvenční analýza þmodelování průběhu èpochopení procesů způsobujících vznik dat; èpragmatický nástroj pro splnění výše uvedených cílů è např. pomocí lineárních systémů – autoregresivní (AR), integrační (I), s klouzavým průměrem (moving average – MA) levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz ČASOVÉ ŘADY – CO S NIMI? þpredikce budoucích hodnot – velká část analytických metod pro časové řady; þ (Predikce (z lat. prae-, před, a dicere, říkat) znamená předpověď či prognózu, tvrzení o tom, co se stane nebo nestane v budoucnosti. Na rozdíl od věštění nebo hádání se slovo predikce obvykle užívá pro odhady, opřené o vědeckou hypotézu nebo teorii. srvn. forecasting þ þmonitorování průběhu a detekce významných změn - např. sledování funkce ledvin po transplantaci; è levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz ČASOVÁ ŘADA þJAKÉ FENOMÉNY ROZPOZNÁVÁME þV PRŮBĚHU ČASOVÉ ŘADY? þtrend þoscilace levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz ČASOVÁ ŘADA þJAKÉ FENOMÉNY ROZPOZNÁVÁME þV PRŮBĚHU ČASOVÉ ŘADY? þtrend þ celkový, obecný sklon, směřování, vývojová tendence (ABZ.cz) þ … {Y(t)} je (nenáhodná, deterministická?) funkce m(t) = E[Y(t)], kde E[.] označuje očekávanou, resp. střední hodnotu; þ levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz ČASOVÁ ŘADA þJAKÉ FENOMÉNY ROZPOZNÁVÁME þV PRŮBĚHU ČASOVÉ ŘADY? þtrend þoscilace – èkolik oscilačních složek obsahuje a jaké mají kmitočty? levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz ČASOVÁ ŘADA þJAKÉ FENOMÉNY ROZPOZNÁVÁME þV PRŮBĚHU ČASOVÉ ŘADY? þtrend þoscilace – èkolik oscilačních složek obsahuje a jaké mají kmitočty? èjak často budeme odebírat vzorky? è þ levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz ADITIVNÍ MODEL ČASOVÉ ŘADY þpředpokládá, že hodnoty dané časové řady jsou realizacemi náhodné proměnné Yn, která se skládá ze čtyř dílčích složek þYn = Tn + Zn + Sn + Rn, þkde þTn je (monotónní) funkce času (n, nT), kterou nazýváme trend; þZn reprezentuje nenáhodné (deterministické) dlouhodobé cyklické vlivy (ekonomické jevy, roční či déledobější periodicita – všechno je relativní,…); þsložky Tn a Zn se mnohdy slučují k vyjádření dlouhodobého chování časové řady þGn = Tn + Zn levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz ADITIVNÍ MODEL ČASOVÉ ŘADY þpředpokládá, že hodnoty dané časové řady jsou realizacemi náhodné proměnné Yn, která se skládá ze čtyř dílčích složek þYn = Tn + Zn + Sn + Rn, þkde þTn je (monotónní) funkce času (n, nT), kterou nazýváme trend; þZn reprezentuje nenáhodné (deterministické) dlouhodobé cyklické vlivy (déledobější nesezónní periodicita – všechno je relativní,…ekonomické jevy, doby ledové); þSn popisuje nenáhodné (deterministické) krátkodobé cyklické (sezónní) vlivy; þRn je náhodná veličina, která zahrnuje všechny náhodné odchylky od ideálního deterministického modelu levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz ZÁKLADNÍ KONCEPT HODNOTÍCÍ VÝROK PŘÍČINNÝ DETERMINISTICKÝ VZTAH REÁLNÝ OBJEKT levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz CÍL VŠECH MOŽNÝCH ANALÝZ ODHALIT TEN PŘÍČINNÝ DETERMINISTICKÝ VZTAH NAVZDORY VŠEMU TOMU, CO NÁM TO ODHALENÍ KAZÍ levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz ADITIVNÍ MODEL ČASOVÉ ŘADY þpředpokládá, že hodnoty dané časové řady jsou realizacemi náhodné proměnné Yn, která se skládá ze čtyř dílčích složek þYn = Tn + Zn + Sn + Rn, þ þV dalším budeme předpokládat, že střední hodnota chybové proměnné Rn bude nulová, tj. že kladné i záporné odchylky od deterministického modelu jsou v průměru v rovnováze. (Toho lze vždycky dosáhnout šikovnou volbou jedné či více složek Tn, Zn, nebo Sn.) levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz ADITIVNÍ MODEL ČASOVÉ ŘADY þpředpokládá, že hodnoty dané časové řady jsou realizacemi náhodné proměnné Yn, která se skládá ze čtyř dílčích složek þYn = Tn + Zn + Sn + Rn, þ þCílem analýzy časových řad je identifikovat a interpretovat jednotlivé složky časové řady. levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz MODELY TRENDU þfunkční èz nějakého hlediska (kritéria) optimální proložení experimentálních hodnot danou funkcí času – tehdy když už známe, jakou funkční závislostí se sledovaná veličina řídí, tj. už známe řešení diferenční rovnice popisující dynamiku daného procesu þdynamické èvytvoření modelu trendu lineární dynamickou soustavou, tj, známe jak popsat dynamiku procesu, ale neznáme řešení definiční diferenciální rovnice levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz NELINEÁRNÍ FUNKČNÍ MODELY TRENDU þpředpokládejme pro zjednodušení aditivní model pouze þYn = Tn + Rn a E(Rn) = 0, þpak E(Yn) = Tn = f(n) þ þObecně je funkce f(n), jejíž funkční předpis známe, závislá na určitých parametrech, tj. f(n; β1,…, βp). Parametry funkce odhadneme z množiny realizací yn náhodné proměnné Yn. levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz NELINEÁRNÍ FUNKČNÍ MODELY TRENDU þStandardním postupem, jak odhad lze spočítat, je odhad pomocí nejmenších čtverců odchylky þ þ þHodnoty pak slouží jako model chování mimo sledovaný interval (dopředná, zpětná predikce). Hodnoty rozdílů nazýváme rezidua. Obsahují informaci o kvalitě datového modelu. levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz LOGISTICKÁ FUNKCE levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz MITSCHERLICHOVA FUNKCE þtypické použití pro dlouhodobý růst (pokles) v systému; þpočáteční hodnota je fM(0) = β1+β2; þkdyž je β3 < 0, pak limt®¥fM(n)=β1; β1 je saturační hodnota stavu systému levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz GOMPERTZOVA FUNKCE þsamozřejmě platí þ þ þa tak log(fG) je Mitscherlichovou funkcí s parametry β1, β2 a log(β3) levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz ALOMETRICKÁ FUNKCE þProtože þ þmůžeme použít lineární regresní model pro logaritmická data log(yn) þlog(yn) = log(β2) + β1log(n) + εn, n ≥ 1, þkde εn reprezentuje chybovou proměnnou levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz þAlometrie = studium proměnlivých proporcí rozměrů organismu, spojených se změnou jeho velikosti, a to buď v rámci individálního růstu (a. ontogenetická), nebo ve srovnání s příbuznými organismy různých velikostí (a. fylogenetická) þAlometrická rovnice:nechť y = mxa , kde x a y jsou změřené délky charakteristických částí těla. Tvar rovnice naznačuje nelineární závislost růstu. Předpokládáme y = 0 pro x = 0, je-li x celková délka. þZ toho plyne ln(y) = a ln(x), kde a = alometrický koeficient který odráží změny poměru délek x k délkám y. þJe-li a = 1, potom je y úměrné x a nedochází k žádné alometrii, y je isometrické vzhledem k x. þJe-li a > 1, roste y rychleji než x (pozitivní alometrie). þJe-li a < 1, roste y pomaleji než x (negativní alometrie). þNapříklad u člověka roste hlava pomaleji než torzo. ALOMETRICKÁ FUNKCE levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz ALOMETRICKÁ FUNKCE levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz LINEÁRNÍ FILTRACE ČASOVÝCH ŘAD þPředpokládejme þYn = Tn + Sn + Rn, þ þCílem nechť je stanovení odhadů trendu (driftu) a sezónní složky (složek) , které posléze odstraníme z časové řady , resp. , čímž řadu rozdělíme na „hladké“ deterministické složky a nepravidelnou fluktuační složku s nulovou střední hodnotou. levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz LINEÁRNÍ FILTRACE ČASOVÝCH ŘAD þPředpokládejme þYn = Tn + Sn + Rn, þ þPokud vymyslíme filtr, který dokáže odhadnout (modelovat) průběh trendu, pak vymyšlený filtr představuje matematický model procesu, který je zdrojem trendové posloupnosti. þPokud vymyslíme filtr, který dokáže odhadnout (modelovat) průběh sezónních oscilací, pak vymyšlený filtr představuje matematický model procesu, který je zdrojem sezónní posloupnosti. þ levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz JAK VYMYSLET TEN SPRÁVNÝ MODEL? levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz JAK VYMYSLET TEN SPRÁVNÝ MODEL? levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz JAK VYMYSLET TEN SPRÁVNÝ MODEL? Jaké známe signály s konstantním spektrem? levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz JAK VYMYSLET TEN SPRÁVNÝ MODEL? Jaké známe signály s konstantním spektrem? > levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz þdeterministický - jednotkový impuls; þnáhodný - bílý šum; þ þChceme zkonstruovat takový filtr, které má, zjednodušeně, impulsní charakteristiku odpovídající modelovanému průběhu. þ JAK VYMYSLET TEN SPRÁVNÝ MODEL? Jaké známe signály s konstantním spektrem? levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz ODHAD TRENDU (DRIFTU) þpomalu se měnící složky þß þDOLNÍ PROPUST þ(snadněji se realizuje pomocí MA filtrů) þWoldův dekompoziční teorém: èjakýkoliv ARMA nebo MA proces může být jednoznačně reprezentován AR modelem max. ¥ řádu; èjakýkoliv ARMA nebo AR proces lze reprezentovat MA modelem max. ¥ řádu; èß èje nám jedno, co použijeme za model, jen by měl mít co nejméně parametrů, které se snadno počítají þ levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz b=(1,1,1) a=3 levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz b=(1,1,1,1) a=4 levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz b=(1,1,1,1,1) a=5 levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz b=(1,1,1,1,1,1,1,1,1) a=9 levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz b=(1,2,2,2,1) a=8 levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz b=(1,2,3,2,1) a=9 H(z)= (1+z-1+z-2).(1+z-1+z-2) levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz b=(1,1,1) a=3 H(z)= (1+z-1+z-2) levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz b=(1,3,3,1) a=8 H(z)= (1+z-1)3 levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz b=(1,1) a=2 H(z)= (1+z-1) levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz ODHAD TRENDU (DRIFTU) þpomalu se měnící složky þß þDOLNÍ PROPUST þ(snadněji se realizuje pomocí MA filtrů) þ1. aby bylo zesílení filtru jednotkové, je třeba, þaby ; þ2. je třeba počítat průměr tak, aby nedocházelo ke zpoždění výstupních hodnot – jak toho dosáhnout? levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz HRÁTKY S POČÁTEČNÍ FÁZÍ originál φ01=φ02=π/2 φ01= π/4; φ02=π/2 φ01=φ02=π levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz þke zkreslení nedošlo, pokud fázová charakteristika byla lineární; þlineární je tehdy, pokud je impulsní charakteristika symetrická HRÁTKY S POČÁTEČNÍ FÁZÍ levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz SKUPINOVÉ ZPOŽDĚNÍ þZáporná derivace fázové charakteristiky se nazývá skupinové zpoždění þ þ þKonstantní skupinové zpoždění znamená, že se všechny složky signálu kmitočtovém pásmu dostanou na výstup se stejným zpožděním. þFiltry řádu m s lineární fází mají skupinové zpoždění m/2 a filtrovaný signál je zpožděn o m/2 kroků. levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz PŘECHODOVÝ DĚJ þx(nT) = {1,2,1,2,3,1,2} þg(nT) = {1/3,1/3,1/3} þ þy(nT) = [x(nT)+x(nT-T)+x(nT-2T)]/3 levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz PŘECHODOVÝ DĚJ þ x(nT) = {1,2,1,2,3,1,2} g(nT) = {1/3,1/3,1/3} nulové počáteční podmínky: x(0)=0; x(-T)=0 y(nT) = [x(nT)+x(nT-T)+x(nT-2T)]/3 levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz PŘECHODOVÝ DĚJ x(nT) = {1,2,1,2,3,1,2} g(nT) = {1/3,1/3,1/3} počáteční podmínky určeny první hodnotou vstupu: x(0)=1; x(-T)=1 y(nT) = [x(nT)+x(nT-T)+x(nT-2T)]/3 levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz þx(nT) = {1,2,1,2,3,1,2} þg(nT) = {1/3,1/3,1/3} þvýpočet vůči střední hodnotě impulsní odezvy: þy(nT) = [x(nT+T)+x(nT)+x(nT-T)]/3 PŘECHODOVÝ DĚJ levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz þx(nT) = {1,2,1,2,3,1,2} þg(nT) = {1/3,1/3,1/3} þvýpočet vůči střední hodnotě impulsní odezvy s nulovými počátečními a koncovými podmínkami þy(nT) = [x(nT+T)+x(nT)+x(nT-T)]/3 PŘECHODOVÝ DĚJ levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz ODHAD TRENDU (DRIFTU) þpomalu se měnící složky þß þDOLNÍ PROPUST þ(snadněji se realizuje pomocí MA filtrů) þ1. aby bylo zesílení filtru jednotkové, je třeba, þaby ; þ2. je třeba počítat průměr tak, aby nedocházelo ke zpoždění výstupních hodnot þ jak toho dosáhnout? levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz ODHAD TRENDU (DRIFTU) þDOLNÍ PROPUST þ(snadněji se realizuje pomocí MA filtrů) þ2. je třeba počítat průměr tak, aby nedocházelo ke zpoždění výstupních hodnot èpočítat podle standardní diferenční rovnice o výsledek posunout o hodnotu skupinového zpoždění; èpočítat vůči středu impulsní odezvy. levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz ODHAD TRENDU (DRIFTU) þDOLNÍ PROPUST þ(snadněji se realizuje pomocí MA filtrů) þ3. je třeba počítat s přechodným dějem o délce impulsní odezvy na začátku výstupu nebo o polovině délky impulsní odezvy na začátku a na konci levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz ODHAD TRENDU (DRIFTU) þDOLNÍ PROPUST þ(snadněji se realizuje pomocí MA filtrů) þJak odhadnout mezní frekvenci DP? þpraktické pravidlo: þurčíme oscilační složku o nejnižší frekvenci a mezní frekvenci DP pro odhad driftu stanovíme jako nejvyšší frekvenci propustného pásma filtru, který neovlivní oscilační složku levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz þPříprava nových učebních materiálů þpro obor Matematická biologie þje podporována projektem ESF þč. CZ.1.07/2.2.00/07.0318 þ„VÍCEOBOROVÁ INOVACE STUDIA MATEMATICKÉ BIOLOGIE“ INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ logo-MU