Nejistoty: V zadání nejsou explicitní nejistoty měření, ale v úvodním odstavci se říká, že pro měřené hodnoty (ozn. \(y\)) platí Poissonovo rozdělení, tedy že mj. střední hodnota (\(\lambda\)) je rovna rozptylu, \(\sigma_y^2\). Pro každý bod \(y_j\) máme jen jedno měření, tedy odhad lambda je právě tato hodnota a odhad nejistoty \(\sigma_y = \sqrt{y_j}\). Po transformaci \(y \to \log(y)\) se samozřejmě transformuje i tato nejistota (podle zákona šíření nejistot) - zatímco v lineární škále nejistota s velikostí naměřené hodnoty roste, v logaritmické je to naopak.
Po odečtení nějaké nafitované komponenty by se tyto nejistoty v principu měly mírně zvětšit (o nejistotu modelu), v praxi je ale tato nejistota oproti \(\sigma_y\) zanedbatelná.
NB: Některé funkce v pythonu s nejistotami pracovat neumí, např. scipy.linalg.lstsq
. Náhradou může být tento kód
def lstsq(matA,b,sig_b):
import numpy as np
matW=np.eye(len(b))
ir=np.arange(0,len(b))
matW[ir,ir]=1/sig_b**2
hess=matA @ matW @ matA.T
cov=np.linalg.inv(hess)
pars=cov @ matA @ matW @b
return pars,cov
Poloha maxima: Jde o (co nejpřesnější) určení polohy maxima v horizontálním směru (energie). V logaritmické i lineární škále je tato poloha identická, souvisí s nafitovanými parametry q1 a q2 (vzorec je dosti jednoduchý). K určení nejistoty polohy maxima potřebujete znát nejen nejistoty těchto parametrů, ale i jejich kovarianci resp. korelaci. To vše můžete získat z kovarianční matice, která je inverzní k hessianu - analogický problém v maticovém formalismu je řešen v tomto ukázkovém příkladu
Pokud fitujete polohu maxima přímo (jako nelineární parametr) a váš fitovací program vám vrací i nejistotu, je to akceptovatelné řešení, musíte ale vědět alespoň, jakou veličinu program minimalizuje.
Kovarianční resp. korelační matici můžete pak snadno získat i pro “kombinovaný” model, kdy není potřeba ani provádět fitování, stačí získat hessian z modelové matice, která bude v jednotlivých sloupcích obsahovat konstantu (“jedničky”), exponencielu a gaussovku.
Test normálního rozdělení: Spočtená korigovaná rezidua můžete primárně vykreslit do histogramu - pokud budete dělat Pearsonův test, tak lze vybrat jen část histogramu, kde podle tradičního pravidla počet binů s méně jak 5 prvky bude méně jak 5 (tedy vynechat okrajové oblasti). Pokud budete využívat nějaké předprogramované funkce na Kolmogorův test, vykreslete alespoň přibližnou empirickou distrib. funkci získanou z tohoto histogramu (viz Kolm. test v návodu ke kurzu). Parametry normálního rozdělení, se kterým budete histogram či EDF srovnávat, lze vzít jako střední hodnotu a směrod. odchylku výchozích reziduí (střední hodnota by měla být blízká 0, rozptyl očekáváme blízký 1).