Unfolding

histogram s ideálním rozlišením má hodnoty binů $m_i$ náhodně rozdělené kolem středních hodnot $\mu_i$

$$\nu_i= \mu_{tot}\ P(\mathrm{ udl. v\ binu}\ i) = \ \mu_{tot} \int dy\ P(\mathrm{bin\ i\ |\ detek. event\ s\ hod.}\ y)\ \varepsilon(y)\ f_{true}(y)$$

$\varepsilon(y)$ je účinnost detekce, $f_{true}$ hledané rozdělení

Převod mezi měřenou hodnotou $x$ a skutečnou veličinou $y$ charakterizuje podmíněná pravděpodobnost $s(x|y)$ = prst naměření $x$, pokud skutečně nastane $y$. Platí $P(\mathrm{bin\ i\ |\ det. event\ s\ hod.}\ y) = \int_{bin\ j} dy\ s(x|y)$ zároveň s normalizací rozlišení (resolution function, pro 2D point spread function/PSF/ ) $ \int s(x|y) dx = 1 $

Úlohu lze převést na maticový problém

$$R_{ij}=\frac{\int_{bin\ i} dx\ \int_{bin\ j} dy\ s(x|y)\ \varepsilon(y)\ f_{t}(y)}{\int_{bin\ j} dy\ f_{t}(y)} \approx \frac{\int_{bin\ i} dx \ \int_{bin\ j} dy\ s(x|y)\ \varepsilon(y)}{\int_{bin\ j} dy }$$ poslední přibliž. rovnost platí, pokud $f_{t}(y)$ je zhruba konstatní v rámci každého binu. Hodnoty prvků matice získáme výpočtem z modelu.

Pak pro $\nu_i=E (n_i)$, kde $n_i$ je obsah i-teho binu měřeného signálu, platí

$\nu_i=\sum R_{ij} \mu_j + \beta_i$, tedy $\mathbf{\mu}=R^{-1} (\mathbf{\nu} - \mathbf{\beta})$ , resp. pro odhad $\mathbf{\hat{\mu}} = R^{-1} ({\mathbf{n} -\mathbf{\beta}})$

Obecné řešení dá (vzhledem k počtu hledaných proměnných) relativně nestabilní výsledek. K omezení oscilací je obvykle k minimalizované hodnotě ($-\log L(\mu)$) přidán ještě člen $S(\mu)$ sledující "hladkost" rozdělení : regularizace

A) z prvních, druhých, .. diferencí $\sum{(\mu_{i}-\mu_{i-1})^2}$, $\sum{(2\mu_{i}-\mu_{i-1}-\mu_{i+1})^2}$
B) z maximalizace entropie

případná podmínka celkového počtu událostí: minimalizujeme $$\phi(\mu,\lambda)= \alpha \log L(\mu) + S(\mu) + \lambda \left[ n_{tot} - \sum \nu_i \right]$$

Určení nejistot podle $$\frac{\partial \mu}{\partial n}=C = -A^{-1} B$$

$A_{ij}=\frac{\partial^2 \phi}{\partial \mu_i \partial \mu_j}$, $B_{ij}=\frac{\partial^2 \phi}{\partial \mu_i \partial n_j}$, $\lambda$ je zahrnuto mezi $\mu$

Pokud z naměřených dat určíme kovarianční matici $V=cov(n_i,n_j)$, dostaneme $cov(\mu_i,\mu_j) = C^{T} V C$. Kromě nejistot hodnot $\mu$ nás ale zajímá také bias $\hat \mu - E(\mu)$

ad A: Tichonovova funkce (vyšší hodnota=hladší průběh)

$$S(f)=-\int \left( \frac{d^k f(y)}{dy^k} \right)^2\ d y$$

možno kombinovat $k$

ad B: $$H = - \sum p_i \log p_i = - \sum \frac{\mu_i}{\mu_{tot}}\ \log\frac{\mu_i}{\mu_{tot}}= S(\mu)\ \mu_{tot}$$ odpovida $\log \Omega$ počtu kombinací

  • zobecnění na více dimenzí - u entropie přímočaré, u Tichonova konstruujeme n-dim diference
  • pro astron. snímky (izolované body) max.ent. vychází lépe, nevyhlazuje tolik píky