Kalibrace kredit skóringových modelů Eva Horáčková Obsah ● Definice kalibrace ● Využití kalibrace ● Způsoby použití kalibrace ● Metody kalibrace ● Testování kalibrace ● Parametrické testování Kalibrace Prvotním cílem CS karet byla pomoc při seřazení klientů a rozhodování o přijetí/nepřijetí Dnes je důraz kladen i na přesnost odhadu pravděpodobnosti selhání klienta. „Použití bandingu, scalingu a dalších metod tak, aby bylo zajištěno, že výsledné skóre mají stejný význam napříč různými skóringovými kartami a znázorňují pravděpodobnost selhání.“ Využití kalibrace Konzistence mezi modely - porovnání skóre vytvořené různými CS modely Změna plošných podmínek ve společnosti - změna, která se projeví stejně u všech klientů Jinak definovaná pravděpodobnost selhání – PS známe, ale potřebujeme znát i pro jinou definici selhání Odhad pravděpodobnosti selhání klienta (Basel II) Odhad pravděpodobnosti selhání Klíčový faktor pro oceňování úvěru a stanovení kapitálových rezerv. Směrnice Basel II doporučuje, aby byl kapitálový požadavek stanoven na základě ratingu a skóringu Basel II – možnosti výpočtu kapitálového požadavku Standardizovaný přístup - plošný výpočet, používaný v Basel I Externí rating – využití ratingu ratingových agentur (stanovují rating pouze pro velké společnosti) Interní rating (IRB – Internal Ratings-based Approach) – využití vlastních odhadů pravděpodobnosti selhání Použití kalibrace • Je vypočítávana na základě skutečné průměrné pravděpodobnosti selhání vzorku • Během vývoje modelu, v závěru • Rozsáhlost je závislá na technice tvorby CS modelu, čase, metrických rozdílech • Modely tvořené logistickou regresí – kalibrace není nutná (v praxi vždy neplatí) Způsoby kalibrace • Změna koeficientů modelu (pouze regresní modely) • Rozdělení do skupin (banding) • Lineární posun a škálování • Transformace pomocí vhodné funkce (beta funkce) • Lineární programování (složité, nepoužívané v praxi) Banding – libovolné skupiny Rozdělení do 5-25 (30) skupin, 5-10 skupin pro homogenní nebo omezená data, skupiny nejsou nijak definovány Stanovení počtu skupin: • Calinski-Harabaszova statistika • Nesrovnatelné s výsledky jiného modelu Banding - Benchmarking • Pevná průměrná PS skupiny • Minimalizace součtu čtverců • mezi danou PS a PS klientů • Třídy ratingových agentur • Postup ▫ Počet skupin ▫ Hranice shruba stejných skupin ▫ Součet čtverců ▫ Posun hranic o bod, součet čtverců Banding – marginal risk boundaries Třídy stanovené nejen průměrnou pravděpodobností selhání, ale také min a max hranicemi Využívá se metodologie založená na odhadu mezního rizika – složitý úkol, vztah mezi skóre a rizikem není zpravidla přes celou škálu totožný Metoda nejbližšího souseda Rozdělení do skupin a interpolace Lineární transformace Shift, scaling Lineární vztah mezi PD a skóre Beta funkce Nelineární vztah mezi PD a skóre Nutno nalézt vhodnou transformační funkci Často využívaná je beta funkce Testování kalibrace Testování podmíněných odhadůZávislost odhadů na daném prostředí (kovariance s HDP, nezaměstnaností), přijímáme předpoklad nezávislosti selhání jednotl. klientů Odhad PD ozn. PIT (Point-in-time) Testování nepodmíněných odhadůNezávislost na prostředí, odhad PD ozn. TTC (Through-theCycle). Nelze přijmout předpoklad nezávislosti Testování kalibrace Podmíněné testování • Binomický test ▫ Normální aproximace • Chí kvadrát testy (Hosmer-Lemeshowův test) • Spiegelhalterův test Nepodmíněné testování Binomický test • Testování kalibrace jedné skupiny • Selhání zákazníků jsou nezávislá H0: Odhadnutá PS skupiny = pozorované PS • X má binomické rozdělení, b – počet špatných uchazečů Normální aproximace binomického testu Lze využít pokud je v dané skupině 10 a více klientů (přijímáme předpoklad normálního rozložení klientů) I – počet prvků ve skupině Z-test o střední hodnotě při známém rozptylu Chí kvadrát testy • Hosmer-Lemeshowův test • Testování všech skupin současně • H0: Očekávané a pozorované PS nejsou stejné • Chí-kvadrát rozdělení s I -2 stupni volnosti Spiegelhalterův test • Testuje do skupin nerozřazená data • H0: střední hodnota skóre = střední hodnota kalibrovaných výsledků Nepodmíněné testování Není potřeba předpokladu nezávislosti mezi skupinami dat, předpokládáme nezávislost v čase Nulovou hypotézu, že pravdivá PD je menší nebo rovna q zamítáme, pokud T – počet let, nt – počet klientů, dt – počet špatných, q – odhad PD Děkuji za pozornost