logo-IBA logo-MU © Institut biostatistiky a analýz ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc. logo-IBA logo-MU © Institut biostatistiky a analýz VI. SEKVENČNÍ KLASIFIKACE levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz ZAČÍNÁME þaž dosud (bayesovské klasifikátory, klasifikátory s diskriminační hranicí, s minimální vzdáleností, …) – pevný konstantní počet příznaků þkolik a jaké příznaky ? èmálo příznaků – možná chyba klasifikace; èmoc příznaků – možná nepřiměřená pracnost, vysoké náklady; èpoužít příznaky, které nesou co nejvíce informace o klasifikační úloze; è levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz ZAČÍNÁME þsekvenční klasifikace - kompromis mezi velikostí klasifikační chyby a cenou určení příznaků èklasifikace na základě klasifikačního stromu; levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz ZAČÍNÁME 001.jpg Rozhodovací strom pro klasifikaci rytmu signálu EKG levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz ZAČÍNÁME þsekvenční klasifikace - kompromis mezi velikostí klasifikační chyby a cenou určení příznaků èklasifikace na základě klasifikačního stromu; èklasifikace s rostoucím počtem příznaků, přičemž okamžik ukončení klasifikační procedury stanoví klasifikátor sám podle předem daného kritéria pro kvalitu rozhodnutí (tj. na základě vlastností klasifikačních tříd, resp. obrazů v nich); levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz PRINCIP 002.jpg levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz WALDOVO KRITÉRIUM þpředpokládejme dichotomický klasifikátor obrazů popsaných příznakovými vektory (x1, x2, …); þnechť p(x1, x2, …, xi|ω1) a p(x1, x2, …, xi|ω2) jsou i-rozměrné hustoty pravděpodobnosti výskytu obrazu x = (x1, x2, …, xi) v i-tém klasifikačním kroku v třídách ω1 a ω2; þnechť A a B jsou konstanty (0 0 a q1,q2 Î (0,1ñ þ levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz MODIFIKOVANÉ WALDOVO KRITÉRIUM 003.jpg levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz REEDOVO KRITÉRIUM þpro obecný počet tříd zobecněný věrohodnostní poměr þ þ þ þtakto vypočítaný poměr se srovná s mezní hodnotou r-té třídy A(ωr), určenou jako þ þ þ þ kde Prs je pravděpodobnost, že obraz ze třídy ωs zatřídíme do ωr. levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz REEDOVO KRITÉRIUM þpokud pro třídu ωP platí þΛi(x|ωP) £ A(ωP), p=1,2,…,R, þ pak předpokládáme, že obraz x nepatří do třídy ωP, kterou lze z dalších úvah vyloučit; þpo vyloučení všech možných tříd se spočítají nové hodnoty věrohodnostních poměrů pro zbylé třídy a proces se opakuje; þnení-li možné vyloučit další třídu, zvýší se počet příznaků a klasifikace pokračuje, dokud nezbude jediná klasifikační třída; þ levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz REEDOVO KRITÉRIUM þpro R=2 je Reedovo kritérium ekvivalentní kritériu Waldovu a má tytéž optimální vlastnosti; þpro R>2 nebyla optimalita prokázána; þ levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz MODIFIKOVANÉ REEDOVO KRITÉRIUM þstejně jako Waldova kritéria lze použít proměnných mezí þproměnných práh je zpravidla definován vztahem þ levy-panel-IBA-se-zavojem logo-IBA-transparent logo-MU © Institut biostatistiky a analýz þPříprava nových učebních materiálů þoboru Matematická biologie þje podporována projektem ESF þč. CZ.1.07/2.2.00/28.0043 þ„INTERDISCIPLINÁRNÍ ROZVOJ STUDIJNÍHO OBORU MATEMATICKÁ BIOLOGIE“ INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ logo-MU