Dasher Richard Šimek Referát do PA154 - Nástroje pro korpusy Richard Šimek, 5. 3. 2006 Dasher T • autoři: David MacKay, David Ward • Cambridge University; freeware • podpora pro vysoce efektivní textový vstup za ooužití jiných prostředků než standardní počítačové dávesnice oblasti využití: • asistivní technologie (postižení - bez rukou, s jednou rukou apod.) • PDA a mobilní telefony • složité jazyky (např. japonština) • používá pravděpodobnostní prediktivní jazykový model (viz další slajdy) 98 Princip File Edit Options Help Speed Richard Šimek, 5. 3. 2006 • písmena v abecedním pořadí, každé písmeno je v obdélníku • obdélník s vybraným písmenem obsahuje opět úplnou abecedu, ze které lze vybrat 2. symbol atd. • základní myšlenka: písmena s větší pravděpodobností jsou ve větším obdélníku • o konkrétním rozložení se rozhoduje na základě jazykového modelu Richard Šimek, 5. 3. 2006 „Inverzní" aritmetické kódování • aritmetické kódování: kódové slovo je číslo z intervalu (0,1), postupným kódováním symbolů se intervaly zjemňují v poměru pravděpodobnosti výskytu znaku • v Dasheru reprezentuje ypsilonová souřadnice celý interval (0,1), kde každý symbol abecedy má přirazen segment délky odpovídající pravděpodobnosti jeho výskytu v daném kontextu 75 Richard Šimek, 5. 3. 2006 Jazykový model • jazykové modely aproximující přirozený jazyk využívají statistické metody a jsou založeny na odhadech frekvence výskytu sekvencí slov • nejpoužívanější jsou n-gramové modely (bigramy, trigramy), které určují pravděpodobnost výskytu určitého slova se znalostí n-1 okolních slov • n-gramové modely je potreba natrénovat z korpusu Richard Šimek, 5. 3. 2006 PPM (Prediction by Partial Match) • jazykový model použitý v Dasheru se neomezuje jen na koncept slov • spojuje informace o n-gramech s pravděpodobnostmi výskytu jednotlivých symbolu ze slovníku • kontext 4-5 symbolů 3 módy: • Standard letter-based PPM • Word-based model • Mixture model (PPM/dictionary) Richard Šimek, 5. 3. 2006 Jazykový model (3) • jazykový model se učí v čase (učí se nové uživatelovy výrazy a obraty) • vše, co napíšeme, se automaticky ukládá do souboru jako další trénovací data Richard Šimek, 5. 3. 2006 Další vlastnosti • import trénovacích dat jednoduše načtením souboru • zdroj dat pro češtinu: Ústav Českého národního korpusu FF UK • jakékoliv abecedy: napr. i LaTeX, C, IPA • ostatní software - 2 módy: běžné psaní a doplňování slov (uživatel mezi nimi musí přepínat) • Dasher tyto režimy nerozlišuje počítačovo myš touchpad touchscreen eyetracker headmouse dech tlačítka Richard Šimek, 5. 3. 2006 iích metod Myš, touchpad. • Rychlost vstupu s použitím myši: po 10 minutách tréninku 5-15 slov/min., po hodině 15-25 slov/min., zkušení uživatelé 40 slov za minutu • ukázka Dasheru • video: ipaq Richard Šimek, 5. 3. 2006 touchscreen Eyetracker • kamera + senzory snímající, na které místo na obrazovce zaměřuje uživatel pohled • cena: $3000 Eye Dasher • rychlost vstupu: po deseti minutách tréninku 7 slov/min., po hodině 20 slov/min., zkušení uživatelé 30 slov za minutu • eyetracking bez Dasheru, jen s virtuální (on-screen) klávesnicí: 15 slov/min., error-rate 5x vyssi Richard Šimek, 5. 3. 2006 Eye Dasher (2) Uživatelská přívětivost: • vstup za pomoci virtuální (on-screen) klávesnice je diskrétní (čekání na vypršení časovače, popř. mrknutí) • Dasher poskytuje spojitý vstup • video: eye_dasher Headmouse • IR kamera • reflexivní body • cena:$150-$300 Richard Šimek, 5. 3. 2006 Breath Dasher £k|c«ll \ A I yyjíaste beli-, wiH lii^ á -íUe. wer. <2< 2ÔCA, Richard Šimek, 5. 3. 2006 Breath Dasher (2) • přímá úměra mezi objemem plic a hodnotou ypsilonové souřadnice • jednodimenzionální (nelze zpět) • proto: Control mode • Control area (Stop, Pause, Move, Delete) • video: breath dasher Button Dasher 3 směry: • dopredu nahoru • dopredu dolů • zpět Richard Šimek, 5. 3. 2006 ! Sx Richard Šimek, 5. 3. 2006 Dasher vs. rozpoznávání řeči • nepoužitelnost systémů pro automatické rozpoznávání řeči v hlučném prostředí • i u nejlepších rozpoznávačů asi 5 % chyb Richard Šimek, 5. 3. 2006 a Speech Dasher *W • 1. krok: standardní rozpoznávání reči • 2. krok: kontrola a oprava rozpoznané promluvy pomocí Dasheru • rychlejší než oprava s použitím samostatného rozpoznávání reci (speciální príkazy) • rychlejší než samostatný Dasher • video: speech_dasher