Dasher Richard Šimek Referát do PA154- Nástroje pro korpusy Richard Šimek, 5. 3. 2006 Dasher • autoři: David MacKay, David Ward • Cambridge University; freeware • podpora pro vysoce efektivní textový vstup za ooužití jiných prostředků než standardní počítačové dávesnice oblasti využití: • asistivní technologie (postižení- bez rukou, s jednou rukou apod.) • PDA a mobilní telefony • složité jazyky (např. japonština) • používá pravděpodobnostní prediktivní jazykový model (viz další slajdy) Richard Šimek, 5. 3. 2006 Princip File Edit Options Help písmena v abecedním pořadí, každé písmeno je v obdélníku obdélník s vybraným písmenem obsahuje opět úplnou abecedu, ze které lze vybrat 2. symbol atd. základní myšlenka: písmena s větší pravděpodobností jsou ve větším obdélníku o konkrétním rozložení se rozhoduje na základě jazykového modelu Richard Šimek, 5. 3. 2006 „Inverzní" aritmetické kódování • aritmetické kódování: kódové slovo je číslo z intervalu (0,1), postupným kódováním symbolu se intervaly zjemňují v poměru pravděpodobnosti výskytu znaku • v Dasheru reprezentuje ypsilonová souřadnice celý interval (0,1), kde každý symbol abecedy má přirazen segment délky odpovídající pravděpodobnosti jeho výskytu v daném kontextu Richard Šimek, 5. 3. 2006 Jazykový model • jazykové modely aproximující přirozený jazyk využívají statistické metody a jsou založeny na odhadech frekvence výskytu sekvencí slov • nej po užívanější jsou n-gramové modely (bigramy, trigramy), které určují pravděpodobnost výskytu určitého slova se znalostí n-1 okolních slov • n-gramové modely je potreba natrénovat z korpusu Richard Šimek, 5. 3. 2006 PPM (Prediction by Partial Match) • jazykový model použitý v Dasheru se neomezuje en na koncept slov • spojuje informace o n-gramech s pravděpodobnostmi výskytu jednotlivých symbolu ze slovníku • kontext 4-5 symbolů 3 módy: • Standard letter-based PPM • Word-based model • Mixture model (PPM/dictionary) Richard Šimek, 5. 3. 2006 Jazykový model (3) • jazykový model se učí v čase (učí se nové uživatelovy výrazy a obraty) • vše, co napíšeme, se automaticky ukládá do souboru jako další trénovací data Richard Šimek, 5. 3. 2006 Další vlastnosti • import trénovacích dat jednoduše načtením souboru • zdroj dat pro češtinu: Ústav Českého národního korpusu FF UK • jakékoliv abecedy: napr. i LaTeX, C, IPA • ostatní software - 2 módy: běžné psaní a doplňování slov (uživatel mezi nimi musí přepínat) • Dasher tyto režimy nerozlišuje Richard Šimek, 5. 3. 2006 Druhy vstupních metod • počítačová myš • touchpad • touchscreen • eyetracker • headmouse • dech • tlačítka Richard Šimek, 5. 3. 2006 Myš, touchpad, touchscreen • Rychlost vstupu s použitím myši: po 10 minutách tréninku 5-15 slov/min., po hodině 15-25 slov/min., zkušení uživatelé 40 slov za minutu • ukázka Dasheru • video: ipaq Richard Šimek, 5. 3. 2006 Eyetracker • kamera + senzory snímající, na které místo na obrazovce zaměřuje uživatel pohled • cena: $3000 Richard Šimek, 5. 3. 2006 Eye Dasher • rychlost vstupu: po deseti minutách tréninku 7 slov/min., po hodině 20 slov/min., zkušení uživatelé 30 slov za minutu • eyetracking bez Dasheru, jen s virtuální (on-screen) klávesnicí: 15 slov/min., error-rate 5x vyssi 1 Richard Šimek, 5. 3. 2006 Eye Dasher (2) Uživatelská přívětivost: • vstup za pomoci virtuální (on-screen) klávesnice je diskrétní (čekání na vypršení časovače, popř. mrknutí) • Dasher poskytuje spojitý vstup • video: eye_dasher Headmouse • IR kamera • reflexivní body • cena: $150-$300 Richard Simek, 5. 3. 2006 Breath Dasher Richard Šimek, 5. 3. 2006 Breath Dasher (2) • přímá úměra mezi objemem plic a hodnotou ypsilonové souřadnice • jednodimenzionální (nelze zpět) • proto: Control mode • Control area (Stop, Pause, Move, Delete) • video: breath dasher Button Dasher 3 smery: • dopredu nahoru • dopredu dolü • zpet Richard Šimek, 5. 3. 2006 Dasher vs. rozpoznávání reči • nepoužitelnost systémů pro automatické rozpoznávání řeči v hlučném prostředí • i u nejlepších rozpoznávačů asi 5 % chyb Richard Šimek, 5. 3. 2006 Speech Dasher • 1. krok: standardní rozpoznávání reci • 2. krok: kontrola a oprava rozpoznané promluvy pomocí Dasheru • rychlejší než oprava s použitím samostatného rozpoznávání reci (speciální příkazy) • rychlejší než samostatný Dasher • video: speech_dasher