Oxford WordSmith Tools 4.0 Bc. Jiří Mikulášek PA154 ­ Nástroje pro korpusy FI MUNI duben 2006 WordSmith 4.0 Základní informace WordList Concordancer Keywords Další nástroje Základní informace Autor: Mike Scott, Oxford University Press od roku 1996, aktuálně ve verzi 4.0. Komerční, demo verze pro práci nepoužitelná. Soubor nástrojů pro lexikální analýzu. Tři hlavní nástroje ­ WordList, Concordancer, Keywords. Množství dalších užitečných utilit ­ WebGetter, Language chooser, File utilities WordList Analyzuje vstupní text a generuje frekvenční seznamy slov. Vstupem může být několik textových souborů (značkovaného) textu. Výstupem je frekvenční tabulka výskytů. Výstup je možné řadit dle různých parametrů. Umožňuje lematizaci (po přidání seznamu lemat). WordList WordList ­ oblasti použití Vytvoření podkladů pro hledání klíčových slov a vytváření konkordancí. Analýza konzistence ­ porovnávání různých verzí téhož textu apod. Lematizace ­ soubor lemat, nebo vytváření lemat ručně. Analýza souvislosti slov. Concordancer Vytváření konkordancí ­ příkladů slov nebo frází s jejich kontexty. Vyhledá ve vstupních text(ech) konkordance podle vyhledávacích kritérií. Vyhledávání podle kontextu. Zobrazení kolokací, možnost nastavení kolokačních vzdáleností. Zpracování značkovaného textu. Možnost editace vlastních kategorií. Concordancer Concordancer - použití Studium jazyka, hledání slovních spojení apod. Pomůcka pro učitele. Zkoumání chování slov vzhledem k jejich kontextu. Keywords Pokusí se identifikovat klíčová slova v textu na základě porovnávání frekvencí výskytu. Pracuje s výstupy WordListu ­ jeden wordlist pro vyhledání klíčových slov a druhý (větší) pro porovnání frekvencí. Možnost přímého nalezení konkordancí k nalezeným klíčovým slovům. Asociace klíčových slov. ... Keywords Keywords - využití Dobrá pomůcka pro charakterizaci textu ­ styl, žánr, ... Analýza obsahu. Vyhledávání informací. Klasifikace textu. Další nástroje Slušné množství užitečných nástrojů. WebGetter ­ vytváření vlastního korpusu pomocí vyhledávání textů na webu. Minimal Pairs ­ hledá páry co nejpodobnějších slov. File utilities ­ porovnávání, rozdělování, ... Text Converter ­ nahrazování částí textu Reference http://www.lexically.net/wordsmith/