VIKMA06 Rešeršní a studijně rozborová činnost 23. 3. 2012: Přednáška P5: Rešeršní strategie. FF MU, jaro 2012 Mgr. Josef Schwarz 126172@mail.muni.cz Rešeršní strategie §širší pojetí §užší pojetí §výběr konkrétního vyhledávacího nástroje a komunikace se systémem ¢ Cíle rešeršní strategie ¢relevance X pertinence ¢úplnost X přesnost Úplnost a přesnost l l l l l lúplnost (R) •R = a / (a+c) • lpřesnost (P) •P = a / (a+b) • lvztah mezi úplností a přesností je nepřímo úměrný (vyšší přesnost znamená nižší úplnost a naopak) • relevantní dok. nerelevantní dok. vyhledané dok. a b nevyhledané dok c d Předpoklady rešeršní strategie ¢Předpokladem pro stanovení rešeršní strategie je znalost: linformačního zdroje (databáze) •Obsah – jaké dokumenty, v jaké retrospektivě a úplnosti apod. •Struktura – podle jakých polí lze vyhledávat lnástrojů •Řízené slovníky, hesláře, autority aj. lalgoritmů •Operátory dotazovacího jazyka, konvence pravostranného rozšíření atd. luživatelského rozhraní • Strategie pro zúžení záběru §klíčová slova se kombinují s věcným selekčním jazykem §omezení na určité pole záznamu §využití proximitních operátorů §omezení na určitý typ dokumentu §operátor NOT pro vyloučení některých záznamů §jazykové vymezení §časové rozmezí §kombinace množiny deskriptorů/hesel s podřazenými klíčovými slovy §kombinace s množinou sel. údajů vyjadřující další pojem z dotazu, hledisko F Strategie pro rozšíření záběru §uvedení synonym, tvarů slov, pravopisných variant (operátor OR, zástupné znaky, krácení podle slovních kořenů) §uvedení jednotek věcného SJ jako klíčových slov (např. vyhledávání ve všech polích) §dodatečné uvedení širších jednotek věcného SJ, tj. těch, které jsou nadřazeny použitým termínům (deskriptorům, předmětovým heslům) §obecné termíny, tj. s vysokým výskytem §zrušení předběžných omezení Vyhledávací techniky pro zvýšení přesnosti §použití operátoru AND §použití operátoru NOT §„case sensitive“ §proximitní operátory §vážené vyhledávání („weighted searching“) §omezení na pole („field searching“) ¢ Vyhledávací techniky pro zvýšení úplnosti F §použití operátoru OR §krácení, zástupné znaky §fuzzy vyhledávání §rozšiřování dotazu („query expansion“) §paralelní vyhledávání – „multiple database searching ¢ Typy rešeršní strategie ¢strategie stavebních kamenů ¢vyhledávání pomocí nejspecifičtější fazety ¢strategie rostoucí perly ¢strategie osekávání Strategie stavebních kamenů §samostatné dílčí dotazy vyjadřující ústřední pojmy původního rešeršního požadavku §identifikace klíčových/významných pojmů §množina výrazů vztahující se k pojmu: synonyma, kvazisynonyma, pravopisné formy, nadřazené, podřízené výrazy §OR, truncation (krácení podle slov. kořenů), stemming, wild cards (zástupné znaky) §spojení dílčích formulací ve finální soubor §AND §vhodné použít, když usilujeme o úplnost u úzce specifikovaných témat Vyhledávání pomocí nejspecifičtější fazety Fvztahuje se k vyhledávání složených témat – více aspektů Fuživatel musí znát všechny dílčí témata a musí být schopen určit, které téma je nejspecifičtější §Vyhledávání § podle nejužšího pojmu z rešeršního požadavku §pokud je výsledek uspokojivý, nemusí být do rešerše zahrnuta další dílčí hlediska ¢ Strategie rostoucí perly ¢Dotaz je postupně modifikován dle výsledků rešerše – záznamy jsou postupně procházeny a zjišťovány relevantní termíny (řízené termíny, slova z názvů apod.), které jsou použity k revidování dotazu. ¢ ¢Prvotním cílem je alespoň jeden záznam §zjištění použitelných selekčních termínů §úprava formulace rešeršního dotazu ¢ ¢ ¢ ¢ ¢ Strategie osekávání §první formulace dotazu - širší formulace, tj. pomocí obecného pojmu – cílem je vyhledání více záznamů §postupná specifikace dotazu §uplatnění taktik pro zúžení záběru (AND, NOT, proxim. oper., field searching, formální omezení) §formulace širší kategorie (obor, vědní disciplína), klasifikace §náročnější na čas l Rešeršní strategie - praktické rady ¢Buďte flexibilní §berte připravené kroky strategie orientačně §přizpůsobujte další taktiky výsledkům rešerše §nulový výsledek – hledání příčiny ¢Využívejte řízených slovníků §využívejte souvisejících pojmů ke konkrétnímu řízenému termínu (nadřazené, podřazené pojmy) §nikdy nespojujte výrazy s malou frekvencí výskytu (zjistitelné v katalogu) operátorem AND ¢Vytvářejte množiny termínů §je velmi důležité k jednotlivým klíčovým slovům vytvářet množiny souvisejících termínů §termíny v množině se spojují pomocí logického součtu – OR ¢Využívejte klasifikací §pomocí klasifikací vyhledáte většinou mnoho záznamů, proto se hodí jejich využití při strategii osekávání Rešeršní strategie - praktické rady ¢Využívejte krácení - truncation ¢ ¢Využívejte zástupných znaků – wild cards ¢ ¢POZOR na používání NOT §radikální snížení záznamů na výstupu §vyloučení i těch záznamů, které obsahují žádané informace ¢Přizpůsobte rešeršní strategii vyhledávacímu systému, v němž vyhledáváte ¢Vytěžujte výhody databází §reformulace dotazu §taktiky pro rozšiřovaní a zužování výsledné množiny ¢Používejte akronymy §chcete-li dosáhnout co nejúplnějšího vyhledávání, zadávejte zkratky, které se v daném oboru běžně používají §ověřte, zda jsou zkratky zahrnuty do řízeného slovníku F Literatura ¢kapitoly ze základní a doplňkové literatury lCHU07, kap. 6, 9 (s. 81-96, 145-166) lING92, kap. 6 (s. 123-156) lVIC04, kap. 7 (s. 180-209) l ¢další doplňková literatura k tématu lOthman, R. Retrieval features for online databases : common, unique, and expected. Online Information Review, 2004, roč. 28, č. 3, s. 200-210. • ¢