Selekční jazyky (2) Úvod do problematiky Přednáška č. 2 – 21.3.2008 Filozofická fakulta Masarykova Univerzity, Kabinet knihovnictví - Ústav české literatury a knihovnictví jarní semestr 2007/2008 Josef Schwarz schwarzjv@seznam.cz Kvalita a konzistence indexace Kvalita indexace *LAN03, kap. Quality of Indexing *kvalitní indexace – taková indexace, která zajistí (ne)vyhledání dokumentu v rámci konkrétního informačního systému *jde o relativní hodnotu w účel a zaměření informačního systému w potřeby a požadavky uživatelů *nelze hodnotit kvantitativními metodami *faktory ovlivňující kvalitu indexace Konzistence indexace *LAN03, Consistency of Indexing *míra shody dvou nebo více SOD *typy konzistence w mezi indexátory (interindexer consistency) n shoda indexace mezi dvěma nebo více indexátory w indexátora (intraindexer consistency) n konzistence indexace jednoho indexátora *konzistence z hlediska hloubky indexace w konzistence pořádacích znaků vyjadřujících hlavní témata w konzistence pořádacích znaků vyjadřujících vedlejší témata Konzistence indexace (pokr.) *Výpočet I. n dvojice indexátorů - tzv. konzistenční pár (consistency pair) C = a / b kde: n a = počet pořádacích znaků, které shodně zvolili oba indexátoři n b = celkový počet přidělených jedinečných pořádacích znaků Konzistence indexace (pokr.) *Indexátor 1 n námořníci n ztroskotání n ostrovy n Robinson Crusoe n dobrodružné romány Konzistence indexace (pokr.) *Výpočet II. n více než dva indexátoři C = průměr konzistenčních párů Konzistence indexace (pokr.) *Indexátor 1 n námořníci n ztroskotání n ostrovy n Robinson Crusoe n dobrodružné romány Kvalita vs konzistence indexace *vztah kvality a konzistence není bezprostřední n konzistentní indexace neznamená kvalitní indexaci n kvalitní indexace zahrnuje i konzistentní indexaci n konzistence indexace zlepšuje efektivitu vyhledávání n z hlediska správy databáze je konzistence kvalitou Faktory ovlivňující indexaci *indexátor w obj.: zkušenost a znalost SJ, znalost oboru, porozumění textu, systematické myšlení, racionální čtení w subj.: soustř., pečlivost, nálada, únava, motivace *SJ w kvalita řízeného slovníku w indexační pravidla *dokument/text w obor, struktura, délka, styl, žánr, pomocný aparát, jazyk *pracovní podmínky w prac. doba, produktivita práce, prac. prostředí, technické prostředky Kontrola a hodnocení indexace *v procesu indexace w indexační pravidla w srovnání s obsahem databáze n automatické procedury: TODESCHINI, C., FARRELL, M.P. An expert system for quality control in bibliographic databases. Journal of the American Society for Information Science, 1989, roč. 40, č. 1, s. 1-11. w supervize n správnost a úplnost obsahové analýzy n věcná i formální správnost přiřazených pořádacích znaků n indexační chyby w indexační experimenty *při vyhledávání w relevance vyhledávání w úplnost (recall) a přesnost (precision) Relevance vyhledávání *úplnost (recall) R n počet vyhledaných relevantních dokumentů / počet všech relevantních dokumentů *přesnost (precision) P n počet vyhledaných relevantních dokumentů / počet všech vyhledaných dokumentů *poměr mezi úplností a přesností ] Indexační chyby *data: kontrola indexace UK-ETF 1998-99 n viz případová studie *nejčastější typy chyb n opominutí hledisek (18,6%) n nesprávné stanovení významu nebo rozsahu deskriptoru (12,3%) n chybějící jednotlivé deskriptory (11,5%) *typy chyb podle ovlivnění úplnost a přesnost vyhledávání n komplexní chyby snižující úplnost (23,4%) n dílčí chyby snižující úplnost (22,1%) n dílčí chyby snižující úplnost i přesnost (14,9%) Indexační chyby (pokr.) *typy chyb podle fáze indexace n obsahová analýza (18,1%) w zdroj chyb: indexátor n identifikace pojmů (42,3%) w zdroj chyb: indexační pravidla, indexátor w nejčastěji: opominutí hledisek n výběr deskriptorů z tezauru (20,8%) w zdroj chyb: indexátor, indexační pravidla, řízený slovník ] Indexační experimenty • srovnávání různých typů selekčních jazyků * indexace vzorku dokumentů * porovnání formou rešeršních dotazů • konzistence indexátorů * experimentální přístup * dva nebo více indexátorů * vzorek dokumentů * indexace * interpretace výsledků w (případová studie) ] Využití hodnocení indexace *indexátor w zpětná vazba w hodnocení práce *SJ n řízený slovník w úprava lexika n. struktury w úprava poznámek o rozsahu n indexační pravidla w formulace w úprava *dokumenty w reindexace