Redukované texty aneb jak na anotace, abstrakt, extrakt, referát,… Martin Krčál VIKBB42 Knihovnické procesy a služby Brno, 29. února 2012 Redukovaný text - definice TDKIV Text, který vznikne na základě obsahové analýzy dokumentu z plného textu dokumentu sémantickou redukcí informací obsažených v dokumentu, tj. výběrem z hlediska obsahu podstatných informací. Na sémantickou redukci zpravidla navazuje komprimace vybraných informací a jejich vyjádření v přirozeném nebo umělém jazyce formou vět, klíčový slov nebo znaků. Redukovaný text dokumentu je vždy podstatně kratší než plný text a naplňuje funkci signální (upozornění na nový dokument), substituční (náhrada plného textu dokumentu) nebo selekční (umožnění výběru dokumentů). Hlavní typy redukovaného textu dokumentu jsou referát, anotace, extrakt, resumé a synopse; někdy se mezi ně řadí i soubory věcných selekčních údajů (např. deskriptorů, předmětových hesel, klasifikačních znaků apod.), které však vyjadřují spíše tematiku než vlastní obsah dokumentu. Redukované texty * obsahová analýza * z plného textu * sémantické redukce obsahu (informací) * komprimace vybraných info * přirozený nebo umělý jazyk vvěty, klíčová slova nebo znaky * kratší * vzniká nové dílo ðvychází z originálu Funkce RT * signální vexistence textu * substituční vnahrazení čtení celého textu * selekční vpro vyhledávání literatury vRT v katalogu ð ano nebo ne??? * ostatní vtématické shluky (podobné dokumenty) Historie RT * redukce = běžná součást života vpravěké malby, záznamy bitev, beletrie * od 16.stol. – zprávy o dílech vmezi učenci (humanismus, šíření info) * 19. stol. – rozvoj vědeckých časopisů vindexové, abstraktové, referátové časopisy, oborová specializace * 2/2 20. stol. – rozvoj PC a ICT vkatalogizace, automatická indexace a abstrahování, abstraktové DB, online rozhraní, propojení s FT, RSS, alerts,… Dvě cesty RT * odborná literatura * beletrie * * Rozdíly??? > Typologie RT Extrakt =výtah (extract) * věty z dokumentu * nevznikají nové formulace * cíl: vystihnout obsah dokumentu * zásada neutrálnosti vnemá se manipulovat s obsahem Resumé (resume, summary) * shrnutí, souhrn * rekapitulace přečteného textu vnemá funkci signální a substituční vna konci dokumentu vshrnutí nejdůležitějších poznatů vpro ty, co už text četli (doplnění orientace, správné pochopení) * druhy vautorské vredakční Abstrakt (abstract) * zaměřuje se jen na text vnehodnotí, chybí doplňkové informace * rozsáhlejší než anotace * části abstraktu vcíle vpoužitá metodologie (v rozsahu nezbytně nutném pro pochopení) vvýsledky a závěry vvedlejší informace – to co nemá souvislosti s cílem dokumentu, ale je důležité Umístění abstraktu * co nejblíže začátku dokumentu * časopis vpod nadpis a autora * samostatná publikovaná zpráva vtitulní list, dokumentační list, první lichá strana před obsahem * monografie, VŠKP vrub titulního listu nebo následující lichá stránka * samostatné abstrakty kapitol vna první stránku kapitoly nebo před ní Abstrakt (abstract) * druhy (dle počtu dokumentů) vmonografický - 1 dokument vpřehledový - dokumenty na vybrané téma * druhy (dle obsáhlosti) vinformativní - i substituční funkce, podrobnější, technické a přírodní obory vindikativní - signální funkce, kratší, společenské a humanitní vědy, častější * druhy (dle autora) vautorský - píše sám autor vkritický - odborník na téma, text by neměl být hodnocen (např. knihovník) Abstrakt (abstract) * druhy (dle uspořádání témat) vanalytický - dle věcných hledisek, nemusí odpovídat uspořádání původního dokumentu vvýběrový - dle určitého hlediska (např. skupina čtenářů, požadavky instituce apod.) vstrukturovaný - ne text, ale formou bodů (metody, cíle, východiska,…) a k nim jsou navázána fakta, přehledné * Abstrakt (abstract) * modulární abstrakt v4 složky – anotace, indikativní, informativní a kritický abstrakt * Formální a stylistická úprava * bibliografické údaje vprimární dokumenty - stejná stránka vsekundární dokumenty + samostatné abstrakty - těsně před nebo za vČSN ISO 690, 690-2 * délka vprůměr 250 slov, krátké text 100 slov, max. 500 slov (max. 1 tisková strana) vurčuje ji obsah než délka textu * 1. věta = ústřední myšlenka, u sekundárních druh dokumentu Formální a stylistická úprava * členění do odstavců jen u delších abstraktů (ne nadpisy a kapitoly) * souvislé věty, krátké věty, logicky navazující * klíčová slova za abstraktem (volitelně) * slovesa v činném rodě vtrpný rod pouze tam, kde má být zdůrazněn účastník děje * 3. osoba, jiná osoba jen pro snazší pochopení textu Formální a stylistická úprava * obecná terminologie vdefinice v abstraktu ne!!! * standardizované měrné jednotky, symboly, zkratky vISO, národní normy * nepoužívat rovnice, tabulky, vzorce, diagramy,… • * specifikace v normě vČSN ISO 214 Dokumentace - Abstrakty pro publikace a dokumentaci (únor 2001) Anotace (annotation) * kratší a stručnější než abstrakt * hodnocení, info o tématu, autorovi,… vi z jiných dokumentů * Druhy anotace * dle autora vautorská, nakladatelská, redakční * dle hodnocení vdoporučující (z hlediska skupiny čtenářů) vtextologická (kvalita textu) * další anotace: vanalytická – strukturovaná RT dle věcných hledisek vskupinová – více dok. na společné téma vbibliografická – anotace v bibliografii vinformativní - nehodnotí Další druhy RT * Synopse vredukovaný text rozsáhlejších děl vnebo RT mezi názvem a textem * Regest vvýtah diplomatického textu Kdo tvoří nejlépe RT? * autor * odborník na danou problematiku * knihovník/informační specialista > Požadavky na tvůrce RT * zkušenosti * přehled * znalost oboru * jazykové schopnosti Tvorba RT Co ovlivňuje délku RT * délka originálního textu * komplexnost řešeného problému * pokrytí řešených oborů * důležitost obsahu pro čtenáře * přístupnost – nedostupný=delší * účel RT Proces tvorby * čtení textu vporozumění obsahu vlinking words (spojovací, uvozovací výrazy – především, shrnuto, in conclusion, finally,...) * analýza vselekce (nedůležité věci) vinterpretace (vyjádření obsahu vlastními slovy, subjektivní, myšlenkové mapy) * syntéza vnapsání RT Automatická RT * rozdělení textu na věty * ohodnocení * složení Přístupy k ART * statistický přístup vfrekvence slov, stop slova, stemming (varianty slova, slovník), problémem synonyma * syntaktický přístup vstruktura textu, zákonitosti (umístění slov, významovost vět, podřazené věty, vazby, parsery pro rozložení vět) * sémantický přístup vdůležité části spojeny s určitými pojmy (podstatný, záměr, cíl, důležitý), kombinace * Evaluace * zejména pro automaticky tvořené * neexistuje univerzální návod na automatickou tvorbu RT * možnosti srovnání voriginální text vgold summary * posouzení celku nebo jednotlivých částí Druhy evaluace * vnější vúčel textu, proč byl vytvořen * vnitřní vorientace na text a obsah Problémy evaluace * nikdy se nevytvoří stejný RT * nikdy se nevytvoří stejné hodnocení * Zdroje * Dokumentace – Abstrakty pro publikace a dokumentaci : ČSN ISO 214. Praha : Český normalizační institut, 2001. 15 s. * Referát a anotace : ČSN 01 0194. Praha : Vydavatelství Úřadu pro normalizaci a měření, 1983. 7 s. * MACHÁČKOVÁ, Martina. Redukované texty v katalozích ČR [online]. Brno, 2010. 95 s. Dostupné z WWW: http://is.muni.cz/th/179890/ff_m/Machackova_diplomova_prace.pdf. Diplomová práce. Masarykova univertita, FF KISK. Vedoucí diplomové práce Mgr. Josef Schwarz. Závěr •Děkuji Vám za pozornost billboard Martin Krčál krcal@fss.muni.cz >