Czech BushBank: Instrukce pro anotátory ¶
NP ¶
- NP je fráze, jejíž hlavou je podstatné či přídavné
jméno, zájmeno, číslovka, předložka nebo zkratka (k[12347A]) včetně
svých bezpředložkových rozvití
- např. zájmena "který", "jaký", "se", "si" jsou NP
- "domnívám se" - NP je "se"
- "vymínil si" - NP je "si"
- "ceny tepla by mohly být i nižší" - NP jsou "ceny tepla" a "nižší"
- opatření by nutilo ke změně chování spotřebitele paliv, kteří ještě stále investují... - NP jsou "opatření", "ke změně chování spotřebitele paliv", "kteří"
- musíme určit, za jakých podmínek to uděláme - NP jsou "za jakých podmínek", "to"
- např. zájmena "který", "jaký", "se", "si" jsou NP
- do NP patří předložka včetně "jako", "než", "okolo", "kolem" POUZE NA ZAČÁTKU, tzn. každá NP je oddělena předložkou
- "jako tvrdé politické rozhodnutí vlády" je NP
- "mnohem vyšší než náklady v České republice" - "než náklady" je NP, "v České republice" je NP
- "s nimiž se čtenáři setkali jako spotřebitelé" - "jako spotřebitelé" je NP
- "s návratností do 10 let" - NP jsou "s návratností" a "do 10 let"
- ALE pokud po "jako", "než" bezprostředně nenásleduje NP, není součástí NP
- "jako byla cena rodinného domku" - NP je pouze "cena rodinného domku"
- do NP nepatří spojky ("aby, že, protože, jak...") spojující jednotlivé věty
- NP může obsahovat spojku pouze uprostřed; a pouze takovou, která souřadně spojuje přívlastky
- "černá a bílá kočka" je NP
- "ministerstvo školství a mládeže" je NP
- víceslovné předložky rozdělujeme:
- "se zřetelem na správní řízení" - NP jsou "se zřetelem" a "na správní řízení"
- "vzhledem ke komplikacím" - NP jsou "vzhledem" a "ke komplikacím"
- a s jednoslovnými nevlastními předložkami zacházíme jako s předložkami vlastními:
- např. "blízko", "doprostřed", "dovnitř", "nedaleko", "oproti", "poblíž", "uprostřed", "vprostřed", "zprostřed" - tedy nevlastní předložky jednoslovné vzniklé z místních příslovcí
- "jsou poblíž nás" - NP je "poblíž nás"
- "uprostřed náměstí" je NP
- v případě, že jsou dvě NP vedle sebe bez
předložky, musíme je rozdělit, pokud sémanticky nepatří k sobě, čili
druhá není rozvitím první:
- "dala mi to" - NP jsou "mi" a "to"
- "pošleme vám zboží" - NP jsou "zboží"a "vám"
- "jak vypadal svět před 100 lety očima vesmíru" - NP jsou "svět", "před sto lety" a "očima vesmíru"
- "z nichž každý" - správné NP jsou "z nichž" a "každý"
- NP nezačíná ani nekončí na interpunkci ani na žádné jiné divné znaky (hvězdička, závorka, pomlčka, uvozovky a jiné)
- "na 5 tisíc Kč," "příliš nákladné," "*Michal Malý" NEJSOU NP
- správná je jen nejdelší možná NP podle pravidel výše
- "zcela jiné starosti" je správná NP, "jiné starosti" nebo "starosti" jsou špatné NP
- "okolo půl milionu" je správná NP, "milionu" nebo "půl milionu" jsou špatné NP
- "nadějnost českého trhu" je jedna NP
- správné NP jsou také:
- "10 %"
- "100 kč"
- "20 až 30 dnů"
- ALE "od 200 do 600 m" - NP jsou "od 200" a "do 600m";
- přístavky a jiná interpunkcí oddělená bližší určení určujeme jako NP zvlášť
- "Marie Nováková, učitelka na základní škole" - NP jsou "Marie Nováková", "učitelka" a "na základní škole"
- ALE "učitelka Marie Nováková" je jedna NP - "Marie Nováková" je špatná NP
- příslovce patří do NP pouze pokud před ně lze postavit předložku
- "téměř tři hodiny" - můžeme říci "za téměř tři hodiny", tudíž téměř patří do NP
- stejně tak i příslovce "asi", "přibližně", "například/ na příklad" ("například zelenina" je NP)
- ALE nepatří "už", již" ("už dvě hodiny" - NP je "dvě hodiny" bez už)
- do NP nepatří slovesa, částice a citoslovce
- "až 500 kč" - NP je pouze "500 kč"
COORD ¶
- skládá se z několika NP + spojovací výrazy (čárka, spojka)
- "džípy a obrněné vozy" je koordinace, "džípy" a "obrněné vozy" jsou NP
- "pes nebo kočka" je koordinace a "pes" a "kočka" jsou NP
- "originální rozhodnutí či certifikát" je koordinace, a "originální rozhodnutí" a "certifikát" jsou NP
- aby šlo o koordinaci, je nutné, aby byl hlavní (řídící) člen NP několikanásobný
- "na nákup chemikálií a vybavení" není koordinace, ale NP, protože řídící člen je "nákup"
- "ministerstvo školství, mládeže a tělovýchovy" není koordinace - protože hlavní člen je "ministerstvo"
- pokud před několikanásobným větným členem
stojí předložka, NENÍ to koordinace, protože hlavou fráze a řídícím
členem je předložka
- "mluvil o míru a svornosti" - "míru a svornosti" závisí na předložce "o", není koordinace
- "bílá a černá kočka" NENÍ koordinace, muselo by být "bílá kočka a černý pes"
- nezačíná ani nekončí na interpunkci ani na žádné jiné divné znaky (hvězdička, závorka, pomlčka, uvozovky a jiné)
- pro případ typu "sice X, ale Y" jsou "Y" a "X" NP a "sice X, ale Y" je koordinace
- "sice dům, ale malý" je koordinace
VP ¶
- VP je slovesná fráze, obsahuje POUZE slovesné tvary a nic jiného
- včetně tvarů: bych, bys, by, bychom, bysme
- včetně pomocných tvarů slovesa být a jejich negací: jsem, jsi, je, jsme, jste, jsou, budu, budeš, bude, budeme, budete, budou)
- jedna VP obsahuje právě jedno významové sloveso => jednoduchá věta může obsahovat víc VP
- "šel nakoupit" - VP jsou "šel" a "nakoupit"
- "šel bys nakoupit" - správné VP jsou "šel bys" a "nakoupit"
- "budu hrát fotbal" - VP je "budu hrát"
- "vše jsme uplatnili" - VP je "jsme uplatnili"
- spojky "aby", "kdyby" a jejich tvary, tj. "abych, abys, aby, abychom, abyste, aby..." do VP nepatří
- "abych šel" - VP je pouze "šel"
- jedna VP také spolu s významovým slovesem
obsahuje slovesa modální i jejich negace, tedy "chtít", "mít
(povinnost)", "moci", "umět", "smět", "muset", "lze", "nelze", "nechtít"
- "může dojít k sejmutí klateb" - VP je "může dojít"
- "rozhodnutí musí zrát" - VP je "musí zrát"
- "má se stát prezidentem" - VP je "má stát"
- "úkony nelze hradit" - VP je "nelze hradit"
- "bude muset o odvolání uchazeče rozhodnout" - VP je "bude muset rozhodnout"
- "mohlo by dojít k sejmutí klateb" - VP je "mohlo by dojít", "mohlo dojít" je špatná VP
- fázová slovesa tvoří samostatnou VP
- "začít bruslit" - VP jsou "začít" a "bruslit"
- "potřebuji spravit" - VP jsou "potřebuji" a "spravit"
- "ošetřující lékař odmítl sdělit" - VP jsou "odmítl" a "sdělit"
- VP NIKDY neobsahuje se/si
- "domnívám se" - VP je pouze "domnívám"
- několikanásobný přísudek rozdělujeme:
- "musí ošetřovat a bodovat" - VP jsou "musí ošetřovat" a "bodovat"
- VP u přísudku jmenného:
- "je potřeba zakročit" - VP jsou "je" a "zakročit"; "potřeba" je NP
- stejným způsobem například "je dobré udělat"
- jedna VP obsahuje i sloveso v příčestí trpném
- "byl zabit" - je VP
- "byl jeho post předurčen" - VP je "byl předurčen"
- ALE pokud je tam adjektivum nebo pokud je
příčestí trpné odvozeno od adjektiva (tj. nelze utvořit slovesný
infinitiv), není součástí VP
- "je ochoten" - VP je pouze "je", "ochoten" je NP
- ale "byl zabit" je VP
- "byl zabitý" - VP je "byl", "zabitý" je NP
- slovesná spojení typu "mít uděláno" jsou jedna VP, stejně tak příčestí trpné je jedna VP i když je pomocné "je" vypuštěno
- "mít spočteno" - jedna VP
- "sečteno a podtrženo" - VP jsou "sečteno" a "podtrženo"
- VP nezačíná ani nekončí na interpunkci ani na žádné jiné divné znaky (hvězdička, závorka, pomlčka, uvozovky a jiné)
- "*chci podpořit" je špatná VP
- VP určujeme i pokud je v závorce
- "Firma ( její jméno neuvádíme ) se skládá ze dvou ekonomicky a obchodně samostatných divizí." - VP jsou "neuvádíme", "skládá"
- VP neobsahuje "-li"
- "pomineme-li bezdrátové telefony" - VP je pouze "pomineme"
CLAUSE ¶
- neznačkujeme
RELATIONS ¶
Navázání na NP (noun:) ¶
- snažíme se vytvořit nejdelší platnou NP a navazujeme vždycky na řídící NP
- "muž s dalekohledem": "s dalekohledem" -> "noun: muž"
- je v pořádku nepřiřadit NP nikam
- když jsou NP součástí koordinace, tak se váže k slovesu nebo k jiné NP jen koordinace a NP se navazují na koordinaci
- "pejsek a kočička běhali"
- "pejsek a kočička" -> "verb: běhali"
- "pejsek" -> "noun: pejsek a kočička"
- "kočička" -> "noun: pejsek a kočička"
- "pejsek a kočička běhali"
- pokud se NP nenavazuje nikam, použijte "not identified yet" nebo neurčujte
- nikdy nenavazujeme na strukturu (VP, NP), která je označena znaménkem "-", tedy je špatně, ani nenavazujeme samotnou špatnou strukturu
- pokud může být daná NP závislá na více frázích (NP, VP - např. doplněk), určete ji podle významu (a sebe)
Navázání na VP ¶
- navazujeme vždy na VP, která se vyskytuje ve stejné jednoduché větě (pokud má věta více VP navazujeme k té, ke které se váže)
- "se/si", "který", "jaký" jsou NP a vážeme je k příslušnému slovesu
Technické detaily ¶
- Je třeba mít nainstalovanou Javu - http://www.java.com/en/download/index.jsp
- Všechny elementy musí být určeny, jestli jsou správně či ne (tedy označené "+" nebo "-"), pokud jsou označeny "?", určete je, jinak se nezobrazí v klikátku
- Pokud jsou NP, VP určeny (+,-) a vy máte jiný názor, tak to změňte
- jako výsledek se posílají všechny soubory .xml, nejlépe komprimované v ZIP souboru
Last modified 23 hours ago
Last modified on 11/24/13 11:29:15
Attachments (1)
- Pokyny pro anotátory.pdf (125.1 KB) - added by xgrac 17 months ago.
Download all attachments as: .zip