wiki:ManualNew

Czech BushBank: Instrukce pro anotátory

NP

  • NP je fráze, jejíž hlavou je podstatné či přídavné jméno, zájmeno, číslovka, předložka nebo zkratka (k[12347A]) včetně svých bezpředložkových rozvití
    • např. zájmena "který", "jaký", "se", "si" jsou NP
      • "domnívám se" - NP je "se"
      • "vymínil si" - NP je "si"
    • "ceny tepla by mohly být i nižší" - NP jsou "ceny tepla" a "nižší"
    • opatření by nutilo ke změně chování spotřebitele paliv, kteří ještě stále investují... - NP jsou "opatření", "ke změně chování spotřebitele paliv", "kteří"
    • musíme určit, za jakých podmínek to uděláme - NP jsou "za jakých podmínek", "to"
  • do NP patří předložka včetně "jako", "než", "okolo", "kolem" POUZE NA ZAČÁTKU, tzn. každá NP je oddělena předložkou
    • "jako tvrdé politické rozhodnutí vlády" je NP
    • "mnohem vyšší než náklady v České republice" - "než náklady" je NP, "v České republice" je NP
    • "s nimiž se čtenáři setkali jako spotřebitelé" - "jako spotřebitelé" je NP
    • "s návratností do 10 let" - NP jsou "s návratností" a "do 10 let"
  • ALE pokud po "jako", "než" bezprostředně nenásleduje NP, není součástí NP
    • "jako byla cena rodinného domku" - NP je pouze "cena rodinného domku"
  • do NP nepatří spojky ("aby, že, protože, jak...") spojující jednotlivé věty
  • NP může obsahovat spojku pouze uprostřed; a pouze takovou, která souřadně spojuje přívlastky
    • "černá a bílá kočka" je NP
    • "ministerstvo školství a mládeže" je NP
  • víceslovné předložky rozdělujeme:
    • "se zřetelem na správní řízení" - NP jsou "se zřetelem" a "na správní řízení"
    • "vzhledem ke komplikacím" - NP jsou "vzhledem" a "ke komplikacím"
  • a s jednoslovnými nevlastními předložkami zacházíme jako s předložkami vlastními:
    • např. "blízko", "doprostřed", "dovnitř", "nedaleko", "oproti", "poblíž", "uprostřed", "vprostřed", "zprostřed" - tedy nevlastní předložky jednoslovné vzniklé z místních příslovcí
    • "jsou poblíž nás" - NP je "poblíž nás"
    • "uprostřed náměstí" je NP
  • v případě, že jsou dvě NP vedle sebe bez předložky, musíme je rozdělit, pokud sémanticky nepatří k sobě, čili druhá není rozvitím první:
    • "dala mi to" - NP jsou "mi" a "to"
    • "pošleme vám zboží" - NP jsou "zboží"a "vám"
    • "jak vypadal svět před 100 lety očima vesmíru" - NP jsou "svět", "před sto lety" a "očima vesmíru"
    • "z nichž každý" - správné NP jsou "z nichž" a "každý"
  • NP nezačíná ani nekončí na interpunkci ani na žádné jiné divné znaky (hvězdička, závorka, pomlčka, uvozovky a jiné)
    • "na 5 tisíc Kč," "příliš nákladné," "*Michal Malý" NEJSOU NP
  • správná je jen nejdelší možná NP podle pravidel výše
    • "zcela jiné starosti" je správná NP, "jiné starosti" nebo "starosti" jsou špatné NP
    • "okolo půl milionu" je správná NP, "milionu" nebo "půl milionu" jsou špatné NP
    • "nadějnost českého trhu" je jedna NP
  • správné NP jsou také:
    • "10 %"
    • "100 kč"
    • "20 až 30 dnů"
    • ALE "od 200 do 600 m" - NP jsou "od 200" a "do 600m";
  • přístavky a jiná interpunkcí oddělená bližší určení určujeme jako NP zvlášť
    • "Marie Nováková, učitelka na základní škole" - NP jsou "Marie Nováková", "učitelka" a "na základní škole"
    • ALE "učitelka Marie Nováková" je jedna NP - "Marie Nováková" je špatná NP
  • příslovce patří do NP pouze pokud před ně lze postavit předložku
    • "téměř tři hodiny" - můžeme říci "za téměř tři hodiny", tudíž téměř patří do NP
    • stejně tak i příslovce "asi", "přibližně", "například/ na příklad" ("například zelenina" je NP)
    • ALE nepatří "už", již" ("už dvě hodiny" - NP je "dvě hodiny" bez už)
  • do NP nepatří slovesa, částice a citoslovce
    • "až 500 kč" - NP je pouze "500 kč"

COORD

  • skládá se z několika NP + spojovací výrazy (čárka, spojka)
    • "džípy a obrněné vozy" je koordinace, "džípy" a "obrněné vozy" jsou NP
    • "pes nebo kočka" je koordinace a "pes" a "kočka" jsou NP
    • "originální rozhodnutí či certifikát" je koordinace, a "originální rozhodnutí" a "certifikát" jsou NP
  • aby šlo o koordinaci, je nutné, aby byl hlavní (řídící) člen NP několikanásobný
    • "na nákup chemikálií a vybavení" není koordinace, ale NP, protože řídící člen je "nákup"
    • "ministerstvo školství, mládeže a tělovýchovy" není koordinace - protože hlavní člen je "ministerstvo"
  • pokud před několikanásobným větným členem stojí předložka, NENÍ to koordinace, protože hlavou fráze a řídícím členem je předložka
    • "mluvil o míru a svornosti" - "míru a svornosti" závisí na předložce "o", není koordinace
    • "bílá a černá kočka" NENÍ koordinace, muselo by být "bílá kočka a černý pes"
  • nezačíná ani nekončí na interpunkci ani na žádné jiné divné znaky (hvězdička, závorka, pomlčka, uvozovky a jiné)
  • pro případ typu "sice X, ale Y" jsou "Y" a "X" NP a "sice X, ale Y" je koordinace
    • "sice dům, ale malý" je koordinace

VP

  • VP je slovesná fráze, obsahuje POUZE slovesné tvary a nic jiného
    • včetně tvarů: bych, bys, by, bychom, bysme
    • včetně pomocných tvarů slovesa být a jejich negací: jsem, jsi, je, jsme, jste, jsou, budu, budeš, bude, budeme, budete, budou)
  • jedna VP obsahuje právě jedno významové sloveso => jednoduchá věta může obsahovat víc VP
    • "šel nakoupit" - VP jsou "šel" a "nakoupit"
    • "šel bys nakoupit" - správné VP jsou "šel bys" a "nakoupit"
    • "budu hrát fotbal" - VP je "budu hrát"
    • "vše jsme uplatnili" - VP je "jsme uplatnili"
  • spojky "aby", "kdyby" a jejich tvary, tj. "abych, abys, aby, abychom, abyste, aby..." do VP nepatří
    • "abych šel" - VP je pouze "šel"
  • jedna VP také spolu s významovým slovesem obsahuje slovesa modální i jejich negace, tedy "chtít", "mít (povinnost)", "moci", "umět", "smět", "muset", "lze", "nelze", "nechtít"
    • "může dojít k sejmutí klateb" - VP je "může dojít"
    • "rozhodnutí musí zrát" - VP je "musí zrát"
    • "má se stát prezidentem" - VP je "má stát"
    • "úkony nelze hradit" - VP je "nelze hradit"
    • "bude muset o odvolání uchazeče rozhodnout" - VP je "bude muset rozhodnout"
    • "mohlo by dojít k sejmutí klateb" - VP je "mohlo by dojít", "mohlo dojít" je špatná VP
  • fázová slovesa tvoří samostatnou VP
    • "začít bruslit" - VP jsou "začít" a "bruslit"
    • "potřebuji spravit" - VP jsou "potřebuji" a "spravit"
    • "ošetřující lékař odmítl sdělit" - VP jsou "odmítl" a "sdělit"
  • VP NIKDY neobsahuje se/si
    • "domnívám se" - VP je pouze "domnívám"
  • několikanásobný přísudek rozdělujeme:
    • "musí ošetřovat a bodovat" - VP jsou "musí ošetřovat" a "bodovat"
  • VP u přísudku jmenného:
    • "je potřeba zakročit" - VP jsou "je" a "zakročit"; "potřeba" je NP
    • stejným způsobem například "je dobré udělat"
  • jedna VP obsahuje i sloveso v příčestí trpném
    • "byl zabit" - je VP
    • "byl jeho post předurčen" - VP je "byl předurčen"
  • ALE pokud je tam adjektivum nebo pokud je příčestí trpné odvozeno od adjektiva (tj. nelze utvořit slovesný infinitiv), není součástí VP
    • "je ochoten" - VP je pouze "je", "ochoten" je NP
    • ale "byl zabit" je VP
    • "byl zabitý" - VP je "byl", "zabitý" je NP
  • slovesná spojení typu "mít uděláno" jsou jedna VP, stejně tak příčestí trpné je jedna VP i když je pomocné "je" vypuštěno
    • "mít spočteno" - jedna VP
    • "sečteno a podtrženo" - VP jsou "sečteno" a "podtrženo"
  • VP nezačíná ani nekončí na interpunkci ani na žádné jiné divné znaky (hvězdička, závorka, pomlčka, uvozovky a jiné)
    • "*chci podpořit" je špatná VP
  • VP určujeme i pokud je v závorce
    • "Firma ( její jméno neuvádíme ) se skládá ze dvou ekonomicky a obchodně samostatných divizí." - VP jsou "neuvádíme", "skládá"
  • VP neobsahuje "-li"
    • "pomineme-li bezdrátové telefony" - VP je pouze "pomineme"

CLAUSE

  • neznačkujeme

RELATIONS

  • snažíme se vytvořit nejdelší platnou NP a navazujeme vždycky na řídící NP
    • "muž s dalekohledem": "s dalekohledem" -> "noun: muž"
  • je v pořádku nepřiřadit NP nikam
  • když jsou NP součástí koordinace, tak se váže k slovesu nebo k jiné NP jen koordinace a NP se navazují na koordinaci
    • "pejsek a kočička běhali"
      • "pejsek a kočička" -> "verb: běhali"
      • "pejsek" -> "noun: pejsek a kočička"
      • "kočička" -> "noun: pejsek a kočička"
  • pokud se NP nenavazuje nikam, použijte "not identified yet" nebo neurčujte
  • nikdy nenavazujeme na strukturu (VP, NP), která je označena znaménkem "-", tedy je špatně, ani nenavazujeme samotnou špatnou strukturu
  • pokud může být daná NP závislá na více frázích (NP, VP - např. doplněk), určete ji podle významu (a sebe)
  • navazujeme vždy na VP, která se vyskytuje ve stejné jednoduché větě (pokud má věta více VP navazujeme k té, ke které se váže)
  • "se/si", "který", "jaký" jsou NP a vážeme je k příslušnému slovesu

Technické detaily

  • Je třeba mít nainstalovanou Javu - http://www.java.com/en/download/index.jsp
  • Všechny elementy musí být určeny, jestli jsou správně či ne (tedy označené "+" nebo "-"), pokud jsou označeny "?", určete je, jinak se nezobrazí v klikátku
  • Pokud jsou NP, VP určeny (+,-) a vy máte jiný názor, tak to změňte
  • jako výsledek se posílají všechny soubory .xml, nejlépe komprimované v ZIP souboru
Last modified 23 hours ago Last modified on 11/24/13 11:29:15