Digitálna knižnica a digitálny archív prof. PhDr. Dušan Katuščák, PhD. Osnova prednášky 1.Prerekvizity a osobný program 2.Metodologický a technologický koncept 3.Projekt Digitálna knižnica a digitálny archív a môj zápas s veternými mlynmi 4.Porovnanie plánu a skutočnosti 5.Konzervovanie a CBA (Cost Benefit Analysis) 6.Závery • • • 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 2 Prerekvizity digitálneho príbehu a našej cesty 60.-70. roky •1968 – na začiatku – Matica slovenská, Miloš Kovačka, Dezider Kormúth, Peter Liba a článková bibliografia (1918-1938) •Bibliografická práca – záujem o lepšie zaznamenanie obsahu popri popise (obsahová charakteristika...) •Strojové spracovanie slovenskej národnej bibliografie (1975) (ing. Ján Mišík, dr. Štefan Ďurovčík) •Formovanie metodologického mikrosystému – •Štrukturalizmus, Nitra, Kabinet literárnej komunikácie, teória metakomunikácie, metatextu, komunikačný prístup k bibliografii, dôraz na informačnú funkciu bibliografie a knižníc, štátne výskumné programy P13 a P18 • • • 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 3 Prerekvizity 80. roky •IKIS – pokusy o integráciu a kooperáciu (štátny program) – Dušan Katuščák, Štefan Kimlička, Ján Mišík, Miloš Kovačka, Soňa Makulová, Jela Šteinerová, Jaro Šušol, Štefan Ďurovčík a i. •1978 - metodológia informačných systémov, informačných jazykov, bibliografie, štandardizácie bibliografického popisu, formát ISO 2709, makrotezaurus; •1983 – SNK ako samostatný útvar v rámci Matice slovenskej •Regionálny informačný kooperačný systém •Zrod modernej koncepcie konzervovania dokumentov •Vybudovanie datacentra, získanie hardvéru, výmenný formát IKIS •2000, zákon 183/2000 Z.z. Zákon o knižniciach • 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 4 Prerekvizity 90.roky • •Štandardizácia, integrácia, kooperácia •Preklad a implementácia formát UNIMARC, Cena Mateja Bela (Lit. Fond) •Implementácia štandardov ISBD a AACR2 •Projekt KIS3G a spoločný softvér VIRTUA (cena ITAPA, Európska komisia – jediný významný portál SK – manažment znalostí •Záznamy vo formáte MARC21 implementované do Virtui, konverzie z lokálnych systémov (ca 1.5 mil.) •Št. úloha – KNIHA SK, projekt základného výskumu – konzervovanie papiera (špičkové vedecké výsledky) •Odlúčenie SNK od Matice slovenskej •Univerzita Komenského (spoločný systém Virtua – 12 fakúlt, konverzie) • 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 5 Rok 2000+ •2000 Zákon 183/2000 Z.z. O knižniciach •Výberové konanie: Generálny riaditeľ (2000-2012) •Priority: •Masová priemyselná digitalizácia (od 2002) •http://www.4digitalbooks.com/_auto_dlmini.php •Masové priemyselné konzervovanie •http://www.knihask.eu/odborny.htm •2006 – SNK v Európskej knižnici •2009 – SNK v Europeane •Projekt OPIS2 (180 mil eur – 2005-2015) •Slovenská digitálna knižnica , OPIS2 - (Nórske fondy) •Národný projekt: Digitálna knižnica a digitálny archív (DIKDA) •Katedra mediamatiky a kultúrneho dedičstva 2002/2003 (prof. Milan Konvit), •Centrum excelentnosti UNIZA (2010-2015) • 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 6 Metodologický koncept bibliografie a dokumentácie •Writing ☛ Rewriting ☛ Description ☛ Digitisation •Historickú vývojovú líniu vidíme takto: •Bibliografia sa „vracia“ po dvoch tisícročiach ku svojej archetypálnej „podstate“ •Prešla od starovekého a stredovekého písania a prepisovania dokumentov (writing, rewriting) do 16. storočia, •cez novoveké popisovanie kníh (description), ktoré teraz doznieva, po digitalizáciu (digitisation) od začiatku 21. storočia. •To, čo bolo v minulosti v bibliografii dominantné a známe ako prepisovanie dokumentov, to je v súčasnosti pre bibliografiu digitalizácia ako kvalitatívne nová fáza vývoja jej formy a spoločenského dosahu 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 7 •Čistenie v depozitoch •Skenovanie •Globálna schéma (J. Dzvák) •Pracovné úložisko •Dolovanie znalostí •Spracovanie dát •Metadáta •Prezentácia verejnosti (Big Data) •Nová služba •Zbierky/objekty na policiach: 9.3 km (BIG Collections) • • • • • • •KB/data Mining •ebooks •Textové analýzy (JUĽŠ, IBM, HP,UPJŠ, Oracle...) • • •MDS/DO associations •Konzervovanie • •Sterilizácia •80 ton za rok • •Deacidifikácia •20-60 ton za rok •Laboratórna kontrola kvality 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 8 • • •Projekt Digitálna knižnica a digitálny archív a •Môj zápas s veternými mlynmi 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 9 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 10 https://hrperspectives.files.wordpress.com/2011/09/1276051231_98879510_5-don-quijote-de-la-mancha-m alaga-1276051231.jpg Schválenie národného projektu •OP Informatizácia spoločnosti (OPIS) •Schválenie 2006-2007 (RO, EK, vláda SR) •Január 2010 OPIS 2 – Schválená Štúdia uskutočniteľnosti •Vláda SR – uzn.192/2011 (24.7 mil. pro rata) •31.3. 2011 Zoznam národných projektov OPIS na roky 2007 – 2013 •28.3.2011 – minister D. Krajcer - poverenie SNK pripraviť a implementovať projekt DIKDA (2011-2015) •2010-2015 - Centrum excelentnosti FHV Žilina-SNK (4 mil.eur) •16.11.2011 – hotový projekt – odovzdaný SORO •2012 – politika zvíťazila nad verejným záujmom • • 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 11 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 12 DSC02405.JPG 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 13 Cieľ projektu DIKDA }Digitalizácia a sprístupnenie písomného kultúrneho a vedeckého dedičstva všetkým občanom Slovenska, Európy a sveta }Špecifický cieľ - digitalizácia všetkých slovacikálnych dokumentov }Slovacikálne písomné dokumenty, čiže diela, ktorých ◦a) autormi sú Slováci, ◦b) boli vydané, vyrobené, nájdené a nachádzajúce sa na území dnešného Slovenska, ◦c) sa obsahovo dotýkajú Slovenska alebo Slovákov alebo ◦d) sú napísané v slovenskom jazyku }Sociálny cieľ - poskytnúť všetkým občanom nové služby }PFI už nebudú poskytovať len záznamy o dokumentoch ale úplné texty samotných dokumentov } 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 14 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 15 Digitalizačné roboty SNK DL3000 DSC02224.JPG 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 16 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 17 C:\Users\Dusan Katuscak\Documents\Obrázky neverejné\jpg\_MG_0043.jpg Kamaldulský kódex (1756) •Rukopis začal vznikať opisovaním Nového zákona 6. mája 1756; opisovanie Starého zákona začalo 4. marca 1757. •Rukopis má dva zväzky. Prvý zväzok má 920 strán a druhý 780 strán. •Súčasťou prekladu bol aj Latinsko-slovenský slovník, ktorý sa zachoval v rukopise z roku 1763. •Romulad Hadbavný, Kamaldulský rád, Červený kláštor • •https://www.researchgate.net/publication/313350851_Kamaldulsky_kodex_-_symbolicky_zaciatok_masovej _digitalizacie_na_Slovensku_Narodny_projekt_digitalna_kniznica_a_digitalny_archiv •(Chemical Papers, Krásy Slovenska, Matriky, ... Ca 2 mil. strán experimentov) • • • • 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 18 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 19 C:\Users\Dusan Katuscak\Documents\Obrázky neverejné\jpg\_MG_0026.jpg 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 20 C:\Users\Dusan Katuscak\Documents\Obrázky neverejné\jpg\_MG_0059.jpg 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 21 C:\Users\Dusan Katuscak\Documents\Obrázky neverejné\jpg\_MG_0057.jpg Sprístupnenie objektov - repozity •Europeana (51 mil objektov) •https://www.europeana.eu/portal/sk • •Slovakiana •https://www.slovakiana.sk •Web umenia •https://www.webumenia.sk • •MEDIAINFO (digi zbierky) •http://mi.memoria.sk/# • •FEZ/FEDORA (open source) (digi zbierky) •http://fez.ceps.uniza.sk/view/FEZ:106 • •Virtua (KIS3G_LIS - knižničný systém) •http://www.memoria.sk •https://www.kis3g.sk • •(Hydra, Islandora, Invenio, Dspace, Eprint ...) • • • • • 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 22 Projekt v číslach •Rozpočet projektu: 50 000 000 Eur •2 800 000 objektov => 250 000 000 strán •250 000 000 strán => 17 PB dát •2 pracovné kópie potrebujú asi 34 PB dát •Produkcia 43 TB/deň •Preniesť 6 Gbit dát za sekundu •Trojsmenná prevádzka jún 2012-jún 2015 •78 nových pracovných miest •30 % dostupných objektov cez internet •Udržateľnosť minimálne do roku 2020 •Ca 24 000 000 CD (700 MB) •Ca 3 600 000 DVD (4,7 GB) •Ca 9 000 pások LTO 5 (1,6 TB) • • 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 23 Miesto a spôsob realizácie digitalizácie }Masová priemyselná digitalizácia }80% digitalizácie sa uskutoční s použitím robotov }20 % sa uskutoční s použitím manuálnych skenerov }Integrované konzervačné a digitalizačné centrum }Digitalizácia a konzervovanie ako jeden sofistikovaný technologický proces }Kritický masív slovacikálnych objektov sa nachádza v Slovenskej národnej knižnici v Martine a v Slovenskom národnom archíve v Bratislave }Dočasne 213 nových zamestnancov (trvalo zostáva 76) 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 24 Martin Luther King 1963 • •Mali sme sen :- )) •Aj sny a projekty sa dajú ukradnúť a deformovať •J) • 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 25 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 26 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 27 Porovnanie plánu a skutočnosti http://www.itapa.sk/data/att/3467.pdf (plagiát J. Kováčik SNK, referuje o projekte bez uvedenia jeho autorstva) 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 28 Podľa informácie Týždenníka Trend „Celkový počet strán, ktoré sa mali zdigitalizovať v národnej knižnici, tým klesol z pôvodných 253,8 milióna na 40,3 milióna, čiže šesťnásobne. Jednak sa znížil počet objektov a tiež sa uprednostňujú písomnosti menej náročné na spracovanie na úkor náročnejších kníh. Napríklad články v novinách, príspevky v zborníkoch a podobne. Podľa pôvodnej zmluvy o nenávratnom finančnom príspevku mala knižnica zdigitalizovať celkovo 700-tisíc kníh. Tento cieľ sa znížil na 100-tisíc monografií.“ 05.10.2015 Náklady na digitalizáciu (nie len skenovanie) • •infraštruktúru, •investície - stavby, materiál, •IKT, •skenery, •softvér, •archivovanie, •prístup •hardvér, •laboratórne vybavenie, • • •konzervovanie •energie, •mzdy, •odvody, •poistné, •zamestnanci, •služby, •slovom všetko! 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 29 Zdroj podvodu (podľa môjho názoru) •Správa Úradu pre verejné obstarávanie hovorí: • •"Pre každú každú položku aj pre každú kategóriu použil paretovu analýzu na stanovenie koeficienta váhovosti na ocenenie služieb a súvisiacich tovarov potrebných pre implementáciu národných projektov, definovaných v OPIS 2, t.j. určil váhu ceny pre každú kategóriu tak, aby dosiahol čo najefektívnejšie a najhospodárnejšie vynakladanie finančných prostriedkov za daný predmet zákazky.“ • •V skutočnosti Ministerstvo kultúry a Úrad pre verejné obstarávanie nevykonali žiadny cenový prieskum. Len akceptovali návrhy cien budúceho dodávateľa v rámcovej zmluve. • • • 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 30 Plán a skutočnosť - porovnanie Objekty (zmenený plán SNK) Strany A (plán) Projekt DIKDA/objekty B(zmena) Objekty/počet zmena SNK (C) Rozdiel oproti projektu/objekty 1.Monografie a zväzky viacdielnych monografií zväzkov 700 000 100 000 -600 000 kníh 2. Seriály (čísla) výtlačkov 28 000 350 000 +322 000 3. Články a príspevky v zborníkoch článkov 0 800 000 +800 000 4. Mapy, plagáty, pohľadnice kusov 10 250 10 000 +250 Počet strán 253 847 750 40 300 000 -213 547 750 Celkom objektov 1 439 000 1 260 000 -179 000 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertv 31 Tabuľka 3 Porovnanie: (A) počet objektov v projekte s počtom objektov po podstatnej zmene projektu (B), (C) rozdiel Počítajme ďalej •Podľa koncepcie MKSR nemá SNK digitálny obsah dlhodobo archivovať sama, ale prostredníctvom Centrálneho dátového archívu, ktorý je vybudovaný v rámci projektu OPIS2 v Univerzitnej knižnici v Bratislave. •Tento archív má kapacitu 25 000 Terabytov (=25 PB). Náklady na archív v UKB boli ca 33 000 000 €. •Z toho je pre digitálny obsah SNK plánovaná a obstaraná kapacita 17 000 TB (=17 PB) • •Celkový počet TB v apríli 2018 je 4162,21 TB (zo 17 inštitúcií) 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 32 Centrálny dátový archív Univerzitná knižnica v Bratislave •Názov zmluvy: Zmluva o poskytnutí nenávratného finančného príspevku •Číslo zmluvy: MK-40/2012-M •Dodávateľ: Univerzitná knižnica v Bratislave Michalská 1, 814 17 Bratislava Slovenská republika IČO: 00164631 Odberateľ: Úrad vlády Slovenskej republiky Námestie slobody 1, 813 70 Bratislava 1 Slovenská republika IČO: 00151513 •Celková hodnota predmetu zmluvy, ak ju možno určiť (vrátane DPH): 33 184 470,48 € •Dátum uzatvorenia zmluvy: 13. marec 2012 •Kapacita CDA (archív) 25 PB (25 000 TB) • • 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 33 Počítajmeďalej! Archivovanie digitálneho obsahu •Od roku 2012 do konca projektu v roku 2015, SNK do archívu nedala 17 000 terabytov, ale len približne 80 terabytov, čo nie je ani len jedno percento plánovaného objemu. •Tých 17 PB v archíve UKB, ktoré sú určené pre SNK, predstavuje 67% nákladov na archivovanie digitálneho obsahu z projektu SNK. •Znamená to, že sumu 40 282 685 €, ktorú použila na digitalizáciu SNK, treba zvýšiť o 67% zo sumy 33 000 000 €. (67% z 33 000 000 je 22 110 000 €.). • •Suma na projekt SNK je takto zvýšená na hodnotu 62 392 685 €. • 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 34 Počítajme ešte ďalej! Sprístupnenie digitálneho obsahu •K sume 62 392 685 € je potrebné pripočítať alikvotnú čiastku aj z projektu Národného osvetového centra, ktoré malo od konca novembra 2015 sprístupňovať digitálny obsah cez systém Slovakiana • •Slovakiana stála (projekt OPIS2 - Centrálna aplikačná infraštruktúra) ca 23 000 000 €. •Väčšina digitálneho obsahu mala byť zo SNK. •Zo sumy 23 000 000 je preto vhodné dedikovať na sprístupnenie digitálneho obsahu odhadom ca 15 000 000 € •Vývoj nového softvéru nebol potrebný!!! 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 35 Náklady na DIKDA spolu • •Projekt SNK: 40 282 685 € (-9 mil) •Archív CDA v UKB pre SNK: 22 110 000 € (67% kapacity) •Sprístupnenie v Slovakiane: 15 000 000 € (odhad alikv. časť) •Digitalizácia písomného dedičstva (DIKDA) •Výsledok 40 300 000 strán (z plánovaných 250 000 000 strán) •∑ 77 392 685 € •Pri kurze 25 CZK za euro (ca 1,5 miliardy CZK) •Ca 2 € za stranu (plánované 0,19 €/strana) 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 36 Konzervovanie (nerealizované podľa projektu) •Ciele IKDC: •Projekt KNIHASK (štátny plán základného výskumu SAV, STU, SNK, SNA): http://kniha.chtf.stuba.sk •Technologický rozvoj najlepších dostupných konzervačných technológií (BAT) na Slovensku, alebo zmluvne potvrdené zabezpečenie zapojenia Slovenska do ich rozvoja (Nitrochemie) •Udržateľný rozvoj technológie a zamestnanosti vysokoškolsky kvalifikovaných ľudí na Slovensku. •Znižovanie merných nákladov na ochranu kultúrneho dedičstva •Zvyšovanie úžitkových vlastností KAD •Vývoj a optimalizácia technologických postupov ochrany KAD so zreteľom na udržanie ekologickej kvality životného prostredia a pracovného prostredia • 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 37 Technologické centrum KNIHASK 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 38 DSC_7271 Autor, Inštitúcia UniLab S DSC_7253 DSC_7249 Navrhované procesy a výkony prevádzky IKDC Proces Spracované množstvo KAD (kg/r) Deacidifikácia 20 000 Digitalizácia 50 000 Sterilizácia 80 000 Čistenie 80 000 Sušenie 20 000 Individuálne úpravy 2 000 Lyofilizácia bez určenia množstva 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 40 CBA=Cost Benefit Analysis •Citát z CBA, povinnej prílohy projektu DIKDA: „Pri použití tejto metódy pre potreby SNK sa vychádza z nasledujúcich údajov (prepočítané na euro kurzom 1 EUR=1,3 USD): •Počet dokumentov v knižniciach SR je 3 500 000 (od roku 1900 po rok 2010). •Cena jedného dokumentu je odhadnutá na 76,9 EUR. •Celková cena dokumentov je 269 230 769 EUR. •Ročné straty sú 4,66% [ročná degradácia], čo vo finančnom vyjadrení predstavuje 12 546 154 EUR.“ • 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 41 CBA v SNK (priemyslové konzervovanie sa nekoná) •V rámci projektu sa malo chemicky ošetrovať cca 500 000 knižničných dokumentov a 1,4 mil. dokumentov z národného archívu, čo počas troch rokov realizácie predstavuje 1 900 000 kusov. •Touto metódou ročne zabráni stratám 4,66% z počtu 633 333 dokumentov. •Cena jedného dokumentu je odhadnutá na 76,90 EUR (LC 100 USD) •Celková cena dokumentov je 48 703 308 EUR. •Ročné straty sú 4,66%, čo vo finančnom vyjadrení predstavuje 2 269 574EUR. •Prínos zo záchrany dokumentov je trvalý a tak do prínosov projektu je možné započítať každoročnú záchranu opotrebovania knižničného fondu o 4,66%. •Návratnosť nákladov na projekt 10 rokov podľa CBA • 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 42 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 43 https://hrperspectives.files.wordpress.com/2011/09/1276051231_98879510_5-don-quijote-de-la-mancha-m alaga-1276051231.jpg Závery •Okrem osobnej frustrácie aj profesionálne závery: 1.Do vedy, výskumu a vzdelávania patria aj poznatky o negatívnych javoch a skúsenostiach! 2.Nevyužitá historická príležitosť kvalitatívnej zmeny služieb informačných inštitúcií (fragmentovaný prístup, divoká digitalizácia...) 3.Plytvanie verejnými zdrojmi 4.Zlyhanie európskych a národných kontrolných orgánov a ÚVO 5.Zneužitie odborníkov politikmi a politizácia programu informatizácie 6.Nekompetentné riadenie na úrovni ministerstva a inštitúcie 7.Nedostatočný záujem odbornej informačnej komunity o zásadnú inováciu prostredníctvom masovej priemyslovej digitalizácie a konzervovania 8.Komunita na Slovensku takmer nereaguje na inovácie a výzvy (Big data, Digital Humanities, scientizácia LIS, READ...) • • • • • • 17. 5. 2018 Brno, Masarykova univerzita, Filozofická fakulta, Blok expertov 44 dusankatuscak@gmail.com Ďakujem za pozornosť