Sociální informatika
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií
Sémantický web, ontologie, sociální
sítě, elektronické informační zdroje
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 2 z 73
Osnova
• Sémantický web
• Ontologie
• Sociální sítě
• Modelování a analýza sociálních sítí
• Elektronické informační zdroje
– IEEE Xplore DL
– ACM DL
• Zadání domácího úkolu
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 3 z 73
Sémantický web
• Metody a techniky pro přiřazení významu
(sémantiky) informacím na webu
• Web rozšířený o metadata
• Metadata = data o datech
• Postaven na formátu RDF
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 4 z 73
Cíle sémantického webu
• Integrovat data z různých zdrojů
• Umožnit výměnu dat mezi aplikacemi napříč
celým webem
• Umožnit kvalitnější strojové vyhledávání
informací na webu
• Umožnit popsat vztahy mezi daty a objekty v
reálném světě
• Přiřadit informacím na webu přesný význam
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 7 z 73
Metadata v HTML
• Pomocí tagů:
• Cíl: umožnit kvalitnější vyhledávání, než
obyčejný full-text search
• Zneužíváno ve velké míře spammery
• Neumožňuje definovat vztahy a hierarchie
objektů
• Dnes vyhledávače dávají přednost jiným
metodám, než prohledávání tagů
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 8 z 73
HTML 5
• Některé elementy v HTML5
– ,
– ,
– ,
– ,
–
– …
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 9 z 73
RDF
• RDF = Resource Description Framework
• Framework pro popis zdrojů na webu
• Navržen tak, aby byl strojově čitelný a
pochopitelný
• Doporučení W3C
• Různé způsoby serializace
– Uložení do souboru
– Př. RDF/XML
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 10 z 73
Princip RDF (1)
• Každému zdroji na webu přiřadí trojici:
– Subject (subjekt, podmět)
– Predicate (predikát, vlastnost)
– Object (objekt, předmět)
• Při definici subjektů a predikátů je typicky
potřeba definovat URI (Unique Resource
Identifier) pro jednoznačné přiřazení významu.
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 11 z 73
Princip RDF (2)
• RDF dokumenty lze ukládat do triplestore
databází (databáze optimalizované pro RDF
trojice) nebo serializovat pomocí XML (formát
RDF/XML)
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 12 z 73
Příklad - RDF/XML
• Příklad: „Obloha má modrou barvu.“
– Podmět: „obloha“
– Vlastnost: „mít barvu“
– Předmět: „modrá“ („blue“)
• Serializace ve formátu RDF/XML:
1:
2:
3:
6:
7: blue
8:
9:
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 13 z 73
Triplestores
• Databáze optimalizované pro ukládání RDF
trojic (subjekt, predikát, objekt)
• Mnoho implementací v různých jazycích
– C, C#, PHP, Java, Perl
• Postaveny buď nad existujícím relačním
databázovým strojem (MySQL, PostgreSQL,
MS SQL, Oracle), nebo vyvinuty kompletně od
začátku přesně pro svůj účel (vyšší efektivita)
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 14 z 73
Ontologie
• Model pro popis světa
složeného z typů, vlastností
a vztahů
• Využití v sémantickém
webu pro přiřazení
významu datům (tj. pro
tvorbu metadatového
modelu)
• Při tvorbě ontologií je
snaha o co nejpřesnější
podobnost mezi objekty
reálného světa a
vlastnostmi modelu
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 15 z 73
Ontologie - diskuze
• Opravdu každý vidí svět stejně?
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 16 z 73
Kategorie ontologií
• Individua (instance a objekty)
• Třídy (množiny, kolekce, pojmy, typy, druhy)
• Atributy (aspekty, stavy, vlastnosti,
charakteristiky a parametry, kterých mohou
objekty/třídy nabývat)
• Relace (způsoby, jakými k sobě mohou třídy a
individua navzájem patřit)
• Funkční výrazy (komplexní struktury nad
relacemi)
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 17 z 73
Kategorie ontologií
• Restrikce (formální popis platného vstupu)
• Pravidla (Příkazy ve formě if-then (příčinanásledek)
popisující logické inference, které
mohou být odvozeny z výroků v dané formě)
• Axiomy (výroky (vč. pravidel) v logické formě,
které dohromady skládají kompletní teorii, kterou
ontologie popisuje. Nemusí obsahovat pouze
apriorní znalosti, ale také odvozené teorie z jiných
axiomů)
• Události (změny atributů a relací)
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 18 z 73
Inference znalostí
• Pojem inference
– 1) dobře navržená logická heuristika pro
odvozování nových znalostí
– 2) odvozená znalost
• Inference znalostí - odvozování nových
znalostí na základě existujících (známých)
znalostí (inferencí)
• Využití v sémantickém webu při strojovém
vyhledávání nových znalostí
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 19 z 73
Inference pomocí pomocí
definovaných pravidel.
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 20 z 73
Inferenční enginy
• Počítačové programy, které zkouší odvodit
odpověď z báze znalostí (knowledge base,
množina axiomů/výroků/faktů/znalostí/popř.
inferencí)
• Data v bázi znalostí musí být uložena takovým
způsobem, aby stroj/engine dokázal odvodit a
porozumět jejich významu, tj. musí být
explicitně vyjádřena jejich sémantika
(samotná data musí být doplněna o metadata)
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 21 z 73
SPARQL [„spa:kl“]
• Jazyk / protokol pro inferenci znalostí z RDF
dokumentů
• Umožňuje provádět dotazy nad RDF trojicemi
(triplestore databázemi)
• Podobná syntax jako SQL
• Výhoda SPARQL: dotazy jsou díky přítomnosti
URI v RDF formátu globálně jednoznačné
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 22 z 73
Příklad SPARQL
• Dotaz ke zjištění jmen všech osob v databázi
má následující formát:
– SELECT ?name FROM WHERE { ?x
example:name ?name }
– SELECT ?name FROM WHERE { ?x
example:name ?name ; ?x example:city
„Stockholm“ }
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 23 z 73
Sociální sítě
• Propojená skupina lidí, kteří se navzájem
ovlivňují
• Sociální software (socioware)
– Software, který umožňuje tvořit komunity pomocí
počítačových propojení.
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 24 z 73
Virtuální komunita, e-komunita
• Periferní (tj. lurker – číhající) - externí,
nestrukturovaná účast
• Příchozí (tj. nováček) – nově příchozí je vpuštěn
do komunity a může se plně účastnit diskuze
• Zasvěcenec (tj. stálý člen) – plně uznaný účastník
• Strážce hranic (tj. vůdce) – podporuje členství a
zprostředkovává interakce
• Odchozí (tj. starý) – proces opouštění komunity
kvůli novým vztahům, novým místům, novým
vyhlídkám
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 25 z 73
Sociální sítě
• Facebook
• Twitter (tweety, „SMS Internetu“)
• MySpace – sdílení hudby a videa
• Orkut – sdílení multimédií, chatování a hledání
ztracených přátel.
• Classmates (Spolužáci.cz)
• Blackplanet - síť určená pro Afroameričany a
jejich přátele
• Hi5, Friendster, Bebo, …
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 29 z 73
Modelování a analýza sociálních
sítí
• Grafy
• Matice
• Vizualizace
• Aplikace
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 30 z 73
Graf
• Jednoduchý neorientovaný graf je dvojice G =
(V, E) , kde V je neprázdná množina vrcholů
(uzlů) a E je množina dvouprvkových množin
vrcholů, tzv. (neorientovaných) hran.
• Jednoduchý orientovaný graf je dvojice G = (V,
E) , kde V je neprázdná množina vrcholů (uzlů)
a E je množina uspořádaných dvojic vrcholů,
tzv. (orientovaných) hran.
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 32 z 73
Maticová reprezentace grafu
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 34 z 73
Clique - Klika
• Teorie grafů:
– Clique je taková podmnožina neorientovaného
grafu, ve které jsou každé dva uzly spojené
hranou.
• Sociální vědy: "clique" popisuje skupinu
přibližně 2 až 12 (průměr 5 - 6) osob které
spolu interagují mnohem častěji a intensivněji
než ostatní
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 36 z 73
Příklady typů klik
• Punkeři
• Gangsteři
• Mean girls
• Šprti (nerds)
• Skateři
• Outsideři
• Intelektuálové
• …
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 37 z 73
Některé další základní relevantní
grafové pojmy
• Cesta
• Souvislost grafu
• Cyklus
• Strom
• Most
• Bipartitní graf
• Orientovaný graf
• Planární graf, multigraf
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 38 z 73
Cesta v grafu
• Tah grafu je takový jeho sled, ve kterém se
neopakují žádné hrany
• Cestou v grafu je takový jeho tah, ve kterém se
neopakují žádné uzly
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 39 z 73
Uzavřená cesta
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 40 z 73
Šest stupňů odloučení
• Teorie
• Všichni lidé planety spojeni maximálně přes
šest dalších osob
• Stanley Milgram
– 1967
– Rozeslání dopisů
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 41 z 73
Souvislý graf
• Souvislý graf je takový (neorientovaný) graf, v
němž platí, že pro každé dva vrcholy x, y
existuje sled z x do y.
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 42 z 73
Cyklus
• Uzavřená cesta respektující orientaci hran
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 43 z 73
Strom
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 44 z 73
Ohodnocený orientovaný graf
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 45 z 73
Multigraf
• Obsahuje rovnoběžné hrany
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 46 z 73
Sociální graf senátu USA
• O'Reilly Media
• Senatoři jsou propojeni hranou jestliže volí
stejně v 65% případů během dvouletého
období
• http://www.slideshare.net/oreillymedia/us-
senate-social-graph-1991-
present?type=presentation
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 53 z 73
Vizualizace
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 55 z 73
Fragment sítě Facebook
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 56 z 73
Elektronické informační zdroje
• Informační zdroje, které jsou uchovávány v
elektronické podobě a jsou dostupné v prostředí
počítačových sítí nebo prostřednictvím jiných
technologií distribuce digitálních dat
• Vznikají primárně ve formě elektronické,
digitalizací nebo paralelně v tištěné a elektronické
formě
• Obecně se s termínem EIZ nepojí zdroje, které
jsou zdarma na internetu.
• Jedná se o profesionálně vytvářené informační
zdroje přístupné online na komerční bázi
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 57 z 73
Rozdělení EIZ (1)
• Z hlediska typů
– Online katalogy (elektronické katalogy knihoven)
– Databáze profesionálních informací
– Digitální knihovny, e-knihy, e-časopisy
– Oborové brány
• Z hlediska technického zpřístupnění
– Přístup k EIZ offline
– Přístup k EIZ online
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 58 z 73
Rozdělení EIZ (2)
• Z hlediska tématického a oborového dělení
– Univerzální - WoS, Scopus
– Multioborové - EBSCOhost, ProQuest
– Oborové - pro konkrétní obor
• Z hlediska podmínek zpřístupnění
– Volně dostupné x licencované
– Volně dostupné - volně dostupné na internetu
• Wikipedie, katalogy knihoven
– Licencované - plné texty článků z odborných
recenzovaných časopisů, přístup zajišťují většinou knihovny
– granty, celouniverzitní licence
• Licencované databáze
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 59 z 73
Typy databází
• Druhy databází dle obsahu:
– Bibliografické
– Fulltextové
– Faktografické
• Numerické
• Fakta
• Adresáře, katalogy a rejstříky
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 60 z 73
Financování EIZ
• Databáze je zakoupena z vlastních zdrojů
instituce
• Kombinace grant + spoluúčast instituce
• Databáze je plně hrazena z grantu
• Modely platby
– Platba za využití
• Pay-per-click, pay-as-you-go, pay-by-use
• Platí se za stažení dokumentu nebo využití zdroje
– Předplatné
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 61 z 73
EIZ na MUNI
• Portál EIZ
– https://ezdroje.muni.cz/
• Aktualizováno dle aktuálních potřeb
• Přímý přístup ze sítě MUNI
• Vzdálený přístup
– EZproxy
– OpenVPN
– Shibboleth
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 64 z 73
IEEE Xplore DL
• http://ieeexplore.ieee.org/
• Obsahuje přes 3,5 milionu zdrojů
– Knihy (přes 1000)
– Sborníky z konferencí (přes 1200)
– Časopisy (přes 160)
– Standardy (přes 3800)
• Zaměřeno především na oblast ICT
– „Institute of Electrical and Electronics Engineers“
• Publikace dostupné ve formátu PDF a HTML
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 65 z 73
Autentizace a personalizace
• Přihlášení předplatitele (MU)
– V rámci sítě MU bez nutnosti použít login a heslo
– Přes poskytovatele identit
• „Sign In Through Your Athens / Shibboleth Provider“
• Zvolit možnost „Masaryk University“
• Možnost vytvoření vlastního profilu
– Zdarma
– Libovolný mail
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 66 z 73
Možnosti vlastního profilu
• Nastavení osobních preferencí
– Formát stahování citací
– Omezení obsahu, ve kterém se vyhledává
– Počet výsledků na stránku
• Sledování historie dotazů
– Posledních 50 dotazů
– Je možné dotazy následně kombinovat
• Nastavení upozornění na dotazy/zdroje
– Zasílá se na email
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 67 z 73
Ukázka
• Vyhledání
• „Flying“ („frogs“)
• Následné filtrování dle kategorií
• Uložení vyhledávání a nastavení upozornění
• Informuje v případě změny výsledků na daný
dotaz
• Přehledné zobrazení základních informací o zdroji
• Tutoriály
• www.ieee.org/go/clientservices
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 68 z 73
ACM DL
• http://dl.acm.org/
• Producentem je Association for Computing Machinery
– 100 000 členů z celého světa
• Přes 50 vlastních časopisů
• 400 000 plnotextových článků
• 2 000 konferenčních sborníků
• Abstraktová část
– 2 000 000 dokumentů od 6 000 vydavatelů
– 200 000 knih
– 70 000 disertací
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 69 z 73
Autentizace a personalizace
• Přihlášení předplatitele (MU)
– V rámci sítě MU bez nutnosti použít login a heslo
– VPN
• Možnost vytvoření webového profilu
– Zdarma
– Libovolný mail
– Možnosti profilu
• Možnost komentářů
• Vytvoření kolekce citací
• Vytvoření komentáře k přečtenému článku
• Sdílení
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 70 z 73
Další informace a ukázka
• Aplikace pro mobilní telefony
– Android i iOS
• Vyhledání
– Rozšířené vyhledávání
– Možnost upřesnit volbu v případě nalezení mnoha
shod
• – Rozdělení informací o článku na kategorie
– „Cited by“
• Jen v rámci ACM DL
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 71 z 73
Domácí úkol do 13. 12. 2015
• Na zadané téma:
– Vyhledat 5 relevantních článků na IEEE DL
– Vyhledat 5 relevantních článků na ACM DL
• Témata vytvořím do pondělí 12:00
– Kdo je dnes na přednášce může zaslat přednostní volbu
tématu do pondělí 16:00 na email xplhak@gmail.com
– Kdo je dnes na přednášce může odevzdat jen 5 článků
• Registrace témat bude od pondělí od 17:00
• Články odevzdejte do odevzdávárny k danému tématu
– Do 13. 12. 23:59
Jaromír Plhák, 3.11.2015Seminář z asistivních technologií Snímek 72 z 73
Přesunutí příští přednášky
• Přesunuta do A318
• Stejný den, stejný čas
• Rozešlu ještě mailem v pondělí odpoledne
– Spolu se zadáním domácího úkolu
Děkuji za pozornost
Jaromír Plhák,
3.11.2015
Seminář z asistivních technologií