Internet
Sémantický web
RNDr. Jaromír Plhák, Ph.D.
SIN01 - Sociální informatika
Podzim 2017
1
Osnova
• Internet
• Historie
• Služby Internetu
• Sémantický web
• Ontologie
• Crowdsourcing
2
Historie (1)
• Síť ARPANET (vývoj začal v roce 1969)
• Považována za první počítačovou síť vůbec
• Cíle:
• Zjednodušení komunikace
• Sdílení SW a HW
• Sdílení dat a informací
• 1973 - připojena Evropa
• Norsko
3
4
Historie (2)
• 1992 – připojeno Československo
• ČVUT
• 1995 – Amazon, e-Bay
• 1996 – 55 milionů uživatelů, Seznam
• 1998 – Google, PayPal
• 2000 – 250 milionů uživatelů
• 2003 – 600 milionů uživatelů
• 2005 – 900 milionů uživatelů
• 2006 – více než miliarda uživatelů
Oblasti působnosti Internetu
• 70. léta 20. století
• Zejména vojenský sektor, zajištění obrany USA
• 80. léta 20. století
• Přechod z vojenského sektoru do akademického, zajištění komunikace v
nekomerční sféře
• 90. léta 20. století
• Přechod ze sektoru akademického do komerčního a postupně do všech oblastí
lidských činností
• Prudký rozvoj ICT, požadavky na kvalitu služeb a zabezpečení
přenášených informací
Současnost Internetu
• Veřejná síť typu WAN (Wide Area Network)
• Nemá vlastníka
• Infrastruktura je provozována na komerční bázi
• ISP (Internet Service Provider)
• Negativní jevy
• Riziko omezení soukromí
• Zázemí pro kriminální a nelegální aktivity pod rouškou zdánlivé anonymity
• Prohlubování rozdílů mezi technologicky vyspělým a technologicky zaostalým
světem
Který světadíl má největší podíl
uživatelů?
11
Kolik přibližně webových stránek v současnosti existuje?
12
13
14
Internet v ČR
• První organizací, zajišťující správu na celém území republiky, bylo
sdružení CESNET
• Czech Education and Scientific NETwork
• Česká akademická síť
• CESNET 2 od roku 2001
Služby Internetu
• Výměna dat a informací
• Přenos souborů
• Vzdálený přístup
• WWW
• Komunikace
• Elektronická pošta
• Diskusní systémy
• IRC, ICQ, Jabber
• IP telefonie
• Videokonference
WWW – World Wide Web
• Systém serverů, které uchovávají hypertextové dokumenty a další
zdroje a umožňují k nim přístup
• Distribuovaný systém podporovaný protokolem HTTP (HyperText
Transfer Protocol)
• Hypertext = způsob organizace informační jednotky
• Nelineární dokument, obsahující odkazy na další související informační
jednotky
• Komunikace na principu klient - server
Internet vs. WWW (1)
• Nejsou synonyma, přestože se tak používají
• Internet – celosvětová síťová struktura počítačů uzpůsobených k
vzájemnému přenosu dat a tudíž k výměně informací
• WWW – podsystém Internetu, soustava dokumentů navzájem
propojených odkazy a spolupracujících pomocí protokolu HTTP
Internet vs. WWW (2)
• Internet existuje nezávisle na WWW, ale WWW by bez Internetu
existovat nemohlo
• Vznik WWW v roce 1989 jako prostředek komunikace mezi odlehlými
pracovišti
• Tim Berners-Lee, CERN
• WWW systém je tvořen webovými stránkami
• Populární díky jednoduchosti jazyka
• (X)HTML (5)
Webový klient
• V roce 1993 vznikl první grafický prohlížeč Mosaic
• V současnosti pestrá nabídka webových prohlížečů
• Nejpopulárnější webové prohlížeče
• Mozilla Firefox
• Chrome
• Opera
• Safari
• Internet Explorer
Webový server
• Nejznámější webové servery
• Apache
• Pro operační systémy třídy Unix
• Internet Information Services
• Pro Windows
• Lotus Domino
• Komerční, pro platformy IBM
• Nestcape Enterprise, Fast Track
• Komerční
• Netware
• Komerční systém firmy Novell
E-mail
• Způsob odesílání, doručování a přijímání
zpráv přes elektronické komunikační
systémy
• SMTP
• Simple Mail Transfer Protocol
• Tělo zprávy
• Přílohy
• Každá příloha je určena typem obsahu
(Content-Type)
• Příklady: text/plain, text/html, image/jpeg,
image/png, application/msword
Instant messaging
• Zpráva je doručena ve velmi krátké době od odeslání
• Status
• Online / Offline / Cofee break / …
• Internet Relay Chat
• Skupinová komunikace v místnostech – kanálech
• ICQ, Jabber
• Viber, WhatsApp, Facebook Messenger, ...
25
IP telefonie
• VoIP (Voice over Internet Protocol)
• Přenos hlasového (telefonního) signálu prostřednictvím počítačové
sítě
• V současnosti i videopřenos
• Příklady klientských aplikací
• Skype
• Microsoft NetMeeting
• ...
Videokonference
• Nejpokročilejší forma dvoustranné nebo
skupinové komunikace na Internetu
• Založeny na přenosech audia a videa
• Technicky náročný proces, vytvářející komplexní prostředí pro
distribuovanou týmovou spolupráci
• Méně náročná je jednosměrná relace, kdy vysílající uzel je pouze
jeden a všichni účastníci multimediální data pouze přijímají
• Využití zejména pro distanční výuku (E-learning)
Unified communications
28
Vyhledávací služby na Internetu
• Google – http://www.google.com
• Bing - https://www.bing.com/
• Seznam – http://www.seznam.cz
• Centrum – http://www.centrum.cz
• Baidu - www.baidu.com/
• ...
Podobnostní vyhledávání
• Složité datové struktury, obrázky
• Vyhledávání založené na podobnosti (metrice)
• Metrické prostory
• Škálovatelné algoritmy
• Polynomiální složitost není postačující
• Podpora grafických algoritmů a AI
Sémantický web
• Metody a techniky pro přiřazení významu (sémantiky) informacím na
webu
• Web rozšířený o metadata
• Metadata = data o datech
• Postaven na formátu Resource Description Framework (RDF) a
Ontology Web Language (OWL)
Cíle sémantického webu
• Integrovat data z různých zdrojů
• Umožnit výměnu dat mezi aplikacemi napříč celým webem
• Umožnit kvalitnější strojové vyhledávání informací na webu
• Umožnit popsat vztahy mezi daty a objekty v reálném světě
• Přiřadit informacím na webu přesný význam
Metadata v HTML
• Pomocí tagů:
• Cílem je umožnit kvalitnější vyhledávání, než obyčejný full-text search
• Zneužíváno ve velké míře spammery
• Neumožňuje definovat vztahy a hierarchie objektů
• Dnes vyhledávače dávají přednost jiným metodám, než prohledávání
tagů
HTML 5
• Některé elementy v HTML5
• ,