Internet Sémantický web RNDr. Jaromír Plhák, Ph.D. SIN01 - Sociální informatika Podzim 2017 1 Osnova • Internet • Historie • Služby Internetu • Sémantický web • Ontologie • Crowdsourcing 2 Historie (1) • Síť ARPANET (vývoj začal v roce 1969) • Považována za první počítačovou síť vůbec • Cíle: • Zjednodušení komunikace • Sdílení SW a HW • Sdílení dat a informací • 1973 - připojena Evropa • Norsko 3 4 Historie (2) • 1992 – připojeno Československo • ČVUT • 1995 – Amazon, e-Bay • 1996 – 55 milionů uživatelů, Seznam • 1998 – Google, PayPal • 2000 – 250 milionů uživatelů • 2003 – 600 milionů uživatelů • 2005 – 900 milionů uživatelů • 2006 – více než miliarda uživatelů Oblasti působnosti Internetu • 70. léta 20. století • Zejména vojenský sektor, zajištění obrany USA • 80. léta 20. století • Přechod z vojenského sektoru do akademického, zajištění komunikace v nekomerční sféře • 90. léta 20. století • Přechod ze sektoru akademického do komerčního a postupně do všech oblastí lidských činností • Prudký rozvoj ICT, požadavky na kvalitu služeb a zabezpečení přenášených informací Současnost Internetu • Veřejná síť typu WAN (Wide Area Network) • Nemá vlastníka • Infrastruktura je provozována na komerční bázi • ISP (Internet Service Provider) • Negativní jevy • Riziko omezení soukromí • Zázemí pro kriminální a nelegální aktivity pod rouškou zdánlivé anonymity • Prohlubování rozdílů mezi technologicky vyspělým a technologicky zaostalým světem Který světadíl má největší podíl uživatelů? 11 Kolik přibližně webových stránek v současnosti existuje? 12 13 14 Internet v ČR • První organizací, zajišťující správu na celém území republiky, bylo sdružení CESNET • Czech Education and Scientific NETwork • Česká akademická síť • CESNET 2 od roku 2001 Služby Internetu • Výměna dat a informací • Přenos souborů • Vzdálený přístup • WWW • Komunikace • Elektronická pošta • Diskusní systémy • IRC, ICQ, Jabber • IP telefonie • Videokonference WWW – World Wide Web • Systém serverů, které uchovávají hypertextové dokumenty a další zdroje a umožňují k nim přístup • Distribuovaný systém podporovaný protokolem HTTP (HyperText Transfer Protocol) • Hypertext = způsob organizace informační jednotky • Nelineární dokument, obsahující odkazy na další související informační jednotky • Komunikace na principu klient - server Internet vs. WWW (1) • Nejsou synonyma, přestože se tak používají • Internet – celosvětová síťová struktura počítačů uzpůsobených k vzájemnému přenosu dat a tudíž k výměně informací • WWW – podsystém Internetu, soustava dokumentů navzájem propojených odkazy a spolupracujících pomocí protokolu HTTP Internet vs. WWW (2) • Internet existuje nezávisle na WWW, ale WWW by bez Internetu existovat nemohlo • Vznik WWW v roce 1989 jako prostředek komunikace mezi odlehlými pracovišti • Tim Berners-Lee, CERN • WWW systém je tvořen webovými stránkami • Populární díky jednoduchosti jazyka • (X)HTML (5) Webový klient • V roce 1993 vznikl první grafický prohlížeč Mosaic • V současnosti pestrá nabídka webových prohlížečů • Nejpopulárnější webové prohlížeče • Mozilla Firefox • Chrome • Opera • Safari • Internet Explorer Webový server • Nejznámější webové servery • Apache • Pro operační systémy třídy Unix • Internet Information Services • Pro Windows • Lotus Domino • Komerční, pro platformy IBM • Nestcape Enterprise, Fast Track • Komerční • Netware • Komerční systém firmy Novell E-mail • Způsob odesílání, doručování a přijímání zpráv přes elektronické komunikační systémy • SMTP • Simple Mail Transfer Protocol • Tělo zprávy • Přílohy • Každá příloha je určena typem obsahu (Content-Type) • Příklady: text/plain, text/html, image/jpeg, image/png, application/msword Instant messaging • Zpráva je doručena ve velmi krátké době od odeslání • Status • Online / Offline / Cofee break / … • Internet Relay Chat • Skupinová komunikace v místnostech – kanálech • ICQ, Jabber • Viber, WhatsApp, Facebook Messenger, ... 25 IP telefonie • VoIP (Voice over Internet Protocol) • Přenos hlasového (telefonního) signálu prostřednictvím počítačové sítě • V současnosti i videopřenos • Příklady klientských aplikací • Skype • Microsoft NetMeeting • ... Videokonference • Nejpokročilejší forma dvoustranné nebo skupinové komunikace na Internetu • Založeny na přenosech audia a videa • Technicky náročný proces, vytvářející komplexní prostředí pro distribuovanou týmovou spolupráci • Méně náročná je jednosměrná relace, kdy vysílající uzel je pouze jeden a všichni účastníci multimediální data pouze přijímají • Využití zejména pro distanční výuku (E-learning) Unified communications 28 Vyhledávací služby na Internetu • Google – http://www.google.com • Bing - https://www.bing.com/ • Seznam – http://www.seznam.cz • Centrum – http://www.centrum.cz • Baidu - www.baidu.com/ • ... Podobnostní vyhledávání • Složité datové struktury, obrázky • Vyhledávání založené na podobnosti (metrice) • Metrické prostory • Škálovatelné algoritmy • Polynomiální složitost není postačující • Podpora grafických algoritmů a AI Sémantický web • Metody a techniky pro přiřazení významu (sémantiky) informacím na webu • Web rozšířený o metadata • Metadata = data o datech • Postaven na formátu Resource Description Framework (RDF) a Ontology Web Language (OWL) Cíle sémantického webu • Integrovat data z různých zdrojů • Umožnit výměnu dat mezi aplikacemi napříč celým webem • Umožnit kvalitnější strojové vyhledávání informací na webu • Umožnit popsat vztahy mezi daty a objekty v reálném světě • Přiřadit informacím na webu přesný význam Metadata v HTML • Pomocí tagů: • Cílem je umožnit kvalitnější vyhledávání, než obyčejný full-text search • Zneužíváno ve velké míře spammery • Neumožňuje definovat vztahy a hierarchie objektů • Dnes vyhledávače dávají přednost jiným metodám, než prohledávání tagů HTML 5 • Některé elementy v HTML5 •
,