Masarykova univerzita v Brně Filozofická fakulta Ústav české literatury a knihovnictví Kabinet informačních studií a knihovnictví PRINCIP ARCHITEKTURY INTERNETU Seminární práce k předmětu Učící se společnost a role knihovníka v ní Autor: Mlynářová Eva UČO: 216431 Typ studia: prezenční Ročník: 3. Počet znaků: 20031 Brno 2009 Úvod Tuto práci jsem se rozhodla napsat vzhledem k jejímu technickému zaměření. Již při studiu na střední škole jsem se s tématy vývoje a stavby Internetu setkala. Práce se pro mne tedy stává prostředkem, pomocí kterého si hodlám své současné znalosti obohatit o nové informace z aktuálního dění kolem fenoménu, kterým Internet bezpochyby je. Samotný obsah práce je zaměřen jak na samotný historický zárodek Internetu, určení většiny důležitých milníků, které vznik Internetu vůbec umožnily a také obsahuje popis principu jeho fungování. Pokusím se o nástin v rovině technické, avšak v takové míře, aby byl tento text dobře srozumitelný i jedincům, kteří neznají technická fakta. Závěrem pak obsahuje úvahu a nástin budoucnosti. To, jak se bude vyvíjet Internet dále a jaké změny případně nastanou pro nás, uživatele, ale i pro samotný Internet. 1 Vlastní text Historický vývoj Samotný historický vývoj Internetu započal již před mnoha lety. Dodnes se vedou dohady o tom, co lze za počátek Internetu stanovit. Je možné ale říci, že Internet vznikl při snaze propojit síť Ministerstva obrany USA a ostatní radiové či satelitní sítě. Za pomyslný první milník pro základ počítačových sítí vůbec lze považovat položení prvního trans-atlantického kabelu. První mezikontinentální kabelový spoj byl mezi Kanadou a Irskem zprovozněn na pouhých 26 dní v roce 1858 měděným vedením. Dosažená rychlost byla 25 slov za hodinu. Spoj byl obnoven v roce 1866, kdy byla rychlost již 8 slov za minutu. Spojení bylo komerční a jeho cena se pohybovala kolem 100 USD za 20 slov.1 V roce 1969 byla spuštěna experimentální síť zvaná ARPANET. Jednalo se o projekt severoamerické agentury ministerstva obrany. Tato síť však měla všechny uzle rovnocenné. Neexistoval žádný centrální blok a to z důvodu, aby při případném zničení některých z částí, byla síť schopná nadále fungovat. Během podzimu 1969 se součástí sítě ARPANET staly počítače amerických univerzit. Dále se ARPANET šířila i do Evropy, zde byly v roce 1973 připojeny první neamerické instituce, a to britská University College of London a norská Royal Radar Establishment.2 Později se z experimentu stala operační síť a spousta institucí ji začala využívat ke každodenní datové komunikaci. Vedle sítě ARPANET začaly vznikat další. Za zmínění jistě stojí CSNET nebo-li Computer Science Network3 , která byla založena v roce 1981. Jednalo se o celonárodní americkou síť, která propojovala jinak stovky kilometrů vzdálené univerzity a sloužila tedy především k vědeckým účelům. Rovněž se CSNET stává předchůdcem nově vytvářené sítě NSFNET, kterou se snaží vytvořit nezávislá vládní organizace NSF (Národní vědecká nadace). NSFNET vzniká v roce 1985 a stává se hlavní součástí páteřní sítě Internetu i když na dnešní běžné poměry pouze s přenosovou rychlostí 56kb/s. V době svého vzniku spojuje pět počítačových center umístěných na univerzitách v 1 http://cs.wikipedia.org/wiki/Podmo%C5%99sk%C3%BD_kabel 2 http://www.seniorclub.cz/internet.htm 3 http://en.wikipedia.org/wiki/CSNET 2 Americe, které obsahují výkonné počítače. Tímto úkonem NSF zpřístupnila síť každému, neboť k dřívějším sítím byl omezený přístup. Předchozí sítě mohlo využívat jen několik vědců z velkých společností a zároveň byly využívány pouze pro výzkum zbraní. Mezitím se v roce 1983 od sítě ARPANET oddělila síť MILNET (Military network), která byla omezena pro vojenskou sféru. Začíná se rozšiřovat pojem Internet. Nejdůležitějším milníkem však v roce 1983 zůstává přijetí protokolu TCP/IP, který je dodnes celosvětovým standardem. Tento modernější a flexibilnější protokol nahradil do té doby používaný NCP v síti ARPANET, který se stal zastaralým a jeho další používání nebylo doporučováno. V dobách ARAPNETu vznikla potřeba lidí, zpracovat převod číselných adres na textové názvy, které by byly pro člověka příjemnější a hlavně pro lépe zapamatovatelné. Původně byl na všechny počítače distribuován jediný soubor, který zmíněný překlad zajišťoval. I přes nevyhovující koncepci je tento soubor využíván i v dnešní době. Uživatel pomoci jeho modifikace může blokovat reklamy nebo si uložit vlastní ,,přezdívky" pro často navštěvované servery.4 V roce 1983 byl vyvinut protokol DNS (Domain Name System). DNS je hierarchický systém doménových jmen, který je realizován servery DNS a protokolem stejného jména, kterým si vyměňují informace. Jeho hlavním úkolem a příčinou vzniku jsou vzájemné převody doménových jmen a IP adres uzlů sítě.5 Samotný protokol DNS byl definován a později i upravován v mnoha RFC (Request For Comments) souborech, které jsou používány k označení standardů a dalších dokumentů popisujících internetové protokoly. Oficiálně jsou RFC považovány za doporučení, ale i přes tento fakt se podle RFC řídí většina Internetu.6 Rok 1983 je na historii vývoje Internetu velmi bohatý. Neboť v Evropě se již pracuje na založení a hlavně zprovoznění evropské akademické a vědecké sítě (EARN). Tato síť byla oficiálně založena v červenci roku 1984 se sídlem ve francouzské Paříži. Avšak z právního hlediska byla uznána až v únoru 1985.7 Další přírůstky jsou rovněž sítě EUNET (European UNIX Network), japonská síť JUNET a britská síť JANET (Joint Academic Network).8 S takovýmto nástupem lokálně 4 http://cs.wikipedia.org/wiki/Domain_Name_System 5 http://cs.wikipedia.org/wiki/Domain_Name_System 6 http://cs.wikipedia.org/wiki/RFC 7 http://en.wikipedia.org/wiki/European_Academic_Research_Network 8 http://www.seniorclub.cz/internet.htm 3 vytvářených sítí se ARPANET stával pouze sítí pro přenos. I o tuto funkci byl ale později připraven právě sítí NSFNET. Dalo by se tedy říci, že v březnu roku 1990 přišel samotný konec sítě ARPANET. Roku 1991 dosáhla NSFNET přenosové rychlosti 44,7 Mb/s a vědci z Minnesotské univerzity poprvé předvedli systém Gopher, který byl posledním schůdkem pro přechod k systému WWW.9 Samotné pojmenování Gopher bylo z počátku považováno za novotvar. Lidé se domnívali, že byl tento výraz vytvořen ze slovního spojení ,,to go for information". Toto spojení v překladu znamená: jít si pro informace. Zároveň toto spojení odpovídá základnímu principu fungování samotného Gopher systému. Neboť uživatelům je umožněno, aby si vyžádali informace z vlastní iniciativy.10 Gopher byl ve svém základu skromný a jednoduchý, byl velmi nenáročný na přenosovou kapacitu. Tyto fakty mohly dobře vyhovovat uživatelům internetu, kteří nechtěli být neustále omezování pomalým připojením a nemuseli si stahovat extra velké objemy dat. Nakonec to byla právě vlastnost neflexibilní struktury, která přispěla ke stagnaci a k tomu, že se Gopher stal nepoužívaným. Nebyl dostatečně intuitivní a ,,sexy" pro uživatele, což byl velký nedostatek v právě rozvíjejícím se období komercializace.11 Dalo by se říci, že protokol Gopher byl starší bratr dnes již dobře známého protokolu HTTP. Avšak samotný zánik Gopheru ještě nenastal, stále existuje přibližně 125 serverů, které jsou indexovány pomocí speciálního vyhledávače Veronica, který je určený přímo pro prostředí Gopheru. Dokonce i téměř všechny současné webové prohlížeče podporují rozhraní protokolu Gopher.12 Výše jsem zmínila protokol HTTP. Vytvoření tohoto protokolu umožnilo vznik Internetu v podobě, ve které jej dnes známe. Autorem tohoto protokolu je Tim Berners-Lee. Vynálezce webu v roce 1989 uchopil 45 let starý hypertext, velkou síť s 16 let starým protokolem, přidal vlastní napodobeninu SGML -- vše smíchal dohromady a World Wide Web byl na světě. O rok později napsal první webový server a prohlížeč. Fyzik Tim Berners-Lee byl pouze ve správný 9 http://www.seniorclub.cz/internet.htm 10 http://www.earchiv.cz/b05/b0703001.php3 11 http://www.earchiv.cz/b05/b0703001.php3 12 http://en.wikipedia.org/wiki/Gopher_(protocol) 4 čas na správném místě. 13 Současný stav V následujících odstavcích se pokusím popsat současný stav v jakém se Internet nachází a jaký je význam Internetu pro dnešní globální společnosti. Rovněž se pokusím o vysvětlení samotného principu jeho fungování. Neopomenu rovněž zmínit instituce, které se dále zabývají vývojem a správným směrováním Internetu. V dnešní době je Internet důležitým médiem, které každý den používáme k práci, komunikaci, zábavě či k získávání informací. Internet zdárně plní původní cíl ARPANETu. A to posílání informací a vzájemná komunikace bez ohledu na reálnou vzdálenost komunikujících subjektů. Existuje velké kvantum možností jak komunikovat, elektronickou poštou počínaje a IM konče. S rozvojem komunikace přišel i rozvoj multimédií. V dnešní době rychlejších připojení není problém poslouchat rádiové vysílání přes webové rozhraní místo obvyklého FM přijímače. Od roku 1992 se rozvíjí i komerční sféra Internetu. Mnoho z nás má dnes na Internetu svou osobní nebo dokonce firemní prezentaci. Díky tomuto posunu se stává i přístup k informacím o jednotlivých firmách pro potencionálního zákazníka jednodušší. Existence internetových obchodů již taky není novinkou a málokdo ještě nevyužil možnosti si produkt zakoupit touto pohodlnou cestou. O aktuálním využívání Internetu a možnostech, které nabízí, by se dalo sepsat ještě mnoho řádků. Nyní se však chci zaměřit na samotné fungování Internetu. Ačkoliv na počátku se vyvinul ze sítě, která byla financována národní vědeckou nadací, dá se dnes říci, že Internet je svobodné médium. Nenajdeme totiž ani jednoho majoritního vlastníka (ať už společnost, nebo jednotlivce), který by měl moc Internet ovládat. Jedním z významných hráčů dnešního Internetu je organizace IANA, která zastupuje velmi důležitou funkci, kterou je management zdrojů pro Internet. Když píši o zdrojích, mám na mysli nejdůležitější a nejcennější ,,surovinu" Internetu ­ IP adresy. Tyto IP adresy si můžeme představit jako telefonní čísla. Každý počítač má tu svou, unikátní. Přesně z tohoto důvodu je možné jedinečně adresovat (záměrně opomíjím komplikovanější situaci, kterou způsobuje tzv. NAT ­ network address translation) libovolný počítač v celém Internetu a zaslat mu libovolná data. 13 http://www.webylon.info/K.01 5 Protože není reálné, aby jedna organizace měla přehled o veškerých IP adresách na světě, rozděluje je po obrovských blocích organizacím menším, které se starají o jednotlivé poskytovatele připojení na vyhraněném území ­ takzvaní RIR14 (Regional Internet Registry). Evropu, střední východ a část střední Asie spravuje organizace RIPE NCC15 se sídlem v holandském Amsterdamu. Lokální registry pak dále rozdělují IP adresy jednotlivým poskytovatelům internetového připojení (ISP), kteří je dělí mezi své zákazníky. Druhým velmi cenným identifikátorem v Síti je číslo autonomního systému (tzv. AS). Jeden autonomní systém je možné si představit jako jednoho poskytovatele připojení k Internetu (ISP) , i když v realitě jsou čísla AS sdílena více ISP. Internet není ve své podstatě nic jiného než jedna obrovská počítačová síť složená ze sítí jednotlivých ISP. Propojení sítí ISP se děje v takzvaných ,,peeringových centrech" (v ČR je centrum NIX.CZ umístěno v Praze ve čtyřech oddělených budovách. Zde mohou členové sdružení NIX.CZ propojovat vzájemně své sítě a vyměňovat si mezi sebou data.16 Již dříve bylo zmíněno, že Internet je koncipován tak, aby přežil za jakýchkoliv podmínek. Chová se jako živý organizmus. Toto chování má na svědomí dynamický routing. Každý ISP, který má přiděleno číslo AS a chce si v peeringovém centru vyměňovat data (slangově peerovat) vlastní server podporující protokol BGP417 (případně BGP4+), za pomoci kterého ostatním ISP, se kterými je spojen oznamuje skupiny IP adres (agregované prefixy), které obsahuje jeho síť, kterou identifikuje právě zmíněným číslem AS. Pak ostatní operátoři ví, kam provoz pro kterou konkrétní IP adresu posílat. Pokud je ISP spojen s více než jedním jiným ISP, může se chovat jako tranzitní operátor, tedy dále hlásit rozsahy IP adres, které se ,,naučil" od ostatních sítí. Výsledkem je to, že všichni operátoři světa ví, kam směrovat a ,,přeposílat" provoz na kteroukoliv IP adresu. Celý tento mechanismus má ještě jeden efekt. ISP se může od svých sousedů ,,naučit" IP adresu i víckrát. Data potom odesílá tak, aby musely urazit co možná nejkratší cestu. Toto chování má obrovskou výhodu. V případě výpadku některého ISP je provoz, který by měl přes něj projít směrován náhradní cestou. Odtud tedy plyne ona nezničitelnost Internetu. I v případě sabotáže, přetržení podmořských kabelů nebo administrativních omezení je omezeno relativně malé území, 14 http://en.wikipedia.org/wiki/Regional_Internet_Registry 15 http://en.wikipedia.org/wiki/RIPE_NCC 16 http://www.earchiv.cz/a92/a241c110.php3 17 http://en.wikipedia.org/wiki/BGP 6 ale zbytek Internetu funguje. Jedním z nejpalčivějších problémů dneška pro Internet je právě vyčerpání jeho zdrojů v podobě IP adres. IP adresa je číslo složené ze čtyřech bytů, které se z důvodu čitelnosti zapisují jako čtyři čísla v desítkové soustavě v oddělená tečkami (například 192.168.0.1). Jak bylo napsáno výše, jedná se o 4 byte, tedy čísla nabývající hodnoty 0 ­ 255. Jednoduchou matematikou lze spočítat, že Internet ve stávajícím stavu nemůže adresovat více než 2564 = 4294967296 počítačů. Pro úplnost prozradím, že některé adresy mají speciální význam a nelze je pro adresaci použít (např. 127.0.0.1.; 192.168.0.1.) ­ tedy počet je ještě o něco nižší. Ano, zdá se to jako relativně velké číslo. V době návrhu protokolu TCP/IP to možná i velké číslo bylo. Dnes je již ale jisté, že počet adres bude vyčerpán zhruba v roce 2010.18 Pro tento problém již řešení existuje. Stávající IP adresy (IPv4) budou nahrazeny novějšími ­ IPv6. Tyto adresy jsou podstatně delší ­ je pomocí nich možné adresovat až 2128 počítačů. Nové adresy se již kvůli své délce zapisují v šestnáctkové soustavě, vždy po skupinách dvou byte oddělených dvojtečkami (například 2001:2f0:0:8800:206:5bff:fe8d:940). Jak již pohled na IP adresu napovídá, v budoucnosti bude DNS ještě důležitější než je tomu dnes. Druhým problémem, o kterém se zase tolik nemluví, ale na druhou stranu je nám ještě blíž než problém první je vyčerpání čísel AS. V době návrhu protokolu BGP bylo určeno, že jako identifikace autonomního systému postačí dva byte, tedy na světě bude existovat maximálně 65536 poskytovatelů internetu. Realita nám ale ukazuje, že již dnes identifikátor nepostačuje a je pomalu nahrazován čtyř-bytovým identifikátorem. Oba problémy sice mají řešení, ale prosazování do praxe silně pokulhává. Naráží se na nevoli uživatelů zvykat si na nové věci, cenu zařízení u ISP a v neposlední řadě na podporu u výrobců hardware i software. Doufám v to, že si všichni zmínění problém neuvědomí příliš pozdě. Vedle IP adres a čísel AS je tu ještě jeden důležitý stavební kámen Sítě sítí, o kterém zde již byla řeč ­ systém DNS. Tento systém je uživatelům asi nejblíže ze zatím zmiňovaných prvků. Jedná se o systém podobný slovníku. Umožňuje obousměrný překlad jmenného názvu na IP adresu a zpět. Systém má stromovou strukturu a je opět navržen tak, aby obstál kdykoliv a za 18 http://www.cisco.com/web/about/ac123/ac147/archived_issues/ipj_6-4/ipv4.html 7 jakýchkoliv podmínek. Vezměme si například adresu kisk.phil.muni.cz. Pokud počítač chce s touto adresou komunikovat, musí si ji nejprve za pomoci tohoto slovníku přeložit na IP adresu. Na světě existuje 13 ,,hlavních", tzv. ,,root serverů", kterých se lze zeptat. Ani jeden z nich nám na dotaz nedá odpověď. Prozradí nám ale, kde se ptát dál. V našem příkladu nám řeknou, že na doménu ,,.cz" se máme ptát u serverů společnosti CZ.NIC. Zde se tedy zeptáme znovu a ani nyní nedostaneme odpověď, ale jsme odkázáni na servery Masarykovy university s tím, že na věci domény ,,.muni.cz" se máme ptát jich. Náš poslední dotaz zašleme tedy jednomu z těchto serverů a zde se již dočkáme odpovědi, že jméno ,,kisk.phil.muni.cz" odpovídá IP adrese 147.251.100.54. Celý tento proces probíhá na pozadí, bez vědomí uživatele, je dokončen v řádech milisekund. Můžeme doufat, že v budoucnosti nám servery Masarykovy university odpoví nejen adresou ve formátu IPv4, ale i adresou ve formátu IPv6. Závěr Jaká je budoucnost Internetu? Divoká. Internet kdysi vykročil směrem spojování počítačů, dnes připojujeme notebooky a mobilní telefony a zítra? Ač se to může zdát směšné, jsou zde vize, které předpovídají domy připojené k Internetu, ledničky a kávovary s vlastní IP adresou. Nejspíše se tedy dočkáme toho, že z práce si před odjezdem domů zapneme vzdáleně doma topení a necháme si uvařit kávu nebo napustit vanu. Můžeme se dočkat i toho, že naše lednička zjistí, že nám došlo máslo a sama jej po internetu objedná a zaplatí z našeho účtu. Možnosti jsou obrovské. Bohužel nové možnosti s sebou nesou i nové hrozby. Je dost pravděpodobné, že se v budoucnu nebudeme setkávat pouze s krádeží dat pomocí Internetu, ale i vytopených domů a odmražených ledniček. Jistí si ale můžeme být hlavně tím, že ani po tak raketovém začátku Internet ještě neřekl své poslední slovo. 8 Použitá literatura: * KROL, Ed. Vše o Internetu : průvodce uživatele a katalog zdrojů. 1. vyd. Veletiny : Science, 1995. 490 s. ISBN 8090147542. * PETERKA, J. Kapitoly z historie Internetu. Softwarové noviny 1998, roč. 9, č.4, s.38-43. [cit. 2009-04-27]. Dostupné z URL: . * Podmořský kabel - Wikipedie, otevřená encyklopedie [online]. [cit. 2009-04-27]. Dostupné z URL: . * ARPANET - Wikipedie, otevřená encyklopedie [online]. [cit. 2009-04-28]. Dostupné z URL: . * DERFLER, Frank J, jr. - FREED, Les. Jak pracují sítě. ilustroval Michael Troller. 1. vyd. Brno : UNIS, 1994. 217 s. ISBN 1562761293. * CHMELAŘOVÁ, M. Počítačové sítě a síť Internet : studijní text. Opava, 2006. 49 s. * Historie internetu [online]. [cit. 2009-04-28]. Dostupné z URL: . * Domain Name System - Wikipedie, otevřená encyklopedie [online]. [cit. 2009-04-28]. Dostupné z URL: . * RFC - Wikipedie, otevřená encyklopedie [online]. [cit. 2009-04-28]. Dostupné z URL: . * CSNET - Wikipedia, the free encyclopedia [online]. [cit. 2009-04-28]. Dostupné z URL: . * European Academic Research Network - Wikipedia, the free encyclopedia [online]. [cit. 2009- 04-28]. Dostupné z URL: . * Jiří Peterka: Historie českého Internetu: Gopher [online]. [cit. 2009-04-28]. Dostupné z URL: . * Gopher (protocol) - Wikipedia, the free encyclopedia [online]. [cit. 2009-04-28]. Dostupné z URL: . * CHAMURAPPI. A řekl Tim: Budiž web... . [online]. c2004-2008 [cit. 2009-04-28]. Dostupné z URL: . * Regional Internet registry - Wikipedia, the free encyclopedia [online]. [cit. 2009-04-28]. Dostupné z URL: . * RIPE NCC - Wikipedia, the free encyclopedia [online]. [cit. 2009-04-08]. Dostupné z URL: . ˇ Jiří Peterka: Směrování v TCP/IP sítích - IV. [online]. [cit. 2009-04-08]. Dostupné z URL: . * Border Gateway Protocol - Wikipedia, the free encyclopedia [online]. [cit. 2009-04-28]. Dostupné z URL: . * HUSTON, G. IPv4: How long do we have?.The Internet Protocol Journal [online]. Dec. 2003, vol. 6, iss. 4. [cit. 2009-04-29]. Dostupné z URL: .