Analýza sítě publikačních vazeb studentů a zaměstnanců Fakulty informatiky Masarykovy univerzity Mgr. Petr Štěpánek IV124 Komplexní sítě Mgr. Petr Štěpánek 325065 2 Obsah Základní popis sítě......................................................................................................................................... 3 Analýza malých komponent souvislosti ........................................................................................................ 4 Analýza obří komponenty souvislosti............................................................................................................ 5 Modularita................................................................................................................................................. 5 Centrality................................................................................................................................................... 6 Rich-clubs .................................................................................................................................................. 9 Bezškálovost sítě ..................................................................................................................................... 20 Seznam obrázků .......................................................................................................................................... 21 IV124 Komplexní sítě Mgr. Petr Štěpánek 325065 3 Základní popis sítě Data pro projekt byla získána pomocí nástroje Prezentátor v Informačním systému Masarykovy univerzity. Síť se skládá z 679 uzlů, které představují autory publikací z FI MU (v časovém období 1994-duben 2015) a některé další spoluautory z MU, kteří mají, nebo měli přiřazeny identifikátory UČO. Data tedy nezahrnují spoluautory článků z jiných univerzit. Vazby pak představují spolupráci autorů na společném článku. Síla vazby představuje četnost spoluautorství konkrétních osob. Parametry sítě:  Počet uzlů 679  Počet hran 1275  Průměrný stupeň uzlu 3,756  Diametr sítě 16  Modularita 0,845  Počet komponent spojitosti 23  Průměrný klastrovací koeficient 0,553  Průměrná délka cesty 5,334 Síť obsahuje jednu obří komponentu souvislosti a 22 malých, složených z 1 až 4 uzlů. Obrázek 1: Komponenty souvislosti IV124 Komplexní sítě Mgr. Petr Štěpánek 325065 4 Analýza malých komponent souvislosti Nejprve se zaměříme na malé komponenty. Většinou je tvoří autoři, kteří publikovali sami, nebo s kolegy z MU pouze několikrát (do 12 publikací). Dále se zde vyskytují dva autoři, kteří ve zkoumaném období publikovali 24 a 27 vědeckých prací. Nejvýraznějšími autory zde jsou však prof. PhDr. Ing. Miloslav Dokulil, DrSc. se 114 publikacemi, z toho 111 jako jediný autor a Fotios Liarokapis, PhD se 77 vědeckými publikacemi, u všech jako jediný autor. Obrázek 2: Zobrazení 21 malých komponent. Barva, velikost a popisky uzlů reprezentují jejich selfDegree, zelené popisky hran představují jejich váhy. IV124 Komplexní sítě Mgr. Petr Štěpánek 325065 5 Analýza obří komponenty souvislosti Obří komponenta tvoří 94% celé sítě. Proto se jí budeme zabývat podrobněji. Parametry komponenty:  Počet uzlů 646  Počet hran 1263  Průměrný stupeň uzlu 3,91  Diametr sítě 16  Hustota sítě 0,006  Modularita 0,829 (parametr rozlišení 2,0)  Průměrný klastrovací koeficient 0,552  Průměrná délka cesty 5,335 Modularita Modularitu sítě jsme určili pomocí nástroje Gephi s parametrem rozlišení 2,0. Výsledek je zaznamenaný na obrázku 3. Můžeme zde rozeznat 11 modulů, které lze identifikovat jako jednotlivé vědecké skupiny, a uzly s vysokým stupněm jako sdružující osoby těchto skupin. Obrázek 3: Rozložení klastrů sítě. prof. RNDr. Michal Kozubek, Ph.D.doc. Ing. Jiří Sochor, CSc. doc. RNDr. Tomáš Pitner, prof. RNDr. Václav Matyáš, M.Sc., doc. RNDr. Petr Sojka, Ph.D. RNDr. David Antoš, Ph.D. doc. RNDr. Petr Holub, Ph.D. prof. RNDr. Luděk Matyska, CSc. prof. Ing. Pavel Zezula, CSc. doc. RNDr. Vlastislav Dohnal, Ph.D. prof. RNDr. Ivana Černá, prof. RNDr. Luboš Brim, CSc. doc. RNDr. Lubomír Popelínský, Ph.D. doc. Ing. Michal Brandejs, CSc. doc. Ing. Václav Přenosil, CSc. IV124 Komplexní sítě Mgr. Petr Štěpánek 325065 6 Centrality Obrázek 4: Velikost uzlu – stupeň uzlu, barva uzlu – betweeness Kombinace parametru stupně uzlu, modularizace a betweeness centrality přináší zajímavou informaci o důležitosti, či praktickém zaměření autorů. Pokud analyzujeme betweeness centralitu v kontextu modularity sítě, získáme takto autory významné z pohledu propojení klastrů (zaměření vědních oborů). To znamená autory, kteří nabyté znalosti vlastního zaměření aplikují na problémy jiného oboru. Když do analýzy přidáme ještě parametr stupně uzlu, zjistíme, že se nám vysoký stupeň uzlu a vysoká betweeness centralita ve většině případů překrývá. Jednotlivé klastry tak mají jednoho autora s nejvyšším stupněm uzlu a nejvyšší betweeness centralitou. Tito lidé jsou bezesporu největšími kapacitami svých oborů v rámci FI MU. Např. prof. RNDr. Michal Kozubek, Ph.D., doc. Ing. Jiří Sochor, CSc., doc. RNDr. Petr Sojka, Ph.D., doc. RNDr. Tomáš Pitner, Ph.D., prof. RNDr. Václav Matyáš, M.Sc., Ph.D. V rozsáhlejších klastrech však nemusíme najít jednoho člověka, který by splňoval podmínku nejvyššího stupně uzlu i nejvyšší betweenss centrality najednou. V takové situaci lze dle mého názoru považovat autora s vyšší betweeness za člověka, který se zaměřuje více na aplikovaný výzkum, než autor s vyšším počtem spoluautorů, ale nižší betweeness. prof. RNDr. Michal Kozubek, Ph.D. doc. Ing. Jiří Sochor, CSc. doc. RNDr. Tomáš Pitner, Ph.D. prof. RNDr. Václav Matyáš, M.Sc., Ph.D. doc. RNDr. Petr Sojka, Ph.D. RNDr. David Antoš, Ph.D. doc. RNDr. Petr Holub, Ph.D. prof. RNDr. Luděk Matyska, CSc. prof. Ing. Pavel Zezula, CSc. doc. RNDr. Vlastislav Dohnal, Ph.D. prof. RNDr. Ivana Černá, CSc. prof. RNDr. Luboš Brim, CSc. doc. RNDr. Lubomír Popelínský, Ph.D. doc. Ing. Michal Brandejs, CSc. doc. Ing. Václav Přenosil, CSc. IV124 Komplexní sítě Mgr. Petr Štěpánek 325065 7 Obrázek 5: Velikost uzlu – stupeň uzlu, barva uzlu – closeness Na obrázku 5 si můžeme všimnout zajímavého jevu. V pravé části sítě se nachází oddělený klastr, který obsahuje jeden významný hub. Tím hubem je prof. Ing. Václav Přenosil, CSc. Profesor Přenosil má vysoký stupeň uzlu, ale nižší closeness centralitu. To reflektuje i jeho pozici v síti. Je uprostřed svého klastru, ale je značně vzdálen od zbytku sítě. Uzly s nejmenší closeness centralitou jsou RNDr. JUDr. Vladimír Šmíd, CSc., se svými spoluautory z ÚVT (obrázek 5, nahoře uprostřed). prof. RNDr. Michal Kozubek, Ph.D. doc. Ing. Jiří Sochor, CSc. doc. RNDr. Tomáš Pitner, Ph.D. prof. RNDr. Václav Matyáš, M.Sc., Ph.D. doc. RNDr. Petr Sojka, Ph.D. RNDr. David Antoš, Ph.D. doc. RNDr. Petr Holub, Ph.D. prof. RNDr. Luděk Matyska, CSc. prof. Ing. Pavel Zezula, CSc. doc. RNDr. Vlastislav Dohnal, Ph.D. prof. RNDr. Ivana Černá, CSc. prof. RNDr. Luboš Brim, CSc. doc. RNDr. Lubomír Popelínský, Ph.D. doc. Ing. Michal Brandejs, CSc. doc. Ing. Václav Přenosil, CSc. IV124 Komplexní sítě Mgr. Petr Štěpánek 325065 8 Obrázek 6: Velikost uzlu – betweeness Uzly s vysokou betweeness propojují autory z více klastrů. Nejvýznamnější autoři spolupracující s autory z více různých vědeckých oblastí jsou RNDr. David Antoš, Ph.D. a doc. RNDr. Petr Sojka, Ph.D. Při porovnání ohodnocení centralit uzlů pomocí PageRank a EigenVector lze pozorovat, že algoritmus PageRank více oceňuje uzly s vysokým stupněm uzlu a s velkým rozdílem stupňů uzlů v jeho okolí, zatímco algoritmus pro EigenVector přiřazuje vyšší centralitu uzlům s vysokým stupněm a zároveň s hodně sousedy, kteří mají také vysoký stupeň uzlu, viz obrázek 7 a 8. Nejlépe hodnocenými uzly algoritmem PageRank se tak stali doc. RNDr. Tomáš Pitner, Ph.D., doc. RNDr. Lubomír Popelínský, Ph.D., doc. Ing. Jiří Sochor, CSc. Tito autoři mají velký počet spoluautorů, kteří jsou spoluautory jen zřídka. Buď jsou jedinými autory publikací, nebo publikují velice málo. Opakem jsou autoři s vysokým hodnocením algoritmem EigenVector. Jsou to především RNDr. David Antoš, Ph.D., prof. RNDr. Luděk Matyska, CSc., doc. RNDr. Petr Holub, Ph.D., prof. RNDr. Ivana Černá, CSc., prof. RNDr. Luboš Brim, CSc. Jmenovaní autoři mají mezi spoluautory velký počet akademiků s vysokým stupněm uzlu. prof. RNDr. Michal Kozubek, Ph.D. doc. Ing. Jiří Sochor, CSc. doc. RNDr. Tomáš Pitner, Ph.D. prof. RNDr. Václav Matyáš, M.Sc., Ph.D. doc. RNDr. Petr Sojka, Ph.D. RNDr. David Antoš, Ph.D. doc. RNDr. Petr Holub, Ph.D. prof. RNDr. Luděk Matyska, CSc. prof. Ing. Pavel Zezula, CSc. doc. RNDr. Vlastislav Dohnal, Ph.D. prof. RNDr. Ivana Černá, CSc. prof. RNDr. Luboš Brim, CSc. doc. RNDr. Lubomír Popelínský, Ph.D. doc. Ing. Michal Brandejs, CSc. doc. Ing. Václav Přenosil, CSc. IV124 Komplexní sítě Mgr. Petr Štěpánek 325065 9 Obrázek 7: Velikost uzlu – stupeň uzlu, barva uzlu – PageRank Obrázek 8: Velikost uzlu – stupeň uzlu, barva uzlu – EigenVector Rich-clubs V této podkapitole jsou zobrazeny rich-clubs jednotlivých klastrů. Rich-clubs byly vytvořeny pomocí filtru K-core v programu Gephi. K=4 Obrázek 9: Klastr a jeho Rich-club IV124 Komplexní sítě Mgr. Petr Štěpánek 325065 10 Obrázek 10: Klastr a jeho Rich-club K = 3 IV124 Komplexní sítě Mgr. Petr Štěpánek 325065 11 Obrázek 11: Klastr a jeho Rich-club K=4 IV124 Komplexní sítě Mgr. Petr Štěpánek 325065 12 Obrázek 12: Klastr a jeho Rich-club K = 3 IV124 Komplexní sítě Mgr. Petr Štěpánek 325065 13 Obrázek 13: Klastr a jeho Rich-club K=5 IV124 Komplexní sítě Mgr. Petr Štěpánek 325065 14 Obrázek 14: Klastr a jeho Rich-club K = 4 IV124 Komplexní sítě Mgr. Petr Štěpánek 325065 15 Obrázek 15: Klastr a jeho Rich-club K = 2 IV124 Komplexní sítě Mgr. Petr Štěpánek 325065 16 Obrázek 16: Klastr a jeho Rich-club K=5 IV124 Komplexní sítě Mgr. Petr Štěpánek 325065 17 Obrázek 17: Klastr a jeho Rich-club K = 6 IV124 Komplexní sítě Mgr. Petr Štěpánek 325065 18 Obrázek 18: Klastr a jeho Rich-club K=7 IV124 Komplexní sítě Mgr. Petr Štěpánek 325065 19 Obrázek 19: Klastr a jeho Rich-club K = 3 IV124 Komplexní sítě Mgr. Petr Štěpánek 325065 20 Bezškálovost sítě Síť jeví známky bezškálovosti. Obsahuje malé množství velkých hubů a velké množství uzlů s nízkým stupněm. Zároveň v síti můžeme pozorovat vlastnost preferenčního připojování. Po proložení křivky rozložením stupně uzlu zjistíme rovnici křivky y = 349.65x-1.674 s koeficientem || = 1,674. Koeficient je menší než 2, z čehož vyplývá, že síť není bezškálová. Obrázek 20: Rozložení stupně uzlu a proložení křivkou Musíme si však uvědomit, že tuto vlastnost řešíme na síti, která má pouze malý počet uzlů. Pokud by síť byla větší, bezškálová by nejspíš byla. y = 349.65x-1.674 R² = 0.9313 0.1 1 10 100 1000 1 10 100 Početuzlů(log) Stupeň uzlu (log) Rozložení stupně uzlu IV124 Komplexní sítě Mgr. Petr Štěpánek 325065 21 Seznam obrázků Obrázek 1: Komponenty souvislosti.............................................................................................................. 3 Obrázek 2: Zobrazení 21 malých komponent. Barva, velikost a popisky uzlů reprezentují jejich selfDegree, zelené popisky hran představují jejich váhy.................................................................................................. 4 Obrázek 3: Rozložení klastrů sítě................................................................................................................... 5 Obrázek 4: Velikost uzlu – stupeň uzlu, barva uzlu – betweeness................................................................ 6 Obrázek 5: Velikost uzlu – stupeň uzlu, barva uzlu – closeness.................................................................... 7 Obrázek 6: Velikost uzlu – betweeness......................................................................................................... 8 Obrázek 7: Velikost uzlu – stupeň uzlu, barva uzlu – PageRank ................................................................... 9 Obrázek 8: Velikost uzlu – stupeň uzlu, barva uzlu – EigenVector................................................................ 9 Obrázek 9: Klastr a jeho Rich-club................................................................................................................. 9 Obrázek 10: Klastr a jeho Rich-club............................................................................................................. 10 Obrázek 11: Klastr a jeho Rich-club............................................................................................................. 11 Obrázek 12: Klastr a jeho Rich-club............................................................................................................. 12 Obrázek 13: Klastr a jeho Rich-club............................................................................................................. 13 Obrázek 14: Klastr a jeho Rich-club............................................................................................................. 14 Obrázek 15: Klastr a jeho Rich-club............................................................................................................. 15 Obrázek 16: Klastr a jeho Rich-club............................................................................................................. 16 Obrázek 17: Klastr a jeho Rich-club............................................................................................................. 17 Obrázek 18: Klastr a jeho Rich-club............................................................................................................. 18 Obrázek 19: Klastr a jeho Rich-club............................................................................................................. 19 Obrázek 20: Rozložení stupně uzlu a proložení křivkou.............................................................................. 20