Filmové dějiny online: jak zobrazovat minulost? II - využití software Gephi ve Film studies

Gephi - statistika

Cíle kapitoly

  • Představení metrik z menu Statistics
    • Average Degree, Avg. Weighted Degree, Graph Density, Modularity, Eigenvector Centrality, ad.

ÚKOL na tento týždeň

K práci použite dataset Les Miserables s ktorým sme pracovali na prvej hodine. Pre zobrazenie siete použite Force Atlas 2. Použite metriky z menu Statistics a vygenerujte nasledovné exporty:

  1. EXPORT 1 - veľkosť uzlov nech zodpovedá váženému stupňu uzla (Weighted degree)
  2. EXPORT 2 - veľkosť uzlov nech zodpovedá Betweenness centrality (středová mezipoloha)
  3. EXPORT 3 - veľkosť uzlov nech zodpovedá stupňu uzla (Degree)

Farba uzlov nech vždy reprezentuje komunity siete

Pripravte si odpovede na nasledovné otázky:

  1. Ktoré tri postavy sú najdôležitejšími mostami ktoré môžu ovplyvňovať tok informácií v sieti?
  2. Ktorá postava sa môže najrýchlejšie a najjednoduchšie prepojiť s ktoroukoľvek časťou siete?
  3. Viete vysvetliť, prečo sa veľkosť uzla reprezentujúceho postavu "Gavroche" výrazne zmení pri zmene veľkosti z Degree na Weighted Degree?

Pomôcka: okrem Overview skúste pri identifikácii veľkosti uzlov použiť aj Data Laboratory.


Metric


Average Degree - The average number of edges connected to a node

Avg. Weighted Degree - The average sum of the weights of edges connected to a node

Network Diameter - The longest shortest path between nodes within the graph

Graph Density - Measures how close the graph is to complete

HITS - Computes two values for each node; How valuable information stored at that node is & the quality of the nodes links

Modularity - Community detection algorithm

PageRank - Ranks nodes “pages” according to how often a user following links will non-randomly reach the node “page”

Connected Components - Determines the number of connected components in the network

Avg. Clustering Coefficient - Averages how nodes are embedded in their neighborhood

Eigenvector Centrality - A measure of node importance in a network based on a node’s connections; the sum of the centrality measures of all nodes connected to a node

Avg. Path Length - The average number of steps to get from one randomly selected node to another

 <https://thomaspadilla.org/na2014/

Nejpoužívanější míry centrality


  • Degree centrality (centralita měřená stupněm uzlu)[1] – Historicky první a koncepčně nejjednodušší je takzvaně stupňová centralita, která je definována jako počet vazeb, které uzel má. Stupeň uzlu je počtem hran vycházejících z daného uzlu (tj. počet přímých vazeb k dalším uzlům). Tato centralita tedy měří aktivitu, kterou uzel v síti vykazuje. Uzly, které mají vysokou hodnotu jsou „středy“ nebo „spojky“ v dané síti.
  • Closeness centrality (blízkost polohy ve středu)[1] – Matematicky lze tuto centralitu vyjádřit jako minimum součtu vzdáleností uzlu ke všem ostatním uzlům. Uzly, které mají vysokou hodnotu této centrality, mají součet vzdáleností nejmenší, lehce přijímají a přenášejí informaci a v neposlední řadě mají velký vliv na to, co se v síti jako takové děje.
  • Betweenness centrality (středová mezipoloha)[1] – Betweenness centrality je nejvyšším uzlem, pokud tímto uzlem vždy procházejí cesty mezi libovolnými dvojicemi uzlů sítě. Betweenness centrality tedy měří, kolik cest mezi dvojicí uzlů prochází daným uzlem. Uzel s vysokou hodnotou betweenness centrality může působit jako závora nebo propojení, zároveň má také výbornou pozici pro kontrolu toku informací v síti.
  • Eigenvector cetrality (vážený počet hran)[1] – Pomocí eigenvector cetrality měříme účinek uzlu v síti. Uzly, propojující více bodů, jsou významnějšími než ty, které jich propojují méně nebo pouze jeden.

 <https://cs.wikipedia.org/wiki/Centralita>

Pomocí které metriky rozdělíme síť do skupin/komunit?

Modularity

Která metrika vypočítáva hodnoty Betweenness centrality, Closeness Centrality a Eccentricity?

Network Diameter

Jak změříme nasycenost (úplnost) sítě?

Pomocí Graph Density

Užitečné odkazy


Odevzdávárna

Zpětná vazba