Druga część ćwiczenia stanowi kontynuację części pierwszej. W drugiej części studenci wyznaczają miary centralności węzłów w sieci, badają modularność sieci, a także analizują konsensus triad i sieci egocentryczne.
W ćwiczeniu wykorzystujemy zbiór CampNet. Dane zostały pobrane od 18 uczestników letniego warsztatu naukowego organizowanego w USA. Pod koniec warsztatu uczestnicy wskazali 3 osoby, z którymi spędzili najwięcej czasu. Drugi zbiór danych to CampAttr opisujący poszczególne węzły. Dostępne atrybuty to: gender (1=kobieta, 2=mężczyzna), role (1=student, 2=nauczyciel), oraz miara pośrednictwa. Zbiór danych został zebrany przez Steva Bograttiego, Russa Bernarda i Berta Pelto podczas trzytygodniowego warsztatu NSF Summer Institute for Ethnographic Research Methods w 1992 roku. W trakcie warsztatu uczestnicy byli zakwaterowani w tym samym hotelu i bardzo często przebywali razem. Wszyscy uczestnicy studiowali/pracowali w tym samym departamencie.
1. Rozpoczynamy od zaznajomienia się ze zbiorem danych campnet. Użyj ikony z literą D aby wyświetlić zawartość zbioru danych, wykorzystaj także program NetDraw do prostej wizualizacji zbioru danych.
2. Przejdź do Network→Cohesion→Density→(new) Density Overall
, wskaż CampNet jako wejściowy zbiór danych i pozostawiając wartości pozostałych parametrów kliknij przycisk OK. W wyniku uzyskasz informację o gęstości sieci (ang. density) i liczbie relacji w zbiorze danych.
3. UCI*Net umożliwia także wyznaczenie gęstości w sieci partycjonowanej według wskazanego atrybutu (wewnątrz partycji i między partycjami). Przejdź do Network→Cohesion→Density→Density by Groups
i wybierz CampNet jako wejściowy zbiór danych. Wybierz CampAttr
jako zbiór danych zarówno dla wierszy, jak i kolumn partycji. Upewnij się, że opcje dla partycji są ustawione na column
i Gender
. Wybierz Sum (frequencies)
jako metodę agregacji.
Kliknij OK. Zobaczysz w wyniku gęstość wewnątrz każdej partycji oraz gęstość i liczbę połączeń między partycjami. Spróbuj zinterpretować uzyskane wyniki.
4. Możemy także wyznaczyć odległości między dowolnymi węzłami w sieci. Odległość geodezyjna to najkrótsza droga między dowolnymi dwoma węzłami. Przejdź do Network→Cohesion→Geodesic Distances
i wskaż CampNet jako zbiór wejściowy. Kliknij OK. W wyniku otrzymasz informacje o odległościach w sieci.
5. Sprawdź, które węzły są osiągalne z których miejsc w sieci. W tym celu przejdź do Network→Cohesion→Reachability
i wygeneruj raport dla zbioru CampNet.
6. W kolejnym kroku przeprowadzimy analizę głównego komponentu i peryferiów sieci. Przejdź do Network→Core/Periphery→Continuous
, wskaż CampNet jako zbiór wejściowy i kliknij przycisk OK.
Zbiór danych nie wskazuje na istnienie struktury jądra sieci i obszarów peryferyjnych. Wszystkie węzły mają tę samą wartość „jądrowości”, co wyraźnie wskazuje na strukturę ściśle zdecentralizowaną.
Ćwiczenie samodzielne wykorzystuje zbiór KAPTAIL. W 1972 roku Bruce Kapferer obserwował interakcje zachodzące w fabryce tekstylnej w Zambii na przestrzeni 10 miesięcy. Badania Kapferera skupiały się na obserwacji sposobów tworzenia koalicji między pracownikami w trakcie negocjacji o wyższe stawki. Zbiór danych składa się z czterech macierzy kwadratowych reprezentujących kolejno: interakcje związane z wykorzystaniem narzędzi i pomocą w pracy (macierze KAPFTI1
i KAPFTI2
odnotowują sytuację w dwóch punktach czasowych), oraz interakcje społeczne (macierze KAPFTS1
i KAPFTS2
odnotowują sytuację w dwóch punktach czasowych). Co ciekawe, pierwszy punkt czasowy nastąpił po nieudanym strajku, podczas gdy drugi punkt czasowy nastąpił po udanym strajku).
KAPFTS1
, wyświetl jej strukturę, dokonaj prostej wizualizacji. Postaraj się dostrzec centralistyczną strukturę sieci. Network→Core/Periphery→Categorical
i wskaż KAPTAIL jako zbiór wejściowy. Zapamiętaj, jak nazywa się plik zawierający przypisanie poszczególnych węzłów do klas (core i partition). Przeanalizuj uzyskany wynik, zwróć uwagę na różnicę między gęstością połączeń w jądrze i gęstością połączeń w peryferiach. Zwizualizuj przypisanie węzłów do klas. Ćwiczenie wykorzystuje zbiór DRUGNET. Zbiór reprezentuje wyniki badań przeprowadzonych na 293 osobach uzależnionych od narkotyków, związki między węzłami reprezentują używanie tych samych igieł. Badanie centralności w zbiorze służy do zidentyfikowania osób, które mogą najszybciej zachorować lub najbardziej rozprzestrzenić chorobę przenoszoną przez krew.
7. Wybierz Network→Centrality and Power→Multiple measures
. Jako zbiór wejściowy wskaż DRUGNET. Obejrzyj uzyskane wyniki. Zauważ, że poszczególne miary zostały znormalizowane aby łatwiej porównywać pozycję poszczególnych węzłów wg różnych miar. Powtórz wyliczenie, tym razem wskazując w oknie pop-up opcję Raw Scores
w sekcji Report.
8. W następnym kroku przeanalizujemy korelację między miarami centralności i indywidualnymi profilami poszczególnych wierzchołków. Przejdź do Tools→Similarities (e.g. correlations)
. Jako analizowany zbiór danych podaj DRUGNET-cent. Kliknij przycisk OK. Przeanalizuj wynikową macierz i spróbuj znaleźć miary centralności które są najsilniej ze sobą skorelowane.
9. Powtórz ćwiczenie. Tym razem jednak przeanalizuj związki między miarami centralności i indywidualnymi węzłami. W oknie pop-up ponownie wskaż zbiór DRUGNET-cent jako dane do analizy. Zmień parametr Compute similarities among
na wartość Rows
. Zmień też nazwę zbioru wynikowego na DRUGNET-cent-SimRows
. Kliknij przycisk OK.
10. Wyświetl wynikowy zbiór danych DRUGNET-cent-SimRows
w programie UCI*Net. Zauważ np. że osoby o identyfikatorach 1 i 2 posiadają praktycznie ten sam profil centralności.
11. Niektóre miary oceny sieci nabierają znaczenia w przypadku, gdy dane są w pełni symetryczne. W celu transformacji sieci do postaci symetrycznej wybierz Transform→Symmetrize
. W oknie pop-up jako transformowany zbiór podaj DRUGNET. Po przetransformowaniu grafu wyznaczymy miarę centralności zgodnie z kryterium wektora własnego. Wybierz Network→Centrality and Power→Eigenvector
. W oknie pop-up wskaż zbiór DRUGNET-Sym
. Pozostaw resztę parametrów z wartościami domyślnymi i kliknij OK. Obejrzyj uzyskane wyniki i zidentyfikuj najbardziej centralne węzły na wizualizacji.
12. Wybierz Network→Ego Networks→Egonet basic measures
i jako zbiór wejściowy wskaż CampNet. Zmień nazwę zbioru wynikowego na CampNet-EgoNet
. Upewnij się, że parametr Type of ego neighborhood
jest ustawiony na UNDIRECTED
. Kliknij OK. Wynikowy zbiór przedstawia miary egocentryczne dla każdego węzła w sieci. Definicja każdej miary znajduje się pod koniec pliku logu. Dodatkowo, klikając na przycisk Help w oknie pop-up można przeczytać szczegółowe wyjaśnienie każdej miary.
13. Dzięki analizie sieci egocentrycznych można także sprawdzić, w jaki sposób wartości atrybutów węzłów wpływają na ich pozycję. W pierwszej kolejności przeanalizujemy homofilię. Wybierz Network→Ego Networks→Egonet Homophily
. Jako zbiór danych wskaż CampNet, natomiast jako zbiór atrybutów wskaż CampAttr
. Wybierz gender jako analizowaną wartość. Zaznacz Outgoing ties only
przy definicji sieci egocentrycznej. W wyniku uzyskasz raport pokazujący homofilię każdego węzła pod względem płci.
14. W następnym kroku wybierz Network→Ego Networks→Egonet Composition→Categorical alter attributes
. Wskaż CampNet jako zbiór wejściowy, a CamAttr
jako zbiór z atrybutami. Jako analizowaną wartość atrybutu wybierz Role
. Tym razem do definicji sieci egocentrycznej wykorzystaj zarówno krawędzie wchodzące, jak i wychodzące. Wynik zawiera raport z częstotliwością występowania poszczególnych kategorii w sieciach egocentrycznych dla każdego węzła. Heterogeniczność mierzy różnorodność ról w ramach sieci egocentrycznych, a miara IQV jest znormalizowaną heterogenicznością.
15. Powtórz ćwiczenie, wybierając tym razem atrybut ciągły. Zamiast atrybutu Role
wybierz teraz miarę Betweenness
. Wynik zawiera średnie, sumy, wartości minimalne, maksymalne, odchylenia standardowe i liczbę krawędzi dla każdego ego.
16. W ostatniej części ćwiczenia zmierzymy dziury strukturalne w sieciach egocentrycznych. Kliknij Network→Ego Networks→Structural Holes
i wskaż CampNet jako zbiór podlegający analizie. W wyniku tej operacji otrzymujesz raport zawierający dziury strukturalne w sieciach egocentrycznych. Posłuż się przyciskiem Help
aby dowiedzieć się więcej o wyświetlonych miarach.
Ćwiczenie samodzielne wykorzystuje zbiór Trade i powiązany z nim zbiór atrybutów Trade_Attributes. Główny zbiór przedstawia związki między 24 krajami na płaszczyźnie wymiany następujących dóbr: produktów (MANUFACTURED_GOODS
), żywności (FOODS
), materiałów (CRUDE_MATERIALS
), oraz paliw i minerałów (MINERALS
). Ostatnia macierz reprezentuje wzajemną wymianę dyplomatów (DIPLOMATIC_EXCHANGE
). Wszystkie sieci są skierowane, binarne i niesymetryczne. Dodatkowo, zbiór Trade_Attributes zawiera dla każdego kraju: wzrost ludności w latach 1970-81, średni wzrost PKB per capita, procent ludności z wykształceniem średnim oraz konsumpcję energii elektrycznej per capita w 1981 roku. Zbiór danych został wybrany przez S.Wassermana i K.Faust z obszerniejszego zbioru 63 krajów przygotowanego przez Smitha i White'a w 1963 r.
GNP
). FOODS
. FOODS
. DIPLOMATIC_EXCHANGE
. SCHOOLS
.