1. 들어가며
네트워크 분석은 다수의 점(노드)들이 선으로 연결되어 있는 망을 분석하는 방법이다. 점(노드)은 개인, 국가, 회사 등을 의미하고 점들이 선으로 연결이 되었다는 것은 거래 관계가 있거나, 친구 관계를 맺고 있다거나 하는 등의 특정한 관계가 형성되어 있음을 의미한다.
2. 노드(node)와 엣지(edge)
노드는 네트워크를 구성하는 개체, 엣지는 개체 간의 연결 상태를 의미한다. 아래 <그림 1>에서는 네트워크에 A, B, C 노드가 존재하고 B와 C는 연결되어 있다.
3. 네트워크의 특징을 나타내는 개념들
아래 <그림 2>는 두 개의 서로 다른 네트워크 A, B이다. 이 둘은 생김새를 보면 다르다는 것이 분명하지만 구체적으로 그 다름(difference)을 어떤 수치로 표현할 수 있을지 살펴 보자.
(1) 노드의 개수 : 노드가 많을 수록 더 크고 복잡한 네트워크임에 틀림없다
(2) 연결의 개수 : 연결이 많을 수록 네트워크는 더 끈끈하게 연결되어 있을 것이다.
(1), (2)는 너무 당연한 이야기라 간단하게 넘어가고 이제 조금 설명이 필요한 개념을 살펴보자.
(3) 밀도(density)
네트워크의 밀도 = 총 연결 수 / 가능한 총 연결 수
네트워크의 노드 수가 정해지면 이 노드들이 이론적으로 연결될 수 있는 총 연결수를 계산할 수 있다. 이 값을 분모로 하고, 실제 네트워크에서 노드간의 연결 수를 분자로 한 값이다. 당연히 밀도가 높으면 많은 노드들이 연결되어 있을 것이므로 더 깊고 끈끈한 네트워크라고 볼 수 있다. 위의 A, B의 경우 두 네트워크의 노드 수가 다르기 때문에 시각적으로 판단하기는 어렵지만 얼핏 봤을 때 A가 B보다 밀도가 더 높아 보인다.
(4) 연결수 평균
각 노드들은 저 마다 몇 개의 다른 노드들과 연결되어 있을 것이다. 노드들이 다른 노드와 평균적으로 몇 개씩 연결되어 있는지를 의미하는 개념이다.
(5) 클러스터 계수
예를 들어 네트워크를 구성하는 많은 노드들 중에서 인접하는 세 개의 노드가 <그림 3>의 "가"처럼 모두 연결되어 있을 수도 있고 "나"처럼 어느 한 지점이 끊어져 있을 수도 있다. 클러스터 계수는 이 처럼 인접하는 노드들 간의 관계 정도를 의미하는 수치이다. 추이성(transitivity)이라고도 한다.
클러스터 계수 = 연결된 세 개의 노드 수 / 연결된 두 개의 노드 수
4. 요약
네트워크의 다름을 구체적으로 구분하는 몇 가지 통계 값을 살펴보았는데 약간씩 공식이 다를 뿐 기본적으로는 네트워크가 얼마나 많이, 잘 연결되어 있는지를 다른 방식으로 표현하고 있을 뿐이라는 사실을 알 수 있다. 이제 네트워크의 전체적인 특징이 아니라 개별 노드 하나의 특징을 다음 글에서 살펴보자.
다음글
'네트워크분석' 카테고리의 다른 글
2. 노드의 중심성(centrality) (0) | 2022.03.17 |
---|
댓글