Pola Analisi Jaringan Sosial Dinamis

BAB 2
TINJAUAN PUSTAKA

Analisis jaringan adalah penelitian tentang graf dalam ukuran yang besar.
Banyak sistem di dunia yang mengambil bentuk jaringan misalnya internet, World
Wide Web(WWW), jaringan sosial atau koneksi antar individu, jaringan organisasional dan relasi bisnis antar perusahaan, jaringan neural, jaringan metabolisme,
jaringan makanan, jaringan distribusi misalnya pembuluh darah atau rute pengiriman pos, jaringan pengarang karya ilmiah dan lain-lain (Newman, 2003).
Penelitian menyangkut jaringan telah banyak diteliti di permulaan abad 20, dimana paling banyak didominasi oleh ahli matematika dan peneliti ilmu sosial yang
telah menuntun kepada perkembangan saat ini dimana subjek yang semakin luas
dan berbeda-beda beberapa diantaranya biologi, ekologi, ekonomi, ilmu komputer
dan fisika.
Jaringan sosial memegang peranan yang sentral dalam kegiatan sehari-hari,
dalam fenomena sosial, dalam kehidupan ekonomi dan politik. Oleh karena itu
penting untuk memberikan analisis lengkap dari struktur jaringan sosial dan
meneliti pengaruh yang mungkin diberikan pada perilaku manusia.
Dalam analisis jaringan sosial, jaringan dikategorikan oleh sifat dasar dari
himpunan aktor dan properti relasi antara aktor-aktor tersebut. Aktor atau entitas dapat merupakan tipe dari variasi individu, organisasi atau koleksi atau
kumpulan dari orang atau organisasi. Koleksi dari orang misalnya grup mahasiswa yang menghadiri kuliah yang sama dan kumpulan organisasi misalnya
himpunan negara bagian.
Mode dari jaringan didefinisikan sebagai jumlah tipe aktor atau entitas
yang variabel strukturalnya (relasi) diukur. Variabel struktural diukur dalam

pasangan-pasangan entitas. Jika pasangan entitas adalah himpunan tunggal,
jaringan ini disebut dengan relationship atau one-mode network. Jika variabel
strukturalnya diukur dalam dua himpunan entitas, disebut sebagai affiliation
atau two-mode network. Two-mode network terdiri dari dua himpunan entitas
yang berbeda atau himpunan aktor dan himpunan kejadian. Dalam kasus pertama, jaringan disebut dyadic network dan link antara dua aktor dari himpunan
berbeda menyatakan relasi antara kedua aktor (Wasserman dan Faust, 1994).
4

Universitas Sumatera Utara

5
2.1 Analisis Jaringan Sosial
Social Networks Analysis (SNA) mulai berkembang sekitar tahun 1920 an
dan berfokus pada hubungan antara entitas sosial, misalnya komunikasi antara
anggota suatu grup, perdagangan antar negara atau transaksi ekonomi antara
perusahaan (Boccaletti, et al. 2005).
Dalam ilmu sosial, analisis jaringan memiliki tradisi yang panjang. Tujuan utama analisis jaringan sosial adalah mendeteksi dan menginterpretasikan
pola dari relasi sosial antara aktor. Namun, akhir-akhir ini bidang ini juga semakin populer di banyak area penelitian seperti immunulogy, sistem transportasi,
biologi molekular, sistem informasi, sistem komputer dan lain-lain. Meskipun domain dari aplikasi adalah menetapkan bentuk analisis yang tepat, metode yang
umum dalam analisis jaringan dapat dibedakan berdasarkan level analisis. Analisis jaringan dapat dilakuakan dalam tiga level yaitu, elemen-level, group-level

dan network-level.
Dalam element-level analysis, memberi penekanan pada analisis properti
dari individual node atau link. Misalnya dalam mesin pencarian yang mana
mencoba halaman penting diantara interlink dalam website. Dalam goup-level
analysis, korelasi antara node dianalisis secara khusus, salah satunya menyelidiki
tentang properti grup dari node atau link. Dalam network level analysis, properti graf dianalisis secara keseluruhan. Network level analysis digunakan untuk
membedakan antara tipe network yang berbeda, dan menetapkan pengertian yang
bernilai dan mengimplementasikannya ke dalam algoritma.
Beberapa dekade terakhir muncul penelitian-penelitian tentang complex networks yakni jaringan dengan struktur yang irreguler, kompleks dan secara dinamis
berkembang atas waktu, dengan fokus utama bergerak dari analisis jaringan yang
kecil ke sistem dengan ribuan bahkan jutaan node, dan memperbaharui perhatian kepada properti jaringan yang dinamis. Hal ini tiba-tiba dicetuskan dalam 2
paper yang selanjutnya sangat berkembang oleh Watts dan Strogatz dalam SmallWorld Networks yang muncul dalam Nature 1998 dan oleh Barabasi dan Albert
dalam Scale-Free Networks muncul setahun kemudian dalam Science, telah terlihat secara fisik komunitas antar aktor, dan secara pasti meningkatkan kekuatan
kumputasional yang memungkinkan meneliti banyak properti dari database yang
sangat besar dari jaringan nyata (real networks). Diantaranya jaringan trans-

Universitas Sumatera Utara

6
portasi, jaringan telepon, internet dan World Wide Web, kolaborasi aktor dalam

database perfilman, kolaborasi penulisan karya ilmiah (scientific coauthorship)
dan lain-lain.
2.2 Representasi Jaringan
Jaringan dapat direpresentasikan dengan dua cara yaitu sebagai matriks dan
graf. Didalam matriks baris dan kolom berkorespondensi dengan aktor/entitas,
matriks akan bujursangkar untuk one-mode network, dan persegi panjang untuk
two-mode network. Entri sel mengandung nilai link hubungan yang menghubungkan aktor/entitas, jadi sel yang ke(i, j) merepresentasikan hubungan dari aktor i
ke aktor j. Matriks ini disebut juga dengan adjacency matrix.
Adjacency matrix merupakan cara yang paling sedehana untuk merepresentasikan jaringan. Misalkan diasumsikan terdapat n verteks dalam jaringan, yang
terhubung satu sama lain dengan m edge, selanjutnya misalkan edge tidak berarah. Dapat dispesifikasikan secara lengkap struktur hubungan dalam jaringan
dengan matriks A dengan ordo nxn yang elemen-elemennya:
(
1, jika terdapat suatu sisi menghubungkan i, j
Aij =
0, jika tidak ada
Jaringan biasanya dimodelkan sebagai graf. Suatu graf G = (V, E) adalah
suatu objek dimana V menotasikan himpunan verteks(titik), E menyatakan himpunan edge (sisi) yang menghubungkan pasangan verteks . Sisi tak berarah yang
menghubungkan titik u, v ∈ V yang dinotasikan dengan (u, v). Dalam ilmu jaringan verteks biasanya disebut dengan node atau aktor sedangkan edge disebut link
atau relasi.
Suatu graf G′ = (V ′, E ′ ) adalah subgraf dari graf G = (V, E) jika V ′ ⊆ V

dan E ′ ⊆ E. Subgraf disebut induced subgraph jika E ′ mengandung semua sisi
e ∈ E yang menghubungkan titik-titik dalam V ′ .
Relasi dalam suatu jaringan dapat merupakan relasi berarah, misalnya eksport/import barang antar negara, panggilan telepon atau pesan email antar individu dan lain-lain. Relasi ini dapat direpresentasikan dengan graf berarah (directed graph) yang biasa disebut dengan digraph. Suatu digraph G umumnya
didefinisikan sebagai G = (V, A) dimana V adalah himpunan berhingga verteks
dan A adalah himpunan arcs yang menghubungkan verteks yang berbeda.
Universitas Sumatera Utara

7

Gambar 2.1 Tipe jaringan
Himpunan verteks yang disatukan oleh edge adalah tipe sederhana dari
jaringan. Jaringan bisa saja lebih kompleks karena verteks itu mungkin saja
lebih dari satu tipe berbeda dalam jaringan dan lebih dari satu tipe edge yang
berbeda (Gambar 2.1).
Walk dari v1 ke vk dalam graf tak berarah G = (V, E) adalah barisan alternating dari titik-titik dan sisi v1, e1, v2, e2, v3, ..., ek−1, vk , dimana ei = (vi , vi+1),
yang mana setiap titik adalah insiden dengan sisi yang mengikuti dan mendahuluinya dalam barisan itu. Panjang dari walk ini didefinisikan oleh jumlah sisi
dalam barisan itu. Path P adalah walk dimana semua titik dan semua sisi adalah
berbeda: ei 6= ej dan vi 6= vj untuk i 6= j. Suatu path p dari u ke v dalam
graf G = (V, E) adalah path terpendek(shortest path) atau geodesic jika bobotnya
w(p) adalah bobot terkecil yang mungkin diantara semua path dari u ke v, dimana w(p) didefinisikan sebagai jumlah semua bobot sisi pada p. Panjang d(u, v)

dari path terpendek disebut shortest-path distance atau geodesic distance. Jika
tidak ada path terpendek antara dua titik maka jarak antara mereka adalah tak
terhingga.
Suatu graf tak berarah G = (V, E) adalah terhubung (connected) jika terdapat path yang melalui semua pasangan titik, dengan kata lain setiap titik dapat dicapai dari setiap titik lain. Graf yang tidak terhubung disebut disconnected. Subgraf yang terhubung dalam graf disebut komponen-komponen (componnents). Komponen dalam graf adalah subgraf yang terhubung maksimal. Komponen terhubung (connected component) dari G = (V, E) adalah induced subgraph

Universitas Sumatera Utara

8
G′ = (V ′ , E ′ ) yang maksimal yang artinya tidak ada subgraf yang terhubung.
G′′ = (V ′′ , E ′′) dengan V ′′ ⊃ V ′ . Dengan perkataan lain, komponen terhubung
adalah suatu subgraf dimana terdapat path antara semua pasangan titik dan tidak
ada path antara sisi dalam komponen dan tidak ada titik dalam komponen.
2.3 Properti Jaringan
Peneliti selama beberapa tahun terakhir telah mengidentifikasi propertiproperti jaringan yang dapat ditemukan dalam banyak jaringan nyata dari domain yang beragam. Properti yang mempunyai peranan dalam pencarian pola
adalah distribusi derajat(degree distribution) dan diameter kecil(small diameter).
Selanjutnya dalam bagian ini akan dikaji juga properti-properti lain dari suatu
jaringan yaitu derajat node, derajat rata-rata, densitas, diameter, dan sentralitas.
2.4 Derajat Node dan Derajat Rata-rata (Average Degree)
Properti kunci dari setiap node dalam jaringan adalah derajatnya. Derajat
dari node dinotasikan sebagai ki (derajat node ke-i dalam jaringan) adalah jumlah link yang insiden dengan node tersebut atau dengan kata lain derajat adalah

banyaknya node yang adjacent dengan node itu. Misalkan n adalah jumlah node
dalam suatu jaringan tak berarah maka jumlah total dari link L dapat diekspresikan sebagai jumlah derajat node-node nya.
n

1X
L=
ki
2 i=1

(2.1)

Derajat rata-rata node < k > dalam suatu jaringan (average degree) dinyatakan
dengan:

n

2L
1X
ki =
< k >=

n i=1
n

(2.2)

Di dalam jaringan berarah terdapat in-degree (derajat masuk) kiin yaitu banyaknya
link yg menuju node tersebut dan out-degree (derajat keluar) kiout adalah banyaknya
link menuju keluar dari node tersebut. Total link dalam jaringan berarah adalah:
L=

n
X
i=1

k

in

=


n
X

k out

(2.3)

i=1

Universitas Sumatera Utara

9
Pada persamaan (2.3) tidak menggunakan faktor 1/2 seperti persamaan (2.1)
karena menghitung derajat masuk dan derajat keluar secara terpisah. Derajat
rata-rata jaringan berarah adalah
n

n

1 X in

1 X out L
(k ) =
ki = k out =
k =
n i=1
n i=1 i
n
in

(2.4)

2.5 Jarak, Diameter dan Average Path Length
Dalam sistem fisik komponen dikategorikan berdasarkan jarak (distance)
yang jelas, seperti jarak antara dua atom dalam kristal, atau antara dua galaksi
dalam jagat raya. Dalam jaringan jarak adalah suatu konsep yang menantang.
Apa yang dimaksud engan jarak antara dua halaman web dalam WWW, atau dua
individu yang mungkin saling mengenal atau tidak saling mengenal? Jarak fisik
tidak relevan disini, dua halaman web terhubung satu sama lain mungkin oleh dua
orang yang berada di belahan dunia yang berbeda atau mungkin oleh dua orang
yang berada di gedung yang sama tapi tidak saling mengenal satu sama lain.

Dalam jaringan jarak fisik digantikan dengan path length (panjang path), dimana
panjang path adalah banyaknya link yang dimiliki oleh path tersebut (Barabasi,
2012).
Shortest path atau geodesic path antara node i dan j adalah path dengan
jumlah link yang paling sedikit. Shortest path sering juga disebut sebagai jarak
(distance) antara node i dan j yang disimbolkan dengan d(i, j) atau dij . Jika
tidak ada path antara node, jarak antara mereka adalah tak terhingga. Konsep
ini menuntun kepada karakteristik penting lain dalam jaringan yaitu diameter.
Diameter (dmax ) adalah shortest path maksimum antara dua node dalam jaringan.
Dengan perkataan lain ketika panjang semua shortest path dari setiap node ke
semua node dihitung, diameter adalah shortest path terpanjang.
dmax := max{d(u, v) | u, v ∈ V }

(2.5)

Diameter suatu graf penting karena mengukur seberapa jauh terpisah atau jarak
dua node tejauh dalam suatu graf. Misalkan dalam jaringan komunikasi dimana
link transmisi pesan. Difokuskan pada pengiriman pesan diantara semua pasangan node. Selanjutnya asumsikan pesan selalu mencari rute terpendek (melalui
geodesic), dijamin bahwa pesan dapat melalui satu node ke node yang lain, atas
path dengan panjang yang tidak lebih dari diameter graf.

Universitas Sumatera Utara

10
Average path length (rata-rata path) antara node disimbolkan dengan <
d > adalah rata-rata jarak antara semua pasangan node dalam jaringan. Untuk
jaringan tak berarah dengan n buah node, diberikan oleh:
X
2
< d >=
di,j
n(n − 1) i,j=1,n

(2.6)

2.6 Densitas Graf dan Subgraf

Derajat adalah suatu konsep yang menganggap jumlah sisi yang insiden
dengan setiap node dalam graf. Dapat juga dianggap jumlah dan perbandingan
dari sisi dalam graf secara keseluruhan. Suatu graf dapat memiliki banyak sisi
tapi jumlah maksimum yang mungkin ditentukan oleh jumlah node dalam graf
tersebut. Misalkan terdapat n buah node dalam suatu graf (tanpa loop) maka
terdapat kemungkinan pasangan tidak terurut node, sehingga n(n − 1)/2 adalah
banyak sisi yang mungkin dalam graf tersebut.
Densitas adalah perbandingan dari banyak sisi yang ada pada suatu graf
(L) dengan jumlah maksimum yang mungkin sisi dari graf tersebut. Jika densitas
dilambangkan dengan △ maka dapat dihitung sebagai:
2L
L
=
△=
n(n − 1)/2
n(n − 1)

(2.7)

densitas bernilai terendah 0 yaitu jika L = 0 dan tertinggi bernilai 1 yaitu jika
banyaknya sisi/garis yang ada sama dengan banyaknya maksimum yang mungkin
n(n − 1)/2.
Jika setiap sisi ada, maka setiap node disebut adjacent dan graf dikatakan
komplit (complete). Suatu graf komplit dengan g buah node biasanya dinotasikan
dengan Kn . Graf komplit mengandung semua n(n − 1)/2 sisi yang mungkin,
dengan densitas sama dengan 1, dan semua derajat node sama dengan n − 1.
Terdapat hubungan langsung antara densitas graf dan rata-rata derajat node
dalam graf. Telah diketahui bahwa jumlah derajat sama dengan 2L sehingga
diperoleh:

d
(2.8)
(n − 1)
dengan kata lain densitas graf adalah proporsi rata-rata dari insiden garis dengan
△=

node.
Densitas dari subgraf dapat juga didefinisikan sebagai jumlah sisi yang ada
dalam subgraf tersebut dibagi dengan jumlah garis yang mungkin muncul dalam
Universitas Sumatera Utara

11
subgraf. Misalkan dinotasikan jumlah node dalam subgraf Gs adalah ns , dan
jumlah sisi dalam subgraf sebagai Ls . Jumlah sisi yang mungkin dalam suatu
subgraf adalah sama dengan ns (ns − 1)/2. Sehingga densitas dari subgraf dapat
dihitung sebagai:
△s =

2Ls
ns (ns − 1)

(2.9)

densitas dari subgraf menyatakan proporsi ikatan yang muncul diantara subset
aktor dalam suatu jaringan.
2.7 Sentralitas (Centrality) dan Wibawa (Prestige)
Konsep sentralitas menangkap tentang menonjol atau tidaknya suatu node
dalam jaringan. Sentralitas adalah ukuran dalam graf yang digunakan dalam analisis jaringan untuk menemukan struktur penting dari node dan edge. Sentralitas
umumnya menetapkan pentingnya suatu node hanya berdasarkan struktur graf.
Definisi yang paling sederhana dari sentralitas node adalah bahwa node sentral
haruslah node yang paling aktif atau node yang memiliki ikatan paling banyak
dengan node lain dalam jaringan. Misalkan dalam suatu organisasi seseorang dengan hubungan atau komunikasi yang ekstensif dengan banyak orang lain dalam
organisasi dinilai lebih penting daripada orang lain dengan kontak yang lebih
sedikit. Sentralitas adalah ukuran dalam level node sedangkan sentralisasi adalah
ukuran dalam level jaringan.
Ada empat ukuran dalam sentralitas yang digunakan secara luas dalam analisis jaringan yaitu: derajat sentralitas (degree centrality), keantaraan(betweenness),
kedekatan(closeness), dan eigenvector centrality.
Derajat sentralitas didefinisikan sebagai jumlah link yang incident atas suatu
node (jumlah ikatan yang dimiliki node). Degree centrality CD (v) dari verteks u
dalam graf tak berarh G = (V, E) didefinisikan sebagai: CD (v) = deg(u). Untuk
graf G(V, E) dengan n verteks, derajat sentralitas CD (v) untuk verteks v adalah:
CD (v) =

deg(v)
n−1

(2.10)

Perhitungan derajat sentralitas diatas membutuhkan waktu kompleksiti O(| E |).
Jumlah sentralitas berasal dari definisi dasar dari shortest path antara pasangan verteks. Misalnya Closeness Centrality, terdekat berdasarkan jumlah jarak
terpendek terhadap verteks-verteks yang lain. Contoh nyata dalam pemilihan
Universitas Sumatera Utara

12
lokasi yang cocok untuk mall dalam suatu kota dengan tujuan meminimumkan
jarak para konsumen. Oleh karena itu closeness centrality cC (u) untuk verteks u
didefinisikan sebagai:
cC (u) = P

1
v∈V d(v, u)

(2.11)

Perhitungan closeness centrality menjadi aplikasi sederhana dari algoritma
all pairs shortest path (APSP), yang memiliki algoritma standart seperti algoritma
Floyd-Warshall yang memiliki waktu kompleksiti O(| V |3) (Floyd, 1962).
Sama halnya dengan Closeness Centrality, Betweennes Centrality menandai
pentingnya verteks berdasarkan jumlah shortest path yang melalui nya. Jika ada
dua node yang saling berdekatan, yaitu v dan w, ingin berinterkasi dan node u
berada pada lintasan hubungan antara v dan w, maka u memiliki kontrol terhadap
interaksi keduanya dan betweennes mengukur kontrol tersebut. Jika u berada pada
lintasan dari beberapa interaksi maka u adalah sebuah node yang penting atau
berpengaruh. Secara matematis betweennes centrality cB (u) dari verteks u adalah

cB (u) =

X X σst (u)
s∈V t∈V

(2.12)

σst

dimana σst adalah jumlah shortest path antara s dan t dan σst (u) adalah jumlah
shortest path antara s dan t dimana terdapat u didalamnya.
Untuk menghitung betwenees centrality dapat mengikuti modifikasi sederhana dari algoritma Dijkstra untuk menemukan sumber tunggal shortest path
antara pasangan verteks. Proses ini membutuhkan total waktu O(| V |3). Selanjutnya fakta bahwa verteks v berada dalam shortest path antara s dan t jika
dan hanya jika d(s, t) = d(s, v) + d(v, t) dan dalam kasus ini jumlah shortest path
yang melalui u, diperoleh dari perkalian jumlah shortest path antara s, v dan v, t
ekivalen dengan σst = σsv σvt . Fakta ini menyiratkan bahwa menghitung cB (u)∀u
dalam waktu kompleksiti O(| V |3) secara keseluruhan.
Betwennes centrality cB dapat dihitung untuk setiap verteks dalam suatu graf
berbobot G = (V, E) dalam O(| V || E | + | V |2 log | V |)
Prestige(martabat/wibawa) merupakan suatu pengukuran yang lebih halus
terhadap peran seorang aktor dibandingkan dengan pengukuran centrality. Misalkan dapat bedakan ikatan yang diberikan dan ikatan yang diterima seperti
Universitas Sumatera Utara

13
relasi berarah. Seorang aktor yang prestige adalah aktor yang memiliki ikatan
sebagai penerima (in-links). Perbedaan utama antara centrality dengan prestige
adalah centrality fokus pada out-links sementara prestigue fokus pada in-links.
2.8 Distribusi Derajat(Degree Distribution)
Distribusi derjat (pk ) adalah probabilitas node yang terpilih secara random dalam jaringan dengan derajat k. Karena (pk ) adalah probabilitas, maka
P∞
k=1 (pk ) = 1. Untuk jaringan tetap dengan n node, derajat distribusinya adalah
histogram normalisasi dengan pk =

nk
n

dimana nk adalah jumlah derajat dari k

buah node. Oleh sebab itu jumlah derajat node dapat diperoleh dari distribusi
derajat selama nk = npk . Distribusi derajat mempunyai peran sentral dalam teori
jaringan karena banyak perhitungan dalam jaringan yang mengharuskan untuk
mengetahui nilai pk . Misalnya derajat rata-rata jaringan dapat ditulis sebagai
< k >=


X

kpk

(2.13)

k=0

2.9 Clustering
Salah satu cara untuk menemukan himpunan verteks yang saling berkolerasi
adalah dengan mempartisi graf. Partisi yang efektif selanjutnya akan menjadikan
entitas dalam grup yang sama lebih berkolerasi satu sama lain daripada entitas
antar grup yang berbeda. Clustering dapat menyajikan sembarang divisi atau
verteks.
Misalkan G = (V, G) adalah graf tak berarah.

Suatu cluster Ci ⊆ V

adalah himpunan bagian tak kosong dari verteks-verteks. Suatu clustering ζ =
{C1 , ..., Ck } dari G adalah partisi dari semua verteks kedalam cluster Ci . Himpunan E(Ci , Cj ) terdiri atas semua sisi yang titik asalnya Ci dan titik tujuannya dalam Cj .E(Ci ) adalah himpunan sisi yang memiliki titik asal dan tujuan
Sk
dalam Ci . E(ζ) := i=1 E(Ci ) adalah himpunan sisi intra-cluster dan E(ς) :=

E\E(ς)himpunan sisi inter-cluster. Jumlah dari sisi intra-cluster dinotasikan dengan m(C) dan jumlah inter-cluster oleh m(C). Suatu cluster Ci diidentifikasi
dengan induksi subgraf G yakni graf G[Ci ] := (Ci , E(Ci )).
Universitas Sumatera Utara

14
Kualitas suatu clustering ditentukan berdasarkan nosi densitas node dalam
suatu cluster dan nosi kejarangan anatara cluster yang berbeda. Kualitas ini
didefinisikan berdasarkan dua fungsi pembantu. Misal A(G) adalah himpunan
dari semua clustering yang mungkin dari G, dan misalkan f dan g adalah fungsi
yang mengukur densitas didalam cluster dan kejarangan antara cluster secara
berturut-turut sehingga;
f, g : A(G) → R+ ∪ {0}

(2.14)

Selanjutnya indeks kualitas dari clustering ζ didefinisikan sebagai:
index(ζ) =

f(ζ) + g(ζ)
max{f(ζ ′) + g(ζ ′ ) : ζ ′ ∈ A(G)}

(2.15)

Sebagian besar clustering trivial yakni partisi kedalam himpunan tunggal
dan partisi kedalam hanya satu himpunan, akan memaksimumkan fungsi utilitas. Idealnya akan dicari clustering non trivial yang juga memaksimumkan fungsi
utilitas, atau semaksimum mungkin. Beberapa cara memodelkan fungsi f, g dan
clustering yang diperoleh.
Cara yang paling dasar untuk membagi graf ke dalam cluster dengan memaksimumkan bobot intra-cluster edge. Coverage κ(ζ) mengukur bobot dari sisi intracluster, dibandingkan dengan bobot semua sisi yakni:
f(ζ) =

X

w(e), g ≡ 0

(2.16)

e∈E(ζ)

Nilai maksimum dari indeks coverage adalah ketika tidak di cluster sama sekali,
atau ketika sisinya intra-cluster. Oleh karena itu nilai kualitas diberikan oleh:
P
e∈E(ζ) w(e)
κ(ζ) = P
(2.17)
e∈E w(e)

Indeks performance mengkombinasikan dua fungsi untuk mengukur densi-

tas f dan kejarangan g, mengobservasi semua pasangan node. Suatu pasangan
node mungkin meningkatkan densitas cluster jika kedua node tersebut dalam satu
cluster dan terhubung oleh sustu sisi(termasuk dalam f) atau meningkatkan kejarangan dari sisi inter-cluster jka kedua node terletak dalam cluster yang berbeda
dan tidak terhubung oleh suatu sisi(termasuk dalam g). Dalam kedua situasi ini
paradigma densitas intra-cluster dan kejarangan inter-cluster dipenuhi.
Universitas Sumatera Utara

15

f(ζ) :=

k
X

w(E(Ci ))

(2.18)

i=1

dan
g(ζ) := (

X

M.[(u, v) 6∈ E].[u ∈ Ci , v ∈ Cj , i 6= j])

(2.19)

u,v∈V

2.10 Koefisien Clustering dan Transitifitas
Dalam banyak jaringan ditemukan bahwa jika verteks A terhubung dengan
verteks B dan verteks B dengan verteks C, sehingga mempertinggi probabilitas
bahwa verteks A akan terhubung dengan verteks C. Dalam bahasa jaringan sosial,
teman dari temanmu kemungkinan akan menjadi temanmu.
Definisi: 2.10 Misalkan suatu node i yang memiliki ki tetangga, dan terdapat ni edge diantara tetangga-tetangga nya. Selanjutnya koefisien clustering dari
i didefinisian sebagai:
Ci =


 ni
ki

0

ki > 1
ki = 0 atau 1

(2.20)

jadi persamaan diatas mengukur derajat transitifitas suatu graf, semakin tinggi
nilainya mengimplikasikan bahwa teman dari teman kemungkinan besar dengan
sendirinya akan menjadi teman, hal ini menuntun kepada struktur graf. Sebagai
contoh perhatikan Gambar 2.2.

Gambar 2.2 Clustering Coefficient. Node X memiliki kX = 6 tetangga. Terdapat
hanya nX = 5 edge antar tetangga. Sehingga Clustering coefficient
lokal dari node X adalah nX /kX = 5/15 = 1/3

Universitas Sumatera Utara

16
Dalam istilah topologi jaringan, transitifitas berarti kehadiran segitiga dalam
jumlah besar dalam jaringan, himpunan dari 3 verteks yang terhubung satu sama
lain. Ini dapat diukur dengan mendefinisikan koefisien clustering C.
C=

3x jumlah segitiga dalam jaringan
jumlah connected triple dari verteks

(2.21)

dimana ”connected triple” terdiri dari 3 verteks yang terhubung oleh 2 atau 3 sisi
tak berarah. Misalnya, suatu segitiga A, B, C membuat 3 triple ABC, BCA, dan
CAB. Sebaliknya rantai dari node A, B, C yang terhubung dimana B terhubung
dengan A dan C namun A tidak terhubung dengan C yaitu membentuk triplet
tunggal terbuka. Faktor pengali 3 pada pembilang persamaan diatas menunjukkan
fakta bahwa setiap segitiga dihitung tiga kali dalam perhitungan triple.
Salah satu teknik clustering adalah melibatkan graf partisi: Graf dipecah
menjadi dua partisi atau komunitas yang kemudian dapat mempartisi dirinya
sendiri. Beberapa ukuran berbeda dapat dioptimisasikan ketika graf dipartisi.
Clustering data secara umum adalah untuk menemukan grup homogen dimana kesamaan dalam grup diminimumkan dan kesamaan antar grup dimaksimalkan. Dalam (Han dan Kamber, 2006) metode clustering untuk data statis diklasifikasikan kedalam 5 kategori utama, metode partisi, metode hirearki, metode
berdasarkan densitas, dan metode berdasarkan grid dan model.
Metode partisi membangun k partisi data. Partisi ini rapuh jika sebagian
dan setiap objek dalam dataset diijinkan dalam hanya satu partisi. Namun dalan
partisi fuzzy suatu objek dapat menjadi lebih dari satu partisi dengan probabilitas
yang beragam.
2.11 Clique
Clique dalam suatu graf tak berarah adalah himpunan bagian dari titik
sehingga setiap dua titik dalam suatu subset terhubung oleh sebuah sisi. Misalkan
suatu graf tak berarah G = (V, E) dan graf G1 = (V1 , E1 ) disebut suatu subgraf
dari G, jika V1 ⊂ V , E1 ⊂ E dan untuk setiap sisi (vi , vj ) ∈ E1, titik-titik
vi , vj ∈ V . Suatu subgraf G1 disebut komplit, jika terdapat suatu sisi untuk setiap
pasangan titik. Faktanya, clique adalah subgraf komplit, yang berarti bahwa di
dalam clique, setiap anggotanya mempunyai ikatan langsung satu sama lain atau
Universitas Sumatera Utara

17
antar titik.
Suatu clique dikatakan maksimal, jika tidak mengandung clique yang lain.
Jumlah clique dalam suatu graf sama dengan kardinalitas dari clique terbesar
dalam sutu graf G dan diperoleh dengan menyelesaikan maksimum clique dari
masalah NP-hard.

Universitas Sumatera Utara