26 simjac = |
Ω
x
∩Ω
x
|| Ω
x
|+| Ω
y
|-| Ω
x
∩Ω
x
| 2.6
Dengan ketentuan bahwa | Ω
x
∩Ω
x
| ≤ |Ω
x
| dan | Ω
x
∩Ω
x
| ≤ |Ω
y
|. Pengukuran similaritas melibatkan tetapan Jaccard khususnya atau umumnya
ko-okkurensi digunakan untuk mendapatkan secara semantik makna antara objek- objek yang mungkin terwakili di dalam media sosial sebagaimana Web. Pengukuran
similaritas ini dapat membangun model jaringan semantik seperti hubungan yang dinyatakan antara pendekatan analisis [PA] dan [FE] berdasarkan studi literatur
pada 2.4.2 di atas, atau hubungan seperti Gambar 2.1 Cilibrasi Vitányi, 2007. Gambar tersebut menjelaskan jika terjadi hubungan banyak butir PA dengan salah
satu FE maka akan ditentukan titik antara secara kombinasi, dan dipilih salah satu kombinasi menurut urutan yang ada. Dengan demikian hubungan PA1 dengan FE5
melintasi tiga titik, yaitu 1, 2 dan 3, sedangkan hubungan antara PA4 dan FE1 melintasi satu titik, yaitu 1. Jadi, untuk mendapatkan gambaran semantik secara
khusus harus melibatkan populasi teks antara PA dan FE.
2.7. Pengujian dan Penilaian
Secara populasi, secara harfiah teks, kata atau istilah ada dalam Web. Web sebagai media sosial menjadi gambaran terhadap perilaku sosial terhadap sesuatu hal yang
berkaitan dengan pribadi ataupun komunitas sosial itu, termasuk tentang sistem informasi. Web sebagai sumber informasi mengandungi dokumen ilmiah sampai
dokumen pribadi yang terletak dalam blog, yang mewakili pribadi, organisasi, sekumpulan orang, atau komunitas sosial tertentu. Namun demikian, alat yang paling
mudah untuk mengakses informasi ini adalah mesin cari, sebagaimana singleton dan doubleton dihasilkan dalam mewakili sesuatu secara statistik.
Mesin cari tidaklah sedikit jumlahnya, di antaranya terdapat Google, Yahoo, Bing, dan sebagainya dengan berbagai keistimewaan yang berbeda pula. Secara
umum, mesin cari mencari informasi baru dari seluruh dunia untuk diindeks dan dijadikan sumber pengetahuan untuk dieksplorasi kemudian. Masing-masing mesin
cari memiliki singleton dan doubleton berbeda besarannya, jadi setiap pengungkapan makna tertentu melibatkan mesin cari memerlukan pengujian dan penilaian.
Universitas Sumatera Utara
27
Tabel 2.1. Tabel kontingensi
Butir Nilai
Jumlah I II III
s
1
u
11
u
12
u
13
Σ
j=1...3
u
1j
s
2
u
21
u
22
u
23
Σ
j=1...3
u
2j
... ... ... ... ... s
n
u
n1
u
n2
u
n3
Σ
j=1...3
u
nj
Jumlah
Σ
i=1...n
u
i1
Σ
i=1...n
u
i2
Σ
i=1...n
u
i3
Σ
i=1...n
Σ
j=1...3
u
ij
2.7.1. Tabel kontingensi Tabel kontingensi mempunyai r jalur dan l lajur, dan dengan derajat kebebasan
dk = r-1l-1. 2.7
Uji χ
2
chi square dilakukan untuk menentukan apakah data yang dihasilkan dari mesin cari yang berbeda saling bergantung atau tidak Matsuo et al., 2007. Misalnya,
untuk tabel kontingensi seperti Tabel 2.1 nilai harapan eks untuk frekuensi data u
11
dapat dihitung seperti berikut:
eksu
11
= Σ
j=1...3
u
1j
Σ
i=1...n
u
i1
Σ
i=1...n
Σ
j=1...3
u
ij
2.8
Demikian juga dengan frekuensi data yang lain, dihitung dengan cara yang sama sehingga nilai dari
χ
2
adalah χ
2
= Σu
ij
-eksu
ij 2
eksu
ij
2.9
2.7.2. Alpha Cronbach α alpha Cronbach merupakan tetapan konsistensi internal yang secara umum
digunakan sebagai penaksir keandalan pengujian terhadap sampel data Cortina, 1993. Misalkan diukur kuantitas yang terdiri dari k komponen:
x = y
1
+ y
2
+ ... + y
k
, 2.10
α Cronbach adalah
Universitas Sumatera Utara
28 α = kk-1 1 - Σ
i=1,...,k
σ
y i
2
σ
x
2
2.11
dengan mana σ
x
2
adalah variansi dari skor total yang diamati sedangkan σ
y
i 2
adalah variansi komponen i untuk sampel y. Variansi dihitung dengan menggunakan
σ
y
2
= 1n Σy-ȳ
2.12
dengan mana ȳ adalah rata-rata. Secara umum, aturan penggunaan α adalah dengan
menggunakan penanda sebagai berikut:
a. α ≥ 0,9: konsistensi internal adalah sangat baik, b. 0,7 ≤ α 0,9: konsistensi internal adalah baik,
c. 0,6 ≤ α 0,7: konsistensi internal diterima, d. 0,5 ≤ α 0,6: konsistensi internal adalah miskin,
e. α 0,5: konsistensi internal tidak diterima.
2.7.3. Recall dan Presisi Secara statistic, recall dan presisi menunjukkan perbandingan antara data percobaaan
dan data survey Croft et al., 2010. Misalkan, terdapat sekumpulan butir data A sebagai percobaan dan sekumpulan butir data B sebagai survei dengan ukuran masing-
masing adalah |A| dan |B|. Andaikan melalui perhitungan diperoleh |A ∩B| untuk
menyatakan hal-hal yang sama, maka penilaian berdasarkan recall dinyatakan dengan
rec = |A ∩B||A|
2.13
sedangkan presisi dapat dinyatakan sebagai
pre = |A ∩B||B|
2.14
dengan ketentuan bahwa |A ∩B| ≤ |A| dan |A∩B| ≤ |B|. Andaikan |AUB| = hitungan dari
A ditambah B atau hitA+B sedangkan hitA = |A| dan hitB = |B|, maka recall dan presisi masing-masing dapat dinyatakan sebagai berikut:
Universitas Sumatera Utara
29 rec = hitAhitA+B
2.15 dan
pre = hitBhitA+B . 2.16
Universitas Sumatera Utara
BAB 3 METODE PENELITIAN