Pengujian dan Penilaian TINJAUAN PUSTAKA

26 simjac = | Ω x ∩Ω x || Ω x |+| Ω y |-| Ω x ∩Ω x | 2.6 Dengan ketentuan bahwa | Ω x ∩Ω x | ≤ |Ω x | dan | Ω x ∩Ω x | ≤ |Ω y |. Pengukuran similaritas melibatkan tetapan Jaccard khususnya atau umumnya ko-okkurensi digunakan untuk mendapatkan secara semantik makna antara objek- objek yang mungkin terwakili di dalam media sosial sebagaimana Web. Pengukuran similaritas ini dapat membangun model jaringan semantik seperti hubungan yang dinyatakan antara pendekatan analisis [PA] dan [FE] berdasarkan studi literatur pada 2.4.2 di atas, atau hubungan seperti Gambar 2.1 Cilibrasi Vitányi, 2007. Gambar tersebut menjelaskan jika terjadi hubungan banyak butir PA dengan salah satu FE maka akan ditentukan titik antara secara kombinasi, dan dipilih salah satu kombinasi menurut urutan yang ada. Dengan demikian hubungan PA1 dengan FE5 melintasi tiga titik, yaitu 1, 2 dan 3, sedangkan hubungan antara PA4 dan FE1 melintasi satu titik, yaitu 1. Jadi, untuk mendapatkan gambaran semantik secara khusus harus melibatkan populasi teks antara PA dan FE.

2.7. Pengujian dan Penilaian

Secara populasi, secara harfiah teks, kata atau istilah ada dalam Web. Web sebagai media sosial menjadi gambaran terhadap perilaku sosial terhadap sesuatu hal yang berkaitan dengan pribadi ataupun komunitas sosial itu, termasuk tentang sistem informasi. Web sebagai sumber informasi mengandungi dokumen ilmiah sampai dokumen pribadi yang terletak dalam blog, yang mewakili pribadi, organisasi, sekumpulan orang, atau komunitas sosial tertentu. Namun demikian, alat yang paling mudah untuk mengakses informasi ini adalah mesin cari, sebagaimana singleton dan doubleton dihasilkan dalam mewakili sesuatu secara statistik. Mesin cari tidaklah sedikit jumlahnya, di antaranya terdapat Google, Yahoo, Bing, dan sebagainya dengan berbagai keistimewaan yang berbeda pula. Secara umum, mesin cari mencari informasi baru dari seluruh dunia untuk diindeks dan dijadikan sumber pengetahuan untuk dieksplorasi kemudian. Masing-masing mesin cari memiliki singleton dan doubleton berbeda besarannya, jadi setiap pengungkapan makna tertentu melibatkan mesin cari memerlukan pengujian dan penilaian. Universitas Sumatera Utara 27 Tabel 2.1. Tabel kontingensi Butir Nilai Jumlah I II III s 1 u 11 u 12 u 13 Σ j=1...3 u 1j s 2 u 21 u 22 u 23 Σ j=1...3 u 2j ... ... ... ... ... s n u n1 u n2 u n3 Σ j=1...3 u nj Jumlah Σ i=1...n u i1 Σ i=1...n u i2 Σ i=1...n u i3 Σ i=1...n Σ j=1...3 u ij 2.7.1. Tabel kontingensi Tabel kontingensi mempunyai r jalur dan l lajur, dan dengan derajat kebebasan dk = r-1l-1. 2.7 Uji χ 2 chi square dilakukan untuk menentukan apakah data yang dihasilkan dari mesin cari yang berbeda saling bergantung atau tidak Matsuo et al., 2007. Misalnya, untuk tabel kontingensi seperti Tabel 2.1 nilai harapan eks untuk frekuensi data u 11 dapat dihitung seperti berikut: eksu 11 = Σ j=1...3 u 1j Σ i=1...n u i1 Σ i=1...n Σ j=1...3 u ij 2.8 Demikian juga dengan frekuensi data yang lain, dihitung dengan cara yang sama sehingga nilai dari χ 2 adalah χ 2 = Σu ij -eksu ij 2 eksu ij 2.9 2.7.2. Alpha Cronbach α alpha Cronbach merupakan tetapan konsistensi internal yang secara umum digunakan sebagai penaksir keandalan pengujian terhadap sampel data Cortina, 1993. Misalkan diukur kuantitas yang terdiri dari k komponen: x = y 1 + y 2 + ... + y k , 2.10 α Cronbach adalah Universitas Sumatera Utara 28 α = kk-1 1 - Σ i=1,...,k σ y i 2 σ x 2 2.11 dengan mana σ x 2 adalah variansi dari skor total yang diamati sedangkan σ y i 2 adalah variansi komponen i untuk sampel y. Variansi dihitung dengan menggunakan σ y 2 = 1n Σy-ȳ 2.12 dengan mana ȳ adalah rata-rata. Secara umum, aturan penggunaan α adalah dengan menggunakan penanda sebagai berikut: a. α ≥ 0,9: konsistensi internal adalah sangat baik, b. 0,7 ≤ α 0,9: konsistensi internal adalah baik, c. 0,6 ≤ α 0,7: konsistensi internal diterima, d. 0,5 ≤ α 0,6: konsistensi internal adalah miskin, e. α 0,5: konsistensi internal tidak diterima. 2.7.3. Recall dan Presisi Secara statistic, recall dan presisi menunjukkan perbandingan antara data percobaaan dan data survey Croft et al., 2010. Misalkan, terdapat sekumpulan butir data A sebagai percobaan dan sekumpulan butir data B sebagai survei dengan ukuran masing- masing adalah |A| dan |B|. Andaikan melalui perhitungan diperoleh |A ∩B| untuk menyatakan hal-hal yang sama, maka penilaian berdasarkan recall dinyatakan dengan rec = |A ∩B||A| 2.13 sedangkan presisi dapat dinyatakan sebagai pre = |A ∩B||B| 2.14 dengan ketentuan bahwa |A ∩B| ≤ |A| dan |A∩B| ≤ |B|. Andaikan |AUB| = hitungan dari A ditambah B atau hitA+B sedangkan hitA = |A| dan hitB = |B|, maka recall dan presisi masing-masing dapat dinyatakan sebagai berikut: Universitas Sumatera Utara 29 rec = hitAhitA+B 2.15 dan pre = hitBhitA+B . 2.16 Universitas Sumatera Utara

BAB 3 METODE PENELITIAN