Representasi Semantik TINJAUAN PUSTAKA

23 w. [FFw] Sistem efektif Systems are effective. x. [FFx] Secara keseluruhan puas dengan sistem Overall, satisfied with systems. Sedangkan faktor sekunder berasal dari faktor organisasi dan perencanaan sistem informasi seperti diuraikan pada bagian terdahulu. Namun demikian, selain faktor teknis seperti PA1 sampai PA2 dalam perencanaan sistem informasi terdapat situasi organisasi sebagai fitur-fitur yang dapat dikenali seperti dirangkumkan sebagai berikut: a. [FE1] Mengatasi situasi organisasi yang kompleks address complex enterprise situation. b. [FE2] Mendukung analisis banyak tingkat support multiple level analysis. c. [FE3] Mendukung pemodelan data informasi support information data modeling. d. [FE4] Memiliki landasaan teoritis have sound theoretical basis. e. [FE5] Menentukan kebutuhan organisasi yang ada determine existing enterprise requirements. f. [FE6] Menentukan kebutuhan berpotensi dan akan datang determine future potensial requirements.

2.6. Representasi Semantik

Kata atau frasa kata yang dikenali secara umum sebagai istilah secara harfiah mewakili sebarang objek yang berkaitan dengan istilah itu Nasution, 2011a. Suatu istilah dapat dinotasikan sebagai t x = {w 1 w 2 …w k } untuk objek x, k adalah banyak kata yang membangun istilah t x . Secara umum, istilah mewakili dokumen, yaitu kumpulan kata d = {w 1 , w 2 , …, w n }, dan setiap kata dalam dokumen secara statistik mempunyai bobot probabilitas seperti berikut Nasution dan Noah, 2011: p w = 1n 2.1 Universitas Sumatera Utara 24 dan n adalah banyak kata dalam dokumen d. Namun, berdasarkan kosakata diperoleh pw = Σ w dalam d p w 2.2 Berdasarkan persamaan 2.1, untuk m dokumen dalam kumpulan dokumen D = {d 1 ,d 2 ,…,d m } diperoleh probabilitas setiap kata seperti berikut: p wd = 1nm 2.3 sedangkan bobot untuk kosakata w dalam kumpulan dokumen adalah pw = Σ w dalam D p wd 2.4 2.6.1. Similaritas kosinus Secara semantik, probabilitas kata sebagai vektor dalam kumpulan dokumen yang dapat memberikan makna tertentu bagi dokumen atau objek yang diwakili oleh istilah dimaksudkan. Andaikan dari dua kumpulan dokumen diperoleh vektor |w 1 | = [w 1 ,w 2 ,...,w l1 ], vektor |w 2 | = [w 1 ,w 2 ,...,w l2 ], dan vektor |w 1 ∩w 2 | untuk kata yang sama antara {w 1 ,…,w l1 } dan {w 1 ,…,w l2 }, maka similaritas antara dokumen atau antara kumpulan dokumen dapat dihitung dengan menggunakan similaritas kosinus berikut Deza Deza, 2007: simkos = |w 1 ∩w 2 |sqrt|w 1 ||w 2 | 2.5 Dengan syarat bahwa |w 1 ∩w 2 | ≤ |w 1 | dan |w 1 ∩w 2 | ≤ |w 2 |. Secara semantik, similaritas kosinus berfungsi untuk mencari kesamaan makna berdasarkan vektor yang dihasilkan melalui kumpulan dokumen. 2.6.2. Singleton dan doubleton Web adalah kumpulan dokumen Web, yang terdiri dari laman-laman Web. Andaikan kumpulan laman-laman Web ω i sebagai dokumen dinotasikan sebagai Ω = {ω i = 1,…,pt} dengan mana pt adalah waktu pengukuran, jadi kardinalitas dari | Ω| = pt, Universitas Sumatera Utara 25 nilai tergantung kepada waktu pengukuran, disebabkan oleh dinamika laman Web terus tumbuh sebagai media sosial yang mewakili gambaran sosial secara keseluruhan. Untuk mewakili gambaran sosial secara populasi teks dari Web dapat dilakukan pengukuran melalui singleton Nasution, 2012 dan doubleton Nasution, 2013, yaitu a. Singleton adalah peristiwa atau okkurensi istilah t x dalam Ω ditulis Ω x , yaitu kumpulan dokumen yang berkaitan dengan istilah t x . Nilai singleton untuk t x adalah banyaknya dokumen yang berkaitan dengan istilah t x , yang dikenali juga sebagai hit count dan secara statistik ditulis sebagai | Ω x |. b. Doubleton adalah ko-okkurensi atau peristiwa dari dua istilah t x dan t y secara bersamaan dalam Ω ditulis Ω x ∩Ω x untuk t x ≠ t y . Nilai doubleton untuk dua istilah ini adalah hit count dan secara statistik ditulis sebagai | Ω x ∩Ω x |. Gambar 2.1. Jaringan semantik asumsi antara PA dan FE. Untuk mendapatkan hubungan semantik antara dua istilah berbeda dapat digunakan tetapan Jaccard Deza Deza, 2007 sebagai berikut: Universitas Sumatera Utara 26 simjac = | Ω x ∩Ω x || Ω x |+| Ω y |-| Ω x ∩Ω x | 2.6 Dengan ketentuan bahwa | Ω x ∩Ω x | ≤ |Ω x | dan | Ω x ∩Ω x | ≤ |Ω y |. Pengukuran similaritas melibatkan tetapan Jaccard khususnya atau umumnya ko-okkurensi digunakan untuk mendapatkan secara semantik makna antara objek- objek yang mungkin terwakili di dalam media sosial sebagaimana Web. Pengukuran similaritas ini dapat membangun model jaringan semantik seperti hubungan yang dinyatakan antara pendekatan analisis [PA] dan [FE] berdasarkan studi literatur pada 2.4.2 di atas, atau hubungan seperti Gambar 2.1 Cilibrasi Vitányi, 2007. Gambar tersebut menjelaskan jika terjadi hubungan banyak butir PA dengan salah satu FE maka akan ditentukan titik antara secara kombinasi, dan dipilih salah satu kombinasi menurut urutan yang ada. Dengan demikian hubungan PA1 dengan FE5 melintasi tiga titik, yaitu 1, 2 dan 3, sedangkan hubungan antara PA4 dan FE1 melintasi satu titik, yaitu 1. Jadi, untuk mendapatkan gambaran semantik secara khusus harus melibatkan populasi teks antara PA dan FE.

2.7. Pengujian dan Penilaian