Visualisasi dan Navigasi Semantik pada Subjek Tesis IPB Menggunakan Peluang Bersyarat

VISUALISASI DAN NAVIGASI SEMANTIK PADA
SUBJEK TESIS IPB MENGGUNAKAN
PELUANG BERSYARAT

CHUSNUL ARIFIN RASUANDAR

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2013

PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Visualisasi dan
Navigasi Semantik pada Subjek Tesis IPB Menggunakan Peluang Bersyarat
adalah benar karya saya dengan arahan dari komisi pembimbing dan belum
diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber
informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak
diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam
Daftar Pustaka di bagian akhir skripsi ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, Agustus 2013
Chusnul Arifin Rasuandar
NIM G64090113

ABSTRAK
CHUSNUL ARIFIN RASUANDAR. Visualisasi dan Navigasi Semantik pada
Subjek Tesis IPB Menggunakan Peluang Bersyarat. Dibimbing oleh FIRMAN
ARDIANSYAH dan BADOLLAHI MUSTAFA.
Pencarian dan penelusuran dokumen menggunakan istilah subjek pada
dokumen merupakan cara yang efektif dalam mendapatkan informasi penelitian
yang ada di IPB, misalnya dokumen tesis. Hasil pencarian dan penelusuran akan
menjadi lebih interaktif jika ditambahkan visualisasi informasi. Penelitian ini
bertujuan untuk membangun sistem penelusuran dokumen berdasarkan subjek
pada tesis IPB dan memvisualisasikan keterhubungan antaristilah subjeknya.
Dilakukan proses stemming pada istilah subjek menggunakan algoritme Porter
Stemmer dan selanjutnya dibuat daftar istilah subjek menggunakan teknik
thresholding. Analisis dilakukan terhadap nilai threshold untuk menentukan nilai
threshold yang menghasilkan waktu komputasi yang efisien dan jumlah istilah

subjek yang optimal. Hasil penelitian menunjukkan nilai threshold yang baik ialah
4 dengan waktu komputasi 334 detik dan 381 istilah subjek. Selanjutnya, dihitung
besar peluang keterhubungan antaristilah subjeknya menggunakan rumus peluang
bersyarat untuk kemudian dirancang bentuk visualisasinya.
Kata kunci: visualisasi, subjek tesis, penelusuran dokumen, peluang bersyarat,
Institut Pertanian Bogor

ABSTRACT
CHUSNUL ARIFIN RASUANDAR. Visualization and Semantic Navigation on
Bogor Agricultural University (IPB) thesis subject using conditional probability.
Supervised by FIRMAN ARDIANSYAH and BADOLLAHI MUSTAFA.
Searching and browsing research documents, such as thesis, using subject
terms in document is an effective way to obtain information about existing
research in IPB. These two tasks results will be more interactive when a
visualization module is added. This research aims to build a document browsing
system based on subjects of the IPB’s thesis metadata and to visualize the
relations among subject terms. Subject terms are stemmed using the Porter
Stemmer algorithm and the list of subject term are created using the thresholding
technique. Analysis on threshold values is performed to determine the threshold
level which gives efficient computation time and the optimal number of subject

terms. The experimental results show that the threshold value of 4 provides the
computation time of 334 seconds and results in 381 subject terms. Furthermore,
the probabilities of subject terms are calculated using the conditional probability
formula and a visualization module is designed.
Keywords: visualization, thesis subjects, documents browsing, conditional
probability, Bogor Agricultural University

VISUALISASI DAN NAVIGASI SEMANTIK PADA
SUBJEK TESIS IPB MENGGUNAKAN
PELUANG BERSYARAT

CHUSNUL ARIFIN RASUANDAR

Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer
pada
Departemen Ilmu Komputer

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2013

Penguji:
Irman Hermadi, Phd

Judul Skripsi: Visualisasi dan Navigasi Semantik pad a Subjek Tesis IPB
Menggunakan Peluang Bersyarat
Nama
: Chusnul Arifin Rasuandar
: G64090113
NIM

Disetujui oleh

エゥャ 。HI セ@
Finnan Ardiansyah, SKom MSi
Pembimbing I


Tanggal Lulus:

2 6 AUG 2013

dイセオウエ。ヲL

MLib
Pembimbing II

Judul Skripsi : Visualisasi dan Navigasi Semantik pada Subjek Tesis IPB
Menggunakan Peluang Bersyarat
Nama
: Chusnul Arifin Rasuandar
NIM
: G64090113

Disetujui oleh

Firman Ardiansyah, SKom MSi

Pembimbing I

Drs Badollahi Mustafa, MLib
Pembimbing II

Diketahui oleh

Dr Ir Agus Buono, MSi MKom
Ketua Departemen

Tanggal Lulus:

PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas
segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang
dipilih dalam penelitian yang dilaksanakan sejak bulan Desember 2012 ini ialah
visualisasi informasi, dengan judul Visualisasi dan Navigasi Semantik pada
Subjek Tesis IPB Menggunakan Peluang Bersyarat.
Dalam pelaksanaan tugas akhir ini banyak pihak yang selalu memberikan
dukungan dan bantuan. Oleh karena itu, penulis ingin menyampaikan terima kasih

kepada:
1
Papa Albert Zultanair, Mama Masayu Tuti Hawa, Adit, dan Poppy yang
senantiasa memberikan dukungan, kasih sayang, doa, dan semangat yang
luar biasa.
2
Bapak Firman Ardiansyah, SKom MSi dan Bapak Drs Badollahi Mustafa,
MLib selaku dosen pembimbing yang selalu memberikan bimbingan dan
nasihat selama pengerjaan tugas akhir.
3
Bapak Irman Hermadi, Phd selaku dosen penguji atas kesediaannya sebagai
penguji pada ujian tugas akhir.
4
Toto Haryanto, SKom Msi selaku dosen pembimbing akademik yang telah
membimbing penulis selama masa perkuliahan.
5
Teman-teman satu bimbingan: Bimo, Nadya, Riandi, Nathan, dan Kevin
yang senantiasa saling memberikan semangat dan bersedia menjadi teman
diskusi.
6

Fahri, Erwin, Haqqi, Doddy, Rangga, Hanna, Iis, Fara, Nurul, Rini, Wulan,
Luksi, dan rekan-rekan Ilkom 46 yang selalu memberikan dukungan dan
bantuan satu sama lain.
Semoga karya ilmiah ini bermanfaat.
Bogor, Agustus 2013
Chusnul Arifin Rasuandar

DAFTAR ISI
DAFTAR TABEL

vi

DAFTAR GAMBAR

vi

DAFTAR LAMPIRAN

vi


PENDAHULUAN

1

Latar Belakang

1

Perumusan Masalah

2

Tujuan Penelitian

2

Manfaat Penelitian

2


Ruang Lingkup Penelitian

3

METODE

3

Pengumpulan Data

3

Pembersihan Data

4

Indexing

4


Perhitungan Peluang Antaristilah

4

Perancangan Visualisasi

6

Perancangan Antarmuka

6

HASIL DAN PEMBAHASAN

6

Pengumpulan Data

6

Pembersihan Data

7

Indexing

8

Perhitungan Peluang Antaristilah

12

Perancangan Visualisasi

13

Perancangan Antarmuka

14

SIMPULAN DAN SARAN

15

Simpulan

15

Saran

16

DAFTAR PUSTAKA

16

LAMPIRAN

18

RIWAYAT HIDUP

21

DAFTAR TABEL
1
2
3
4
5

Matriks perhitungan banyak istilah dalam satu subjek
Matriks perhitungan peluang antaristilah
Contoh istilah yang mengandung anomali
Contoh istilah yang sudah dikenai proses stemming
Contoh nilai peluang

5
5
8
9
12

DAFTAR GAMBAR
1
2
3
4
5
6
7
8
9

Metode penelitian
Format INDOMARC CDS/ISIS
Contoh record data yang mengalami kesalahan parsing
Grafik keterhubungan jumlah data dengan waktu komputasi
Grafik keterhubungan jumlah data dengan jumlah istilah yang
dihasilkan
Grafik keterhubungan jumlah data dengan jumlah pasangan subjek
yang lolos threshold
Visualisasi keterhubungan istilah subjek forestry
Tampilan antarmuka bagian visualisasi
Tampilan antarmuka bagian back-end processing

3
6
7
10
10
11
13
15
15

DAFTAR LAMPIRAN
1 Contoh record yang mengandung kesalahan pengetikan
2 Hasil perhitungan nilai threshold terhadap waktu komputasi, jumlah
pasangan subjek yang lolos threshold dan jumlah subjek yang
dihasilkan
3 Perhitungan persentase keragaman istilah subjek

17

18
19

PENDAHULUAN
Latar Belakang
Pencarian (searching) dan penelusuran (browsing) dokumen merupakan
kegiatan yang sering terjadi di perpustakaan. Dalam proses mendapatkan
informasi, pencarian dan penelusuran dokumen pada suatu koleksi merupakan dua
hal yang berbeda. Pencarian adalah proses memasukkan query ke dalam suatu
search engine yang menghasilkan dokumen-dokumen yang sudah diurutkan
berdasarkan tingkat kecocokan dengan query. Penelusuran adalah proses melihat
suatu halaman secara berurutan dengan menggunakan hyperlink (Olston & Chi
2003).
Pencarian dan penelusuran dokumen merupakan kegiatan yang mudah untuk
mendapatkan suatu informasi. Akan tetapi, keduanya memiliki keterbatasan.
Menurut Manber et al. (2007), pencarian terkadang sulit dilakukan oleh pengguna
yang belum menentukan query yang akan dimasukkannya, sedangkan penelusuran
dapat membuat konten dalam koleksi menjadi lebih hidup sehingga pengguna
yang belum menentukan query akan menjadi tertuntun namun membutuhkan
waktu yang lama dalam mendapatkan informasi.
Proses pencarian berdasarkan subjek atau topik pada metadata dokumen
merupakan cara yang efektif jika pengguna ingin mencari dokumen yang sesuai
dengan topik yang diinginkan. Hasil pencarian dan penelusuran tersebut akan
lebih interaktif jika ditambahkan visualisasi informasi. Menurut Chase et al.
(1998), visualisasi dapat mendukung interaksi yang efisien dan efektif untuk
beragam pekerjaan kognitif pengguna seperti menganalisis, meringkas, dan
menarik kesimpulan atas informasi yang didapat. Akan tetapi, kebutuhan
pengguna dalam mencari infomasi semakin meluas dan rumit sehingga visualisasi
sederhana tidak cukup untuk mengatasi masalah tersebut. Terkadang informasi
keterhubungan antardokumen tidak terilustrasikan dengan baik sehingga
pengguna sulit untuk menelusuri informasi dari satu dokumen ke dokumen
lainnya (Kboubi et al. 2010). Oleh karena itu, perlu dibuat sistem yang
memudahkan pengguna untuk mendapatkan informasi yang diinginkan dengan
menelusuri keterhubungan antardokumen.
Pada penelitian yang sudah dilakukan oleh Rizky (2010), sistem pencarian
dokumen berdasarkan subjek sudah dibuat dengan basis desktop serta
penambahan fitur visualisasi keterhubungan antaristilah (term) dari subjek. Sistem
tersebut menggunakan perhitungan peluang bersyarat untuk memeringkat hasil
pencarian dari query yang dimasukkan oleh pengguna dan hasil tersebut
ditampilkan dalam visualisasi.
Sistem tersebut sudah berjalan dengan baik akan tetapi masih memiliki
kelemahan. Kelemahannya yaitu waktu eksekusi sistem dianggap kurang efisien.
Setelah query dimasukkan oleh pengguna, sistem menjalankan proses perhitungan
peluang bersyarat dengan koleksi data yang sangat banyak sehingga waktu
eksekusinya menjadi tinggi. Kelemahan tersebut memang sudah berlaku pada
sistem pencarian secara umum karena untuk melakukan pemeringkatan, sistem
akan meminta pengguna memasukkan query.

2
Selain waktu eksekusi, sistem juga memiliki kelemahan lain, yakni
melakukan proses pemenggalan subjek berdasarkan kata sehingga terdapat
beberapa frase di dalam koleksi dokumen yang dipenggal dan menghasilkan dua
atau lebih kata yang berbeda. Hal ini dapat menimbulkan kejanggalan pada hasil
yang akan divisualisasikan. Misalnya, frase Jawa Barat nantinya akan dipenggal
menjadi kata Jawa dan kata Barat. Jika terdapat istilah yang seharusnya
berhubungan dengan frase Jawa Barat, misalnya Animal, maka hasilnya adalah
Animal-Jawa dan Animal-Barat. Hasil keterhubungan antara Animal dengan
Barat inilah yang dikatakan janggal. Oleh karena itu, diperlukan penelitian untuk
mengurangi kelemahan-kelemahan dari sistem tersebut.
Pada penelitian ini, sistem akan dibangun untuk penelusuran istilah subjek
tidak untuk pencarian sehingga sistem tidak perlu melakukan pemeringkatan hasil
query. Selain itu, perhitungan peluang bersyarat dan pembuatan daftar istilah
untuk query dilakukan pada saat proses pembuatan koleksi data (indexing). Jadi,
pada saat pengguna memasukkan query untuk penelusuran, sistem hanya
menampilkan hasil visualisasi berdasarkan nilai peluang yang sudah dihitung
sebelumnya.

Perumusan Masalah
Pada penelitian ini, akan dibuat sistem penelusuran yang diharapkan dapat
mengatasi keterbatasan sistem pencarian secara umum. Masalah yang mungkin
menjadi perhatian dalam penelitian ini adalah:
1
Bagaimana membangun struktur sistem yang efektif sehingga hasil yang
ditampilkan tidak menimbulkan kejanggalan dan waktu eksekusinya
menjadi efisien?
2
Kapan dilakukannya perhitungan peluang bersyarat?

Tujuan Penelitian
Tujuan penelitian ini ialah membangun sistem penelusuran dokumen
berdasarkan subjek yang dipisahkan berdasarkan frase dan menampilkan
visualisasi keterhubungan antaristilahnya.

Manfaat Penelitian
Manfaat penelitian ini ialah membantu pengguna dalam mendapat ide dan
topik untuk melakukan pencarian dokumen yang lebih spesifik. Dengan adanya
visualisasi, nantinya pengguna akan menjadi lebih mudah menelusuri
keterhubungan antardokumen tesis IPB melalui keterhubungan subjek tesis.
Selain itu, sistem yang akan dibuat diharapkan dapat menunjukkan kekayaan
intelektual dan penelitian yang dilakukan oleh IPB.

3
Ruang Lingkup Penelitian
1
2
3

Ruang lingkup penelitian ini ialah:
Data yang digunakan adalah data tesis perpustakaan pusat IPB tahun 19632013 dengan format CDS/ISIS.
Pembuatan index istilah subjek berdasarkan frase bukan kata.
Proses perhitungan peluang hanya untuk dua istilah, yaitu istilah yang akan
ditelusuri dan istilah yang ada di koleksi dokumen (daftar istilah).

METODE
Pengumpulan Data
Secara umum, metode penelitian ini meliputi pengumpulan data,
pembersihan data, tahap indexing, perhitungan peluang antaristilah, perancangan
visualisasi, dan perancangan antarmuka. Tahapan metode penelitian ini dapat
dilihat pada Gambar 1.
Pada penelitian ini, data yang digunakan adalah metadata tesis IPB tahun
1963 sampai tahun 2013. Data diambil dari perpustakaan pusat IPB dalam bentuk
data CDS/ISIS (Computerised Documentation Service/Integrated Set Information
Systems). CDS/ISIS adalah sistem temu kembali dan penyimpanan informasi yang
didesain secara spesifik untuk manajemen terkomputerisasi dari database nonnumerik yang terstruktur (UNESCO 2004).
Format metadata di dalam data CDS/ISIS tersebut mengikuti aturan format
INDOMARC (Indonesia-Machine Readable Cataloging). Format INDOMARC
merupakan implementasi dari International Standar Organization (ISO) Format
ISO 2709 untuk Indonesia, sebuah format untuk pertukaran informasi bibliografis
melalui magnetic tape, compact disk, atau media machine-readable lainnya.
Informasi bibliografis secara umum mencakup pengarang, judul, subjek, catatan,
data penerbitan, dan deskripsi fisik (PNRI 2005).
Data dalam CDS/ISIS tersebut nantinya akan diekspor ke dalam format
CSV (Comma Separated Values) atau XLS (Microsoft Excel Spreadsheet) terlebih
dahulu sebelum dilakukan proses pembersihan data.

Gambar 1 Metode penelitian

4
Pembersihan Data
Pembersihan data dilakukan untuk membenahi data hasil ekspor dari bentuk
data CDS/ISIS menjadi CSV. Data hasil ekspor akan memiliki field yang tidak
terisi. Data yang akan digunakan dalam penelitian ini haruslah berupa data CSV
yang memiliki field yang lengkap atau terisi semua. Selain bagian field yang
lengkap, data yang digunakan harus memiliki jumlah istilah yang cukup pada field
subjek di dalam data CSV tersebut. Dalam penelitian ini, ditetapkan istilah
minimum dalam satu data ialah dua istilah.

Indexing
Proses indexing dilakukan untuk membuat daftar istilah yang diambil dari
field subjek pada data XLS. Untuk mengambil istilah-istilah tersebut, diperlukan
proses parsing pada data XLS menggunakan script PHP ke dalam database
MySQL. Setelah proses parsing dilakukan, diperoleh kumpulan istilah subjek
metadata tesis.
Kumpulan istilah subjek tersebut akan digunakan untuk membuat inverted
index. Inverted index adalah index yang selalu memetakan dari suatu istilah
(terms) ke dalam bagian dokumen dimana istilah tersebut berada (Manning et al.
2008). Index tersebut dapat digunakan untuk menunjukkan dokumen yang
direpresentasikan oleh kumpulan istilah tersebut.

Perhitungan Peluang Antaristilah
Proses dimulai dengan menghitung peluang masing-masing istilah terhadap
jumlah dokumen secara keseluruhan. Proses perhitungannya sesuai dengan rumus
berikut:

P a
dengan ∑
adalah jumlah istilah a dalam kumpulan istilah keseluruhan dan
adalah jumlah dokumen secara keseluruhan.
Setelah itu, dilakukan perhitungan banyaknya istilah satu dengan istilah
yang lainnya yang berada dalam satu subjek metadata tesis. Proses
perhitungannya dapat digambarkan dengan matriks seperti pada Tabel 1, dengan
adalah istilah a,
adalah istilah b dan ∑ a
adalah jumlah a dan yang
a
berada dalam satu subjek metadata tesis.
Setelah itu dilakukan perhitungan peluang antaristilah menggunakan rumus
perhitungan peluang bersyarat. Proses perhitungannya dapat digambarkan dengan
matriks seperti pada Tabel 2, dengan rumus peluang bersyarat sebagai berikut:

dengan

P( a | )

P

a

P

5
P( a



)

a

Peluang antaristilah dihitung untuk menunjukkan kedekatan satu istilah
dengan istilah lainnya. Misalkan istilah a dan istilah b memiliki peluang yang
besar, maka dapat dikatakan bahwa istilah a dekat dengan istilah b atau banyak
tesis IPB yang memiliki subjek dengan pasangan istilah tersebut.
Tabel 1 Matriks perhitungan banyak istilah dalam satu subjek
Istilah

fa

fa

-

fb
fc

c

fb

fc

a

a

a

-

a

c

c
c

-

Dengan melihat Tabel 1, maka proses perhitungan banyaknya istilah fa dan fb
dalam satu subjek tesis adalah dengan menggunakan rumus ∑ a
, dengan a
adalah istilah a dan adalah istilah b. Untuk hasil perhitungan banyaknya istilah
yang sama dalam satu subjek tesis (misal fa dan fa) yang berarti tesis hanya
berjumlah satu istilah subjek, dianggap tidak ada karena dalam penelitian ini tesis
yang digunakan harus memiliki minimal dua buah istilah subjek.
Tabel 2 Matriks perhitungan peluang antaristilah
Istilah

fa

fa

-

fb
P

fb

P

a

fc

P

c a

P

fc

a

P

a c

-

P

c

c

-

Dengan melihat Tabel 2, maka proses perhitungan peluang istilah fa dengan
istilah fb adalah dengan menggunakan rumus P a
dengan adalah istilah yang
akan ditelusuri keterhubungannya dan a adalah istilah yang mempunyai
keterhubungan dengan istilah yang ditelusuri.

6
Perancangan Visualisasi
Perancangan visualisasi dimulai dengan memilih bentuk dasar dari
visualisasinya, contohnya graph, tree, atau vector. Pada penelitian ini, bentuk
dasar yang dipilih adalah graph dengan bentuk seperti matahari. Graph tersebut
mempunyai dua node, yaitu parent dan child. Node parent merupakan node yang
merepresentasikan istilah yang akan ditelusuri keterhubungannya sedangkan node
child merupakan node yang merepresentasikan istilah yang mempunyai
keterhubungan dengan istilah yang ditelusuri.
Visualisasi dilakukan dengan mempertimbangkan besaran nilai peluang dari
istilah yang akan ditelusuri. Perbedaan besaran nilai peluang dapat digambarkan
dengan dengan membedakan warna atau ukuran node child.

Perancangan Antarmuka
Penambahan fitur interaksi dalam antarmuka dapat memudahkan pengguna
dalam menggunakan aplikasi. Contoh interaksi yang akan terjadi selama
penggunaan aplikasi ialah proses pemilihan istilah yang akan ditelusuri
keterhubungannya (node parent) dan proses penelusuran keterhubungan
antaristilah melalui hasil visualisasi. Fitur interaksi yang akan dibuat dapat berupa
search box untuk pencarian istilah pada daftar istilah atau penambahan animasi
pada hasil visualisasi.

HASIL DAN PEMBAHASAN
Pengumpulan Data
Data yang digunakan dalam penelitian ini adalah metadata tesis IPB mulai
dari tahun 1963 sampai 2013. Data tersebut sudah terkumpul dalam format
CDS/ISIS yang dapat dilihat menggunakan program Winisis. Data yang
terkumpul berjumlah 12 109. Data tersebut merupakan data CDS/ISIS yang
diambil dari perpustakaan pusat IPB. Format penulisan data tersebut sudah
mengikuti format INDOMARC. Gambar 2 merupakan contoh format
INDOMARC dari data tersebut.

Gambar 2 Format INDOMARC CDS/ISIS

7
Format INDOMARC dalam data CDS/ISIS tersebut memiliki beberapa tag
yang menunjukkan kode atribut dari suatu data. Sebagai contoh tag 245
merupakan judul dari tesis dan tag 100 merupakan penulis tesis. Dalam penelitian
ini, tag-tag yang akan digunakan adalah tag 245 yang merupakan judul tesis, tag
102 yang merupakan penulis utama tesis, tag 260 yang merupakan tahun terbit
tesis, tag 300 yang merupakan atribut tambahan seperti jumlah halaman dari tesis,
tag 710 yang merupakan departemen asal penulis utama, serta tag 650 yang
merupakan subjek dari tesis dan yang akan menjadi fokus penelitian ini.
Tag 650 memiliki beberapa simbol-simbol tertentu yang membedakan arti
dari subjek, seperti ^a yang berarti subjek besar (umum), ^x berarti subjek kecil
(khusus), ^y berarti tahun yang terkait pada penelitian, dan ^z berarti tempat yang
terkait pada penelitian. Dalam penelitian ini, simbol yang digunakan adalah ^a
dan ^x. Setelah itu, data tersebut dikonversikan ke dalam format XLS
menggunakan operasi print pada program Winisis.

Pembersihan Data
Kumpulan data CDS/ISIS yang sudah dikonversikan ke dalam format XLS
masih mengandung record data yang tidak bersih atau kurang sesuai dengan yang
diinginkan. Oleh karena itu, perlu dilakukan proses pembersihan data, yaitu
menghilangkan record data yang hanya memiliki satu subjek, memperbaiki
record data yang mengalami kesalahan parsing saat proses konversi dari
CDS/ISIS, dan menghilangkan tanda baca.
Data awal yang dikonversikan dari CDS/ISIS berjumlah 12 109 record data.
Setelah menghilangkan record data yang hanya memiliki satu subjek, data
keseluruhan menjadi 9304 record data dan selanjutnya dilakukan penghilangan
tanda baca pada record data. Setelah itu, data sudah dapat dianggap bersih dan
siap untuk diolah. Jumlah data bersih secara keseluruhan berjumlah 9304 record
data.
Akan tetapi, di dalam data bersih tersebut masih mengandung 1499 record
data yang mengalami kesalahan parsing saat proses konversi. Gambar 3
menunjukkan contoh satu field record data yang mengalami kesalahan parsing.
Dari Gambar 3, dapat dikatakan bahwa record data yang mengalami kesalahan
parsing adalah record yang memiliki camel case (karakter lowercase dan
uppercase yang berdekatan) pada datanya. Camel case di sini menunjukkan
bahwa jumlah subjek dari record data tersebut lebih dari satu subjek, misalnya

Gambar 3 Contoh record data yang mengalami kesalahan parsing

8
pada record “ProstaglandinsOestrous cycle” yang memiliki dua subjek, yaitu
“Prostaglandins” dan “Oestrous cycle”. Hal ini terjadi akibat keterbatasan pada
sintaks operasi print pada program Winisis sehingga terjadi kesalahan dalam
memisahkan subjek yang berjumlah lebih dari satu di dalam tag 650^a atau 650^x.
Oleh karena itu, perlu dilakukan perbaikan record data dengan cara
menghilangkan camel case pada record tersebut. Proses penghilangan camel case
dibuat dalam script PHP dan dilakukan pada awal proses indexing berlangsung.
Untuk memudahkan proses penghilangan camel case, perlu dilakukan perbaikan
pada 20 record subjek yang mengandung kesalahan pengetikan seperti pada
Lampiran 1. Perbaikan record tersebut dilakukan secara manual karena jumlah
data hanya sedikit.

Indexing
Proses indexing dimulai dengan mengimpor data XLS ke dalam database
MySQL. Selanjutnya, dilakukan proses penghilangan camel case pada record data
yang mengalami kesalahan parsing. Setelah itu, dibuat daftar istilah berdasarkan
subjek dan dihitung frekuensinya. Perhitungan frekuensi dilakukan untuk
mengetahui jumlah setiap pasang istilah yang ada. Selain itu, perhitungan
dilakukan untuk memeriksa istilah yang mengandung anomali yang mungkin
terjadi akibat kesalahan pengetikan atau perbedaan persepsi pustakawan yang
memberikan subjek tesis. Tabel 3 dapat menunjukkan anomali tersebut.
Dapat dilihat dari Tabel 3, terdapat dua pasangan istilah yang hanya
berjumlah 1, sedangkan pasangan istilah lainnya berjumlah 4 sehingga dapat
dikatakan bahwa dua pasangan istilah tersebut mengandung anomali. Hal ini
disebabkan jumlah tesis kedua istilah tersebut hanya berjumlah 1 yang sangat
memungkinkan adanya suatu kesalahan dalam pengetikan atau perbedaan persepsi
pustakawan dalam memberi subjek tesis. Di lain sisi, tesis yang mengandung
subjek agricultural economics dan agribusiness dianggap tidak ada anomali
karena berjumlah 4 yang artinya sulit dikatakan mengandung kesalahan. Akan
tetapi, sesungguhnya tesis-tesis tersebut bersubjek sama. Karena adanya anomali,
sistem menganggap istilah subjek tersebut menjadi berbeda. Oleh karena itu, perlu
dilakukan tindakan pembenahan istilah subjek yang mengandung anomali.
Tabel 3 Contoh istilah yang mengandung anomali
Subjek1
agricultural economic
agricultural economics
agricultural economy

Subjek2
agribusiness
agribusiness
agribusiness

Jumlah
1
4
1

Tindakan pembenahan istilah tersebut dapat dilakukan dengan dua pilihan,
yaitu dengan memperbaiki istilah yang mengandung anomali menjadi bentuk
istilah subjek yang sesuai atau membuat ketiga istilah tersebut menjadi seragam.
Idealnya, tindakan yang paling tepat ialah memperbaiki istilah yang mengandung
anomali menjadi bentuk istilah subjek yang sesuai, namun diperlukan suatu
pedoman atau kamus istilah untuk membandingkan bentuk yang sesuai dengan

9
bentuk yang tidak sesuai tadi. Karena keterbatasan ini, maka dipilih tindakan yang
kedua, yaitu membuat ketiga istilah tersebut menjadi seragam. Cara sederhana
yang dapat dilakukan untuk menyeragamkan ketiga istilah tersebut ialah dengan
memenggal imbuhan pada istilah tersebut. Salah satu algoritme yang dapat
menghilangkan imbuhan adalah algoritme Porter Stemmer. Oleh karena itu, maka
dilakukan proses stemming pada daftar istilah yang sudah dibuat. Tabel 4
merupakan hasil stemming dari istilah-istilah pada Tabel 3.
Tabel 4 Contoh istilah yang sudah dikenai proses stemming

No
1
2
3
4
5

Subjek1
agricultur econom
agricultur econom
agricultur econom
agricultur econom
agricultur economi

Subjek2
agribusi
agribusi
agribusi
agribusi
agribusi

Pada Tabel 4 dapat terlihat kekurangan dari algoritme Porter Stemmer, yaitu
pada istilah nomor 5. Istilah pada Subjek1 yang mulanya agricultural economy
berubah menjadi agricultural economi bukan agricultural econom sehingga istilah
nomor 5 menjadi berbeda dengan yang istilah lainnya. Oleh karena itu, perlu
dilakukan thresholding jumlah istilah yang bertujuan untuk mengurangi istilahistilah yang kurang sesuai atau tidak seragam dengan istilah-istilah yang ada
seperti istilah agricultural economi. Dalam penelitian ini, nilai threshold perlu
diperhatikan karena akan memengaruhi hasil dari daftar istilah dan waktu
komputasi dari proses indexing.
Pada penelitian ini, dilakukan beberapa kali (trial and error) percobaan
proses indexing menggunakan empat buah koleksi data dengan jumlah data yang
berbeda. Percobaan ini bertujuan melihat keterhubungan antara jumlah data dan
nilai threshold dengan waktu komputasi saat indexing, keterhubungan antara
jumlah data dan nilai threshold dengan jumlah istilah subjek yang dihasilkan,
serta keterhubungan antara jumlah data dan nilai threshold dengan jumlah data
yang lolos threshold. Selain itu, percobaan ini bertujuan menentukan nilai
threshold yang dapat menghasilkan waktu komputasi yang efisien dan jumlah
istilah yang optimal.
Dalam percobaan ini, disiapkan empat buah koleksi data, yaitu data tahun
1963-2013, 1993-2013, 2003-2013, dan 2008-2013 dengan jumlah data masingmasing sebanyak 9304, 7419, 5450 dan 3329 record data. Setelah dilakukan
percobaan dengan menggunakan 10 threshold, maka didapatkan grafik seperti
pada Gambar 4, Gambar 5, dan Gambar 6. Hasil percobaan selengkapnya dapat
dilihat pada Lampiran 2.
Dengan melihat Gambar 4, dapat disimpulkan bahwa semakin besar data
yang akan diindeks, semakin besar pula waktu komputasi yang dihasilkan. Waktu
komputasi sangat tinggi untuk threshold=1 sedangkan untuk threshold=2 dan
seterusnya waktu komputasi menurun. Hal ini terjadi karena tidak ada data yang
tersisihkan dari nilai threshold yang diberikan atau dapat dikatakan bahwa semua
data diindeks secara keseluruhan sehingga waktu komputasi menjadi sangat tinggi.
Akan tetapi, perbedaan tidak begitu terlihat antara waktu komputasi yang

10

Gambar 4 Grafik keterhubungan jumlah data dengan waktu komputasi
dihasilkan threshold=3 sampai threshold=10. Dengan demikian, dapat dikatakan
bahwa nilai threshold tidak mempengaruhi waktu komputasi secara signifikan.
Dengan melihat Gambar 5 dan Gambar 6, dapat disimpulkan bahwa
semakin besar data yang akan diindeks, semakin banyak pula istilah subjek yang
akan dihasilkan dan semakin banyak pasangan subjek yang lolos threshold.
Jumlah istilah semakin menurun seiring bertambahnya nilai threshold. Hal ini
terjadi karena semakin tinggi nilai threshold, semakin banyak pasangan subjek
yang tersisihkan dan tidak mencukupi untuk lolos dari threshold yang ditentukan
sehingga jumlah istilah subjek yang dihasilkan semakin sedikit. Oleh karena itu,
dapat dikatakan bahwa nilai threshold mempunyai pengaruh yang signifikan
terhadap jumlah istilah subjek yang dihasilkan.

Gambar 5 Grafik keterhubungan jumlah data dengan jumlah istilah yang
dihasilkan

11

Gambar 6 Grafik keterhubungan jumlah data dengan jumlah pasangan subjek
yang lolos threshold
Berdasarkan Gambar 4, Gambar 5 dan Gambar 6, dapat dianalisis bahwa
nilai threshold yang dapat menghasilkan waktu komputasi yang efisien berkisar
antara 3 sampai 10 karena waktu komputasinya cenderung sama. Untuk
menentukan nilai threshold yang menghasilkan jumlah istilah subjek yang optimal,
perlu dianalisis terlebih dahulu berapa jumlah istilah yang dianggap optimal
dengan cara menghitung persentase keragaman.
Persentase keragaman menunjukkan banyaknya istilah yang dihasilkan
terhadap jumlah pasangan subjek yang lolos threshold. Misalkan dalam suatu
koleksi data terdapat 10 buah data dan terdapat 10 istilah di dalam koleksi tersebut,
maka persentase keragamannya bernilai 100%. Jika hanya terdapat 1 buah istilah
di dalam 10 data tersebut, maka persentase keragamannya bernilai 0%.
Dalam penelitian ini, persentase keragaman dapat dihitung dengan
menggunakan rumus sebagai berikut:
Pe sentase

te m
te m

dengan term1 adalah jumlah istilah subjek yang dihasilkan dan term2 adalah
jumlah pasangan subjek yang lolos threshold. Misalkan untuk data tahun 19632013 dengan nilai threshold=3, jumlah pasangan subjek yang lolos threshold
berjumlah 4245 dan jumlah istilah yang dihasilkan sebanyak 545 subjek, maka
persentasenya sebesar 12.84%. Untuk data yang sama, nilai threshold=4
persentasenya 10.68% dan untuk nilai threshold=5 persentasenya sebesar 9.07%.
Hasil perhitungan selengkapnya dapat dilihat Lampiran 3.
Tujuan dilakukannya perhitungan persentase ragam ini ialah mendapatkan
persentase yang terkecil dengan mempertimbangkan jumlah pasangan subjek yang
lolos threshold dan jumlah dokumen yang digunakan. Selain itu, persentase
keragaman yang kecil dipilih karena koleksi data yang dihasilkan akan memiliki
sedikit data dengan subjek yang mengandung kesalahan. Oleh karena itu, pada
penelitian ini ditetapkan data yang digunakan adalah data tahun 1963-2013. Untuk

12
mendapatkan nilai threshold yang dipilih, dilakukan perhitungan rata-rata
persentase keragaman pada data tahun 1963-2013, yaitu sebesar 12.48%, lalu
dicari nilai threshold yang memiliki nilai persentase keragaman mendekati nilai
rata-rata. Dengan demikian, nilai threshold yang dipilih adalah 4 sebagai nilai
threshold yang menghasilkan jumlah istilah subjek yang optimal.
Selanjutnya, dilakukan proses thresholding terhadap data yang sebelumnya
sudah dikenai proses stemming. Setelah itu, akan didapat daftar istilah baru yang
memungkinkan bersih dari data yang kurang sesuai. Selanjutnya, dilakukan proses
pembuatan inverted index.

Perhitungan Peluang Antaristilah
Proses perhitungan peluang dimulai dengan membuat kombinasi antaristilah
dari daftar istilah yang sudah dibuat. Kombinasi tersebut merupakan pasanganpasangan istilah yang mungkin berpasangan pada satu field subjek tesis. Proses
perhitungannya sebagai berikut:
1 Subjek yang nantinya akan dilihat keterhubungannya dinamakan subjek
parent dan subjek-subjek berhubungan dinamakan subjek child.
2 Merujuk ke rumus (2), maka yang bertindak sebagai a adalah child dan parent
bertindak sebagai b.
3 Pertama, dihitung jumlah tesis yang mengandung istilah subjek parent pada
daftar istilah, lalu dihitung juga jumlah tesis yang mengandung istilah subjek
parent dan child yang berada pada satu tesis. Setelah nilai keduanya sudah
diketahui, dihitung perbandingan antara jumlah tesis yang mengandung istilah
subjek parent dan child yang berada pada satu tesis dengan jumlah tesis yang
mengandung istilah subjek parent pada daftar istilah. Perbandingan antara
jumlah keduanya disebut peluang subjek child jika subjek parent yang dipilih.
Jika nilai peluang antaristilah tersebut sudah dihitung, nilai peluang tersebut
disimpan beserta istilah yang bersangkutan ke dalam database.
Tabel 5 adalah contoh nilai peluang beserta istilah yang bersangkutan.
Subjek2 merupakan subjek parent sedangkan Subjek1 adalah subjek child.
Diketahui bahwa istilah subjek agribusi pada daftar istilah berjumlah 18
sedangkan istilah subjek agricultur econom berjumlah 51. Istilah subjek agribusi
dan agricultur econom yang terletak pada satu tesis berjumlah 5. Hasil
perhitungan peluangnya seperti pada Tabel 5.
Tabel 5 Contoh nilai peluang
Subjek1
agribusi
agricultur econom

Subjek2
agricultur econom
agribusi

Peluang
0.09803
0.27777

13
Perancangan Visualisasi
Proses perancangan visualisasi dimulai dengan pembuatan script PHP untuk
mengumpulkan data yang sesuai dengan query yang dimasukkan pengguna.
Query yang dimasukkan oleh pengguna akan dikenai proses stemming terlebih
dahulu menggunakan algoritme Porter Stemmer. Setelah itu, dicari nilai peluang
dan istilah-istilah pasangan yang sudah dikenai proses stemming dari query
tersebut di dalam database. Selanjutnya, dicari istilah asli dari istilah-istilah
pasangan tersebut. Setelah istilah asli didapatkan, istilah tersebut ditandai sebagai
child dan query yang dimasukkan pengguna sebagai parent.
Setelah didapatkan data parent dan child, selanjutnya dibuat script PHP
untuk menghubungkan data parent dan child dengan script untuk visualisasi. Pada
penelitian ini, script untuk visualisasi menggunakan script JQuery JIT. Setelah
koleksi data sudah terhubung dengan script visualisasi, dilakukan pengaturan
terhadap atribut-atribut visualisasi, seperti ukuran dan bentuk node, warna node
dan edge, jarak antara node parent dan node child, serta warna background
visualisasi.
Dapat dilihat dari Gambar 7, visualisasi yang ditampilkan adalah hasil
visualisasi dari query forestry. Istilah forestry bertindak sebagai node parent
dengan jumlah node child sebanyak 19 buah. Hasil visualisasi tersebut
mengandung makna bahwa istilah subjek forestry memiliki keterhubungan dengan
19 istilah lainnya. Oleh karena itu, dapat dikatakan bahwa 19 child tersebut
memiliki kesamaan, yaitu berada dalam satu field subjek dengan subjek forestry di
dalam metadata tesis IPB.
Terdapat perbedaan pada setiap node child baik segi warna maupun ukuran.

Gambar 7 Visualisasi keterhubungan istilah subjek forestry

14
Pada penelitian ini, perbedaan warna menunjukkan range nilai peluang,
sedangkan ukuran node menunjukkan rasio dari peluang untuk setiap child yang
berhubungan dengan parent. Selain itu, arah putar berlawanan jarum jam pada
node-node child dari hasil visualisasi membentuk urutan peluang dari peluang
terkecil hingga yang terbesar. Jadi, dapat disimpulkan bahwa istilah subjek forest
management memiliki hubungan paling erat dengan subjek forestry dibandingkan
dengan istilah subjek lainnya.

Perancangan Antarmuka
Menurut Zhang (2008), terdapat tiga paradigma sistem dalam menampilkan
visualisasi informasi, yaitu QB (Query searching and Browsing), BQ (Browsing
and Query searching), dan BO (Browsing Only) paradigm. Sistem yang telah
dibuat dalam penelitian ini mengikuti sistem dengan paradigma QB paradigm,
yaitu pengguna akan diminta memasukkan query berupa istilah subjek, lalu sistem
akan menampilkan hasil pencarian tersebut, selanjutnya pengguna akan
menelusuri istilah-istilah yang terhubung dengan istilah yang dimasukkan sebagai
query pada visualisasi yang ditampilkan. Oleh karena itu, telah dibuat antarmuka
yang sesuai dengan paradigma sistem tersebut.
Antarmuka pengguna terbagi menjadi dua bagian, yaitu bagian untuk
visualisasi dan bagian untuk back-end processing. Antarmuka bagian visualisasi
adalah bagian yang mencakup antarmuka utama untuk menampilkan visualisasi
dari keterhubungan istilah query yang dimasukkan pengguna beserta fitur-fitur
interaksi visualisasi, sedangkan antarmuka bagian back-end processing adalah
bagian yang mencakup antarmuka untuk pengguna yang menangani koleksi data
yang akan ditampilkan dalam visualisasi.
Fitur-fitur interaksi yang terdapat pada bagian visualisasi antara lain search
box untuk pencarian istilah pada daftar istilah, halaman yang memuat daftar istilah
untuk memudahkan pengguna memilih istilah yang akan dimasukkan sebagai
query, link untuk menampilkan dokumen-dokumen yang terkait dengan query dan
istilah yang berhubungan, penambahan animasi dan link pada child, serta fitur
panning, dragging dan zooming untuk hasil visualisasi.
Antarmuka bagian back-end processing terdiri atas halaman untuk
menampilkan informasi tentang koleksi data yang sedang digunakan, halaman
untuk melakukan proses indexing termasuk proses impor data dari XLS ke
MySQL, dan halaman untuk menampilkan daftar istilah yang digunakan saat ini.
Gambar 8 adalah tampilan antarmuka bagian visualisasi dan Gambar 9 adalah
tampilan antarmuka salah satu halaman pada bagian back-end processing.
Sistem dengan visualisasi yang dibuat dalam penelitian ini dapat membantu
pengguna menelusuri keterhubungan antardokumen tesis IPB melalui
keterhubungan subjek tesis. Sistem ini tidak hanya menampilkan dokumen yang
sesuai dengan query yang dimasukkan pengguna, tetapi juga menampilkan
dokumen-dokumen yang berhubungan dengan subjek yang dicari. Dengan fitur
visualisasi dari sistem, pengguna dapat mengetahui subjek-subjek yang sudah
pernah diteliti oleh IPB dan jumlah penelitian yang menggunakan subjek tersebut.

15

Gambar 8 Tampilan antarmuka bagian visualisasi

Gambar 9 Tampilan antarmuka bagian back-end processing

SIMPULAN DAN SARAN
Simpulan
Penelitian ini telah berhasil membangun sistem penelusuran dokumen
berdasarkan istilah subjek dan menampilkan hasil visualisasinya. Penelitian ini
juga berhasil membuat struktur sistem yang dapat mengurangi waktu eksekusi dan
mengurangi kejanggalan dalam menampilkan hasil visualisasi. Pada penelitian ini,
dapat disimpulkan bahwa nilai threshold tidak memengaruhi waktu komputasi
saat proses indexing secara signifikan, namun memengaruhi jumlah istilah subjek
yang dihasilkan sehingga persentase ragam dari istilah subjekpun ikut terpengaruh.
Proses penyeragaman istilah menggunakan Porter Stemmer dan proses
thresholding masih memiliki kekurangan dalam membuat koleksi data, yaitu
masih menyisakan data yang tidak terpakai yang jumlahnya cukup signifikan.

16
Saran
Pada penelitian ini, sebaiknya pada saat proses indexing dilakukan
perbaikan istilah yang mengandung anomali menjadi bentuk istilah subjek yang
sesuai. Untuk melakukan proses ini, dibutuhkan kamus istilah atau thesaurus yang
harus dibuat sebelumnya.

DAFTAR PUSTAKA
Chase P D’Amo e R Ge shon N Holland R, Hyland R, et al. Semantic
Visualization. ACL-COLING Workshop on Content Visualization and
Intermedia Representations. 1998 Agustus 15; Montreal, Canada. New
Brunswick(US): ACL. hlm 52-62.
Kboubi F, Habacha A, BenAhmed M. 2012. Semantic visualization and
navigation in textual corpus. International Journal of Information Sciences and
Techniques. 2(1):53-62.
Manber U, Smith M, Gopal B. 1997. Webglimpse: Combining browsing and
searching. USENIX 1997 Annual Technical Conference; 1997 Jan 6-10;
Anaheim, California. Berkeley(US): USENIX Association. hlm 195-206.
Manning CD, Raghavan P, Schutze H. 2008. Introduction to Information
Retrieval. New York(US): Cambridge University Press.
Olston C, Chi E. 2003. ScentTrails: integrating browsing and searching on the
web. ACM Transactions on Computer-Human Interaction. 10(3):177-197.
[PNRI] Perpustakaan Nasional Republik Indonesia. 2005. INDOMARC Format
MARC Indonesia. Jakarta(ID): Perpustakaan Nasional Republik Indonesia.
Rizky R. 2010. Visualisasi keterhubungan antaristilah subjek pada metadata tesis
IPB menggunakan peluang bersyarat [skripsi]. Bogor (ID): Institut Pertanian
Bogor.
[UNESCO] United Nations Educational, Scientific dan Cultural Organization.
2004. CDS/ISIS for Windows Reference Manual (Version1.5). Nelson(NZ):
UNESCO.
Zhang J. 2008. Visualization for Information Retrieval. Berlin(DE): SpringerVerlag.

17
Lampiran 1 Contoh record yang mengandung kesalahan pengetikan
No.

Record subjek sebelum diperbaiki

Record subjek setelah diperbaiki

1

AGriculture

Agriculture

2

AGronomy

Agronomy

3

AGronomy

Agronomy

4

MArine ecologi

Marine ecologi

5

STatistic analysis

Statistic analysis

6

PLankton

Plankton

7

GeneraL GEOLOGY

General GEOLOGY

8

OIl

Oil

9

HUnting

Hunting

10

FOrestry

Forestry

11

FIscal policy

Fiscal policy

12

MOlecular biology

Molecular biology

13

EConomics

Economics

14

FiIsheries

Fisheries

15

LOcal planning

Local planning

16

aBotany

Botany

17

DFisheries

Fisheries

18

FIies

Flies

19

SSavage Treatment

Savage Treatment

20

Animal HUsbandry

Animal Husbandry

18
Lampiran 2 Hasil perhitungan nilai threshold terhadap waktu komputasi, jumlah
pasangan subjek yang lolos threshold dan jumlah subjek yang
dihasilkan
Threshold
Data
a
19632013

19932013

20032013

20082013

1

2

3

4

5

6

7

8

9

10

921

385

373

334

349

343

342

327

342

329

b

13296 5477 4245 3567 3075 2775 2535 2353 2209 1984

c

5352

947

545

381

279

224

187

161

146

115

a

603

216

204

193

182

188

179

186

193

192

b

10073 4018 3040 2575 2191 1981 1825 1706 1602 1467

c

4683

804

426

294

212

164

138

122

106

87

a

182

82

72

63

57

59

60

56

57

52

b

5822

3249 2551 2215 1871 1716 1590 1450 1362 1272

c

2804

660

363

259

184

151

126

105

92

78

a

76

39

32

31

29

30

30

29

29

29

b

3613

1902 1422 1176

940

865

799

715

667

604

c

1974

488

114

98

82

67

57

47

259

181

Keterangan : a = Waktu komputasi (detik), b = Jumlah pasangan subjek yang lolos threshold, c =
Jumlah istilah subjek yang dihasilkan

19
Lampiran 3 Perhitungan persentase keragaman istilah subjek
Threshold
1
2
3
4
5
6
7
8
9
10
a

1963-2013
40.25
17.29
12.84
10.68
9.07
8.07
7.38
6.84
6.61
5.80

Persentase Keragaman(%)a
1993-2013
2003-2013
46.49
48.16
20.01
20.31
14.01
14.23
11.42
11.69
9.68
9.83
8.28
8.80
7.56
7.92
7.15
7.24
6.62
6.75
5.93
6.13

2008-2013
54.64
25.66
18.21
15.39
12.13
11.33
10.26
9.37
8.55
7.78

Jumlah istilah subjek yang dihasilkan dibagi jumlah pasangan subjek yang lolos threshold

20

RIWAYAT HIDUP
Penulis lahir di kota Jakarta pada tanggal 21 Mei 1992 sebagai anak pertama
dari 3 bersaudara dari pasangan Albert Zultanair dan Masayu Tuti Hawa. Penulis
menghabiskan seluruh masa kecilnya serta mengenyam pendidikan di kota
Bekasi. Penulis merupakan lulusan dari Sekolah Menengah Atas Negeri 9 Bekasi
(2006–2009), Sekolah Menengah Pertama Negeri 26 Bekasi (2003–2006),
Sekolah Dasar Negeri Pedurenan 6 Bekasi (1999–2003) dan Sekolah Dasar
Negeri Cibening 2 Bekasi (1997-1999). Pada tahun 2009, penulis diterima sebagai
Mahasiswa Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu
Pengetahuan Alam, Institut Pertanian Bogor.
Pada tanggal 1 Juli 2012, penulis melaksanakan Praktik Kerja Lapangan di
Perseroan Terbatas Pertamina Region Unit VI Balongan Indramayu sampai
tanggal 14 Agustus 2012. Selama mengikuti perkuliahan, penulis pernah menjadi
asisten praktikum untuk Mata Kuliah Algoritma dan Pemrograman pada tahun
2011, 2012 dan 2013, asisten praktikum untuk Mata Kuliah Rekayasa Perangkat
Lunak pada tahun 2012 dan 2013, dan asisten praktikum untuk Mata Kuliah Basis
Data pada tahun 2013 di Departemen Ilmu Komputer Institut Pertanian Bogor.
Penulis merupakan seorang pencinta olahraga, khususnya sepakbola dan
basket. Penulis juga merupakan seorang pencinta musik dan menekuni alat musik
gitar bass serta olah vokal.