Tujuan Penelitian Sistem pemerolehan informasi karya ilmiah berbasis Cluster dengan G-Means Clustering.

BAB II LANDASAN TEORI

2.1. Konsep Pemerolehan Informasi

Pemerolehan informasi Information Retrieval adalah kumpulan berbagai algoritma dan teknologi untuk melakukan pemrosesan, penyimpanan, dan temu kembali informasi pada suatu koleksi data yang besar dan tidak terstruktur Manning et al, 2008. Jenis informasi tersebut beragam, bisa berupa teks dokumen, halaman web, maupun objek multimedia seperti foto dan video. 2.1.1. Operasi Teks 2.1.1.1. Stopword Stopword adalah suatu kata yang sangat sering muncul dalam berbagai dokumen adalah diskriminator yang buruk dan tidak berguna dalam temu kembali informasi. Stopword perlu dieliminasi untuk mengurangi waktu eksekusi query dengan cara menghindari proses list yang panjang Butcher et al., 2010. Pembuangan stopword ini akan mengurangi ukuran indeks, meningkatkan efisiensi dan keefektifan dari pemerolehan informasi Croft et al., 2010. Contoh stopword dalam bahasa Indonesia, yaitu kata ganti orang “aku”, “kamu”, “kita”, dsb., konjungsi “dan”, “atau”, dsb., dan beberapa kata lainnya.

2.1.1.2. Stemming

Stemming adalah proses pengenalan suatu kata. Stemming sering melibatkan pemisahan kata dari imbuhan dan tanda baca Göker et al, 2009. Menurut Agusta 2010, pola suatu kata dalam bahasa Indonesia adalah sebagai berikut : Prefiks I + Prefiks II + kata dasar + Sufiks III + Sufiks II + Sufiks I PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 8

2.1.1.2.1. Algoritma Nazief – Adriani sebagai Algoritma Stemming

Algoritma Stemming Nazief – Adriani diperkenalkan oleh Nazief dan Adriani 1996. Algoritma ini memiliki tahap-tahap sebagai berikut ini : 1. Cari kata yang akan diistem dalam basis data kata dasar. Jika ditemukan maka diasumsikan kata adalah root word. Maka algoritma berhenti. 2. Selanjutnya adalah pembuangan Inflection Suffixes “-lah”, “-kah”, “-ku”, “- mu”, atau “-nya”. Jika berupa particles “-lah”, “-kah”, “-tah” atau “-pun” dan terdapat Possesive Pronouns “-ku”, “-mu”, atau “-nya”, maka langkah ini diulangi lagi untuk menghapus Possesive Pronouns. 3. Hapus Derivation Suffixes “-i”, “-an” atau “-kan”. Jika kata ditemukan di kamus, maka algoritma berhenti. Jika tidak maka ke langkah 3a berikut ini : a. Jika “-an” telah dihapus dan huruf terakhir dari kata tersebut adalah “-k”, maka “-k” juga ikut dihapus. Jika kata tersebut ditemukan dalam kamus maka algoritma berhenti. Jika tidak ditemukan maka lakukan langkah 3b. b. Akhiran yang dihapus “-i”, “-an” atau “-kan” dikembalikan, lanjut ke langkah 4. 4. Hapus Derivation Prefix. Jika pada langkah 3 ada sufiks yang dihapus maka pergi ke langkah 4a, jika tidak pergi ke langkah 4b. a. Periksa tabel kombinasi awalan-akhiran yang tidak diijinkan pada Tabel 2.1 . Jika ditemukan maka algoritma berhenti, jika tidak, pergi ke langkah 4b. Tabel kombinasi awalan-akhiran yang tidak diijinkan ditampilkan pada tabel berikut ini : Awalan Akhiran yang tidak diizinkan be- -i di- -an ke- -i, -kan me- -an se- -i, -kan Tabel 2.1. Tabel kombinasi awalan dan akhiran yang tidak diijinkan b. Tentukan tipe awalan kemudian hapus awalan. Jika awalan kedua sama dengan awalan pertama algoritma berhenti.

Tujuan Penelitian Sistem pemerolehan informasi karya ilmiah berbasis Cluster dengan G-Means Clustering.

BAB II LANDASAN TEORI

2.1. Konsep Pemerolehan Informasi

2.1.1.2. Stemming

2.1.1.2.1. Algoritma Nazief – Adriani sebagai Algoritma Stemming

Parts

Dokumen yang terkait

Algoritma Modified K-MEANS Clustering Pada Penentuan Cluster Centre Berbasis Sum Of Squared Error (SSE)

Sistem Informasi Geografis Berbasis Web untuk Produksi Kedelai di Indonesia Menggunakan K-Means Clustering

SISTEM INFORMASI GEOGRAFIS BERBASIS WEB UNTUK PRODUKSI KEDELAI DI INDONESIA MENGGUNAKAN K-MEANS CLUSTERING

PERANCANGAN SISTEM CLUSTERING SUSU SAPI DENGAN MENGGUNAKAN METODEK-MEANS Perancangan Sistem Clustering Susu Sapi dengan Menggunakan Metode K-Means.

Cluster Quasi-Random Data Using Fuzzy C-Means Clustering - MATLAB & Simulink.

DATA MINING PENERAPAN K-MEANS ALGORITM CLUSTERING

Implementasi Alokasi Memori Dinamis pada Sistem Komputer Berbasis Clustering K-Means

Algoritma Modified K-MEANS Clustering Pada Penentuan Cluster Centre Berbasis Sum Of Squared Error (SSE)

Algoritma Modified K-MEANS Clustering Pada Penentuan Cluster Centre Berbasis Sum Of Squared Error (SSE)

Algoritma Modified K-MEANS Clustering Pada Penentuan Cluster Centre Berbasis Sum Of Squared Error (SSE)

Dukungan

Links

Tujuan Penelitian Sistem pemerolehan informasi karya ilmiah berbasis Cluster dengan G-Means Clustering.

BAB II LANDASAN TEORI

2.1. Konsep Pemerolehan Informasi

2.1.1.2. Stemming

2.1.1.2.1. Algoritma Nazief – Adriani sebagai Algoritma Stemming

Parts

Dokumen yang terkait

Algoritma Modified K-MEANS Clustering Pada Penentuan Cluster Centre Berbasis Sum Of Squared Error (SSE)

Sistem Informasi Geografis Berbasis Web untuk Produksi Kedelai di Indonesia Menggunakan K-Means Clustering

SISTEM INFORMASI GEOGRAFIS BERBASIS WEB UNTUK PRODUKSI KEDELAI DI INDONESIA MENGGUNAKAN K-MEANS CLUSTERING

PERANCANGAN SISTEM CLUSTERING SUSU SAPI DENGAN MENGGUNAKAN METODEK-MEANS Perancangan Sistem Clustering Susu Sapi dengan Menggunakan Metode K-Means.

Cluster Quasi-Random Data Using Fuzzy C-Means Clustering - MATLAB & Simulink.

DATA MINING PENERAPAN K-MEANS ALGORITM CLUSTERING

Implementasi Alokasi Memori Dinamis pada Sistem Komputer Berbasis Clustering K-Means

Algoritma Modified K-MEANS Clustering Pada Penentuan Cluster Centre Berbasis Sum Of Squared Error (SSE)

Algoritma Modified K-MEANS Clustering Pada Penentuan Cluster Centre Berbasis Sum Of Squared Error (SSE)

Algoritma Modified K-MEANS Clustering Pada Penentuan Cluster Centre Berbasis Sum Of Squared Error (SSE)

Dokumen yang Anda mencari sudah siap untuk unduhkan