1
BAB I
PENDAHULUAN
1.1. Latar Belakang Masalah
Karya sastra merupakan sebuah seni ungkapan pribadi manusia berupa pengalaman, pemikiran, ide dan semangat dalam suatu bentuk
gambaran kehidupan yang dapat dilukiskan dalam bentuk tulisan. Beberapa contoh karya sastra diantaranya adalah puisi, fiksi atau prosa
dan lain sebagainya. Dengan beragam suku dan bahasa yang ada, Indonesia tentunya memiliki beragam karya sastra dari masing-masing
daerah. Sebagai contoh dalam sebuah cerita fiksi terdiri dari beberapa kalimat yang menyusun cerita tersebut dan dalam setiap kalimat
terdapat kata kunci yang akan mempermudah proses pemerolehan informasi dari kalimat tersebut. Misalnya pada sebuah cerpen terdapat
kalimat yang setelah dilakukan proses pemerolehan informasi maka kalimat tersebut dapat digolongkan menjadi kalimat urutan kejadian
atau tergolong dalam kelompok kalimat keadaan atau bahkan kelompok kalimat komunikasi. Proses pemerolehan informasi ini tidak harus
dilakukan pada satu kalimat, proses ini dapat dilakukan dengan menggunakan beberapa kalimat seperti pada penelitian yang dilakukan
ini, menggunakan kalimat yang mengandung kata sabar kemudian diambil kalimat depan dan belakangnya jika kalimat tersebut berada di
bagian tengah paragraf. Jika kalimat yang mengandung kata sabar berada pada awal paragraf, maka akan diambil pula kalimat setelahnya
dan jika kalimat yang mengandung kata sabar tersebut berada pada bagian akhir paragraf, maka akan diambil pula kalimat sebelumnya.
Menurut Manning 2008, proses pemerolehan informasi dapat diartikan pencarian material dari dokumen yang sifatnya tidak
terstruktur yang bertujuan untuk memenuhi kebutuhan informasi dari suatu kumpulan dokumen yang besar. Proses pemerolehan informasi
ini dapat dilakukan dengan menggunakan hitungan manual maupun menggunakan metode-metode yang ada dalam data mining atau
penambangan data atau dikenal juga dengan text mining dalam pemerolehan informasi. Dalam proses pemerolehan informasi ini, ada
beberapa tahapan yang harus dilakukan. Tahap pertama adalah preprocessing.
Tahap ini terbagi menjadi 3 tahap lagi yaitu tokenizing, stopword
dan stemming. Setelah 3 tahap awal ini dilakukan, kemudian akan dilakukan perhitungan text frequency serta pembobotan. Setelah
proses diatas dilakukan, selanjutnya adalah melakukan klasifikasi dengan menggunakan metode KNN atau K Nearest Neighbour.
Dalam klasifikasi ini kata akan dipisahkan ke dalam beberapa kelompok dengan berdasar kemiripan kata dalam dokumen. Dengan
pengelompokan kata ini, akan mebantu untuk menemukan informasi dari sebuah dokumen secara lebih tepat. Dalam metode KNN,
klasifikasi ini menggunakan hasil perhitungan tf atau text frequency dengan melihat kemiripan cosine similarity setiap dokumen
berdasarkan nilai k atau jumlah tetangga terdekat. Dari latar belakang diatas, penulis tertarik untuk meneliti apakah
metode KNN ini dapat atau cocok digunakan untuk mengklasifikasikan teks dengan data yang berasal dari berbagai karya sastra indonesia
seperti puisi, cerpen, dongeng dan lain sebagainya. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
1.2. Rumusan Masalah