Metode Pengumpulan Data Pengolahan Data Preprocessing Data

37 Pada Gambar 3.1 proses indexing menghasilkan kumpulan kata beserta nilai frekuensi kata dari masing - masing yang telah diseleksi. Kumpulan kata ini akan diolah menggunakan metode Multinomial Naïve Bayes sehingga menghasilkan model yang digunakan untuk proses klasifikasi. Proses klasifikasi, akan melalui proses indexing yang sama pada proses training tanpa diketahui kelas atau kategorinya yang menghasilkan kumpulan kata. Hasil kumpulan kata digunakan untuk proses matching agar mendapatkan daftar kata yang sama pada kumpulan kata dan data model. Hasil proses matching digunakan untuk melakukan klasifikasi menggunakan metode Multinomial Naïve Bayes.

3.2 Teknik Analisis Data

3.2.1 Metode Pengumpulan Data

Data yang diperoleh merupakan data yang melalui beberapa tahapan. Adapaun tahapan yang dilalui untuk melakukan pengumpulan data dalam penelitian ini sebagai berikut: 1. Studi Pustaka Penggunaan studi pustaka pada penelitian ini adalah untuk mencari sumber – sumber mengenai metode Multinomia Naive Bayes untuk mengklasifikasikan data teks. 2. Observasi Penggunaan observasi pada penelitian adalah untuk melakukan pencarian data teks lirik lagu dari berbagai macam situs website. 38 3. Wawancara Metode wawancara digunakan untuk pengelompokan data sebagai acuan pemberian label terhadap data dari seorang ahli. Dalam kasus penelitian ahli dipilih dari dosen psikologi untuk menentukan klasifikasi data yang baik dan tidak baik untuk anak.

3.2.1 Pengolahan Data

Dalam penelitian data yang digunakan sebanyak 500. Data yang digunakan diperoleh melalui beberapa situs website. Pembagian data dapat dilihat pada tabel 3.1 berikut: Tabel 3.1 Tabel Data Training dan Testing Jumlah Data Data Training Data Testing Klasifikasi Lagu Baik 200 50 Lagu Tidak Baik 200 50 Total 400 100 Sebanyak 400 data sebagai data training akan melalui tahap preprocessing untuk mendapatkan sebuah model dan 100 data sebagai data testing akan melalui tahap preprocessing untuk mencocokan data testing dengan model untuk mengetahui hasil klasifikasi. Sampai pada akhirnya perhitungan akurasi dengan menggunakan confusion matrix. 39

3.2.2 Preprocessing Data

Preprocessing akan dilalui oleh data sebelum proses klasifikasi. Proses ini dilakukan untuk meminimalisir permasalahan yang timbul dalam data diantaranya mengurangi jumlah kata yang tidak berarti atau tidak memiliki makna dalam data dalam dokumen. Proses yang berlangsung pada setiap data dilakukan melalui tahapan sebagai berikut : 1 Tokenizing Tahapan ini, menghilangkan karakter yang tidak memiliki arti pada kumpulan kata. 2 Normalization Tahapan ini, mengembalikan bentuk kata dari huruf besar menjadi huruf kecil. 3 Stop Word Tahapan ini, menghilangkan kata yang tidak memiliki arti atau tidak mempengaruhi pemerolehan informasi. 4 Stemming Tahapan ini, mengembalikan bentuk kata menjadi bentuk kata dasar 5 Sorting dan Grouping Tahapan ini, mengurutkan kata dari abjad a sampai z serta menggabungkan kata yang sama. 40

Metode Pengumpulan Data Pengolahan Data Preprocessing Data

3.2 Teknik Analisis Data

3.2.1 Metode Pengumpulan Data

3.2.1 Pengolahan Data

3.2.2 Preprocessing Data

3.2.3 Klasifikasi Data

Parts

Dokumen yang terkait

Analisis Sentimen Nasabah Bank X Menggunakan Pengklasifikasian Naive Bayes

Optimasi Akurasi Analisis Sentimen Pada Posting Twitter Menggunakan Metode Naive Bayes dan Stemming

Perbandingan Metode Seleksi Fitur pada Spam Filter Menggunakan Klasifikasi Multinomial Naïve Bayes

Sistem klasifikasi surat masuk menggunakan multinomial naive bayes.

Analisis Sentimen pada Provider Telekomunikasi Menggunakan Metode Naive Bayes Classifier dengan Seleksi Fitur Mutual Information.

Analisis Sentimen Menggunakan Metode Naive Bayes Classifier dengan Seleksi Fitur Chi Square.

ANALISIS SENTIMEN MENGGUNAKAN METODE NAiVE BAYES CLASSIFIER DENGAN SELEKSI FITUR CHI SQUARE.

Analisis Sentimen Review Film Pada Twitter Menggunakan Metode Information Gain dan Naive Bayes Classifier.

Sentiment Analysis Berbahasa Indonesia Menggunakan Improved Multinomial Naive Bayes Indonesian Sentiment Analysis Using Improved Multinomial Naïve Bayes

KLASIFIKASI LAGU DAERAH INDONESIA BERDASARKAN LIRIK MENGGUNAKAN METODE TF-IDF DAN NAÏVE BAYES

Dukungan

Links

Metode Pengumpulan Data Pengolahan Data Preprocessing Data

3.2 Teknik Analisis Data

3.2.1 Metode Pengumpulan Data

3.2.1 Pengolahan Data

3.2.2 Preprocessing Data

3.2.3 Klasifikasi Data

Parts

Dokumen yang terkait

Analisis Sentimen Nasabah Bank X Menggunakan Pengklasifikasian Naive Bayes

Optimasi Akurasi Analisis Sentimen Pada Posting Twitter Menggunakan Metode Naive Bayes dan Stemming

Perbandingan Metode Seleksi Fitur pada Spam Filter Menggunakan Klasifikasi Multinomial Naïve Bayes

Sistem klasifikasi surat masuk menggunakan multinomial naive bayes.

Analisis Sentimen pada Provider Telekomunikasi Menggunakan Metode Naive Bayes Classifier dengan Seleksi Fitur Mutual Information.

Analisis Sentimen Menggunakan Metode Naive Bayes Classifier dengan Seleksi Fitur Chi Square.

ANALISIS SENTIMEN MENGGUNAKAN METODE NAiVE BAYES CLASSIFIER DENGAN SELEKSI FITUR CHI SQUARE.

Analisis Sentimen Review Film Pada Twitter Menggunakan Metode Information Gain dan Naive Bayes Classifier.

Sentiment Analysis Berbahasa Indonesia Menggunakan Improved Multinomial Naive Bayes Indonesian Sentiment Analysis Using Improved Multinomial Naïve Bayes

KLASIFIKASI LAGU DAERAH INDONESIA BERDASARKAN LIRIK MENGGUNAKAN METODE TF-IDF DAN NAÏVE BAYES

Dokumen yang Anda mencari sudah siap untuk unduhkan