Clustering dengan SOM IMPLEMENTASI DAN PENGUJIAN

Tabel 4.1. Contoh Hasil Dari Keyphrase Extraction lanjutan Judul Artikel Keyphrase Extraction Pertolongan Pertama Jika Anak Demam di Malam Hari demam, anak, tidur, bayi Pertolongan Pertama pada Luka Bakar Sedang luka_bakar, luka, kulit, Mana yang Paling Menular: Hepatitis A, B atau C? hepatitis_b, hepatitis, virus, hepatitis_a, hepatitis_c, Meringankan Gejala Flu pada Anak flu, anak, demam, sakit_tenggorokan, batuk, 5 Makanan Pereda Gejala Premenstrual Syndrome pms, lemak, menstruasi, jerawat, kalsium, Suasana Kamar Remang-remang Paling Pas untuk Malam Pertama - Pose Yoga Pilot Wanita Ini Jadi Sensasi di Instagram - Apa Yang Baik Bagi Jantung Juga Dapat Mencegah Kanker kanker, jantung, darah, Dari 533 artikel input, 5 artikel tidak memiliki kata kunci disebabkan kurangnya kata kesehatan yang terdapat pada artikel tersebut. 5 artikel ini dianggap kurang kompeten sebagai artikel kesehatan sehingga 5 artikel ini tidak akan dilibatkan dalam proses clustering.

4.4. Clustering dengan SOM

Clustering dengan algoritma SOM Self Organizing Maps pada penelitian ini dibagi menjadi dua proses. 1. Proses Awal Pada proses awal ini dilakukan pengelompokkan menjadi dua korpus baru yaitu korpus artikel kesehatan yang berhubungan dengan anak dan korpus artikel kesehatan umum. Pengelompokkan ini bertujuan untuk memisahkan artikel kesehatan yang berhubungan dengan anak dengan artikel kesehatan umum. Pengelompokkan ini menggunakan 3 term yaitu anak, bayi, dan balita sebagai parameter perhitungan untuk setiap artikel yang ada. Artikel yang terkelompokkan sebagai artikel kesehatan yang berhubungan dengan anak masuk ke dalam korpus C0, sementara untuk artikel kesehatan umum atau yang tidak berhubungan dengan anak akan masuk kedalam korpus C1. Dari 528 artikel yang terdapat pada korpus awal, 135 artikel masuk kedalam korpus C0 dan 393 artikel masuk kedalam korpus Universitas Sumatera Utara C1. Grafik hasil dari pemisahan artikel kesehatan yang dilakukan pada tahap pertama ini dapat dilihat pada Gambar 4.5. Gambar 4.5. Grafik Hasil Pemisahan Artikel pada Proses Awal Clustering Dari Gambar 4.5 dapat dilihat bahwa artikel-artikel yang berhubungan dengan anak memiliki jumlah yg cukup besar dan dengan jumlah yang cukup besar ini maka pemisahan artikel ini tidak dapat diabaikan. Pemisahan artikel ini sangat bermanfaat dalam membedakan artikel kesehatan yang berhubungan dengan anak ataupun tidak. Hal ini juga membantu dalam membedakan kelompok usia yang dituju dari topik kesehatan yang sama. Sebagai contoh yaitu topik kesehatan “kanker”, kanker dapat berbeda penanganannya tergantung dengan kelompok usia yang ditujunya. Contoh artikel yang masuk kedalam setiap kelompok yang ditentukan juga dapat dilihat pada Tabel 4.2. Tabel 4.2. Contoh Artikel Hasil dari Proses Awal Clustering Judul Artikel Kata Kunci Korpus 5 Hal Soal Nutrisi Anak yang Masih Dipercaya, Padahal Mitos anak, alergi, balita, susu, bayi, C0 5 Langkah Kurangi Berat Badan Bagi Balita yang Kelebihan Gizi balita, gizi, anak, berat_badan, C0 Ada Virus Saat Hamil, Apakah Berpotensi Menular ke Anak? virus, anak, hamil, C0 Anak Pendek Berisiko Terkena Penyakit Degeneratif gizi, penyakit_degeneratif, anak, otak, C0 Asam Folat Turunkan Risiko Cacat pada Janin hamil, kalsium, tulang, bayi, nutrisi, C0 Universitas Sumatera Utara Tabel 4.2. Contoh Artikel Hasil dari Proses Awal Clustering Lanjutan Judul Artikel Kata Kunci Korpus 30 Kanker Paru Baru Terdeteksi 3 Bulan Sebelum Pasien Meninggal kanker_paru, C1 5 Cara Cegah Keracunan Makanan keracunan_makanan, kontaminasi, bakteri, spora, kulit, C1 50 Persen Kesulitan Hamil Disebabkan Faktor Pria sperma, varikokel, infertilitas, hamil, operasi, C1 Buah-buahan Ini Bisa Diandalkan untuk Bantu Turunkan Berat Badan lemak, berat_badan, kalori, antioksidan, perut, C1 Diet Rendah Karbohidrat Picu Kematian Dini karbohidrat, diet, berat_badan, C1 2. Proses Akhir Pada proses akhir dari clustering dengan algoritma SOM, setiap artikel pada dua korpus baru hasil dari proses awal akan di-clustering berdasarkan topiknya. Term yang dijadikan parameter pada proses akhir dari clustering ini merupakan kata kunci dari setiap artikel yang ada pada dua korpus tersebut dengan nilai DF diatas 2. Pada proses clustering ini akan dilakukan dua percobaan dengan jumlah term parameter yang berbeda yaitu 5 dan 10. Term yang digunakan pada setiap percobaan dapat dilihat pada Tabel 4.3. Hasil percobaan ini bisa dilihat pada Tabel 4.4. Tabel 4.3. Term Parameter pada Proses Akhir Clustering Cluster Jumlah Term Term C0 5 bayi, susu, asi, hamil, kanker C0 10 bayi, susu, asi, hamil, kanker, gizi, kembang, kulit, berat_badan, alergi C1 5 kanker, kanker_payudara, tekanan_darah, serangan_jantung, berat_badan C1 10 kanker, kanker_payudara, tekanan_darah, serangan_jantung, berat_badan, darah, kulit, jantung, diabetes, tidur, Universitas Sumatera Utara Tabel 4.4. Hasil Percobaan pada Proses Akhir Clustering Cluster Jumlah Term Maksimum Cluster Cluster yang Terbentuk Cluster yang terisi C0 5 25 20 11 C0 10 100 29 16 C1 5 25 14 8 C1 10 100 46 34 Hasil percobaan ini menunjukan bahwa semakin banyak jumlah term yang dijadikan sebagai parameter maka akan semakin banyak jumlah cluster yang terbentuk. Namun term yang dijadikan parameter juga bergantung kepada banyaknya jumlah cluster yang terbentuk. Grafik hasil dari clustering pada korpus C0 dengan jumlah term yang dijadikan sebagai parameter adalah sebanyak 5 buah dapat dilihat pada Gambar 4.6. Sedangkan grafik hasil dari clustering pada korpus C1 dengan jumlah term yang dijadikan sebagai parameter adalah sebanyak 5 buah dapat dilihat pada Gambar 4.7. Gambar 4.6. Grafik Hasil Clustering pada Korpus C0 Universitas Sumatera Utara Gambar 4.7. Grafik Hasil Clustering pada Korpus C1 Dari cluster yang terbentuk, cluster yang berdekatan biasanya memiliki topik cluster yang sama. Hal ini disebabkan dari nilai bobot cluster-nya yang tidak jauh berbeda. Bobot yang tidak jauh berbeda ini disebabkan oleh term lain yang ikut terdapat didalam cluster selain dari term topik cluster itu sendiri sehingga menyebabkan perbedaan nilai bobot. Contoh artikel yang masuk kedalam setiap cluster yang terdapat pada korpus C0 yaitu kelompok kesehatan anak dapat dilihat pada Tabel 4.4. Tabel 4.5. Contoh Artikel Hasil dari Clustering pada Korpus C0 Cluster Jumlah Artikel Tema Cluster Judul Artikel 18 Susu ASI  Cara Produksi ASI melimpah  Mengatasi Anak yang Susah Minum ASI Perah  Bayi Muntah Setelah Minum ASI Perah, Apa Sebabnya? 2 10 ASI  Ingat, ASI Donor Sifatnya Sementara Universitas Sumatera Utara Tabel 4.4. Contoh Artikel Hasil dari Clustering pada Korpus C0 Lanjutan Cluster Jumlah Artikel Tema Cluster Judul Artikel  Infografis: Syarat dan Tahapan Mendonorkan ASI  Faktor-faktor yang Bisa Bikin Ibu Produksi ASI dengan Jumlah Banyak 4 46 Lainnya  Anak Sering Pipis, Mengapa?  Kapan Jadwal Imunisasi Anak Anda?  Meringankan Gejala Flu pada Anak 6 24 Bayi  Pertolongan Pertama Jika Bayi Pingsan  Pertolongan Pertama Jika Bayi Pingsan  Napas Bayi Berbunyi Grok-grok, Apa Penyebabnya? 8 10 Susu  Duh Si Kecil Suka Menggigit Puting Saat Menyusu  Bayi Menolak Menyusu Setelah Ibu Konsumsi Obat Magh  Konsumsi Obat Nyeri Saat Menyusui, Berpengaruhkah Pada Bayi? 10 6 Kanker  Jajanan Sekolah Tak Sehat Bisa Picu Kanker  Tubuh Kuning dan Perut Membesar, Anak Ini Ternyata Kena Neuroblastoma  Beragam Manfaat Menyusui bagi Kesehatan Ibu 12 3 Hamil Kanker  Gunakan Jaringan Ovarium Beku, Wanita Ini Lahirkan Bayi Sehat  Hormon yang Berubah-ubah Bisa Tingkatkan Risiko Kanker Kulit pada Ibu Hamil  5 Fakta Menarik Tentang Aspirin | Obat Penghilang Rasa Nyeri 14 12 Hamil  Jangan Remehkan Diabetes Saat Hamil  Ada Virus Saat Hamil, Apakah Berpotensi Menular ke Anak?  Asam Folat Turunkan Risiko Cacat pada Janin Universitas Sumatera Utara Tabel 4.4. Contoh Artikel Hasil dari Clustering pada Korpus C0 Lanjutan Cluster Jumlah Artikel Tema Cluster Judul Artikel 16 3 Bayi, Susu Hamil  Haruskah Anak Mendapat Kolostrum Saat Lahir?  Teh Oolong dan Berbagai Manfaat Kesehatannya  Ibu yang Gemar Konsumsi Susu Saat Hamil Ini Lahirkan Bayi Montok 5,9 kg 17 1 Susu Hamil  Amankah Menyusui Saat Hamil? Begini Penjelasan Medisnya 19 2 Bayi, Susu, ASI Hamil  ASI - Sebuah Mukjizat Bagi Ibu dan Bayi  Stimulasi Puting Saat Hamil Bisa Picu Kecacatan Janin, Mitos atau Fakta? Dari Tabel 4.4 dapat dilihat bahwa cluster yang berdekatan biasanya memiliki topik yang mirip, namun dibedakan dengan satu atau lebih term yang menjadi pembedanya. Seperti pada cluster 16 dan cluster 17 memiliki topik yang sama yaitu “susu hamil” namun pada cluster 16 memiliki term “bayi” pada topiknya. Contoh artikel yang masuk kedalam setiap cluster yang terdapat pada korpus C1 yaitu kelompok kesehatan umum dapat dilihat pada Tabel 4.5. Tabel 4.6. Contoh Artikel Hasil dari Clustering pada Korpus C1 Cluster Jumlah Artikel Tema Cluster Judul Artikel 284 Lainnya  Diet TLC  14 Hal Tentang Buta Warna  7 Manfaat Serat Bagi Tubuh 2 53 Kanker  4 Faktor Penyebab Timbulnya Kanker Kulit  Cegah Kanker Ovarium Dengan Mengkonsumsi ini  Lebih Aktif Bergerak Cegah Kanker 4 22 Berat Badan  7 Penyebab Kenaikan Berat Badan Universitas Sumatera Utara Tabel 4.6. Contoh Artikel Hasil dari Clustering pada Korpus C1 Lanjutan Cluster Jumlah Artikel Tema Cluster Judul Artikel  Diet Rendah Karbohidrat Picu Kematian Dini  Badan Pendek dan Kurus, Bagaimana Agar Ideal? 6 9 Serangan Jantung  Pertolongan Pertama untuk Serangan Jantung  5 Pemicu Serangan Jantung yang Mungkin Tidak Anda Duga  Serangan Jantung Tak Selalu Bergejala Nyeri Dada 8 3 Kanker Tekanan Darah  Kacang-Kacangan, Turunkan Kolesterol Hingga Cegah Kanker  Manfaat Daun Sirsak  13 Manfaat Buah Pir Bagi Kesehatan Tubuh 10 10 Tekanan Darah  Kurang Vitamin D Memicu Tekanan Darah Tinggi  Ragam Manfaat Buah Semangka Bagi Kesehatan Tubuh  7 Nutrisi Penting Yang Sering Terlewatkan Ketika Sedang Diet 12 4 Kanker Payudara  Deteksi Dini Kanker Payudara bagi masyarakat Kecamatan Mampang Jakarta  Obesitas Dikaitkan Dengan Risiko 10 Jenis Kanker  6 Makanan Sehat Yang Dibutuhkan Wanita 13 8 Kanker Kanker Payudara  Senyawa Dalam Seledri Mampu Melawan Kanker Payudara  Makanan Tinggi Serat Bisa Kurangi Risiko Kanker Payudara Dari Tabel 4.5 dapat dilihat bahwa cluster yang berdekatan seperti cluster 12 dan cluster 13 memiliki tema yang mirip yaitu kanker payudara. Hanya saja pada cluster 13 terdapat term kanker yang membuat nilai dari cluster 13 berbeda dari cluster 12. Universitas Sumatera Utara

4.5. Implementasi Sistem Bagian Depan