Tabel 4.1. Contoh Hasil Dari Keyphrase Extraction lanjutan Judul Artikel
Keyphrase Extraction
Pertolongan Pertama Jika Anak Demam di Malam Hari
demam, anak, tidur, bayi Pertolongan Pertama pada Luka Bakar
Sedang luka_bakar, luka, kulit,
Mana yang Paling Menular: Hepatitis A, B atau C?
hepatitis_b, hepatitis, virus, hepatitis_a, hepatitis_c,
Meringankan Gejala Flu pada Anak flu, anak, demam, sakit_tenggorokan,
batuk, 5 Makanan Pereda Gejala Premenstrual
Syndrome pms,
lemak, menstruasi,
jerawat, kalsium,
Suasana Kamar Remang-remang Paling Pas untuk Malam Pertama
- Pose Yoga Pilot Wanita Ini Jadi Sensasi
di Instagram -
Apa Yang Baik Bagi Jantung Juga Dapat Mencegah Kanker
kanker, jantung, darah,
Dari 533 artikel input, 5 artikel tidak memiliki kata kunci disebabkan kurangnya kata kesehatan yang terdapat pada artikel tersebut. 5 artikel ini dianggap kurang
kompeten sebagai artikel kesehatan sehingga 5 artikel ini tidak akan dilibatkan dalam proses clustering.
4.4. Clustering dengan SOM
Clustering dengan algoritma SOM Self Organizing Maps pada penelitian ini dibagi menjadi dua proses.
1. Proses Awal
Pada proses awal ini dilakukan pengelompokkan menjadi dua korpus baru yaitu korpus artikel kesehatan yang berhubungan dengan anak dan korpus artikel
kesehatan umum. Pengelompokkan ini bertujuan untuk memisahkan artikel kesehatan yang berhubungan dengan anak dengan artikel kesehatan umum.
Pengelompokkan ini menggunakan 3 term yaitu anak, bayi, dan balita sebagai parameter perhitungan untuk setiap artikel yang ada. Artikel yang terkelompokkan
sebagai artikel kesehatan yang berhubungan dengan anak masuk ke dalam korpus C0, sementara untuk artikel kesehatan umum atau yang tidak berhubungan dengan
anak akan masuk kedalam korpus C1. Dari 528 artikel yang terdapat pada korpus awal, 135 artikel masuk kedalam korpus C0 dan 393 artikel masuk kedalam korpus
Universitas Sumatera Utara
C1. Grafik hasil dari pemisahan artikel kesehatan yang dilakukan pada tahap pertama ini dapat dilihat pada Gambar 4.5.
Gambar 4.5. Grafik Hasil Pemisahan Artikel pada Proses Awal Clustering
Dari Gambar 4.5 dapat dilihat bahwa artikel-artikel yang berhubungan dengan anak memiliki jumlah yg cukup besar dan dengan jumlah yang cukup besar ini
maka pemisahan artikel ini tidak dapat diabaikan. Pemisahan artikel ini sangat bermanfaat dalam membedakan artikel kesehatan yang berhubungan dengan anak
ataupun tidak. Hal ini juga membantu dalam membedakan kelompok usia yang dituju dari topik kesehatan yang sama. Sebagai contoh yaitu topik kesehatan
“kanker”, kanker dapat berbeda penanganannya tergantung dengan kelompok usia yang ditujunya. Contoh artikel yang masuk kedalam setiap kelompok yang
ditentukan juga dapat dilihat pada Tabel 4.2.
Tabel 4.2. Contoh Artikel Hasil dari Proses Awal Clustering Judul Artikel
Kata Kunci Korpus
5 Hal Soal Nutrisi Anak yang Masih Dipercaya, Padahal Mitos
anak, alergi, balita, susu, bayi, C0
5 Langkah Kurangi Berat Badan Bagi Balita yang Kelebihan Gizi
balita, gizi,
anak, berat_badan,
C0 Ada Virus Saat Hamil, Apakah
Berpotensi Menular ke Anak? virus, anak, hamil,
C0 Anak Pendek Berisiko Terkena
Penyakit Degeneratif gizi,
penyakit_degeneratif, anak, otak,
C0 Asam Folat Turunkan Risiko
Cacat pada Janin hamil, kalsium, tulang, bayi,
nutrisi, C0
Universitas Sumatera Utara
Tabel 4.2. Contoh Artikel Hasil dari Proses Awal Clustering Lanjutan Judul Artikel
Kata Kunci Korpus
30 Kanker Paru Baru Terdeteksi 3
Bulan Sebelum
Pasien Meninggal
kanker_paru, C1
5 Cara Cegah Keracunan Makanan keracunan_makanan, kontaminasi, bakteri, spora,
kulit, C1
50 Persen
Kesulitan Hamil
Disebabkan Faktor Pria sperma,
varikokel, infertilitas, hamil, operasi,
C1 Buah-buahan Ini Bisa Diandalkan
untuk Bantu Turunkan Berat Badan
lemak, berat_badan, kalori, antioksidan, perut,
C1
Diet Rendah Karbohidrat Picu Kematian Dini
karbohidrat, diet,
berat_badan, C1
2. Proses Akhir
Pada proses akhir dari clustering dengan algoritma SOM, setiap artikel pada dua korpus baru hasil dari proses awal akan di-clustering berdasarkan topiknya. Term
yang dijadikan parameter pada proses akhir dari clustering ini merupakan kata kunci dari setiap artikel yang ada pada dua korpus tersebut dengan nilai DF diatas
2. Pada proses clustering ini akan dilakukan dua percobaan dengan jumlah term parameter yang berbeda yaitu 5 dan 10. Term yang digunakan pada setiap
percobaan dapat dilihat pada Tabel 4.3. Hasil percobaan ini bisa dilihat pada Tabel 4.4.
Tabel 4.3. Term Parameter pada Proses Akhir Clustering Cluster Jumlah
Term Term
C0 5
bayi, susu, asi, hamil, kanker C0
10 bayi, susu, asi, hamil, kanker, gizi, kembang, kulit,
berat_badan, alergi C1
5 kanker, kanker_payudara, tekanan_darah,
serangan_jantung, berat_badan C1
10 kanker, kanker_payudara, tekanan_darah,
serangan_jantung, berat_badan, darah, kulit, jantung, diabetes, tidur,
Universitas Sumatera Utara
Tabel 4.4. Hasil Percobaan pada Proses Akhir Clustering Cluster
Jumlah Term
Maksimum Cluster
Cluster yang Terbentuk
Cluster yang terisi
C0 5
25 20
11 C0
10 100
29 16
C1 5
25 14
8 C1
10 100
46 34
Hasil percobaan ini menunjukan bahwa semakin banyak jumlah term yang dijadikan sebagai parameter maka akan semakin banyak jumlah cluster yang
terbentuk. Namun term yang dijadikan parameter juga bergantung kepada banyaknya jumlah cluster yang terbentuk. Grafik hasil dari clustering pada korpus
C0 dengan jumlah term yang dijadikan sebagai parameter adalah sebanyak 5 buah dapat dilihat pada Gambar 4.6. Sedangkan grafik hasil dari clustering pada korpus
C1 dengan jumlah term yang dijadikan sebagai parameter adalah sebanyak 5 buah dapat dilihat pada Gambar 4.7.
Gambar 4.6. Grafik Hasil Clustering pada Korpus C0
Universitas Sumatera Utara
Gambar 4.7. Grafik Hasil Clustering pada Korpus C1
Dari cluster yang terbentuk, cluster yang berdekatan biasanya memiliki topik cluster yang sama. Hal ini disebabkan dari nilai bobot cluster-nya yang tidak jauh
berbeda. Bobot yang tidak jauh berbeda ini disebabkan oleh term lain yang ikut terdapat didalam cluster selain dari term topik cluster itu sendiri sehingga
menyebabkan perbedaan nilai bobot. Contoh artikel yang masuk kedalam setiap cluster yang terdapat pada korpus C0 yaitu kelompok kesehatan anak dapat dilihat
pada Tabel 4.4.
Tabel 4.5. Contoh Artikel Hasil dari Clustering pada Korpus C0 Cluster
Jumlah Artikel
Tema Cluster Judul Artikel
18 Susu ASI
Cara Produksi ASI melimpah
Mengatasi
Anak yang
Susah Minum ASI Perah
Bayi Muntah Setelah Minum ASI
Perah, Apa Sebabnya? 2
10 ASI
Ingat,
ASI Donor
Sifatnya Sementara
Universitas Sumatera Utara
Tabel 4.4. Contoh Artikel Hasil dari Clustering pada Korpus C0 Lanjutan
Cluster Jumlah
Artikel Tema Cluster
Judul Artikel
Infografis: Syarat dan Tahapan
Mendonorkan ASI
Faktor-faktor yang Bisa Bikin Ibu Produksi ASI dengan Jumlah
Banyak
4 46
Lainnya
Anak Sering Pipis, Mengapa?
Kapan Jadwal Imunisasi Anak Anda?
Meringankan Gejala Flu pada Anak
6 24
Bayi
Pertolongan Pertama Jika Bayi Pingsan
Pertolongan Pertama Jika Bayi
Pingsan
Napas Bayi Berbunyi Grok-grok, Apa Penyebabnya?
8 10
Susu
Duh Si Kecil Suka Menggigit Puting Saat Menyusu
Bayi Menolak Menyusu Setelah
Ibu Konsumsi Obat Magh
Konsumsi Obat
Nyeri Saat
Menyusui, Berpengaruhkah Pada Bayi?
10 6
Kanker
Jajanan Sekolah Tak Sehat Bisa Picu Kanker
Tubuh
Kuning dan
Perut Membesar, Anak Ini Ternyata Kena
Neuroblastoma
Beragam Manfaat Menyusui bagi Kesehatan Ibu
12 3
Hamil Kanker
Gunakan Jaringan Ovarium Beku,
Wanita Ini Lahirkan Bayi Sehat
Hormon yang Berubah-ubah Bisa Tingkatkan Risiko Kanker Kulit
pada Ibu Hamil
5 Fakta Menarik Tentang Aspirin | Obat Penghilang Rasa Nyeri
14 12
Hamil
Jangan Remehkan Diabetes Saat Hamil
Ada Virus Saat Hamil, Apakah
Berpotensi Menular ke Anak?
Asam Folat Turunkan Risiko Cacat pada Janin
Universitas Sumatera Utara
Tabel 4.4. Contoh Artikel Hasil dari Clustering pada Korpus C0 Lanjutan
Cluster Jumlah
Artikel Tema Cluster
Judul Artikel
16 3
Bayi, Susu Hamil
Haruskah
Anak Mendapat
Kolostrum Saat Lahir?
Teh Oolong dan Berbagai Manfaat Kesehatannya
Ibu yang Gemar Konsumsi Susu
Saat Hamil Ini Lahirkan Bayi Montok 5,9 kg
17 1
Susu Hamil
Amankah Menyusui Saat Hamil? Begini Penjelasan Medisnya
19 2
Bayi, Susu, ASI Hamil
ASI - Sebuah Mukjizat Bagi Ibu
dan Bayi
Stimulasi Puting Saat Hamil Bisa Picu Kecacatan Janin, Mitos atau
Fakta?
Dari Tabel 4.4 dapat dilihat bahwa cluster yang berdekatan biasanya memiliki topik yang mirip, namun dibedakan dengan satu atau lebih term yang menjadi
pembedanya. Seperti pada cluster 16 dan cluster 17 memiliki topik yang sama yaitu “susu hamil” namun pada cluster 16 memiliki term “bayi” pada topiknya. Contoh
artikel yang masuk kedalam setiap cluster yang terdapat pada korpus C1 yaitu kelompok kesehatan umum dapat dilihat pada Tabel 4.5.
Tabel 4.6. Contoh Artikel Hasil dari Clustering pada Korpus C1 Cluster
Jumlah Artikel
Tema Cluster Judul Artikel
284 Lainnya
Diet TLC
14 Hal Tentang Buta Warna
7 Manfaat Serat Bagi Tubuh
2 53
Kanker
4 Faktor Penyebab Timbulnya Kanker Kulit
Cegah Kanker Ovarium Dengan
Mengkonsumsi ini
Lebih Aktif
Bergerak Cegah
Kanker 4
22 Berat Badan
7 Penyebab Kenaikan Berat Badan
Universitas Sumatera Utara
Tabel 4.6. Contoh Artikel Hasil dari Clustering pada Korpus C1 Lanjutan Cluster
Jumlah Artikel
Tema Cluster Judul Artikel
Diet Rendah Karbohidrat Picu
Kematian Dini
Badan Pendek
dan Kurus,
Bagaimana Agar Ideal? 6
9 Serangan
Jantung
Pertolongan Pertama
untuk Serangan Jantung
5 Pemicu Serangan Jantung yang
Mungkin Tidak Anda Duga
Serangan Jantung Tak Selalu Bergejala Nyeri Dada
8 3
Kanker Tekanan
Darah
Kacang-Kacangan, Turunkan
Kolesterol Hingga Cegah Kanker
Manfaat Daun Sirsak
13 Manfaat
Buah Pir
Bagi Kesehatan Tubuh
10 10
Tekanan Darah
Kurang
Vitamin D
Memicu Tekanan Darah Tinggi
Ragam Manfaat Buah Semangka
Bagi Kesehatan Tubuh
7 Nutrisi Penting Yang Sering Terlewatkan Ketika Sedang Diet
12 4
Kanker Payudara
Deteksi Dini Kanker Payudara bagi
masyarakat Kecamatan Mampang Jakarta
Obesitas Dikaitkan Dengan Risiko
10 Jenis Kanker
6 Makanan Sehat Yang Dibutuhkan Wanita
13 8
Kanker Kanker
Payudara
Senyawa Dalam Seledri Mampu Melawan Kanker Payudara
Makanan
Tinggi Serat
Bisa Kurangi Risiko Kanker Payudara
Dari Tabel 4.5 dapat dilihat bahwa cluster yang berdekatan seperti cluster 12 dan cluster 13 memiliki tema yang mirip yaitu kanker payudara. Hanya saja pada
cluster 13 terdapat term kanker yang membuat nilai dari cluster 13 berbeda dari cluster 12.
Universitas Sumatera Utara
4.5. Implementasi Sistem Bagian Depan