Gambar 3. 6 Raw data yang tidak valid 3.2.3
Data Selection
Pada tahap ini dilakukan proses seleksi pada data untuk melihat kecenderungan data dikarenakan data yang terdapat pada tabel hasil scraping memiliki tingkat kepentingan
yang berbeda. Hasil dari proses ini adalah menghasilkan beberapa parameter atribut dalam penentuan kualitas udara yaitu NO, SO
2
, CO, O
3
, dan Curah Hujan.
3.3 Perancangan Server Cluster Raspberry Pi
Pada penelitian ini sistem yang dibangun akan diterapkan pada sebuah cluster server grid berbasis raspberry pi yang terdiri dari satu buah node master dan empat buah
node slave seperti pada gambar 3.6. Raspberry pi yang dipakai pada sistem ini adalah lima buah raspberry pi 2.
Raspberry pi yang telah diinstall sistem operasi raspbian kemudian dihubungkan pada jaringan. Penggunaan jaringan bertujuan agar setiap node raspberry
dapat berkomunikasi dalam melakukan eksekusi proses secara terdistribusi. Masing masing raspberry pi telah membutuhkan beberapa aplikasi dan library tambahan yang
wajib diinstall yaitu : a.
Nfs-kernel-server dan nfs-client b.
Portmapper c.
Passwordless ssh, dan d.
Mpich 2 e.
Python 2.7.12 dan python 3.5 Setelah paket paket aplikasi di atas telah diinstall, lalu node-node raspberry dapat
dibangun dengan arsitektur seperti pada gambar 3.5 :
Universitas Sumatera Utara
Gambar 3. 7 Arsitektur Raspberry Pi Server Grid 3.4
Naïve Bayes Classifier
Pada tahapan ini, data hasil web scraping yang telah diproses menjadi dataset untuk training dan testing kemudian diolah untuk dapat diklasifikasikan menggunakan
algoritma naïve bayes classifire. Algoritma ini akan menghitung nilai probabilitas dari range data per minggu, lalu mengklasifikasikannya berdasarkan 6 tingkatan nilai AQI.
Dalam melakukan implementasi algoritma Naïve Bayes perlu diperhatikan rasio pembagian data training dan data testing serta tingkat akurasi prediksi hasil klasifikasi.
Sebagai contoh untuk melakukan klasifikasi data dalam 1 hari dengan data seperti pada gambar 3.6
Dengan menggunakan teorema Bayes, kita dapat melakukan kalkulasi nilai rata-rata tertinggi dari beberapa parameter. Pada gambar 3.6 terlihat secara jelas
bahwa data untuk parameter PM2.5 memiliki nilai yang sangat tinggi dibandingkan dengan yang lain.
3.1
Universitas Sumatera Utara
Gambar 3. 8 Data AQI selama 24 jam
Universitas Sumatera Utara
Berdasarkan rumus, langkah selanjutnya yang dilakukan adalah : 1.
Melakukan konversi data polutan PM2.5 pada gambar 3.6 menjadi tabel 3.1 :
Tabel 3. 1Tabel Frekuensi AQI Level selama 24 Jam Level
Frekuensi
Good Moderate
Unhealthy For Sensitive Groups
Unhealthy 7
Very Unhealthy 17
Hazardous
Total Data 24
2. Buat Tabel kemungkinan berdasarkan tabel frekuensi 3.1 menjadi tabel 3.2
Tabel 3. 2 Tabel Kemungkinan Berdasarkan tabel frekuensi Level
Frekuensi Kemungkinan
Good 024
Moderate 024
Unhealthy For Sensitive Groups
024 Unhealthy
7 724
0.29 Very Unhealthy
17 1724
0.70 Hazardous
024
Total Data 24
Universitas Sumatera Utara
3. Gunakan Rumus Bayessian rumus 2.2 untuk melakukan kalkulasi
probabilitas akhir dari setiap kelas. Kelas dengan probabilitas akhir tertinggi kemungkinan merupakan hasil prediksi klasifikasi. Dalam hal ini ada 2 kelas
yang memiliki nilai probabilitas lebih tinggi dari kelas lainnya yaitu :
�������ℎ����ℎ� = 7
24 = 0.29
�����������ℎ����ℎ� = 17
24 = 0.70
Berdasarkan contoh Prior Probabilitas di atas, diasumsikan untuk objek baru yang akan diklasifikasikan akan berada diantara dua kelas tersebut. Kemudian kita
dapat menghitung kemungkinan dengan perbandingan 1 : 3 dimana dalam sebuah himpunan terdapat 1 objek dengan kemungkinan Unhealthy dan 3 objek dengan
kemungkinan Very Unhealthy.
����ℎ����|��ℎ����ℎ� = 1
7 = 0.14
����ℎ����|������ℎ����ℎ� = 3
17 = 0.17
Maka kemungkinan akhir objek X untuk berada dalam kategori Unhealthy adalah: ����������|��ℎ����ℎ� =
7 24
× 1
7 = 0.04
Sementara kemungkinan akhir objek X untuk berada dalam kategori Very Unhealthy adalah :
����������|������ℎ����ℎ� = 17
24 ×
3 17
= 0.303
Maka, objek X dapat diklasifikasikan sebagai Very Unhealthy dikarenakan kelas tersebut memiliki kemungkinan posterior yang terbesar.
3.2
3.3
3.5
3.6
3.7 3.4
Universitas Sumatera Utara
3.5 Perancangan Antarmuka Sistem