Klasifikasi Kualitas Udara Menggunakan Naïve Bayes Classifier Pada Sistem Terdistribusi Raspberry Pi Cluster Server

ABSTRAK

Kondisi udara dipengaruhi oleh banyaknya polusi yang terjadi di suatu daerah seperti
materi partikel, ozon, nitrogen oksida dan karbon dioksida. Polutan - polutan tersebut
memiliki nilai standar yang telah dikategorikan disebut dengan AQI (Air Quality
Index). Nilai polutan yang bervariasi pada rentang waktu tertentu akan menyebabkan
kualitas udara menjadi sulit untuk diklasifikasikan ke dalam kategori AQI. Sistem
terdistribusi seperti cluster machine memiliki peforma yang baik dalam melakukan
pengelolaan data secara terdistribusi. Raspberry pi yang dibangun secara cluster
dapat meningkatkan peforma pemrosesan dan sumber daya yang dibutuhkan dalam
pengelolaan data yang besar dan bervariasi. Penelitian ini dilakukan dengan
menerapkan metode Naïve Bayes pada raspberry pi cluster server dimana data yang
telah dikumpulkan menggunakan metode web scraping akan dibagikan ke setiap
slave node cluster, kemudian master node mengirimkan sinyal untuk mengelola data.
Setelah melakukan penelitian dan pembangunan aplikasi ini, dapat diambil
kesimpulan dengan melakukan implementasi Naïve Bayes pada server cluster, dapat
dilakukan pembangunan sebuah model pengumpulan data dan klasifikasi pada
sistem terdistribusi serta memberikan hasil klasifikasi kualitas udara dengan akurasi
98%.
Kata kunci: Web Scraping, Naïve Bayes, Cluster Server, Klasifikasi, Air Quality.


Universitas Sumatera Utara

AIR QUALITY CLASSIFICATION USING NAÏVE BAYES
CLASSIFIER ON DISTRIBUTED SYSTEM RASPBERRY PI
CLUSTER SERVER

ABSTRACT

The air condition is influenced by the amount of pollution that occurred in a specific
area, there are particulate matter, ozone, nitrogen oxides, and carbon dioxide. These
pollutants has a standard categorized value called the AQI (Air Quality Index).
Values of pollutants varies in specified time span, causing the air quality is difficult
to be classified into categories of AQI. Distributed system such as cluster machine
has a good performance in order to manage big data in distributed ways. The
Raspberry pi that is being built as cluster can increase the performance of processing
and resources that is needed to manage varies big data. This study was completed by
implementing the Naïve Bayes method on raspberry pi cluster server where the
collected data using web scraping method will be distributed to each slave node
cluster, and then the master node will send the signal to process the data. After
conducting research and development of this application, it can be concluded that by

implementing the Naïve Bayes on cluster server, we can build a model of collecting
data and classification on distributed system and it also can give the result of air
quality classification with 98% accuracy.
Keywords : Web Scraping, Naïve Bayes, Cluster Server, Classification, Air Quality

Universitas Sumatera Utara