Metode Observasi Terhadap Data Mobil Den

Metode Observasi Terhadap Data Mobil Dengan Menggunakan
Klasifikasi dan Decision Tree Pada Matlab 7.8.0 (R2009a)
Eva Syamrosbania Lelana1
1

Jurusan Teknik Elektro, Universitas Haluoleo
evalelana33@gmail.com

Abstract — The method of “Observation car data use
classification and decision tree” . intended as a task of data
mining wich for early trials. In this study using data already
provided in matlab. Classification is a method for compiling
data or group data systematicall or according to some rule or
rules that have been set. The decision tree is a classification
method that uses the representation to a tree structure that
contains alternative to solving a problem. The research uses
matlab 7.8.0 (R2009a) application.
Keyword — Statistic Toolbox, Observation, Classification
Trees, Decision Tree, Matlab 7.8.0 (R2009a).
Abstrak — Pada Metode “Observasi Data Mobil Menggunakan
Klasifikasi Dan Pohon Keputusan”. Bertujuan sebagai tugas dari

Data Mining dimana untuk awal percobaan-percobaan. Dalam
penelitian ini menggunakan data yang sudah disediakan di matlab.
Klasifikasi adalah sebuah metode untuk menyusun data atau
mengelompokkan data secara sistematis atau menurut beberapa
aturan atau kaidah yang telah ditetapkan. Pohon Keputusan adalah
suatu metode klasifikasi yang menggunakan representasi untuk
struktur pohon yang berisi alternative-alternatif untuk pemecahan
suatu masalah. Penelitian ini menggunakan aplikasi matlab 7.8.0
(R2009a).
Kata kunci — Statistik Toolbox, Observasi, Klasifikasi, Pohon
Keputusan, Matlab 7.8.0 (R2009a).

I.

PENDAHULUAN

Berkembangnya penggunaan computer dalam bidang
manajemen data menyebabkan akumulasi data dalam jumlah
sangat besar dibeberapa organisasi. Apalagi dengan
berkembangnya persepsi bahwa analisa terhadap data yang

besar ini akan mengubah data pasif menjadi informasi yang
berguna. Salah satu cara untuk melakukan hal itu adalah
denggan menggunakan metode Data Mining atau Knowledge
Discovery in Database.
II. LATAR BELAKANG
Di dalam konsep Data Mining terdapat berbagai cara
dan metode untuk mengekstrak informasi dari data yang
besar. Klasifikasi adalah salah satu metode untuk melakukan
ekstraksi informasi. Tujuan dari klasifikasi ini adalah untuk
menganalisa data input dan membuat model yang akurat
untuk setiap kelasnya berdasarkan data yang ada. Model
kelas tersebut juga digunakan untuk mengklasifikasikan data
tes lain/data tes baru untuk ditentukan label kelasnya.
Terdapat banyak algoritma yang dapat digunakan
untuk melakukan klasifikasi data mining, salah satunya
dengan Jaringan Syaraf Tiruan (JST). JST merupakan suatu
arsitektur jaringan untuk memodelkan cara kerja sistem
syaraf manusia (otak) dalam melaksanakan tugas tertentu.
Pemodelan ini didasari oleh kemampuan otak manusia
dalam mengorganisasi sel-sel penyusunnya atau neuron,


sehingga memiliki kemampuan untuk melaksanakan
tugas-tugas tertentu khususnya pengenalan pola dengan
efektivitas jaringan sangat tinggi[9]. Dalam mencari
arsitektur yang optimal bukanlah hal yang mudah dalam
penggunaan JST. Salah satu kelemahan JST adalah
penentuan arsitektur yang optimal. Yang dimaksud
arsitektur adalah penentuan struktur dan bobot-bobot koneksi
dalam JST.
Evolutionary Algorithms (EAs) adalah algoritmaalgoritma optimasi yang berbasis evolusi dalam dunia
nyata. Oleh karena itu EAs dapat digunakan dalam
optimasi pencarian arsitektur yang optimal dari JST.
Algoritma EAs yang digunakan dalam penelitian ini adalah
Evolution Strategies (ES). Pemilihan algoritma ES
disebabkan kecepatan proses ES lebih baik dibandingkan
dengan Genetic Algorithm[9].
Setiap atribut data memiliki pengaruh yang berbeda-beda
dalam pengklasifikasian data. Hal ini tergantung pada
seberapa besar nilai keinformatifan atau kontribusi suatu
atribut dalam pengklasifikasian data. Sehingga diperlukan

feature selection terhadap atribut yang akan dijadikan
sebagai input dalam pengklasfikasian data menggunakan
JST. Penelitian ini menganalisis metode klasifikasi JST,
yang dipadukan dengan ES dan dengan melakukan proses
feature selection pada saat preprocessing. Metode JST yang
digunakan adalah Feedforward Networks dengan Supervised
Learning.
III. LANDASAN TEORI
A. Data Mining
Data mining adalah suatu proses mengekplorasi dan
menganalisis data dalam jumlah besar baik secara otomatis
maupun semi otomatis untuk mendapatkan suatu pola yang
bermakna dari data. Data mining menjadi penting karena
banyaknya data yang terkumpul saat ini, cepatnya transfer
data yang terjadi pada saat ini serta adanya kebutuhan untuk
dapat mengolah data mentah menjadi data yang bernilai
dengan cepat dan tepat.
B. Matlab
MATLAB (Matrix Laboratory) adalah sebuah lingkungan
komputasi numerikal dan bahasa pemrograman komputer

generasi keempat. Dikembangkan oleh The MathWorks,
MATLAB memungkinkan manipulasi matriks, pem-plot-an
fungsi dan data, implementasi algoritma, pembuatan
antarmuka pengguna, dan peng-antarmuka-an dengan
program dalam bahasa lainnya. Meskipun hanya bernuansa
numerik, sebuah kotak kakas (toolbox) yang menggunakan
mesin simbolik MuPAD, memungkinkan akses terhadap

Page | 1

kemampuan aljabar komputer. Sebuah paket tambahan,
Simulink, menambahkan simulasi grafis multiranah dan
Desain Berdasar-Model untuk sistem terlekat dan dinamik.
Misalkan sistem 2 persamaan dengan 2 variabel seperti
persamaan dibawah ini :
2x – y = 12
(1)
5x + 12 y = 12
..........................................................................................................................................................................


tersebut
kemudian
dibuat
suatu
model
untuk
mengklasifikasikan data. Model tersebut kemudian
digunakan sebagai acuan untuk mengklasifikasikan data-data
yang belum diketahui kelasnya yang biasa disebut dengan test
sets. Beberapa metode klasifikasi adalah dengan
menggunakan pohon keputusan, kaidah (rule), memory based
reasoning, neural networks, Naïve Bayes, dan support vector
machine.
D. Information Gain
Untuk Menghitung information gain, terlebih dahulu kita
harus memahami suatu ukuran yang disebut entropy.
Didalam bidang information theory, kita menggunakan
entropy sebagai suatu parameter untuk mengukur
keberagaman dari suatu kumpulan sampel data Secara
matematis, entropy dirumuskan sebagai berikut :


Gambar 1.1 Tampilan Awal Matlab 7.8.0 (R2009a)
Hingga yang kompleks, seperti mencari akar-akar
polinomial, interpolasi dari sejumlah data, perhitungan
dengan matriks, pengolahan sinyal, dan metoda
numerik.Salah satu aspek yang sangat berguna dari
MATLAB ialah kemampuannya untuk menggambarkan
berbagai jenis grafik, sehingga kita bisa memvisualisasikan
data dan fungsi yang kompleks.Sebagai contoh, tiga gambar
berikut diciptakan dengan command surf di MATLAB[2]

…………….(2)
dimana c adalah jumlah nilai yang ada pada atribut target
(jumlah kelas). Sedangkan, pi menyatakan jumlah sampel
untuk kelas i.
Setelah kita mendapatkan nilai entropy untuk suatu
kumpulan sampel data, maka kita dapat mengukur efektivitas
suatu atribut dalam mengklasifikasikan data. Ukuran
efektivitas ini disebut sebagai information gain. Secara
matematis, information gain dari suatu atribut A, dituliskan

sebagai berikut:

…(3)
Dimana :
A
v
Values (A)
|Sv|
|S|
Entropy (Sv)

: Atribut
: menyatakan suatu nilai yang mungkin
untuk atribut A
: himpunan nilai-nilai yang mungkin
untuk atribut A
: jumlah sampel untuk nilai v
: jumlah seluruh sampel data
: entropy untuk sampel-sampel yang
memiliki nilai v


E. Decision Tree (Pohon Keputusan)

Gambar 1.2 Dimensi Command Surf Pada Matlab

C. Klasifikasi
Klasifikasi adalah suatu proses untuk mengelompokkan
sejumlah data ke dalam kelas-kelas tertentu yang sudah
diberikan berdasarkan kesamaan sifat dan pola yang terdapat
dalam data-data tersebut[4]. Secara umum, proses klasifikasi
dimulai dengan diberikannya sejumlah data yang menjadi
acuan untuk membuat aturan klasifikasi data. Data-data ini
biasa disebut dengan training sets. Dari training sets

Pohon keputusan atau decision tree merupakan teknik
data mining yang digunakan untuk mengeksplorasi data
dengan membagi kumpulan data yang besar menjadi
himpunan record yang lebih kecil dan memperhatikan
variabel tujuannya. [5].
Pada sebuah pohon keputusan setiap node

merepresentasikan atribut yang telah diuji, setiap cabang
merupakan suatu pembagian hasil uji, dan node daun (leaf)
merepresentasikan kelompok kelas tertentu. Level node
teratas dari sebuah pohon keputusan adalah node akar (root)
yang biasanya berupa atribut yang memiliki pengaruh
terbesar pada suatu kelas tertentu. Pada umumnya pohon
keputusan melakukan strategi pencarian secara top-down

Page | 2

Gambar 1.4 Tampilan Matlab saat Terinstal Dengan
Benar
C. Flowchart Dan Program
START

Input Data
Gambar 1.3 Decision Tree (Pohon Keputusan)
IV. METODE PENELITIAN

Klasifikasi Data


Metode yang digunakan dalam penelitian ini adalah
sebagai berikut:
1. Studi Pustaka, yaitu peneliti mencari materi dengan
browsing dan searching lewat internet.
2. Data yang digunakan sebagai percobaan sudah
disediakan di matlab sehingga penulis hanya
menganalisa saja, tidak merekap data dilapangan.
3. Penulis mendesain penulisan jurnal berdasarkan
template yang telah diberikan oleh dosen pemateri.

Menganalisa
Data

Ya
Decision
Tree

A. Alat Dan Bahan Yang Digunakan
Penelitian ini menggunakan Notebook toshiba 64 bit
dengan kapasitas RAM 2 GB serta hard disk 320 GB dengan
kecepatan processor 1.86 GHz. Notebook Toshiba sudah
terinstal dengan windows 7, microsoft office 2007, dan
terinstal aplikasi matlab 7.8.0 (R2009a). Perkembangan
terbaru dari matlab adalah 2016b, Namun penulis tidak
menggunakan matlab 2016b, dikarenakan aplikasi yang
terdownload tidak bisa diinstall. Sehingga dengan kendala
seperti itu penulis tidak bisa menggunakan versi matlab
terbaru.
B. Pengujian Alat Dan Bahan
Tahap Selanjutnya adalah pengujian alat dan bahan.
Dimana jika computer atau notebook Toshiba yang
digunakan tidak ada kendala sampai selesai menganalisa
atau dalam penelitian maka computer atau notebook
Toshiba dalam keadaan normal. Dalam system operasi
matlab 7.8.0 (R2009a) yang terinstall dengan baik dan
benar, maka akan seperti pada gambar berikut :

Tidak

Ya
Tidak
Kesimpulan

END
Keterangan :
Langkah awal adalah dengan membuka matlab dengan
mengklik 2 kali pada aplikasi matlab, kemudian masukkan
data yang sudah tersedia di statistic toolbox pada matlab,
setelah memasukkan data maka data itu akan diklasifikasikan
atau dipengelompokkan, setelah data diklafikasi maka data
tersebut akan dianalisa, jika tidak ingin menganalisa data
maka bisa kembali menginput data baru. Setelah menganalisa
data, maka terbentuk pohon keputusan atau decision tree, jika
ingin membuat kesimpulan maka bisa memilih pilihan “Ya”
jika tidak maka akan langsung berakhir “END”.

Page | 3

V. HASIL DAN PEMBAHASAN
A. Hasil klasifikasi data mobil
Load carsmall
t = classregtree ([MPG Cylinders], origin,……
‘ names’ ,{‘ MPG’

A. Ucapan Terimakasih
Penulis mengucapkan terimakasih kepada dosen
pembimbing yang telah membimbing penulis, kepada orang
tua yang selalu mensupport penulis, dan kepada teman-teman
elektro yang telah membantu dalam penelitian ini

‘ Cyl’ }, ‘ cat’ ,2).

B. Daftar Pustaka

t =
Decision tree for classification
1.

If Cyl = 4 then node 2 else node 3

2.

If MPG