Analisa Performansi menggunakan Algoritma Decision Tree

ANALISA PERFORMANSI MENGGUNAKAN
ALGORITMA DECISSION TREE
TESIS
Oleh
MARIES SWENDY
097038001/ TINF

PROGRAM STUDI MAGISTER (S2) TEKNIK INFORMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SUMATERA UTARA
MEDAN
2012

ANALISA PERFORMANSI MENGGUNAKAN
ALGORITMA DECISSION TREE

TESIS

Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh Gelar
Magister Komputer Dalam Program Studi Magister Teknik
Informatika Pada Program Pascasarjana Fakultas MIPA

Universitas Sumatera Utara

Oleh
MARIES SWENDY
097038001/ TINF

PROGRAM STUDI MAGISTER (S2) TEKNIK INFORMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SUMATERA UTARA
MEDAN
2012

PENGESAHAN TESIS
Judul Tesis

:

ANALISA PERFORMANSI
MENGGUNAKAN
ALGORITMA

DECISSION TREE

Nama Mahasiswa
Nomor Induk Mahasiswa
Program Studi
Fakultas

:
:
:
:

MARIES SWENDY

097038001
Magister (S2) Teknik Informatika
Matematika dan Ilmu Pengetahuan Alam
Universitas Sumatera Utara

Menyetujui

Komisi Pembimbing,

Dr. Erna Budhiarti Nababan, MIT
Anggota

Prof Dr Drs Iryanto M.Si
Ketua

Ketua Program Studi

Dekan

Prof. Dr. Muhammad Zarlis
NIP : 19570701 198601 1 003

Dr. Sutarman, M.Sc
NIP : 19631026 199103 1 001

PERNYATAAN ORISINALITAS


ANALISA PERFORMANSI MENGGUNAKAN ALGORITMA DECISSION TREE

TESIS

Dengan ini penulis nyatakan bahwa penulis mengakui semua karya tesis ini adalah
hasil karya penulis sendiri kecuali kutipan dan ringkasan yang tiap bagiannya telah
dijelaskan sumbernya dengan benar.

Medan, 20 Januari 2012

Maries Swendy
NIM. 097038001

PERNYATAAN PERSETUJUAN PUBLIKASI
KARYA ILMIAH UNTUK KEPENTINGAN
AKADEMIS
Sebagai sivitas akademika Universitas Sumatera Utara, saya yang bertandatangan di
bawah ini:
Nama Mahasiswa


:

MARIES SWENDY

Nomor Induk Mahasiswa

:

097038001

Program Studi

:

Magister (S2) Teknik Informatika

Jenis Karya Ilmiah

:


TESIS

Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada
Universitas Sumatera Utara Hak Bebas Royalti Non-Eksklusif (Non-Exclusive
Royalty Free Right) atas Tesis saya yang berjudul :

ANALISA PERFORMANSI MENGGUNAKAN ALGORITMA DECISSION TREE
Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti NonEksklusifini, Universitas Sumatera Utara berhak menyimpan, mengalih media,
memformat, mengelola dalam bentuk database, merawat dan mempublikasikan Tesis
saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai
penulis dan sebagai pemegang dan atau sebagai pemilik hak cipta.

Medan, 20 Januari 2012

Maries Swendy
NIM. 097038001

Telah diuji pada
Tanggal : 20 Januari 2011


PANITIA PENGUJI TESIS
Ketua

: Prof. Drs Iryanto, M.Si

Anggota

: 1. Dr. Erna Budhiarti Nababan, MIT
2. Prof.Dr.Opim Salim Sitompul
3 . Prof. Dr. Muhammad Zarlis
4. M. Andri Budiman, ST, M.Comp. Sc, M.EM

RIWAYAT HIDUP

DATA PRIBADI

Nama Lengkap

MARIES SWENDY


Tempat dan Tanggal Lahir

Medan, 28 Maret 1985

Alamat Rumah

Jl. Gelatik IX No. 205 Perumnas Mandala Medan
20226

Email

gtalkmaries@gmail.com

Instansi Tempat Bekerja

PT. Telekomunikasi Indonesia, Tbk.

Alamat Kantor

Jl.Putri Hijau No. 1 Medan


DATA PENDIDIKAN
SD

: Madrasah Ibtidaiyah Negeri Medan Denai

Tamat : 1994

SMP

: SLTP Al-Ittihadiyah Medan

Tamat : 2000

SMU

: Negreri 14 Medan

Tamat : 2003


S1

:Teknik Informatika STT Harapan Medan

Tamat : 2008

S2

: PSMTINF PPs FMIPA USU Medan

Tamat : 2012

i

KATA PENGANTAR

Puji syukur penulis panjatkan kehadirat Allah SWT Tuhan Yang Maha
Esa atas segala limpahan erkah, rahmat dan karunia-Nya sehingga Tesis ini dapat
diselesaikan melalui bimbingan, arahan dan bantuan yang diberikan berbagai
pihak khususnya pembimbing, pembanding, para dosen, teman mahasiswa,

khususnya mahasiswa Program Studi Magister (S2) Teknik Informatika di
FMIPA Universitas Sumatera Utara.
Tesis yang berjudul: “Analisa Performansi menggunakan Algoritma
Decision Tree” adalah merupakan Tesis dan syarat untuk memperoleh gelar
Magister Komputer dalam Program Studi Magister (S2) Teknik Informatika pada
Program Pascasarjana FMIPA Universitas Sumatera Utara. Penulis mengucapkan
terima kasih yang sebesar-besarnya kepada:
Orangtua tercinta Ayahanda dan Ibunda serta semua keluarga yang
senantiasa mendoakan, dan memberikan dorongan kepada penulis.
Rektor Universitas Sumatera Utara, Prof. Dr. dr. Syahril Pasaribu,
DTM&H, M,Sc (CTM), Sp. A(K) atas kesempatan yang diberikan kepada penulis
untuk mengikuti dan menyelesaikan pendidikan Program Magister (S2).
Dekan FMIPA Universitas Sumatera Utara, Dr. Sutarman, M.Sc atas
kesempatan yang diberikan kepada penulis menjadi mahasiswa Program Magister
(S2) pada Program Pascasarjana FMIPA Universitas Sumatera Utara.
Ketua Program Studi Magister (S2) Teknik Informatika, Prof. Dr.
Muhammad Zarlis, Sekretaris Program Studi Magister (S2) Teknik Informatika
M. Andri Budiman, ST, M. Comp. Sc, M.EM beserta seluruh Staff Pengajar pada
Program Studi Magister (S2) Teknik Informatika Program Pascasarjana FMIPA
Universitas Sumatera Utara, yang telah bersedia membimbing penulis, sehingga
dapat menyelesaikan pendidikan tepat pada waktunya.
Terima kasih yang tak terhingga dan penghargaan setinggi-tingginya
penulis ucapkan kepada Prof. Dr. Iryanto M.Si selaku Pembimbing Utama dan Dr.
Erna Budhiarti Nababan. MIT selaku Pembimbing Anggota yang dengan penuh

ii

kesabaran membimbing, memberikan dukungan moril, memotivasi kritik dan
saran serta memberikan bahan-bahan yang berkaitan dengan penyusunan tesis ini
sehingga penulis dapat menyelesaikan tesis ini dengan baik.
Terimakasih yang tak terhingga dan penghargaan setinggi-tingginya
penulis ucapkan kepada Prof. Dr. Muhammad Zarlis, Prof. Dr. Opim, M.Sc dan
M. Andri Budiman, ST, M. Comp. Sc, M.EM sebagai pembanding, yang telah
memberikan kritik dan saran serta arahan yang baik demi penyelesaian tesis ini.
Seluruh Staf Pengajar dan Administrasi, Program Studi Magister (S2)
Teknik Informatika Program Pascasarjana FMIPA Universitas Sumatera Utara
yang telah memberikan bantuan dan pelayanan yang baik kepada penulis selama
mengikuti perkuliahan.
Rekan Mahasiswa Angkatan Pertama Program Studi Magister (S2) Teknik
Informatika Komputer FMIPA Universitas Sumatera Utara yang telah banyak
membantu penulis selama mengikuti perkuliahan.
Kepada semua pihak yang tidak dapat penulis sebutkan satu persatu dalam
tesis ini, terima kasih atas segala bantuan yang diberikan. Sekecil apapun bantuan
yang diberikan kepada penulis turut menghantarkan penulis untuk menyelesaikan
pendidikan yang ditempuh selama ini. Dengan segala kekurangan dan kerendahan
hati, semoga segala bantuan yang diberikan mendapat balasan oleh Allah SWT
Tuhan Yang Maha Kuasa.
Penulis menyadari bahwa tesis ini masih jauh dari sempurna, untuk itu
sangat diharapkan masukan, kritik dan saran agar tesis ini bisa lebih baik lagi di
masa yang akan datang serta dapat memberi manfaat.

Medan,
Penulis,

Januari 2012

Maries Swendy

iii

ABSTRAK
Penerapan data mining dalam mengambil informasi yang lebih berguna
dibandingkan dengan peggunaan basis data konvensional dengan kebutuhan
tambahan berupa analisa pemikiran dari user/ pelaku sistem dari sebuah
organisasi/ perusahaan. Tesis ini mengusulkan sebuah tools tools yang dapat
melakukan monitoring dan tracking performansi melalui model aturan
keterhubungan data survei, data hasil audit dengan data revenue pada organisasi/
perusahaan. Faktor-faktor mana yang lebih dominan yang mempengaruhi growth
revenue sebagai variabel tingkat kinerja organisasi/ performansi perusahaan
tersebut. Penggunaan variabel tersebut dengan sistem skala dapat membantu
menentukan tingkat performansi yang beragam pada data growth revenue untuk
perhitungan pada algoritma pohon klasifikasi dan regresi (CART).
Kata Kunci: decision tree, regresi, performansi, pohon klasifikasi dan regresi
(CART)

iv

PERFORMANCE ANALYSIS USING
DECISION TREE ALGORITHMS

ABSTRACT
Data mining have been implemented to get the information more usefull then
using conventional database combine with using human analysis as the user from
the organization/ company systems. This Thesis proposes a tools to monitoring
and tracking performance from the connectedness rule model of the results of
survey, audit data and revenue’s data in organization/ company systems. The
more dominant factors that influence the growth revenue as the variable of
organization/ company performance. The Variabel using scale system to helps
finding kind of performance level in growth revenue using classification and
regression tree (CART)
Key Word : decision tree, regression, performance, classification and regression
tree (CART)

v

DAFTAR ISI
Halaman
PENGESAHAN

iii

KATA PENGANTAR

iv

ABSTRAK

vi

ABSTRACT

vii

DAFTAR ISI

viii

DAFTAR TABEL

x

DAFTAR GAMBAR

xi

BAB I

PENDAHULUAN

1

1.1

Latar Belakang

1

1.2

Perumusan Masalah

3

1.3.

Batasan Masalah

4

1.4

Tujuan Penelitian

4

1.5

Manfaat Penelitian

5

1.6

Metodologi Penelitian

5

1.7

Sistematika Penulisan

6

BAB II

TINJAUAN PUSTAKA

8

2.1

Pengertian Data Mining

8

2.2

Tahapan Data Mining

10

2.3

Teknik Data Mining

13

2.4

Kernel K-Mean

17

2.4.1 Cluster Validity Criterion

19

2.4.2 Elbow Criterion (RMSSDT dan RS)

19

2.5

CART (Classification and Regression Trees)

20

2.6

Paket Statistik untuk Ilmu Sosial

24

2.7

Komunitas Rapidminer

24

2.8

Malcolm Baldrige National Quality Award

25

2.9

Penelitian yang relevan

28

vi

BAB III

METODOLOGI

33

3.1.

Selection Data

33

3.1.1 Data Revenue

34

3.1.2 Data Customer Satisfaction Index (CSI)

35

3.1.3 Data Kriteria Baldridge

37

Preprocessing Data

39

3.2.1 Data Revenue

40

3.2.2 Data Customer Satisfaction Index (CSI)

41

3.2.3 Data Kriteria Baldridge

42

3.2.4. Validasi Data

42

Transformasi Data

47

3.3.1 Clustering pada data Revenue

48

3.3.2 Penggabungan Data

51

3.3.3 Data Mining

52

HASIL DAN PEMBAHASAN

57

4.1.

Pendahuluan

57

4.2

Hasil Percobaan

58

4.2.1 Cronbach’s Alpha

58

4.2.2 Teknik Analisis Regresi Linear Berganda

59

Percobaan Data Keseluruhan

62

3.2

3.3

BAB IV

4.3

BAB V

KESIMPULAN DAN SARAN

71

5.1.

Kesimpulan

71

5.2

Saran

71

DAFTAR PUSTAKA
LAMPIRAN

72

vii

DAFTAR TABEL

Nomor

J udul

Halaman

2.1

Tabel Perbandingan Penelitian yang Relevan

30

3.1

Atribut Data Revenue

35

3.2

Atribut Data CSI

37

3.3

Atribut Data Kriteria Baldridge

39

3.4

Data yang tidak memenuhi syarat

40

3.5

Data Growth Revenue

41

3.6

Data CSI

42

3.7

Data Kriteria Baldridge

42

3.8

Signifikan dan Reliabilitas Statistik Sampel
Data Uner 1 Sumatera

43

3.9

Descriptive Statistik Data Uner 1 Sumatera

44

3.10

Model Summary Sampel Data Uner 1 Sumatera

45

3.11

Corelations Statistik Sampel Data Uner 1 Sumatera

45

3.12

Rekap laporan Statistik Sampel Data Uner 1 Sumatera

46

3.13

Anova Statistik Sampel Data Uner 1 Sumatera

47

3.14

Data Rekap Uner 1 Sumatera sebelum transformasi

51

3.15

Data Rekap Uner 1 Sumatera setelah transformasi

51

4.1

Signifikan dan Reliabilitas Statistik Data Uner 1 Sumatera 58

4.2

Descriptive Statistik Data Uner 1 Sumatera

59

4.3

Model Summary Data Uner 1 Sumatera

60

4.4

Corelations Statistik Data

60

4.5

Rekap laporan Statistik Data Uner 1 Sumatera

61

4.6

Anova Statistik Data Uner 1 Sumatera

62

viii

DAFTAR GAMBAR

Nomor

J udul

Halaman

1.1

Kerangka pemikiran penelitian

6

2.1

Proses Data Mining

11

2.2

Alur produksi data mining

12

2.3

Penggolongan teknik data mining

13

2.4

Tahapan Teknik Klasifikasi

14

2.5

Tahapan Teknik Asosiasi

15

2.6

Proses clustering

16

2.7

Diagram CART

21

2.8

Struktur Administrasi MBNQA

26

2.9

Kerangka Kerja MBCfPE

27

3.1

Flowchart KDD process

33

3.2

Capture Hasil Kluster dengan Kernel K-Mean

50

3.3

Capture Diagram Hasil Kluster dengan Kernel K-Mean50

3.4

Algoritma CART

53

3.5

Grafik Decision tree pada data sampel

54

3.6

Profil Predikat pada data sampel

56

4.1

Proses penginputan Data Keseluruhan

63

4.2

Proses Linkage Data Keseluruhan

64

4.3

Tampilan Proses pada tab XML di Rapidminer

65

4.4

Tampilan Pohon pada tab XML di Rapidminer

66

4.5

Decision tree Data Keseluruhan

67

4.6

Profil Predikat pada data keseluruhan

68

4.7

Hasil Korelasi variabel revenue dengan CSI

69

4.8

Hasil Korelasi variabel Baldridge dengan CSI

69

4.9

Hasil Korelasi variabel revenue dengan Baldridge

70