Analisa Performansi menggunakan Algoritma Decision Tree
ANALISA PERFORMANSI MENGGUNAKAN
ALGORITMA DECISSION TREE
TESIS
Oleh
MARIES SWENDY
097038001/ TINF
PROGRAM STUDI MAGISTER (S2) TEKNIK INFORMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SUMATERA UTARA
MEDAN
2012
ANALISA PERFORMANSI MENGGUNAKAN
ALGORITMA DECISSION TREE
TESIS
Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh Gelar
Magister Komputer Dalam Program Studi Magister Teknik
Informatika Pada Program Pascasarjana Fakultas MIPA
Universitas Sumatera Utara
Oleh
MARIES SWENDY
097038001/ TINF
PROGRAM STUDI MAGISTER (S2) TEKNIK INFORMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SUMATERA UTARA
MEDAN
2012
PENGESAHAN TESIS
Judul Tesis
:
ANALISA PERFORMANSI
MENGGUNAKAN
ALGORITMA
DECISSION TREE
Nama Mahasiswa
Nomor Induk Mahasiswa
Program Studi
Fakultas
:
:
:
:
MARIES SWENDY
097038001
Magister (S2) Teknik Informatika
Matematika dan Ilmu Pengetahuan Alam
Universitas Sumatera Utara
Menyetujui
Komisi Pembimbing,
Dr. Erna Budhiarti Nababan, MIT
Anggota
Prof Dr Drs Iryanto M.Si
Ketua
Ketua Program Studi
Dekan
Prof. Dr. Muhammad Zarlis
NIP : 19570701 198601 1 003
Dr. Sutarman, M.Sc
NIP : 19631026 199103 1 001
PERNYATAAN ORISINALITAS
ANALISA PERFORMANSI MENGGUNAKAN ALGORITMA DECISSION TREE
TESIS
Dengan ini penulis nyatakan bahwa penulis mengakui semua karya tesis ini adalah
hasil karya penulis sendiri kecuali kutipan dan ringkasan yang tiap bagiannya telah
dijelaskan sumbernya dengan benar.
Medan, 20 Januari 2012
Maries Swendy
NIM. 097038001
PERNYATAAN PERSETUJUAN PUBLIKASI
KARYA ILMIAH UNTUK KEPENTINGAN
AKADEMIS
Sebagai sivitas akademika Universitas Sumatera Utara, saya yang bertandatangan di
bawah ini:
Nama Mahasiswa
:
MARIES SWENDY
Nomor Induk Mahasiswa
:
097038001
Program Studi
:
Magister (S2) Teknik Informatika
Jenis Karya Ilmiah
:
TESIS
Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada
Universitas Sumatera Utara Hak Bebas Royalti Non-Eksklusif (Non-Exclusive
Royalty Free Right) atas Tesis saya yang berjudul :
ANALISA PERFORMANSI MENGGUNAKAN ALGORITMA DECISSION TREE
Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti NonEksklusifini, Universitas Sumatera Utara berhak menyimpan, mengalih media,
memformat, mengelola dalam bentuk database, merawat dan mempublikasikan Tesis
saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai
penulis dan sebagai pemegang dan atau sebagai pemilik hak cipta.
Medan, 20 Januari 2012
Maries Swendy
NIM. 097038001
Telah diuji pada
Tanggal : 20 Januari 2011
PANITIA PENGUJI TESIS
Ketua
: Prof. Drs Iryanto, M.Si
Anggota
: 1. Dr. Erna Budhiarti Nababan, MIT
2. Prof.Dr.Opim Salim Sitompul
3 . Prof. Dr. Muhammad Zarlis
4. M. Andri Budiman, ST, M.Comp. Sc, M.EM
RIWAYAT HIDUP
DATA PRIBADI
Nama Lengkap
MARIES SWENDY
Tempat dan Tanggal Lahir
Medan, 28 Maret 1985
Alamat Rumah
Jl. Gelatik IX No. 205 Perumnas Mandala Medan
20226
Email
gtalkmaries@gmail.com
Instansi Tempat Bekerja
PT. Telekomunikasi Indonesia, Tbk.
Alamat Kantor
Jl.Putri Hijau No. 1 Medan
DATA PENDIDIKAN
SD
: Madrasah Ibtidaiyah Negeri Medan Denai
Tamat : 1994
SMP
: SLTP Al-Ittihadiyah Medan
Tamat : 2000
SMU
: Negreri 14 Medan
Tamat : 2003
S1
:Teknik Informatika STT Harapan Medan
Tamat : 2008
S2
: PSMTINF PPs FMIPA USU Medan
Tamat : 2012
i
KATA PENGANTAR
Puji syukur penulis panjatkan kehadirat Allah SWT Tuhan Yang Maha
Esa atas segala limpahan erkah, rahmat dan karunia-Nya sehingga Tesis ini dapat
diselesaikan melalui bimbingan, arahan dan bantuan yang diberikan berbagai
pihak khususnya pembimbing, pembanding, para dosen, teman mahasiswa,
khususnya mahasiswa Program Studi Magister (S2) Teknik Informatika di
FMIPA Universitas Sumatera Utara.
Tesis yang berjudul: “Analisa Performansi menggunakan Algoritma
Decision Tree” adalah merupakan Tesis dan syarat untuk memperoleh gelar
Magister Komputer dalam Program Studi Magister (S2) Teknik Informatika pada
Program Pascasarjana FMIPA Universitas Sumatera Utara. Penulis mengucapkan
terima kasih yang sebesar-besarnya kepada:
Orangtua tercinta Ayahanda dan Ibunda serta semua keluarga yang
senantiasa mendoakan, dan memberikan dorongan kepada penulis.
Rektor Universitas Sumatera Utara, Prof. Dr. dr. Syahril Pasaribu,
DTM&H, M,Sc (CTM), Sp. A(K) atas kesempatan yang diberikan kepada penulis
untuk mengikuti dan menyelesaikan pendidikan Program Magister (S2).
Dekan FMIPA Universitas Sumatera Utara, Dr. Sutarman, M.Sc atas
kesempatan yang diberikan kepada penulis menjadi mahasiswa Program Magister
(S2) pada Program Pascasarjana FMIPA Universitas Sumatera Utara.
Ketua Program Studi Magister (S2) Teknik Informatika, Prof. Dr.
Muhammad Zarlis, Sekretaris Program Studi Magister (S2) Teknik Informatika
M. Andri Budiman, ST, M. Comp. Sc, M.EM beserta seluruh Staff Pengajar pada
Program Studi Magister (S2) Teknik Informatika Program Pascasarjana FMIPA
Universitas Sumatera Utara, yang telah bersedia membimbing penulis, sehingga
dapat menyelesaikan pendidikan tepat pada waktunya.
Terima kasih yang tak terhingga dan penghargaan setinggi-tingginya
penulis ucapkan kepada Prof. Dr. Iryanto M.Si selaku Pembimbing Utama dan Dr.
Erna Budhiarti Nababan. MIT selaku Pembimbing Anggota yang dengan penuh
ii
kesabaran membimbing, memberikan dukungan moril, memotivasi kritik dan
saran serta memberikan bahan-bahan yang berkaitan dengan penyusunan tesis ini
sehingga penulis dapat menyelesaikan tesis ini dengan baik.
Terimakasih yang tak terhingga dan penghargaan setinggi-tingginya
penulis ucapkan kepada Prof. Dr. Muhammad Zarlis, Prof. Dr. Opim, M.Sc dan
M. Andri Budiman, ST, M. Comp. Sc, M.EM sebagai pembanding, yang telah
memberikan kritik dan saran serta arahan yang baik demi penyelesaian tesis ini.
Seluruh Staf Pengajar dan Administrasi, Program Studi Magister (S2)
Teknik Informatika Program Pascasarjana FMIPA Universitas Sumatera Utara
yang telah memberikan bantuan dan pelayanan yang baik kepada penulis selama
mengikuti perkuliahan.
Rekan Mahasiswa Angkatan Pertama Program Studi Magister (S2) Teknik
Informatika Komputer FMIPA Universitas Sumatera Utara yang telah banyak
membantu penulis selama mengikuti perkuliahan.
Kepada semua pihak yang tidak dapat penulis sebutkan satu persatu dalam
tesis ini, terima kasih atas segala bantuan yang diberikan. Sekecil apapun bantuan
yang diberikan kepada penulis turut menghantarkan penulis untuk menyelesaikan
pendidikan yang ditempuh selama ini. Dengan segala kekurangan dan kerendahan
hati, semoga segala bantuan yang diberikan mendapat balasan oleh Allah SWT
Tuhan Yang Maha Kuasa.
Penulis menyadari bahwa tesis ini masih jauh dari sempurna, untuk itu
sangat diharapkan masukan, kritik dan saran agar tesis ini bisa lebih baik lagi di
masa yang akan datang serta dapat memberi manfaat.
Medan,
Penulis,
Januari 2012
Maries Swendy
iii
ABSTRAK
Penerapan data mining dalam mengambil informasi yang lebih berguna
dibandingkan dengan peggunaan basis data konvensional dengan kebutuhan
tambahan berupa analisa pemikiran dari user/ pelaku sistem dari sebuah
organisasi/ perusahaan. Tesis ini mengusulkan sebuah tools tools yang dapat
melakukan monitoring dan tracking performansi melalui model aturan
keterhubungan data survei, data hasil audit dengan data revenue pada organisasi/
perusahaan. Faktor-faktor mana yang lebih dominan yang mempengaruhi growth
revenue sebagai variabel tingkat kinerja organisasi/ performansi perusahaan
tersebut. Penggunaan variabel tersebut dengan sistem skala dapat membantu
menentukan tingkat performansi yang beragam pada data growth revenue untuk
perhitungan pada algoritma pohon klasifikasi dan regresi (CART).
Kata Kunci: decision tree, regresi, performansi, pohon klasifikasi dan regresi
(CART)
iv
PERFORMANCE ANALYSIS USING
DECISION TREE ALGORITHMS
ABSTRACT
Data mining have been implemented to get the information more usefull then
using conventional database combine with using human analysis as the user from
the organization/ company systems. This Thesis proposes a tools to monitoring
and tracking performance from the connectedness rule model of the results of
survey, audit data and revenue’s data in organization/ company systems. The
more dominant factors that influence the growth revenue as the variable of
organization/ company performance. The Variabel using scale system to helps
finding kind of performance level in growth revenue using classification and
regression tree (CART)
Key Word : decision tree, regression, performance, classification and regression
tree (CART)
v
DAFTAR ISI
Halaman
PENGESAHAN
iii
KATA PENGANTAR
iv
ABSTRAK
vi
ABSTRACT
vii
DAFTAR ISI
viii
DAFTAR TABEL
x
DAFTAR GAMBAR
xi
BAB I
PENDAHULUAN
1
1.1
Latar Belakang
1
1.2
Perumusan Masalah
3
1.3.
Batasan Masalah
4
1.4
Tujuan Penelitian
4
1.5
Manfaat Penelitian
5
1.6
Metodologi Penelitian
5
1.7
Sistematika Penulisan
6
BAB II
TINJAUAN PUSTAKA
8
2.1
Pengertian Data Mining
8
2.2
Tahapan Data Mining
10
2.3
Teknik Data Mining
13
2.4
Kernel K-Mean
17
2.4.1 Cluster Validity Criterion
19
2.4.2 Elbow Criterion (RMSSDT dan RS)
19
2.5
CART (Classification and Regression Trees)
20
2.6
Paket Statistik untuk Ilmu Sosial
24
2.7
Komunitas Rapidminer
24
2.8
Malcolm Baldrige National Quality Award
25
2.9
Penelitian yang relevan
28
vi
BAB III
METODOLOGI
33
3.1.
Selection Data
33
3.1.1 Data Revenue
34
3.1.2 Data Customer Satisfaction Index (CSI)
35
3.1.3 Data Kriteria Baldridge
37
Preprocessing Data
39
3.2.1 Data Revenue
40
3.2.2 Data Customer Satisfaction Index (CSI)
41
3.2.3 Data Kriteria Baldridge
42
3.2.4. Validasi Data
42
Transformasi Data
47
3.3.1 Clustering pada data Revenue
48
3.3.2 Penggabungan Data
51
3.3.3 Data Mining
52
HASIL DAN PEMBAHASAN
57
4.1.
Pendahuluan
57
4.2
Hasil Percobaan
58
4.2.1 Cronbach’s Alpha
58
4.2.2 Teknik Analisis Regresi Linear Berganda
59
Percobaan Data Keseluruhan
62
3.2
3.3
BAB IV
4.3
BAB V
KESIMPULAN DAN SARAN
71
5.1.
Kesimpulan
71
5.2
Saran
71
DAFTAR PUSTAKA
LAMPIRAN
72
vii
DAFTAR TABEL
Nomor
J udul
Halaman
2.1
Tabel Perbandingan Penelitian yang Relevan
30
3.1
Atribut Data Revenue
35
3.2
Atribut Data CSI
37
3.3
Atribut Data Kriteria Baldridge
39
3.4
Data yang tidak memenuhi syarat
40
3.5
Data Growth Revenue
41
3.6
Data CSI
42
3.7
Data Kriteria Baldridge
42
3.8
Signifikan dan Reliabilitas Statistik Sampel
Data Uner 1 Sumatera
43
3.9
Descriptive Statistik Data Uner 1 Sumatera
44
3.10
Model Summary Sampel Data Uner 1 Sumatera
45
3.11
Corelations Statistik Sampel Data Uner 1 Sumatera
45
3.12
Rekap laporan Statistik Sampel Data Uner 1 Sumatera
46
3.13
Anova Statistik Sampel Data Uner 1 Sumatera
47
3.14
Data Rekap Uner 1 Sumatera sebelum transformasi
51
3.15
Data Rekap Uner 1 Sumatera setelah transformasi
51
4.1
Signifikan dan Reliabilitas Statistik Data Uner 1 Sumatera 58
4.2
Descriptive Statistik Data Uner 1 Sumatera
59
4.3
Model Summary Data Uner 1 Sumatera
60
4.4
Corelations Statistik Data
60
4.5
Rekap laporan Statistik Data Uner 1 Sumatera
61
4.6
Anova Statistik Data Uner 1 Sumatera
62
viii
DAFTAR GAMBAR
Nomor
J udul
Halaman
1.1
Kerangka pemikiran penelitian
6
2.1
Proses Data Mining
11
2.2
Alur produksi data mining
12
2.3
Penggolongan teknik data mining
13
2.4
Tahapan Teknik Klasifikasi
14
2.5
Tahapan Teknik Asosiasi
15
2.6
Proses clustering
16
2.7
Diagram CART
21
2.8
Struktur Administrasi MBNQA
26
2.9
Kerangka Kerja MBCfPE
27
3.1
Flowchart KDD process
33
3.2
Capture Hasil Kluster dengan Kernel K-Mean
50
3.3
Capture Diagram Hasil Kluster dengan Kernel K-Mean50
3.4
Algoritma CART
53
3.5
Grafik Decision tree pada data sampel
54
3.6
Profil Predikat pada data sampel
56
4.1
Proses penginputan Data Keseluruhan
63
4.2
Proses Linkage Data Keseluruhan
64
4.3
Tampilan Proses pada tab XML di Rapidminer
65
4.4
Tampilan Pohon pada tab XML di Rapidminer
66
4.5
Decision tree Data Keseluruhan
67
4.6
Profil Predikat pada data keseluruhan
68
4.7
Hasil Korelasi variabel revenue dengan CSI
69
4.8
Hasil Korelasi variabel Baldridge dengan CSI
69
4.9
Hasil Korelasi variabel revenue dengan Baldridge
70
ALGORITMA DECISSION TREE
TESIS
Oleh
MARIES SWENDY
097038001/ TINF
PROGRAM STUDI MAGISTER (S2) TEKNIK INFORMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SUMATERA UTARA
MEDAN
2012
ANALISA PERFORMANSI MENGGUNAKAN
ALGORITMA DECISSION TREE
TESIS
Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh Gelar
Magister Komputer Dalam Program Studi Magister Teknik
Informatika Pada Program Pascasarjana Fakultas MIPA
Universitas Sumatera Utara
Oleh
MARIES SWENDY
097038001/ TINF
PROGRAM STUDI MAGISTER (S2) TEKNIK INFORMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SUMATERA UTARA
MEDAN
2012
PENGESAHAN TESIS
Judul Tesis
:
ANALISA PERFORMANSI
MENGGUNAKAN
ALGORITMA
DECISSION TREE
Nama Mahasiswa
Nomor Induk Mahasiswa
Program Studi
Fakultas
:
:
:
:
MARIES SWENDY
097038001
Magister (S2) Teknik Informatika
Matematika dan Ilmu Pengetahuan Alam
Universitas Sumatera Utara
Menyetujui
Komisi Pembimbing,
Dr. Erna Budhiarti Nababan, MIT
Anggota
Prof Dr Drs Iryanto M.Si
Ketua
Ketua Program Studi
Dekan
Prof. Dr. Muhammad Zarlis
NIP : 19570701 198601 1 003
Dr. Sutarman, M.Sc
NIP : 19631026 199103 1 001
PERNYATAAN ORISINALITAS
ANALISA PERFORMANSI MENGGUNAKAN ALGORITMA DECISSION TREE
TESIS
Dengan ini penulis nyatakan bahwa penulis mengakui semua karya tesis ini adalah
hasil karya penulis sendiri kecuali kutipan dan ringkasan yang tiap bagiannya telah
dijelaskan sumbernya dengan benar.
Medan, 20 Januari 2012
Maries Swendy
NIM. 097038001
PERNYATAAN PERSETUJUAN PUBLIKASI
KARYA ILMIAH UNTUK KEPENTINGAN
AKADEMIS
Sebagai sivitas akademika Universitas Sumatera Utara, saya yang bertandatangan di
bawah ini:
Nama Mahasiswa
:
MARIES SWENDY
Nomor Induk Mahasiswa
:
097038001
Program Studi
:
Magister (S2) Teknik Informatika
Jenis Karya Ilmiah
:
TESIS
Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada
Universitas Sumatera Utara Hak Bebas Royalti Non-Eksklusif (Non-Exclusive
Royalty Free Right) atas Tesis saya yang berjudul :
ANALISA PERFORMANSI MENGGUNAKAN ALGORITMA DECISSION TREE
Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti NonEksklusifini, Universitas Sumatera Utara berhak menyimpan, mengalih media,
memformat, mengelola dalam bentuk database, merawat dan mempublikasikan Tesis
saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai
penulis dan sebagai pemegang dan atau sebagai pemilik hak cipta.
Medan, 20 Januari 2012
Maries Swendy
NIM. 097038001
Telah diuji pada
Tanggal : 20 Januari 2011
PANITIA PENGUJI TESIS
Ketua
: Prof. Drs Iryanto, M.Si
Anggota
: 1. Dr. Erna Budhiarti Nababan, MIT
2. Prof.Dr.Opim Salim Sitompul
3 . Prof. Dr. Muhammad Zarlis
4. M. Andri Budiman, ST, M.Comp. Sc, M.EM
RIWAYAT HIDUP
DATA PRIBADI
Nama Lengkap
MARIES SWENDY
Tempat dan Tanggal Lahir
Medan, 28 Maret 1985
Alamat Rumah
Jl. Gelatik IX No. 205 Perumnas Mandala Medan
20226
gtalkmaries@gmail.com
Instansi Tempat Bekerja
PT. Telekomunikasi Indonesia, Tbk.
Alamat Kantor
Jl.Putri Hijau No. 1 Medan
DATA PENDIDIKAN
SD
: Madrasah Ibtidaiyah Negeri Medan Denai
Tamat : 1994
SMP
: SLTP Al-Ittihadiyah Medan
Tamat : 2000
SMU
: Negreri 14 Medan
Tamat : 2003
S1
:Teknik Informatika STT Harapan Medan
Tamat : 2008
S2
: PSMTINF PPs FMIPA USU Medan
Tamat : 2012
i
KATA PENGANTAR
Puji syukur penulis panjatkan kehadirat Allah SWT Tuhan Yang Maha
Esa atas segala limpahan erkah, rahmat dan karunia-Nya sehingga Tesis ini dapat
diselesaikan melalui bimbingan, arahan dan bantuan yang diberikan berbagai
pihak khususnya pembimbing, pembanding, para dosen, teman mahasiswa,
khususnya mahasiswa Program Studi Magister (S2) Teknik Informatika di
FMIPA Universitas Sumatera Utara.
Tesis yang berjudul: “Analisa Performansi menggunakan Algoritma
Decision Tree” adalah merupakan Tesis dan syarat untuk memperoleh gelar
Magister Komputer dalam Program Studi Magister (S2) Teknik Informatika pada
Program Pascasarjana FMIPA Universitas Sumatera Utara. Penulis mengucapkan
terima kasih yang sebesar-besarnya kepada:
Orangtua tercinta Ayahanda dan Ibunda serta semua keluarga yang
senantiasa mendoakan, dan memberikan dorongan kepada penulis.
Rektor Universitas Sumatera Utara, Prof. Dr. dr. Syahril Pasaribu,
DTM&H, M,Sc (CTM), Sp. A(K) atas kesempatan yang diberikan kepada penulis
untuk mengikuti dan menyelesaikan pendidikan Program Magister (S2).
Dekan FMIPA Universitas Sumatera Utara, Dr. Sutarman, M.Sc atas
kesempatan yang diberikan kepada penulis menjadi mahasiswa Program Magister
(S2) pada Program Pascasarjana FMIPA Universitas Sumatera Utara.
Ketua Program Studi Magister (S2) Teknik Informatika, Prof. Dr.
Muhammad Zarlis, Sekretaris Program Studi Magister (S2) Teknik Informatika
M. Andri Budiman, ST, M. Comp. Sc, M.EM beserta seluruh Staff Pengajar pada
Program Studi Magister (S2) Teknik Informatika Program Pascasarjana FMIPA
Universitas Sumatera Utara, yang telah bersedia membimbing penulis, sehingga
dapat menyelesaikan pendidikan tepat pada waktunya.
Terima kasih yang tak terhingga dan penghargaan setinggi-tingginya
penulis ucapkan kepada Prof. Dr. Iryanto M.Si selaku Pembimbing Utama dan Dr.
Erna Budhiarti Nababan. MIT selaku Pembimbing Anggota yang dengan penuh
ii
kesabaran membimbing, memberikan dukungan moril, memotivasi kritik dan
saran serta memberikan bahan-bahan yang berkaitan dengan penyusunan tesis ini
sehingga penulis dapat menyelesaikan tesis ini dengan baik.
Terimakasih yang tak terhingga dan penghargaan setinggi-tingginya
penulis ucapkan kepada Prof. Dr. Muhammad Zarlis, Prof. Dr. Opim, M.Sc dan
M. Andri Budiman, ST, M. Comp. Sc, M.EM sebagai pembanding, yang telah
memberikan kritik dan saran serta arahan yang baik demi penyelesaian tesis ini.
Seluruh Staf Pengajar dan Administrasi, Program Studi Magister (S2)
Teknik Informatika Program Pascasarjana FMIPA Universitas Sumatera Utara
yang telah memberikan bantuan dan pelayanan yang baik kepada penulis selama
mengikuti perkuliahan.
Rekan Mahasiswa Angkatan Pertama Program Studi Magister (S2) Teknik
Informatika Komputer FMIPA Universitas Sumatera Utara yang telah banyak
membantu penulis selama mengikuti perkuliahan.
Kepada semua pihak yang tidak dapat penulis sebutkan satu persatu dalam
tesis ini, terima kasih atas segala bantuan yang diberikan. Sekecil apapun bantuan
yang diberikan kepada penulis turut menghantarkan penulis untuk menyelesaikan
pendidikan yang ditempuh selama ini. Dengan segala kekurangan dan kerendahan
hati, semoga segala bantuan yang diberikan mendapat balasan oleh Allah SWT
Tuhan Yang Maha Kuasa.
Penulis menyadari bahwa tesis ini masih jauh dari sempurna, untuk itu
sangat diharapkan masukan, kritik dan saran agar tesis ini bisa lebih baik lagi di
masa yang akan datang serta dapat memberi manfaat.
Medan,
Penulis,
Januari 2012
Maries Swendy
iii
ABSTRAK
Penerapan data mining dalam mengambil informasi yang lebih berguna
dibandingkan dengan peggunaan basis data konvensional dengan kebutuhan
tambahan berupa analisa pemikiran dari user/ pelaku sistem dari sebuah
organisasi/ perusahaan. Tesis ini mengusulkan sebuah tools tools yang dapat
melakukan monitoring dan tracking performansi melalui model aturan
keterhubungan data survei, data hasil audit dengan data revenue pada organisasi/
perusahaan. Faktor-faktor mana yang lebih dominan yang mempengaruhi growth
revenue sebagai variabel tingkat kinerja organisasi/ performansi perusahaan
tersebut. Penggunaan variabel tersebut dengan sistem skala dapat membantu
menentukan tingkat performansi yang beragam pada data growth revenue untuk
perhitungan pada algoritma pohon klasifikasi dan regresi (CART).
Kata Kunci: decision tree, regresi, performansi, pohon klasifikasi dan regresi
(CART)
iv
PERFORMANCE ANALYSIS USING
DECISION TREE ALGORITHMS
ABSTRACT
Data mining have been implemented to get the information more usefull then
using conventional database combine with using human analysis as the user from
the organization/ company systems. This Thesis proposes a tools to monitoring
and tracking performance from the connectedness rule model of the results of
survey, audit data and revenue’s data in organization/ company systems. The
more dominant factors that influence the growth revenue as the variable of
organization/ company performance. The Variabel using scale system to helps
finding kind of performance level in growth revenue using classification and
regression tree (CART)
Key Word : decision tree, regression, performance, classification and regression
tree (CART)
v
DAFTAR ISI
Halaman
PENGESAHAN
iii
KATA PENGANTAR
iv
ABSTRAK
vi
ABSTRACT
vii
DAFTAR ISI
viii
DAFTAR TABEL
x
DAFTAR GAMBAR
xi
BAB I
PENDAHULUAN
1
1.1
Latar Belakang
1
1.2
Perumusan Masalah
3
1.3.
Batasan Masalah
4
1.4
Tujuan Penelitian
4
1.5
Manfaat Penelitian
5
1.6
Metodologi Penelitian
5
1.7
Sistematika Penulisan
6
BAB II
TINJAUAN PUSTAKA
8
2.1
Pengertian Data Mining
8
2.2
Tahapan Data Mining
10
2.3
Teknik Data Mining
13
2.4
Kernel K-Mean
17
2.4.1 Cluster Validity Criterion
19
2.4.2 Elbow Criterion (RMSSDT dan RS)
19
2.5
CART (Classification and Regression Trees)
20
2.6
Paket Statistik untuk Ilmu Sosial
24
2.7
Komunitas Rapidminer
24
2.8
Malcolm Baldrige National Quality Award
25
2.9
Penelitian yang relevan
28
vi
BAB III
METODOLOGI
33
3.1.
Selection Data
33
3.1.1 Data Revenue
34
3.1.2 Data Customer Satisfaction Index (CSI)
35
3.1.3 Data Kriteria Baldridge
37
Preprocessing Data
39
3.2.1 Data Revenue
40
3.2.2 Data Customer Satisfaction Index (CSI)
41
3.2.3 Data Kriteria Baldridge
42
3.2.4. Validasi Data
42
Transformasi Data
47
3.3.1 Clustering pada data Revenue
48
3.3.2 Penggabungan Data
51
3.3.3 Data Mining
52
HASIL DAN PEMBAHASAN
57
4.1.
Pendahuluan
57
4.2
Hasil Percobaan
58
4.2.1 Cronbach’s Alpha
58
4.2.2 Teknik Analisis Regresi Linear Berganda
59
Percobaan Data Keseluruhan
62
3.2
3.3
BAB IV
4.3
BAB V
KESIMPULAN DAN SARAN
71
5.1.
Kesimpulan
71
5.2
Saran
71
DAFTAR PUSTAKA
LAMPIRAN
72
vii
DAFTAR TABEL
Nomor
J udul
Halaman
2.1
Tabel Perbandingan Penelitian yang Relevan
30
3.1
Atribut Data Revenue
35
3.2
Atribut Data CSI
37
3.3
Atribut Data Kriteria Baldridge
39
3.4
Data yang tidak memenuhi syarat
40
3.5
Data Growth Revenue
41
3.6
Data CSI
42
3.7
Data Kriteria Baldridge
42
3.8
Signifikan dan Reliabilitas Statistik Sampel
Data Uner 1 Sumatera
43
3.9
Descriptive Statistik Data Uner 1 Sumatera
44
3.10
Model Summary Sampel Data Uner 1 Sumatera
45
3.11
Corelations Statistik Sampel Data Uner 1 Sumatera
45
3.12
Rekap laporan Statistik Sampel Data Uner 1 Sumatera
46
3.13
Anova Statistik Sampel Data Uner 1 Sumatera
47
3.14
Data Rekap Uner 1 Sumatera sebelum transformasi
51
3.15
Data Rekap Uner 1 Sumatera setelah transformasi
51
4.1
Signifikan dan Reliabilitas Statistik Data Uner 1 Sumatera 58
4.2
Descriptive Statistik Data Uner 1 Sumatera
59
4.3
Model Summary Data Uner 1 Sumatera
60
4.4
Corelations Statistik Data
60
4.5
Rekap laporan Statistik Data Uner 1 Sumatera
61
4.6
Anova Statistik Data Uner 1 Sumatera
62
viii
DAFTAR GAMBAR
Nomor
J udul
Halaman
1.1
Kerangka pemikiran penelitian
6
2.1
Proses Data Mining
11
2.2
Alur produksi data mining
12
2.3
Penggolongan teknik data mining
13
2.4
Tahapan Teknik Klasifikasi
14
2.5
Tahapan Teknik Asosiasi
15
2.6
Proses clustering
16
2.7
Diagram CART
21
2.8
Struktur Administrasi MBNQA
26
2.9
Kerangka Kerja MBCfPE
27
3.1
Flowchart KDD process
33
3.2
Capture Hasil Kluster dengan Kernel K-Mean
50
3.3
Capture Diagram Hasil Kluster dengan Kernel K-Mean50
3.4
Algoritma CART
53
3.5
Grafik Decision tree pada data sampel
54
3.6
Profil Predikat pada data sampel
56
4.1
Proses penginputan Data Keseluruhan
63
4.2
Proses Linkage Data Keseluruhan
64
4.3
Tampilan Proses pada tab XML di Rapidminer
65
4.4
Tampilan Pohon pada tab XML di Rapidminer
66
4.5
Decision tree Data Keseluruhan
67
4.6
Profil Predikat pada data keseluruhan
68
4.7
Hasil Korelasi variabel revenue dengan CSI
69
4.8
Hasil Korelasi variabel Baldridge dengan CSI
69
4.9
Hasil Korelasi variabel revenue dengan Baldridge
70