Penerapan Data Mining Pada Penjualan Unit Pesawat Di PT. Dirgantara Indonesia Bandung Dengan Metode Clustering

(1)

PENERAPAN DATA MINING PADA PENJUALAN UNIT

PESAWAT DI PT. DIRGANTARA INDONESIA

BANDUNG DENGAN METODE CLUSTERING

TUGAS AKHIR

Disusun Untuk Memenuhi Syarat Kelulusan Pada Program Studi Strata Satu Sistem Komputer di Jurusan Teknik Komputer

Oleh

Beni Harta Ginting 10209094

Pembimbing

Selvia Lorena Br Ginting S.Si., M.T

JURUSAN TEKNIK KOMPUTER

FAKULTAS TEKNIK DAN ILMU KOMPUTER

UNIVERSITAS KOMPUTER INDONESIA


(2)

i

LEMBAR PENGESAHAN

PENERAPAN DATA MINING PADA PENJUALAN UNIT

PESAWAT DI PT. DIRGANTARA INDONESIA BANDUNG

DENGAN METODE CLUSTERING

Oleh

Beni Harta Ginting 10209094

Telah disetujui dan disahkan di Bandung sebagai Tugas Skripsi pada tanggal : Bandung, 28 Juli 2015

Menyetujui,

Pembimbing 1,

Selvia Lorena Br. Ginting, MT. NIP: 4127.70.05.003

Mengetahui,

Dekan Fakultas Teknik dan Ilmu Ketua Jurusan Teknik Komputer Komputer

Prof.Dr.H.Denny Kurniadie, Ir.,M.Sc Dr. Wendi Zarman, M.Si. NIP: 4127.70.015 NIP: 4127.70.05.10


(3)

KATA PENGANTAR

Puji syukur penulis panjatkan kepada tuhan yang maha esa yang masih memberikan kesehatan dan kesempatannya kepada kita semua, terutama kepada penulis. Sehingga penulis dapat menyelesaikan menyelesaikan skripsi

Penulis menyadari sepenuhnya, bahwa dalam peyusunan laporan ini masih banyak kekurangan dan jauh dari sempurna. Hal ini disebabkan oleh keterbatasan pengetahuan dan kemampuan penulis. Oleh karena itu, kritik dan saran yang konstruktif akan senantiasa diterima penulis sebagai masukan yang berarti, sehingga dalam penyusunan laporan lainnya penulis dapat menyusun dengan lebih baik.

dalam kesempatan ini, penulis ingin mengucapkan terimakasih kepada: 1. Ir. Dr. Eddy Suryanto Soegoto, M.Sc., selaku Rektor UNIKOM

2. Ibu Selvia Lorena Br. Ginting. S.Si. M.T selaku pembimbing i yang telah banyak memberikan waktu, saran, nasihat, motivasi dan bimbingan kepada penulis selama menempuh studi.

3. Bapak Wendi Zarman, M.Si., selaku dosen wali yang telah memberikan arahan, bantuan, saran, nasihat, motivasi dan bimbingan kepada penulis. 4. Bapak John Adler, M.Si., selaku dosen penulisan proposal dan seminar

yang telah memberikan arah dalam penyusunan skripsi ini.

5. Seluruh dosen jurusan teknik komputer yang telah memberikan banyak ilmu, motivasi dan kedisiplinan kepada penulis.

6. Ayah, ibu, adik dan semua keluarga ku tercinta yang telah memberikan kasih sayang, doa dan semangat yang tiada henti. Semoga suatu saat aku dapat membanggakan kalian.

7. Teman-teman di teknik komputer 2009 khususnya kelas 09 tk 03 terima kasih atas bantuan dan dukungan kalian semua kawan-kawan ku tercinta.


(4)

8. Simet kaban, selaku pembimbing pt.dirgantara indonesia dan seluruh karyawan pt.dirgantara indonesia terima kasih atas semua bantuan yang diberikan.

Di dalam penulisan skripsi ini, penulis telah berusaha semaksimal mungkin, walaupun demikian penulis menyadari bahwa skripsi ini jauh dari sempurna. Untuk itu penulis akan selalu menerima segala masukkan yang ditujukan untuk menyempurnakan skripsi ini. Akhir kata, penulis berharap semoga skripsi ini dapat bermanfaat bagi penulis pada khususnya dan pembaca pada umumnya.

Bandung, Agustus 2015


(5)

1

DAFTAR ISI

LEMBAR PENGESAHAN………i

LEMBAR PERNYATAAN………ii

ABSTRAK………...……iii

ABSTRACT………...iv

KATA PENGANTAR……….v

DAFTAR ISI………..vii

DAFTAR GAMBAR………..xi

DAFTAR TABEL……….xiii

DAFTAR SIMBOL………...xv BAB I ... Error! Bookmark not defined.

1.1 Latar Belakang Masalah ... Error! Bookmark not defined.

1.2 Maksud dan Tujuan ... Error! Bookmark not defined.

1.2.1 Maksud ... Error! Bookmark not defined.

1.2.2 Tujuan ... Error! Bookmark not defined.

1.3 Batasan Masalah... Error! Bookmark not defined.

1.4 Metode Penelitian... Error! Bookmark not defined.

1.5 Sistematika Penulisan ... Error! Bookmark not defined. BAB II ... Error! Bookmark not defined. 2.1 Tinjauan Tempat Penelitian ... Error! Bookmark not defined.


(6)

2

2.1.2 Visi dan Misi ... Error! Bookmark not defined.

2.1.3 Struktur Organisasi ... Error! Bookmark not defined.

2.2 Landasan Teori ... Error! Bookmark not defined.

2.2.1 Pengertian Data Mining... Error! Bookmark not defined.

2.2.2 Tahapan Data Mining ... Error! Bookmark not defined.

2.2.3 Arsitektur Data Mining ... Error! Bookmark not defined.

2.3 Pengelompokan (Clustering) ... Error! Bookmark not defined.

2.4 K-Means ... Error! Bookmark not defined.

2.4.1 Algoritma K-Means ... Error! Bookmark not defined.

2.4.2 K-Means Clustering ... Error! Bookmark not defined.

2.4.3 Proses Clustering Algoritma K-Means . Error! Bookmark not defined.

2.5 UML ... Error! Bookmark not defined.

2.5.1 Notasi Dalam UML ... Error! Bookmark not defined.

2.5.2 Use Case Diagram... Error! Bookmark not defined.

2.5.3 Class Diagram ... Error! Bookmark not defined.

2.5.4 Sequence Diagram ... Error! Bookmark not defined.

2.5.5 Activity Diagram... Error! Bookmark not defined.

2.6 Software Pendukung ... Error! Bookmark not defined.

2.6.1 NetBeans IDE 7.0.1... Error! Bookmark not defined.

2.6.2 XAMPP ... Error! Bookmark not defined.

2.6.3 Microsoft Excel ... Error! Bookmark not defined. BAB III ... Error! Bookmark not defined. 3.1 Analisis Sistem ... Error! Bookmark not defined.


(7)

3

3.1.1 Analisis Masalah ... Error! Bookmark not defined.

3.1.2 Analisis Data ... Error! Bookmark not defined.

3.1.3 Analisis Kebutuhan Non Fungsional .... Error! Bookmark not defined.

3.1.4 Analisis Kebutuhan Fungsional ... Error! Bookmark not defined.

3.1.5 Use Case Diagram... Error! Bookmark not defined.

3.1.6 Collaboration Diagram ... Error! Bookmark not defined.

3.1.7 Class Diagram ... Error! Bookmark not defined.

3.2 Entity Relationship Diagram (ERD) ... Error! Bookmark not defined.

3.3 Perancangan Arsitektur ... Error! Bookmark not defined.

3.3.1 Perancangan Struktur Menu ... Error! Bookmark not defined.

3.4 Perancangan A ntarmuka ... Error! Bookmark not defined.

3.4.1 Perancangan Antarmuka Pengunjung ... Error! Bookmark not defined.

3.5 Perancangan Tabel ... Error! Bookmark not defined.

3.5.1 Perancangan Tabel User ... Error! Bookmark not defined.

3.5.2 Perancangan Tabel Penjualan ... Error! Bookmark not defined.

3.5.3 Perancangan Tabel History ... Error! Bookmark not defined.

3.5.4 Perancangan Tabel Produk ... Error! Bookmark not defined.

3.5.5 Perancangan Tabel Wilayah ... Error! Bookmark not defined.

3.5.6 Perancangan Prosedural ... Error! Bookmark not defined.

3.5.7 Pesan ... Error! Bookmark not defined. BAB IV ... Error! Bookmark not defined. 4.1 Implementasi Perangkat Lunak ... Error! Bookmark not defined.


(8)

4

4.3 Tampilan Database ... Error! Bookmark not defined.

4.3.1 Tabel History ... Error! Bookmark not defined.

4.3.2 Tabel Penjualan ... Error! Bookmark not defined.

4.3.3 Tabel Produk ... Error! Bookmark not defined.

4.3.4 Tabel User ... Error! Bookmark not defined.

4.3.5 Tabel Wilayah ... Error! Bookmark not defined.

4.4 Implementasi Antarmuka ... Error! Bookmark not defined.

4.4.1 Tampilan Antarmuka User ... Error! Bookmark not defined.

4.4.2 Tampilan Antarmuka Utama ... Error! Bookmark not defined.

4.4.3 Tampilan Antarmuka Data User ... Error! Bookmark not defined.

4.4.4 Tampilan Antarmuka Data Wilayah PenjualanError! Bookmark not defined.

4.4.5 Tampilan Antarmuka Data Penjualan ... Error! Bookmark not defined.

4.4.6 Tampilan Antarmuka Diagram PenjualanError! Bookmark not defined.

4.4.7 Tampilan Antarmuka Import Data ... Error! Bookmark not defined.

4.4.8 Tampilan Antarmuka Analisa ClusteringError! Bookmark not defined.

4.4.9 Tampilan Antarmuka History Proses ClusteringError! Bookmark not defined.

4.4.10 Tampilan Antarmuka History Proses ClusteringError! Bookmark not defined.

4.4.11 Tampilan Antarmuka Admin ... Error! Bookmark not defined.


(9)

5

4.5.1 Pengujian Alpha ... Error! Bookmark not defined.

4.5.2 Kasus Dan Pengujian Alpha... Error! Bookmark not defined.

4.5.3 Kesimpulan Proses Pengujian Alpha .... Error! Bookmark not defined.

4.5.4 Pengujian Beta ... Error! Bookmark not defined.

4.5.5 Kuisioner ... Error! Bookmark not defined.

4.5.6 Kesimpulan Pengujian Beta ... Error! Bookmark not defined. BAB V ... Error! Bookmark not defined. 5.1 Kesimpulan ... Error! Bookmark not defined.


(10)

(11)

DAFTAR RIWAYAT HIDUP

Nama : Beni Harta Ginting Tempat, Tanggal Lahir : Bandung, 10 April 1991 Jenis Kelamin : Laki - Laki

Agama : Kristen Protestan

Alamat Tetap : Jl. Kopo Sayati Gg Nata II Dalam No 249 Kelurahan Margahayu Kecamatan Sayati, Bandung No. Telepon : 082214005242

Email : binben182@gmail.com

Pendidikan Formal

2009 - 2015 : UNIVERSITAS KOMPUTER INDONESIA 2006 - 2009 : SMA ANGKASA LANUD SULAIMAN 2003 - 2006 : SMP N 38 BANDUNG


(12)

1

BAB I

PENDAHULUAN

1.1 Latar Belakang Masalah

Dalam dunia bisnis yang selalu dinamis dan penuh persaingan, para pelakunya harus senantiasa memikirkan cara-cara untuk survive dan jika mungkin mengembangkan skala bisnis mereka, untuk mencapai hal itu, ada tiga kebutuhan bisnis yang dapat dilakukan, yaitu penambahan jenis maupun peningkatan kapasitas produk, pengurangan biaya operasi perusahaan, dan peningkatan efektifitas pemasaran dan keuntungan. Agar bisa memenuhi kebutuhan-kebutuhan bisnis di atas banyak cara yang dapat ditempuh, salah satunya adalah dengan melalukan analisis data perusahaan.

PT. Dirgantara Indonesia merupakan perusahaan yang bergerak dalam bidang industri pembuatan unit pesawat. Sebagai perusahaan besar, PT Dirgantara Indonesia menghasilkan berbagai macam unit pesawat dengan nama dan jenis yang berbeda. Tidak hanya PT Dirgantara Indonesia masih cukup banyak juga perusahaan lain yang bergerak di bidang yang sama. Hal tersebut tentu saja menimbulkan persaingan bisnis antar perusahaan.

Produk yang diproduksi oleh PT Dirgantara Indonesia selain memiliki nama yang berbeda, setiap nama dari unit tersebut pun memiliki jenis yang beragam sesuai dari permintaan konsumen. Produk yang diproduksi tersebut dipasarkan ke banyak kota-kota di Indonesia bukan hanya di Indonesia tetapi dipasarkan juga ke luar negeri Hal ini tentu akan menghasilkan data penjualan produk yang begitu banyak.

Untuk menghadapi persaingan bisnis yang dinamis pihak perusahaan dituntut agar dapat mengambil keputusan yang tepat dalam menentukan strategi pemasaran produk yang akan dijualnya agar dapat melaksanakan hal tersebut, perusahaan memerlukan informasi yang cukup untuk dapat dianalisa lebih lanjut. Informasi yang


(13)

2

dihasilkan tentunya adalah hasil analisis dari pengolahan data penjualan pada perusahaan tersebut. Data penjualan yang sudah ada akan diolah atau dianalisis untuk mengetahui tingkat kecenderungan konsumen di setiap tempat tujuan pemasaran produk pada faktor ketertarikannya. Dari pengolahan data tersebut akan diperoleh suatu pola konsumsi masyarakat terhadap produk dari perusahaan tersebut.

Ketersediaan data yang melimpah, kebutuhan akan informasi (atau pengetahuan) sebagai pendukung pengambilan keputusan untuk membuat solusi bisnis, dan dukungan infrastruktur di bidang teknologi informasi merupakan cikal-bakal dari lahirnya teknologi data mining. Data mining dimaksudkan untuk memberikan solusi nyata bagi para pengambil keputusan di dunia bisnis, untuk mengembangkan bisnis mereka.

Data mining didefinisikan sebagai satu set teknik yang digunakan secara otomatis untuk mengeksplorasi secara menyeluruh dan membawa ke permukaan relasi-relasi yang kompleks pada set data yang sangat besar. Set data yang dimaksud di sini adalah set data yang berbentuk tabulasi, seperti yang banyak diimplementasikan dalam teknologi manajemen basis data relasional. Akan tetapi, teknik-teknik data mining dapat juga diaplikasikan pada representasi data yang lain, seperti domain data spatial, berbasis text, dan multimedia (citra). Data mining dapat

juga didefinisikan sebagai “pemodelan dan penemuan pola-pola yang tersembunyi dengan memanfaatkan data dalam volume yang besar” Data mining menggunakan pendekatan discovery-based dimana pencocokan pola (pattern-matching) dan algoritma-algoritma yang lain digunakan untuk menentukan relasi-relasi kunci di dalam data yang diekplorasi Data mining merupakan komponen baru pada arsitektur Sistem Pendukung Keputusan (SPK) di perusahaan-perusahaan.

Pengelompokan (Clustering) mengidentifikasi objek yang memiliki kesamaan karakteristik tertentu, dan kemudian menggunakan karakteristik tersebut sebagai

“vektor karakteristik” atau “centroid”. Pengelompokan ini digunakan oleh perusahaan untuk membuat laporan mengenai karakteristik umum dari grup-grup konsumen yang berbeda. Proses Clustering yang akan dilakukan menggunakan algoritma K-Means


(14)

3

Dari pertimbangan atas penjelasan yang telah dipaparkan diatas, Maka dibuatlah suatu aplikasi PENERAPAN DATA MINING PADA PENJUALAN UNIT PESAWAT DI PT. DIRGANTARA INDONESIA BANDUNG DENGAN METODE CLUSTERING”.

1.2 Maksud dan Tujuan

Berdasarkan latar belakang permasalahan serta masalah apa saja yang ingin penulis pecahkan, tidak terlepas dari maksud dan tujuan yang terkait dengan perancangan sistem ini.

1.2.1 Maksud

Maksud dari penulisan tugas akhir ini adalah merancang dan membangun sebuah aplikasi Data Mining pada penjualan unit pesawat di PT Dirgantara Indonesia dengan menggunakan metode clustering dengan algoritma K-Means

1.2.2 Tujuan

1. Mempermudah dalam mengolah data penjualan yang cukup besar. 2. Memberikan gambaran dalam pengambilan keputusan.

3. Membantu memberikan informasi dari data yang diolah.

4. Memudahkan perusahaan dalam mengehtahui informasi dari penjualan unit di PT Dirgantara Indonesia.

1.3 Batasan Masalah

Agar penyusunan penelitian ini tidak keluar dari pokok permasalahan yang dirumuskan, maka ruang lingkup pembahasan dibatasi pada:

1. Metode yang digunakan dalam Sistem Aplikasi ini menggunakan metode

Clustering dengan menggunakan Algoritma K-Means.

2. Metode perancangan pada model yang digunakan adalah berdasarkan objek.


(15)

4 - Xampp sebagai client-serverdatabase

- Desain dan membangun aplikasi dengan menggunakan NetBeans IDE 7.0.1

- Browser Mozila Firefox untuk mengakses phpMyAdmin pada XAMMP

- Format file yang akan diinputkan berupa file database yang berekstensi SQL atau EXCEL.

4. Hasil dari analisa tersebut adalah terbentuknya pola penjualan unit pesawat di PT Dirgantara Indonesia.

5. Menggunakan Sistem Operasi WindowsSeven (7) 32bit.

6. Data yang akan dianalisa merupakan data penjualan unit pesawat di PT Dirgantara Indonesia.

1.4 Metode Penelitian

Adapun metode penelitian yang dilakukan penulis meliputi:

1. Tahap Pengumpulan Data

Metode pengumpulan data yang digunakan dalam penelitian ini adalah sebagai berikut :

a. Studi Literatur

Penulis akan melakukan pencarian dan pembelajaran dari berbagai literatur dan dokumen sebagai penunjang dalam membuat skripsi ini khususnya yang berkaitan dengan Data Mining yang bermetode Clustering.

b. Observasi

Teknik pengumpulan data dengan mengadakan penelitian dan peninjauan langsung terhadap permasalahan yang diambil.

c. Interview

Teknik pengumpulan data dengan mengadakan Tanya jawab secara langsung yang ada kaitannya dengan topik yang diambil.


(16)

5

2. Tahap Pembuatan Perangkat Lunak

Teknis analisa data dalam pembuatan perangkat lunak menggunakan pemodelan perangkat lunak dengan paradigma waterfall seperti terlihat pada gambar 1.1, yang meliputi beberapa proses diantaranya:

a. System / Information Engineering

Merupakan bagian dari sistem yang terbesar dalam pengerjaan suatu proyek, dimulai dengan menetapkan berbagai kebutuhan dari semua elemen yang diperlukan sistem dan mengalokasikannya kedalam pembentukan perangkat lunak

b. Analisis

Merupakan tahap menganalisis hal-hal yang diperlukan dalam pelaksanaan proyek pembuatan perangkat lunak.

c. Design

Tahap penerjemahan dari data yang dianalisis kedalam bentuk yang mudah dimengerti oleh user.

d. Coding

Tahap penerjemahan data atau pemecahan masalah yang telah dirancang keadalam bahasa pemrograman tertentu.

e. Pengujian

Merupakan tahap pengujian terhadap perangkat lunak yang dibangun. f. Maintenance

Tahap akhir dimana suatu perangkat lunak yang sudah selesai dapat mengalami perubahan–perubahan atau penambahan sesuai dengan permintaan user


(17)

6

1.5 Sistematika Penulisan

Adapun sistematika pada Skripsi ini adalah sebagai berikut:

BAB I PENDAHULUAN

Bab ini berisi tentang latar belakang, rumusan masalah, batasan masalah, tujuan, manfaat, metodologi dan sistematika penulisan.

BAB II TINJAUAN PUSTAKA

Bab ini menjelaskan tentang teori-teori yang terkait dengan permasalah yang diambil.

BAB III ANALISA DAN PERANCANGAN

Bab ini menjelaskan tentang analisa yang dilakukan dalam merancang dan membuat Sistem Aplikasi.

BAB IV IMPLEMENTASI DAN PENGUJIAN

Bab ini membahas tentang implementasi dari aplikasi yang dibuat secara keseluruhan. Serta melakukan pengujian terhadap aplikasi yang dibuat untuk mengetahui aplikasi tersebut telah dapat menyelesaikan permasalah yang dihadapi sesuai dengan yang diharapkan.


(18)

7

BAB V KESIMPULAN DAN SARAN

Bab ini berisi tentang kesimpulan dan saran dari hasil penelitian yang diharapkan dapat bermanfaat bagi pengembangan pembuatan aplikasi program selanjutnya.


(19)

118

BAB V

KESIMPULAN DAN SARAN

Pada bab ini akan menjelaskan mengenai kesimpulan dan saran untuk memperbaiki dan mengembangkan aplikasi yang telah dirancang.

5.1 Kesimpulan

Setelah melakukan analisis, perancangan, dan pengujian, maka dapat diperoleh kesimpulan sebagai berikut :

1. Aplikasi yang dibangun dapat membantu PT. Dirgantara Indonesia sebagai gambaran bagi pengambilan keputusan perusahaan dalam rangka mendapatkan pola penjualan produk yang dihasilkan.

2. Pengolahan data yang dilakukan dapat menghasilkan informasi yang cukup untuk dapat dianalisa lebih lanjut.

3. Aplikasi yang dibangun dapat mengurangi penumpukan data yang kurang dimanfaatkan sebelumnya.

4. Aplikasi yang dibangun dapat memberi gambaran dari penjualan produk ,wilayah dan tahun penjualanya dengan grafik dan diagram yang ada.

5. Aplikasi yang dibangun dapat Memudahkan perusahaan dalam mengehtahui informasi dari penjualan unit di PT Dirgantara Indonesia

5.2 Saran

Berdasarkan kesimpulan di atas, hal yang diharapkan kedepan adalah agar aplikasi ini dapat dikembangkan lebih jauh dengan pengolahan data yang lebih besar dan luas sehingga aplikasi ini benar-benar dapat digunakan sebagai salah satu gambaran dalam pengambilan keputusan perusahaan yang lebih akurat dan berguna.


(20)

1

PENERAPAN DATA MINING PADA PENJUALAN UNIT PESAWAT DI PT. DIRGANTARA INDONESIA BANDUNG DENGAN METODECLUSTERING

Beni Harta Ginting1), Selvia Lorena Br.Ginting 2) 1), 2)

Jurusan Sistem Komputer Universitas Komputer Indonesia Bandung

1

binben182@gmail.com

ABSTRAK

Dalam dunia bisnis yang selalu dinamis dan penuh persaingan, para pelakunya harus senantiasa memikirkan cara-cara untuk terus survive dan jika mungkin mengembangkan skala bisnis mereka PT.Dirgantara Indonesia merupakan perusahaan yang bergerak dalam bidang pembuatan unit pessawat . Tidak hanya PT.Dirgantara Indonesia, masih cukup banyak perusahaan-perusahaan lain yang bergerak dibidang serupa. Hal tersebut tentu saja menimbulkan persaingan bisnis antar perusahaan Dalam rangka menghadapi persaingan bisnis dan meningkatkan pendapatan perusahaan, pihak terkait dalam perusahaan tersebut dituntut untuk dapat mengambil keputusan yang tepat dalam menentukan strategi pemasaran unit pesawat yang akan dijualnya. Ketersediaan data yang melimpah, kebutuhan akan informasi (atau pengetahuan) sebagai pendukung pengambilan keputusan untuk membuat solusi bisnis, dan dukungan infrastruktur di bidang teknologi informasi merupakan cikal-bakal dari lahirnya teknologi data mining. Data mining dimaksudkan untuk memberikan solusi nyata bagi para pengambil keputusan di dunia bisnis, untuk mengembangkan bisnis mereka. Salah satu metode yang terdapat dalam data mining yang digunakan dalam penelitian ini adalah pengelompokan (Clustering) dimana metode tersebut mengidentifikasi objek yang memiliki kesamaan karakteristik tertentu, dan kemudian menggunakan

karakteristik tersebut sebagai “vektor karakteristik” atau “centroid”. Hasil dari penelitian ini adalah aplikasi yang dapat mempermudah menganalisis sejumlah data yang besar guna membantu memberikan informasi berharga sebagai gambaran dasar pengambilan keputusan perusahaan.

Kata kunci : persaingan bisnis, solusi bisnis, teknologi informasi, data mining,

pengelompokan(clustering)

1. PENDAHULUAN

Dalam dunia bisnis yang selalu dinamis dan penuh persaingan, para pelakunya harus senantiasa memikirkan cara-cara untuk survive dan jika mungkin mengembangkan skala bisnis mereka, untuk mencapai hal itu, ada tiga kebutuhan bisnis yang dapat dilakukan, yaitu penambahan jenis maupun peningkatan kapasitas produk, pengurangan biaya operasi perusahaan, dan peningkatan efektifitas pemasaran dan keuntungan. Agar bisa memenuhi kebutuhan-kebutuhan bisnis di atas banyak cara yang dapat ditempuh, salah satunya adalah dengan melalukan

analisis data perusahaan. PT. Dirgantara Indonesia merupakan perusahaan yang bergerak dalam bidang industri pembuatan unit pesawat. Sebagai perusahaan besar, PT Dirgantara Indonesia menghasilkan berbagai macam unit pesawat dengan nama dan jenis yang berbeda. Tidak hanya PT Dirgantara Indonesia masih cukup banyak juga perusahaan lain yang bergerak di bidang yang sama. Hal tersebut tentu saja menimbulkan persaingan bisnis antar perusahaan. Produk yang diproduksi oleh PT Dirgantara Indonesia selain memiliki nama yang berbeda, setiap nama dari unit tersebut pun memiliki jenis yang beragam


(21)

2

sesuai dari permintaan konsumen. Produk yang diproduksi tersebut dipasarkan ke banyak kota-kota di Indonesia bukan hanya di Indonesia tetapi dipasarkan juga ke luar negeri Hal ini tentu akan menghasilkan data penjualan produk yang begitu banyak.

Untuk menghadapi persaingan bisnis yang dinamis pihak perusahaan dituntut agar dapat mengambil keputusan yang tepat dalam menentukan strategi pemasaran produk yang akan dijualnya Agar dapat melaksanakan hal tersebut, perusahaan memerlukan informasi yang cukup untuk dapat dianalisa lebih lanjut. Informasi yang dihasilkan tentunya adalah hasil analisis dari pengolahan data penjualan pada perusahaan tersebut. Data penjualan yang sudah ada akan diolah atau dianalisis untuk mengetahui tingkat kecenderungan konsumen di setiap tempat tujuan pemasaran produk pada faktor ketertarikannya. Dari pengolahan data tersebut akan diperoleh suatu pola konsumsi masyarakat terhadap produk dari perusahaan tersebut. Data mining didefinisikan sebagai satu set teknik yang digunakan secara otomatis untuk mengeksplorasi secara menyeluruh dan membawa ke permukaan relasi-relasi yang kompleks pada set data yang sangat besar. Set data yang dimaksud di sini adalah set data yang berbentuk tabulasi, seperti yang banyak diimplementasikan dalam teknologi manajemen basis data relasional. Akan tetapi, teknik-teknik data mining dapat juga diaplikasikan pada representasi data yang lain, seperti domain data spatial, berbasis text, dan multimedia (citra). Data mining dapat juga didefinisikan sebagai

“pemodelan dan penemuan pola-pola yang tersembunyi dengan memanfaatkan data

dalam volume yang besar” Data mining

menggunakan pendekatan discovery-based dimana pencocokan pola (pattern-matching) dan algoritma-algoritma yang lain digunakan untuk menentukan relasi-relasi kunci di dalam data yang diekplorasi Data mining merupakan komponen baru pada arsitektur Sistem Pendukung Keputusan (SPK) di perusahaan-perusahaan.

2. TEORI PENUNJANG

Data Mining (DM) adalah salah satu bidang yang berkembang pesat karena besarnya kebutuhan akan nilai tambah dari database skala besar yang makin banyak terakumulasi sejalan dengan pertumbuhan teknologi informasi. Definisi umum dari DM itu sendiri adalah serangkaian proses untuk menggali nilai tambah berupa pengetahuan yang selama ini tidak diketahui secara manual dari suatu kumpulan data.

Data mining adalah kombinasi secara logis antara pengetahuan data, dan analisa statistik yang dikembangkan dalam pengetahuan bisnis atau suatu proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, tiruan dan machine-learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat bagi pengetahuan yang terkait dari berbagai database besar.

Pengelompokan (Clustering)

merupakan tugas deskripsi yang banyak digunakan dalam mengidentifikasi sebuah himpunan terbatas pada kategori atau cluster untuk mendeskripsikan data yang ditelaah. Kategori-kategori ini dapat bersifat eksklusif dan ekshaustif mutual, atau mengandung representasi yang lebih kaya seperti kategori yang hirarkis atau saling menumpuk (overlapping).

Berbeda dengan association rule mining dan classification dimana kelas data telah ditentukan sebelumnya, clustering melakukan pengelompokan data tanpa berdasarkan kelas data tertentu. Bahkan clustering dapat dipakai untuk memberikan label pada kelas data yang belum diketahui itu. Karena itu clustering sering digolongkan sebagai metode unsupervised learning. Prinsip dari clustering adalah memaksimalkan kesamaan antar anggota satu kelas dan meminimumkan kesamaan antar kelas/cluster. Clustering dapat dilakukan pada data yang memiliki beberapa atribut yang dipetakan sebagai


(22)

3

ruang multidimensi. Ilustrasi dari clustering dapat dilihat pada Gambar 2.4 dimana lokasi, dinyatakan dengan bidang dua dimensi, dari pelanggan suatu toko dapat dikelompokkan menjadi beberapa cluster dengan pusat cluster ditunjukkan oleh tanda positif (+).

Banyak algoritma clustering memerlukan fungsi jarak untuk mengukur kemiripan antar data, diperlukan juga metode untuk normalisasi bermacam atribut yang dimiliki data.

Beberapa kategori algoritma clustering yang banyak dikenal adalah metode partisi dimana pemakai harus menentukan jumlah k partisi yang diinginkan lalu setiap data di tes untuk dimasukkan pada salah satu partisi, metode lain yang telah lama dikenal adalah metode hierarki yang terbagi dua lagi : bottom-up yang menggabungkan cluster kecil menjadi cluster lebih besar dan top-down yang memecah cluster besar menjadi cluster yang lebih kecil. Kelemahan metode ini adalah bila salah satu penggabungan/pemecahan dilakukan pada tempat yang salah, tidak dapat didapatkan cluster yang optimal. Pendekatan yang banyak diambil adalah menggabungkan metode hierarki dengan metode clustering lainnya seperti yang dilakukan oleh Chameleon.

Gambar 2.4 Ilustrasi Clustering

K-Means Clustering merupakan metode

untuk mengklasifikasikan atau mengelompokan objek-objek (data) kedalam K-group (cluster) berdasarkan atribut tertentu. Pengelompokan data dilakukan untuk memperhitungkan jarak terdekat antara data-data(objek observasi)

dengan pusat cluster (centroid). Prinsip utama dari metode ini adalah menyusun K buah centroid atau rata-rata (mean) dari sekumpulan data berdimensi N, dimana metode ini mensyaratkan nilai K sudah diketahui sebelumnya (apriori). Algoritma K-Means dimulai dengan pembentukan prototype cluster diawal kemudian secara iteratif prototipe cluster tersebut diperbaiki sehingga tercapai kondisi konvergen, yaitu kondisi dimana tidak terjadi perubahan yang signifikan terhadap prototipe cluster. Perubahan ini diukur dengan menggunakan fungsi objektif D yang umumnya didefinisikan sebagai jumblah atau rata-ratajarak tiap item data dengan centroid groupnya.

Algoritma K-Means

K-Means termasuk dalam partitioning clustering yaitu setiap data harus masuk dalam cluster tertentu dan memungkinkan bagi setiap data yang termasuk dalam cluster tertentu pada suatu tahapan proses, pada tahapan berikutnya berpindah ke cluster yang lain. K-Means memisahkan data ke k daerah bagian yang terpisah, dimana k adalah bilangan integer positif. Algoritma K-Means sangat terkenal karena kemudahan dan kemampuannya untuk mengklasifikasi data besar dan outlier dengan sangat cepat. Berikut adalah langkah-langkah algoritma K-Means : 1. Penentuan Pusat Cluster Awal Dalam menentukan n buah pusat cluster awal dilakukan pembangkitan bilangan random yang merepresentasikan urutan data input. Pusat awal cluster didapatkan dari data sendiri bukan dengan menentukan titik baru, yaitu dengan menrandom pusat awal dari data.

2. Perhitungan Jarak Dengan Pusat Cluster

Untuk mengukur jarak antara data dengan pusat cluster digunakan

Euclidian distance.

1) Algoritma perhitungan jarak data dengan pusat cluster

2) Ambil nilai data dan nilai pusat cluster


(23)

4

Hitung Euclidian distance data dengan tiap pusat cluster

3 Pengelompokkan Data

Jarak hasil perhitungan akan dilakukan perbandingan dan dipilih jarak terdekat antara data dengan pusat cluster, jarak ini menunjukkan bahwa data tersebut berada dalam satu kelompok dengan pusat cluster terdekat.

1) Ambil nilai jarak tiap pusat cluster dengan data

2) Cari nilai jarak terkecil

3) Kelompokkan data dengan pusat cluster yang memiliki jarak terkecil.

4. Penentuan pusat cluster baru

Untuk mendapatkan pusat cluster baru bisa dihitung dari rata-rata nilai anggota cluster dan pusat cluster. Pusat cluster yang baru digunakan untuk melakukan iterasi selanjutnya, jika hasil yang didapatkan belum konvergen. Proses iterasi akan berhenti jika telah memenuhi maksimum iterasi yang dimasukkan oleh User atau hasil yang dicapai sudah konvergen (pusat cluster baru sama dengan pusat cluster lama).

Proses Clustering Algoritma K-Means

Pada tahap ini akan dilakukan proses utama yaitu segmentasi data nilai

yang diakses dari database yaitu sebuah metode clustering algoritma K-Means. Berikut ini merupakan diagram flowchart dari algoritma K-Means dengan asumsi bahwa parameter input adalah jumlah data set sebanyak n data dan jumlah inisialisasi centroid K=4 sesuai dengan jumlah jurusan yang ada di PT Dirgantara Indonesia yaitu Boeing, Hovercraft, Helikopter, dan Aircraft

beberapa langkah yang dilalui oleh clustering algoritma K-Means memuat bagian-bagian sebagai berikut ini:

1. N data : data set yang akan diolah sebanyak N data dimana N data tersebut terdiri dari atribut-atributnya N(Boeing,Hovercraft,Helikopter, dan Aircraft) yang berarti data N memiliki atribut sebanyak 4

2. K Centroid : Inisialisasi dari pusat cluster data adalah sebanyak K dimana pusat-pusat awal tersebut digunakan sebagai banyaknya kelas yang akan tercipta. Centroid didapatkan secara random dari N data set yang ada.

3. Euclidian Distance: merupakan jarak yang didapat dari perhitungan antara semua N data dengan K centroid dimana akan memperoleh tingkat kedekatan dengan kelas yang terdekat dengan populasi data tersebut. Jarak euclidian untuk menandai adanya persamaan antar tiap cluster dengan jarak minimum dan mempunyai persamaan yang lebih tinggi. Euclidian matrik.

Dimana :

x : Titik data pertama y : Titik data kedua,

n : Jumlah karakteristik (attribut) dalam terminologi data mining,

d(x,y) : Euclidian distance yaitu jarak antara data pada titik x dan titik y menggunakan kalkulasi matematika

4. Pengelompokkan Data: setelah sejumlah populasi data tersebut menemukan kedekatan dengan salah satu centroid yang ada maka secara otomatis populasi data tersebut masuk kedalam kelas yang memiliki centroid yang bersangkutan. 5. Update Centroid Baru: tiap kelas yang telah tercipta tadi melakukan update

centroid baru. Hal ini dilakukan dengan menghitung nilai rata-rata dari kelas masing-masing. Apabila belum memenuhi optimal hasil proses pengukuran ecluidian distance dilakukan kembali.

6. Batas Iterasi : apabila dalam proses clustering belum optimal namun sudah memenuhi batas iterasi maka proses dihentikan


(24)

5

ERD

Wilayah Penjualan Produk

History

memiliki n n memiliki 1 1

memiliki 1

1

PK : Prodid Nama_produk

PK : id_wilayah Nama_wilayah

kelas

PK : idjual tanggal Id_wilayah

prodid jumlah

No_cluster Id_wilayah kelompok

Jumlah_cluster jumlah

rata1

rata2

rata3

rata4

Gambar 3.1 ERD yang digunakan

4. IMPLEMENTASI DAN PENGUJIAN Implementasi Aplikasi

a. Implementasi Antar Muka Pengguna

(User Interface) awal

Berikut adalah tampilan antar muka pengguna (user interface) aplikasi.

Gambar 4.1 Tampilan awal

b. Implementasi tampilan utama

Gambar 4.2 Tampilan utama d.proses analisa clustering

Gambar 4.3 Tampilan form proses clustering

Gambar 4.4 tampilan form history proses clustering dan laporan akhir


(25)

6 5. KESIMPULAN DAN SARAN

Setelah melalui tahap implementasi dan pengujian sistem dilakukan maka dapat diambil beberapa kesimbulan sebagai berikut:

Setelah melakukan analisis, perancangan, dan pengujian, maka dapat diperoleh kesimpulan sebagai berikut : 1. Aplikasi yang dibangun dapat

membantu PT. Dirgantara Indonesia sebagai gambaran bagi pengambilan keputusan perusahaan dalam rangka mendapatkan pola penjualan produk yang dihasilkan.

2. Pengolahan data yang dilakukan dapat menghasilkan informasi yang cukup untuk dapat dianalisa lebih lanjut.

3. Aplikasi yang dibangun dapat mengurangi penumpukan data yang kurang dimanfaatkan sebelumnya. 4. Aplikasi yang dibangun dapat

memberi gambaran dari penjualan produk ,wilayah dan tahun penjualanya dengan grafik dan diagram yang ada.

5. Aplikasi yang dibangun dapat Memudahkan perusahaan dalam mengehtahui informasi dari penjualan unit di PT Dirgantara Indonesia

Adapun saran untuk mengoptimalkan aplikasi di masa mendatang adalah sebagai berikut:

1. Berdasarkan kesimpulan di atas, hal yang diharapkan kedepan adalah agar aplikasi ini dapat dikembangkan lebih jauh dengan pengolahan data yang lebih besar dan luas sehingga aplikasi ini benar-benar dapat digunakan sebagai salah satu gambaran dalam pengambilan keputusan perusahaan yang lebih akurat dan berguna.

6. DAFTAR PUSTAKA

[1] Andi (Rabu, 4 Maret 2009), Data Mining dan Web Mining,

http://andyku.wordpress.com/2008/04/ 17/data-mining-dan-web-mining/

[2] Andri Heryandi, S.T. SQL (Structured Query Language) dengan delphi,

Diktat Delphi, 1-55

[3] Iko Pramudiono. (Rabu, 4 Maret 2009), Pengantar Data Mining: Menambang Permata Pengetahuan di Gunung Data, http://ilmukomputer.org/2008/11/25/p engantardata-mining/

[4] Kadir, Abdul,( 2001), Konsep Dan Tuntunan Basis Data , Yogyakarta : Andi. [5] Sandy Kurniawan, Taufiq Hidayat (Rabu, 5 Agustus 2009), PENERAPAN DATA MINING

DENGAN METODE INTERPOLASI UNTUK MEMPREDIKSI MINAT KONSUMEN ASURANSI (Studi

[7] Susanti, Azhar, (2003), Sistem Informasi Management, Yogyakarta: Andi. Yusta Noverison. (Selasa, 3 Maret 2009),

Data Mining,

http://yustanoverison.blogspot.com/20 08/05/data-mining.html


(1)

PENERAPAN DATA MINING PADA PENJUALAN UNIT PESAWAT DI PT.

DIRGANTARA INDONESIA BANDUNG DENGAN METODECLUSTERING

Beni Harta Ginting1), Selvia Lorena Br.Ginting 2) 1), 2)

Jurusan Sistem Komputer Universitas Komputer Indonesia Bandung

1

binben182@gmail.com

ABSTRAK

Dalam dunia bisnis yang selalu dinamis dan penuh persaingan, para pelakunya harus senantiasa memikirkan cara-cara untuk terus survive dan jika mungkin mengembangkan skala bisnis mereka PT.Dirgantara Indonesia merupakan perusahaan yang bergerak dalam bidang pembuatan unit pessawat . Tidak hanya PT.Dirgantara Indonesia, masih cukup banyak perusahaan-perusahaan lain yang bergerak dibidang serupa. Hal tersebut tentu saja menimbulkan persaingan bisnis antar perusahaan Dalam rangka menghadapi persaingan bisnis dan meningkatkan pendapatan perusahaan, pihak terkait dalam perusahaan tersebut dituntut untuk dapat mengambil keputusan yang tepat dalam menentukan strategi pemasaran unit pesawat yang akan dijualnya. Ketersediaan data yang melimpah, kebutuhan akan informasi (atau pengetahuan) sebagai pendukung pengambilan keputusan untuk membuat solusi bisnis, dan dukungan infrastruktur di bidang teknologi informasi merupakan cikal-bakal dari lahirnya teknologi data mining. Data mining dimaksudkan untuk memberikan solusi nyata bagi para pengambil keputusan di dunia bisnis, untuk mengembangkan bisnis mereka. Salah satu metode yang terdapat dalam data mining yang digunakan dalam penelitian ini adalah pengelompokan (Clustering) dimana metode tersebut mengidentifikasi objek yang memiliki kesamaan karakteristik tertentu, dan kemudian menggunakan karakteristik tersebut sebagai “vektor karakteristik” atau “centroid”. Hasil dari penelitian ini adalah aplikasi yang dapat mempermudah menganalisis sejumlah data yang besar guna membantu memberikan informasi berharga sebagai gambaran dasar pengambilan keputusan perusahaan.

Kata kunci : persaingan bisnis, solusi bisnis, teknologi informasi, data mining, pengelompokan(clustering)

1. PENDAHULUAN

Dalam dunia bisnis yang selalu dinamis dan penuh persaingan, para pelakunya harus senantiasa memikirkan cara-cara untuk survive dan jika mungkin mengembangkan skala bisnis mereka, untuk mencapai hal itu, ada tiga kebutuhan bisnis yang dapat dilakukan, yaitu penambahan jenis maupun peningkatan kapasitas produk, pengurangan biaya operasi perusahaan, dan peningkatan efektifitas pemasaran dan keuntungan. Agar bisa memenuhi kebutuhan-kebutuhan bisnis di atas banyak cara yang dapat ditempuh, salah satunya adalah dengan melalukan

analisis data perusahaan. PT. Dirgantara

Indonesia merupakan perusahaan yang bergerak dalam bidang industri pembuatan unit pesawat. Sebagai perusahaan besar, PT

Dirgantara Indonesia menghasilkan

berbagai macam unit pesawat dengan nama dan jenis yang berbeda. Tidak hanya PT Dirgantara Indonesia masih cukup banyak juga perusahaan lain yang bergerak di bidang yang sama. Hal tersebut tentu saja

menimbulkan persaingan bisnis antar

perusahaan. Produk yang diproduksi oleh

PT Dirgantara Indonesia selain memiliki nama yang berbeda, setiap nama dari unit tersebut pun memiliki jenis yang beragam


(2)

sesuai dari permintaan konsumen. Produk yang diproduksi tersebut dipasarkan ke banyak kota-kota di Indonesia bukan hanya di Indonesia tetapi dipasarkan juga ke luar negeri Hal ini tentu akan menghasilkan data penjualan produk yang begitu banyak.

Untuk menghadapi persaingan bisnis yang dinamis pihak perusahaan dituntut agar dapat mengambil keputusan yang tepat dalam menentukan strategi pemasaran produk yang akan dijualnya Agar dapat melaksanakan hal tersebut, perusahaan memerlukan informasi yang cukup untuk dapat dianalisa lebih lanjut. Informasi yang dihasilkan tentunya adalah hasil analisis dari pengolahan data penjualan pada perusahaan tersebut. Data penjualan yang sudah ada akan diolah atau dianalisis untuk

mengetahui tingkat kecenderungan

konsumen di setiap tempat tujuan

pemasaran produk pada faktor

ketertarikannya. Dari pengolahan data

tersebut akan diperoleh suatu pola

konsumsi masyarakat terhadap produk dari

perusahaan tersebut. Data mining

didefinisikan sebagai satu set teknik yang

digunakan secara otomatis untuk

mengeksplorasi secara menyeluruh dan membawa ke permukaan relasi-relasi yang kompleks pada set data yang sangat besar. Set data yang dimaksud di sini adalah set data yang berbentuk tabulasi, seperti yang banyak diimplementasikan dalam teknologi manajemen basis data relasional. Akan tetapi, teknik-teknik data mining dapat juga diaplikasikan pada representasi data yang lain, seperti domain data spatial, berbasis text, dan multimedia (citra). Data mining

dapat juga didefinisikan sebagai

“pemodelan dan penemuan pola-pola yang tersembunyi dengan memanfaatkan data

dalam volume yang besar” Data mining

menggunakan pendekatan discovery-based dimana pencocokan pola (pattern-matching)

dan algoritma-algoritma yang lain

digunakan untuk menentukan relasi-relasi kunci di dalam data yang diekplorasi Data mining merupakan komponen baru pada arsitektur Sistem Pendukung Keputusan (SPK) di perusahaan-perusahaan.

2. TEORI PENUNJANG

Data Mining (DM) adalah salah satu bidang yang berkembang pesat karena besarnya kebutuhan akan nilai tambah dari database skala besar yang makin banyak terakumulasi sejalan dengan pertumbuhan teknologi informasi. Definisi umum dari DM itu sendiri adalah serangkaian proses untuk menggali nilai tambah berupa

pengetahuan yang selama ini tidak

diketahui secara manual dari suatu

kumpulan data.

Data mining adalah kombinasi secara logis antara pengetahuan data, dan analisa

statistik yang dikembangkan dalam

pengetahuan bisnis atau suatu proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, tiruan dan

machine-learning untuk mengekstraksi dan

mengidentifikasi informasi yang

bermanfaat bagi pengetahuan yang terkait

dari berbagai database besar.

Pengelompokan (Clustering)

merupakan tugas deskripsi yang banyak digunakan dalam mengidentifikasi sebuah himpunan terbatas pada kategori atau cluster untuk mendeskripsikan data yang

ditelaah. Kategori-kategori ini dapat

bersifat eksklusif dan ekshaustif mutual, atau mengandung representasi yang lebih kaya seperti kategori yang hirarkis atau saling menumpuk (overlapping).

Berbeda dengan association rule

mining dan classification dimana kelas data telah ditentukan sebelumnya, clustering melakukan pengelompokan data tanpa berdasarkan kelas data tertentu. Bahkan clustering dapat dipakai untuk memberikan label pada kelas data yang belum diketahui

itu. Karena itu clustering sering

digolongkan sebagai metode unsupervised learning. Prinsip dari clustering adalah memaksimalkan kesamaan antar anggota satu kelas dan meminimumkan kesamaan

antar kelas/cluster. Clustering dapat

dilakukan pada data yang memiliki


(3)

ruang multidimensi. Ilustrasi dari clustering dapat dilihat pada Gambar 2.4 dimana lokasi, dinyatakan dengan bidang dua dimensi, dari pelanggan suatu toko dapat dikelompokkan menjadi beberapa cluster dengan pusat cluster ditunjukkan oleh tanda positif (+).

Banyak algoritma clustering

memerlukan fungsi jarak untuk mengukur kemiripan antar data, diperlukan juga metode untuk normalisasi bermacam atribut yang dimiliki data.

Beberapa kategori algoritma clustering yang banyak dikenal adalah metode partisi dimana pemakai harus menentukan jumlah k partisi yang diinginkan lalu setiap data di tes untuk dimasukkan pada salah satu partisi, metode lain yang telah lama dikenal adalah metode hierarki yang terbagi dua lagi : bottom-up yang menggabungkan cluster kecil menjadi cluster lebih besar dan top-down yang memecah cluster besar

menjadi cluster yang lebih kecil.

Kelemahan metode ini adalah bila salah satu penggabungan/pemecahan dilakukan pada tempat yang salah, tidak dapat

didapatkan cluster yang optimal.

Pendekatan yang banyak diambil adalah menggabungkan metode hierarki dengan metode clustering lainnya seperti yang dilakukan oleh Chameleon.

Gambar 2.4 Ilustrasi Clustering

K-Means Clustering merupakan metode

untuk mengklasifikasikan atau

mengelompokan objek-objek (data)

kedalam K-group (cluster) berdasarkan

atribut tertentu. Pengelompokan data

dilakukan untuk memperhitungkan jarak terdekat antara data-data(objek observasi)

dengan pusat cluster (centroid). Prinsip utama dari metode ini adalah menyusun K buah centroid atau rata-rata (mean) dari sekumpulan data berdimensi N, dimana metode ini mensyaratkan nilai K sudah diketahui sebelumnya (apriori). Algoritma K-Means dimulai dengan pembentukan prototype cluster diawal kemudian secara iteratif prototipe cluster tersebut diperbaiki sehingga tercapai kondisi konvergen, yaitu kondisi dimana tidak terjadi perubahan yang signifikan terhadap prototipe cluster. Perubahan ini diukur dengan menggunakan

fungsi objektif D yang umumnya

didefinisikan sebagai jumblah atau rata-ratajarak tiap item data dengan centroid groupnya.

Algoritma K-Means

K-Means termasuk dalam partitioning clustering yaitu setiap data harus masuk dalam cluster tertentu dan memungkinkan bagi setiap data yang termasuk dalam cluster tertentu pada suatu tahapan proses, pada tahapan berikutnya berpindah ke cluster yang lain. K-Means memisahkan data ke k daerah bagian yang terpisah, dimana k adalah bilangan integer positif. Algoritma K-Means sangat terkenal karena kemudahan dan kemampuannya untuk mengklasifikasi data besar dan outlier dengan sangat cepat. Berikut adalah langkah-langkah algoritma K-Means :

1. Penentuan Pusat Cluster Awal

Dalam menentukan n buah pusat cluster awal dilakukan pembangkitan bilangan random yang merepresentasikan urutan data input. Pusat awal cluster didapatkan dari data sendiri bukan dengan menentukan titik baru, yaitu dengan menrandom pusat awal dari data.

2. Perhitungan Jarak Dengan Pusat

Cluster

Untuk mengukur jarak antara data dengan pusat cluster digunakan

Euclidian distance.

1) Algoritma perhitungan jarak data

dengan pusat cluster

2) Ambil nilai data dan nilai pusat


(4)

Hitung Euclidian distance data dengan tiap pusat cluster

3 Pengelompokkan Data

Jarak hasil perhitungan akan

dilakukan perbandingan dan dipilih jarak terdekat antara data dengan pusat cluster, jarak ini menunjukkan bahwa data tersebut berada dalam satu kelompok dengan pusat cluster terdekat.

1) Ambil nilai jarak tiap pusat cluster

dengan data

2) Cari nilai jarak terkecil

3) Kelompokkan data dengan pusat

cluster yang memiliki jarak terkecil.

4. Penentuan pusat cluster baru

Untuk mendapatkan pusat cluster baru bisa dihitung dari rata-rata nilai anggota cluster dan pusat cluster. Pusat cluster yang baru digunakan untuk melakukan iterasi selanjutnya, jika hasil yang didapatkan belum konvergen. Proses iterasi akan berhenti jika telah memenuhi maksimum iterasi yang dimasukkan oleh User atau hasil yang dicapai sudah konvergen (pusat cluster baru sama dengan pusat cluster lama).

Proses Clustering Algoritma K-Means

Pada tahap ini akan dilakukan proses utama yaitu segmentasi data nilai

yang diakses dari database yaitu sebuah metode clustering algoritma K-Means. Berikut ini merupakan diagram flowchart dari algoritma K-Means dengan asumsi bahwa parameter input adalah jumlah data set sebanyak n data dan jumlah inisialisasi centroid K=4 sesuai dengan jumlah jurusan yang ada di PT Dirgantara Indonesia yaitu

Boeing, Hovercraft, Helikopter, dan

Aircraft

beberapa langkah yang dilalui oleh

clustering algoritma K-Means memuat bagian-bagian sebagai berikut ini:

1. N data : data set yang akan diolah

sebanyak N data dimana N data tersebut

terdiri dari atribut-atributnya

N(Boeing,Hovercraft,Helikopter, dan

Aircraft) yang berarti data N memiliki atribut sebanyak 4

2. K Centroid : Inisialisasi dari pusat

cluster data adalah sebanyak K dimana

pusat-pusat awal tersebut digunakan

sebagai banyaknya kelas yang akan tercipta. Centroid didapatkan secara random dari N data set yang ada.

3. Euclidian Distance: merupakan

jarak yang didapat dari perhitungan antara semua N data dengan K centroid dimana akan memperoleh tingkat kedekatan dengan kelas yang terdekat dengan populasi data tersebut. Jarak euclidian untuk menandai adanya persamaan antar tiap cluster dengan jarak minimum dan mempunyai persamaan yang lebih tinggi. Euclidian matrik.

Dimana :

x : Titik data pertama y : Titik data kedua,

n : Jumlah karakteristik (attribut) dalam terminologi data mining,

d(x,y) : Euclidian distance yaitu jarak antara data pada titik x dan titik y menggunakan kalkulasi matematika

4. Pengelompokkan Data: setelah sejumlah

populasi data tersebut menemukan

kedekatan dengan salah satu centroid yang ada maka secara otomatis populasi data

tersebut masuk kedalam kelas yang

memiliki centroid yang bersangkutan. 5. Update Centroid Baru: tiap kelas yang telah tercipta tadi melakukan update

centroid baru. Hal ini dilakukan dengan menghitung nilai rata-rata dari kelas masing-masing. Apabila belum memenuhi optimal hasil proses pengukuran ecluidian distance dilakukan kembali.

6. Batas Iterasi : apabila dalam proses clustering belum optimal namun sudah memenuhi batas iterasi maka proses dihentikan


(5)

ERD

Wilayah Penjualan Produk

History

memiliki n n memiliki 1 1

memiliki 1

1

PK : Prodid Nama_produk

PK : id_wilayah Nama_wilayah

kelas

PK : idjual tanggal Id_wilayah

prodid jumlah

No_cluster Id_wilayah kelompok

Jumlah_cluster jumlah

rata1

rata2

rata3

rata4

Gambar 3.1 ERD yang digunakan

4. IMPLEMENTASI DAN PENGUJIAN Implementasi Aplikasi

a. Implementasi Antar Muka Pengguna (User Interface) awal

Berikut adalah tampilan antar muka

pengguna (user interface) aplikasi.

Gambar 4.1 Tampilan awal

b. Implementasi tampilan utama

Gambar 4.2 Tampilan utama d.proses analisa clustering

Gambar 4.3 Tampilan form proses clustering

Gambar 4.4 tampilan form history proses clustering dan laporan akhir


(6)

5. KESIMPULAN DAN SARAN

Setelah melalui tahap implementasi dan pengujian sistem dilakukan maka dapat diambil beberapa kesimbulan sebagai berikut:

Setelah melakukan analisis,

perancangan, dan pengujian, maka dapat diperoleh kesimpulan sebagai berikut :

1. Aplikasi yang dibangun dapat

membantu PT. Dirgantara Indonesia sebagai gambaran bagi pengambilan keputusan perusahaan dalam rangka mendapatkan pola penjualan produk yang dihasilkan.

2. Pengolahan data yang dilakukan

dapat menghasilkan informasi yang cukup untuk dapat dianalisa lebih lanjut.

3. Aplikasi yang dibangun dapat

mengurangi penumpukan data yang kurang dimanfaatkan sebelumnya.

4. Aplikasi yang dibangun dapat

memberi gambaran dari penjualan

produk ,wilayah dan tahun

penjualanya dengan grafik dan diagram yang ada.

5. Aplikasi yang dibangun dapat

Memudahkan perusahaan dalam

mengehtahui informasi dari

penjualan unit di PT Dirgantara Indonesia

Adapun saran untuk mengoptimalkan aplikasi di masa mendatang adalah sebagai berikut:

1. Berdasarkan kesimpulan di atas, hal

yang diharapkan kedepan adalah

agar aplikasi ini dapat

dikembangkan lebih jauh dengan pengolahan data yang lebih besar dan luas sehingga aplikasi ini benar-benar dapat digunakan sebagai salah satu gambaran dalam pengambilan keputusan perusahaan yang lebih akurat dan berguna.

6. DAFTAR PUSTAKA

[1] Andi (Rabu, 4 Maret 2009), Data

Mining dan Web Mining,

http://andyku.wordpress.com/2008/04/ 17/data-mining-dan-web-mining/

[2] Andri Heryandi, S.T. SQL

(Structured Query Language) dengan

delphi,

Diktat Delphi, 1-55

[3] Iko Pramudiono. (Rabu, 4 Maret

2009), Pengantar Data Mining: Menambang Permata Pengetahuan di Gunung Data, http://ilmukomputer.org/2008/11/25/p engantardata-mining/

[4] Kadir, Abdul,( 2001), Konsep Dan

Tuntunan Basis Data , Yogyakarta : Andi.

[5] Sandy Kurniawan, Taufiq Hidayat

(Rabu, 5 Agustus 2009), PENERAPAN DATA MINING

DENGAN METODE INTERPOLASI

UNTUK MEMPREDIKSI MINAT

KONSUMEN ASURANSI (Studi

[7] Susanti, Azhar, (2003), Sistem

Informasi Management, Yogyakarta: Andi. Yusta Noverison. (Selasa, 3 Maret 2009),

Data Mining,

http://yustanoverison.blogspot.com/20 08/05/data-mining.html