Penerapan Data Mining Pada penjualan Produk Minuman Di PT. Pepsi Cola Indobeverages Menggunakan Metode Clustering

(1)

PENERAPAN

DATA MINING

PADA PENJUALAN PRODUK

MINUMAN DI PT. PEPSI COLA INDOBEVERAGES

MENGGUNAKAN METODE

CLUSTERING

SKRIPSI

Diajukan untuk Menempuh Ujian Akhir Sarjana Program Strata Satu Jurusan Teknik Informatika

Fakultas Teknik dan Ilmu Komputer Universitas Komputer Indonesia

Oleh :

ENUR IRDIANSYAH

10105140

JURUSAN TEKNIK INFORMATIKA

FAKULTAS TEKNIK DAN ILMU KOMPUTER

UNIVERSITAS KOMPUTER INDONESIA

BANDUNG

(2)

LEMBAR PENGESAHAN

PENERAPAN

DATA MINING

PADA PENJUALAN PRODUK

MINUMAN DI PT. PEPSI COLA INDOBEVERAGES

MENGGUNAKAN METODE

CLUSTERING

ENUR IRDIANSYAH

10105140

Pembimbing,

Andri Heryandi, S.T., M.T. NIP. 41277006007

Menyetujui,

Ketua Jurusan Teknik Informatika

Mira Kania Sabariah, S.T., M.T. NIP. 41277006008

(3)

PENERAPAN

DATA MINING

PADA PENJUALAN PRODUK

MINUMAN DI PT. PEPSI COLA INDOBEVERAGES

MENGGUNAKAN METODE

CLUSTERING

ENUR IRDIANSYAH

10105140

Penguji I Penguji II

Irfan Maliki, S.T. Andri Heryandi, S.T., M.T.

NIP. 41277006019 NIP. 41277006007

Penguji III

Tati Harihayati M., S.T., M.T. NIP. 41277006006

(4)

ABSTRAK

PENERAPAN

DATA MINING

PADA PENJUALAN PRODUK

MINUMAN DI PT. PEPSI COLA INDOBEVERAGES

MENGGUNAKAN METODE

CLUSTERING

Oleh

Enur Irdiansyah

10105140

Dalam dunia bisnis yang selalu dinamis dan penuh persaingan, para pelakunya harus senantiasa memikirkan cara-cara untuk terus survive dan jika mungkin mengembangkan skala bisnis mereka.

PT. Pepsi Cola Indobeverages merupakan perusahaan yang bergerak dalam bidang industri minuman. Sebagai perusahaan besar, PT. Pepsi Cola Indobeverages menghasilkan berbagai macam produk minuman dengan nama dan kemasan yang berbeda. Tidak hanya PT. Pepsi Cola Indobeverages, masih cukup banyak perusahaan-perusahaan lain yang bergerak dibidang serupa. Hal tersebut tentu saja menimbulkan persaingan bisnis antarperusahaan.

Dalam rangka menghadapi persaingan bisnis dan meningkatkan pendapatan perusahaan, pihak terkait dalam perusahaan tersebut dituntut untuk dapat mengambil keputusan yang tepat dalam menentukan strategi pemasaran produk minuman yang akan dijualnya.

Ketersediaan data yang melimpah, kebutuhan akan informasi (atau pengetahuan) sebagai pendukung pengambilan keputusan untuk membuat solusi bisnis, dan dukungan infrastruktur di bidang teknologi informasi merupakan cikal-bakal dari lahirnya teknologi data mining. Data mining dimaksudkan untuk memberikan solusi nyata bagi para pengambil keputusan di dunia bisnis, untuk mengembangkan bisnis mereka.

Data mining didefinisikan sebagai satu set teknik yang digunakan secara otomatis untuk mengeksplorasi secara menyeluruh dan membawa ke permukaan relasi-relasi yang kompleks pada set data yang sangat besar. Salah satu metode yang terdapat dalam data mining yang digunakan dalam penelitian ini adalah pengelompokan (Clustering) dimana metode tersebut mengidentifikasi objek yang memiliki kesamaan karakteristik tertentu, dan kemudian menggunakan karakteristik tersebut sebagai “vektor karakteristik” atau “centroid”.

Hasil dari penelitian ini adalah aplikasi yang dapat mempermudah menganalisis sejumlah data yang besar guna membantu memberikan informasi berharga sebagai gambaran dasar pengambilan keputusan perusahaan.

Kata kunci : persaingan bisnis, solusi bisnis, teknologi informasi, data mining, pengelompokan(clustering)

(5)

ABSTRACT

DATA MINING APPLICATION OF BEVERAGE PRODUCTS

MARKETING IN PEPSI COLA INDOBEVERAGES COMPANY

USING CLUSTERING METHOD

Enur Irdiansyah

10105140

In the dynamic and very competitive world of commerce or business, the people involved have to be fully prepared of the ways to surviving and developing their business range.

Pepsi Cola Indobeverages Company is a consumer products company focused on beverages. As a big company, Pepsi Cola Indobeverages Company seeks to produce various beverage products with different names and packages. Pepsi Cola Indobeverages Company is not the only one company that focused on beverages in Indonesia, there are several companies with similar direction. It is surely arising business competitions among the companies.

To be up against the business competitions and to improve company financial rewards, the company must have an ability to take the appropriate decision of definitive marketing strategies of their beverage products.

The availability of abundant data, the necessity of information (or knowledge) as the proponent to take the appropriate decision of establishing business solutions, and the infrastructure supports in information technology are the pioneers of data mining technology. Data mining purpose is to give the real solution for the decision maker of business, and to developing their business range.

Data mining is defined as one technique set that automatically used to explore comprehensively and bring the complex relations to the surface in the huge data set. The one of data mining method that used in this research is Clustering, it is identify object with the similarity of certain characteristics, and then using those characteristics as the “vector characteristic” or “centroid”.

The result of this research is an application that will make analyze of huge data set easier then helpful to give information as a basic feature of company’s decision makers.

Keywords: business competition, business solution, information technology, data mining, clustering

(6)

DAFTAR ISI

LEMBAR JUDUL

LEMBAR PENGESAHAN

ABSTRAK ... i

ABSTRACT ... ii

KATA PENGANTAR ... iii

DAFTAR ISI ... vi

DAFTAR TABEL ... xii

DAFTAR GAMBAR ... xiv

DAFTAR SIMBOL ... xvii

DAFTAR LAMPIRAN ... xix

BAB I PENDAHULUAN ... 1

1.1.Latar Belakang Masalah ... 1

1.2.Perumusan Masalah ... 3

1.3.Maksud dan Tujuan ... 4

1.4.Batasan Masalah ... 4

1.5.Metodologi Penelitian ... 5

1.6.Sistematika Penulisan ... 7

BAB II TINJAUAN PUSTAKA ... 9

2.1.Tinjauan Tempat Penelitian ... 9

2.1.1. Sejarah Perusahaan ... 9

(7)

vii

2.2.Landasan Teori ... 18

2.2.1. Pengertian Data Mining... 18

2.2.2. Tahapan Data Mining ... 20

2.2.3. Arsitektur Data Mining ... 22

2.2.4. Pengelompokkan (Clustering) ... 23

2.2.4.1. Teknik Clustering ... 26

2.2.4.2. Hierarchical Clustering ... 27

2.2.4.3. Agglomerative ... 27

2.2.4.4. Divisive ... 28

2.2.4.5. Partitional Clustering ... 29

2.2.4.6. Agglomerative Hierarchical Clustering Algorithm (AHC Algorithm) ... 29

2.2.4.7. Contoh Penerapan Clustering Menggunakan Algoritma AHC ... 32

2.2.5. Konsep Dasar Data dan Informasi ... 35

2.2.5.1. Pengertian Data ... 35

2.2.5.2. Pengertian Informasi ... 35

2.2.6. Basis Data (Database) ... 36

2.2.7. Database Management System (DBMS)... 38

2.2.8. ERD (Entity Relationship Diagram)... 40

(8)

viii

2.2.10.Kamus Data (Data Dictionary) ... 45

2.2.11.MySQL ... 46

2.2.12.Delphi ... 47

BAB III ANALISIS DAN PERANCANGAN SISTEM ... 49

3.1.Analisis Sistem ... 49

3.1.1. Analisis Masalah... 49

3.1.2. Analisis Non Fungsional dan Kebutuhan Non Fungsional ... 51

3.1.2.1. Analisis Perangkat Keras ... 51

3.1.2.2. Analisis Perangkat Lunak ... 52

3.1.2.3. Analisis User (Pengguna) ... 52

3.1.3. Analisis Basis Data ... 53

3.2.Analisis Kebutuhan Fungsional ... 55

3.2.1. Diagram Konteks ... 55

3.2.2. Data Flow Diagram (DFD) ... 56

3.2.2.1. DFD Level 1 ... 56

3.2.2.2. DFD Level 2 Proses Pengolahan Data Master ... 57

3.2.2.3. DFD Level 2 Proses Clustering ... 57

3.2.2.4. DFD Level 3 Proses Pengolahan Data User ... 58

3.2.2.5. DFD Level 3 Proses Input Parameter Kelas Wilayah Penjualan ... 59

3.2.2.6. DFD Level 3 Proses Buat Clustering ... 60

3.2.3. Spesifikasi Proses ... 61

3.2.4. Kamus Data ... 74

(9)

3.3.2. Perancangan Antar Muka ... 81

3.3.2.1. Perancangan Tampilan Program ... 81

3.3.2.1.1. Tampilan Awal Aplikasi ... 81

3.3.2.1.2. Tampilan Login User ... 82

3.3.2.1.3. Tampilan Menu Utama Setelah Login User... 82

3.3.2.1.4. Tampilan Sub Menu User/Operator ... 83

3.3.2.1.5. Tampilan Sub Menu Hak Akses Menu ... 83

3.3.2.1.6. Tampilan Sub Menu Kelas Wilayah Penjualan ... 84

3.3.2.1.7. Tampilan Sub Menu Import Data Penjualan ... 84

3.3.2.1.8. Tampilan Sub Menu Analisa Clustering ... 85

3.3.2.1.9. Tampilan Sub Menu Ganti Password ... 85

3.3.2.1.10. Tampilan Menu About ... 86

3.3.2.1.11. Tampilan Tambah Data User ... 86

3.3.2.1.12. Tampilan Edit Data User ... 86

3.3.2.1.13. Tampilan History ... 87

3.3.2.1.14. Tampilan Lihat Progress ... 87

3.3.2.2. Perancangan Pesan ... 88

3.3.3. Perancangan format input/import dan output/eksport ... 89

3.3.3.1. Perancangan format input/import ... 89

(10)

3.3.4. Perancangan Prosedural ... 91

3.3.5. Jaringan Semantik... 98

BAB IV IMPLEMENTASI DAN PENGUJIAN ... 99

4.1.Implementasi Sistem ... 99

4.1.1. Implementasi Perangkat Keras ... 99

4.1.2. Implementasi Perangkat Lunak ... 100

4.1.3. Implementasi Form ... 100

4.1.4. Implementasi Basis Data ... 101

4.1.5. Implementasi Antar Muka ... 107

4.1.6. Implementasi Pesan ... 114

4.2.Pengujian ... 116

4.2.1. Rencana Pengujian ... 116

4.2.2. Kasus dan Hasil Pengujian Alpha ... 117

4.2.2.1. Pengujian Login ... 117

4.2.2.2. Pengujian Pengolahan Data User ... 118

4.2.2.3. Pengujian Pengolahan Hak Akses User ... 121

4.2.2.4. Pengujian Input Kelas Wilayah Penjualan ... 123

4.2.2.5. Pengujian Import Data Penjualan ... 124

4.2.2.6. Pengujian Analisa Clustering ... 125

4.2.2.7. Pengujian Ganti Password ... 127

4.2.3. Kesimpulan Hasil Pengujian Alpha ... 129

4.2.4. Kasus dan Hasil Pengujian Beta ... 129

(11)

(12)

xii

DAFTAR TABEL

Tabel 2.1 Data Penjualan Minuman Per Wilayah Tanggal 1 Januari 2007 ... 32

Tabel 2.2 Pembuatan cluster pertama ... 33

Tabel 2.3 Hasil clustering sebanyak tiga cluster ... 34

Tabel 3.1 Karakteristik Pengguna ... 52

Tabel 3.2 Spesifikasi Proses ... 61

Tabel 3.3 Kamus Data Proses Login ... 74

Tabel 3.4 Kamus Data : Data Penjualan ... 74

Tabel 3.5 Kamus Data : Parameter Kelas Wilayah ... 75

Tabel 3.6 Kamus Data : Data history ... 75

Tabel 3.7 Kamus Data : Data detail history ... 75

Tabel 3.8 Kamus Data : Data cluster ... 75

Tabel 3.9 Struktur Tabel User (m_user) ... 77

Tabel 3.10 Struktur Tabel Hak Akses (m_trustee_01)... 77

Tabel 3.11 Struktur Tabel Penjualan (t_penjualan) ... 77

Tabel 3.12 Struktur Tabel Produk (m_product) ... 78

Tabel 3.13 Struktur Tabel Kelas Wilayah (m_kelaswilayah) ... 78

Tabel 3.14 Struktur Tabel History (history) ... 78

Tabel 3.15 Struktur Tabel Detail History (detail_history) ... 78

Tabel 3.16 Struktur Tabel Cluster (cluster) ... 79

Tabel 3.17 Struktur Tabel Temporary (tmp1) ... 79

(13)

xiii

Tabel 4.1 Implementasi Form ... 100

Tabel 4.2 Rencana Pengujian Aplikasi Data Mining PT. PEPSI COLA INDOBEVERAGES ... 116

Tabel 4.3 Pengujian Verifikasi User ID dan Password... 117

Tabel 4.4 Pengujian Pengolahan Data User ... 118

Tabel 4.5 Pengujian Pengolahan Hak Akses User ... 121

Tabel 4.6 Pengujian Input Kelas Wilayah Penjualan ... 123

Tabel 4.7 Pengujian Import Data Penjualan ... 124

Tabel 4.8 Pengujian Analisa Clustering... 125

(14)

xiv

DAFTAR GAMBAR

Gambar 1.1 Paradigma Waterfall ... 7

Gambar 2.1 Struktur Organisasi Perusahaan ... 18

Gambar 2.2 Tahapan pada proses knowledge discovery ... 20

Gambar 2.3 Arsitektur Data Mining ... 23

Gambar 2.4 Ilustrasi Clustering ... 25

Gambar 2.5 Pengelompokan himpunan data menjadi tiga cluster ... 25

Gambar 2.6 Agglomerative dan Divisive ... 27

Gambar 3.1 Entity Relationship Diagram (ERD) ... 54

Gambar 3.2 Diagram Konteks... 55

Gambar 3.3 DFD Level 1 ... 56

Gambar 3.4 DFD Level 2 Proses Pengolahan Data Master ... 57

Gambar 3.5 DFD Level 2 Proses Clustering ... 58

Gambar 3.6 DFD Level 3 Proses Pengolahan Data User ... 59

Gambar 3.7 DFD Level 3 Proses Input Parameter Kelas Wilayah Penjualan ... 60

Gambar 3.8 DFD Level 3 Proses Buat Cluster ... 61

Gambar 3.9 Skema Relasi ... 76

Gambar 3.10 Perancangan Struktur Menu ... 80

Gambar 3.11 Tampilan Awal Aplikasi ... 81

Gambar 3.12 Tampilan Login User ... 82

Gambar 3.13 Tampilan Menu Utama Setelah Login User ... 82

(15)

Gambar 3.18 Tampilan Sub Menu Analisa Clustering ... 85

Gambar 3.19 Tampilan Sub Menu Ganti Password ... 85

Gambar 3.20 Tampilan Menu About ... 86

Gambar 3.21 Tampilan Tambah Data User ... 86

Gambar 3.22 Tampilan Edit Data User ... 87

Gambar 3.23 Tampilan History... 87

Gambar 3.24 Tampilan Lihat Progress ... 88

Gambar 3.25 Tampilan Perancangan Pesan ... 88

Gambar 3.26 Tampilan Perancangan Format input/import... 90

Gambar 3.27 Tampilan Perancangan Format output/eksport ... 90

Gambar 3.28 Perancangan Prosedural Flowchart login ... 91

Gambar 3.29 Perancangan Prosedural Flowchart tambah data ... 92

Gambar 3.30 Perancangan Prosedural Flowchart edit data ... 93

Gambar 3.31 Perancangan Prosedural Flowchart hapus data ... 94

Gambar 3.32 Perancangan Prosedural Flowchart import data ... 95

Gambar 3.33 Perancangan Prosedural Flowchart eksport data ... 96

Gambar 3.34 Perancangan Prosedural Flowchart ganti password ... 97

Gambar 3.35 Jaringan Semantik ... 98

Gambar 4.1 Form Tampilan Awal Aplikasi ... 107

(16)

xvi

Gambar 4.3 Form Menu Utama Aplikasi ... 108

Gambar 4.4 Form Pengolahan Data User ... 108

Gambar 4.5 Form Tambah User... 109

Gambar 4.6 Form Edit User ... 109

Gambar 4.7 Form Pengolahan Hak Akses User... 109

Gambar 4.8 Form Wilayah Penjualan Per Kelas ... 110

Gambar 4.9 Form Import Data Penjualan ... 110

Gambar 4.10 Form Cari File ... 111

Gambar 4.11 Form Analisa Clustering ... 111

Gambar 4.12 Form Ganti Password ... 112

Gambar 4.13 Form About ... 112

Gambar 4.14 Laporan Daftar User... 113

Gambar 4.15 Laporan Hasil Analisa Clustering ... 113

Gambar 4.16 Form History ... 114

Gambar 4.17 Form Lihat Progress ... 114

(17)

xvii

Simbol Nama Keterangan

Entity Menunjukkan himpunan entitas

Garis Menunjukkan penghubung antara

himpunan relasi dengan himpunan entitas dan himpunan entitas dengan atributnya

Belah ketupat / Relationship

Menunjukkan himpunan relasi

Atribut Menunjukan item data yang menjadi bagian dari suatu entitas

2. Simbol DataFlowDiagram

Simbol Nama Keterangan

Proses Menunjukkan kegiatan / kerja yang dilakukan oleh orang, mesin atau komputer

Terminator Menunnjukkan bagian dari luar

Arus / Aliran data

Menunjukkan arus dari proses

Data store Menunjukkan simpanan dari data yang dapat berupa suatu file / database di sistem komputer

(18)

xviii 3. Simbol Flowchart

Simbol Nama Fungsi

Terminator Permulaan/akhir program

Garis alir

(flow line)

Arah aliran program

Proses Proses perhitungan/proses

pengolahan data

Input/output data Proses input/output data, parameter, informasi

Decision Perbandingan pernyataan,

penyeleksian data yang memberikan pilihan untuk langkah selanjutnya

(19)

xix

Lampiran B Hasil Kuesioner ... B-1 Lampiran C Surat Penelitian ... C-1

(20)

BAB I PENDAHULUAN

1.1Latar Belakang Masalah

Dalam dunia bisnis yang selalu dinamis dan penuh persaingan, para pelakunya harus senantiasa memikirkan cara-cara untuk terus survive dan jika mungkin mengembangkan skala bisnis mereka. Untuk mencapai hal itu, ada tiga kebutuhan bisnis yang dapat dilakukan, yaitu penambahan jenis maupun peningkatan kapasitas produk, pengurangan biaya operasi perusahaan, dan peningkatan efektifitas pemasaran dan keuntungan. Agar bisa memenuhi kebutuhan-kebutuhan bisnis di atas banyak cara yang dapat ditempuh, salah satunya adalah dengan melakukan analisis data perusahaan.

PT. Pepsi Cola Indobeverages merupakan perusahaan yang bergerak dalam bidang industri minuman. Sebagai perusahaan besar, PT. Pepsi Cola Indobeverages menghasilkan berbagai macam produk minuman dengan nama yang berbeda. Tidak hanya PT. Pepsi Cola Indobeverages, masih cukup banyak perusahaan-perusahaan lain yang bergerak di bidang serupa. Hal tersebut tentu saja menimbulkan persaingan bisnis antar perusahaan.

Produk minuman yang diproduksi oleh PT. Pepsi Cola Indobeverages tersebut selain memiliki nama yang berbeda, setiap nama dari minuman tersebut pun memiliki kemasan yang beragam pula. Produk-produk minuman yang diproduksi tersebut dipasarkan ke banyak kota-kota di Indonesia. Hal ini tentu akan menghasilkan data penjualan produk yang begitu banyak.

(21)

Untuk menghadapi persaingan bisnis yang dinamis pihak perusahaan dituntut agar dapat mengambil keputusan yang tepat dalam menentukan strategi pemasaran produk yang akan dijualnya. Agar dapat melaksanakan hal tersebut, perusahaan memerlukan informasi yang cukup untuk dapat dianalisa lebih lanjut. Informasi yang dihasilkan tentunya adalah hasil analisis dari pengolahan data penjualan pada perusahaan tersebut. Data penjualan yang sudah ada akan diolah atau dianalisis untuk mengetahui tingkat kecenderungan konsumen di setiap tempat tujuan pemasaran produk pada faktor ketertarikannya. Dari pengolahan data tersebut akan diperoleh suatu pola konsumsi masyarakat terhadap produk dari perusahaan tersebut.

Data mining didefinisikan sebagai satu set teknik yang digunakan secara otomatis untuk mengeksplorasi secara menyeluruh dan membawa ke permukaan relasi-relasi yang kompleks pada set data yang sangat besar. Set data yang dimaksud di sini adalah set data yang berbentuk tabulasi, seperti yang banyak diimplementasikan dalam teknologi manajemen basis data relasional. Akan tetapi, teknik-teknik data mining dapat juga diaplikasikan pada representasi data yang lain, seperti domain data spatial, berbasis text, dan multimedia (citra). Data

(22)

mining dapat juga didefinisikan sebagai “pemodelan dan penemuan pola-pola yang tersembunyi dengan memanfaatkan data dalam volume yang besar” Data mining menggunakan pendekatan discovery-based dimana pencocokan pola (pattern-matching) dan algoritma-algoritma yang lain digunakan untuk menentukan relasi-relasi kunci di dalam data yang diekplorasi. Data mining merupakan komponen baru pada arsitektur sistem pendukung keputusan (SPK) di perusahaan-perusahaan.

Pengelompokan (Clustering) mengidentifikasi objek yang memiliki kesamaan karakteristik tertentu, dan kemudian menggunakan karakteristik tersebut sebagai “vektor karakteristik” atau “centroid”. Pengelompokan ini digunakan oleh perusahaan untuk membuat laporan mengenai karakteristik umum dari grup-grup konsumen yang berbeda. Proses Clustering yang akan dilakukan menggunakan Agglomerative Hierarchical Clustering Algorithm (AHC algorithm).

Dari pertimbangan atas penjelasan yang telah dipaparkan diatas, maka dibuatlah suatu aplikasi PENERAPAN DATA MINING PADA PENJUALAN PRODUK MINUMAN DI PT. PEPSI COLA INDOBEVERAGES

MENGGUNAKAN METODE CLUSTERING.

1.2 Identifikasi Masalah

Dengan mengacu pada latar belakang masalah diatas, maka permasalahan yang dibahas dan diteliti adalah :

(23)

Bagaimana cara menerapkan Data Mining pada penjualan produk minuman di PT. PEPSI COLA INDOBEVERAGES menggunakan metode clustering.

1.3Maksud dan Tujuan

Berdasarkan permasalahan yang diteliti, maka maksud dari penulisan tugas akhir ini adalah untuk membangun aplikasi Data Mining pada penjualan produk minuman di PT. Pepsi Cola Indobeverages menggunakan metode clustering.

Sedangkan tujuan yang akan dicapai dalam penelitian ini antara lain : 1. Mempermudah menganalisis data yang besar

2. Membantu memberikan informasi dari data penjualan yang diolah 3. Memberikan gambaran dalam pengambilan keputusan

1.4Batasan Masalah

Adapun batasan masalah yang akan dibahas adalah :

1. Data yang akan dianalisa merupakan data penjualan produk minuman di PT. PEPSI COLA INDOBEVERAGES.

2. Algoritma yang digunakan dalam metode clustering yang dilakukan adalah Agglomerative Hierarchical Clustering Algorithm (AHC).

3. Format file yang akan diinputkan berupa file database dengan berekstensi excel atau xls.

4. Hasil dari analisa tersebut adalah terbentuknya pola penjualan produk minuman di PT. PEPSI COLA INDOBEVERAGES.

(24)

6. Metode yang digunakan adalah metode aliran terstruktur dimana tools yang digunakan adalah Data Flows Diagram (DFD) dan Entity Relationship Diagram (ERD).

7. Aplikasi ini dibangun dengan menggunakan bahasa pemrograman Pascal dengan aplikasi pemrograman Borland Delphi 7 dan Database menggunakan MySQL.

1.5Metodologi Penelitian

Metodologi yang digunakan dalam penulisan tugas akhir ini adalah sebagai berikut :

1. Tahap pengumpulan data

Metode pengumpulan data yang digunakan dalam penelitian ini adalah sebagai berikut :

a. Studi Literatur

Pengumpulan data dengan cara mengumpulkan literatur, jurnal, paper dan bacaan-bacaan yang ada kaitannya dengan judul penelitian.

b. Observasi

Teknik pengumpulan data dengan mengadakan penelitian dan peninjauan langsung terhadap permasalahan yang diambil.

c. Interview

Teknik pengumpulan data dengan mengadakan tanya jawab secara langsung yang ada kaitannya dengan topik yang diambil.

(25)

2. Tahap pembuatan perangkat lunak.

Teknik analisis data dalam pembuatan perangkat lunak menggunakan pemodelan perangkat lunak dengan paradigma waterfall seperti terlihat pada Gambar 1.1, yang meliputi beberapa proses diantaranya:

a. System / Information Engineering

Merupakan bagian dari sistem yang terbesar dalam pengerjaan suatu proyek, dimulai dengan menetapkan berbagai kebutuhan dari semua elemen yang diperlukan sistem dan mengalokasikannya kedalam pembentukan perangkat lunak.

b. Analisis

Merupakan tahap menganalisis hal-hal yang diperlukan dalam pelaksanaan proyek pembuatan perangkat lunak.

c. Design

Tahap penerjemahan dari data yang dianalisis kedalam bentuk yang mudah dimengerti oleh user.

d. Coding

Tahap penerjemahan data atau pemecahan masalah yang telah dirancang keadalam bahasa pemrograman tertentu.

e. Pengujian

(26)

f. Maintenance

Tahap akhir dimana suatu perangkat lunak yang sudah selesai dapat mengalami perubahan–perubahan atau penambahan sesuai dengan permintaan user.

Gambar 1.1 Paradigma Waterfall

1.6Sistematika Penulisan

Sistematika penulisan penelitian tugas akhir ini disusun untuk memberikan gambaran umum tentang penelitian yang dijalankan. Sistematika penulisan tugas akhir ini adalah sebagai berikut :

BAB I. PENDAHULUAN

Bab ini menguraikan tentang latar belakang permasalahan, mencoba mengidentifikasi inti permasalahan yang dihadapi, menentukan maksud dan tujuan penelitian, yang kemudian diikuti dengan pembatasan masalah, metodologi penelitian, serta sistematika penulisan.

(27)

BAB II. TINJAUAN PUSTAKA

Bab ini membahas tentang tinjauan perusahaan serta berbagai konsep dasar dan teori-teori yang berkaitan dengan topik penelitian yang dilakukan dan hal-hal yang berguna dalam proses analisis permasalahan serta tinjauan terhadap penelitian-penelitian serupa yang telah pernah dilakukan sebelumnya termasuk sintesisnya.

BAB III. ANALISIS DAN PERANCANGAN SISTEM

Bab ini menganalisis masalah dari data hasil penelitian, kemudian dilakukan pula proses perancangan sistem yang akan dibangun sesuai dengan analisa yang telah dilakukan.

BAB IV. IMPLEMENTASI DAN PENGUJIAN

Bab ini berisi tentang implementasi dari tahapan-tahapan penting yang telah dilakukan sebelumnya kemudian dilakukan pengujian terhadap sistem sesuai dengan tahapan yang telah dijalani untuk memperlihatkan sejauh mana system yang dibangun layak digunakan.

BAB V. KESIMPULAN DAN SARAN

Bab ini berisi mengenai kesimpulan atas tugas akhir yang dibuat serta berisi saran-saran untuk adanya pengembangan mutu dan kualitas bagi masa yang akan datang.

(28)

BAB II

TINJAUAN PUSTAKA

2.1Tinjauan Tempat Penelitian

2.1.1 Sejarah Perusahaan

1965 PepsiCo, Inc. didirikan oleh Donald M. Kendall, Presiden dan Eksekutif Utama (Chief Executive Officer/CEO) Pepsi-Cola, dan Herman W. Lay, Pimpinan dan CEO Frito-Lay, melalui penggabungan kedua perusahaan. Pepsi-Cola diciptakan saat Caleb Bradham, seorang ahli farmasi dari New Bern, Carolina Utara, Amerika Serikat, pada akhir tahun 1890-an menciptakan sebuah minuman bernama “Minuman Brad” (“Brad’s drink”) dengan tujuan untuk mengobati sakit perut. Minuman itu terbuat dari air berkarbonat, gula, vanila, minyak pati, pepsin, dan buah kola. Pada 28 Agustus 1898, nama “Minuman Brad” diubah menjadi “Pepsi-Cola” dan kemudian nama itu didaftar pada 16 Juni 1903. Bradham memperoleh nama Pepsi dari penyakit dyspepsia (sakit perut atau ketidakcernaan). Frito-Lay, Inc. dibentuk pada tahun 1961 melalui gabungan Perusahaan Frito, yang didirikan oleh Elmer Doolin pada tahun 1932, dan Perusahaan H. W. Lay, yang didirikan oleh Herman W. Lay pada tahun 1932. Herman Lay sebagai Pimpinan Dewan Direktur dari perusahaan yang baru (PepsiCo); Donald M.

(29)

1966

1971

Kendall sebagai Presiden dan CEO. Perusahaan yang baru ini memiliki laporan penjualan sebesar 510 juta dolar dan mempekerjakan 19.000 (sembilan belas ribu) pegawai. Produk-produk utama dari perusahaan baru ini yaitu:

1. Pepsi-Cola Company – Pepsi-Cola (diformulasikan pada tahun 1898), Diet Pepsi (1964) dan Mountain Dew (diperkenalkan oleh Tip Corporation pada tahun 1948). 2. Frito-Lay, Inc. – Keripik jagung merk Fritos (diciptakan

oleh Elmer Doolin pada tahun 1932, keripik kentang merk Lay’s (diciptakan oleh Herman W. Lay pada tahun 1938), makanan ringan berperencah keju merk Cheetos (1948), keripik kentang merk Ruffles (1958) dan kue kering asin merk Rold Gold (diperoleh pada tahun 1961).

Pepsi memasuki Jepang dan Eropa bagian Timur

CEO PepsiCo, Donald M. Kendall memangku jabatan Pimpinan Dewan Direktur pada saat pensiunnya Herman W. Lay. Lay tetap memegang peranan penting dalam korporasi sampai beliau meninggal pada tanggal 6 Desember 1982.

Andral E. Pearson ditunjuk menjadi presiden Pepsico, jabatan tersebut tetap dipangkunya sampai beliau pensiun pada tahun 1984.

(30)

1973

1974

1976

1980

PepsiCo Foods International (PFI) yang pada akhirnya berganti nama menjadi Frito-Lay International, didirikan untuk memasarkan makanan ringan ke seluruh dunia.

Pepsi-Cola menjadi produksi konsumen Amerika pertama yang diproduksi, dipasarkan, dan terjual di Uni Soviet.

Pepsi memperkenalkan kampanye pemasaran “Pepsi Challenge (Tantangan Pepsi)” pertama kali di Dallas, Texas tahun 1975, yang kemudian menjadi kampanye pemasaran nasional. PepsiCo membuat ujian rasa buta antara Pepsi-Cola dan pesaingnya, Coca-Cola. Dalam ujian rasa buta itu, kebanyakan dari konsumen memilih Pepsi sebagai minuman yang lebih enak.

PepsiCo mengadopsi Kode Pergerakan Bisnis Sedunia.

Pepsi-Cola menjadi satu-satunya merk minuman ringan dengan penjualan terbesar di supermarket-supermarket di Amerika Serikat. Dengan kampanye pemasaran “Have a Pepsi day!“ “Puppies,” yang kemudian menjadi salah satu adpertensi/iklan yang paling disukai di Amerika.

PepsiCo Food Service International (PFSI) dibentuk dengan fokus pada perkembangan restoran-restoran ke luar negeri.

(31)

1984

Penampilan pertama Penghargaan Internasional Donald M. Kendall Bottler-of-the-Year.

Frito-Lay mulai memasarkan kue merk Grandma’s keseluruh dalam negeri.

Penata taman, Russel Page (1906-1985) mulai memperluas wilayah taman di PepsiCo.

Pepsi menjadi penjualan #1 di toko-toko.

PepsiCo distruktur ulang untuk lebih fokus kepada tiga pokok bisnis: minuman ringan, makanan ringan dan restoran. Bisnis alat-alat transportasi dan olahraga telah terjual.

Wayne Calloway menjadi presiden PepsiCo.

Diet Pepsi di formulasi ulang dengan 100% NutraSweet.

Diperkenalkan Slice and Diet Slice, minuman ringan pertama dengan jus buah.

Pepsi-Cola membuat sejarah iklan dengan Michael Jackson bersaudara sebagai gambaran generasi baru Pepsi-Cola, yang mana iklan tersebut menjadi televisi komersial sekaligus pemasaran musik yang paling ditunggu-tunggu. Pepsi menjadi “The Choice of a New Generation (Pilihan Generasi Baru)”.

Herman W. Lay Award of Excellence menetapkan Frito-Lay sebagai keunggulan penjualan kelas dunia.

(32)

1990

1995

Saham PepsiCo terpecah menjadi tiga-untuk-satu.

PepsiCo, dengan saham-sahamnya, memegang kedudukan yang berkuasa dalam perusahaan Gamesa, perusahaan kue terbesar di Meksiko.

Frito-Lay mengiklankan keripik tortilla merk Doritos bersama dengan selebritis Jay Leno.

PepsiCo menandatangani perjanjian dagang komersial terbesar dalam sejarahnya dengan Uni Soviet.

PepsiCo memperoleh keuntungan melebihi 1 miliar dolar untuk pertama kalinya.

Pepsi-Cola memperkenalkan tema “Nothing else is a Pepsi.” Pepsi-Cola menjadi adpertensi paling teratas di Super Bowl.

Mountain Dew mensponsori Grammy Awards. Dengan tema “Been There, Done That, Tried That.”

Perkongsian Pepsi Lipton Tea meluncurkan kampanye periklanan baru yaitu “There’s only one Original.”

Pepsi-Cola memperkenalkan Smooth Moos Smoothies, susu kocok rendah lemak.

7Up International meluncurkan 7Up Ice Cola, sebuah minuman kola jernih terbaru.

Frito-Lay memperluas segmen makanan ringan rendah/tanpa-lemak secara agresif. Diperkenalkan Baked Lays.

(33)

1997

2000

PepsiCo memperkenalkan keripik kentang merk Lay’s di 20 market diseluruh dunia.

Lahirnya situs PepsiCo - http://www.pepsico.com.

Pepsi-Cola mengenalkan kampanye iklan baru dengan tema “Generation Next.”

Air mineral kemasan Aquafina dipasarkan keseluruh dalam negeri. Frito-Lay mengumumkan rencana pembelian makanan ringan berusia 104 tahun, yaitu Cracker Jack, yang terbuat dari campuran jagung berondong dan kacang yang dilapisi permen dari Borden Foods Corp.

Pepsi-Cola merayakan Hari Jadi ke-100 tahun pada tahun 1998 dengan mengadakan konferensi pengusaha minuman ringan, yang dilaksanakan di Hawai. Perayaan tersebut juga sekaligus konferensi pengusaha minuman ringan yang pertama.

Frito-Lay mengenalkan Keripik Tortilla 3D Doritos, yaitu keripik dengan bentuk segitiga.

Pepsi-Cola membangkitkan kembali kampanye pemasaran “Pepsi Challenge (Tantangan Pepsi)”. Tantangan tersebut meliputi minuman kola reguler Pepsi One dan Diet Coke.

Pepsi-Cola bekerjasama dengan Yahoo Inc., sebuah perusahaan navigasi jaringan terbesar, dalam kampanye pemasaran multimedia

(34)

yang ditujukan kepada remaja dan dewasa muda.

Tropicana, berkongsi dengan Galaxy Foods Co., mengenalkan minuman susu kedelai dingin-dan-minuman buah, terbuat dari jus, sup buah kental dicampur dengan susu kedelai dan protein kedelai. Merk air minum kemasan Aquafina menjadi merk penjualan terbaik air minum kemasan satu-satunya di saluran dagang eceran di Amerika Serikat.

PepsiStuff.com, sebuah situs jaringan untuk barang dagangan, diskon, dan berkas musik digital dari nama-nama terkemuka dalam bidang perfilman, musik, video game, pakaian, dan olahraga diluncurkan dalam promosi bersama dengan Yahoo.

Pepsi-Cola meluncurkan “Sierra Mist”, minuman soda lemon, tanpa kafein.

The North American Coffee Partnership meluncurkan minuman kopi kemasan Frappucino dengan perencah Karamel, yang merupakan tambahan perencah keenam bagi minuman kopi praktis populer tersebut.

PepsiCo, Inc. mencapai kesepakatan untuk mendapatkan saham di Perusahaan South Beach Beverage, yang merk inovatif SoBe-nya telah menjadikan perusahaan tersebut sebagai salah satu perusahaan industri tersukses.

PepsiCo, Inc. dan Perusahaan Quaker Oats mencapai kesepakatan untuk bergabung.

(35)

PepsiCo melengkapi akuisisi mayoritas saham di South Beverage Co.

Penjualan PepsiCo mencapai 20 miliar dolar dan telah mempekerjakan 125.000 (seratus dua puluh lima ribu) pegawai pada akhir tahun.

PepsiCo meluncurkan Diversity@work, situs jaringan http://www.pepsico.com/diversity.

2.1.2 Visi dan Misi Perusahaan

2.1.2.1 Visi Perusahaan

“Put into action through programs and a focus on environmental stewardship, activities to benefit society, and a commitment to build shareholder value by making a truly sustainable company.”

Visi perusahaan terwujud dalam tindakan melalui program-program dan suatu fokus pada masalah lingkungan, kegiatan-kegiatan yang bermanfaat bagi masyarakat, dan sebuah komitmen untuk membangun nilai bagi saham dengan menjadi perusahaan yang benar-benar tak tergoyahkan.

2.1.2.2 Misi Perusahaan

Misi PT. Pepsi Cola adalah untuk menjadi perusahaan produk-produk konsumen terdepan yang tepat terfokus pada produk-produk minuman dan makanan. Tujuannya dalam menghasilkan pendapatan finansial kepada

(36)

investor sebagaimana perusahaan memberikan kesempatan bagi para pegawai, rekan bisnis, dan komunitas tempat PT. Pepsi Cola berusaha untuk berkembang dan memperkaya diri. Dan dalam segala hal yang dikerjakan, perusahaan berjuang demi kejujuran, keadilan, dan integritas.

2.1.3 Struktur Organisasi Perusahaan

Secara garis besar, PT. Pepsi Cola Indobeverages dipimpin oleh seorang Presiden Direktur sebagai pimpinan tertinggi perusahaan yang dibantu oleh beberapa orang yang menempati posisi sebagai direktur pada struktur inti dari perusahaan. Sedangkan dalam hal produksi, PT. Pepsi Cola dipimpin oleh seorang Plant Manager yang bertanggung jawab langsung kepada Presiden Direktur. Plant Manager ini bertugas sebagai pimpinan tertinggi di bagian produksi (pabrik). Seperti halnya pimpinan secara umum, Plant Manager juga dibantu oleh para Manager lainnya sebagai bawahan yang masing-masing bertanggung jawab atas bagian/departemen yang mereka pimpin. Untuk lebih jelas mengenai struktur organisasi PT. Pepsi Cola Indobeverages dapat dilihat pada gambar 2.1.

(37)

Gambar 2.1 Struktur Organisasi Perusahaan

2.2Landasan Teori

2.2.1Pengertian Data Mining

Data Mining (DM) adalah salah satu bidang yang berkembang pesat karena besarnya kebutuhan akan nilai tambah dari database skala besar yang makin banyak terakumulasi sejalan dengan pertumbuhan teknologi informasi. Definisi umum dari DM itu sendiri adalah serangkaian proses untuk menggali nilai tambah berupa pengetahuan yang selama ini tidak diketahui secara manual dari suatu kumpulan data.[5]

Data mining adalah kombinasi secara logis antara pengetahuan data, dan analisa statistik yang dikembangkan dalam pengetahuan bisnis atau suatu proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, tiruan dan machine-learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat bagi pengetahuan yang terkait dari berbagai database besar. [7]

(38)

Data mining meliputi tugas-tugas yang dikenal sebagai ekstraksi pengetahuan, arkeologi data, eksplorasi dalam pemrosesan pola data dan memanen informasi. Semua aktifitas ini dilakukan secara otomatis dan mengizinkan adanya penemuan cepat bahkan oleh non programmer. [7]

Data mining cerdas menemukan informasi di dalam data warehouse dimana laporan dan query tidak bisa diungkapkan secara efektif. Piranti data mining menemukan pola-pola di dalam data dan bahkan menyimpulkan aturan dari data tersebut.[7]

Data mining (DM) yang juga dikenal sebagai Knowledge Discovery (Frawley et al., 1992), merupakan salah satu bidang yang berkembang pesat karena besarnya kebutuhan akan nilai tambah dari database skala besar yang makin banyak terakumulasi sejalan dengan pertumbuhan teknologi informasi. Secara umum, data mining dapat didefinisikan sebagai suatu rangkaian proses untuk menggali nilai tambah berupa ilmu pengetahuan yang selama ini tidak diketahui secara manual dari suatu kumpulan data.[1]

Definisi umum dari Data Mining adalah proses pencarian pola-pola yang menarik (hidden pattern) berupa pengetahuan (knowledge) yang tidak diketahui sebelumnya dari suatu kumpulan data dimana data tersebut dapat berada dalam database, data warehouse, atau media penyimpanan informasi yang lain. Data Mining merupakan proses analisis terhadap data dengan penekanan menemukan informasi yang

(39)

tersembunyi pada sejumlah besar data yang disimpan ketika menjalankan bisnis perusahaan.

2.2.2Tahapan Data Mining

Dalam aplikasinya, data mining sebenarnya merupakan bagian dari proses Knowledge Discovery in Database (KDD), bukan sebagai teknologi yang utuh dan berdiri sendiri. Data mining merupakan suatu bagian langkah yang penting dalam proses KDD terutama berkaitan dengan ekstraksi dan penghitungan pola-pola dari data yang ditelaah, seperti ditunjukan oleh gambar 2.2 dibawah ini :[5]

(40)

a. Data cleaning

Untuk menghilangkan data noise (data yang tidak relevan/berhubungan langsung dengan tujuan akhir proses data mining, misal: data mining yang bertujuan untuk menganalisa hasil penjualan, maka data-data dalam kumpulan seperti ”nama pegawai”, ”umur”, dan sebagainya dapat di-ignore) dan tidak konsisten.

b. Data integration

Untuk menggabungkan multiple data source. c. Data selection

Untuk mengambil data yang sesuai untuk keperluan analisa. d. Data transformation

Untuk mentransformasikan data ke dalam bentuk yang lebih sesuai untuk di mining.

e. Data mining

Proses terpenting dimana metode tertentu diterapkan untuk menghasilkan data pattern.

f. Pattern evaluation

Untuk mengidentifikasi apakah interenting patterns yang didapatkan sudah cukup mewakili knowledge berdasarkan perhitungan tertentu.

g. Knowledge presentation

Untuk mempresentasikan knowledge yang sudah didapatkan dari user.

(41)

2.2.3Arsitektur Data Mining

Umumnya system data mining terdiri dari komponen-komponen berikut:

a. Database, data warehouse, atau media penyimpanan informasi Media dalam hal ini bisa jadi berupa database, data warehouse, spreadsheets, atau jenis-jenis penampung informasi lainnya. Data cleaning dan data intregration dapat dilakukan pada datadata tersebut.

b. Database atau data warehouse server

Database atau data warehouse server bertanggung jawab untuk menyediakan data yang relevan berdasarkan permintaan dari user pengguna data mining.

c. Basis Pengetahuan (knowledge base)

Merupakan basis pengetahuan yang digunakan sebagai panduan dalam pencarian pola.

d. Data mining engine

Yaitu bagian dari software yang menjalankan program berdasarkan algoritma yang ada.

e. Pattern evaluation module

Yaitu bagian dari software yang berfungsi untuk menemukan pattern atau pola-pola yang terdapat di dalam database yang diolah sehingga nantinya proses datamining dapat menemukan knowledge yang sesuai.

(42)

f. Graphical user interface

Bagian ini merupakan sarana antara user dan sistem data mining untuk berkomunikasi, dimana user dapat berinteraksi dengan sistem melalui data mining query, untuk menyediakan informasi yang dapat membantu dalam pencarian knowledge. Lebih jauh lagi, bagian ini mengijinkan user untuk melakukan browsing pada database dan data warehouse, mengevaluasi pattern yang telah dihasilkan, dan menampilkan pattern tersebut dengan tampilan yang berbeda-beda.[3]

Gambar 2.3 Arsitektur Data Mining

2.2.4Pengelompokan(Clustering)

Pengelompokan (clustering) merupakan tugas deskripsi yang banyak digunakan dalam mengidentifikasi sebuah himpunan terbatas pada kategori atau cluster untuk mendeskripsikan data yang ditelaah. Kategori-kategori ini dapatbersifat eksklusif dan ekshaustifmutual, atau

Graphical User Interface (GUI)

Pattern Evaluation

Data Mining Engine

Database or Data Warehouse Server

Database _Data

Warehouse

Data Cleaning & Data integration Filtering

(43)

mengandung representasiyang lebih kaya seperti kategoriyang hirarkis atau saling menumpu (overlapping).

Berbeda dengan association rule mining dan classification dimana kelas data telah ditentukan sebelumnya, clustering melakukan pengelompokan data tanpa berdasarkan kelas data tertentu. Bahkan clustering dapat dipakai untuk memberikan label pada kelas data yang belum diketahui itu. Karena itu clustering sering digolongkan sebagai metode unsupervised learning.

Prinsip dari clustering adalah memaksimalkan kesamaan antar anggota satu kelas dan meminimumkan kesamaan antar kelas/cluster. Clustering dapat dilakukan pada data yang memiliki beberapa atribut yang dipetakan sebagai ruang multidimensi. Ilustrasi dari clustering dapat dilihat pada Gambar 2.3 dimana lokasi, dinyatakan dengan bidang dua dimensi, dari pelanggan suatu toko dapat dikelompokkan menjadi beberapa cluster dengan pusat cluster ditunjukkan oleh tanda positif (+).

Banyak algoritma clustering memerlukan fungsi jarak untuk mengukur kemiripan antar data, diperlukan juga metode untuk normalisasi bermacam atribut yang dimiliki data.

Beberapa kategori algoritma clustering yang banyak dikenal adalah metode partisi dimana pemakai harus menentukan jumlah k partisi yang diinginkan lalu setiap data di tes untuk dimasukkan pada salah satu partisi, metode lain yang telah lama dikenal adalah metode hierarki yang terbagi dua lagi : bottom-up yang menggabungkan cluster kecil menjadi

(44)

cluster lebih besar dan top-down yang memecah cluster besar menjadi cluster yang lebih kecil. Kelemahan metode ini adalah bila salah satu penggabungan/pemecahan dilakukan pada tempat yang salah, tidak dapat didapatkan cluster yang optimal. Pendekatan yang banyak diambil adalah menggabungkan metode hierarki dengan metode clustering lainnya seperti yang dilakukan oleh Chameleon.[6]

Gambar 2.4 Ilustrasi Clustering

(45)

Ada beberapa teknik dalam clustering, yaitu :

1. Metode partisi : membangun berbagai partisi dan kemudian mengevaluasi partisi tersebut dengan beberapa kriteria.

2. Metode hierarki : membuat suatu penguraian secara hierarkikal dari himpunan data menggunakan beberapa kriteria.

3. Metode Berbasis densitas : berdasarkan konektivitas dan fungsi densitas.

4. Metode Berbasis grid : berdasarkan suatu struktur granularitas multi-level.

5. Metode Berbasis model : suatu model dihipotesakan untuk masing – masing cluster dan ide untuk mencari best fit dari model tersebut untuk masing – masing yang lain.

2.2.4.1Teknik Clustering

Secara garis besar metode clustering dibagi dalam 2 tipe yaitu : hierarchical dan non hierarchical. Hierarchical menggunakan N x N similarity matrix, sedangkannon hierarchical membagi dataset menjadi sebuah level single partisi, dengan atau tanpa pencocokan antara clusters. Selain itu hal mendasar yang membedakan kedua metode ini adalah : metode pengelompokan hirarki digunakan apabila belum ada informasi jumlah kelompok, sedangkan metode pengelompokan non hirarki bertujuan mengelompokan n objek ke dalam kkelompok (k<n). Berikut adalah perjelasan singkat mengenai perbandingan antarametode hirarki (agglomerative hierarchical) dan metode partisi (k-means).

(46)

2.2.4.2HierarchicalClustering

Teknik hirarki(hierarchical methods) adalah teknik clustering yang membentuk kontruksi hirarki berdasarkan tingkatan tertentu seperti struktur pohon Dengandemikian proses pengelompokkannya dilakukan secara bertingkat atau bertahap. Hasil dari pengelompokan ini dapat disajikan dalam bentuk dendogram. Ada dua pendekatan dalam hierarchical clustering yaitu agglomerative dan divisive. Berikut ini adalah gambaran mengenai Agglomerative dan Divisive :

Gambar 2.6 Agglomerative dan Divisive

2.2.4.3Agglomerative

Metode ini dimulai dengan setiap N cluster membentuk cluster masing-masing. Kemudian dua cluster dengan jarak terdekat bergabung. Selanjutnya cluster yang lama akan bergabung dengan cluster yang sudah ada dan membentuk cluster baru. Hal ini tetap memperhitungkan jarak kedekatan antar cluster. Proses akan berlanjut hingga akhirnya terbentuk satu cluster yang terdiri dari keseluruhan cluster.

(47)

Beberapa metode dari agglomerative :

1. Single linkage (nearest neighbor methods) : Metode ini menggunakan prinsip jarak minimum yang diawali dengan mencari dua cluster terdekat dan keduanya membentuk cluster yang pertama.

2. Complete linkage (furthest neighbor methods) : Metode ini merupakan kebalikan dari pendekatan yang digunakan pada single linkage. Prinsip jarak yang digunakan adalah jarak terjauh(maksimal) antar cluster.

3. Average linkage between groups methods : Metode ini mengikuti prosedur yang sama dengan kedua metode sebelumnya. Prinsip ukuran jarak yang digunakan adalah jarak rata-rata antar tiap pasangan cluster yang mungkin. 4. Ward’s method error sum of squares : Ward mengajukan

suatu metode pembentukan cluster yang didasari oleh hilangnya informasi akibat penggabungan cluster menjadi cluster. Hal ini diukur dengan jumlah total deviasi kuadrat dari meancluster untuk tiap observasi.

2.2.4.4Divisive

Metode divisive berlawanan dengan metode agglomerative. Metode ini pertama-tama diawali dengan satu cluster besar yang mencakup semua cluster. Selanjutnya cluster yang memiliki ketidakmiripan yang cukup besar akan dipisahkan sehinggamembentuk

(48)

cluster yang lebih kecil. Pemisahan ini dilanjutkan sehingga mencapai sejumlah cluster yang diinginkan.

2.2.4.5PartitionalClustering

Konsep dasar dari partitional clustering adalah membagi n jumlah cluster kedalam k cluster. Metode ini merupakan metode pengelompokan yang bertujuan mengelompokan objek sehingga jarak antar tiap objek ke pusat kelompok didalam satu kelompok adalah minimum. K-means Clustering dan K-medoids atau PAM (partition around medoids)merupakan beberapa algoritma dari partitional clustering. Berikutini adalah penjelasan singkat dari metode clustering K-means yaitu :

a. Membagi objek ke dalam k subset tak kosong.

b. Menghitung titik benih sebagai pusat(titik rata – rata dari cluster) cluster dari partisi sekarang.

c. Memberikan masing – masing objek tersebut ke cluster dengan titik benih terdekat.

d. Kembali ke tahap yang kedua, berhenti jika tidak ada lagi yang penugasan baru.

2.2.4.6Agglomerative Hierarchical Clustering Algorithm(AHC

algorithm)

Proses Clustering yang akan dilakukan menggunakan Agglomerative Hierarchical Clustering Algorithm (AHC algorithm). Walaupun lebih lambat, hasil akhir pengelompokan agglomerative

(49)

hierarchical clustering lebih baik dibandingkan kmeans yang sering digunakan, karena lebih efisien . Proses dasar dari hierarchical clustering adalah:

a. Mulailah dengan mendefinisikan setiap item sebagai cluster, jadi data yang ada sejumlah N items, maka sekarang cluster yang ada sejumlah N items tersebut. Jarak antara clusters sama dengan jarak antara items yang ada.

b. Selanjutnya, mencari pasangan cluster yang paling dekat dan menggabungkan keduanya dalam satu cluster.

c. Hitung jarak antara cluster yang baru dibentuk dengan cluster yang sudah ada sebelumnya. Ulangi tahap b dan c sampai cluster membentuk N cluster yang diinginkan.

Ada tiga metode yang ada dalam AHC algorithm dan yang akan digunakan untuk melakukan clustering adalah metode single linkage. Metode single lingkage menggunakan prinsip jarak minimum. Dibawah ini adalah psedeocode dari algoritma Agglomerative Hierarchical Clustering.

Agglomerative Hierarchical Algorithm:

Given:

a set X of objects {x1,...,xn} a distance function dis(c1,c2)

1. for i = 1 to n ci = {xi}

end for

2. C = {c1,...,cb} 3. l = n+1 4. while C.size > 1 do

(50)

b) remove cmin1 and cmin2 from C c) add {cmin1,cmin2} to C

d) l = l + 1

end while

Contoh : diberikan kumpulan X(dapat dilihat pada gambar ), yang sudah direpresentasikan dalam bentuk matrix. Dengan menggunakan fungsi Euclidean distance dan single link method untuk menghitung jarak antara clusters.

a. pertama, masing – masing anggota (Xi) dari X, ditempatkan dalam cluster Ci,dimana Ci adalah anggota dari cluster C.

C = {{x1},{x2},{x3}, {x4},{x5},{x6},{x7}, {x8},{x9},{x10}} b. set l = 11.

c. (iterasi pertama dari penggulangan menggunakan while) C.size = 10. Setelah dilakukan perhitungan jarak maka didapatkan jarak minimum adalah hasil perhitungan jarak antara C2 dan C10.

(cmin1,cmin2) = (c2,c10)

Pindahkan c2 and c10 from C, tambahkan c11 to C.

C = {{x1},{x3}, {x4},{x5},{x6},{x7}, {x8},{x9},{{x2}, {x10}}} Set l = l + 1 = 12

(51)

d. Dan perhitungan terus dilakukan sampai membentuk N cluster yang diinginkan.

e. Kesimpulan dari hasil clustering yang didapatkan.

Tahapan akhir dari proses clustering adalah kesimpulan dari clustering yang didapatkan.

2.2.4.7Contoh Penerapan Clustering Menggunakan Algoritma AHC

Dari hasil penelitian yang dilakukan, didapatkan sample data penjualan produk minuman dari suatu perusahaan. Dari data penjualan tersebut akan dicoba dilakukan pengelompokan (clustering) menggunakan algoritma AHC. Adapun data penjualan tersebut dapat dilihat pada Tabel 2.1 dibawah.

Tabel 2.1 Data Penjualan Minuman Per Wilayah Tanggal 1 Januari 2007

WILAYAH JUMLAH

Bandar Lampung 9803

Bandung 27281

Batam 7488

Bogor 10864

Denpasar 6839

Depok 16291

Jakarta Barat 12653 Jakarta Pusat 11035 Jakarta Selatan 5937 Jakarta Timur 14843 Jakarta Utara 8787

Makassar 7277

Malang 9360

Padang 4980

Pakanbaru 8808 Samarinda 6728 Tangerang 17461 Tasikmalaya 7224

(52)

Sesuai dengan algoritma yang diterapkan, maka setiap item wilayah pada table diatas akan dijadikan sebagai cluster, jadi data yang ada sejumlah 18 items, maka sekarang cluster yang ada sejumlah 18 items tersebut. Selanjutnya, dari data penjualan (jumlah) dicari pasangan cluster yang paling dekat (selisih terkecil) dan menggabungkan keduanya dalam satu cluster. Pembuatan cluster pertama ini dapat dilihat pada Tabel 2.2 berikut :

Tabel 2.2 Pembuatan cluster pertama WILAYAH JUMLAH

KELOMPOK : A1 | JUMLAH ANGGOTA : 1

Bandung 27281

KELOMPOK : A2 | JUMLAH ANGGOTA : 1

Tangerang 17461

KELOMPOK : A3 | JUMLAH ANGGOTA : 1

Depok 16291

KELOMPOK : A4 | JUMLAH ANGGOTA : 1

Jakarta Timur 14843

KELOMPOK : A5 | JUMLAH ANGGOTA : 1

Jakarta Barat 12653

KELOMPOK : A6 | JUMLAH ANGGOTA : 1

Jakarta Pusat 11035

KELOMPOK : A7 | JUMLAH ANGGOTA : 1

Bogor 10864

KELOMPOK : A8 | JUMLAH ANGGOTA : 1

Bandar Lampung 9803

KELOMPOK : A9 | JUMLAH ANGGOTA : 1

Malang 9360

KELOMPOK : A10 | JUMLAH ANGGOTA : 2

Jakarta Utara 8787

Pakanbaru 8808

KELOMPOK : A11 | JUMLAH ANGGOTA : 1

Batam 7488

KELOMPOK : A12 | JUMLAH ANGGOTA : 1

Makassar 7277

KELOMPOK : A13 | JUMLAH ANGGOTA : 1

Tasikmalaya 7224

KELOMPOK : A14 | JUMLAH ANGGOTA : 1

Denpasar 6839

KELOMPOK : A15 | JUMLAH ANGGOTA : 1

Samarinda 6728

KELOMPOK : A16 | JUMLAH ANGGOTA : 1

Jakarta Selatan 5937

KELOMPOK : A17 | JUMLAH ANGGOTA : 1

(53)

Dari tabel diatas dapat terlihat bahwa pasangan cluster yang paling dekat yang pertama kali membentuk cluster adalah wilayah Jakarta Utara dan Pekanbaru yang merupakan anggota kelompok A10. Sedangkan wilayah lainnya masih merupakan cluster dari dirinya sendiri. Setelah jarak terdekat membentuk satu cluster pertama, kemudian kita harus menghitung jarak antara cluster yang baru dibentuk dengan cluster yang sudah ada sebelumnya. Tahap ini akan diulangi sampai cluster membentuk N cluster yang diinginkan. Dalam kasus ini, misalnya kita akan membentuk tiga cluster dari data yang ada, maka hasil dari algoritma AHC yang digunakan adalah seperti terlihat pada Tabel 2.3 berikut :

Tabel 2.3 Hasil clustering sebanyak tiga cluster

WILAYAH JUMLAH

KELOMPOK : A1 | JUMLAH ANGGOTA : 1

Bandung 27281

KELOMPOK : A2 | JUMLAH ANGGOTA : 10

Jakarta Utara 8787

Pakanbaru 8808

Malang 9360

Bandar Lampung 9803

Bogor 10864

Jakarta Pusat 11035

Jakarta Barat 12653

Jakarta Timur 14843

Depok 16291

Tangerang 17461

KELOMPOK : A3 | JUMLAH ANGGOTA : 7

Padang 4980

Jakarta Selatan 5937

Samarinda 6728

Denpasar 6839

Tasikmalaya 7224

Makassar 7277

(54)

2.2.5Konsep Dasar Data dan Informasi

2.2.5.1 Pengertian Data

Menurut Azhar Susanto : “Data adalah fakta atau apapun yang dapat digunakan input dan menghasilkan informasi”.[6] Data adalah kenyataan yang menggambarkan suatu kejadian dan kesatuan kenyataan. Data merupakan suatu istilah yang berbentuk jamak dari kata “datum” yang berarti fakta atau bagian dari fakta yang mengandung arti yang menghubungkan dengan kenyataan, simbol-simbol, gambar-gambar, kata-kata, angka-angka, huruf-huruf yang menunjukan suatu ide, objek, kondisi dan situasi.

Menurut the liang gie: ”Data atau bahan keterangan adalah hal atau peristiwa kenyataan lainnya apapun yang mendukung suatu pengetahuan untuk dijadikan dasar guna penyusunan keterangan pembuatan kesimpulan atau penetapan keputusan, atau data ibarat bahan mentah yang melalui pengolahannya tertentu lalu menjadi keterangan (informasi)”.

2.2.5.2 Pengertian Informasi

Informasi adalah hasil pengolahan data yang memberikan arti dan manfaat.[8]

(55)

2.2.6Basis Data (Database)

Basis data (Database) adalah sekumpulan informasi bermanfaat yang diorganisasikan kedalam tata cara yang khusus.[6]

Database adalah kumplan data yang saling berkaitan, berhubungan yang disimpan secara bersama-sama sedemikian rupa tanpa pengulangan yang tidak perlu, untuk memenuhi berbagai kebutuhan. Data-data ini harusmengandung semua informasi untuk mendukung semua kebutuhan sistem.Proses dasar yang dimiliki oleh database ada empat, yaitu:

1.Pembuatan data-data baru (create database) 2. Penambahan data (insert)

3. Mengubah data (update) 4. Menghapus data (delete).

Database merupakan salah satu komponen yang penting dalam sistem informasi, karena merupakan basis dalam menyediakan informasi pada para pengguna. Basis data (database) menjadi penting karena munculnya beberapa masalah bila tidak menggunakan data yang terpusat, seperti adanya duplikasi data, hubungan antar data tidak jelas, organisasi data dan update menjadi rumit. Jadi tujuan dari pengaturan data dengan menggunakan basis data adalah :

a. Menyediakan penyimpanan data untuk dapat digunakan oleh organisasi saat sekarang dan masa yang akan datang.

b. Cara pemasukan data sehingga memudahkan tugas operator dan menyangkut pula waktu yang diperlukan oleh pemakai untuk

(56)

mendapatkan data serta hak-hak yang dimiliki terhadap data yang ditangani.

c. Pengendalian data untuk setiap siklus agar data selalu up-to-date dan dapat mencerminakan perubahan spesifik yang terjadi di setiap sistem.

d. Pengamanan data terhadap kemungkinan penambahan, modifikasi, pencurian dan gangguan-gangguan lain.

Dalam basis data sistem informasi digambarkan dalam model entity relationship (E-R). Bahasa yang digunakan dalam basis data (database) yaitu :

a. DDL (Data Definition Language)

Merupakan bahasa definisi data yang digunakan untuk membuat dan mengelola objek database seperti database, tabel dan view

b. DML (Data Manipulation Language)

Merupakan bahasa manipulasi data yang digunakan untuk memanipulasi data pada objek database seperti tabel

c. DCL (Data Control Language)

Merupakan bahasa yang digunakan untuk mengendalikan pengaksesan data.

Penyusunan basis data meliputi proses memasukkan data kedalam media penyimpanan data, dan diatur dengan menggunakan perangkat Sistem Manajemen Basis Data (Database Management System / DBMS).

(57)

2.2.7DatabaseManagement System (DBMS)

“Managemen Sistem Basis Data (Database Management System / DBMS) adalah perangkat lunak yang di desain untuk membantu dalam hal pemeliharaan dan utilitas kumpulan data dalam jumlah besar”.[6]

Sistem Manajemen Basis data (Database Management System) merupakan sistem pengoperasian dan sejumlah data pada komputer. Dengan sistem ini dapat merubah data, memperbaiki data yang salah dan menghapus data yang tidak dapat dipakai. Sistem manajemen database merupakan suatu perluasan software sebelumnya mengenai software pada generasi komputer yang pertama. Dalam hal ini data dan informasi merupakan kesatuan yang saling berhubungan dan berkerja sama yang terdiri dari: peralatan, tenaga pelaksana dan prosedur data. Sehingga pengolahan data ini membentuk sistem pengolahan data. Peralatan dalam hal ini berupa perangakat keras (hardware) yang digunakan, dan prosedur data yaitu berupa perangakat lunak (software) yang digunakan dan dipakai untuk mengalokasikan dalam pembuatan sistem informasi pengolahan database.

Manipulasi basis data meliputi pembuatan pernyataan (query) untuk mendapatkan informasi tertentu, melakukan pembaharuan atau penggantian (update) data, serta pembuatan report dari data. Tujuan utama DBMSadalah untuk menyediakan tinjauan abstrak dari data bagi user. Jadi sistem menyembunyikan informasi mengenai bagaimana data disimpan dan dirawat, tetapi data tetap dapat diambil dengan efisien.

(58)

Pertimbangan efisiensi yang digunakan adalah bagaimana merancang struktur data yang kompleks, tetapi tetap dapat digunakan oleh pengguna yang masih awam, tanpa mengetahui kompleksitas stuktur data.Sistem manajemen database atau database management system (DBMS) adalah merupakan suatu sistem software yang memungkinkan seorang user dapat mendefinisikan, membuat, dan memelihara serta menyediakan akses terkontrol terhadap data. Database sendiri adalah sekumpulan data yang berhubungan dengan secara logika dan memiliki beberapa arti yang saling berpautan. DBMS yang utuh biasanya terdiri dari :

1. Hardware

Hardware merupakan sistem komputer aktual yang digunakan untuk menyimpan dan mengakses databse. Dalam sebuah organisasi berskala besar, hardware terdiri : jaringan dengan sebuah server pusat dan beberapa program client yang berjalan di komputer desktop.

2. Software beserta utility Software adalah DBMS yang aktual. DBMS memungkinkan para user untuk berkomunikasi dengan database. Dengan kata lain DBMS merupakan mediator antara database dengan user. Sebuah database harus memuat seluruh data yang diperlukan oleh sebuah organisasi.

3. Prosedur

Bagian integral dari setiap sistem adalah sekumpulan prosedur yang mengontrol jalannya sistem, yaitu praktik-praktik nyata yang harus

(59)

diikuti user untuk mendapatkan, memasukkan, menjaga, dan mengambil data

4. Data

Data adalah jantung dari DBMS. Ada dua jenis data. Pertama, adalah kumpulan informasi yang diperlukan oleh suatu organisasi. Jenis data kedua adalah metadata, yaitu informasi mengenai database. 5. User (Pengguna)

Ada sejumlah user yang dapat mengakses atau mengambil data sesuai dengan kebutuhan penggunaan aplikasi-aplikasi dan interface yang disediakan oleh DBMS, antara lain adalah :

a. Database administrator adalah orang atau group yang bertanggungjawab mengimplementasikan sistem database di dalam suatu organisasi.

b. Enduser adalah orang yang berada di depan workstation dan berinteraksi secara langsung dengan sistem.

c. Programmer aplikasi, orang yang berinteraksi dengan database melalui cara yang berbeda.

2.2.8ERD(Entity Relationship Diagram)

Basis data Relasional adalah kumpulan dari relasi-relasi yang mengandung seluruh informasi berkenaan suatu entitas/ objek yang akan disimpan di dalam database. Tiap relasi disimpan sebagai sebuah file tersendiri. Perancangan basis data merupakan suatu kegiaatan yang setidaknya bertujuan sebagai berikut:

(60)

a. Menghilangkan redundansi data.

b. Meminimumkan jumlah relasi di dalam basis data.

c. Membuat relasi berada dalam bentuk normal, sehingga dapat meminimumkan permasalahan berkenaan dengan penambahan, pembaharuan dan penghapusan.

ERD adalah suatu pemodelan dari basis data relasional yang didasarkan atas persepsi di dalam dunia nyata, dunia ini senantiasa terdiri dari sekumpulan objek yang saling berhubungan antara satu dengan yang lainnya. Suatu objek disebut entity dan hubungan yang dimilikinya disebut relationship. Suatu entity bersifat unik dan memiliki atribut sebagai pembeda dengan entity lainnya.

Contoh : entity Mahasiswa, mempunyai atribut nama, umur, alamat, dan nim.

Diagram E-R terdiri dari:

a. Kotak persegi panjang, menggambarkan himpunan entitas. b. Elips, menggambarkan atribut-atribut entitas.

c. Diamon, menggambarkan hubungan antara himpunan entitas d. Garis, yang menghubungkan antar objek dalam diagram E-R

E-R Diagram merupakan suatu bahasa pemodelan dimana posisinya dapat dianalogikan dengan story board dalam industri film, blue print arsitektur suatu bangunan, miniatur, dan lain-lain. Dalam praktiknya, membangun suatu sistem terlebih dahulu dilakukannya suatu perencanaan. Pemodelan merupakan suatu sub bagian dari perencanaan

(61)

secara keseluruhan sebagai salah satu upaya feedback evaluasi perampungan suatu perencanaan. E-R Diagram sebagai suatu pemodelan setidaknya memiliki beberapa karakteristik dan manfaat sebagai berikut: a. Memudahkan untuk dilakukannya analisis dan perubahan sistem

sejak dini, bersifat murah dan cepat

b. Memberikan gambaran umum akan sistem yang akan di buat sehingga memudahkan developer.

c. Menghasilkan dokumentasi yang baik untuk client sebagai bahan diskusi dengan bentuk E-R Diagram itu sendiri, dan

d. Kamus data bagi bagi para pengembang database. Struktur dari E-R Diagram secara umum ialah terdiri dari:

a. Entitas merupakan objek utama yang informasi akan disimpan, biasanya berupa kata benda, ex; Mahasiswa, Dosen, Nasabah, Mata Kuliah, Ruangan, dan lain-lain. Objek dapat berupa benda nyata maupun abstrak.

b. Atribut merupakan deskripsi dari objek yang bersangkutan

c. Relationship merupakan suatu hubungan yang terjalin antara dua entitas yang ada.

Kardinalitas Relasi ERD yang mempersentasikan suatu basis data relasional senantiasa memiliki relasi-relasi dari sejumlah entitas yang dapat ditentukan banyaknya. Banyaknya suatu relasi yang dimiliki oleh suatu relasi entitas disebut derajat relasi. Derajat relasi maksimum disebut dengan kardinalitas sedangkan derajat minimum disebut dengan

(62)

modalitas. Kardinalitas yang terjadi diantara dua himpunan entitas (misal A dan B) dapat berupa :

a. One to One, satu record dipetakan dengan satu record di entitas lain. Contoh: satu nasabah punya satu account.

b. One to Many, Satu record dapat dipetakan menjadi beberapa record di entitas lain. Contoh: satu nasabah dapat punya lebih dari satu account.

c. Many to Many, Beberapa record dapat dipetakan menjadi beberapa record di entitas lain. Contoh: satu nasabah dapat memiliki lebih dari satu account. Satu account dapat dimiliki lebih dari satu nasabah (join account).

2.2.9DFD(Data Flow Diagram)

DFD adalah suatu model logika data atau proses yang dibuat untuk menggambarkan dari mana asal data dan kemana tujuan data yang keluar dari sistem, dimana data disimpan, proses apa yang menghasilkan data tersebut dan interaksi antara data yang tersimpan dan proses yang dikenakan pada data tersebut.

DFD sering digunakan untuk menggambarkan suatu sistem yang telah ada atau sistem baru yang akan dikembangkan secara logika tanpa mempertimbangkan lingkungan fisik dimana data tersebut mengalir atau dimana data tersebut akan disimpan.

(63)

DFD merupakan alat yang digunakan pada metodologi pengembangan sistem yang terstruktur. Kelebihan utama pendekatan aliran data, yaitu :

a. Kebebasan dari menjalankan implementasi teknis sistem.

b. Pemahaman lebih jauh mengenai keterkaitan satu sama lain dalam sistem dan subsistem.

c. Mengkomunikasikan pengetahuan sistem yang ada dengan pengguna melalui diagram aliran data.

d. Menganalisis sistem yang diajukan untuk menentukan apakah data-data dan proses yang diperlukan sudah ditetapkan.

Disamping itu terdapat kelebihan tambahan, yaitu :

1. Dapat digunakan sebagai latihan yang bermanfaat bagi penganalisis, sehingga bisa memahami dengan lebih baik keterkaitan satu sama lain dalam sistem dan subsistem.

2. Membedakan sistem dari lingkungannya dengan menempatkan batas-batasnya.

3. Dapat digunakan sebagai suatu perangkat untuk berinteraksi dengan pengguna.

4. Memungkinkan penganalisis menggambarkan setiap komponen yang digunakan dalam diagram.

DFD terdiri dari context diagram dan diagram rinci (DFD Levelled). Context diagram berfungsi memetakan model lingkungan (menggambarkan hubungan antara entitas luar, masukan dan keluaran

(64)

sistem), yang direpresentasikan dengan lingkaran tunggal yang mewakili keseluruhan sistem. DFD levelled menggambarkan sistem sebagai jaringan kerja antara fungsi yang berhubungan satu sama lain dengan aliran dan penyimpanan data, model ini hanya memodelkan sistem dari sudut pandang fungsi.

Dalam DFD levelled akan terjadi penurunan level dimana dalam penurunan level yang lebih rendah harus mampu merepresentasikan proses tersebut ke dalam spesifikasi proses yang jelas. Jadi dalam DFD levelled bisa dimulai dari DFD level 0 kemudian turun ke DFD level 1 dan seterusnya. Setiap penurunan hanya dilakukan bila perlu. Aliran data yang masuk dan keluar pada suatu proses di level x harus berhubungan dengan aliran data yang masuk dan keluar pada level x+1 yang mendefinisikan proses pada level x tersebut. Proses yang tidak dapat diturunkan/dirinci lagi dikatakan primitif secara fungsional dan disebut sebagai proses primitif.

2.2.10 Kamus Data (Data Dictionary)

Merupakan katalog (tempat penyimpanan) dari elemen-elemen yang berada dalam satu sistem. Kamus data mempunyai fungsi yang sama dalam pemodelan sistem dan juga berfungsi membantu pelaku sistem untuk mengerti aplikasi secara detail, dan me-reorganisasi semua elemen data yang digunakan dalam sistem sehingga pemakai dan

(65)

penganalisa sistem punya dasar pengertian yang sama tentang masukan, keluaran, penyimpanan dan proses.

Kamus data mendefinisikan elemen data dengan fungsi sebagai berikut :

1. Menjelaskan arti aliran data dan penyimpanan dalam DFD

2. Mendeskripsikan komposisi paket data yang bergerak melalui aliran misalnya alamat diuraikan menjadi kota, negara dan kode pos 3. Mendeskripsikan komposisi penyimpanan data

4. Menspesifikasikan nilai dan satuan yang relevan bagi penyimpanan dan aliran data.

5. Mendeskripsikan hubungan detail antar penyimpanan yang akan menjadi titik perhatian dalam Diagram Keterhubungan Entitas (E-R)

2.2.11 MySQL

SQL ( Structured Query Language ) adalah bahasa standar yang digunakan untuk mengakses server database. Semenjak tahun 70-an bahasa ini telah dikembangkan oleh IBM, yang kemudian diikuti dengan adanya Oracle, Informix dan Sybase. Dengan menggunakan SQL, proses akses database menjadi lebih user-friendly dibandingkan dengan misalnya dBase ataupun Clipper yang masih menggunakan perintah – perintah pemrograman murni.

MySQL adalah sebuah server database SQL multiuser dan multi-threaded. SQL sendiri adalah salah satu bahasa database yang paling populer di dunia. Implementasi program server database ini adalah

(66)

program daemon 'mysqld' dan beberapa program lain serta beberapa pustaka. Sebagaimana database sistem yang lain, dalam SQL juga dikenal hierarki server dengan database-database. Tiap-tiap database memiliki tabel-tabel. Tiap-tiap tabel memiliki field-field. Umumnya informasi tersimpan dalam tabel – tabel yang secara logik merupakan struktur 2 dimensi terdiri atas baris dan kolom. Field-field tersebut dapat berupa data seperti int, realm char, date, time dan lainnya. SQL tidak memiliki fasilitas pemrograman yang lengkap, tidak ada looping ataupun percabangan. Sehingga untuk menutupi kelemahan ini perlu digabung dengan bahasa pemrograman semisal Pascal. MySQL sering digunakan sebagai SQL server karena berbagai kelebihannya, antara lain :

1. Source MySQL dapat diperoleh dengan mudah dan gratis. 2. Sintaksnya lebih mudah dipahami dan tidak rumit.

3. Pengaksesan database dapat dilakukan dengan mudah.

2.2.12 Delphi

Delphi adalah suatu program berbasis bahasa Pascal yang berjalan dalam lingkungan Windows. Delphi telah memanfaatkan suatu teknik pemrograman yang disebut RAD yang telah membuat pemrograman menjadi lebih mudah. Delphi adalah suatu bahasa pemrograman yang telah memanfaatkan metode pemrograman Object Oriented Programming (OOP). Secara ringkas, object adalah suatu komponen yang mempunyai bentuk fisik dan biasanya dapat dilihat (visual). Object biasanya dipakai untuk melakukan tugas tertentu dan mempunyai

(1)

DATA MINING APPLICATION OF BEVERAGE PRODUCTS

MARKETING IN PEPSI COLA INDOBEVERAGES COMPANY USING

CLUSTERING METHOD

Enur Irdiansyah

Indonesian Computer University Jl. Dipati Ukur No. 112-116, Bandung 40132

Email : [email protected]

ABSTRACT

In the dynamic and very competitive world of commerce or business, the people involved have to be fully prepared of the ways to surviving and developing their business range.

Pepsi Cola Indobeverages Company is a consumer products company focused on beverages. Pepsi Cola Indobeverages Company is not the only one company that focused on beverages in Indonesia, there are several companies with similar direction. It is surely arising business competitions among the companies.

To be up against the business competitions and to improve company financial rewards, the company must have an ability to take the appropriate decision of definitive marketing strategies of their beverage products. The availability of abundant data, the necessity of information (or knowledge) as the proponent to take the appropriate decision of establishing business solutions, and the infrastructure supports in information technology are the pioneers of data mining technology. Data mining purpose is to give the real solution for the decision maker of business, and to developing their business range.

The one of data mining method that used in this research is Clustering, it is identify object with the similarity of certain characteristics, and then using those characteristics as the “vector characteristic” or “centroid”.

The result of this research is an application that will make analyze of huge data set easier then helpful to give information as a basic feature of company’s decision makers.

Keywords : business competition, business solution, information technology, data mining, clustering

1. INTRODUCTION

1.1 Background

In the dynamic and very competitive world of commerce or business, the people involved have to be fully prepared of the ways to surviving and developing their business range. To reach that ability, three requirements have been summarized are addition of product types also increasing product capacities, reduction of company’s operational cost, and increasing marketing efficacy and profit. To fulfill these requirements, many ways that can endure, one of those is analyze company’s data.

Pepsi Cola Indobeverages Company is a consumer products company focused on beverages. As a big company, Pepsi Cola Indobeverages Company seeks to

produce various beverage products with different names and packages. Pepsi Cola Indobeverages Company is not the only one company that focused on beverages in Indonesia, there are several companies with similar direction. It is surely arising business competitions among the companies.

To be up against the business competitions and to improve company financial rewards, the company must have an ability to take the appropriate decision of definitive marketing strategies of their beverage products. To take that appropriate decision, the company needs some adequate information to be analyzed further.

(2)

The availability of abundant data, the necessity of information (or knowledge) as the proponent to take the appropriate decision of establishing business solutions, and the infrastructure supports in information technology are the pioneers of data mining technology. Data mining purpose is to give the real solution for the decision maker of business, and to developing their business range.

The one of data mining method that used in this research is Clustering, it is identify object with the similarity of certain characteristics, and then using those characteristics as the “vector characteristic” or “centroid”. This clustering has been used by several companies to make report of general characteristic of different consumer groups. The clustering process that will be conduct is Agglomerative Hierarchical Clustering Algorithm (AHC algorithm).

1.2 Problem Identification

Referring to the background, the identifying and researching problem is: How to applying Data Mining on beverages product selling in PEPSI COLA INDOBEVERAGES COMPANY using the clustering method.

1.3 The Aim and The Purpose

Based on the identifying problem, the aim of this final assignment is to build the Data Mining application on beverages product selling in Pepsi Cola Indobeverages Company using the clustering method.

While the purposes that willing to be reached are:

1. To make analyze of huge data set easier.

2. Helpful to give the information from processed selling data.

3. To give the basic feature of company’s decision makers.

2. MODEL, ANALYSIS, DESIGN, AND

IMPLEMENTATION 2.1 Model

Data analysis technique of software construction using software modeling with waterfall paradigm as shown in Picture 1.1, consist of several process which are:

a. System / Information Engineering It is a part of the biggest system in a project construction, begin with determine various requirement from the entire element that necessary for the system and allocated it into software construction.

b. Analysis

It is analysis stage of materials that necessary to perform the software construction project.

c. Design

It is translation stage of analyzed data into comprehensible form for user. d. Coding

It is a stage of translation data or problem solving that has been designed into specific programming language.

e. Trial

It is a trial of the constructed software. f. Maintenance

It is a final stage where the settled software may have any modification or addition congruent with the user demand.

Picture 1. Waterfall Paradigm 2.2Analysis

A. System Analysis

System analysis defines as disperse of an intact information system into parts of its component as the objective is to identifying and evaluating the problems, opportunities, obstructions that happened and the requirements so the improvements can be suggested. Or in easy way, system analysis is a research on the existed system with purpose is to design a new system or renew it. This analysis system stage is a very critical stage and very important, because any mistake in this system will also causes

(3)

mistake in the next stage. The main task of analysis system is to find the weakness of performing system so the improvement can be suggested.

B. Basis Data Analysis

The logic structure of basis data is drawn into a graphic using Entity Relationship Diagram (ERD). ERD is a relationship between entities that used in the system to describe the relationship between entities or data structure and relation among files.

The main component ERD formation are Entity and Relation then in this item ERD are components of entity complex and relation complex that showed more specific by several properties describing the entire facts of the following system. The ERD of constructed application are below:

Picture 2. Entity Relationship Diagram (ERD)

C. Functional Requirement Analysis

1. Context Diagram

Picture 3. Context Diagram

2. DFD Level 1

Picture 4. DFD Level 1 3. Relation Scheme

Picture 5. Relation Scheme

(4)

2.3 Design

A. Menu Structure Design

Designing an application need a menu structure contains of menu and submenu with function is to make user applying the application easier. Below is showing of menu structure of this application:

Picture 6. Menu Structure Design

B. Application Main Menu Design

Below is the picture of main menu design.

Picture 7. Main Menu Appearance

C. Clustering Process Appearance

Design

Below is the picture of clustering analysis design.

Picture 8. Clustering Analysis Appearance 2.4 Implementation

The implementation of the constructed system will be done in this stage after analyzing and designing has been finished. Then will be implemented to the utilized programming language.

A. System Implementation

The implementation purpose is to confirm the designing program module to the performer system so that user can give the input to the system builder.

B. Hardware Implementation

The hardware that used to implementing the system are below:

1. Processor : Pentium 4 2,66 GHz 2. Harddisk : 80 Gb

3. Memory : DDR 256 Mb 4. Monitor : 15”

C. Software Implementation

The software that used to implementing the system are below:

1. Windows XP Operational System 2. MySQL 5

3. WAMP 5

4. SQLyog Enterprise – MySQL GUI v7.14

5. Delphi 7

6. Component Delphi 7

D. Form Implementation

Form implementation is performed to know each program page that has been made. Below is the form implementation:

(5)

Table 1. Form Implementation

3. RESULT AND DISCUSSION

From the analysis and the designing that has been done, the result of the constructed application shown as these appearances below:

Picture 9. Clustering Analysis Form

Picture 10. The Report of Clustering Analysis Result

Picture 11. Progress Look Form

4. CONCLUSION AND SUGGESTION

4.1 Conclusion

After the analysis, designing, and trial, the conclusions obtained are:

1. The constructed application is helpful for PEPSI COLA INDOBEVERAGES COMPANY as a feature of decision maker in the framework of gaining selling product pattern result.

2. Data processing is resulting adequate information to be analyzed further. 3. The constructed application decreasing

the stack of data which useless before. 4.2 Suggestion

Based on the conclusion above, the expectation next is this application can be more developed further with more huge data processing so that the application truly can be used as one of the more accurate and more useful company’s decision maker feature.

5. REFERENCES

[1] Andi (Wednesday, March 4th 2009),

Data Mining dan Web Mining, http://andyku.wordpress.com/2008/04/

Menu Description Nama File

Beginning Appearan ce

Program file to show the beginning page of application unPra_Login.pas Login User

Program file to handle user login

unLogin.pas

Main Entire system

process unMain.pas Data Master The processing user data, authorization access, selling zone class parameter input unUser.pas, unUser_Input.pas, unTrustee.pas, UnKelasWilayah.pas Password Change

Program file to change user password

unGantiPassword.pas

Import Data

Program file to import data

unImportPenjualan.pas, unImportReturPenjualan.p as

Clustering Cluster making process, history, export, and progress UnAnalisaPeringkatPerBul an.pas Unit1.pas UnProgress.pas Module Data

Program file to collecting component connection, table, query, data source UDM.pas

(6)

[2]

[3]

[4]

[5]

[6]

[7]

17/data-mining-dan-web-mining/ Andri Heryandi, S.T. SQL (Structured Query Language) dengan delphi,

Diktat Delphi, 1-55

Iko Pramudiono. (Wednesday, March 4th 2009), Pengantar Data Mining: Menambang Permata Pengetahuan di Gunung Data, http://ilmukomputer.org/2008/11/25/p engantardata-mining/

Kadir, Abdul,(2001), Konsep Dan Tuntunan Basis Data , Yogyakarta : Andi.

Sandy Kurniawan, Taufiq Hidayat (Wednesday, August 5th_2009), PENERAPAN DATA MINING DENGAN METODE INTERPOLASI UNTUK MEMPREDIKSI MINAT KONSUMEN ASURANSI (Studi Kasus Asuransi Metlife), http://journal.uii.ac.id/index.php/medi a-informatika/article/view/114/76/ Susanti, Azhar, (2003), Sistem Informasi Management, Yogyakarta: Andi.

Yusta Noverison. (Tuesday, March 3rd

2009), Data Mining,

http://yustanoverison.blogspot.com/20 08/05/data-mining.html

Penerapan Data Mining Pada penjualan Produk Minuman Di PT. Pepsi Cola Indobeverages Menggunakan Metode Clustering

PENERAPAN

DATA MINING

PADA PENJUALAN PRODUK

MINUMAN DI PT. PEPSI COLA INDOBEVERAGES

MENGGUNAKAN METODE

CLUSTERING

ENUR IRDIANSYAH

10105140

JURUSAN TEKNIK INFORMATIKA

FAKULTAS TEKNIK DAN ILMU KOMPUTER

UNIVERSITAS KOMPUTER INDONESIA

BANDUNG

LEMBAR PENGESAHAN

PENERAPAN

DATA MINING

PADA PENJUALAN PRODUK

MINUMAN DI PT. PEPSI COLA INDOBEVERAGES

MENGGUNAKAN METODE

CLUSTERING

ENUR IRDIANSYAH

10105140

PENERAPAN

DATA MINING

PADA PENJUALAN PRODUK

MINUMAN DI PT. PEPSI COLA INDOBEVERAGES

MENGGUNAKAN METODE

CLUSTERING

ENUR IRDIANSYAH

10105140

ABSTRAK

PENERAPAN

DATA MINING

PADA PENJUALAN PRODUK

MINUMAN DI PT. PEPSI COLA INDOBEVERAGES

MENGGUNAKAN METODE

CLUSTERING

Enur Irdiansyah

10105140

ABSTRACT

DATA MINING APPLICATION OF BEVERAGE PRODUCTS

MARKETING IN PEPSI COLA INDOBEVERAGES COMPANY

USING CLUSTERING METHOD

Enur Irdiansyah

10105140

DATA MINING APPLICATION OF BEVERAGE PRODUCTS

MARKETING IN PEPSI COLA INDOBEVERAGES COMPANY USING

CLUSTERING METHOD

ABSTRACT

Parts

Dokumen yang terkait

Penerapan data mining pada penjualan produk kaos kaki di pabrik kalvin socks production menggunakan metode association

Penerapan Data Mining Pada Penjualan Produk Benang Di PT. Bandung Perkasa Jaya Menggunakan Metode Associantion Rule

Penerapan Data Mining Pada Penjualan Produk Di PT. Trimitra Tunas Sakti Wilayah Jawa Timur Menggunakan Metode Clustering

Penerapan Data Mining pada Data Penjualan di Slasher Clothing Menggunakan Metode Association Rule

Penerapan Data Mining pada data Penjualan Sepatu Untuk Membentuk Segmintasi Distributor di CV Mimosabi Menggunakan Metode Clustering

Penerapan Data Mining Pada Penjualan Unit Pesawat Di PT. Dirgantara Indonesia Bandung Dengan Metode Clustering

Implementasi Data Mining Pada Penjualan Produk Di PT. Focus Gaya Graha Menggunakan Metode Association Rule

Perencanaan Pengendalian Persediaan Bahan Baku dan Bahan Pembantu di PT Pepsi Cola Indobeverages

Penerapan Analytical Hierarchy Process dalam Penyusunan Strategi Bisnis PT. Pepsi - Cola Indobeverages

Implementasi data mining menggunakan metode clustering untuk prediksi penjualan di PT. XYZ.

Dokumen yang Anda mencari sudah siap untuk unduhkan