Pemrosesan Data ANALISIS DAN PERANCANGAN SISTEM

empat tahun, dan tidak sedikit pula mahasiswa yang menyelesaikan studinya kurang dari empat tahun. 3.2.2. Pengelompokan atribut Terdapat beberapa kelompok item pada setiap atribut seperti berikut: 1. Jenis Sekolah a. SMAMA Negeri Dalam Medan b. SMAMA Negeri Luar Medan c. SMAMA Swasta Dalam Medan d. SMAMA Swasta Luar Medan e. SMTA Lain-lain semua sekolah selain empat diatas 2. Jalur Masuk a. PMP b. SNMPTN c. SPMPRM d. UMB 3. IPK a. IPK 3.00 b. IPK = 3.00-3.49 c. IPK 3.49 4. Lama Studi a. 4 Tahun b. 4 Tahun c. 4 Tahun

3.3. Pemrosesan Data

Terdapat beberapa tahapan dalam pengolahan data yang harus dilalui agar menghasilkan data yang diinginkan, yaitu gabungan aturan atau association rules dari data lulusan mahasiswa. 3.3.1. Data mining Tahapan ini adalah proses untuk menghasilkan association rules. Berikut merupakan data lulusan mahasiswa sebanyak 30 mahasiswa yang mewakili keseluruhan data dari salah satu fakultas yang akan dilakukan proses pencarian association rules yang dapat dilihat pada Tabel 3.4. Tabel 3.4. Data lulusan mahasiswa Id Mahasiswa Jenis Sekolah Jalur Masuk IPK Lama Studi 1 SMAMA Negeri Luar Medan SNMPTN 2.97 4 Tahun 2 SMAMA Swasta Dalam Medan SNMPTN 2.92 4 Tahun 3 SMAMA Negeri Luar Medan SNMPTN 3.29 4 Tahun 4 SMAMA Negeri Dalam Medan SNMPTN 3.41 4 Tahun 5 SMAMA Negeri Dalam Medan SPMPRM 2.92 4 Tahun 6 SMAMA Negeri Dalam Medan SNMPTN 2.78 4 Tahun 7 SMAMA Negeri Dalam Medan SPMPRM 3.05 4 Tahun 8 SMAMA Negeri Dalam Medan SNMPTN 3.22 4 Tahun 9 SMAMA Negeri Luar Medan SNMPTN 3.30 4 Tahun 10 SMAMA Negeri Luar Medan SNMPTN 3.10 4 Tahun 11 SMAMA Negeri Luar Medan SNMPTN 3.36 4 Tahun 12 SMTA Lain-lain SNMPTN 3.07 4 Tahun 13 SMAMA Negeri Luar Medan SNMPTN 3.02 4 Tahun 14 SMAMA Negeri Dalam Medan SPMPRM 3.06 4 Tahun 15 SMAMA Negeri Dalam Medan SNMPTN 3.29 4 Tahun 16 SMAMA Negeri Luar Medan SNMPTN 3.44 4 Tahun 17 SMAMA Negeri Luar Medan SNMPTN 3.24 4 Tahun 18 SMAMA Negeri Dalam Medan SNMPTN 3.08 4 Tahun 19 SMAMA Swasta Dalam Medan SNMPTN 3.03 4 Tahun 20 SMAMA Negeri Dalam Medan SNMPTN 3.46 4 Tahun 21 SMAMA Negeri Dalam Medan SPMPRM 2.97 4 Tahun 22 SMTA Lain-lain SNMPTN 3.59 4 Tahun 23 SMAMA Negeri Dalam Medan SPMPRM 2.79 4 Tahun 24 SMAMA Negeri Luar Medan SNMPTN 2.95 4 Tahun 25 SMAMA Swasta Dalam Medan SNMPTN 3.02 4 Tahun 26 SMAMA Negeri Luar Medan SNMPTN 2.99 4 Tahun 27 SMAMA Swasta Luar Medan SNMPTN 3.04 4 Tahun 28 SMAMA Negeri Luar Medan SNMPTN 3.54 4 Tahun 29 SMAMA Swasta Dalam Medan SNMPTN 2.90 4 Tahun 30 SMAMA Negeri Luar Medan SNMPTN 3.06 4 Tahun Dari Tabel 3.4. terdapat 30 lulusan mahasiswa yang masing-masing memiliki kelompok atribut yang berbeda-beda. Maka dari itu, diberikan kode setiap item atribut agar mempermudah proses pencarin rules seperti pada Tabel 3.5. Tabel 3.5. Kode untuk setiap item atribut Atribut Item Kode Jenis Sekolah SMAMA Negeri Dalam Medan A SMAMA Negeri Luar Medan B SMAMA Swasta Dalam Medan C SMAMA Swasta Luar Medan D SMTA Lain-lain E Jalur Masuk PMP F SNMPTN G SPMPRM H UMB I IPK IPK 3.00 J IPK = 3.00-3.49 K IPK 3.49 L Lama Studi 4 Tahun M 4 Tahun N 4 Tahun O Berdasarkan Tabel 3.5, dapat dilihat itemset dari data lulusan mahasiswa ataupun kumpulan item berdasarkan kode pada Tabel 3.6. Tabel 3.6. Data lulusan mahasiswa dengan itemset Id Mahasiswa Itemset 1 BGJO 2 CGJO 3 BGKN 4 AGKM 5 AHJM 6 AGJO 7 AHKO 8 AGKM 9 BGKM 10 BGKM 11 BGKM 12 EGKO 13 BGKO 14 AHKM 15 AGKM 16 BGKM 17 BGKM Tabel 3.6. Data lulusan mahasiswa dengan itemset lanjutan Id Mahasiswa Itemset 18 AGKM 19 CGKO 20 AGKN 21 AHJO 22 EGLN 23 AHJO 24 BGJO 25 CGKN 26 BGJN 27 DGKN 28 BGLN 29 CGJO 30 BGKN 3.3.2. Analisis frequent itemset Bedasarkan data ada Tabel 3.6 dapat dicari itemset yang sering muncul, misalkan diberi nilai minimum support = 10 dan kemudian dilakukan pencarian nilai support pada masing-masing item dengan rumus 2.1. Langkah 1 : Mencari frequent item Tabel 3.7. Nilai support per item No Kode Jumlah Support 1 A 11 1130 100 = 36 2 B 12 1230 100 = 40 3 C 4 430 100 = 13 4 D 1 130 100 = 3 5 E 2 230 100 = 6 6 F 030 100 = 0 7 G 25 2530 100 = 83 8 H 5 530 100 = 16 9 I 030 100 = 0 10 J 9 930 100 = 30 11 K 19 1930 100 = 63 12 L 2 230 100 = 6 13 M 11 1130 100 = 36 14 N 8 830 100 = 26 15 O 11 1130 100 = 36 Berdasarkan data pada Tabel 3.7, frequent item yang memenuhi nilai minimum support yaitu sebanyak 10 adalah jenis sekolah A, B, dan C, jalur masuk G dan H, IPK J dan K, dan lama studi M, N dan O. Langkah 2 : Pembangunan FP-Tree FP-tree merupakan struktur penyimpanan data yang dibentuk oleh sebuah akar yang diberi label null Han Kamber 2006. Fp-tree yang dibangun terdiri dari frequent item pada setiap mahasiswa, maka item yang tidak frequent atau tidak sering muncul dihilangkan. Berikut data mahasiswa dengan itemset dapat dilihat pada Tabel 3.8. Tabel 3.8. Data itemset lulusan mahasiswa Id Mahasiswa Itemset 1 BGJO 2 CGJO 3 BGKN 4 AGKM 5 AHJM 6 AGJO 7 AHKO 8 AGKM 9 BGKM 10 BGKM 11 BGKM 12 GKO 13 BGKO 14 AHKM 15 AGKM 16 BGKM 17 BGKM 18 AGKM 19 CGKO 20 AGKN 21 AHJO 22 GN 23 AHJO 24 BGJO 25 CGKN 26 BGJN 27 GKN 28 BGN 29 CGJO 30 BGKN Fp-tree yang dapat dibangun dari itemset yang ada dapat dilihat pada Gambar 3.2, Gambar 3.3, Gambar 3.4, dan Gambar 3.5. G O J B null 1 1 1 1 Gambar 3.2. Tree setelah pembacaan itemset-1 BGJO Pada Gambar 3.2 pembacaan itemset pertama yaitu BGJO, dimana masing-masing item memiliki nilai awal 1. G O J B null 1 1 1 1 G O J 1 1 1 C 1 Gambar 3.3 Tree Setelah pembacaan itemset-2 CGJO Pada Gambar 3.3 itemset kedua tidak memiliki prefix yang sama dengan prefix pada itemset pertama yaitu B, maka itemset kedua membuat lintasan baru. G O J B null 1 1 2 2 G O J 1 1 1 K 1 N 1 C 1 Gambar 3.4 Tree setelah pembacaan itemset-3 BGKN Pada Gambar 3.4 itemset ketiga memiliki prefix yang sama dengan prefix itemset pertama, sehingga B dan G berada dalam lintasan yang sama dengan itemset pertama, akan tetapi K dan N membuat lintasan baru. Proses terus dilakukan sampai pembacaan itemset ke 30 seperti pada Gambar 3.5. G O J A null M K O J M B G O K M N G N K 11 3 2 1 5 1 2 3 6 12 3 12 8 1 1 4 O 2 5 1 K O M 2 1 1 H 5 N 1 O 1 N 1 J N 1 1 N 2 C G J O K N O 1 1 2 2 2 4 4 ... Gambar 3.5 Tree setelah pembacaan itemset-30 BGKN Langkah 3 : Pencarian frequent itemset Pencarian frequent itemset dilakukan melalui beberapa tahapan. 1. Pembangkitan conditional Fp-tree, yaitu yang hanya mengandung akhiran suffix item yang sama pada setiap itemset seperti pada Gambar 3.6, Gambar 3.7, dan Gambar 3.8. G A null M K J M B G M K 6 1 4 1 4 5 5 5 4 5 K M 1 1 H 2 Gambar 3.6 Conditional FP-tree dengan suffix M G A null K B G K G N K 1 1 1 1 1 4 2 4 1 N 1 N 1 J N 1 2 N N 1 2 G C K N 1 1 1 1 Gambar 3.7 Conditional FP-tree dengan suffix N G O J A null O J B G O J K G O K 4 2 2 1 1 2 1 3 1 3 1 1 1 O 2 1 K O 1 1 H 3 C G J O K O 2 2 1 1 3 3 Gambar 3.8 Conditional Fp-tree dengan suffix O 2. Mengecek kembali nilai support dari suffix itemset lebih besar atau tidak dari minimum support yaitu 10 dengan rumus 2.1, apabila memenuhi dilakukan kembali pengecekan terhadap suffix kedua selanjutnya hingga prefix dengan rumus 2.2. Pengecekan nilai support pada suffix M hingga prefix dapat dilihat pada Tabel 3.9. Tabel 3.9. Nilai support dari suffix M No Suffix Jumlah Support 1 M 11 1130 100 = 36 2 KM 10 1030 100 = 33 3 JM 1 130 100 = 3 4 GKM 9 930 100 = 30 5 HKM 1 130 100 = 3 6 AGKM 4 430 100 = 13 7 BGKM 5 530 100 = 16 Dari Tabel 3.9 dilakukan pengecekan awal terhadap M suffix, nilai support M memenuhi minimum support, sehingga dilakukan pengecekan kembali terhadap dua suffix terakhir yaitu KM dan JM. Nilai support dari KM memenuhi minimum support, sehingga dilakukan pengecekan terhadap tiga suffix terakhir yang mengandung KM yaitu GKM dan HKM. Nilai support GKM memenuhi minimum support, selanjutnya dilakukan kembali pengecekan nilai support yang mengandung GKM yaitu AGKM dan BGKM. Nilai support AGKM dan BGKM memenuhi minimum support, maka AGKM dan BGKM merupakan frequent itemset. Selanjutnya dilakukan juga pengecekan terhadap suffix N dan O dengan cara yang sama seperti pada pengecekan terhadap suffix M sebelumnya. Nilai support dari suffix N dan O dapat dilihat pada Tabel 3.10 dan Tabel 3.11. Tabel 3.10. Nilai support dari suffix N No Suffix Jumlah Support 1 N 7 730 100 = 23 2 GN 2 230 100 = 6 3 JN 1 130 100 = 3 4 KN 5 530 100 = 16 5 GKN 5 530 100 = 16 6 AGKN 1 130 100 = 3 7 BGKN 2 230 100 = 6 8 CGKN 1 130 100 = 3 Dari Tabel 3.10 tidak ditemukan frequent itemset dengan empat kombinasi karena nilai support dari itemset tidak memenuhi minimum support. Tabel 3.11 Nilai s upport dari suffix O No Suffix Jumlah Support 1 O 11 1130 100 = 36 2 JO 7 730 100 = 23 3 KO 4 430 100 = 13 4 GJO 5 530 100 = 16 5 HJO 2 230 100 = 6 6 AGJO 1 130 100 = 3 7 BGJO 2 230 100 = 6 Dari Tabel 3.11 tidak ditemukan frequent itemset dengan empat kombinasi karena nilai support dari itemset tidak memenuhi minimum support. Sehingga itemset dengan kemunculan tinggi hanya AGKM dan BGKM. 3.3.3. Pembentukan association rules Pembentukan association rules atau aturan assosiasi dilakukan untuk mencari aturan assotitif A →B yang memenuhi syarat minimum nilai confidence, yaitu untuk mencari keterhubungan antar item dalam suatu itemset, pada kasus ini mencari seberapa keterhubungan lama masa studi seorang mahasiswa terhadap jenis sekolah, jalur masuk, dan IPK. Misalkan diberi nilai confidence 60, pencarian nilai confidence dapat dihitung dengan rumus 2.3 dan dapat dilihat pada Tabel 3.12. Tabel 3.12. Nilai confidence dari frequent itemset No Itemset A → B Confidence 1 AGKM A GK → M 58 100 = 62 2 BGKM B GK → M 45 100 = 80 Berdasarkan Tabel 3.12, itemset AGKM dan BGKM memiliki nilai confidence yang memenuhi nilai minimum confidence. Maka AGKM dan BGKM dapat dijadikan rules dari suatu data lulusan mahasiswa tersebut, dimana memiliki tingkat kemunculan tinggi dan keterhubungan yang tinggi pada suatu data lulusan mahasiswa. Association rules yang didapat : 1. Mahasiswa yang berasal dari SMAMA Negeri Dalam Medan dengan jalur masuk SNMPTN yang memiliki IPK antara 3.00 sd 3.50, memiliki lama studi 4 tahun. 2. Mahasiswa yang berasal dari SMAMA Negeri Luar Medan dengan jalur masuk SNMPTN yang memiliki IPK antara 3.00 sd 3.50, memiliki lama studi 4 tahun. 3.3.4. Pencocokan saran Dari hasil association rules yang didapat, dapat dilakukan pencocokan saran untuk perguruan tinggi maupun fakultas dengan melihat suffix akhiran pada rules yaitu berdasarkan lama studi. Saran yang diberikan dapat berguna untuk perguruan tinggi dalam meningkatkan kelulusan pada setiap waktu kelulusan, ataupun dapat mengurangi tingkat mahasiswa dengan lama studi 4 tahun. Pencocokan saran dilihat dari rules yang didapat berdasarkan lama studi, apabila lama studi 4 tahun atau = 4 tahun, maka dua kombinasi awal dari rules yang didapat yaitu jenis sekolah dan jalur masuk dapat menjadi saran untuk fakultas. Saran untuk jenis sekolah dari rules yang didapat adalah fakultas dapat memberikan informasi atau menawarkan kepada calon mahasiswa dari jenis sekolah yang didapat agar memilih fakultas tersebut. Saran untuk jalur masuk dari rules yang didapat adalah perguruan tinggi dapat membuka lebar kesempatan bagi calon mahasiswa pada jalur masuk yang didapat untuk masuk ke fakultas tersebut. Apabila lama studi 4 tahun, maka saran untuk jenis sekolah dari rules yang didapat adalah fakultas dapat memberikan informasi atau melakukan promosi kepada calon mahasiswa dari jenis sekolah selain yang didapat agar memilih fakultas tersebut, dan saran untuk jalur masuk dari rules yang didapat agar perguruan tinggi sedikit membuka kesempatan bagi calon mahasiswa pada jalur masuk yang didapat untuk masuk ke fakultas tersebut. Pencocokan saran juga melihat IPK dari rules yang didapat, tetapi tanpa berdasarkan lama studi. Apabila IPK pada rules yang didapat dibawah 3.00 maka fakultas diberi saran untuk dapat memberikan pengajaran lebih kepada mahasiswa dan arahan untuk mulai memikirkan serta mendalami materi yang akan diambil pada tugas akhir nantinya. Apabila nilai IPK antara 3.00 sd 3.49, fakultas diberi saran untuk dapat memberikan arahan kepada mahasiswa untuk meningkatkan IPK dan mulai memikirkan serta mendalami materi yang akan diambil pada tugas akhir. Apabila nilai IPK diatas 3.50, fakultas diberi saran untuk dapat memberikan arahan kepada mahasiswa untuk mempertahankan IPK dan mulai memikirkan serta mendalami materi yang akan diambil pada tugas akhir. Mahasiswa yang ditujukan saran adalah mahasiswa yang telah menjalani perkuliahan lebih dari setahun dan belum mengambil tugas akhir. Dari hasil association rules yang didapat, sistem dapat memberikan saran kepada perguruan tinggi maupun fakultas sebagai berikut. 1. AGKM Jenis Sekolah : SMAMA Negeri Dalam Medan, Jalur Masuk : SNMPTN, IPK : IPK = 3.00-3.49 Lama Studi : 4 Tahun Saran : 1. Fakultas dapat memberikan informasi atau menawarkan kepada calon mahasiswa yang berasal dari SMAMA Negeri Dalam Medan untuk memilih fakultas tersebut. 2. Fakultas lebih membuka lebar kesempatan bagi calon mahasiswa baru yang berasal dari jalur masuk SNMPTN untuk masuk fakultas tersebut. 3. Fakultas dapat memberikan arahan terhadap mahasiswa yang memiliki nilai IPK antara 3.00 sd 3.49 untuk meningkatkan IPK, dan arahan untuk mulai memikirkan serta mendalami materi yang akan diambil pada tugas akhir. 2. BGKM Jenis Sekolah : SMAMA Negeri Luar Medan, Jalur Masuk : SNMPTN, IPK : IPK = 3.00-3.49 Lama Studi : 4 Tahun Saran : 1. Fakultas dapat memberikan informasi atau menawarkan kepada calon mahasiswa yang berasal dari SMAMA Negeri Luar Medan untuk memilih fakultas tersebut. 2. Fakultas lebih membuka lebar kesempatan bagi calon mahasiswa baru yang berasal dari jalur masuk SNMPTN untuk masuk fakultas tersebut. 3. Fakultas dapat memberikan arahan terhadap mahasiswa yang memiliki nilai IPK antara 3.00 sd 3.49 untuk meningkatkan IPK, dan arahan untuk mulai memikirkan serta mendalami materi yang akan diambil pada tugas akhir.

3.4. Analisis Komponen Sistem