Data Mining Terhadap Data Mahasiswa USMI Angkatan 42 dan 43 IPB.
RINGKASAN
FISCA MISWARI AULIA. Data Mining Terhadap Data Mahasiswa USMI Angkatan 42 dan 43
IPB. Dibimbing oleh BUDI SUSETYO dan IBNUL QAYIM.
Data Mining (penambangan data) adalah suatu metode yang digunakan untuk menggali
informasi dari sekumpulan data yang besar. Pada penelitian ini, beberapa metode pada data mining
digunakan untuk menggali informasi dari data mahasiswa USMI angkatan 42 dan 43. Beberapa
metode yang digunakan dalam penelitian ini antara lain analisis korelasi Pearson, uji kebebasan
chi-square, analisis korespondensi, analisis gerombol, dan analisis korelasi kanonik.
Analisis korelasi Pearson digunakan untuk mengetahui hubungan linear antara nilai rapor
mahasiswa saat SMU dan IPK TPB. Uji kebebasan chi-square digunakan untuk mengetahui
keterkaitan antara latar belakang mahasiswa dengan IPK TPB yang diperoleh. Analisis
korespondensi digunakan sebagai analisis lanjutan dari tabulasi silang antara latar belakang
mahasiswa dengan klasifikasi IPK TPB yang diuji berdasarkan uji kebebasan chi-square. Analisis
gerombol digunakan untuk mengelompokkan asal daerah mahasiswa menurut karakteristik IPK
TPB yang diperoleh mahasiswa. Analisis korelasi kanonik digunakan untuk mengetahui
keterkaitan antara nilai mata kuliah TPB dengan prestasi mahasiswa setelah masuk departemen.
Sebesar lebih dari 60% mahasiswa Institut Pertanian Bogor (IPB) berasal dari jalur Undangan
Seleksi Masuk IPB (USMI), sehingga prestasi akademik IPB banyak dipengaruhi mahasiswa
USMI. Pada penelitian ini diketahui potret mahasiswa USMI angkatan 42 dan 43 dari latar
belakang pendidikan ayah yang mayoritas SLTA, pekerjaan pegawai negeri, penghasilan antara
RP. 1.000.001-Rp. 2.500.000,-, memiliki daya listrik sebesar 450 Watt, dan mayoritas berasal dari
Jawa Barat. Latar belakang mahasiswa saat masuk IPB dan hubungannya dengan prestasi setelah
menjadi seorang mahasiswa di Tingkat Persiapan Bersama (TPB) dapat dijadikan informasi bagi
IPB untuk melihat kecenderungan latar belakang mahasiswa yang memiliki prestasi yang baik di
IPB untuk pertimbangan penerimaan calon mahasiswa berikutnya. Pada penelitian ini diketahui
bahwa ternyata mahasiswa yang cenderung memiliki latar belakang pendidikan orang tua kurang
dari Rp. 1.000.000,- adalah mahasiswa yang banyak memperoleh Indeks Prestasi TPB ≥ 3.00.
Pada penelitian ini juga diketahui adanya data-data mahasiswa yang bisa dijadikan masukan
bagi IPB untuk verifikasi pada tahun berikutnya.
DATA MINING TERHADAP DATA MAHASISWA USMI
ANGKATAN 42 DAN 43 IPB
FISCA MISWARI AULIA
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
2009
RINGKASAN
FISCA MISWARI AULIA. Data Mining Terhadap Data Mahasiswa USMI Angkatan 42 dan 43
IPB. Dibimbing oleh BUDI SUSETYO dan IBNUL QAYIM.
Data Mining (penambangan data) adalah suatu metode yang digunakan untuk menggali
informasi dari sekumpulan data yang besar. Pada penelitian ini, beberapa metode pada data mining
digunakan untuk menggali informasi dari data mahasiswa USMI angkatan 42 dan 43. Beberapa
metode yang digunakan dalam penelitian ini antara lain analisis korelasi Pearson, uji kebebasan
chi-square, analisis korespondensi, analisis gerombol, dan analisis korelasi kanonik.
Analisis korelasi Pearson digunakan untuk mengetahui hubungan linear antara nilai rapor
mahasiswa saat SMU dan IPK TPB. Uji kebebasan chi-square digunakan untuk mengetahui
keterkaitan antara latar belakang mahasiswa dengan IPK TPB yang diperoleh. Analisis
korespondensi digunakan sebagai analisis lanjutan dari tabulasi silang antara latar belakang
mahasiswa dengan klasifikasi IPK TPB yang diuji berdasarkan uji kebebasan chi-square. Analisis
gerombol digunakan untuk mengelompokkan asal daerah mahasiswa menurut karakteristik IPK
TPB yang diperoleh mahasiswa. Analisis korelasi kanonik digunakan untuk mengetahui
keterkaitan antara nilai mata kuliah TPB dengan prestasi mahasiswa setelah masuk departemen.
Sebesar lebih dari 60% mahasiswa Institut Pertanian Bogor (IPB) berasal dari jalur Undangan
Seleksi Masuk IPB (USMI), sehingga prestasi akademik IPB banyak dipengaruhi mahasiswa
USMI. Pada penelitian ini diketahui potret mahasiswa USMI angkatan 42 dan 43 dari latar
belakang pendidikan ayah yang mayoritas SLTA, pekerjaan pegawai negeri, penghasilan antara
RP. 1.000.001-Rp. 2.500.000,-, memiliki daya listrik sebesar 450 Watt, dan mayoritas berasal dari
Jawa Barat. Latar belakang mahasiswa saat masuk IPB dan hubungannya dengan prestasi setelah
menjadi seorang mahasiswa di Tingkat Persiapan Bersama (TPB) dapat dijadikan informasi bagi
IPB untuk melihat kecenderungan latar belakang mahasiswa yang memiliki prestasi yang baik di
IPB untuk pertimbangan penerimaan calon mahasiswa berikutnya. Pada penelitian ini diketahui
bahwa ternyata mahasiswa yang cenderung memiliki latar belakang pendidikan orang tua kurang
dari Rp. 1.000.000,- adalah mahasiswa yang banyak memperoleh Indeks Prestasi TPB ≥ 3.00.
Pada penelitian ini juga diketahui adanya data-data mahasiswa yang bisa dijadikan masukan
bagi IPB untuk verifikasi pada tahun berikutnya.
DATA MINING TERHADAP DATA MAHASISWA USMI
ANGKATAN 42 DAN 43 IPB
FISCA MISWARI AULIA
Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Sains pada
Departemen Statistika
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
2009
Judul Skripsi : DATA MINING TERHADAP DATA MAHASISWA USMI
ANGKATAN 42 DAN 43 IPB
Nama
: Fisca Miswari Aulia
NRP
: G14104034
Menyetujui :
Pembimbing I,
Pembimbing II,
Dr. Ir. Budi Susetyo, MS
NIP. 131 624 193
Dr. Ir. Ibnul Qayim
NIP. 131 878 948
Mengetahui :
Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor
Dr.drh. Hasim, DEA
NIP. 131 578 806
Tanggal Lulus :
RIWAYAT HIDUP
Fisca Miswari Aulia dilahirkan di Jakarta pada tanggal 15 April 1986 sebagai putri pertama
dari tiga bersaudara dari ayah Zulhilman Effendi dan ibu Sri Yulianingsih.
Pendidikan formal penulis dimulai pada tahun 1992 di SD Swasta Pelita hingga tahun 1998,
kemudian dilanjutkan di SLTP Negeri 49 Jakarta dan lulus pada tahun 2001, pada tahun yang
sama penulis diterima di SMU Negeri 67 Jakarta dan lulus pada tahun 2004. Setelah lulus SMU,
penulis melanjutkan pendidikan di Institut Pertanian Bogor Fakultas Matematika dan Ilmu
Pengetahuan Alam Departemen Statistika melalui jalur USMI (Undangan Seleksi Masuk IPB).
Selama kuliah penulis mendapatkan beasiswa Peningkatan Prestasi Akademik (PPA).
Penulis pernah menjabat sebagai bendahara umum di Decision Center The Study pada tahun 2007,
menjadi asisten praktikum Biologi Dasar di Departemen Biologi IPB pada tahun akademik
2006/2007, dan menjadi asisten mata kuliah Analisis Data Kategorik di Departemen Statistika IPB
pada tahun akademik 2007/2008. Penulis melakukan kegiatan praktek lapang di International
Flavors and Fragrances (IFF)-PT. Essence Indonesia pada bulan Februari – Maret 2008.
KATA PENGANTAR
Puji syukur ke hadirat Allah SWT atas segala bimbinganNya sehingga penulisan karya
ilmiah ini dapat diselesaikan. Terima kasih penulis ucapkan kepada :
Bapak Dr. Ir. Budi Susetyo, MS dan Bapak Dr. Ir. Ibnul Qayim atas segala bantuan, bimbingan,
dan saran-saran yang diberikan; Ibu Dra. Itasia Dina, M.Si, selaku dosen penguji yang telah
banyak memberikan masukan perbaikan; Bapak Asep di TPB; Ibu Susi di PPMB; Mama, Papa,
dan seluruh keluarga tersayang atas doa dan semangat yang diberikan kepada penulis selama ini;
Indah angkatan 42, terima kasih atas waktu dan bantuannya; Wiwik, Baina, Lilis, Leisha, Zaenal,
Nikhen, Agustina, Renita, Andhika, Yusri, Irene, Lia, dan Fina, teman-teman yang sering memberi
semangat dan tempat diskusi; serta seluruh pihak yang telah membantu dalam penyelesaian karya
ilmiah ini yang tidak bisa penulis sebutkan satu persatu.
Penulis menyadari bahwa penulisan karya ilmiah ini masih jauh dari sempurna, tetapi
harapan penulis karya ilmiah ini dapat bermanfaat bagi yang memerlukannya terlepas dari segala
kekurangannya.
Bogor, Januari 2009
Fisca Miswari Aulia
DAFTAR ISI
Halaman
DAFTAR TABEL ................................................................................................................. vii
DAFTAR GAMBAR ............................................................................................................ vii
DAFTAR LAMPIRAN .......................................................................................................... vii
PENDAHULUAN
Latar Belakang ................................................................................................................ 1
Tujuan ............................................................................................................................. 1
TINJAUAN PUSTAKA
Program Kurikulum Mayor Minor .................................................................................. 1
Indeks Prestasi (IP) ......................................................................................................... 1
Hubungan Data Mining dan Knowledge Data Discovery ............................................... 1
Analisis Korespondensi ................................................................................................... 2
Analisis Gerombol .......................................................................................................... 2
Analisis Korelasi Kanonik .............................................................................................. 3
BAHAN DAN METODE
Bahan .............................................................................................................................. 4
Metode ............................................................................................................................ 4
HASIL DAN PEMBAHASAN
Deskripsi Mahasiswa Berdasrkan Latar Belakang .......................................................... 4
Hubungan Nilai Rapor SMU dan IPK TPB .................................................................... 6
Hubungan IPK TPB dan Latar Belakang Mahasiswa ..................................................... 6
Pengelompokan Asal Daerah Mahasiswa Menurut IPK TPB ......................................... 6
Pola Pergerakan Rataan Indeks Prestasi (IP) per Departemen ....................................... 10
Pola Sebaran Nilai Akhir Mata Kuliah TPB per Departemen ........................................ 10
Analisis Korelasi Kanonik Antara Mata Kuliah TPB dan Prestasi di Departemen ........ 11
Data yang Perlu Verifikasi ............................................................................................. 12
KESIMPULAN DAN SARAN
Kesimpulan .................................................................................................................... 12
Saran .............................................................................................................................. 13
DAFTAR PUSTAKA ........................................................................................................... 13
LAMPIRAN .......................................................................................................................... 14
DAFTAR TABEL
Halaman
1. Persentase data latar belakang mahasiswa angkatan 42 dan 43 ......................................... 4
2. Persentase data asal daerah mahasiswa angkatan 42 dan 43 ............................................... 5
3. Korelasi Pearson antara nilai rapor SMU dan IPK TPB .................................................... 6
4. Pengelompokan asal daerah pada angkatan 42 .................................................................. 7
5. Pengelompokan asal daerah pada angkatan 43 .................................................................. 7
6. Lima mata kuliah TPB yang berpengaruh di setiap departemen ........................................ 11
DAFTAR GAMBAR
Halaman
1. Dendrogram analisis gerombol asal daerah pada angkatan 42 ............................................ 8
2. Dendrogram analisis gerombol asal daerah pada angkatan 43 ............................................ 9
DAFTAR LAMPIRAN
Halaman
1. Boxplot nilai rapor SMU.................................................................................................... 14
2. Hasil Uji Chi-Square antara latar belakang dan kategori IPK TPB ................................... 14
3. Analisis Korespondensi pada kategori IPK TPB dan penghasilan ayah ............................ 15
4. Analisis Korespondensi pada kategori IPK TPB dan asal daerah ...................................... 15
5. Plot korespondensi angkatan 42 kategori penghasilan ayah dan IPK TPB ........................ 16
6. Plot korespondensi angkatan 43 kategori penghasilan ayah dan IPK TPB ........................ 16
7. Plot korespondensi angkatan 42 kategori asal daerah dan IPK TPB.................................. 17
8. Plot korespondensi angkatan 43 kategori asal daerah dan IPK TPB.................................. 17
9. Tabulasi silang antara IPK TPB dan asal daerah pada angkatan 42................................... 18
10. Tabulasi silang antara IPK TPB dan asal daerah pada angkatan 43................................. 19
11. Radar Pergerakan Indeks Prestasi (IP) per Departemen angkatan 42 .............................. 20
12. Radar Pergerakan Indeks Prestasi (IP) per Departemen angkatan 43 .............................. 20
13. Departemen-departemen di IPB pada angkatan 42 dan 43............................................... 21
14. Sebaran Persentase Nilai Akhir Mata Kuliah TPB Angkatan 42 ..................................... 22
15. Sebaran Persentase Nilai Akhir Mata Kuliah TPB Angkatan 43 ..................................... 27
16. Analisis Korelasi Kanonik antara mata kuliah dan prestasi di departemen...................... 34
17. Nilai loading kanonik antara peubah asal (X) dan peubah kanoniknya ........................... 35
18. Nilai loading kanonik antara peubah asal (Y) dan peubah kanoniknya ........................... 37
19. Tabulasi antara penghasilan ayah dan pendidikan ayah (angkatan 42) ............................ 38
20. Tabulasi antara penghasilan ayah dan pekerjaan ayah (angkatan 42) .............................. 38
21. Tabulasi antara penghasilan ayah dan daya listrik (angkatan 42) .................................... 39
22. Tabulasi antara pendidikan ayah dan pekerjaan ayah (angkatan 42)................................ 39
23. Tabulasi silang antara daya listrik dan pekerjaan ayah (angkatan 42) ............................. 40
24. Tabulasi antara penghasilan ayah dan pendidikan ayah (angkatan 43) ............................ 41
25. Tabulasi antara penghasilan ayah dan pekerjaan ayah (angkatan 43) .............................. 41
26. Tabulasi antara penghasilan ayah dan daya listrik (angkatan 43) .................................... 42
27. Tabulasi antara pendidikan ayah dan pekerjaan ayah (angkatan 43)................................ 42
28. Tabulasi silang antara daya listrik dan pekerjaan ayah (angkatan 43) ............................. 43
PENDAHULUAN
2.
Latar Belakang
Institut Pertanian Bogor (IPB) adalah
perguruan tinggi negeri pertama yang
mempelopori jalur masuk melalui PMDK
(Penelusuran Minat dan Kemampuan) atau
yang dikenal dengan jalur USMI (Undangan
Seleksi Masuk IPB). Persentase mahasiswa
USMI yang lebih besar dibandingkan
mahasiswa dari jalur lain, berdampak pada
besarnya pengaruh mahasiswa USMI terhadap
prestasi akademik IPB secara keseluruhan.
Sehingga untuk meningkatkan prestasi IPB,
panitia penerimaan mahasiswa baru IPB
haruslah selektif memilih calon mahasiswa
yang memiliki potensi akademik yang baik.
Penelitian ini secara garis besar ingin
mengetahui apa yang menjadi penciri
keberhasilan mahasiswa jika dilihat dari nilai
SMU dikaitkan dengan prestasinya satu tahun
pertama di Tingkat Persiapan Bersama (TPB),
kemudian pengaruh prestasi setelah lulus TPB
dikaitkan prestasi setelah masuk departemen
pilihan. Dalam penelitian ini akan digunakan
suatu metode yang dapat menggali informasi
dari sekumpulan data yang besar, atau sering
Data
Mining.
Data
mining
disebut
(penambangan data), sesuai dengan namanya,
berkonotasi sebagai pencarian informasi yang
berharga dari basis data yang sangat besar.
Menurut Kantardzic (2003), Data Mining
adalah suatu proses dalam menemukan
berbagai model, ringkasan data, dan nilai-nilai
yang berharga dari sekumpulan data. Pada
dasarnya data mining bukanlah suatu hal yang
baru, yang membuatnya baru adalah
pendekatannya dari berbagai disiplin ilmu dan
teknologi yang digunakan.
Pada penelitian kali ini, beberapa metode
data mining digunakan untuk proses pencarian
informasi dari data USMI (Undangan Seleksi
Masuk IPB) program mayor minor angkatan 42
dan 43 (tahun masuk 2005 dan 2006).
Mahasiswa IPB angkatan 42 dan 43 adalah
mahasiswa yang mengikuti sistem dimana
ketika diterima di IPB, mahasiswa yang
bersangkutan belum memilih departemen.
Mahasiswa baru memilih departemen setelah
lulus dari TPB dengan nilai IPK minimum 2.00.
Data USMI dalam penelitian ini terdiri dari
3281 record data mahasiswa dengan 28 peubah.
3.
Tujuan
Penelitian ini bertujuan untuk :
1. Memberikan informasi berharga yang
dapat dijadikan masukan IPB dalam
meningkatkan kualitas mahasiswa USMI
4.
Mengeksplorasi data USMI program
mayor minor angkatan 42 dan 43.
Melihat hubungan antara latar belakang
mahasiswa dengan nilai akademik
selama di TPB.
Mengetahui hubungan antara nilai
akademik mata kuliah di TPB dan
prestasinya setelah masuk departemen.
TINJAUAN PUSTAKA
Program Kurikulum Mayor Minor
Pengertian kurikulum mayor minor
adalah kurikulum berbasis kompetensi
dimana setiap mahasiswa mengikuti
pendidikan dalam salah satu mayor sebagai
bidang keahlian (kompetensi) utama dan
dapat mengikuti pendidikan dalam salah
satu bidang minor sebagai bidang keahlian
(kompetensi) pelengkap. Dasar penerimaan
mahasiswa pada program mayor pilihannya
adalah :
1. Prestasi akademik yang memenuhi
persyaratan yang telah ditetapkan IPB.
2. Kemampuan memenuhi syarat khusus
yang ditentukan oleh mayor yang
menjadi pilihan mahasiswa tersebut.
3. Daya
tampung
mayor
yang
bersangkutan.
(Panduan Program Sarjana 2006).
Indeks Prestasi (IP)
Penilaian keberhasilan studi semester
dilakukan pada tiap akhir semester.
Penilaian ini meliputi semua mata kuliah
yang direncanakan oleh mahasiswa dalam
KRS. Rumus perhitungan Indeks Prestasi
(IP) adalah sebagai berikut :
n
IP
N k
i 1
n
i i
k
i 1
i
dengan IP = Indeks Prestasi
n = banyaknya mata kuliah
Ni = Nilai mutu mata kuliah i
ki = bobot sks mata kuliah i
(Panduan Program Sarjana 2004)
Hubungan Data Mining dan Knowledge
Data Discovery (KDD)
Data mining secara garis besar dapat dibagi
menjadi dua, yaitu data mining terkait
dengan pendugaan suatu nilai (predictive
data mining) dan data mining terkait dengan
deskripsi data (descriptive data mining).
Pada umumnya metodologi yang sering
digunakan dalam data mining adalah analisis
klasifikasi (Classification), analisis regresi
(Regression), analisis gerombol (Clustering),
analisis deskriptif (Summarization), pemodelan
kebergantungan (Dependency Modeling), dan
pendeteksian perubahan dan deviasi (Change
and Deviation Detection).
Pada aplikasinya data mining adalah
bagian dari knowledge data discovery (KDD),
namun istilah data mining biasanya lebih
dikenal para pelaku bisnis. Sebagai komponen
dalam KDD, data mining terutama berkaitan
dengan ekstraksi dan penghitungan pola-pola
dari data yang ditelaah. Secara garis besar,
langkah-langkah utama dalam proses KDD
adalah:
1. Pemahaman terhadap domain dari
aplikasi dan relevansinya terhadap
pengetahuan yang ada.
2. Pemilihan himpunan data target atau
memfokuskan pada subset variabel
atau sampel data dimana penemuan
(discovery) akan dilakukan.
3. Pemrosesan
pendahuluan
(data
preparation) dan pembersihan data
(data cleaning), operasi dasar seperti
penghapusan noise dilakukan.
4. Proyeksi dan pengurangan data (data
reduction), pencarian fitur-fitur yang
berguna untuk mempresentasikan data
bergantung kepada tujuan yang ingin
dicapai.
5. Pemilihan tugas data mining dari
proses KDD misalnya klasifikasi,
regresi, pengelompokkan, dll.
6. Proses data mining, yaitu pencarian
pola-pola dari data.
7. Penterjemahan
pola-pola
yang
dihasilkan dari data mining.
(Moertini 2002)
Beberapa teknik statistika yang digunakan
dalam penelitian ini antara lain : analisis
korelasi Pearson, uji kebebasan chi-square,
analisis korespondensi, analisis gerombol, dan
analisis korelasi kanonik.
Analisis Korespondensi
Analisis korespondensi merupakan analisis
yang menyajikan prosedur grafik untuk
merepresentasikan hubungan dari tabel
kontingensi atau tabel frekuensi. (Johnson dan
Wichern 1982).
Analisis korespondensi diterapkan untuk
melihat kedekatan profil dalam suatu peubah
kategorik. Plot baris yang berdekatan
menunjukkan kategori baris yang memiliki
profil yang sama dan plot kolom yang
berdekatan menunjukkan kategori kolom yang
memiliki profil yang sama. Matriks
korespondensi didefinisikan sebagai berikut
:
xij
Paxb = Pij
n
, i= 1,2,...,I; j=1,2,...,J
dimana :
Paxb = matriks P berukuran a x b
Pij = elemen matriks P baris ke-i kolom ke-j
xij = frekuensi sel tabel kontingensi baris
ke-i kolom ke-j
n = total frekuensi pada tabel kontingensi
Vektor yang unsur-unsurnya merupakan
jumlah unsur dari vektor-vektor baris
matriks P adalah r = P1; ri > 0, i = 1, 2, .., I
sedangkan vektor yang unsur-unsurnya
merupakan jumlah unsur dari vektor-vektor
kolom matriks P adalah c = P’1; ci > 0, i = 1,
2, .., J. Matriks profil baris didefinisikan
sebagai R = Dr-1 P dan matriks profil kolom
didefinisikan sebagai C = Dc-1 P’. Untuk
mereduksi dimensi data berdasarkan
keragaman
data
(inersia)
dengan
mempertahankan
informasi
optimum,
diperlukan Penguraian Nilai Singular (PNS).
Pada PNS didapat bahwa :
P-rc’ = ADμB’
dengan syarat A’ Dr-1A = B’ Dc-1B = I
dimana :
A = Dr1/2U dan B = Dc1/2V
U = Matriks yang elemennya adalah vektor
eigen dari matriks TT’
V = Matriks yang elemennya adalah vektor
eigen dari matriks T’T
Dμ = Matriks diagonal μ dengan μ2 nilai
eigen tak nol
Dr = diag (r) dan Dc = diag (c)
T Dr1 / 2 P rc 'Dc1 / 2
Maka profil baris matriks R yang posisi
relatifnya sama dengan profil baris matriks
R – 1c’ diberikan oleh F = Dr-1ADμ.
Sedangkan profil kolom matriks C yang
posisi relatifnya sama dengan profil kolom
matriks C – 1r’ diberikan oleh G = Dc-1BDμ.
Analisis Gerombol
Analisis gerombol adalah salah satu
analisis peubah ganda yang bertujuan untuk
mengelompokkan sekumpulan objek ke
dalam satu atau lebih gerombol sehingga
objek-objek yang berada dalam satu
gerombol memiliki homogenitas yang tinggi
(within cluster) dan memiliki heterogenitas
yang tinggi antar cluster (between cluster)
(Santoso,2006).
Proses yang digunakan pada analisis
gerombol pertama kali adalah mengukur
kesamaan (similarity) antar peubah melalui
korelasi dan jarak antar objek. Jika peubah
tidak memiliki korelasi yang tinggi, maka
digunakan jarak Euclid, yang didefinisikan
Johnson dan Wichern (1982) sebagai berikut :
1
2
p
2
d ij xik x jk
k 1
dimana :
d ij = jarak antar objek ke-i dan objek ke-j
xik = nilai objek ke-i pada peubah ke-k
x jk = nilai objek ke-j pada peubah ke-k
p
= banyaknya peubah yang diamati
Secara umum terdapat dua metode
penggerombolan, yaitu metode berhirarki dan
metode tak berhirarki. Metode berhirarki
dimulai dengan mengelompokkan dua atau
lebih objek yang mempunyai kesamaan paling
dekat, kemudian proses berlanjut ke objek
berikutnya yang memiliki kedekatan kedua.
Demikian seterusnya hingga gerombol terlihat
membentuk hirarki (tingkatan) yang jelas antar
objek. Dendogram biasanya digunakan untuk
membantu memperjelas hirarki tersebut. Ada
beberapa metode untuk proses penggerombolan
secara hirarki, yaitu Single Linkage, Complete
Linkage, Average Linkage, Ward’s Method, dan
Centroid Method. Sedangkan pada metode tak
berhirarki proses dimulai dengan menentukan
terlebih dahulu jumlah k, dimana k adalah
banyaknya gerombol yang dibentuk. Metode ini
biasa disebut dengan K-Means Cluster.
Analisis Korelasi Kanonik
Analisis korelasi kanonik digunakan untuk
mengukur tingkat keeratan hubungan antara
dua gugus peubah. Pemikiran dasar tentang
korelasi
kanonik
adalah
menggunakan
kombinasi linear dari dua gugus peubah.
Kombinasi linear yang dibentuk oleh X1, X2,...,
Xm
dan Y1, Y2,...,Yp masing-masing
dinyatakan sebagai berikut :
buah pasangan kombinasi linear yang
dibentuk oleh peubah penduga dan peubah
respon. Kombinasi linear Uq dan Vq
digunakan untuk mencari korelasi kanonik,
yakni dengan menentukan pasangan
kombinasi linear yang memiliki sifat U1 dan
V1 terbesar korelasinya, korelasi U2 dan V2
terbesar kedua dan tidak berkorelasi dengan
pasangan kanonik pertama, korelasi U3 dan
V3 terbesar ketiga dan tidak berkorelasi
dengan pasangan kanonik pertama dan
kedua, Demikian seterusnya untuk semua
pasangan yang mungkin yang banyaknya
adalah q = min (m, p).
Korelasi antara U dan V yang
dinyatakan sebagai fungsi a' dan b'
dirumuskan sebagai berikut :
a ' XY b
CorrU ,V
a ' XX a b ' YY b
dimana :
a = vektor koefisien pembobot peubah
kanonik X
a ' = transpose vektor koefisien pembobot
peubah kanonik X
b = vektor koefisien pembobot peubah
kanonik Y
b ' = transpose vektor koefisien pembobot
XY
peubah kanonik Y
= matriks koragam gugus peubah X
XX
dan gugus peubah Y
= matriks ragam dari peubah X
YY
= matriks ragam dari peubah Y
Dengan menggunakan ketaksamaan
Cauchy
Schwarz
diperoleh
2
2
2
yang
merupakan
akar ciri
1 2 ... p
dari
matriks
(eigenvalues)
1 / 2
1
1 / 2
yang
XX
XY
YY
YX
XX
berpadanan dengan vektor ciri e1, e2, ..., ep,
selain itu 1 2 2 2 ... p 2 juga merupakan
akar
ciri
dari
matriks
1 / 2
1
1 / 2
yang
YY
YX
XX
XY
YY
X* = a1X1 + a2X2+ ... + am Xm
berpadanan dengan vektor f1, f2, ..., fp.
Y* = b1Y1 + b2Y2 + ... + bp Yp
Dalam bentuk vektor kombinasi linear
peubah X dan peubah Y dituliskan Johnson dan
Wichern (1982) sebagai berikut :
U = a'X
V = b'Y
Pasangan U dan V
disebut peubah
kanonik. Jika q minimum di antara m dan p,
ditulis q = min (m,p), yang berarti sebanyak q
Vektor a dan b diperoleh dari persamaan
berikut :
ai ei XX1/ 2
'
'
1/ 2
bi f i YY
Akar positif dari eigen value i2 adalah
| i| yang merupakan koefisien korelasi
kanonik antara variabel kanonik Uq dan Vq
(Gittins,1985)
BAHAN DAN METODE
Bahan
Data yang digunakan dalam penelitian ini
adalah data mahasiswa USMI angkatan 42 dan
43 sebanyak 3281 data mahasiswa dengan 28
peubah, yaitu 4 peubah nilai rapor SMU, 6
peubah latar belakang mahasiswa, 14 peubah
nilai mata kuliah TPB, dan 4 peubah nilai
Indeks Prestasi. Data nilai akademik mahasiswa
yang tidak lengkap tidak diikutsertakan dalam
penelitian ini. Berikut adalah peubah-peubah
yang diamati dalam penelitian ini.
a. Nilai rapor SMU terdiri dari :
1. Matematika
2. Fisika
3. Kimia
4. Biologi
b. Latar belakang mahasiswa terdiri dari :
1. Jenis Kelamin
2. Pendidikan Ayah
3. Pekerjaan Ayah
4. Daya Listrik
5. Penghasilan Ayah
6. Asal Daerah
c. Nilai mata kuliah TPB terdiri dari :
1. Agama
2. Biologi
3. Ekonomi Umum
4. Fisika
5. Bahasa Indonesia
6. Bahasa Inggris
7. Kalkulus
8. Kimia
9. Kewirausahaan
10. Matematika
11. Olahraga & Seni
12. PIP
13. PKN
14. Sosiologi Umum
d. Nilai Indeks Prestasi mahasiswa terdiri dari :
1. IPK TPB
2. IP Semester 3
3. IP Semester 4
4. IP Semester 5
Metode
Langkah-langkah yang akan dilakukan
dalam penelitian ini adalah sebagai berikut :
1. Melakukan eksplorasi data berupa
persiapan data (data preparation) dan
pengurangan data (data reduction).
2. Melakukan uji korelasi terhadap nilai
rapor SMU dan IPK TPB.
3. Melakukan
analisis
chi-square
kemudian
analisis
korespondensi
untuk melihat hubungan antara latar
belakang
mahasiswa
dengan
prestasi akademik saat TPB .
4. Melakukan analisis gerombol untuk
mengelompokkan
asal
daerah
mahasiswa berdasarkan nilai indeks
prestasi TPB.
5. Melakukan
analisis
korelasi
kanonik untuk melihat keterkaitan
antara nilai akademik mata kuliah
di TPB dengan prestasi mahasiswa
setelah masuk departemen dilihat
dari Indeks Prestasinya.
6. Interpretasi dan kesimpulan hasil
analisis.
Software yang digunakan dalam
penelitian ini adalah MS. Excel 2003, SPSS
13.0, Minitab 14 dan SAS 9.1.
HASIL DAN PEMBAHASAN
Deskripsi Mahasiswa Berdasarkan Latar
Belakang
Jumlah data yang digunakan dalam
penelitian ini adalah sebanyak 3281 data
mahasiswa USMI dengan rincian data
mahasiswa angkatan 42 sebanyak 1532
record dan data mahasiswa angkatan 43
sebanyak 1749 record. Data persentase dari
peubah latar belakang mahasiswa yang
digunakan untuk menjelaskan karakteristik
mahasiswa disajikan pada Tabel 1 di bawah
ini :
Tabel 1 Persentase data latar belakang
mahasiswa angkatan 42 & 43
No
1
2
3
Angkt.
42
Angk.
43
Jenis Kelamin
Laki-Laki
Perempuan
41.7
58.3
39.9
60.1
Pendidikan Ayah
SD kebawah
SLTP
SLTA
Diploma
Sarjana (S1/S2/S3)
11.2
7.5
37.2
13.2
29.3
9.9
7.3
36.1
12.8
32.8
1.7
1.1
35.3
2.8
35.1
2.5
2.1
0.7
12.7
5.5
3.8
19.7
1.1
0.1
Peubah
Tidak Mengisi
Pekerjaan Ayah
Pegawai Negeri
TNI/POLRI
Pensiunan Pegawai
Negeri
Wiraswasta
Purnawirawan
Eksekutif
No
Angkt.
42
Angk.
43
0.5
21.7
0.4
4.5
0.1
3.3
0.9
12.5
0.3
4.5
3.9
5.7
4.1
6.3
3.7
6.2
29.8
45.8
15.7
5.3
0.9
26.0
46.0
18.2
6.6
1.1
> 2200 Watt
1.8
2.1
Tidak Mengisi
Penghasilan Ayah
< 500.000
500.001 - 1.000.000
1.000.001 – 2.500.000
2.500.001 – 5.000.000
> 5.000.000
0.6
0.1
7.3
15.9
51.2
19.5
4.8
7.1
14.3
45.3
26.5
6.7
1.2
0.1
Peubah
Pekerjaan Ayah
Profesional
Karyawan Swasta
Rohaniawan
Petani/Nelayan
Buruh
BUMN
4
5
Lainnya
Tidak Mengisi
Daya Listrik
< 450 Watt
450 Watt
900 Watt
1300 Watt
2200 Watt
Tidak Mengisi
Pada data mahasiswa angkatan 42 yang
memulai sistem mayor minor, terjadi penurunan
pada
jumlah
mahasiswa
dibandingkan
mahasiswa phasing out yang berjumlah lebih
dari 1700 mahasiswa. Berdasarkan Tabel 1
untuk angkatan 42, dari 1532 mahasiswa,
mayoritas memiliki latar belakang pendidikan
orang tua SLTA yaitu sebesar 570 (37.2%),
diikuti pendidikan sarjana (S1/S2/S3) sebanyak
448 (29.3%), sedangkan latar belakang
pekerjaan orang tua yang terbesar adalah
pegawai negeri yaitu sebanyak 541 (35.3%)
diikuti karyawan swasta sebanyak 333 (21.7%)
dan purnawirawan sebanyak 194 (12.7%).
Mahasiswa yang mengisi memiliki daya listrik
sebesar 450 Watt tercatat sebanyak 701 (45.8%)
dan sebanyak 785 (51.2%) mengisi penghasilan
orang tua antara Rp. 1.000.001 - 2.500.000,-.
Sedangkan mahasiswa angkatan 43 tercatat
1749 jumlah mahasiswa, sebanyak 632 (36.1%)
memiliki latar pendidikan orang tua SLTA
diikuti pendidikan sarjana (S1/S2/S3) sebanyak
574 (32.8%). Latar belakang pekerjaan orang
tua terbesar adalah pegawai negeri yaitu
sebanyak 614 (35.1%), diikuti wiraswasta
sebanyak 344 (19.7%) dan karyawan swasta
sebanyak 219 (12.5%). Mahasiswa yang
mengisi memiliki daya listrik sebesar 450
Watt tercatat sebanyak 804 (46%) dan
sebanyak 793 (45.3%) mengisi penghasilan
orang tua antara Rp. 1.000.001 - 2.500.000,-.
Pada kedua angkatan dapat dilihat bahwa
persentase mahasiswa perempuan lebih
tinggi dibandingkan mahasiswa laki-laki.
Pada angkatan 42 dan 43 secara berturutturut jumlah mahasiswa perempuan adalah
sebanyak 893 (58.3%) dan 1052 (60.1%).
Tabel
2 Persentase data asal daerah
mahasiswa angkatan 42 & 43
Asal Daerah
Angkt. 42 Angkt. 43
NAD
0.7
1.0
Sumatera Utara
4.9
5.5
Sumatera Barat
4.4
3.1
Riau
0.7
0.5
Jambi
1.3
1.2
Sumatera Selatan
1.4
1.1
Bengkulu
1.0
0.9
Lampung
2.0
2.2
Bangka
0.0
0.3
0.0
Banten
5.3
DKI Jakarta
12.8
13.7
Jawa Barat
46.0
40.0
Jawa Tengah
14.5
13.7
DIY
0.4
0.3
Jawa Timur
6.8
7.1
Bali
0.2
0.4
NTB
0.6
0.7
NTT
0.1
0.3
Kalimantan
0.4
0.6
Sulawesi
1.1
1.3
Papua
0.4
0.3
Luar Negeri
0.3
0.2
Pada Tabel 2 dapat dilihat bahwa asal
daerah mahasiswa untuk tiap angkatan
didominasi dari daerah Jawa Barat. Pada
angkatan 42 tercatat sebanyak 704 (46%)
mahasiswa asal Jawa Barat sedangkan pada
angkatan 43 sebanyak 700 (40%) mahasiswa
asal Jawa Barat. Daerah asal terbesar
berikutnya adalah Jawa Tengah dan DKI
Jakarta. Pada angkatan 42 daerah Bangka
masih bergabung dengan Sumatera Selatan
dan Banten masih bergabung dengan Jawa
Barat.
Hubungan Nilai Raport SMU dan
Indeks Prestasi Kumulatif TPB
Hubungan antara rata-rata nilai rapor SMU
(semester 1 sampai dengan 5) dan IPK TPB
mahasiswa dapat diketahui melalui uji korelasi
Pearson. Tabel korelasi rata-rata antara nilai
rapor SMU dan IPK TPB disajikan pada Tabel
3 berikut.
Tabel 3 Korelasi Pearson antara nilai rapor
SMU dengan IPK TPB
IPK TPB
Rapor SMU
Angkatan 42 Angkatan 43
Matematika
0.2136
0.1588
Fisika
0.136
0.1204
Kimia
0.219
0.1958
Biologi
0.1372
0.1524
Dari hasil korelasi Pearson per angkatan
yang dilakukan antara nilai rapor SMU yaitu
nilai Matematika, Fisika, Biologi, dan Kimia
dengan nilai IPK TPB didapatkan koefisien
korelasi yang sangat kecil, hanya berkisar 0.1
hingga 0.2 dengan nilai probabilitas lebih kecil
dari α = 5%. Korelasi yang kecil bisa
disebabkan karena nilai SMU mahasiswa USMI
kurang beragam atau cenderung homogen
disekitar nilai antara 70 hingga 80. Hal ini
dapat pula dilihat pada gambar boxplot nilai
rapor SMU (semester 1 sampai dengan 5) untuk
mata pelajaran Matematika, Fisika, Kimia, dan
Biologi per angkatan pada Lampiran 1.
Hubungan IPK TPB dan Latar
Belakang Mahasiswa
Pada penelitian ini, Indeks Prestasi
Kumulatif
(IPK)
TPB
mahasiswa
diklasifikasikan secara subjektif menjadi lima
kategori, yaitu : IPK< 2.00, 2.00≤IPK
FISCA MISWARI AULIA. Data Mining Terhadap Data Mahasiswa USMI Angkatan 42 dan 43
IPB. Dibimbing oleh BUDI SUSETYO dan IBNUL QAYIM.
Data Mining (penambangan data) adalah suatu metode yang digunakan untuk menggali
informasi dari sekumpulan data yang besar. Pada penelitian ini, beberapa metode pada data mining
digunakan untuk menggali informasi dari data mahasiswa USMI angkatan 42 dan 43. Beberapa
metode yang digunakan dalam penelitian ini antara lain analisis korelasi Pearson, uji kebebasan
chi-square, analisis korespondensi, analisis gerombol, dan analisis korelasi kanonik.
Analisis korelasi Pearson digunakan untuk mengetahui hubungan linear antara nilai rapor
mahasiswa saat SMU dan IPK TPB. Uji kebebasan chi-square digunakan untuk mengetahui
keterkaitan antara latar belakang mahasiswa dengan IPK TPB yang diperoleh. Analisis
korespondensi digunakan sebagai analisis lanjutan dari tabulasi silang antara latar belakang
mahasiswa dengan klasifikasi IPK TPB yang diuji berdasarkan uji kebebasan chi-square. Analisis
gerombol digunakan untuk mengelompokkan asal daerah mahasiswa menurut karakteristik IPK
TPB yang diperoleh mahasiswa. Analisis korelasi kanonik digunakan untuk mengetahui
keterkaitan antara nilai mata kuliah TPB dengan prestasi mahasiswa setelah masuk departemen.
Sebesar lebih dari 60% mahasiswa Institut Pertanian Bogor (IPB) berasal dari jalur Undangan
Seleksi Masuk IPB (USMI), sehingga prestasi akademik IPB banyak dipengaruhi mahasiswa
USMI. Pada penelitian ini diketahui potret mahasiswa USMI angkatan 42 dan 43 dari latar
belakang pendidikan ayah yang mayoritas SLTA, pekerjaan pegawai negeri, penghasilan antara
RP. 1.000.001-Rp. 2.500.000,-, memiliki daya listrik sebesar 450 Watt, dan mayoritas berasal dari
Jawa Barat. Latar belakang mahasiswa saat masuk IPB dan hubungannya dengan prestasi setelah
menjadi seorang mahasiswa di Tingkat Persiapan Bersama (TPB) dapat dijadikan informasi bagi
IPB untuk melihat kecenderungan latar belakang mahasiswa yang memiliki prestasi yang baik di
IPB untuk pertimbangan penerimaan calon mahasiswa berikutnya. Pada penelitian ini diketahui
bahwa ternyata mahasiswa yang cenderung memiliki latar belakang pendidikan orang tua kurang
dari Rp. 1.000.000,- adalah mahasiswa yang banyak memperoleh Indeks Prestasi TPB ≥ 3.00.
Pada penelitian ini juga diketahui adanya data-data mahasiswa yang bisa dijadikan masukan
bagi IPB untuk verifikasi pada tahun berikutnya.
DATA MINING TERHADAP DATA MAHASISWA USMI
ANGKATAN 42 DAN 43 IPB
FISCA MISWARI AULIA
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
2009
RINGKASAN
FISCA MISWARI AULIA. Data Mining Terhadap Data Mahasiswa USMI Angkatan 42 dan 43
IPB. Dibimbing oleh BUDI SUSETYO dan IBNUL QAYIM.
Data Mining (penambangan data) adalah suatu metode yang digunakan untuk menggali
informasi dari sekumpulan data yang besar. Pada penelitian ini, beberapa metode pada data mining
digunakan untuk menggali informasi dari data mahasiswa USMI angkatan 42 dan 43. Beberapa
metode yang digunakan dalam penelitian ini antara lain analisis korelasi Pearson, uji kebebasan
chi-square, analisis korespondensi, analisis gerombol, dan analisis korelasi kanonik.
Analisis korelasi Pearson digunakan untuk mengetahui hubungan linear antara nilai rapor
mahasiswa saat SMU dan IPK TPB. Uji kebebasan chi-square digunakan untuk mengetahui
keterkaitan antara latar belakang mahasiswa dengan IPK TPB yang diperoleh. Analisis
korespondensi digunakan sebagai analisis lanjutan dari tabulasi silang antara latar belakang
mahasiswa dengan klasifikasi IPK TPB yang diuji berdasarkan uji kebebasan chi-square. Analisis
gerombol digunakan untuk mengelompokkan asal daerah mahasiswa menurut karakteristik IPK
TPB yang diperoleh mahasiswa. Analisis korelasi kanonik digunakan untuk mengetahui
keterkaitan antara nilai mata kuliah TPB dengan prestasi mahasiswa setelah masuk departemen.
Sebesar lebih dari 60% mahasiswa Institut Pertanian Bogor (IPB) berasal dari jalur Undangan
Seleksi Masuk IPB (USMI), sehingga prestasi akademik IPB banyak dipengaruhi mahasiswa
USMI. Pada penelitian ini diketahui potret mahasiswa USMI angkatan 42 dan 43 dari latar
belakang pendidikan ayah yang mayoritas SLTA, pekerjaan pegawai negeri, penghasilan antara
RP. 1.000.001-Rp. 2.500.000,-, memiliki daya listrik sebesar 450 Watt, dan mayoritas berasal dari
Jawa Barat. Latar belakang mahasiswa saat masuk IPB dan hubungannya dengan prestasi setelah
menjadi seorang mahasiswa di Tingkat Persiapan Bersama (TPB) dapat dijadikan informasi bagi
IPB untuk melihat kecenderungan latar belakang mahasiswa yang memiliki prestasi yang baik di
IPB untuk pertimbangan penerimaan calon mahasiswa berikutnya. Pada penelitian ini diketahui
bahwa ternyata mahasiswa yang cenderung memiliki latar belakang pendidikan orang tua kurang
dari Rp. 1.000.000,- adalah mahasiswa yang banyak memperoleh Indeks Prestasi TPB ≥ 3.00.
Pada penelitian ini juga diketahui adanya data-data mahasiswa yang bisa dijadikan masukan
bagi IPB untuk verifikasi pada tahun berikutnya.
DATA MINING TERHADAP DATA MAHASISWA USMI
ANGKATAN 42 DAN 43 IPB
FISCA MISWARI AULIA
Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Sains pada
Departemen Statistika
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
2009
Judul Skripsi : DATA MINING TERHADAP DATA MAHASISWA USMI
ANGKATAN 42 DAN 43 IPB
Nama
: Fisca Miswari Aulia
NRP
: G14104034
Menyetujui :
Pembimbing I,
Pembimbing II,
Dr. Ir. Budi Susetyo, MS
NIP. 131 624 193
Dr. Ir. Ibnul Qayim
NIP. 131 878 948
Mengetahui :
Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor
Dr.drh. Hasim, DEA
NIP. 131 578 806
Tanggal Lulus :
RIWAYAT HIDUP
Fisca Miswari Aulia dilahirkan di Jakarta pada tanggal 15 April 1986 sebagai putri pertama
dari tiga bersaudara dari ayah Zulhilman Effendi dan ibu Sri Yulianingsih.
Pendidikan formal penulis dimulai pada tahun 1992 di SD Swasta Pelita hingga tahun 1998,
kemudian dilanjutkan di SLTP Negeri 49 Jakarta dan lulus pada tahun 2001, pada tahun yang
sama penulis diterima di SMU Negeri 67 Jakarta dan lulus pada tahun 2004. Setelah lulus SMU,
penulis melanjutkan pendidikan di Institut Pertanian Bogor Fakultas Matematika dan Ilmu
Pengetahuan Alam Departemen Statistika melalui jalur USMI (Undangan Seleksi Masuk IPB).
Selama kuliah penulis mendapatkan beasiswa Peningkatan Prestasi Akademik (PPA).
Penulis pernah menjabat sebagai bendahara umum di Decision Center The Study pada tahun 2007,
menjadi asisten praktikum Biologi Dasar di Departemen Biologi IPB pada tahun akademik
2006/2007, dan menjadi asisten mata kuliah Analisis Data Kategorik di Departemen Statistika IPB
pada tahun akademik 2007/2008. Penulis melakukan kegiatan praktek lapang di International
Flavors and Fragrances (IFF)-PT. Essence Indonesia pada bulan Februari – Maret 2008.
KATA PENGANTAR
Puji syukur ke hadirat Allah SWT atas segala bimbinganNya sehingga penulisan karya
ilmiah ini dapat diselesaikan. Terima kasih penulis ucapkan kepada :
Bapak Dr. Ir. Budi Susetyo, MS dan Bapak Dr. Ir. Ibnul Qayim atas segala bantuan, bimbingan,
dan saran-saran yang diberikan; Ibu Dra. Itasia Dina, M.Si, selaku dosen penguji yang telah
banyak memberikan masukan perbaikan; Bapak Asep di TPB; Ibu Susi di PPMB; Mama, Papa,
dan seluruh keluarga tersayang atas doa dan semangat yang diberikan kepada penulis selama ini;
Indah angkatan 42, terima kasih atas waktu dan bantuannya; Wiwik, Baina, Lilis, Leisha, Zaenal,
Nikhen, Agustina, Renita, Andhika, Yusri, Irene, Lia, dan Fina, teman-teman yang sering memberi
semangat dan tempat diskusi; serta seluruh pihak yang telah membantu dalam penyelesaian karya
ilmiah ini yang tidak bisa penulis sebutkan satu persatu.
Penulis menyadari bahwa penulisan karya ilmiah ini masih jauh dari sempurna, tetapi
harapan penulis karya ilmiah ini dapat bermanfaat bagi yang memerlukannya terlepas dari segala
kekurangannya.
Bogor, Januari 2009
Fisca Miswari Aulia
DAFTAR ISI
Halaman
DAFTAR TABEL ................................................................................................................. vii
DAFTAR GAMBAR ............................................................................................................ vii
DAFTAR LAMPIRAN .......................................................................................................... vii
PENDAHULUAN
Latar Belakang ................................................................................................................ 1
Tujuan ............................................................................................................................. 1
TINJAUAN PUSTAKA
Program Kurikulum Mayor Minor .................................................................................. 1
Indeks Prestasi (IP) ......................................................................................................... 1
Hubungan Data Mining dan Knowledge Data Discovery ............................................... 1
Analisis Korespondensi ................................................................................................... 2
Analisis Gerombol .......................................................................................................... 2
Analisis Korelasi Kanonik .............................................................................................. 3
BAHAN DAN METODE
Bahan .............................................................................................................................. 4
Metode ............................................................................................................................ 4
HASIL DAN PEMBAHASAN
Deskripsi Mahasiswa Berdasrkan Latar Belakang .......................................................... 4
Hubungan Nilai Rapor SMU dan IPK TPB .................................................................... 6
Hubungan IPK TPB dan Latar Belakang Mahasiswa ..................................................... 6
Pengelompokan Asal Daerah Mahasiswa Menurut IPK TPB ......................................... 6
Pola Pergerakan Rataan Indeks Prestasi (IP) per Departemen ....................................... 10
Pola Sebaran Nilai Akhir Mata Kuliah TPB per Departemen ........................................ 10
Analisis Korelasi Kanonik Antara Mata Kuliah TPB dan Prestasi di Departemen ........ 11
Data yang Perlu Verifikasi ............................................................................................. 12
KESIMPULAN DAN SARAN
Kesimpulan .................................................................................................................... 12
Saran .............................................................................................................................. 13
DAFTAR PUSTAKA ........................................................................................................... 13
LAMPIRAN .......................................................................................................................... 14
DAFTAR TABEL
Halaman
1. Persentase data latar belakang mahasiswa angkatan 42 dan 43 ......................................... 4
2. Persentase data asal daerah mahasiswa angkatan 42 dan 43 ............................................... 5
3. Korelasi Pearson antara nilai rapor SMU dan IPK TPB .................................................... 6
4. Pengelompokan asal daerah pada angkatan 42 .................................................................. 7
5. Pengelompokan asal daerah pada angkatan 43 .................................................................. 7
6. Lima mata kuliah TPB yang berpengaruh di setiap departemen ........................................ 11
DAFTAR GAMBAR
Halaman
1. Dendrogram analisis gerombol asal daerah pada angkatan 42 ............................................ 8
2. Dendrogram analisis gerombol asal daerah pada angkatan 43 ............................................ 9
DAFTAR LAMPIRAN
Halaman
1. Boxplot nilai rapor SMU.................................................................................................... 14
2. Hasil Uji Chi-Square antara latar belakang dan kategori IPK TPB ................................... 14
3. Analisis Korespondensi pada kategori IPK TPB dan penghasilan ayah ............................ 15
4. Analisis Korespondensi pada kategori IPK TPB dan asal daerah ...................................... 15
5. Plot korespondensi angkatan 42 kategori penghasilan ayah dan IPK TPB ........................ 16
6. Plot korespondensi angkatan 43 kategori penghasilan ayah dan IPK TPB ........................ 16
7. Plot korespondensi angkatan 42 kategori asal daerah dan IPK TPB.................................. 17
8. Plot korespondensi angkatan 43 kategori asal daerah dan IPK TPB.................................. 17
9. Tabulasi silang antara IPK TPB dan asal daerah pada angkatan 42................................... 18
10. Tabulasi silang antara IPK TPB dan asal daerah pada angkatan 43................................. 19
11. Radar Pergerakan Indeks Prestasi (IP) per Departemen angkatan 42 .............................. 20
12. Radar Pergerakan Indeks Prestasi (IP) per Departemen angkatan 43 .............................. 20
13. Departemen-departemen di IPB pada angkatan 42 dan 43............................................... 21
14. Sebaran Persentase Nilai Akhir Mata Kuliah TPB Angkatan 42 ..................................... 22
15. Sebaran Persentase Nilai Akhir Mata Kuliah TPB Angkatan 43 ..................................... 27
16. Analisis Korelasi Kanonik antara mata kuliah dan prestasi di departemen...................... 34
17. Nilai loading kanonik antara peubah asal (X) dan peubah kanoniknya ........................... 35
18. Nilai loading kanonik antara peubah asal (Y) dan peubah kanoniknya ........................... 37
19. Tabulasi antara penghasilan ayah dan pendidikan ayah (angkatan 42) ............................ 38
20. Tabulasi antara penghasilan ayah dan pekerjaan ayah (angkatan 42) .............................. 38
21. Tabulasi antara penghasilan ayah dan daya listrik (angkatan 42) .................................... 39
22. Tabulasi antara pendidikan ayah dan pekerjaan ayah (angkatan 42)................................ 39
23. Tabulasi silang antara daya listrik dan pekerjaan ayah (angkatan 42) ............................. 40
24. Tabulasi antara penghasilan ayah dan pendidikan ayah (angkatan 43) ............................ 41
25. Tabulasi antara penghasilan ayah dan pekerjaan ayah (angkatan 43) .............................. 41
26. Tabulasi antara penghasilan ayah dan daya listrik (angkatan 43) .................................... 42
27. Tabulasi antara pendidikan ayah dan pekerjaan ayah (angkatan 43)................................ 42
28. Tabulasi silang antara daya listrik dan pekerjaan ayah (angkatan 43) ............................. 43
PENDAHULUAN
2.
Latar Belakang
Institut Pertanian Bogor (IPB) adalah
perguruan tinggi negeri pertama yang
mempelopori jalur masuk melalui PMDK
(Penelusuran Minat dan Kemampuan) atau
yang dikenal dengan jalur USMI (Undangan
Seleksi Masuk IPB). Persentase mahasiswa
USMI yang lebih besar dibandingkan
mahasiswa dari jalur lain, berdampak pada
besarnya pengaruh mahasiswa USMI terhadap
prestasi akademik IPB secara keseluruhan.
Sehingga untuk meningkatkan prestasi IPB,
panitia penerimaan mahasiswa baru IPB
haruslah selektif memilih calon mahasiswa
yang memiliki potensi akademik yang baik.
Penelitian ini secara garis besar ingin
mengetahui apa yang menjadi penciri
keberhasilan mahasiswa jika dilihat dari nilai
SMU dikaitkan dengan prestasinya satu tahun
pertama di Tingkat Persiapan Bersama (TPB),
kemudian pengaruh prestasi setelah lulus TPB
dikaitkan prestasi setelah masuk departemen
pilihan. Dalam penelitian ini akan digunakan
suatu metode yang dapat menggali informasi
dari sekumpulan data yang besar, atau sering
Data
Mining.
Data
mining
disebut
(penambangan data), sesuai dengan namanya,
berkonotasi sebagai pencarian informasi yang
berharga dari basis data yang sangat besar.
Menurut Kantardzic (2003), Data Mining
adalah suatu proses dalam menemukan
berbagai model, ringkasan data, dan nilai-nilai
yang berharga dari sekumpulan data. Pada
dasarnya data mining bukanlah suatu hal yang
baru, yang membuatnya baru adalah
pendekatannya dari berbagai disiplin ilmu dan
teknologi yang digunakan.
Pada penelitian kali ini, beberapa metode
data mining digunakan untuk proses pencarian
informasi dari data USMI (Undangan Seleksi
Masuk IPB) program mayor minor angkatan 42
dan 43 (tahun masuk 2005 dan 2006).
Mahasiswa IPB angkatan 42 dan 43 adalah
mahasiswa yang mengikuti sistem dimana
ketika diterima di IPB, mahasiswa yang
bersangkutan belum memilih departemen.
Mahasiswa baru memilih departemen setelah
lulus dari TPB dengan nilai IPK minimum 2.00.
Data USMI dalam penelitian ini terdiri dari
3281 record data mahasiswa dengan 28 peubah.
3.
Tujuan
Penelitian ini bertujuan untuk :
1. Memberikan informasi berharga yang
dapat dijadikan masukan IPB dalam
meningkatkan kualitas mahasiswa USMI
4.
Mengeksplorasi data USMI program
mayor minor angkatan 42 dan 43.
Melihat hubungan antara latar belakang
mahasiswa dengan nilai akademik
selama di TPB.
Mengetahui hubungan antara nilai
akademik mata kuliah di TPB dan
prestasinya setelah masuk departemen.
TINJAUAN PUSTAKA
Program Kurikulum Mayor Minor
Pengertian kurikulum mayor minor
adalah kurikulum berbasis kompetensi
dimana setiap mahasiswa mengikuti
pendidikan dalam salah satu mayor sebagai
bidang keahlian (kompetensi) utama dan
dapat mengikuti pendidikan dalam salah
satu bidang minor sebagai bidang keahlian
(kompetensi) pelengkap. Dasar penerimaan
mahasiswa pada program mayor pilihannya
adalah :
1. Prestasi akademik yang memenuhi
persyaratan yang telah ditetapkan IPB.
2. Kemampuan memenuhi syarat khusus
yang ditentukan oleh mayor yang
menjadi pilihan mahasiswa tersebut.
3. Daya
tampung
mayor
yang
bersangkutan.
(Panduan Program Sarjana 2006).
Indeks Prestasi (IP)
Penilaian keberhasilan studi semester
dilakukan pada tiap akhir semester.
Penilaian ini meliputi semua mata kuliah
yang direncanakan oleh mahasiswa dalam
KRS. Rumus perhitungan Indeks Prestasi
(IP) adalah sebagai berikut :
n
IP
N k
i 1
n
i i
k
i 1
i
dengan IP = Indeks Prestasi
n = banyaknya mata kuliah
Ni = Nilai mutu mata kuliah i
ki = bobot sks mata kuliah i
(Panduan Program Sarjana 2004)
Hubungan Data Mining dan Knowledge
Data Discovery (KDD)
Data mining secara garis besar dapat dibagi
menjadi dua, yaitu data mining terkait
dengan pendugaan suatu nilai (predictive
data mining) dan data mining terkait dengan
deskripsi data (descriptive data mining).
Pada umumnya metodologi yang sering
digunakan dalam data mining adalah analisis
klasifikasi (Classification), analisis regresi
(Regression), analisis gerombol (Clustering),
analisis deskriptif (Summarization), pemodelan
kebergantungan (Dependency Modeling), dan
pendeteksian perubahan dan deviasi (Change
and Deviation Detection).
Pada aplikasinya data mining adalah
bagian dari knowledge data discovery (KDD),
namun istilah data mining biasanya lebih
dikenal para pelaku bisnis. Sebagai komponen
dalam KDD, data mining terutama berkaitan
dengan ekstraksi dan penghitungan pola-pola
dari data yang ditelaah. Secara garis besar,
langkah-langkah utama dalam proses KDD
adalah:
1. Pemahaman terhadap domain dari
aplikasi dan relevansinya terhadap
pengetahuan yang ada.
2. Pemilihan himpunan data target atau
memfokuskan pada subset variabel
atau sampel data dimana penemuan
(discovery) akan dilakukan.
3. Pemrosesan
pendahuluan
(data
preparation) dan pembersihan data
(data cleaning), operasi dasar seperti
penghapusan noise dilakukan.
4. Proyeksi dan pengurangan data (data
reduction), pencarian fitur-fitur yang
berguna untuk mempresentasikan data
bergantung kepada tujuan yang ingin
dicapai.
5. Pemilihan tugas data mining dari
proses KDD misalnya klasifikasi,
regresi, pengelompokkan, dll.
6. Proses data mining, yaitu pencarian
pola-pola dari data.
7. Penterjemahan
pola-pola
yang
dihasilkan dari data mining.
(Moertini 2002)
Beberapa teknik statistika yang digunakan
dalam penelitian ini antara lain : analisis
korelasi Pearson, uji kebebasan chi-square,
analisis korespondensi, analisis gerombol, dan
analisis korelasi kanonik.
Analisis Korespondensi
Analisis korespondensi merupakan analisis
yang menyajikan prosedur grafik untuk
merepresentasikan hubungan dari tabel
kontingensi atau tabel frekuensi. (Johnson dan
Wichern 1982).
Analisis korespondensi diterapkan untuk
melihat kedekatan profil dalam suatu peubah
kategorik. Plot baris yang berdekatan
menunjukkan kategori baris yang memiliki
profil yang sama dan plot kolom yang
berdekatan menunjukkan kategori kolom yang
memiliki profil yang sama. Matriks
korespondensi didefinisikan sebagai berikut
:
xij
Paxb = Pij
n
, i= 1,2,...,I; j=1,2,...,J
dimana :
Paxb = matriks P berukuran a x b
Pij = elemen matriks P baris ke-i kolom ke-j
xij = frekuensi sel tabel kontingensi baris
ke-i kolom ke-j
n = total frekuensi pada tabel kontingensi
Vektor yang unsur-unsurnya merupakan
jumlah unsur dari vektor-vektor baris
matriks P adalah r = P1; ri > 0, i = 1, 2, .., I
sedangkan vektor yang unsur-unsurnya
merupakan jumlah unsur dari vektor-vektor
kolom matriks P adalah c = P’1; ci > 0, i = 1,
2, .., J. Matriks profil baris didefinisikan
sebagai R = Dr-1 P dan matriks profil kolom
didefinisikan sebagai C = Dc-1 P’. Untuk
mereduksi dimensi data berdasarkan
keragaman
data
(inersia)
dengan
mempertahankan
informasi
optimum,
diperlukan Penguraian Nilai Singular (PNS).
Pada PNS didapat bahwa :
P-rc’ = ADμB’
dengan syarat A’ Dr-1A = B’ Dc-1B = I
dimana :
A = Dr1/2U dan B = Dc1/2V
U = Matriks yang elemennya adalah vektor
eigen dari matriks TT’
V = Matriks yang elemennya adalah vektor
eigen dari matriks T’T
Dμ = Matriks diagonal μ dengan μ2 nilai
eigen tak nol
Dr = diag (r) dan Dc = diag (c)
T Dr1 / 2 P rc 'Dc1 / 2
Maka profil baris matriks R yang posisi
relatifnya sama dengan profil baris matriks
R – 1c’ diberikan oleh F = Dr-1ADμ.
Sedangkan profil kolom matriks C yang
posisi relatifnya sama dengan profil kolom
matriks C – 1r’ diberikan oleh G = Dc-1BDμ.
Analisis Gerombol
Analisis gerombol adalah salah satu
analisis peubah ganda yang bertujuan untuk
mengelompokkan sekumpulan objek ke
dalam satu atau lebih gerombol sehingga
objek-objek yang berada dalam satu
gerombol memiliki homogenitas yang tinggi
(within cluster) dan memiliki heterogenitas
yang tinggi antar cluster (between cluster)
(Santoso,2006).
Proses yang digunakan pada analisis
gerombol pertama kali adalah mengukur
kesamaan (similarity) antar peubah melalui
korelasi dan jarak antar objek. Jika peubah
tidak memiliki korelasi yang tinggi, maka
digunakan jarak Euclid, yang didefinisikan
Johnson dan Wichern (1982) sebagai berikut :
1
2
p
2
d ij xik x jk
k 1
dimana :
d ij = jarak antar objek ke-i dan objek ke-j
xik = nilai objek ke-i pada peubah ke-k
x jk = nilai objek ke-j pada peubah ke-k
p
= banyaknya peubah yang diamati
Secara umum terdapat dua metode
penggerombolan, yaitu metode berhirarki dan
metode tak berhirarki. Metode berhirarki
dimulai dengan mengelompokkan dua atau
lebih objek yang mempunyai kesamaan paling
dekat, kemudian proses berlanjut ke objek
berikutnya yang memiliki kedekatan kedua.
Demikian seterusnya hingga gerombol terlihat
membentuk hirarki (tingkatan) yang jelas antar
objek. Dendogram biasanya digunakan untuk
membantu memperjelas hirarki tersebut. Ada
beberapa metode untuk proses penggerombolan
secara hirarki, yaitu Single Linkage, Complete
Linkage, Average Linkage, Ward’s Method, dan
Centroid Method. Sedangkan pada metode tak
berhirarki proses dimulai dengan menentukan
terlebih dahulu jumlah k, dimana k adalah
banyaknya gerombol yang dibentuk. Metode ini
biasa disebut dengan K-Means Cluster.
Analisis Korelasi Kanonik
Analisis korelasi kanonik digunakan untuk
mengukur tingkat keeratan hubungan antara
dua gugus peubah. Pemikiran dasar tentang
korelasi
kanonik
adalah
menggunakan
kombinasi linear dari dua gugus peubah.
Kombinasi linear yang dibentuk oleh X1, X2,...,
Xm
dan Y1, Y2,...,Yp masing-masing
dinyatakan sebagai berikut :
buah pasangan kombinasi linear yang
dibentuk oleh peubah penduga dan peubah
respon. Kombinasi linear Uq dan Vq
digunakan untuk mencari korelasi kanonik,
yakni dengan menentukan pasangan
kombinasi linear yang memiliki sifat U1 dan
V1 terbesar korelasinya, korelasi U2 dan V2
terbesar kedua dan tidak berkorelasi dengan
pasangan kanonik pertama, korelasi U3 dan
V3 terbesar ketiga dan tidak berkorelasi
dengan pasangan kanonik pertama dan
kedua, Demikian seterusnya untuk semua
pasangan yang mungkin yang banyaknya
adalah q = min (m, p).
Korelasi antara U dan V yang
dinyatakan sebagai fungsi a' dan b'
dirumuskan sebagai berikut :
a ' XY b
CorrU ,V
a ' XX a b ' YY b
dimana :
a = vektor koefisien pembobot peubah
kanonik X
a ' = transpose vektor koefisien pembobot
peubah kanonik X
b = vektor koefisien pembobot peubah
kanonik Y
b ' = transpose vektor koefisien pembobot
XY
peubah kanonik Y
= matriks koragam gugus peubah X
XX
dan gugus peubah Y
= matriks ragam dari peubah X
YY
= matriks ragam dari peubah Y
Dengan menggunakan ketaksamaan
Cauchy
Schwarz
diperoleh
2
2
2
yang
merupakan
akar ciri
1 2 ... p
dari
matriks
(eigenvalues)
1 / 2
1
1 / 2
yang
XX
XY
YY
YX
XX
berpadanan dengan vektor ciri e1, e2, ..., ep,
selain itu 1 2 2 2 ... p 2 juga merupakan
akar
ciri
dari
matriks
1 / 2
1
1 / 2
yang
YY
YX
XX
XY
YY
X* = a1X1 + a2X2+ ... + am Xm
berpadanan dengan vektor f1, f2, ..., fp.
Y* = b1Y1 + b2Y2 + ... + bp Yp
Dalam bentuk vektor kombinasi linear
peubah X dan peubah Y dituliskan Johnson dan
Wichern (1982) sebagai berikut :
U = a'X
V = b'Y
Pasangan U dan V
disebut peubah
kanonik. Jika q minimum di antara m dan p,
ditulis q = min (m,p), yang berarti sebanyak q
Vektor a dan b diperoleh dari persamaan
berikut :
ai ei XX1/ 2
'
'
1/ 2
bi f i YY
Akar positif dari eigen value i2 adalah
| i| yang merupakan koefisien korelasi
kanonik antara variabel kanonik Uq dan Vq
(Gittins,1985)
BAHAN DAN METODE
Bahan
Data yang digunakan dalam penelitian ini
adalah data mahasiswa USMI angkatan 42 dan
43 sebanyak 3281 data mahasiswa dengan 28
peubah, yaitu 4 peubah nilai rapor SMU, 6
peubah latar belakang mahasiswa, 14 peubah
nilai mata kuliah TPB, dan 4 peubah nilai
Indeks Prestasi. Data nilai akademik mahasiswa
yang tidak lengkap tidak diikutsertakan dalam
penelitian ini. Berikut adalah peubah-peubah
yang diamati dalam penelitian ini.
a. Nilai rapor SMU terdiri dari :
1. Matematika
2. Fisika
3. Kimia
4. Biologi
b. Latar belakang mahasiswa terdiri dari :
1. Jenis Kelamin
2. Pendidikan Ayah
3. Pekerjaan Ayah
4. Daya Listrik
5. Penghasilan Ayah
6. Asal Daerah
c. Nilai mata kuliah TPB terdiri dari :
1. Agama
2. Biologi
3. Ekonomi Umum
4. Fisika
5. Bahasa Indonesia
6. Bahasa Inggris
7. Kalkulus
8. Kimia
9. Kewirausahaan
10. Matematika
11. Olahraga & Seni
12. PIP
13. PKN
14. Sosiologi Umum
d. Nilai Indeks Prestasi mahasiswa terdiri dari :
1. IPK TPB
2. IP Semester 3
3. IP Semester 4
4. IP Semester 5
Metode
Langkah-langkah yang akan dilakukan
dalam penelitian ini adalah sebagai berikut :
1. Melakukan eksplorasi data berupa
persiapan data (data preparation) dan
pengurangan data (data reduction).
2. Melakukan uji korelasi terhadap nilai
rapor SMU dan IPK TPB.
3. Melakukan
analisis
chi-square
kemudian
analisis
korespondensi
untuk melihat hubungan antara latar
belakang
mahasiswa
dengan
prestasi akademik saat TPB .
4. Melakukan analisis gerombol untuk
mengelompokkan
asal
daerah
mahasiswa berdasarkan nilai indeks
prestasi TPB.
5. Melakukan
analisis
korelasi
kanonik untuk melihat keterkaitan
antara nilai akademik mata kuliah
di TPB dengan prestasi mahasiswa
setelah masuk departemen dilihat
dari Indeks Prestasinya.
6. Interpretasi dan kesimpulan hasil
analisis.
Software yang digunakan dalam
penelitian ini adalah MS. Excel 2003, SPSS
13.0, Minitab 14 dan SAS 9.1.
HASIL DAN PEMBAHASAN
Deskripsi Mahasiswa Berdasarkan Latar
Belakang
Jumlah data yang digunakan dalam
penelitian ini adalah sebanyak 3281 data
mahasiswa USMI dengan rincian data
mahasiswa angkatan 42 sebanyak 1532
record dan data mahasiswa angkatan 43
sebanyak 1749 record. Data persentase dari
peubah latar belakang mahasiswa yang
digunakan untuk menjelaskan karakteristik
mahasiswa disajikan pada Tabel 1 di bawah
ini :
Tabel 1 Persentase data latar belakang
mahasiswa angkatan 42 & 43
No
1
2
3
Angkt.
42
Angk.
43
Jenis Kelamin
Laki-Laki
Perempuan
41.7
58.3
39.9
60.1
Pendidikan Ayah
SD kebawah
SLTP
SLTA
Diploma
Sarjana (S1/S2/S3)
11.2
7.5
37.2
13.2
29.3
9.9
7.3
36.1
12.8
32.8
1.7
1.1
35.3
2.8
35.1
2.5
2.1
0.7
12.7
5.5
3.8
19.7
1.1
0.1
Peubah
Tidak Mengisi
Pekerjaan Ayah
Pegawai Negeri
TNI/POLRI
Pensiunan Pegawai
Negeri
Wiraswasta
Purnawirawan
Eksekutif
No
Angkt.
42
Angk.
43
0.5
21.7
0.4
4.5
0.1
3.3
0.9
12.5
0.3
4.5
3.9
5.7
4.1
6.3
3.7
6.2
29.8
45.8
15.7
5.3
0.9
26.0
46.0
18.2
6.6
1.1
> 2200 Watt
1.8
2.1
Tidak Mengisi
Penghasilan Ayah
< 500.000
500.001 - 1.000.000
1.000.001 – 2.500.000
2.500.001 – 5.000.000
> 5.000.000
0.6
0.1
7.3
15.9
51.2
19.5
4.8
7.1
14.3
45.3
26.5
6.7
1.2
0.1
Peubah
Pekerjaan Ayah
Profesional
Karyawan Swasta
Rohaniawan
Petani/Nelayan
Buruh
BUMN
4
5
Lainnya
Tidak Mengisi
Daya Listrik
< 450 Watt
450 Watt
900 Watt
1300 Watt
2200 Watt
Tidak Mengisi
Pada data mahasiswa angkatan 42 yang
memulai sistem mayor minor, terjadi penurunan
pada
jumlah
mahasiswa
dibandingkan
mahasiswa phasing out yang berjumlah lebih
dari 1700 mahasiswa. Berdasarkan Tabel 1
untuk angkatan 42, dari 1532 mahasiswa,
mayoritas memiliki latar belakang pendidikan
orang tua SLTA yaitu sebesar 570 (37.2%),
diikuti pendidikan sarjana (S1/S2/S3) sebanyak
448 (29.3%), sedangkan latar belakang
pekerjaan orang tua yang terbesar adalah
pegawai negeri yaitu sebanyak 541 (35.3%)
diikuti karyawan swasta sebanyak 333 (21.7%)
dan purnawirawan sebanyak 194 (12.7%).
Mahasiswa yang mengisi memiliki daya listrik
sebesar 450 Watt tercatat sebanyak 701 (45.8%)
dan sebanyak 785 (51.2%) mengisi penghasilan
orang tua antara Rp. 1.000.001 - 2.500.000,-.
Sedangkan mahasiswa angkatan 43 tercatat
1749 jumlah mahasiswa, sebanyak 632 (36.1%)
memiliki latar pendidikan orang tua SLTA
diikuti pendidikan sarjana (S1/S2/S3) sebanyak
574 (32.8%). Latar belakang pekerjaan orang
tua terbesar adalah pegawai negeri yaitu
sebanyak 614 (35.1%), diikuti wiraswasta
sebanyak 344 (19.7%) dan karyawan swasta
sebanyak 219 (12.5%). Mahasiswa yang
mengisi memiliki daya listrik sebesar 450
Watt tercatat sebanyak 804 (46%) dan
sebanyak 793 (45.3%) mengisi penghasilan
orang tua antara Rp. 1.000.001 - 2.500.000,-.
Pada kedua angkatan dapat dilihat bahwa
persentase mahasiswa perempuan lebih
tinggi dibandingkan mahasiswa laki-laki.
Pada angkatan 42 dan 43 secara berturutturut jumlah mahasiswa perempuan adalah
sebanyak 893 (58.3%) dan 1052 (60.1%).
Tabel
2 Persentase data asal daerah
mahasiswa angkatan 42 & 43
Asal Daerah
Angkt. 42 Angkt. 43
NAD
0.7
1.0
Sumatera Utara
4.9
5.5
Sumatera Barat
4.4
3.1
Riau
0.7
0.5
Jambi
1.3
1.2
Sumatera Selatan
1.4
1.1
Bengkulu
1.0
0.9
Lampung
2.0
2.2
Bangka
0.0
0.3
0.0
Banten
5.3
DKI Jakarta
12.8
13.7
Jawa Barat
46.0
40.0
Jawa Tengah
14.5
13.7
DIY
0.4
0.3
Jawa Timur
6.8
7.1
Bali
0.2
0.4
NTB
0.6
0.7
NTT
0.1
0.3
Kalimantan
0.4
0.6
Sulawesi
1.1
1.3
Papua
0.4
0.3
Luar Negeri
0.3
0.2
Pada Tabel 2 dapat dilihat bahwa asal
daerah mahasiswa untuk tiap angkatan
didominasi dari daerah Jawa Barat. Pada
angkatan 42 tercatat sebanyak 704 (46%)
mahasiswa asal Jawa Barat sedangkan pada
angkatan 43 sebanyak 700 (40%) mahasiswa
asal Jawa Barat. Daerah asal terbesar
berikutnya adalah Jawa Tengah dan DKI
Jakarta. Pada angkatan 42 daerah Bangka
masih bergabung dengan Sumatera Selatan
dan Banten masih bergabung dengan Jawa
Barat.
Hubungan Nilai Raport SMU dan
Indeks Prestasi Kumulatif TPB
Hubungan antara rata-rata nilai rapor SMU
(semester 1 sampai dengan 5) dan IPK TPB
mahasiswa dapat diketahui melalui uji korelasi
Pearson. Tabel korelasi rata-rata antara nilai
rapor SMU dan IPK TPB disajikan pada Tabel
3 berikut.
Tabel 3 Korelasi Pearson antara nilai rapor
SMU dengan IPK TPB
IPK TPB
Rapor SMU
Angkatan 42 Angkatan 43
Matematika
0.2136
0.1588
Fisika
0.136
0.1204
Kimia
0.219
0.1958
Biologi
0.1372
0.1524
Dari hasil korelasi Pearson per angkatan
yang dilakukan antara nilai rapor SMU yaitu
nilai Matematika, Fisika, Biologi, dan Kimia
dengan nilai IPK TPB didapatkan koefisien
korelasi yang sangat kecil, hanya berkisar 0.1
hingga 0.2 dengan nilai probabilitas lebih kecil
dari α = 5%. Korelasi yang kecil bisa
disebabkan karena nilai SMU mahasiswa USMI
kurang beragam atau cenderung homogen
disekitar nilai antara 70 hingga 80. Hal ini
dapat pula dilihat pada gambar boxplot nilai
rapor SMU (semester 1 sampai dengan 5) untuk
mata pelajaran Matematika, Fisika, Kimia, dan
Biologi per angkatan pada Lampiran 1.
Hubungan IPK TPB dan Latar
Belakang Mahasiswa
Pada penelitian ini, Indeks Prestasi
Kumulatif
(IPK)
TPB
mahasiswa
diklasifikasikan secara subjektif menjadi lima
kategori, yaitu : IPK< 2.00, 2.00≤IPK