28617 senasif fardan akhriza evy
Seminar Nasional Sistem Informasi 2017, 14 September 2017
Fakultas Teknologi Informasi – UNMER Malang
ANALISIS KESENJANGAN ANTARA TOPIK SKRIPSI MAHASISWA DAN TOPIK
RISET DI PUBLIKASI ILMIAH
Fardanuddin Sufyan1), Tubagus Mohammad Akhriza2), Evy Sophia3)
1)
Sistem Informasi, STMIK Pradnya Paramita (STIMATA) Malang
Email : [email protected]
2)
Teknik Informatika, STMIK Pradnya Paramita (STIMATA) Malang
Email : [email protected]
3)
Sistem Informasi, STMIK Pradnya Paramita (STIMATA) Malang
Email : [email protected]
Abstrak
Tingkat penyerapan mahasiswa terhadap perkembangan teknologi dapat diamati salah satunya dari
topik skripsi yang diambil oleh mahasiswa dimaksud. Permasalahan yang sering dihadapi oleh
perguruan tinggi adalah bagaimana metode yang secara efektif dan efisien mampu mengukur
kesenjangan antara topik skripsi mahasiswa dengan perkembangan teknologi terkini. Penelitian ini
mengusulkan metode untuk mengukur kesenjangan dimaksud dengan cara membandingkan topik
skripsi dengan topik yang diangkat di publikasi ilmiah baik nasional maupun internasional. Metode
yang digunakan adalah association rule mining, dimana kata-kata yang paling sering disebut
(frequent termset) di dalam abstrak skripsi dan abstrak riset yang di publikasi ilmiah dieksploitasi.
Dari frequent termset yang dikumpulkan, hubungan antara satu kata dengan yang lain ditemukan,
untuk kemudian, perbedaan antara topik yang dibahas di dalam skripsi dengan yang diangkat oleh
publikasi ilmiah dianalisis dan disimpulkan. Hasil analisis akan menunjukkan topik yang sering
diangkat pada skripsi namun topik tersebut tidak pernah diangkat di riset, dan sebaliknya.
Kata kunci: association rule, data mining, topik skripsi, topik publikasi ilmiah
Abstract
The level of student absorption on technological developments can be observed through their
choice on their thesis topics. The problems commonly faced by universities are how to effectively
and efficiently measure the gap between students' thesis topics and the latest technological
development. This research proposes a method to measure the gap by comparing the students’
research topics with the scientific publication topics both nationally and internationally. The
method used is association rule mining, where the most frequent words (frequent termset) in
abstracts of the thesis and abstracts of scientific publications are exploited. From the frequent
termset collected, the relationship between one word and the others is found, to then, the difference
between the topics discussed in the thesis with those raised by the scientific publications is
analyzed and summarized. The result of the analysis will show the topics usually found in thesis but
rarely found in published researches and vice versa.
Keyword: association rule, data mining, thesis topics, scientific publication topics.
Copyright © SENASIF 2017
ISSN : 2597 - 4696
504
Seminar Nasional Sistem Informasi 2017, 14 September 2017
Fakultas Teknologi Informasi – UNMER Malang
(2017) dan litecky dkk (2010) menggunakan
PENDAHULUAN
iklan
Secara global, tugas perguruan tinggi
lowongan
kerja
sebagai
sumber
ada 3 yang tertuang dalam tri dharma, yaitu
informasi mengenai skillset yang dibutuhkan
1) pendidikan dan pengajaran 2) penelitian
oleh industry TIK. Di penelitian lain, Son
dan
pengabdian
dkk (2015) menggunakan social media
masyarakat (Djojodibroto, 2004). Salah satu
sebagai sumber informasi perkembangan
tugas perguruan tinggi adalah penelitian dan
TIK yang mutakhir. Para peneliti tersebut
pengembangan yang dilakukan oleh dosen
menggunakan
dan mahasiswa. Penelitan mahasiswa dapat
visualisasi informasi untuk menggambarkan
dilihat dari hasil skripsi mereka. Selain itu
kesenjangan antara topik penelitian dengan
penelitian mahasiswa melalui skripsi juga
topik yang dibicarakan di jejaring social
merupakan tolak ukur tingkat penyerapan
media.
pengembangan
3)
Artikel
kampus terhadap perkembangan teknologi
teknik
ini
clustering
mengusulkan
dan
metode
yang terjadi saat ini. Namun demikian
untuk mengukur kesenjangan antara topik
perkembangan
penelitian
teknologi
informasi
dan
skripsi
mahasiswa
dengan
komunikasi (TIK) begitu cepat dan massif,
perkembangan TIK mutakhir dengan cara
dan masih sulit bagi mahasiswa khususnya
membandingkan
program
mengikuti
abstrak riset yang di publikasi ilmiah baik
Sebagai
jurnal maupun prosiding konferensi. Dataset
Sarjana
perkembangan
TIK
untuk
dimaksud.
abstrak
skripsi
dengan
akibatnya,
terjadi
kesenjangan
antara
skripsi mahasiswa program Sarjana diambil
penelitian
skripsi
mahasiswa
dengan
dari STMIK Pradnya Paramita Malang
(STIMATA), sedangkan dataset abstrak riset
perkembangan TIK.
Permasalahan yang sering dihadapi
dikumpulkan dari IEEE Explore. Pendekatan
oleh perguruan tinggi adalah bagaimana
eksploitasi Association Rule (AR mining)
metode yang secara efektif dan efisien
digunakan untuk menemukan hubungan kata-
mampu
kata yang sering muncul (frequent termset)
penelitian
mengukur
skripsi
kesenjangan
mahasiswa
antara
dari kedua dataset tersebut.
dengan
Hasil implementasi metode yang
perkembangan TIK terkini.
Di sisi lain, informasi mengenai
diusulkan berhasil menemukan topik-topik
perkembangan TIK dapat diperoleh dari
penelitian yang sering dibahas di jurnal dan
berbagai sumber. Penelitian Akhriza dkk
prosiding konferensi namun belum pernah
Copyright © SENASIF 2017
ISSN : 2597 - 4696
505
Seminar Nasional Sistem Informasi 2017, 14 September 2017
Fakultas Teknologi Informasi – UNMER Malang
dibahas di penelitian skripsi mahasiswa; dan
ditemukan,
sebaliknya.
asosiasi
barulah
yang
dicari
aturan
memenuhi
syarat
minimum untuk confidence dengan
KAJIAN LITERATUR
menghitung
Association rule
asosiatif A → B.
bagaimana
suatu
diperoleh dari rumus berikut.
ntara data atau
kelompok
aturan
Nilai confidence dari aturan A → B
Association rules digunakan untuk
menemukan hubungan di
confidence
Confidence = P (B|A) = ∑ Transaksi mengandung A dan B
data
∑ Transaksi mengandung A
mempengaruhi suatu keberadaan data yang
Apriori
lain. Metode ini dapat membantu mengenali
Apriori
adalah
algoritma
yang
pola-pola tertentu di dalam kumpulan data
digunakan
yang besar. Dalam association rules, suatu
frequent itemset untuk mendapatkan aturan
kelompok item dinamakan itemset. Support
asosiasi. Sesuai dengan namanya, algortima
dari itemset X adalah persentase transaksi di
ini menggunakan prior knowledge mengenai
D yang mengandung X, biasa ditulis dengan
frequent
supp(X).
diketahui
Metodologi dasar analisis asosiasi terbagi
informasi selanjutnya. Apriori menggunakan
menjadi dua tahap:
pendekatan secara iterative yang disebut juga
1. Analisis pola frekuensi tinggi
dalam
itemset
melakukan
properties
sebelumnya
pencarian
yang
telah
untuk memproses
sebagai level-wish search dimana k-itemset
Tahapan ini mencari kombinasi item
digunakan untuk mencari (k+1)- itemset.
yang memenuhi syarat minimum dari
Pertama-tama dicari set dari frequent 1-
nilai support dalam database. Nilai
itemset, set ini dinotasikan sebagai L1. L1
support sebuah item diperoleh dengan
yaitu large itemset pertama yang digunakan
rumus berikut.
untuk menemukan L2, kemudian set dari
Support (A) = Jumlah Transaksi Mengandung A
frequent
Total Transaksi
2-itemset
digunakan
untuk
Sementara itu, nilai support dari 2
menemukan L3, dan seterusnya sampai tidak
item diperoleh dari rumus 2 berikut.
ada lagi frequent k-itemset yang dapat
ditemukan. Large itemset adalah itemset
Support (A,B) = ∑ Transaksi mengandung A dan B
yang sering terjadi atau itemset-itemset yang
∑ Transaksi
sudah melewati batas minimum support yang
2. Pembentukan aturan asosiasi Setelah
semua
pola
frekuensi
telah ditentukan.
tinggi
Copyright © SENASIF 2017
ISSN : 2597 - 4696
506
Seminar Nasional Sistem Informasi 2017, 14 September 2017
Fakultas Teknologi Informasi – UNMER Malang
hubungan keterkaitan topik satu dengan yang
Adapun dua proses utama yang dilakukan
lain belum ditemukan.
dalam algoritma apriori, yaitu:
1. Join (penggabungan). Pada proses ini
Son dkk, (2015) pada jurnal yang
setiap item dikombinasikan dengan
berjudul Visualization of e-Health Research
item yang lainnya sampai tidak
Topics and Current Trends Using Social
terbentuk kombinasi lagi.
Network Analysis [6]. penelitian ini bertujuan
2. Prune (pemangkasan). Pada proses
untuk secara kritis meninjau topik penelitian
ini, hasil dari item yang telah
utama dan tren internasional e-kesehatan
dikombinasikan tadi lalu dipangkas
melalui analisis jaringan sosial. Dalam
dengan
penelitian
menggunakan
minimum
ini
menggunakan
pendekatan
clusterring atau pengelompokan.
support yang telah ditentukan oleh
Penelitian tentang kesenjangan yang
user.
dilakukan oleh Akhriza dkk (2017), Litecky
Metode Penemuan Kesenjangan
Akhriza dkk, (2017) pada jurnalnya
dkk, (2010) dan Son dkk (2015) belum
Revealing The Gap Between Skillset Of
mengukur frequent termset atau himpunan
Student And Evolving Skills Required By The
kata yang ada di dalam abstrak. Mereka
Industry
And
hanya fokus mengukur kesenjangan metode
Communication Technology dan juga Litecky
dangan menggunakan frequent itemset dan
Mining
belum menggunakan Assocition Rule (AR
dkk,
Of
(2010)
Information
pada
jurnalnya
ini
Mining), padahal association rule dapat
memiliki kesamaan yaitu mengeksploitasi
mengungkapkan hubungan topik yang satu
lowongan kerja yang dibutuhkan industri
dengan yang lain.
Computing
Jobs
kedua
penelitian
Maka
sebagai acuan perkembangan TIK, namun
diusulkan
penelitian
ini
untuk
mengungkapkan
yang membedakan, pada jurnal Akhriza dkk,
bertujuan
memiliki tujuan lain yaitu
kesenjangan tersebut dengan menggunakan
menemukan
siswa
Association Rule (AR Mining), dimana kata-
dengan keterampilan yang dibutuhkan pihak
kata yang paling sering muncul (frequent
industri, sehingga pihak sekolah atau kampus
termset) di dalam abstrak skripsi dan abstrak
bisa melakukan evaluasi terhadap kurikulum
riset dieksploitasi. Dari frequent termset yang
yang
dikumpulkan, hubungan antara satu kata
kesenjangan
ada.
antara
keterampilan
Namun
penelitian
ini
dengan
menggunakan frequent itemset saja, sehingga
Copyright © SENASIF 2017
yang
lain
ditemukan,
ISSN : 2597 - 4696
507
untuk
Seminar Nasional Sistem Informasi 2017, 14 September 2017
Fakultas Teknologi Informasi – UNMER Malang
kemudian, perbedaan antara topik yang
Proses ke-1 unduh abstrak skripsi dan
dibahas di dalam skripsi dengan yang
abstrak riset. Pada proses ke-1 file
diangkat oleh publikasi ilmiah dianalisis dan
abstrak di simpan dalam bentuk .txt.
disimpulkan. Dari hasil simpulan tersebut,
Pada proses ke-2 setelah abstrak
maka dibandingkan dan dihasilkan topik
sudah dalam bentuk .txt dilanjutkan
yang sering diangkat di skripsi, namun tidak
dengan proses pre-processing yaitu
pernah
sudah
pembersihan stopword dan tanda baca
dipublikasi dan sebaliknya, topik yang tidak
pada abstrak. Sehingga abstrak berisi
pernah diangkat di skripsi, namun sudah
inti dari pembahasan skripsi dan riset
sering diangkat di riset.
jurnal.
diangkat
di
riset
yang
Dari proses pre-processing berlanjut
METODE PENELITIAN
ke proses ke-3 yaitu menjalankan
Framework Penelitian
aplikasi apriori, dengan menentukan
kerangka
kerja
penelitian
framework pada Gambar 1.
ini
seperti
ambang batasnya itu minsupp dan
Angka yang
minconf yang diinginkan.
tertera pada gambar adalah urutan alur proses
penelitian.
Setelah proses aplikasi Apriori, maka
proses ke-4 menghasilkan frequent
Mulai
termset dari aplikasi Apriori.
Unduh abstrak
skripsi
1
Unduh abstrak
artikel
Pre-processing :
Menghilanngkan
stopword dan
tanda baca
2
Pre-processing :
Menghilanngkan
stopword dan
tanda baca
Jalankan apriori:
Input minsupp dan
minconf
3
Jalankan apriori:
Input minsupp dan
minconf
Setelah itu, hasil frequent termset dari
apriori berlanjut ke tahap selanjutnya
proses
ke-5
yaitu
analisis
kesenjangan antara topik skripsi dan
topik riset. fokus disini adalah untuk
Himpunan apriori
4
menemukan yang kata kunci sebelah
Himpunan apriori
kirinya adalah sistem informasi, yang
5.
Analisis
kesenjangan
antara topik skripsi
dan topik riset di
publikasi ilmiah
disebut kesenjangan atau gap adalah
seberapa banyak kata yang tidak sama
6.
Hasil dan
pembahasan
antara topik skripsi dan topik riset.
Selesai
Gambar 1. Kerangka kerja penelitian
Selanjutnya
proses
ke-6,
maka
diperoleh hasil analisis kesenjangan
sehingga terlihat topik keterkaitan
Copyright © SENASIF 2017
ISSN : 2597 - 4696
508
Seminar Nasional Sistem Informasi 2017, 14 September 2017
Fakultas Teknologi Informasi – UNMER Malang
topik yang dibahas. Dan akan terlihat
digunakan sebagai acuan untuk menentukan
topik yang sering gunakan di skripsi,
pola tertentu.
namun tidak pernah digunakan di
Jika filtering sudah dilakukan dengan
riset ataupun topik yang jarang
menggunakan kata kunci dan diperoleh hasil,
diangkat
maka selanjutnya dilakukan pembandingan
tetapi
menarik
untuk
antara hasil filtering data skripsi dan filtering
dibahas.
abstrak publikasi. Dalam penelitian ini
Rancangan Eksperimen
Data abstrak yang digunakan pada
pembandingan
menggunakan
operasi
penelitian ini ada dua macam, yaitu data
matematika, yaitu irisan, sehingga dapat
abstrak skripsi dan data abstrak riset yang di
mengungkap topik yang sering digunakan di
publikasi. Data abstrak skripsi diperoleh
riset, namun tidak pernah digunakan pada
abstrak skripsi program sarjana dari STMIK
skripsi dan topik yang sering digunakan di
PPKIA
skripsi, namun belum pernah digunakan di
Pradnya
Paramita
Malang
(STIMATA) prodi sistem informasi dengan 5
riset.
hal
tersebut
dapat
mengungkap
periode terakhir dan data abstrak riset
kesenjangan dengan membandingkan topik
diperoleh dari situs www.ieee.com dengan
yang dibahas.
kata kunci "Information System" filter tahun
HASIL PENELITIAN DAN
2012-2017, dan artikel yang diambil hanya
PEMBAHASAN
yang dipublikasi di Jurnal dan Konferensi
Hasil dari penelitian ini dapat di lihat
yang diindeks oleh IEEE Explore.
dari tabel berikut. Pada Tabel 1 adalah hasil
Pada penelitian ini, ambang batas
filtering dari frequent termset AR mining
data abstrak skripsi diatur minsupp 3 dan
data abstrak skripsi. Pada tabel tersebut ada
minconf 30% dan pada data abstrak riset
dengan minsupp 10 dan minconf
setelah
itu
pada
data
abstrak
pembahasan scaffolding android informasi
50%,
sistem (3, 33.3333) pada abstrak skripsi,
skripsi
artinya jika mahasiswa membahas android,
mengambil fokus pencarian kata kunci
“sistem informasi”, “sistem penunjang”,
system dan informasi, maka mahasiswa juga
“sistem berbasis” dan “database”, dan pada
pasti
abstrak publikasi focus pencarian pada kata
kunci
“system
information”,
“decision
support”, “database” dan “web”. Filtering
Copyright © SENASIF 2017
membahas
scaffolding.
Angka
didalam
kurung
adalah
support,
yaitu
menunjukkan
keseluruhan
dari
mahasiswa
tentang
total
menunjukkan
bahwa
pembahasan
scaffolding
ISSN : 2597 - 4696
509
3
dengan
Seminar Nasional Sistem Informasi 2017, 14 September 2017
Fakultas Teknologi Informasi – UNMER Malang
android, system dan informasi muncul secara
persyaratan
dan
solusi
melalui
upaya
bersamaan yaitu sebanyak 3 kali. Sedangkan
kolaboratif dari antar tim fungsional dan
angka 33.3% adalah confidence, artinya, ada
klien. Dan ada juga pemabahasan health
confidence (peluang) sebesar 33.3% bahwa
decision performance information (10, 50),
orang yang membahas android informasi
hal ini memberi penilaian baru, bahwa sistem
juga membahas scaffolding. Pembahasan
keputusan bukan hanya berhubungan dengan
yang sejenis dg ini bisa menyesuaikan..
bidang industri saja, namun juga bias masuk
scaffolding sendiri adalah suatu struktur
di bidang kesehatan.
Tabel 1. Hasil filtering data abstrak skripsi
sementara yang digunakan untuk menyangga
manusia dan material dalam konstruksi atau
No.
perbaikan gedung dan bangunan-bangunan
1
besar lainnya. Pembahasan tersebut notabene
Hasil
scaffolding android informasi
sistem (3, 33.3333)
tidak ada hubungannya dengan TIK, namun
2
penelitian mahasiswa melalui skripsi sudah
bigbluebutton website pendukung
sistem (3, 33.3333)
membahas hal tersebut. Terlihat juga ada
3
seo saw pemilihan additive
pembahasan seo saw pemilihan additive
simple pendukung keputusan sistem
simple pendukung keputusan sistem (3,
(3, 33.3333)
33.3333), penggabungan seo atau search
4
engine optimization dengan metode saw atau
(3, 66.6667)
simple additive weighting. Penggabungan
5
tersebut bisa dibilang jarang terjadi.
ahp pengambilan penunjang
keputusan sistem (3, 66.6667)
Pada Tabel 2 adalah hasil filtering
6
dari frequent termset AR mining data abstrak
riset. Pada pembahasan tersebut
saw gerabah pendukung sistem
akademik ahp penunjang
keputusan sistem (3, 33.3333)
terdapat
agile software development systems
system information (10, 50). Pembahasan
Agile
dan
system
information
Tabel 1. Tabel lanjutan
dapat
No
dikatakan banyak dibahas dan confidence nya
7
terbilang tinggi 50%. Agile adalah sebuah
Hasil
sms android informasi sistem (3,
33.3333)
metode dari beberapa kumpulan prinsip
8
untuk pengembangan software di mana
geografis website mysql
informasi sistem (3, 66.6667)
Copyright © SENASIF 2017
ISSN : 2597 - 4696
510
Seminar Nasional Sistem Informasi 2017, 14 September 2017
Fakultas Teknologi Informasi – UNMER Malang
Dari hal ini kita dapat mengambil
Tabel 2. Hasil filtering data abstrak riset
No
1
simpulan kesenjangan antara kedua topik,
yaitu topik skripsi dan topik publikasi.
Hasil
agile software development
Tabel 3. hasil kesenjangan abstrstrak skripsi
systems system information (10, 50)
2
3
4
5
6
communication realize system
dan abstrak riset
information (10, 50)
No
Hasil
health decision performance
1
Agile
information (10, 50)
2
Hierarchy
mapping web software system
3
Evaluate
information (11, 54.5455)
4
Communication
hierarchy assessment risk process
5
Resources
system information (11, 63.6364)
6
Resources
analysis decisionmaking system
7
Study
information (13, 69.2308)
Tabel 4. hasil kesenjangan riset dan skripsi
Tabel
selanjutnya
menjelaskan
No
Hasil
tentang kesenjangan antara topik skripsi dan
1
Scaffolding
topik riset yang di publikasi.seperti Pada
2
Bigbluebutton
Tabel 3 menjelaskan tentang topik yang
3
Administrasi
dibahas publikasi, namun
tidak pernah di
4
Fuzzy
angkat pada skripsi, seperti metodologi
5
Seo
penelitian TIK semacam Agile software
6
Mysql
development yang ternyata sudah banyak
7
Ahp
dipakai di publikasi.
Pada Tabel 4 menjelaskan tentang
KESIMPULAN DAN SARAN
topik yang dibahas pada skripsi, namun
Kesimpulan
tidak ada pada topik publikasi, seperti
Dari hasil penelitian terhadap analisis
Bigbluebutton tidak pernah dibahas pada
kesenjangan antara topik skripsi dan topik
publikasi.
riset
Copyright © SENASIF 2017
yang
di
pulikasi
menggunakan
ISSN : 2597 - 4696
511
Seminar Nasional Sistem Informasi 2017, 14 September 2017
Fakultas Teknologi Informasi – UNMER Malang
Apotek Setya Sehat Semarang)
Journal Of Informatics And
Technology, vol. 2, no. 2, pp. 22 28, 2013.
Djojodibroto, R. D,. 2004. Tradisi
Kehidupan
Akademik.
Galang
Press. Yogyakarta.
Hernanda, Fikhri. 2016, “Agile Software
Development, salah satu metode
pengembangan perangkat lunak”,
https://www.dictio.id/t/agilesoftware-development-salah-satumetode-pengembangan-perangkatlunak/3242 , diakses 3 agustus
2017.
Kusrini dan Luthfi, E. T. 2009. Algoritma
Data Mining. CV. Andi Offset.
Yogyakarta.
Litecky, C. Aken, A. A. dan J. Nelson.
Mining For Computing Jobs, IEEE
Software 27(1) (2010) 78–85.
Son, Youn-jun., Jeon. Senator, Kang. ByeonGwon, Kim. Sun-Hyung, dan Lee,
Soo-Kyoung. 2015. Visualization of
e-Health Research Topics and
Current Trends Using Social
Network Analysis. Mary Ann
Liebert, Inc. Vol. 21 No. 5.
eksploitasi Association rule (AR Mining)
dapat di simpulkan bahwa:
1. Penelitian
ini
berhasil
mengungkap
kesenjangan antara topik skripsi dan
topik riset yang di publikasi dengan
efektif dan efisien, sehingga hasil analisis
dapat dipergunakan untuk mahasiswa
atau perguruan tinggi ke depan.
2. Pada penelitian ini pula, dapat ditemukan
keterkaitan topik satu dengan yang lain,
sehingga dapat menambah wawasan dan
pengembangan ranah penelitian untuk
selanjutnya.
Saran
Untuk
meningkatkan
keakuratan
hasil, data abstrak skripsi dan abstrak riset
ilmiah dapat ditambahkan lebih banyak lagi.
REFERENSI
Akhriza, T. M. Ma, Y. H. Dan Li. J. H. 2017.
Revealing The Gap Between Skillset
Of Student And Evolving Skills
Required By The Industry Of
Information And Communication
Technology. International Journal
Of Software Engineering And
Knowledge Engineering. Vol 27,
No. 5 2017: 675-698.
Abhiesa,
Alif.
2016,
“Cara
Instal
Bigbluebutton Web Conferencing”,
http://www.noobsgnu.com/2015/06/
cara-instal-bigbluebutton-web.html.
diakses 3 Agustus 2017
Anggraeni, H. D. Saputra, Ragil. Dan
Noranita, Beta. 2013. Aplikasi Data
Mining Analisis Data Transaksi
Penjualan Obat Menggunakan
Algoritma Apriori ( Studi Kasus di
Copyright © SENASIF 2017
ISSN : 2597 - 4696
512
Fakultas Teknologi Informasi – UNMER Malang
ANALISIS KESENJANGAN ANTARA TOPIK SKRIPSI MAHASISWA DAN TOPIK
RISET DI PUBLIKASI ILMIAH
Fardanuddin Sufyan1), Tubagus Mohammad Akhriza2), Evy Sophia3)
1)
Sistem Informasi, STMIK Pradnya Paramita (STIMATA) Malang
Email : [email protected]
2)
Teknik Informatika, STMIK Pradnya Paramita (STIMATA) Malang
Email : [email protected]
3)
Sistem Informasi, STMIK Pradnya Paramita (STIMATA) Malang
Email : [email protected]
Abstrak
Tingkat penyerapan mahasiswa terhadap perkembangan teknologi dapat diamati salah satunya dari
topik skripsi yang diambil oleh mahasiswa dimaksud. Permasalahan yang sering dihadapi oleh
perguruan tinggi adalah bagaimana metode yang secara efektif dan efisien mampu mengukur
kesenjangan antara topik skripsi mahasiswa dengan perkembangan teknologi terkini. Penelitian ini
mengusulkan metode untuk mengukur kesenjangan dimaksud dengan cara membandingkan topik
skripsi dengan topik yang diangkat di publikasi ilmiah baik nasional maupun internasional. Metode
yang digunakan adalah association rule mining, dimana kata-kata yang paling sering disebut
(frequent termset) di dalam abstrak skripsi dan abstrak riset yang di publikasi ilmiah dieksploitasi.
Dari frequent termset yang dikumpulkan, hubungan antara satu kata dengan yang lain ditemukan,
untuk kemudian, perbedaan antara topik yang dibahas di dalam skripsi dengan yang diangkat oleh
publikasi ilmiah dianalisis dan disimpulkan. Hasil analisis akan menunjukkan topik yang sering
diangkat pada skripsi namun topik tersebut tidak pernah diangkat di riset, dan sebaliknya.
Kata kunci: association rule, data mining, topik skripsi, topik publikasi ilmiah
Abstract
The level of student absorption on technological developments can be observed through their
choice on their thesis topics. The problems commonly faced by universities are how to effectively
and efficiently measure the gap between students' thesis topics and the latest technological
development. This research proposes a method to measure the gap by comparing the students’
research topics with the scientific publication topics both nationally and internationally. The
method used is association rule mining, where the most frequent words (frequent termset) in
abstracts of the thesis and abstracts of scientific publications are exploited. From the frequent
termset collected, the relationship between one word and the others is found, to then, the difference
between the topics discussed in the thesis with those raised by the scientific publications is
analyzed and summarized. The result of the analysis will show the topics usually found in thesis but
rarely found in published researches and vice versa.
Keyword: association rule, data mining, thesis topics, scientific publication topics.
Copyright © SENASIF 2017
ISSN : 2597 - 4696
504
Seminar Nasional Sistem Informasi 2017, 14 September 2017
Fakultas Teknologi Informasi – UNMER Malang
(2017) dan litecky dkk (2010) menggunakan
PENDAHULUAN
iklan
Secara global, tugas perguruan tinggi
lowongan
kerja
sebagai
sumber
ada 3 yang tertuang dalam tri dharma, yaitu
informasi mengenai skillset yang dibutuhkan
1) pendidikan dan pengajaran 2) penelitian
oleh industry TIK. Di penelitian lain, Son
dan
pengabdian
dkk (2015) menggunakan social media
masyarakat (Djojodibroto, 2004). Salah satu
sebagai sumber informasi perkembangan
tugas perguruan tinggi adalah penelitian dan
TIK yang mutakhir. Para peneliti tersebut
pengembangan yang dilakukan oleh dosen
menggunakan
dan mahasiswa. Penelitan mahasiswa dapat
visualisasi informasi untuk menggambarkan
dilihat dari hasil skripsi mereka. Selain itu
kesenjangan antara topik penelitian dengan
penelitian mahasiswa melalui skripsi juga
topik yang dibicarakan di jejaring social
merupakan tolak ukur tingkat penyerapan
media.
pengembangan
3)
Artikel
kampus terhadap perkembangan teknologi
teknik
ini
clustering
mengusulkan
dan
metode
yang terjadi saat ini. Namun demikian
untuk mengukur kesenjangan antara topik
perkembangan
penelitian
teknologi
informasi
dan
skripsi
mahasiswa
dengan
komunikasi (TIK) begitu cepat dan massif,
perkembangan TIK mutakhir dengan cara
dan masih sulit bagi mahasiswa khususnya
membandingkan
program
mengikuti
abstrak riset yang di publikasi ilmiah baik
Sebagai
jurnal maupun prosiding konferensi. Dataset
Sarjana
perkembangan
TIK
untuk
dimaksud.
abstrak
skripsi
dengan
akibatnya,
terjadi
kesenjangan
antara
skripsi mahasiswa program Sarjana diambil
penelitian
skripsi
mahasiswa
dengan
dari STMIK Pradnya Paramita Malang
(STIMATA), sedangkan dataset abstrak riset
perkembangan TIK.
Permasalahan yang sering dihadapi
dikumpulkan dari IEEE Explore. Pendekatan
oleh perguruan tinggi adalah bagaimana
eksploitasi Association Rule (AR mining)
metode yang secara efektif dan efisien
digunakan untuk menemukan hubungan kata-
mampu
kata yang sering muncul (frequent termset)
penelitian
mengukur
skripsi
kesenjangan
mahasiswa
antara
dari kedua dataset tersebut.
dengan
Hasil implementasi metode yang
perkembangan TIK terkini.
Di sisi lain, informasi mengenai
diusulkan berhasil menemukan topik-topik
perkembangan TIK dapat diperoleh dari
penelitian yang sering dibahas di jurnal dan
berbagai sumber. Penelitian Akhriza dkk
prosiding konferensi namun belum pernah
Copyright © SENASIF 2017
ISSN : 2597 - 4696
505
Seminar Nasional Sistem Informasi 2017, 14 September 2017
Fakultas Teknologi Informasi – UNMER Malang
dibahas di penelitian skripsi mahasiswa; dan
ditemukan,
sebaliknya.
asosiasi
barulah
yang
dicari
aturan
memenuhi
syarat
minimum untuk confidence dengan
KAJIAN LITERATUR
menghitung
Association rule
asosiatif A → B.
bagaimana
suatu
diperoleh dari rumus berikut.
ntara data atau
kelompok
aturan
Nilai confidence dari aturan A → B
Association rules digunakan untuk
menemukan hubungan di
confidence
Confidence = P (B|A) = ∑ Transaksi mengandung A dan B
data
∑ Transaksi mengandung A
mempengaruhi suatu keberadaan data yang
Apriori
lain. Metode ini dapat membantu mengenali
Apriori
adalah
algoritma
yang
pola-pola tertentu di dalam kumpulan data
digunakan
yang besar. Dalam association rules, suatu
frequent itemset untuk mendapatkan aturan
kelompok item dinamakan itemset. Support
asosiasi. Sesuai dengan namanya, algortima
dari itemset X adalah persentase transaksi di
ini menggunakan prior knowledge mengenai
D yang mengandung X, biasa ditulis dengan
frequent
supp(X).
diketahui
Metodologi dasar analisis asosiasi terbagi
informasi selanjutnya. Apriori menggunakan
menjadi dua tahap:
pendekatan secara iterative yang disebut juga
1. Analisis pola frekuensi tinggi
dalam
itemset
melakukan
properties
sebelumnya
pencarian
yang
telah
untuk memproses
sebagai level-wish search dimana k-itemset
Tahapan ini mencari kombinasi item
digunakan untuk mencari (k+1)- itemset.
yang memenuhi syarat minimum dari
Pertama-tama dicari set dari frequent 1-
nilai support dalam database. Nilai
itemset, set ini dinotasikan sebagai L1. L1
support sebuah item diperoleh dengan
yaitu large itemset pertama yang digunakan
rumus berikut.
untuk menemukan L2, kemudian set dari
Support (A) = Jumlah Transaksi Mengandung A
frequent
Total Transaksi
2-itemset
digunakan
untuk
Sementara itu, nilai support dari 2
menemukan L3, dan seterusnya sampai tidak
item diperoleh dari rumus 2 berikut.
ada lagi frequent k-itemset yang dapat
ditemukan. Large itemset adalah itemset
Support (A,B) = ∑ Transaksi mengandung A dan B
yang sering terjadi atau itemset-itemset yang
∑ Transaksi
sudah melewati batas minimum support yang
2. Pembentukan aturan asosiasi Setelah
semua
pola
frekuensi
telah ditentukan.
tinggi
Copyright © SENASIF 2017
ISSN : 2597 - 4696
506
Seminar Nasional Sistem Informasi 2017, 14 September 2017
Fakultas Teknologi Informasi – UNMER Malang
hubungan keterkaitan topik satu dengan yang
Adapun dua proses utama yang dilakukan
lain belum ditemukan.
dalam algoritma apriori, yaitu:
1. Join (penggabungan). Pada proses ini
Son dkk, (2015) pada jurnal yang
setiap item dikombinasikan dengan
berjudul Visualization of e-Health Research
item yang lainnya sampai tidak
Topics and Current Trends Using Social
terbentuk kombinasi lagi.
Network Analysis [6]. penelitian ini bertujuan
2. Prune (pemangkasan). Pada proses
untuk secara kritis meninjau topik penelitian
ini, hasil dari item yang telah
utama dan tren internasional e-kesehatan
dikombinasikan tadi lalu dipangkas
melalui analisis jaringan sosial. Dalam
dengan
penelitian
menggunakan
minimum
ini
menggunakan
pendekatan
clusterring atau pengelompokan.
support yang telah ditentukan oleh
Penelitian tentang kesenjangan yang
user.
dilakukan oleh Akhriza dkk (2017), Litecky
Metode Penemuan Kesenjangan
Akhriza dkk, (2017) pada jurnalnya
dkk, (2010) dan Son dkk (2015) belum
Revealing The Gap Between Skillset Of
mengukur frequent termset atau himpunan
Student And Evolving Skills Required By The
kata yang ada di dalam abstrak. Mereka
Industry
And
hanya fokus mengukur kesenjangan metode
Communication Technology dan juga Litecky
dangan menggunakan frequent itemset dan
Mining
belum menggunakan Assocition Rule (AR
dkk,
Of
(2010)
Information
pada
jurnalnya
ini
Mining), padahal association rule dapat
memiliki kesamaan yaitu mengeksploitasi
mengungkapkan hubungan topik yang satu
lowongan kerja yang dibutuhkan industri
dengan yang lain.
Computing
Jobs
kedua
penelitian
Maka
sebagai acuan perkembangan TIK, namun
diusulkan
penelitian
ini
untuk
mengungkapkan
yang membedakan, pada jurnal Akhriza dkk,
bertujuan
memiliki tujuan lain yaitu
kesenjangan tersebut dengan menggunakan
menemukan
siswa
Association Rule (AR Mining), dimana kata-
dengan keterampilan yang dibutuhkan pihak
kata yang paling sering muncul (frequent
industri, sehingga pihak sekolah atau kampus
termset) di dalam abstrak skripsi dan abstrak
bisa melakukan evaluasi terhadap kurikulum
riset dieksploitasi. Dari frequent termset yang
yang
dikumpulkan, hubungan antara satu kata
kesenjangan
ada.
antara
keterampilan
Namun
penelitian
ini
dengan
menggunakan frequent itemset saja, sehingga
Copyright © SENASIF 2017
yang
lain
ditemukan,
ISSN : 2597 - 4696
507
untuk
Seminar Nasional Sistem Informasi 2017, 14 September 2017
Fakultas Teknologi Informasi – UNMER Malang
kemudian, perbedaan antara topik yang
Proses ke-1 unduh abstrak skripsi dan
dibahas di dalam skripsi dengan yang
abstrak riset. Pada proses ke-1 file
diangkat oleh publikasi ilmiah dianalisis dan
abstrak di simpan dalam bentuk .txt.
disimpulkan. Dari hasil simpulan tersebut,
Pada proses ke-2 setelah abstrak
maka dibandingkan dan dihasilkan topik
sudah dalam bentuk .txt dilanjutkan
yang sering diangkat di skripsi, namun tidak
dengan proses pre-processing yaitu
pernah
sudah
pembersihan stopword dan tanda baca
dipublikasi dan sebaliknya, topik yang tidak
pada abstrak. Sehingga abstrak berisi
pernah diangkat di skripsi, namun sudah
inti dari pembahasan skripsi dan riset
sering diangkat di riset.
jurnal.
diangkat
di
riset
yang
Dari proses pre-processing berlanjut
METODE PENELITIAN
ke proses ke-3 yaitu menjalankan
Framework Penelitian
aplikasi apriori, dengan menentukan
kerangka
kerja
penelitian
framework pada Gambar 1.
ini
seperti
ambang batasnya itu minsupp dan
Angka yang
minconf yang diinginkan.
tertera pada gambar adalah urutan alur proses
penelitian.
Setelah proses aplikasi Apriori, maka
proses ke-4 menghasilkan frequent
Mulai
termset dari aplikasi Apriori.
Unduh abstrak
skripsi
1
Unduh abstrak
artikel
Pre-processing :
Menghilanngkan
stopword dan
tanda baca
2
Pre-processing :
Menghilanngkan
stopword dan
tanda baca
Jalankan apriori:
Input minsupp dan
minconf
3
Jalankan apriori:
Input minsupp dan
minconf
Setelah itu, hasil frequent termset dari
apriori berlanjut ke tahap selanjutnya
proses
ke-5
yaitu
analisis
kesenjangan antara topik skripsi dan
topik riset. fokus disini adalah untuk
Himpunan apriori
4
menemukan yang kata kunci sebelah
Himpunan apriori
kirinya adalah sistem informasi, yang
5.
Analisis
kesenjangan
antara topik skripsi
dan topik riset di
publikasi ilmiah
disebut kesenjangan atau gap adalah
seberapa banyak kata yang tidak sama
6.
Hasil dan
pembahasan
antara topik skripsi dan topik riset.
Selesai
Gambar 1. Kerangka kerja penelitian
Selanjutnya
proses
ke-6,
maka
diperoleh hasil analisis kesenjangan
sehingga terlihat topik keterkaitan
Copyright © SENASIF 2017
ISSN : 2597 - 4696
508
Seminar Nasional Sistem Informasi 2017, 14 September 2017
Fakultas Teknologi Informasi – UNMER Malang
topik yang dibahas. Dan akan terlihat
digunakan sebagai acuan untuk menentukan
topik yang sering gunakan di skripsi,
pola tertentu.
namun tidak pernah digunakan di
Jika filtering sudah dilakukan dengan
riset ataupun topik yang jarang
menggunakan kata kunci dan diperoleh hasil,
diangkat
maka selanjutnya dilakukan pembandingan
tetapi
menarik
untuk
antara hasil filtering data skripsi dan filtering
dibahas.
abstrak publikasi. Dalam penelitian ini
Rancangan Eksperimen
Data abstrak yang digunakan pada
pembandingan
menggunakan
operasi
penelitian ini ada dua macam, yaitu data
matematika, yaitu irisan, sehingga dapat
abstrak skripsi dan data abstrak riset yang di
mengungkap topik yang sering digunakan di
publikasi. Data abstrak skripsi diperoleh
riset, namun tidak pernah digunakan pada
abstrak skripsi program sarjana dari STMIK
skripsi dan topik yang sering digunakan di
PPKIA
skripsi, namun belum pernah digunakan di
Pradnya
Paramita
Malang
(STIMATA) prodi sistem informasi dengan 5
riset.
hal
tersebut
dapat
mengungkap
periode terakhir dan data abstrak riset
kesenjangan dengan membandingkan topik
diperoleh dari situs www.ieee.com dengan
yang dibahas.
kata kunci "Information System" filter tahun
HASIL PENELITIAN DAN
2012-2017, dan artikel yang diambil hanya
PEMBAHASAN
yang dipublikasi di Jurnal dan Konferensi
Hasil dari penelitian ini dapat di lihat
yang diindeks oleh IEEE Explore.
dari tabel berikut. Pada Tabel 1 adalah hasil
Pada penelitian ini, ambang batas
filtering dari frequent termset AR mining
data abstrak skripsi diatur minsupp 3 dan
data abstrak skripsi. Pada tabel tersebut ada
minconf 30% dan pada data abstrak riset
dengan minsupp 10 dan minconf
setelah
itu
pada
data
abstrak
pembahasan scaffolding android informasi
50%,
sistem (3, 33.3333) pada abstrak skripsi,
skripsi
artinya jika mahasiswa membahas android,
mengambil fokus pencarian kata kunci
“sistem informasi”, “sistem penunjang”,
system dan informasi, maka mahasiswa juga
“sistem berbasis” dan “database”, dan pada
pasti
abstrak publikasi focus pencarian pada kata
kunci
“system
information”,
“decision
support”, “database” dan “web”. Filtering
Copyright © SENASIF 2017
membahas
scaffolding.
Angka
didalam
kurung
adalah
support,
yaitu
menunjukkan
keseluruhan
dari
mahasiswa
tentang
total
menunjukkan
bahwa
pembahasan
scaffolding
ISSN : 2597 - 4696
509
3
dengan
Seminar Nasional Sistem Informasi 2017, 14 September 2017
Fakultas Teknologi Informasi – UNMER Malang
android, system dan informasi muncul secara
persyaratan
dan
solusi
melalui
upaya
bersamaan yaitu sebanyak 3 kali. Sedangkan
kolaboratif dari antar tim fungsional dan
angka 33.3% adalah confidence, artinya, ada
klien. Dan ada juga pemabahasan health
confidence (peluang) sebesar 33.3% bahwa
decision performance information (10, 50),
orang yang membahas android informasi
hal ini memberi penilaian baru, bahwa sistem
juga membahas scaffolding. Pembahasan
keputusan bukan hanya berhubungan dengan
yang sejenis dg ini bisa menyesuaikan..
bidang industri saja, namun juga bias masuk
scaffolding sendiri adalah suatu struktur
di bidang kesehatan.
Tabel 1. Hasil filtering data abstrak skripsi
sementara yang digunakan untuk menyangga
manusia dan material dalam konstruksi atau
No.
perbaikan gedung dan bangunan-bangunan
1
besar lainnya. Pembahasan tersebut notabene
Hasil
scaffolding android informasi
sistem (3, 33.3333)
tidak ada hubungannya dengan TIK, namun
2
penelitian mahasiswa melalui skripsi sudah
bigbluebutton website pendukung
sistem (3, 33.3333)
membahas hal tersebut. Terlihat juga ada
3
seo saw pemilihan additive
pembahasan seo saw pemilihan additive
simple pendukung keputusan sistem
simple pendukung keputusan sistem (3,
(3, 33.3333)
33.3333), penggabungan seo atau search
4
engine optimization dengan metode saw atau
(3, 66.6667)
simple additive weighting. Penggabungan
5
tersebut bisa dibilang jarang terjadi.
ahp pengambilan penunjang
keputusan sistem (3, 66.6667)
Pada Tabel 2 adalah hasil filtering
6
dari frequent termset AR mining data abstrak
riset. Pada pembahasan tersebut
saw gerabah pendukung sistem
akademik ahp penunjang
keputusan sistem (3, 33.3333)
terdapat
agile software development systems
system information (10, 50). Pembahasan
Agile
dan
system
information
Tabel 1. Tabel lanjutan
dapat
No
dikatakan banyak dibahas dan confidence nya
7
terbilang tinggi 50%. Agile adalah sebuah
Hasil
sms android informasi sistem (3,
33.3333)
metode dari beberapa kumpulan prinsip
8
untuk pengembangan software di mana
geografis website mysql
informasi sistem (3, 66.6667)
Copyright © SENASIF 2017
ISSN : 2597 - 4696
510
Seminar Nasional Sistem Informasi 2017, 14 September 2017
Fakultas Teknologi Informasi – UNMER Malang
Dari hal ini kita dapat mengambil
Tabel 2. Hasil filtering data abstrak riset
No
1
simpulan kesenjangan antara kedua topik,
yaitu topik skripsi dan topik publikasi.
Hasil
agile software development
Tabel 3. hasil kesenjangan abstrstrak skripsi
systems system information (10, 50)
2
3
4
5
6
communication realize system
dan abstrak riset
information (10, 50)
No
Hasil
health decision performance
1
Agile
information (10, 50)
2
Hierarchy
mapping web software system
3
Evaluate
information (11, 54.5455)
4
Communication
hierarchy assessment risk process
5
Resources
system information (11, 63.6364)
6
Resources
analysis decisionmaking system
7
Study
information (13, 69.2308)
Tabel 4. hasil kesenjangan riset dan skripsi
Tabel
selanjutnya
menjelaskan
No
Hasil
tentang kesenjangan antara topik skripsi dan
1
Scaffolding
topik riset yang di publikasi.seperti Pada
2
Bigbluebutton
Tabel 3 menjelaskan tentang topik yang
3
Administrasi
dibahas publikasi, namun
tidak pernah di
4
Fuzzy
angkat pada skripsi, seperti metodologi
5
Seo
penelitian TIK semacam Agile software
6
Mysql
development yang ternyata sudah banyak
7
Ahp
dipakai di publikasi.
Pada Tabel 4 menjelaskan tentang
KESIMPULAN DAN SARAN
topik yang dibahas pada skripsi, namun
Kesimpulan
tidak ada pada topik publikasi, seperti
Dari hasil penelitian terhadap analisis
Bigbluebutton tidak pernah dibahas pada
kesenjangan antara topik skripsi dan topik
publikasi.
riset
Copyright © SENASIF 2017
yang
di
pulikasi
menggunakan
ISSN : 2597 - 4696
511
Seminar Nasional Sistem Informasi 2017, 14 September 2017
Fakultas Teknologi Informasi – UNMER Malang
Apotek Setya Sehat Semarang)
Journal Of Informatics And
Technology, vol. 2, no. 2, pp. 22 28, 2013.
Djojodibroto, R. D,. 2004. Tradisi
Kehidupan
Akademik.
Galang
Press. Yogyakarta.
Hernanda, Fikhri. 2016, “Agile Software
Development, salah satu metode
pengembangan perangkat lunak”,
https://www.dictio.id/t/agilesoftware-development-salah-satumetode-pengembangan-perangkatlunak/3242 , diakses 3 agustus
2017.
Kusrini dan Luthfi, E. T. 2009. Algoritma
Data Mining. CV. Andi Offset.
Yogyakarta.
Litecky, C. Aken, A. A. dan J. Nelson.
Mining For Computing Jobs, IEEE
Software 27(1) (2010) 78–85.
Son, Youn-jun., Jeon. Senator, Kang. ByeonGwon, Kim. Sun-Hyung, dan Lee,
Soo-Kyoung. 2015. Visualization of
e-Health Research Topics and
Current Trends Using Social
Network Analysis. Mary Ann
Liebert, Inc. Vol. 21 No. 5.
eksploitasi Association rule (AR Mining)
dapat di simpulkan bahwa:
1. Penelitian
ini
berhasil
mengungkap
kesenjangan antara topik skripsi dan
topik riset yang di publikasi dengan
efektif dan efisien, sehingga hasil analisis
dapat dipergunakan untuk mahasiswa
atau perguruan tinggi ke depan.
2. Pada penelitian ini pula, dapat ditemukan
keterkaitan topik satu dengan yang lain,
sehingga dapat menambah wawasan dan
pengembangan ranah penelitian untuk
selanjutnya.
Saran
Untuk
meningkatkan
keakuratan
hasil, data abstrak skripsi dan abstrak riset
ilmiah dapat ditambahkan lebih banyak lagi.
REFERENSI
Akhriza, T. M. Ma, Y. H. Dan Li. J. H. 2017.
Revealing The Gap Between Skillset
Of Student And Evolving Skills
Required By The Industry Of
Information And Communication
Technology. International Journal
Of Software Engineering And
Knowledge Engineering. Vol 27,
No. 5 2017: 675-698.
Abhiesa,
Alif.
2016,
“Cara
Instal
Bigbluebutton Web Conferencing”,
http://www.noobsgnu.com/2015/06/
cara-instal-bigbluebutton-web.html.
diakses 3 Agustus 2017
Anggraeni, H. D. Saputra, Ragil. Dan
Noranita, Beta. 2013. Aplikasi Data
Mining Analisis Data Transaksi
Penjualan Obat Menggunakan
Algoritma Apriori ( Studi Kasus di
Copyright © SENASIF 2017
ISSN : 2597 - 4696
512