28617 senasif fardan akhriza evy

Seminar Nasional Sistem Informasi 2017, 14 September 2017
Fakultas Teknologi Informasi – UNMER Malang

ANALISIS KESENJANGAN ANTARA TOPIK SKRIPSI MAHASISWA DAN TOPIK
RISET DI PUBLIKASI ILMIAH
Fardanuddin Sufyan1), Tubagus Mohammad Akhriza2), Evy Sophia3)
1)

Sistem Informasi, STMIK Pradnya Paramita (STIMATA) Malang
Email : [email protected]
2)
Teknik Informatika, STMIK Pradnya Paramita (STIMATA) Malang
Email : [email protected]
3)
Sistem Informasi, STMIK Pradnya Paramita (STIMATA) Malang
Email : [email protected]

Abstrak
Tingkat penyerapan mahasiswa terhadap perkembangan teknologi dapat diamati salah satunya dari
topik skripsi yang diambil oleh mahasiswa dimaksud. Permasalahan yang sering dihadapi oleh
perguruan tinggi adalah bagaimana metode yang secara efektif dan efisien mampu mengukur

kesenjangan antara topik skripsi mahasiswa dengan perkembangan teknologi terkini. Penelitian ini
mengusulkan metode untuk mengukur kesenjangan dimaksud dengan cara membandingkan topik
skripsi dengan topik yang diangkat di publikasi ilmiah baik nasional maupun internasional. Metode
yang digunakan adalah association rule mining, dimana kata-kata yang paling sering disebut
(frequent termset) di dalam abstrak skripsi dan abstrak riset yang di publikasi ilmiah dieksploitasi.
Dari frequent termset yang dikumpulkan, hubungan antara satu kata dengan yang lain ditemukan,
untuk kemudian, perbedaan antara topik yang dibahas di dalam skripsi dengan yang diangkat oleh
publikasi ilmiah dianalisis dan disimpulkan. Hasil analisis akan menunjukkan topik yang sering
diangkat pada skripsi namun topik tersebut tidak pernah diangkat di riset, dan sebaliknya.
Kata kunci: association rule, data mining, topik skripsi, topik publikasi ilmiah
Abstract
The level of student absorption on technological developments can be observed through their
choice on their thesis topics. The problems commonly faced by universities are how to effectively
and efficiently measure the gap between students' thesis topics and the latest technological
development. This research proposes a method to measure the gap by comparing the students’
research topics with the scientific publication topics both nationally and internationally. The
method used is association rule mining, where the most frequent words (frequent termset) in
abstracts of the thesis and abstracts of scientific publications are exploited. From the frequent
termset collected, the relationship between one word and the others is found, to then, the difference
between the topics discussed in the thesis with those raised by the scientific publications is

analyzed and summarized. The result of the analysis will show the topics usually found in thesis but
rarely found in published researches and vice versa.
Keyword: association rule, data mining, thesis topics, scientific publication topics.

Copyright © SENASIF 2017

ISSN : 2597 - 4696

504

Seminar Nasional Sistem Informasi 2017, 14 September 2017
Fakultas Teknologi Informasi – UNMER Malang

(2017) dan litecky dkk (2010) menggunakan

PENDAHULUAN

iklan

Secara global, tugas perguruan tinggi


lowongan

kerja

sebagai

sumber

ada 3 yang tertuang dalam tri dharma, yaitu

informasi mengenai skillset yang dibutuhkan

1) pendidikan dan pengajaran 2) penelitian

oleh industry TIK. Di penelitian lain, Son

dan

pengabdian


dkk (2015) menggunakan social media

masyarakat (Djojodibroto, 2004). Salah satu

sebagai sumber informasi perkembangan

tugas perguruan tinggi adalah penelitian dan

TIK yang mutakhir. Para peneliti tersebut

pengembangan yang dilakukan oleh dosen

menggunakan

dan mahasiswa. Penelitan mahasiswa dapat

visualisasi informasi untuk menggambarkan

dilihat dari hasil skripsi mereka. Selain itu


kesenjangan antara topik penelitian dengan

penelitian mahasiswa melalui skripsi juga

topik yang dibicarakan di jejaring social

merupakan tolak ukur tingkat penyerapan

media.

pengembangan

3)

Artikel

kampus terhadap perkembangan teknologi

teknik


ini

clustering

mengusulkan

dan

metode

yang terjadi saat ini. Namun demikian

untuk mengukur kesenjangan antara topik

perkembangan

penelitian

teknologi


informasi

dan

skripsi

mahasiswa

dengan

komunikasi (TIK) begitu cepat dan massif,

perkembangan TIK mutakhir dengan cara

dan masih sulit bagi mahasiswa khususnya

membandingkan

program


mengikuti

abstrak riset yang di publikasi ilmiah baik

Sebagai

jurnal maupun prosiding konferensi. Dataset

Sarjana

perkembangan

TIK

untuk
dimaksud.

abstrak


skripsi

dengan

akibatnya,

terjadi

kesenjangan

antara

skripsi mahasiswa program Sarjana diambil

penelitian

skripsi

mahasiswa


dengan

dari STMIK Pradnya Paramita Malang
(STIMATA), sedangkan dataset abstrak riset

perkembangan TIK.
Permasalahan yang sering dihadapi

dikumpulkan dari IEEE Explore. Pendekatan

oleh perguruan tinggi adalah bagaimana

eksploitasi Association Rule (AR mining)

metode yang secara efektif dan efisien

digunakan untuk menemukan hubungan kata-

mampu


kata yang sering muncul (frequent termset)

penelitian

mengukur
skripsi

kesenjangan
mahasiswa

antara

dari kedua dataset tersebut.

dengan

Hasil implementasi metode yang

perkembangan TIK terkini.
Di sisi lain, informasi mengenai

diusulkan berhasil menemukan topik-topik

perkembangan TIK dapat diperoleh dari

penelitian yang sering dibahas di jurnal dan

berbagai sumber. Penelitian Akhriza dkk

prosiding konferensi namun belum pernah

Copyright © SENASIF 2017

ISSN : 2597 - 4696

505

Seminar Nasional Sistem Informasi 2017, 14 September 2017
Fakultas Teknologi Informasi – UNMER Malang

dibahas di penelitian skripsi mahasiswa; dan

ditemukan,

sebaliknya.

asosiasi

barulah

yang

dicari

aturan

memenuhi

syarat

minimum untuk confidence dengan
KAJIAN LITERATUR

menghitung

Association rule

asosiatif A → B.

bagaimana

suatu

diperoleh dari rumus berikut.

ntara data atau

kelompok

aturan

Nilai confidence dari aturan A → B

Association rules digunakan untuk
menemukan hubungan di

confidence

Confidence = P (B|A) = ∑ Transaksi mengandung A dan B

data

∑ Transaksi mengandung A

mempengaruhi suatu keberadaan data yang

Apriori

lain. Metode ini dapat membantu mengenali

Apriori

adalah

algoritma

yang

pola-pola tertentu di dalam kumpulan data

digunakan

yang besar. Dalam association rules, suatu

frequent itemset untuk mendapatkan aturan

kelompok item dinamakan itemset. Support

asosiasi. Sesuai dengan namanya, algortima

dari itemset X adalah persentase transaksi di

ini menggunakan prior knowledge mengenai

D yang mengandung X, biasa ditulis dengan

frequent

supp(X).

diketahui

Metodologi dasar analisis asosiasi terbagi

informasi selanjutnya. Apriori menggunakan

menjadi dua tahap:

pendekatan secara iterative yang disebut juga

1. Analisis pola frekuensi tinggi

dalam

itemset

melakukan

properties

sebelumnya

pencarian

yang

telah

untuk memproses

sebagai level-wish search dimana k-itemset

Tahapan ini mencari kombinasi item

digunakan untuk mencari (k+1)- itemset.

yang memenuhi syarat minimum dari

Pertama-tama dicari set dari frequent 1-

nilai support dalam database. Nilai

itemset, set ini dinotasikan sebagai L1. L1

support sebuah item diperoleh dengan

yaitu large itemset pertama yang digunakan

rumus berikut.

untuk menemukan L2, kemudian set dari

Support (A) = Jumlah Transaksi Mengandung A

frequent

Total Transaksi

2-itemset

digunakan

untuk

Sementara itu, nilai support dari 2

menemukan L3, dan seterusnya sampai tidak

item diperoleh dari rumus 2 berikut.

ada lagi frequent k-itemset yang dapat
ditemukan. Large itemset adalah itemset

Support (A,B) = ∑ Transaksi mengandung A dan B

yang sering terjadi atau itemset-itemset yang

∑ Transaksi

sudah melewati batas minimum support yang

2. Pembentukan aturan asosiasi Setelah
semua

pola

frekuensi

telah ditentukan.

tinggi

Copyright © SENASIF 2017

ISSN : 2597 - 4696

506

Seminar Nasional Sistem Informasi 2017, 14 September 2017
Fakultas Teknologi Informasi – UNMER Malang

hubungan keterkaitan topik satu dengan yang

Adapun dua proses utama yang dilakukan

lain belum ditemukan.

dalam algoritma apriori, yaitu:
1. Join (penggabungan). Pada proses ini

Son dkk, (2015) pada jurnal yang

setiap item dikombinasikan dengan

berjudul Visualization of e-Health Research

item yang lainnya sampai tidak

Topics and Current Trends Using Social

terbentuk kombinasi lagi.

Network Analysis [6]. penelitian ini bertujuan

2. Prune (pemangkasan). Pada proses

untuk secara kritis meninjau topik penelitian

ini, hasil dari item yang telah

utama dan tren internasional e-kesehatan

dikombinasikan tadi lalu dipangkas

melalui analisis jaringan sosial. Dalam

dengan

penelitian

menggunakan

minimum

ini

menggunakan

pendekatan

clusterring atau pengelompokan.

support yang telah ditentukan oleh

Penelitian tentang kesenjangan yang

user.

dilakukan oleh Akhriza dkk (2017), Litecky

Metode Penemuan Kesenjangan
Akhriza dkk, (2017) pada jurnalnya

dkk, (2010) dan Son dkk (2015) belum

Revealing The Gap Between Skillset Of

mengukur frequent termset atau himpunan

Student And Evolving Skills Required By The

kata yang ada di dalam abstrak. Mereka

Industry

And

hanya fokus mengukur kesenjangan metode

Communication Technology dan juga Litecky

dangan menggunakan frequent itemset dan

Mining

belum menggunakan Assocition Rule (AR

dkk,

Of

(2010)

Information

pada

jurnalnya

ini

Mining), padahal association rule dapat

memiliki kesamaan yaitu mengeksploitasi

mengungkapkan hubungan topik yang satu

lowongan kerja yang dibutuhkan industri

dengan yang lain.

Computing

Jobs

kedua

penelitian

Maka

sebagai acuan perkembangan TIK, namun

diusulkan

penelitian

ini

untuk

mengungkapkan

yang membedakan, pada jurnal Akhriza dkk,

bertujuan

memiliki tujuan lain yaitu

kesenjangan tersebut dengan menggunakan

menemukan
siswa

Association Rule (AR Mining), dimana kata-

dengan keterampilan yang dibutuhkan pihak

kata yang paling sering muncul (frequent

industri, sehingga pihak sekolah atau kampus

termset) di dalam abstrak skripsi dan abstrak

bisa melakukan evaluasi terhadap kurikulum

riset dieksploitasi. Dari frequent termset yang

yang

dikumpulkan, hubungan antara satu kata

kesenjangan

ada.

antara

keterampilan

Namun

penelitian

ini

dengan

menggunakan frequent itemset saja, sehingga

Copyright © SENASIF 2017

yang

lain

ditemukan,

ISSN : 2597 - 4696

507

untuk

Seminar Nasional Sistem Informasi 2017, 14 September 2017
Fakultas Teknologi Informasi – UNMER Malang



kemudian, perbedaan antara topik yang

Proses ke-1 unduh abstrak skripsi dan

dibahas di dalam skripsi dengan yang

abstrak riset. Pada proses ke-1 file

diangkat oleh publikasi ilmiah dianalisis dan

abstrak di simpan dalam bentuk .txt.


disimpulkan. Dari hasil simpulan tersebut,

Pada proses ke-2 setelah abstrak

maka dibandingkan dan dihasilkan topik

sudah dalam bentuk .txt dilanjutkan

yang sering diangkat di skripsi, namun tidak

dengan proses pre-processing yaitu

pernah

sudah

pembersihan stopword dan tanda baca

dipublikasi dan sebaliknya, topik yang tidak

pada abstrak. Sehingga abstrak berisi

pernah diangkat di skripsi, namun sudah

inti dari pembahasan skripsi dan riset

sering diangkat di riset.

jurnal.

diangkat

di

riset

yang



Dari proses pre-processing berlanjut

METODE PENELITIAN

ke proses ke-3 yaitu menjalankan

Framework Penelitian

aplikasi apriori, dengan menentukan

kerangka

kerja

penelitian

framework pada Gambar 1.

ini

seperti

ambang batasnya itu minsupp dan

Angka yang

minconf yang diinginkan.


tertera pada gambar adalah urutan alur proses
penelitian.

Setelah proses aplikasi Apriori, maka
proses ke-4 menghasilkan frequent

Mulai

termset dari aplikasi Apriori.

Unduh abstrak
skripsi

1

Unduh abstrak
artikel

Pre-processing :
Menghilanngkan
stopword dan
tanda baca

2

Pre-processing :
Menghilanngkan
stopword dan
tanda baca

Jalankan apriori:
Input minsupp dan
minconf

3

Jalankan apriori:
Input minsupp dan
minconf



Setelah itu, hasil frequent termset dari
apriori berlanjut ke tahap selanjutnya
proses

ke-5

yaitu

analisis

kesenjangan antara topik skripsi dan
topik riset. fokus disini adalah untuk

Himpunan apriori

4

menemukan yang kata kunci sebelah

Himpunan apriori

kirinya adalah sistem informasi, yang

5.
Analisis
kesenjangan
antara topik skripsi
dan topik riset di
publikasi ilmiah

disebut kesenjangan atau gap adalah
seberapa banyak kata yang tidak sama

6.
Hasil dan
pembahasan

antara topik skripsi dan topik riset.
Selesai



Gambar 1. Kerangka kerja penelitian

Selanjutnya

proses

ke-6,

maka

diperoleh hasil analisis kesenjangan
sehingga terlihat topik keterkaitan

Copyright © SENASIF 2017

ISSN : 2597 - 4696

508

Seminar Nasional Sistem Informasi 2017, 14 September 2017
Fakultas Teknologi Informasi – UNMER Malang

topik yang dibahas. Dan akan terlihat

digunakan sebagai acuan untuk menentukan

topik yang sering gunakan di skripsi,

pola tertentu.

namun tidak pernah digunakan di

Jika filtering sudah dilakukan dengan

riset ataupun topik yang jarang

menggunakan kata kunci dan diperoleh hasil,

diangkat

maka selanjutnya dilakukan pembandingan

tetapi

menarik

untuk

antara hasil filtering data skripsi dan filtering

dibahas.

abstrak publikasi. Dalam penelitian ini

Rancangan Eksperimen
Data abstrak yang digunakan pada

pembandingan

menggunakan

operasi

penelitian ini ada dua macam, yaitu data

matematika, yaitu irisan, sehingga dapat

abstrak skripsi dan data abstrak riset yang di

mengungkap topik yang sering digunakan di

publikasi. Data abstrak skripsi diperoleh

riset, namun tidak pernah digunakan pada

abstrak skripsi program sarjana dari STMIK

skripsi dan topik yang sering digunakan di

PPKIA

skripsi, namun belum pernah digunakan di

Pradnya

Paramita

Malang

(STIMATA) prodi sistem informasi dengan 5

riset.

hal

tersebut

dapat

mengungkap

periode terakhir dan data abstrak riset

kesenjangan dengan membandingkan topik

diperoleh dari situs www.ieee.com dengan

yang dibahas.

kata kunci "Information System" filter tahun
HASIL PENELITIAN DAN

2012-2017, dan artikel yang diambil hanya

PEMBAHASAN

yang dipublikasi di Jurnal dan Konferensi

Hasil dari penelitian ini dapat di lihat

yang diindeks oleh IEEE Explore.

dari tabel berikut. Pada Tabel 1 adalah hasil

Pada penelitian ini, ambang batas

filtering dari frequent termset AR mining

data abstrak skripsi diatur minsupp 3 dan

data abstrak skripsi. Pada tabel tersebut ada

minconf 30% dan pada data abstrak riset
dengan minsupp 10 dan minconf
setelah

itu

pada

data

abstrak

pembahasan scaffolding  android informasi

50%,

sistem (3, 33.3333) pada abstrak skripsi,

skripsi

artinya jika mahasiswa membahas android,

mengambil fokus pencarian kata kunci
“sistem informasi”, “sistem penunjang”,

system dan informasi, maka mahasiswa juga

“sistem berbasis” dan “database”, dan pada

pasti

abstrak publikasi focus pencarian pada kata
kunci

“system

information”,

“decision

support”, “database” dan “web”. Filtering
Copyright © SENASIF 2017

membahas

scaffolding.

Angka

didalam

kurung

adalah

support,

yaitu

menunjukkan

keseluruhan

dari

mahasiswa

tentang

total

menunjukkan
bahwa

pembahasan

scaffolding
ISSN : 2597 - 4696

509

3

dengan

Seminar Nasional Sistem Informasi 2017, 14 September 2017
Fakultas Teknologi Informasi – UNMER Malang

android, system dan informasi muncul secara

persyaratan

dan

solusi

melalui

upaya

bersamaan yaitu sebanyak 3 kali. Sedangkan

kolaboratif dari antar tim fungsional dan

angka 33.3% adalah confidence, artinya, ada

klien. Dan ada juga pemabahasan health 

confidence (peluang) sebesar 33.3% bahwa

decision performance information (10, 50),

orang yang membahas android informasi

hal ini memberi penilaian baru, bahwa sistem

juga membahas scaffolding. Pembahasan

keputusan bukan hanya berhubungan dengan

yang sejenis dg ini bisa menyesuaikan..

bidang industri saja, namun juga bias masuk

scaffolding sendiri adalah suatu struktur

di bidang kesehatan.
Tabel 1. Hasil filtering data abstrak skripsi

sementara yang digunakan untuk menyangga
manusia dan material dalam konstruksi atau

No.

perbaikan gedung dan bangunan-bangunan

1

besar lainnya. Pembahasan tersebut notabene

Hasil
scaffolding  android informasi
sistem (3, 33.3333)

tidak ada hubungannya dengan TIK, namun

2

penelitian mahasiswa melalui skripsi sudah

bigbluebutton website pendukung
sistem (3, 33.3333)

membahas hal tersebut. Terlihat juga ada

3

seo  saw pemilihan additive

pembahasan seo  saw pemilihan additive

simple pendukung keputusan sistem

simple pendukung keputusan sistem (3,

(3, 33.3333)

33.3333), penggabungan seo atau search

4

engine optimization dengan metode saw atau

(3, 66.6667)

simple additive weighting. Penggabungan

5

tersebut bisa dibilang jarang terjadi.

ahp  pengambilan penunjang
keputusan sistem (3, 66.6667)

Pada Tabel 2 adalah hasil filtering

6

dari frequent termset AR mining data abstrak
riset. Pada pembahasan tersebut

saw  gerabah pendukung sistem

akademik ahp penunjang
keputusan sistem (3, 33.3333)

terdapat

agile  software development systems
system information (10, 50). Pembahasan
Agile

dan

system

information

Tabel 1. Tabel lanjutan

dapat

No

dikatakan banyak dibahas dan confidence nya

7

terbilang tinggi 50%. Agile adalah sebuah

Hasil
sms  android informasi sistem (3,
33.3333)

metode dari beberapa kumpulan prinsip

8

untuk pengembangan software di mana

geografis  website mysql
informasi sistem (3, 66.6667)

Copyright © SENASIF 2017

ISSN : 2597 - 4696

510

Seminar Nasional Sistem Informasi 2017, 14 September 2017
Fakultas Teknologi Informasi – UNMER Malang

Dari hal ini kita dapat mengambil
Tabel 2. Hasil filtering data abstrak riset
No
1

simpulan kesenjangan antara kedua topik,
yaitu topik skripsi dan topik publikasi.

Hasil
agile  software development

Tabel 3. hasil kesenjangan abstrstrak skripsi

systems system information (10, 50)
2

3

4

5

6

communication  realize system

dan abstrak riset

information (10, 50)

No

Hasil

health decision performance

1

Agile

information (10, 50)

2

Hierarchy

mapping  web software system

3

Evaluate

information (11, 54.5455)

4

Communication

hierarchy  assessment risk process

5

Resources

system information (11, 63.6364)

6

Resources

analysis  decisionmaking system

7

Study

information (13, 69.2308)
Tabel 4. hasil kesenjangan riset dan skripsi
Tabel

selanjutnya

menjelaskan

No

Hasil

tentang kesenjangan antara topik skripsi dan

1

Scaffolding

topik riset yang di publikasi.seperti Pada

2

Bigbluebutton

Tabel 3 menjelaskan tentang topik yang

3

Administrasi

dibahas publikasi, namun

tidak pernah di

4

Fuzzy

angkat pada skripsi, seperti metodologi

5

Seo

penelitian TIK semacam Agile software

6

Mysql

development yang ternyata sudah banyak

7

Ahp

dipakai di publikasi.
Pada Tabel 4 menjelaskan tentang

KESIMPULAN DAN SARAN

topik yang dibahas pada skripsi, namun

Kesimpulan

tidak ada pada topik publikasi, seperti

Dari hasil penelitian terhadap analisis

Bigbluebutton tidak pernah dibahas pada

kesenjangan antara topik skripsi dan topik

publikasi.

riset

Copyright © SENASIF 2017

yang

di

pulikasi

menggunakan

ISSN : 2597 - 4696

511

Seminar Nasional Sistem Informasi 2017, 14 September 2017
Fakultas Teknologi Informasi – UNMER Malang

Apotek Setya Sehat Semarang)
Journal Of Informatics And
Technology, vol. 2, no. 2, pp. 22 28, 2013.
Djojodibroto, R. D,. 2004. Tradisi
Kehidupan
Akademik.
Galang
Press. Yogyakarta.
Hernanda, Fikhri. 2016, “Agile Software
Development, salah satu metode
pengembangan perangkat lunak”,
https://www.dictio.id/t/agilesoftware-development-salah-satumetode-pengembangan-perangkatlunak/3242 , diakses 3 agustus
2017.
Kusrini dan Luthfi, E. T. 2009. Algoritma
Data Mining. CV. Andi Offset.
Yogyakarta.
Litecky, C. Aken, A. A. dan J. Nelson.
Mining For Computing Jobs, IEEE
Software 27(1) (2010) 78–85.
Son, Youn-jun., Jeon. Senator, Kang. ByeonGwon, Kim. Sun-Hyung, dan Lee,
Soo-Kyoung. 2015. Visualization of
e-Health Research Topics and
Current Trends Using Social
Network Analysis. Mary Ann
Liebert, Inc. Vol. 21 No. 5.

eksploitasi Association rule (AR Mining)
dapat di simpulkan bahwa:
1. Penelitian

ini

berhasil

mengungkap

kesenjangan antara topik skripsi dan
topik riset yang di publikasi dengan
efektif dan efisien, sehingga hasil analisis
dapat dipergunakan untuk mahasiswa
atau perguruan tinggi ke depan.
2. Pada penelitian ini pula, dapat ditemukan
keterkaitan topik satu dengan yang lain,
sehingga dapat menambah wawasan dan
pengembangan ranah penelitian untuk
selanjutnya.
Saran
Untuk

meningkatkan

keakuratan

hasil, data abstrak skripsi dan abstrak riset
ilmiah dapat ditambahkan lebih banyak lagi.
REFERENSI
Akhriza, T. M. Ma, Y. H. Dan Li. J. H. 2017.
Revealing The Gap Between Skillset
Of Student And Evolving Skills
Required By The Industry Of
Information And Communication
Technology. International Journal
Of Software Engineering And
Knowledge Engineering. Vol 27,
No. 5 2017: 675-698.
Abhiesa,
Alif.
2016,
“Cara
Instal
Bigbluebutton Web Conferencing”,
http://www.noobsgnu.com/2015/06/
cara-instal-bigbluebutton-web.html.
diakses 3 Agustus 2017
Anggraeni, H. D. Saputra, Ragil. Dan
Noranita, Beta. 2013. Aplikasi Data
Mining Analisis Data Transaksi
Penjualan Obat Menggunakan
Algoritma Apriori ( Studi Kasus di
Copyright © SENASIF 2017

ISSN : 2597 - 4696

512