Pengembangan Koreksi Esai Otomatis Pada E-Learning Di SMK Plus An-Naba Sukabumi Dengan Menggunakan Metode Latent Semantyc Analysys (LSA)

(1)

D-1

BIODATA PENULIS

Data Pribadi

Nama

:

Mashun Sofyan

TTL

:

Cilacap, 10 Oktober 1993

Usia

:

22 Tahun

Jenis Kelamin

:

Laki

laki

Alamat

: Jalan Sukasari 2 Block C No. 124, RT 03 RW 02,

Sekeloa, Bandung.

No. Telp

:

085797920001

Email

:

Mashunsofyan@gmail.com

Pendidikan Formal

1998

2005

Madrasah Ibtidaiyah(MI) Sarwadadi, Kawunganten, Cilacap

2005

2008

MTs Negeri Kawunganten, Cilacap

2008 – 2011

SMA Negeri 1 Jeruk Legi, Cilacap


(2)

PENGEMBANGAN KOREKSI ESAI OTOMATIS PADA

E-LEARNING DI SMK PLUS AN-NABA SUKABUMI DENGAN

MENGGUNAKAN

METODE LATENT SEMANTYC ANALYSIS

(LSA)

SKRIPSI

Diajukan untuk Menempuh Ujian Akhir Sarjana

Program Studi Teknik Informatika

Fakultas Teknik dan Ilmu Komputer

MASHUN SOFYAN

10111518

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS TEKNIK DAN ILMU KOMPUTER

UNIVERSITAS KOMPUTER INDONESIA

2015


(3)

v

DAFTAR ISI

ABSTRAK ...

Error! Bookmark not defined.

ABSTRACT ...

Error! Bookmark not defined.

KATA PENGANTAR ...

Error! Bookmark not defined.

DAFTAR ISI ... v

DAFTAR GAMBAR ...

Error! Bookmark not defined.

DAFTAR TABEL ...

Error! Bookmark not defined.

DAFTAR SIMBOL ...

Error! Bookmark not defined.

DAFTAR LAMPIRAN ...

Error! Bookmark not defined.

BAB 1 PENDAHULUAN ...

Error! Bookmark not defined.

1.1

Latar Belakang Masalah ...

Error! Bookmark not defined.

1.2

Rumusan Masalah ...

Error! Bookmark not defined.

1.3

Maksud dan Tujuan ...

Error! Bookmark not defined.

1.4

Batasan Masalah...

Error! Bookmark not defined.

1.5

Metodologi Penelitian ...

Error! Bookmark not defined.

1.5.1

Metode Pengumpulan Data ...

Error! Bookmark not defined.

1.5.2

Metode Pembangunan Perangkat Lunak ...

Error! Bookmark not

defined.

1.6

Sistematika Penulisan ...

Error! Bookmark not defined.

BAB 2 TINJAUAN PUSTAKA ...

Error! Bookmark not defined.

2.1 Tinjauan Sekolah ...

Error! Bookmark not defined.

2.1.1 Profil SMK Plus An-Naba Sukabumi ..

Error! Bookmark not defined.

2.1.3 Struktur Organisasi Sekolah ...

Error! Bookmark not defined.

2.1.4 Deskripsi Pekerjaan ...

Error! Bookmark not defined.

2.2 E-Learning...

Error! Bookmark not defined.

2.2.1

Learning Management Sistem (LMS)

..

Error! Bookmark not defined.

2.2.2 Penilaian Jawaban Otomatis ...

Error! Bookmark not defined.

2.3 Metode Metode Penilaian Jawaban Esai Otomatis ...

Error! Bookmark not

defined.


(4)

vi

2.3.2 Electronic Essay Rater (E-Rater) ...

Error! Bookmark not defined.

2.3.3 Intelegent Essay Assessor (IEA) ...

Error! Bookmark not defined.

2.3.4 Latent Semantic Analysis (LSA) ...

Error! Bookmark not defined.

2.4 Teori Pembangunan Perangkat Lunak ...

Error! Bookmark not defined.

2.4.1 Flowmap ...

Error! Bookmark not defined.

2.4.2 Diagram Konteks ...

Error! Bookmark not defined.

2.4.3 Data Flow Diagram (DFD) ...

Error! Bookmark not defined.

2.4.4

Entity Relationship Diagram

(ERD) ...

Error! Bookmark not defined.

2.4.5 Kamus Data ...

Error! Bookmark not defined.

2.5 Program-Program Pendukung ...

Error! Bookmark not defined.

2.5.1 Internet ...

Error! Bookmark not defined.

2.5.2 Website ...

Error! Bookmark not defined.

2.5.4 CSS ...

Error! Bookmark not defined.

2.5.6 MySQL ...

Error! Bookmark not defined.

BAB 3 ANALISIS DAN PERANCANGAN SISTEM ...

Error! Bookmark not

defined.

3.1

Analisis Sistem ...

Error! Bookmark not defined.

3.1.1

Analisis Masalah ...

Error! Bookmark not defined.

3.1.2

Analisis Sistem yang Sedang Berjalan ...

Error! Bookmark not

defined.

3.2

Analisis Metode ...

Error! Bookmark not defined.

3.2.1

Analisis

Preprocessing

...

Error! Bookmark not defined.

3.2.2

Analisis metode LSA ...

Error! Bookmark not defined.

3.3 Analisis Kebutuhan Non-Fungsional ...

Error! Bookmark not defined.

3.3.1

Analisis Perangkat Lunak (

Software

) ...

Error! Bookmark not

defined.

3.3.1.1

Fakta Lapangan ...

Error! Bookmark not defined.

3.3.1.3

Kebutuhan sistem ...

Error! Bookmark not defined.

3.3.2

Analisis Perangkat Keras (

Hardware

) ...

Error! Bookmark not

defined.

3.3.2.1

Fakta Lapangan...

Error! Bookmark not defined.


(5)

vii

4.1 Implementasi...

Error! Bookmark not defined.

4.1.1 Implementasi Perangkat Lunak ...

Error! Bookmark not defined.

4.1.2 Implementasi Perangkat Keras ...

Error! Bookmark not defined.

4.1.3 Implementasi Basis Data ...

Error! Bookmark not defined.

4.1.4 Implementasi Antarmuka...

Error! Bookmark not defined.

4.2 Pengujian Sistem ...

Error! Bookmark not defined.

4.2.1 Pengujian Alpha...

Error! Bookmark not defined.

4.2.2 Pengujian Beta ...

Error! Bookmark not defined.

BAB 5 KESIMPULAN DAN SARAN ...

Error! Bookmark not defined.

5.1 Kesimpulan ...

Error! Bookmark not defined.

5.2 Saran ...

Error! Bookmark not defined.


(6)

176

Daftar Pustaka

[1]

M. P. B. S. Sahriar Hamza, “Sistem Koreksi Soal Essay Otomatis Dengan

Menggunakan Metode Rabin Karp,”

EECCISS,

vol. 7, no. 2, p. 153, 2013.

[2]

B. B. D. H. Anak Agung Putri Ratna, “SIMPLE : SISTEM PENILAI

OTOMATIS UNTUK MENILAI UJIA

N DALAM BAHASA INDONESIA,”

MAKARA TEKNOLOGI,

vol. 11, no. 1, pp. 5-11, 2007.

[3] R. S.Pressman, Software Enginering A Practitioners Approach, New York:

McGraw-Hill, 2010.

[4]

Munir, “KONTRIBUSI TEKNOLOGI INFORMASI DAN KOMUNIKASI

(TIK) DALAM PENDIDIKAN DI ERA GLOBALISASI PENDIDIKAN

INDONESIA,”

Indonesian Comunity on Information and Comunicartion

Technology,

vol. 2, no. 2, 2009.

[5] D. E. Hartley, Selling e-Learning, ASTD, 2006.

[6] P. W. D. L. Thomas K Launder, An Introduction to Latent Semantic Analysis,

1998.

[7] M. S. Rossa A.S M, Rekayasa Perangkat Lunak terstruktur dan berorientasi

objek, Bandung: Informatika, 2013.

[8] A. Nugroho, Analisis dan Perancangan Sistem Informasi dengan Metodologi

Berorientasi Objek, Bandung: Informatika, 2005.


(7)

PENGEMBANGAN KOREKSI ESAI OTOMATIS PADA

E-LEARNING DI SMK PLUS AN-NABA SUKABUMI DENGAN

MENGGUNAKAN METODE

LATENT SEMANTYC ANALYSIS

(LSA)

Mashun Sofyan1

1

Teknik Informatika – Universitas Komputer Indonesia Jl. Dipatiukur 112-114 Bandung

E-mail : Mashunsofyan@gmail.com1

ABSTRAK

Pengkoreksian soal esai secara manual yang menghabiskan waktu lebih lama dibandingkan dengan mengoreksi soal esai secara otomatis. Dibutuhkan waktu sekitar 1 menit tiap soal untuk mengkoreksi soal esai secara manual. Jika akan mengkoreksi 30 soal maka dibutuhkan waktu sekitar 30 menit, sedangkan jumlah pelajar di SMK Plus An-Naba Sukabumi sekitar 200 orang.

Berdasarkan data tersebut, perlu dikembangkan sebuah sistem otomatis yang membantu proses penilaian esai. Pengembangan Sistem Penilaian Esai Otomatis pada Tugas Akhir ini menggunakan Metode Latent Semantyc Analysis (LSA) yaitu dengan merepresentasikan kalimat dalam sebuah matriks semantik yang kemudian dilakukan perhitungan matematis dengan mencocokan atau memetakan ada atau tidaknya kata dari kelompok kata pada matriks menggunakan teknik aljabar linear Singular Value Decomposition (SVD).

Berdasarkan hasil data penelitian alpha dan betha dapat diambil sebuah kesimpulan bahwa pengembangan fungsionalitas koreksi esai di SMK Plus An-Naba Sukabumi mampu melaksanakan proses koreksi soal jenis esai dengan lebih cepat.

Kata kunci : LSA, Latent Semantyc Analysis, Singular Value Decomposition (SVD).

1. PENDAHULUAN

SMK `Plus An-Naba Sukabumi merupakan sekolah menengah kejuruan negeri yang beralamat di Jl. Widyakrama No. 112, Sukabumi. SMK Plus An-Naba Sukabumi merupakan salah satu subsistem pendidikan nasional. Tanggung jawab yang terbesar diemban oleh SMK Plus An-Naba Sukabumi adalah membangun bangsa melalui pendidikan teknologi dan kejuruan. Karena itu SMK Plus An-Naba Sukabumi senantiasa berupaya melakukan pembaharuan pendidikan khususnya dalam bidang teknologi dan kejuruan. Dengan mulai diterapkannya kurikulum 2013 yang mengharapkan siswanya untuk berperan aktif dalam proses kegiatan belajar mengajar (KBM) maka penerapan TIK

menjadi salah satu kebutuhan bagi setiap murid dan guru.

Berdasarkan hasil wawancara dengan seorang guru di SMK Plus An-Naba Sukabumi yaitu bapak Ruston Pirmasnyah, S.Kom. mengatakan bahwa proses KBM di SMK Plus An-Naba Sukabumi saat ini sudah cukup baik. SMK Plus An-Naba Sukabumi mulai membangun e-learning sejak tahun 2013. Dalam e-learning yang telah dibangun terdapat fitur latihan soal namun terbantas hanya latihan soal dalam bentuk pilihan ganda. Namun e-learning yang telah dibangun belum menyediakan fasilitas koreksi soal esai otomatis yang dibutuhkan oleh para guru di SMK Plus An-Naba Sukabumi. Pengkoreksian soal esai secara manual yang menghabiskan waktu lebih lama dibandingkan dengan mengoreksi soal esai secara otomatis. Dibutuhkan waktu sekitar 1 menit tiap soal untuk mengkoreksi soal esai secara manual. Jika akan mengkoreksi 30 soal maka dibutuhkan waktu sekitar 30 menit, sedangkan jumlah pelajar di SMK Plus An-Naba Sukabumi sekitar 200 orang. Salah satu metode penilaian esai yang digunakan adalah Latent Semantyc Analysis (LSA) yaitu dengan merepresentasikan kalimat dalam sebuah matriks semantik yang kemudian dilakukan perhitungan matematis dengan mencocokan atau memetakan ada atau tidaknya kata dari kelompok kata pada matriks menggunakan teknik aljabar linear Singular Value Decomposition (SVD).

Dengan ditemukannya permasalahan yang ada, maka dibutuhkan metode yang dapat membantu guru untuk pengoreksian soal esai secara otomatis oleh sistem. Dengan dikembangkan aplikasi LMS ini, diharapkan bisa menjadi sebuah media yang mampu mempercepat proses pengkoreksian soal esai hingga pada akhirnya dapat memudahkan para pengajar di SMK Plus An-Naba Sukabumi. Berdasarkan latar belakang yang telah dipaparkan sebelumnya, maka penelitian tugas akhir ini diberi judul Pengembangan Koreksi Soal Esai Otomatis Pada E-Learning di SMK Plus An-Naba Sukabumi dengan Menggunakan Metode Latent Semantyc Analysis (LSA).

1.1 E-Learning

Perkembangan teknologi informasi yang semakin maju telah mampu membantu manusia


(8)

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA)

46

Edisi. .. Volume. .., Bulan 20.. ISSN : 2089-9033

dalam segala bidang. Salah satu bidang yang tak luput pemanfaatan teknologi informasi dalam prosesnya adalah dalam bidang pendidikan. perkembangan yang semakin maju membuat pergeseran paradigm cara pembelajaran dan melahirkan metode-metode baru dalam prose pembelajaran tersebut. proses belajar mengajar saat ini dapat dilakukan dimanapun tanpa bertatap muka secara langsung dalam suatu ruangan. Interaksi keduanya dapat dilakukan dengan menggunakan bantuan media-media elektronik seperti komputer. Proses belajar mengajar dengan menggunakan bantuan media elektronik seperti ini sekarang dikenal dengan sebutan e-learning.

Pada dasarnya konsep e learning dapat dikelompokan berdasarkan basis teknologi yang digunakannya menjadi dua jenis, yaitu computer based training (CBT) yang menggunakan program komputer sebagai media utama yang digunakan oleh pelajar. Dan jenis satunya adalah web based training (WBT) yang merupakan perkembangan lanjutan dari sistem CBT dengan menggunakan tambahan teknologi berbasis internet. Pada jenis WBT penyampaian dan akses materi pelajaran dilakukan melalui internet.

1.2 Learning Management Sistem (LMS)

Dalam e-learning ada dua bagian utama yang menopang sistemnya, yaitu Learning Management Sistem dan e-learning content atau materi pelajaran yang akan dipelajari oleh pemakai. Learning Management Sistem (LMS) adalah sistem yang membantu dan berfungsi sebagai platform e-learning content.

1.3 Penilaian Jawaban Otomatis

Setiap pembelajaran membutuhkan sebuah evaluasi untuk mengetahui sejauh mana daya serap informasi yang dilakukan oleh peserta didik. Secara umum terdapat dua macam bentuk evaluasi yang dapat dilakukan dalam proses belajar mengajar yaitu secara lisan dan tertulis. Ujian secara lisan memiliki kelemahan yaitu penguji dan pelajar yang diuji harus berada pada satu ruang dan satu waktu yang sama dan membutuhkan waktu yang cukup banyak terutama jika peserta ujian tersebut berjumlah banyak. Sedangkan ujian tulisan jauh lebih efisien karna ujian dapat dilakukan dalam waktu bersamaan dengan jumlah peserta ujian yang lebih banyak.

Jenis ujian tulis dapat dibagi menjadi tiga macam, yaitu pilihan ganda, isian singkat, dan esai. Dari ketiga jenis ujian yang dapat dilakukan secara tertulis tersebut ujian yang paling mudah untuk diperiksa secara otomatis adalah pilihan ganda. Pada ujian jenis pilihan ganda pelajar cukup memilih jawaban yang dianggapnya paling benar dari beberapa pilihan jawaban yang ada. namun kelemahan dari model ujian pilihan ganda adalah kurang dapatnya penguji mengetahui sejauh mana

pengetahuan pelajar yang diuji dan dimungkinkan adanya peserta jawaban yang mendapatkan nilai tinggi dari factor keberuntungan dengan menebak jawaban yang tersedia. Tingkat akurasi yang dapat dilakukan oleh komputer untuk ujian jenis pilihan ganda dapat mencapai 100% karna bentuk uijan seperti ini sangat mudah diolah komputer cukup dengan membandingkan jawaban pelajar dengan kunci jawaban yang ada dalam database.

Jenis ujian tertulis berikutnya adalah isian singkat. Pada jenis ujian isian singkat pelajar cukup mengisi jawaban atas pertanyaan yang diajukan dalam satu atau beberapa kata. Ujian jenis ini sedikit lebih baik dibandingkan pilihan ganda karna menuntut pelajar untuk mempunyai sebuah jawaban sendiri. Dan jenis ujian tertulis lainnya adalah dengan soal esai. Esai adalah suatu tulisan yang menggambarkan opini penulis tentang subyek tertentu yang coba dinilainya. Atau juga dapat diartikan sebagai karangan proga yang mengupas secara sepintas namun akurat, padat dan berisi mengenai masalah kesusastraan, seni dan budaya dari sudut pandang penulis secara subjektif. Menurut KBBI esai adalah karya tulis atau karangan dalam bentuk prosa yang memaparkan tentang suatu masalah dari sudut pandang penulis secara lugas dan sepintas. Bentuk soal esai merupakan bentuk pengujian yang secara akurat mampu menggambarkan pemahaman pelajar secara mendalam mengenai topik yang diujikan. Selain itu ujian esai juga mampu merangsang kemampuan mengemukakan pendapat dalam bentuk tulisan.

Ujian dalam bentuk esai memiliki kekurangan dari segi sumber daya yang dibutuhkan yaitu manusia dan waktu. Ketika sebuah ujian esai diikuti oleh banyak peserta waktu yang dibutuhkan untuk memeriksa jawaban akan bertambah pula. Untuk mengatasi masalah dalam penilaian ujian esai, sistem penilaian esai secara otomatis menggunakan komputer dapat menjadi sebuah solusi yang cukup baik.

1.4 Text Preprocessing

Text preprocessing adalah langkah awal sebelum dilakukan sebuah pencocokan string. Proses ini melalui beberapa tahap tindakan yang dilakukan pada sebuah string jawaban dan kunci yang diisi oleh guru dan siswa. Tahap-tahap yang dilakukan dalam proses ini adalah :

1. 1. Case folding / toLowerCase

Case folding adalah tahapan dimana string yang telah diinput oleh user yang awalnya merupakan campuran dari huruf capital dan huruf kecil disamaratakan dengan dijadikan menjadi huruf kecil semua. Hal ini dilakukan karena system komputer membedakan antara “A” dan “a” sehingga antara “saya” dan “Saya” pun akan dinilai berbeda pada system. Tentunya hal ini akan berpengaruh pada


(9)

pencocokan string antar kunci dan jawaban dari siswa.

2. Penghilangan tanda baca

Tahapan ini adalah penghapusan tanda baca sehingga string yang tersisa hanya terdiri dari huruf dan angka saja. Tahapan ini dilakukan karena system yang akan dibangun hanya mencocokan string dan angka belum melibarkan operasi matematika.

3. Penghapusan kata umum (stopWord)

Tahapan stopWord adalah penghapusan kata-kata yang dinilai umum sehingga kata-kata tersebut tidak dimasukan kedalam array string yang akan dicocokan.

4. Tokenizing

Tokenizing adalah tahapan pemotongan string dalam teks berdasarkan akta yang menyusunnya dan sisimpan dalam sebuah variable array.

5. Stemming (penghapusan awalan dan akhiran) Stemming adalah salah satu cara yang digunakan untuk meningkatkan performa pencarian dan pencocokan kata dengan cara mentransformasikan kata kata dalam sebuah dokumen teks ke bentuk dasarnya. Proses stemming dilakukan dengan menghilangkan semua imbuhan baik yang terdiri dari awalan, sisipan maupun akhiran dan kombinasi dari awalan dan akhiran. Ada banyak algoritma yang digunakan untuk melakukan proses stemming. Khusus untuk stemming bahasa indonesia algoritma yang sering digunakan adalah algoritma nazrief dan andriani, arifin dan setiono, algoritma veda, dll.

1.5 Matriks Singular Value Decomposition SVD merupakan teorema aljabar linear yang disebut mampu untuk memecah blok suatu matriks A menjadi tiga matriks baru yaitu sebuah matriks orthogonal U, matriks diagonal S, dan transpose matriks orthogonal V. Teorema SVD adalah sebagai berikut :

Amn = Umm x Smn x VTnn (1)

Dimana UTU= matriks identitas ( I ), VTV = matriks identitas ( I ). Kolom matriks U merupakan eigenvektor orthonormal dari AAT. Sedangkan kolom matriks V merupakan eigenvektor orthonormal dari ATA. dan S merupakan matriks diagonal akar dari nilai eigen dari matriks U atau V dalam urutan dari yang terbesar.

1.6 Cosine Similarity

Cosine similarity adalah salah satu metode perhitungan similarity yang paling popular untuk diterapkan pada dokumen teks. Kelebihan utama dari metode cosigne similarity adalah tidak terpengaruh pada panjang pendeknya suatu dokumen. Karna yang hanya diperhitungkan nilai term dari masing masing dokumen. Berikut adalah rumus untuk cosine similarity

(2)

Keterangan : A = Matriks A B = Matirks B

||A|| = Panjang Matriks A ||B|| = Panjang Matirks B

1.7 Latent Semantic Analysis (LSA)

Latent Semantic Analysis (LSA) adalah suatu metode perhitungan matematika teknik yang sepenuhnya otomatis dalam penggalian dan penyimpulan hubungan antara kata dan kalimat yang ada dalam paragraf [6]. Algoritma LSA merupakan salah satu algoritma pengembangan dalam bidang ilmu Information Retrival yang mampu menghimpun sejumlah besar dokumen dalam basis data dan mengghubungkan relasi antar dokumen dengan mencocokan query yang diberikan. Fungsi utama dari LSA ini adalah untuk menghitung kemiripan (similarity) dokumen dengan membandingkan representasi vektor tiap dokumen. Penilaian dengan metode LSA lebih kepada kata-kata yang ada dalam tulisan tanpa memperhatikan urutan kata dan tata bahasa dalam tulisan tersebut, sehingga suatu kalimat yang dinilai adalah berdasarkan kata-kata kunci yang ada pada kalimat tersebut.

Untuk menghitung nilai jawaban esai menggunakan metode LSA, caranya adalah dengan cara membuat sebuah dokumen esai yang menjadi acuan (query) atau kunci jawaban dan kemudian esai yang akan dinilai dibandingkan dengan esai acuan jawaban, semakin banyak kemiripannya maka semakin besar nilai jawabannya.

Langkah-langkah pemeriksaan esai dengan metode LSA adalah pertama tulisan direpresentasikan ke dalam matriks dimana baris matriks menunjukkan kata-kata kunci (queries) pada dokumen tersebut dan setiap kolom menunjukkan kolom dokumen. Setiap sel menunjukkan banyaknya kemunculan kata kunci yang berada pada matriks pada dokumen yang ada di kolom matriks. Kemudian isi dari sel tersebut terlebih dahulu ditransformasikan dimana setiap frekuensi kata dibobotkan dengan sebuah fungsi yang menunjukkan pentingnya sebuah kalimat dalam paragraph dan juga derajat yang menunjukkan seberapa pentingnya tipe kata didalam suatu kalimat.

Langkah selanjutnya adalah dilakukan dekomposisi Singular Value Decomposition (SVD)


(10)

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA)

48

Edisi. .. Volume. .., Bulan 20.. ISSN : 2089-9033

pada matriks kata-dokumen. Pada SVD matriks memuat frekuensi pemunculan kata kunci di dekomposisi menjadi tiga buah matriks yang jika tiga buah matriks tersebut dikalikan maka akan muncul kembali matriks asalnya. Matriks pertamanya mendeskripsikan entitas kolom sebagai nilai vektor orthogonal matriks. Matriks keduanya berupa matriks diagonal yang memuat nilai skalar matriks. Secara matematis, faktor yang paling baik adalah menggunakan dimensi terkecil dari matriks awalnya, sehingga rekonstruksi matriks terbaik dihasilkan pada saat nilai faktor lebih kecil dari jumlah faktor yang digunakan.

Dimensi dari matriks yang telah disederhanakan dengan menghapus koefisien pada matriks diagonal sebanyak yang diinginkan sampai tersisa koefisien sebanyak dimensi yang terpilih. Tujuan penyederhanaan ini adalah agar terbentuk matriks yang memuat nilai korelasi yang diinginkan ketika tiga buah matriks direkonstruksi. Kemudian penilaian akan dilakukan dengan membandingkan matriks korelasi dari query dengan matriks korelasi dari setiap dokumen dengan menggunakan perhitungan cosinus α.

2. ISI PENELITIAN

Bagian ini dapat dibagi dalam beberapa sub pokok pembahasan sesuai dengan kebutuhan tulisan. Tidak ada batasan yang baku mengenai jumlah pemerincian sub pokok bahasannya; tetapi setidaknya mengandung: metode, hasil, dan pembahasan.

Pengembangan koreksi esai dimasukan dalam fitur latihan dalam satu halaman bersama soal pilihan ganda. Pengembangan dilakukan karena ditemukan persoalan dalam sistem yang berjalan bahwa pengkoreksian jawaban esai secara manual akan membutuhkan waktu yang lama sebagaimana dijelaskan dalam latar belakang penelitian sehingga membutuhkan fitur tambahan yaitu koreksi soal esai otomatis dalam sistem. Pengembangan ditambahkan dalam bagian latihan soal dengan fitur koreksi soal esai otomatis yang mana dalam sistem sebelumnya sudah teradapat fitur latihan soal namun terabatas hanya soal pilihan ganda saja.

Sistem yang akan dikembangkan dalam penelitian ini adalah sebuah sistem koreksi soal esai otomatis dengan metode Latent Semantyc Analysis. Pada prosesnya sebelum sistem melakukan perhitungan dengan metode LSA ada proses proses yang dilakukan terlebih dahulu. Pengembangan koreksi esai ini terdiri dari dua subproses yaitu proses preprocessing dan proses LSA itu sendiri. Proses preprocessing terdiri dari case folding, tokenizing, filtering, dan stemming. Berikut adalah flowchart dari masing masing proses.

start

Pre processing

Pemrosesan dengan LSA

end

Gambar 1Flowchart Sistem Koreksi Esai Otomatis Untuk lebih memudahkan dalam pemahaman dalam prosesnya diberikan sebuah contoh pencocokan antara kunci jawaban dan jawaban siswa. Dalam contoh berikut adalah salah satu ulangan yang diadakan yang berjumlah 2 soal esai mata pelajaran bahasa indonesia. Jika nilai sempurna dalam ulangan ini adalah 10 maka setiap soal memiliki bobot 5 dalam penyusunan nilai tersebut.

2.1 Analisis metode LSA

Tahapan yang terdapat dalam proses LSA terdiri dari empat tahap dimana masing-masing tahap ada proses perhitungan matematisnya. Proses ini adalah kelanjutan dari proses preprocessing yang telah dilakukan sebelumnya untuk mendapatkan nilai kemiripan antara jawaban dan kunci jawaban.


(11)

start

Kata kunci dan jawaban dalam bentuk array

Pembuatan matriks

Perhitungan nilai matriks U,S,VT dengan SVD

Perhitungan vektor kunci jawaban

Perhitungan nilai cosine similarity

Nilai akhir

end

Gambar 2 Flowchart proses LSA 2.2 Perhitungan nilai matriks U, S, VT

Setelah terbentuk sebuah matriks berukuran m x n maka langkah selanjutnya adalah dengan mencari nilai matriks U, S, VT dengan metode SVD (Singular Value Decomposition). Untuk mendapatkan matriks-matriks berikut melalui beberapa perhitungan yang cukup kompleks mulai dari melakukan transpose matriks, mencari nilai eigen dan mencari vektor eigennya. Namun dalam implementasi program, proses perhitungan dapat menggunakan library dari JAMA yang telah menyediakan fungsi untuk melakukan perhitungan matriks sebagai pengganti MATLAB sehingga didapatkan matriks U, S, VT.

Dari tabel 3.7 didapatkan sebuah matriks A dengan dimensi 9x4 yang akan dilakukan proses SVD untuk mencari nilai U, S, VT . langkah pertama untuk mencari matriks tersebut adalah dengan mencari matriks AT terlebih dahulu.

A

1 1 1 0 0 0 1 1 1 1 0 0 1 1 0 0 1 0 1 1 1 0 0 1 1 0 1 1

0 1 0 0 1 0 1 0

AT

1 0 1 1 1 1 1 0 1 1 0 1 1 0 0 0 1 0 1 1 0 0 1 0 1 0 1 0 1 0 0 1 1 1 0 0

Langkah berikutnya adalah dengan mencari nilai A*AT dan AT*A sehingga didapatkan matriks berikut:

AT* A

7 4 4 4 4 5 2 2 4 2 5 3 4 2 3 5

A*AT

3 1 2 2 2 1 3 1 2 1 2 1 0 2 1 2 0 1 2 1 3 2 2 2 3 1 1 2 0 2 2 1 1 2 1 1 2 2 2 1 3 2 3 0 2 1 1 2 1 2 2 2 0 1 3 2 3 2 3 2 4 1 2 1 0 1 1 0 0 1 1 0 2 1 1 1 2 1 2 0 2

Setelah didapatkan hasil perkalian antara matriks A dan transpose dari matriks A diatas maka langkah selanjutnya adalah mencari nilai eigen dengan cara mengurangi matriks tersebut dengan lambda dikalikan dengan matriks identitas. Yang pertama adalah mencari nilai eigen dari matriks AT*A.

Nilai eigen = 7 4 4 4

-

λ 0 0 0

7 - λ 4 4 4 4 5 2 2 0 Λ 0 0 4 5 - λ 2 2 4 2 5 3 0 0 λ 0 4 2 5 - λ 3

4 2 3 0 0 0 λ 4 2 3 5 - λ

Dari perhitungan diatas dilanjutkan dengan mencari persamaan polynomial (banyak suku) dari matriks diatas. Caranya adalah dengan mengalikan setiap elemen dikurangi elemen lain dari sisi sebelahnya. Sehingga didapakan persamaan berikut :


(12)

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA)

50

Edisi. .. Volume. .., Bulan 20.. ISSN : 2089-9033

Setelah didapatkan sebuah persamaan polynomial seperti diatas langkah selanjutnya adalah mencari akar dari persamaan tersebut sehingga didapatkan

λ1 = 15,400 λ2 = 1,235

λ3 = 3.366 λ4 = 2,000

Sedangkan untuk matriks A*AT dengan melakukan proses yang sama didapatkan nilai eigen sebagai berikut.

λ1 = 15,400 λ2 = 3,366

λ3 = 2,000 λ4 = 1,235

λ5, λ6 , λ7 , λ8, λ9 = 0,000

setelah didapatkan nilai eigen dari masing-masing persamaan diatas langkah selanjutnya adalah dengan memasukan nilai λ pada persamaan awal yang kemudian dinormalisasi sehingga didapatkan matriks-matriks berikut. Untuk vector eigen dari matriks AT*A akan menjadi nilai V yang kemudian akan di transpose menjadi VT. Dan vektor nilai eigen dari A*AT akan menjadi nilai matriks U. Sedangkan matriks S didapatkan dari diagonal akar nilai eigen yang sudah diurutkan dari yang terbesar dan bukan nol.

Matriks U

0.386 -0.248 -0.5 -0.025 0.233 0.483 0 -0.533 0.386 -0.248 0.5 -0.025 0.269 -0.489 0 0.251 0.395 0.413 0 0.131 0.279 0.171 0.5 0.408 0.502 -0.006 0 -0.302 0.107 -0.419 0 -0.433 0.279 0.171 -0.5 0.408

Matriks S

3.924 0 0 0

1.835 0 0

0 0 1.414 0

0 0 0 1.111

Matriks VT

0.636 0.421 0.457 0.457 0.129 0.769 -0.443 -0.443

0 0 -0.707 -0.707 0.761 -0.482 -0.307 -0.307

Setelah didapatkan ketiga matriks tersebut langkah selanjutnya adalah dengan melakukan penyederhanaan kolom-kolom matriks. Penyederhanaan dilakukan pada matriks U dengan penyederhanaan pada jumlah kolomnya, matriks S pada baris dan kolomnya. Langkah penyederhanaan ini dilakukan sesuai dengan nilai dimensi dari matriks tersebut. sehingga didapatkan matriks U dan Sdengan dimensi baru sebagai berikut.

Matri ks U 0.3 86 -0.2 48 0.2 33 0.4 83 0.3 86 -0.2 48 0.2 69 -0.4 89 0.3 95 0.4 13 0.2 79 0.1 71 0.5 02 -0.0 06 0.1 07 -0.4 19 0.2 79 0.1 71 Matriks S 3.9

24 0

0 1.8

35

2.3 Perhitungan vektor kunci jawaban

Pencarian matriks vektor Q dan tiap-tiap D dilakukan untuk melakukan proses perhitungan cosine similarity di tahap berikutnya. Pada langkahnya tahap ini melakukan perkalian matriks dengan himpunan term frekuensi masing-masing query yang ditranspose terhadap matriks U yang kemudian dikalikan kembali dengan invers dari matriks S (S-1). perhitungan berikut adalah contoh dari perhitungan vektor kunci jawaban (Q).


(13)

̅= q . -0.135 |

Jadi hasil perhitungan matriks diatas didapatkan sebuah vektor dari query jawaban (Q) adalah ̅= | 0.617 -0.135 |. Dengan melakukan perhitungan yang sama maka masing-masing jawaban akan menghasilkan nilai vektor sebagai berikut :

Nilai vector Q = | 0.617 - 0.135 | Nilai vector D1 = | 0.407 -0.813 | Nilai vector D2 = | 0.444 0.470 | Nilai vector D3 = | 0.445 0.470 |

2.4 Perhitungan nilai cosine similarity

Perhitungan nilai cosine similarity dilakukan guna mendapatkan nilai atau tingkat kemiripan antar dua buah vektor. Dalam hal ini vektor yang akan dilakukan perhitungan adalah vektor antara kunci jawaban dan masing masing jawaban siswa. Perhitungan ini dilakukan dengan menggunakan rumus pada persamaan dibawah ini.

(3)

Dengan :

D = jawaban siswa

Q = query jawaban

A = Matriks A

B = Matirks B

||A|| = Panjang Matriks A

||B|| = Panjang Matriks B

Sehingga D1 =

Sehingga didapatkan nilai cosine similarity dari D1 sebesar 0.644 . Untuk nilai yang lain juga dilakukan dengan proses yang sama sampai didapatkan masing-masing nilai cosine similarity sebagai berikut :

D2 =

D3 =

Setelah didapatkan nilai similarity dari masing-masing jawaban maka tahap selanjutnya adalah perkalian dengan bobot dari setiap soal yang diujikan. Dalam soal ini memiliki bobot 5 dari 10 point yang ada dalam ulangan dari dua soal, sehingga ketika jawaban dari siswa memiliki kesamaan sempurna dengan kunci yang diberikan akan memiliki 5 point pada soal tersebut.

Jadi nilai rekomendasi yang didapatkan oleh guru dari fungsionalitas koreksi soal pada contoh soal model ini adalah sebagai berikut :

Nilai rekomendasi = nilai cosine similarity * bobot tiap soal

D1 = 0.644 * 5 = 3.2 D2 = 0.566 * 5 = 2.62 D3 = 0.566 * 5 = 2.62

Sehingga menghasilkan Nilai rekomendasi dari 3 siswa yang telah mengerjakan soal esai dengan jawaban berbeda yakin sebagai berikut : Siswa pertama atau D1 menghasilkan nilai rekomendasi 3.20 dibulatkan dengan 1 angka desimal menjadi 3.2, Siswa kedua atau D2 menghasilkan nilai rekomendasi nilai rekomendasi 2.62 dibulatkan dengan 1 angka desimal menjadi 2.6 dan Siswa ketiga atau D3 menghasilkan nilai rekomendasi Nilai rekomendasi 2.62 dibulatkan dengan 1 angka desimal menjadi 2.6

3 PENUTUP

Berdasarkan dari uraian dan hasil analisis yang telah dilakukan maka dapat diambil kesimpulan bahwa Dengan adanya fungsionalitas koreksi esai otomatis guru mampu melaksanakan proses koreksi soal jenis esai dengan lebih cepat. Sebelumnya dibutuhkan waktu sekitar 1 menit tiap soal untuk mengkoreksi soal esai secara manual. 0.386

-0.248 0.233 0.483 0.389

-0.248

̅= | 1 0 1 1 1 1 1 0 1 |

0.269

-0.489 0.255 0.00 0.395 0.413 0.000 0.545 0.279 0.171

0.502 -0.006 0.107

-0.419 0.279 0.171


(14)

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA)

52

Edisi. .. Volume. .., Bulan 20.. ISSN : 2089-9033

Jika akan mengkoreksi 30 soal maka dibutuhkan waktu sekitar 30 menit, sedangkan jumlah pelajar di SMK Plus An-Naba Sukabumi sekitar 200 orang. Setelah pengembangan dibutuhkan waktu sekitar 5 detik tiap soal untuk mengoreksi. Jika akan mengkoreksi 30 soal maka membutuhkan waktu sekitar 150 detik atau 2,5 Menit, sedangkan jika akan mengkoreksi 200 soal maka membutuhkan waktu sekitar 1000 detik atau 5 menit

Untuk pengembangan fungsionalitas koreksi esai otomatis, saran untuk penelitian berikutnya agar menggunakan metode selain Latent Semantyc Analysis (LSA) dalam melakukan koreksi soal esai otomatis.

DAFTAR PUSTAKA

[1] M. P. B. S. Sahriar Hamza, “Sistem Koreksi Soal Essay Otomatis Dengan Menggunakan Metode Rabin Karp,” EECCISS, vol. , no. 2, p. 153, 2013.

[2] B. B. D. H. Anak Agung Putri Ratna, “SIMPLE : SISTEM PENILAI OTOMATIS UNTUK MENILAI UJIAN DALAM BAHASA INDONESIA,” MAKARA TEKNOLOGI, vol. , no. 1, pp. 5-11, 2007.

[3] R. S.Pressman, Software Enginering A Practitioners Approach, New York: McGraw-Hill, 2010.

[4] Munir, “KONTRIBUSI TEKNOLOGI INFORMASI DAN KOMUNIKASI (TIK) DALAM PENDIDIKAN DI ERA GLOBALISASI

PENDIDIKAN INDONESIA,” Indonesian

Comunity on Information and Comunicartion Technology, vol. 2, no. 2, 2009.

[5] D. E. Hartley, Selling e-Learning, ASTD, 2006.

[6] P. W. D. L. Thomas K Launder, An Introduction to Latent Semantic Analysis, 1998. [7] M. S. Rossa A.S M, Rekayasa Perangkat Lunak terstruktur dan berorientasi objek, Bandung: Informatika, 2013.

[8] A. Nugroho, Analisis dan Perancangan Sistem Informasi dengan Metodologi Berorientasi Objek, Bandung: Informatika, 2005.


(15)

AUTOMATIC CORRECTION ESSAY ON DEVELOPMENT

E-LEARNING IN SMK PLUS AN-NABA SUKABUMI LATENT

SEMANTYC USING ANALYSIS (LSA)

Mashun Sofyan1

1

Information Engineering - University Computer Indonesia Jl. Dipatiukur 112-114 Bandung

E-mail : Mashunsofyan@gmail.com1

ABSTRACT

Manually correcting essays that spend more time compared to proofread essays automatically. It takes about 1 minute each question to correct essays manually. If the problem will correct 30 then takes about 30 minutes, while the number of students in vocational Plus An-Naba Sukabumi about 200 people.

Based on these data, the need to develop an automated system that helps process essay grading. Development of Automated Essay Scoring System in this final project uses Latent Semantyc Method Analysis (LSA) is to represent the sentence in a semantic matrix that is then performed mathematical calculations to match or map the presence or absence of the word of the group said in a matrix using linear algebra techniques Singular Value Decomposition (SVD).

Based on the results of the research data of alpha and beta can be drawn a conclusion that the development of an essay correction functionality in SMK Plus An-Naba Sukabumi able to carry out the correction process about the type of essay more quickly.

Keywords: LSA, Semantyc Latent Analysis, Singular Value Decomposition (SVD).

1. INTRODUCTION

Manually correcting essays that spend more time compared to proofread essays automatically. It takes about 1 minute each question to correct essays manually. If the problem will correct 30 then takes about 30 minutes, while the number of students in vocational Plus An-Naba Sukabumi about 200 people.

Based on these data, the need to develop an automated system that helps process essay grading. Development of Automated Essay Scoring System in this final project uses Latent Semantyc Method Analysis (LSA) is to represent the sentence in a semantic matrix that is then performed mathematical calculations to match or map the presence or absence of the word of the group said in a matrix using linear algebra techniques Singular Value Decomposition (SVD).

Based on the results of the research data of alpha and beta can be drawn a conclusion that the development of an essay correction functionality in SMK Plus An-Naba Sukabumi able to carry out the correction process about the type of essay more quickly.

Keywords: LSA, Semantyc Latent Analysis, Singular Value Decomposition (SVD).

1.1 E-Learning

The development of increasingly advanced information technologies have been able to help people in all fields. One area that did not escape the utilization of information technology in the process is in the field of education. the development of increasingly advanced learning how to make a paradigm shift and gave birth to new methods in procedural learning. teaching and learning process can now be made anywhere without direct face to face in a room. Their interaction can be done with the help of electronic media such as computers. Learning with the help of electronic media such as this is now known as e-learning.

Basically the concept of e learning can be classified on the basis of the technology it uses into two types, namely computer based training (CBT), which uses a computer program as the main media used by students. And the kind of which is a web-based training (WBT) is a further development of CBT systems using Internet-based technology enhancements. At WBT types of delivery and access subject matter is done through the internet.

1.2 Learning Management Sistem (LMS)

In e-learning, there are two main parts that sustain the system, ie Learning Management Systems and e-learning content or subject matter to be learned by the user. Learning Management System (LMS) is a system that helps and serves as a platform for e-learning content.

1.3 Automatic Answer Ratings

Each learning requires an evaluation to determine the extent of absorption of information by students. In general there are two kinds of evaluations that can be performed in the learning


(16)

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA)

46

Edisi. .. Volume. .., Bulan 20.. ISSN : 2089-9033

process that is verbally and in writing. Oral exam has the disadvantage of examiners and students must be tested in one room and the same time and require considerable time, especially if the examinees are numerous. While the writing exam is much more efficient because the test can be done at the same time the number of examinees more.

Written test types can be divided into three kinds, namely multiple choice, short stuffing, and essays. Of the three types of tests that can be done in writing the easiest test to be checked automatically is multiple choice. In the multiple-choice type of exam students can simply choose the most correct answers were considered from multiple choice answers. but the weakness of the model multiple choice exam is less failure by examiners determine the extent of knowledge of students tested and the possible presence of the participants answer that gets high marks from the factor of luck by guessing the answers provided. The level of accuracy that can be done by a computer to multiple-choice type of exam can reach 100% because the form is very easy uijan like computer processed simply by comparing the student answer with the answer key in the database.

The next type of written exam is short stuffing. On this kind of field test enough students to fill short answers to questions asked in one or several words. This type of exam is slightly better than multiple-choice because the demands of students to have an answer himself. And other types of written exam is the essay. The essay is an essay that describes the author's opinion on a particular subject is trying judged. Or also can be interpreted as an essay that explores proga in passing but accurate, dense and contains about issues literature, art and culture from the subjective viewpoint of the author. According KBBI essay is paper or essay in prose that describes about a problem from the point of view of the author's straightforward and cursory. The form of essays is a form of testing that accurately able to describe in-depth understanding of students about the topics tested. Furthermore essay exams are also able to stimulate the ability to express opinions in writing.

Exam in the form of essays has shortcomings in terms of resources needed human and time. When an essay exam followed by many participants of the time needed to check the answers will increase anyway. To resolve the problem in the assessment of essay exams, essay grading system automatically using a computer can be a good enough solution.

1.4 Text Preprocessing

Text preprocessing adalah langkah awal sebelum dilakukan sebuah pencocokan string. Proses ini melalui beberapa tahap tindakan yang dilakukan pada sebuah string jawaban dan kunci yang diisi by

teachers and students. The stages are carried out in this process are:

1. Case folding / toLowerCase

Case folding is the stage where the string has been inputted by the user who originally is a mix of capital and lowercase letters generalized to be used to lowercase all. This is done because the computer system distinguishes between "A" and "a" so that the "I" and "I" will be assessed differently in the system. Obviously this will have an effect on string matching between the key and the answer of the student.

2. Removal of punctuation

This stage is the removal of punctuation so that remaining string only consist of letters and numbers only. This stage is done because the system would be built only match strings and numbers have not melibarkan mathematical operations.

3. Elimination of common words (stopword)

Stages stopword is the removal of the words are considered public so that the words are not inserted into the string array that will be matched.

4. Tokenizing

Tokenizing is the stage of cutting the string in the text based on the deed of which it is composed and sisimpan in a variable array.

5. Stemming (deletion prefix and suffix)

Stemming is one of the means used to improve the performance of search and matching words with ways to transform the words into a text document to the basic form. Stemming process is done by eliminating all good additive consisting of a prefix, suffix and inserts as well as a combination of the prefix and suffix. There are many algorithms used to perform the process of stemming. Especially for stemming Indonesian frequently used algorithms are algorithms nazrief and andriani, arifin and Setiono, veda algorithms, etc.

1.5 Matriks Singular Value Decomposition SVD is a so-called linear algebra theorem able to break the block of a matrix A into three new matrix U is an orthogonal matrix, diagonal matrix S, and orthogonal matrix transpose V. SVD theorem is as follows:

Amn = Umm x SMN x VTnn (1)

Where UTU = identity matrix (I), VTV = identity matrix (I). Column matrix U is an orthonormal eigenvector of AAT. While the column matrix V is an orthonormal eigenvector of ATA. and S is a diagonal matrix root of the eigenvalues of matrix U or V in order from the largest.

1.6 Cosine Similarity

Cosine similarity is one similarity calculation method which is the most popular to be


(17)

applied to the text document. The main advantages of the method cosigne similarity is not affected on a short length document. Karna is only taken into account the value of the term of each document. Here is the formula for the cosine similarity.

(2)

Description: A = matrix A B = Matirks B

|| A || = Length Matrix A || B || = Length Matirks B

1.7 Latent Semantic Analysis (LSA)

Latent Semantic Analysis (LSA) is a mathematical calculation method is fully automated techniques in excavation and inference of the relationship between words and sentences in paragraph [6]. LSA algorithm is one of algorithm development in the field of Information retrieval is able to collect a large number of documents in the database and mengghubungkan relationships between documents by matching a given query. The main function of this LSA is to calculate the similarity (similarity) document by comparing the vector representation of each document. Assessment by the LSA method over the words that exist in writing without regard to the order of words and grammar in the text, so that a sentence is considered is based on key words that exist in the sentence.

To calculate the value of essay using the LSA, the way is to create an essay that became the reference document (query) or key answers and then an essay that will be judged in comparison with the reference essay answers, the more resemblance to the greater value of the answer.

Inspection measures essays with LSA method is the first article represented in the matrix where the row shows the keywords (queries) on the document and each column shows the column documents. Each cell shows the number of occurrences of a keyword which is the matrix of documents in the columns of the matrix. Then the contents of the first cell is transformed where every word frequency weighted with a function that shows the importance of a sentence in a paragraph and also the degree which shows how important the type of words in a sentence.

The next step is to do the decomposition of Singular Value Decomposition (SVD) on

word-document matrix. In the SVD matrix containing the keyword appearance frequency decomposition into three matrices that if the three matrices are multiplied it will reappear matrix origin. His first matrix describes the entity as a column vector value orthogonal matrix. Both in the form of a matrix diagonal matrix containing a scalar value matrix. Mathematically, the factors that most good is to use the smallest dimension of the matrix first, so that the reconstruction of the best matrix is generated when the value factor is smaller than the number of factors used.

The dimensions of the matrix which has been simplified by removing the matrix diagonal coefficients as many times as desired until the remaining coefficients are chosen as much dimension. The purpose of this simplification is in order to form a matrix that contains the desired correlation value when three matrix reconstructed. Then the assessment will be done by comparing the correlation matrix of query with a correlation matrix of each document by using the cosine α calculation. 2. CONTENTS OF RESEARCH

Development of correction essays included in the training features in a single page along multiple choice questions. Development is done because it found problems in the system that runs that correction manually essay will take a long time as described in the background research that requires an additional feature of automatic correction of essays in the system. Development added in section exercises with automatic correction feature essays which in the previous system already teradapat features exercises but terabatas only multiple choice questions only.

The system to be developed in this study is an essay about automatic correction system with Semantyc Latent Analysis method. In the process before the system performs the calculation method LSA no processes are done first. The development of this essay correction consists of two subprocesses that process preprocessing and LSA process itself. Preprocessing process consists of a folding case, tokenizing, filtering, and stemming. Here is a flowchart of each process.


(18)

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA)

48

Edisi. .. Volume. .., Bulan 20.. ISSN : 2089-9033

start

Pre processing

Pemrosesan dengan LSA

end

Gambar 1 Flowchart Automated Essay Correction System

To further facilitate the understanding of the process is given an example of matching between the key and answer students' answers. In the following example is one of the replications are held, amounting to 2 essays Indonesian subjects. If a perfect score in this test was 10 then every problem has a weight of 5 in the preparation of these values.

2.1 Analysis methods LSA

Stages are contained in the LSA process consists of four stages in which each stage is no mathematical calculation process. This process is a continuation of the process of preprocessing has been done before to get the value of similarity between the answer and the answer key.

start

Kata kunci dan jawaban dalam bentuk array

Pembuatan matriks

Perhitungan nilai matriks U,S,VT

dengan SVD

Perhitungan vektor kunci jawaban

Perhitungan nilai cosine similarity

Nilai akhir

end

Gambar 2 LSA Process Flowchart

2.2 Calculation of the value of the matrix U, S, VT

Having formed a matrix of size mxn then the next step is to find the value of the matrix U, S, VT with SVD method (Singular Value Decomposition). To obtain the following matrices through some fairly complex calculations ranging from doing transpose matrix, searching for eigenvalues and seek vector eigennya. However, in the implementation of the program, the calculation process can use the library of JAMA that has been providing a function to perform matrix calculations instead of MATLAB to obtain the matrix U, S, VT.

From table 3.7 obtained a 9x4 matrix A with dimensions that will do the SVD to find the value of the U, S, VT. The first step to seek the matrix is to find the matrix AT beforehand.

A

1 1 1 0 0 0 1 1 1 1 0 0 1 1 0 0 1 0 1 1 1 0 0 1


(19)

1 0 1 1 0 1 0 0 1 0 1 0

AT

1 0 1 1 1 1 1 0 1 1 0 1 1 0 0 0 1 0 1 1 0 0 1 0 1 0 1 0 1 0 0 1 1 1 0 0

The next step is to find the value of A * AT and AT * A so we get the following matrix:

AT* A

7 4 4 4 4 5 2 2 4 2 5 3 4 2 3 5

A*AT

3 1 2 2 2 1 3 1 2 1 2 1 0 2 1 2 0 1 2 1 3 2 2 2 3 1 1 2 0 2 2 1 1 2 1 1 2 2 2 1 3 2 3 0 2 1 1 2 1 2 2 2 0 1 3 2 3 2 3 2 4 1 2 1 0 1 1 0 0 1 1 0 2 1 1 1 2 1 2 0 2

Having obtained the multiplication of the matrix A and the transpose of the matrix A above, the next step is to find the eigenvalues by reducing the matrix with lambda multiplied by the identity matrix. The first is to find the eigenvalues of AT * A.

value eigen = 7 4 4 4

-

λ 0 0 0

7 - λ 4 4 4 4 5 2 2 0 Λ 0 0 4 5 - λ 2 2 4 2 5 3 0 0 λ 0 4 2 5 - λ 3

4 2 3 0 0 0 λ 4 2 3 5 - λ

From the above calculation continues to find the polynomial equation (many parts) of the matrix above. The trick is to multiply each element is reduced another element of the side. So didapakan the following equation:

Having obtained a polynomial equation as above the next step is to find the root of the equation thus obtained

λ1 = 15,400 λ2 = 1,235

λ3 = 3.366 λ4 = 2,000

As for the matrix A * AT to do the same process eigenvalues obtained as follows

.λ1 = 15,400 λ2 = 3,366

λ3 = 2,000 λ4 = 1,235

λ5, λ6 , λ7 , λ8, λ9 = 0,000

Having obtained the eigenvalues of each of the above equation next step is to include the value of λ at the beginning of the equation which is then normalized to obtain the following matrices. For eigen vector of the matrix AT * A will be the value of V which will then be transposed into VT. And the vector of eigenvalues of A * AT will be the value of the matrix U. While the diagonal matrix S is obtained from the roots of eigenvalues that have been sorted from the biggest and not zero.

Matriks U

0.386 -0.248 -0.5 -0.025 0.233 0.483 0 -0.533 0.386 -0.248 0.5 -0.025 0.269 -0.489 0 0.251 0.395 0.413 0 0.131 0.279 0.171 0.5 0.408 0.502 -0.006 0 -0.302 0.107 -0.419 0 -0.433 0.279 0.171 -0.5 0.408

Matriks S

3.924 0 0 0

1.835 0 0

0 0 1.414 0

0 0 0 1.111

Matriks VT

0.636 0.421 0.457 0.457 0.129 0.769 -0.443 -0.443 0 0 -0.707 -0.707 0.761 -0.482 -0.307 -0.307


(20)

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA)

50

Edisi. .. Volume. .., Bulan 20.. ISSN : 2089-9033

Having obtained the third matrix next step is to do a simplification of the columns of the matrix. Simplification is done on the matrix U by simplifying the number of columns, the matrix S in rows and columns. This simplification measures carried out in accordance with the value of the dimension of the matrix. so we get the matrix U and S with new dimensions as follows.

Matri ks U 0.3 86 -0.2 48 0.2 33 0.4 83 0.3 86 -0.2 48 0.2 69 -0.4 89 0.3 95 0.4 13 0.2 79 0.1 71 0.5 02 -0.0 06 0.1 07 -0.4 19 0.2 79 0.1 71 Matriks S 3.9

24 0

0 1.8

35

2.3 Perhitungan vektor kunci jawaban

Searches vector matrix Q and each D is done to make the process of calculating the cosine similarity in the next stage. At this stage steps perform matrix multiplication with the set term frequency of each query ditranspose of the matrix U are then multiplied again with the inverse of a matrix S (S-1). The following calculation is an example of the calculation of the key vectors answers (Q).

̅ (2)

̅= q . -0.135 |

So the above matrix calculation results obtained a vector of query answers Q is q -0135 |. By performing the same calculations then each answer will result in the value of the vector as follows:

Value vector Q = | 0617-0135 | Vector values D1 = | 0407 -0813 | Vector values D2 = | 0444 0470 | Vector value D3 = | 0445 0470 |

2.4 Cosine Similarity Value Calculation

Cosine similarity value calculation is done in order to get the value or level of similarity between two vectors. In this case the vector which is the vector will be calculated between each key and answer students' answers. This calculation is done using the formula in the equation below.

(3)

with:

D = the answers students

Q = query answers

A = matrix A

B = Matirks B

|| A || = Length Matrix A

|| B || = Length Matrix B

So that D1 =

So we get the cosine similarity value of D1 by 0644. For other values are also performed by the same process to obtain respectively cosine similarity value as follows :

0.386 -0.248 0.233 0.483 0.389

-0.248

̅= | 1 0 1 1 1 1 1 0 1 |

0.269

-0.489 0.255 0.00 0.395 0.413 0.000 0.545 0.279 0.171

0.502 -0.006 0.107

-0.419 0.279 0.171


(21)

D2 =

D3 =

Having obtained the similarity value of each answer the next step is multiplication by the weight of each question were tested. In this matter has a weight of 5 out of 10 points that exist in a repeat of the two problems, so that when the answer of the students have a perfect similarity with the given key will have 5 points on that question.

So the value of the recommendations obtained by the teacher of correction functionality in the example problems about this model are as follows:

Value recommendation = cosine similarity value * weighting each question

D1 = 0.644 * 5 = 3.2 D2 = 0.566 * 5 = 2.62 D3 = 0.566 * 5 = 2.62

Resulting Value recommendation of three students who have been working on essays with different answers convinced as follows:

The first student or D1 produces a value on 3:20 rounded to 1 decimal figure to 3.2, second or D2 Students generate value recommendations on 2.62 value rounded to 1 decimal figure to 2.6 and the third student or D3 generate value 2.62 on Value recommendation rounded to 1 decimal numbers into 2.6

3. CLOSING

Based on the description and the results of the analysis conducted, it can be concluded that the existence of automated essay correction functionality teachers are able to carry out the correction process about the type of essay more quickly. Previous takes about 1 minute each question to correct essays manually. If the problem will correct 30 then takes about 30 minutes, while the number of students in vocational Plus An-Naba Sukabumi about 200 people. After development takes about 5 seconds to correct each question. If the problem will correct 30 then takes about 150 seconds or 2.5 minutes, whereas if it would correct the 200 questions then takes about 1000 seconds or 5 minutes

For the development of automated essay correction functionality, suggestions for subsequent research in order to use methods other than Latent Semantyc Analysis (LSA) in performing automatic correction essay questions.

BIBLIOGRAPHY

[1] M. P. B. S. Sahriar Hamza, “Sistem Koreksi Soal Essay Otomatis Dengan Menggunakan Metode Rabin Karp,” EECCISS, vol. , no. 2, p. 153, 2013.

[2] B. B. D. H. Anak Agung Putri Ratna, “SIMPLE : SISTEM PENILAI OTOMATIS UNTUK MENILAI UJIAN DALAM BAHASA INDONESIA,” MAKARA TEKNOLOGI, vol. , no. 1, pp. 5-11, 2007.

[3] R. S.Pressman, Software Enginering A Practitioners Approach, New York: McGraw-Hill, 2010.

[4] Munir, “KONTRIBUSI TEKNOLOGI INFORMASI DAN KOMUNIKASI (TIK) DALAM PENDIDIKAN DI ERA GLOBALISASI

PENDIDIKAN INDONESIA,” Indonesian

Comunity on Information and Comunicartion Technology, vol. 2, no. 2, 2009.

[5] D. E. Hartley, Selling e-Learning, ASTD, 2006.

[6] P. W. D. L. Thomas K Launder, An Introduction to Latent Semantic Analysis, 1998. [7] M. S. Rossa A.S M, Rekayasa Perangkat Lunak terstruktur dan berorientasi objek, Bandung: Informatika, 2013.

[8] A. Nugroho, Analisis dan Perancangan Sistem Informasi dengan Metodologi Berorientasi Objek, Bandung: Informatika, 2005.


(22)

iii

KATA PENGANTAR

Segala puji dan syukur senantiasa tercurahkan kepada Allah SWT yang

telah melimpahkan berbagai nikmat kepada setiap manusia tidak terkecuali

penulis sehingga dapat menyelesaikan penyusunan skripsi yang berjudul

Pengembangan Koreksi Soal Esai Otomatis Pada E-Learning di SMK Plus

An-Naba Sukabumi dengan Menggunakan Metode Latent Semantyc Analysis (LSA)

sebagai salah satu syarat kelulusan program Strata Satu (S1) jurusan Teknik

Informatika di Universitas Komputer Indonesia.

Dalam pengerjaan tugas akhir ini penulis juga mendapat banyak bantuan

dan dukungan yang tidak dapat diungkapkan dan dinilai dengan apapun dari

berbagai pihak. Untuk itu dengan segala kerendahan hati penulis ingin

mengucapkan banyak terimakasih kepada :

1.

Ibu Rani Susanto, S.Kom., M.Kom. selaku dosen pembimbing yang

senantiasa dengan penuh kesabaran memberikan arahan dalam penyusunan

tugas akhir ini.

2.

Ibu Ednawati Rainarli, S.Si., M.Si selaku dosen wali sekaligus menjadi

penguji dalam sidang skripsi yang telah memberikan masukan dan arahan

membangun selama masa kuliah.

3.

Bapak Irfan Maliki, S.T., M.T. yang telah bersedia menjadi penguji dalam

seminar dan siding skripsi untuk kemudian memberikan masukan dan

arahan guna menyempurnakan penelitian yang dilakukan oleh penulis.

4.

Bapak Irawan Afrianto, S.T, M.T selaku Ketua Program Studi Teknik

Informatika, terima kasih banyak atas bimbingan selama saya kuliah di

Universitas Komputer Indonesia.

5.

Rekan hidup terbaik saya satu perjuangan, satu visi kedepan membangun

peradaban ISLAM, satu angkatan serta satu jurusan yakni kang Aji Teja

Hartanto yang telah membantu dan mendampingi.


(23)

iv

6.

Seluruh keluarga besar LDK UMMI UNIKOM dan BKLDK Bandung

yang telah memberikan pelajaran dan arti hidup selama berada di

kampus UNIKOM.

7.

Keluarga besar SMK Plus An-Naba Sukabumi yang telah membantu

dalam proses penelitian serta guru saya kang Ruston Pirmansyah.

8.

Seluruh keluarga besar angkatan 2011 khususnya kelas IF-12. Kalian

luar biasa teman, semoga kita semua menjadi manusia yang membawa

manfa’at bagi kehidup

an ini.

9.

Semua pihak yang telah membantu baik secara langsung maupun tidak

langsung yang tidak bisa penulis sebutkan satu persatu.

Saya menyadari bahwa masih banyak kekurangan dalam

pembuatan Tugas Akhir ini. Untuk itu, sumbangan kritik dan saran

sangat saya harapkan dari pembaca. Semoga laporan ini dapat

memberikan manfaat khususnya pembaca secara umum.

Bandung, 10 Agustus 2015


(24)

(25)

E-1


(26)

SURAT PERNYATAAN TIDAK PLAGIAT

Bandung, 19 Agustus 2015

Saya yang bertanda tangan di bawah ini:

Nama : Mashun Sofyan

NIM : 10111518

Judul Skripsi : Pengembangan Koreksi Soal Esai Otomatis Pada E-Learning di SMK

Plus An-Naba Sukabumi dengan Menggunakan Metode Latent Semantyc Analysis (LSA)

Menyatakan bahwa saya tidak melakukan tindakan meniru, menyalin atau menjiplak

skripsi atau karya ilmiah yang telah ada. Apabila saya terbukti melakukan tindakan tersebut,

maka saya bersedia untuk menerima sanksi yang diberikan sesuai dengan ketentuan yang

ditetapkan dan berlaku di Program Studi Teknik Informatika Universitas Komputer Indonesia.

Mengetahui,

Yang memberi pernyataan

(Mashun Sofyan)

10111518


(1)

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA)

51

Edisi. .. Volume. .., Bulan 20.. ISSN : 2089-9033

D2 =

D3 =

Having obtained the similarity value of each answer the next step is multiplication by the weight of each question were tested. In this matter has a weight of 5 out of 10 points that exist in a repeat of the two problems, so that when the answer of the students have a perfect similarity with the given key will have 5 points on that question.

So the value of the recommendations obtained by the teacher of correction functionality in the example problems about this model are as follows:

Value recommendation = cosine similarity value * weighting each question

D1 = 0.644 * 5 = 3.2 D2 = 0.566 * 5 = 2.62 D3 = 0.566 * 5 = 2.62

Resulting Value recommendation of three students who have been working on essays with different answers convinced as follows:

The first student or D1 produces a value on 3:20 rounded to 1 decimal figure to 3.2, second or D2 Students generate value recommendations on 2.62 value rounded to 1 decimal figure to 2.6 and the third student or D3 generate value 2.62 on Value recommendation rounded to 1 decimal numbers into 2.6

3. CLOSING

Based on the description and the results of the analysis conducted, it can be concluded that the existence of automated essay correction functionality teachers are able to carry out the correction process about the type of essay more quickly. Previous takes about 1 minute each question to correct essays manually. If the problem will correct 30 then takes about 30 minutes, while the number of students in vocational Plus An-Naba Sukabumi about 200 people. After development takes about 5 seconds to correct each question. If the problem will correct 30 then takes about 150 seconds or 2.5 minutes, whereas if it would correct the 200 questions then takes about 1000 seconds or 5 minutes

For the development of automated essay correction functionality, suggestions for subsequent research in order to use methods other than Latent Semantyc Analysis (LSA) in performing automatic correction essay questions.

BIBLIOGRAPHY

[1] M. P. B. S. Sahriar Hamza, “Sistem Koreksi Soal Essay Otomatis Dengan Menggunakan

Metode Rabin Karp,” EECCISS, vol. , no. 2, p.

153, 2013.

[2] B. B. D. H. Anak Agung Putri Ratna,

“SIMPLE : SISTEM PENILAI OTOMATIS

UNTUK MENILAI UJIAN DALAM BAHASA

INDONESIA,” MAKARA TEKNOLOGI, vol. ,

no. 1, pp. 5-11, 2007.

[3] R. S.Pressman, Software Enginering A Practitioners Approach, New York: McGraw-Hill, 2010.

[4] Munir, “KONTRIBUSI TEKNOLOGI INFORMASI DAN KOMUNIKASI (TIK) DALAM PENDIDIKAN DI ERA GLOBALISASI

PENDIDIKAN INDONESIA,” Indonesian

Comunity on Information and Comunicartion Technology, vol. 2, no. 2, 2009.

[5] D. E. Hartley, Selling e-Learning, ASTD, 2006.

[6] P. W. D. L. Thomas K Launder, An Introduction to Latent Semantic Analysis, 1998. [7] M. S. Rossa A.S M, Rekayasa Perangkat Lunak terstruktur dan berorientasi objek, Bandung: Informatika, 2013.

[8] A. Nugroho, Analisis dan Perancangan Sistem Informasi dengan Metodologi Berorientasi Objek, Bandung: Informatika, 2005.


(2)

iii

KATA PENGANTAR

Segala puji dan syukur senantiasa tercurahkan kepada Allah SWT yang telah melimpahkan berbagai nikmat kepada setiap manusia tidak terkecuali penulis sehingga dapat menyelesaikan penyusunan skripsi yang berjudul

“Pengembangan Koreksi Soal Esai Otomatis Pada E-Learning di SMK Plus An-Naba Sukabumi dengan Menggunakan Metode Latent Semantyc Analysis (LSA)” sebagai salah satu syarat kelulusan program Strata Satu (S1) jurusan Teknik Informatika di Universitas Komputer Indonesia.

Dalam pengerjaan tugas akhir ini penulis juga mendapat banyak bantuan dan dukungan yang tidak dapat diungkapkan dan dinilai dengan apapun dari berbagai pihak. Untuk itu dengan segala kerendahan hati penulis ingin mengucapkan banyak terimakasih kepada :

1. Ibu Rani Susanto, S.Kom., M.Kom. selaku dosen pembimbing yang senantiasa dengan penuh kesabaran memberikan arahan dalam penyusunan tugas akhir ini.

2. Ibu Ednawati Rainarli, S.Si., M.Si selaku dosen wali sekaligus menjadi penguji dalam sidang skripsi yang telah memberikan masukan dan arahan membangun selama masa kuliah.

3. Bapak Irfan Maliki, S.T., M.T. yang telah bersedia menjadi penguji dalam seminar dan siding skripsi untuk kemudian memberikan masukan dan arahan guna menyempurnakan penelitian yang dilakukan oleh penulis. 4. Bapak Irawan Afrianto, S.T, M.T selaku Ketua Program Studi Teknik

Informatika, terima kasih banyak atas bimbingan selama saya kuliah di Universitas Komputer Indonesia.

5. Rekan hidup terbaik saya satu perjuangan, satu visi kedepan membangun peradaban ISLAM, satu angkatan serta satu jurusan yakni kang Aji Teja Hartanto yang telah membantu dan mendampingi.


(3)

iv

6. Seluruh keluarga besar LDK UMMI UNIKOM dan BKLDK Bandung yang telah memberikan pelajaran dan arti hidup selama berada di kampus UNIKOM.

7. Keluarga besar SMK Plus An-Naba Sukabumi yang telah membantu dalam proses penelitian serta guru saya kang Ruston Pirmansyah. 8. Seluruh keluarga besar angkatan 2011 khususnya kelas IF-12. Kalian

luar biasa teman, semoga kita semua menjadi manusia yang membawa

manfa’at bagi kehidupan ini.

9. Semua pihak yang telah membantu baik secara langsung maupun tidak langsung yang tidak bisa penulis sebutkan satu persatu.

Saya menyadari bahwa masih banyak kekurangan dalam pembuatan Tugas Akhir ini. Untuk itu, sumbangan kritik dan saran sangat saya harapkan dari pembaca. Semoga laporan ini dapat memberikan manfaat khususnya pembaca secara umum.

Bandung, 10 Agustus 2015


(4)

(5)

E-1


(6)

SURAT PERNYATAAN TIDAK PLAGIAT

Bandung, 19 Agustus 2015

Saya yang bertanda tangan di bawah ini:

Nama : Mashun Sofyan NIM : 10111518

Judul Skripsi : Pengembangan Koreksi Soal Esai Otomatis Pada E-Learning di SMK Plus An-Naba Sukabumi dengan Menggunakan Metode Latent Semantyc Analysis (LSA)

Menyatakan bahwa saya tidak melakukan tindakan meniru, menyalin atau menjiplak skripsi atau karya ilmiah yang telah ada. Apabila saya terbukti melakukan tindakan tersebut, maka saya bersedia untuk menerima sanksi yang diberikan sesuai dengan ketentuan yang ditetapkan dan berlaku di Program Studi Teknik Informatika Universitas Komputer Indonesia.

Mengetahui, Yang memberi pernyataan

(Mashun Sofyan) 10111518