Identifikasi standar nasional pendidikan yang berpengaruh terhadap ujian nasional dengan metode pohon regresi

IDENTIFIKASISTANDAR NASIONAL PENDIDIKAN YANG
BERPENGARUH TERHADAP UJIAN NASIONAL SMA DI
PULAU JAWA DENGAN METODE POHON REGRESI

HIDAYATI TAMIMI SARI

DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014

PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Identifikasi Standar
Nasional Pendidikan yang Berpengaruh terhadap Ujian Nasional SMA di Pulau
Jawa dengan Metode Pohon Regresiadalah benar karya saya denganarahan dari
komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan
tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang
diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks
dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.

Bogor, Oktober 2014
Hidayati Tamimi Sari
NIM G14100021

ABSTRAK
HIDAYATI TAMIMI SARI.Identifikasi Standar Nasional Pendidikan yang
Berpengaruh terhadap Ujian Nasional dengan Metode Pohon Regresi. Dibimbing
oleh ANIK DJURAIDAH dan DIAN KUSUMANINGRUM.
Pencapaian nilai Standar Nasional Pendidikan untuk Sekolah Menengah
Atas di Pulau Jawa pada tahun 2013 menunjukkan adanya keragaman. Perbedaan
ketercapaian Standar Nasional Pendidikan ini dapat memengaruhi nilai Ujian
Nasional (UN). Hal yang dapat dilakukan untuk memaksimalkan pencapaian nilai
UN adalah dengan mengklasifikasikan rata-rata nilai UN berdasarkan faktorfaktor yang berpengaruh terhadap nilai UN. Metode pohon regresi merupakan
salah satu metode yang dapat digunakan untuk klasifikasi data dengan peubah
respon berupa data numerik. Evaluasi kestabilan pohon optimum dilakukan
dengan melakukan pengambilan contoh acak sebanyak tiga kali tanpa
pengulangan. Pohon yang dihasilkan dari pengulangan tersebut berbeda-beda, hal

ini menunjukkan ketidakstabilan. Penentuan peubah yang stabil dilakukan dengan
random forest. Hasil dari random forest menunjukkan peubah yang stabil,
diantaranya provinsi, Standar Sarana dan Prasarana, dan Standar Kompetensi
Lulusan. Ketiga peubah tersebut merupakan peubah yang berkontribusi besar
terhadap nilai UN. D.K.I Jakarta dan Jawa Timur perlu memperhatikan Standar
Kompetensi Lulusan, sedangkan Banten, D.I Yogyakarta, Jawa Barat, dan Jawa
Tengah perlu memperhatikan Standar Sarana dan Prasarana untuk mendapatkan
nilai UN yang lebih baik.
Kata kunci:pohon regresi, random forest, standar nasional pendidikan

ABSTRACT
HIDAYATI TAMIMI SARI. Identification of National Education Standards that
Influence the National Exam with Regression Trees Method. Adviced by ANIK
DJURAIDAH and DIAN KUSUMANINGRUM.
Achievement of The National Education Standard for high schools in Java
Island in 2013 showed variation. The difference in the achievement of The
National Education Standard can affect the student’s score in The National Exam
(UN). A solution for maximizing UN is classifiying the student’s score of UN
based on the factors that are associated with UN. Regression tree analysis method
is one of the classification method which can be used for numerical response

variable. Evaluation of stability of the optimum tree is done by resampling three
times with no replacements. The trees obtained from the procedure showed
differences which indicates instability. Therefore this method should be continued
with random forest method to see which variables are stable. The stable
explanatory variables based on random forest are provinces, Infrastructure
Standards, and Competency Standards. These three variables are the variables that
highly contribute to UN. D.K.I Jakarta and East Java should concern to improve
Competency Standards, while Banten, D.I Yogyakarta, West Java and Centre Java
should concern toimprove Infrastructure Standards to a the better score of UN.
Keywords:regression trees, random forest, national standards of education

IDENTIFIKASISTANDAR NASIONAL PENDIDIKAN YANG
BERPENGARUH TERHADAP UJIAN NASIONAL SMA DI
PULAU JAWA DENGAN METODE POHON REGRESI

HIDAYATI TAMIMI SARI

Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Statistika

pada
Departemen Statistika

DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014

Judul Skripsi :Identifikasi Standar Nasional Pendidikan yang Berpengaruh
terhadap Ujian Nasional SMA di Pulau Jawa dengan Metode
Pohon Regresi
Nama
: Hidayati Tamimi Sari
NIM
: G14100021

Disetujui oleh

Dr Ir Anik Djuraidah, MS

Pembimbing I

Dian Kusumaningrum, SSi, MSi
Pembimbing II

Diketahui oleh

Dr Anang Kurnia, MSi
Ketua Departemen

Tanggal Lulus:

PRAKATA
Puji dan syukur penulis ucapkan kepada Allah subhanahu wa ta’ala atas
segala karunia-Nya sehingga penulis bisa menyelesaikan karya ilmiah ini. Karya
ilmilah ini berjudul“Identifikasi Standar Nasional Pendidikan yang Berpengaruh
terhadap Ujian Nasional SMA di Pulau Jawa dengan Metode Pohon Regresi”
merupakan salah satu syarat untuk mendapat gelar Sarjana Statistika pada
Departemen Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Institut
Pertanian Bogor.

Terima kasih penulis ucapkan kepada Ibu Dr Ir Anik Djuraidah, MS dan Ibu
Dian Kusumaningrum, SSi, MSi selaku pembimbingyang telah banyak memberi
saran dan masukan dalam penyelesaian penyusunan skripsi ini.Terimakasih
kepada Bapak La Ode Abdul Rahman SSi, MSi selaku penguji sidang akhir
penulis yang telah memberikan banyak masukan untuk karya ilmiah ini.
Terimakasih kepada staff Kemdikbud bagian Pusat Penelitian dan Kebijakan
(PUSLITJAK) yang telah memberikan data untuk karya ilmiah ini. Ucapan terima
kasih juga penulis sampaikan kepada papa, mama, Lili serta seluruh keluarga
tersayang yang senantiasa memberikan doa, dukungan, nasihat kepada penulis.
Ungkapan terima kasih juga disampaikan kepada seluruh dosen dan staf
Departemen Statistika yang telah membantu penulis selama kuliah sampai
terselesaikannya karya ilmiah ini. Tak lupa pula ungkapan terima kasih penulis
ucapkan kepada teman-teman STK 47 atas kebersamaannya selama ini.
Semoga karya ilmiah ini bermanfaat.

Bogor, Oktober 2014
Hidayati Tamimi Sari

DAFTAR ISI
DAFTAR TABEL


ix

DAFTAR GAMBAR

ix

DAFTAR LAMPIRAN

ix

PENDAHULUAN

1

Latar Belakang

1

Tujuan Penelitian


2

TINJAUAN PUSTAKA

2

Standar Nasional Pendidikan

2

CART (Classificasion and Regression Tree)

3

Pohon Regresi

4

Random Forest (RF)


6

METODE

7

Data

7

Metode

7

HASIL DAN PEMBAHASAN

8

Analisis Deskriptif


8

Analisis Pohon Regresi

9

Random Forest

11

SIMPULAN

13

SARAN

13

DAFTAR PUSTAKA


14

LAMPIRAN

15

RIWAYAT HIDUP

23

DAFTAR TABEL
Tabel 1 Perbandingan nilai KTG
Tabel 2 Kepentingan peubah penjelas berdasarkan random forest

11
12

DAFTAR GAMBAR
Gambar 1
Gambar 2
Gambar 3
Gambar 4
Gambar 5

Diagram Cart
Pohon regresi maksimal
Plot perbandingan kesalahan relatif dengan jumlah simpul
Pohon regresi optimum
Penurunan skor kepentingan

3
9
10
10
12

DAFTAR LAMPIRAN
Lampiran 1 Penjelasan peubah yang digunakan
Lampiran 2 Indikator komponen Standar Nasional Pendidikan
Lampiran 3 Proses analisis data
Lampiran 4 Tabel ringkasan statistik dari peubah yang digunakan
Lampiran 5 Diagram kotak garis antar peubah pada setiap provinsi
Lampiran 6 Pohon regresi optimum yang tidak stabil

15
16
19
20
20
21

PENDAHULUAN
Latar Belakang
Pendidikan memiliki peranan penting yang dapat meningkatkan kualitas
sumber daya manusia.Kemajuan suatu bangsa dapat dilihat dari kualitas
pendidikan bangsa tersebut, sehingga mutu pendidikan perlu diperhatikan.Suatu
ukuran dibutuhkan untuk melihat kinerja sistem pendidikan di Indonesia.
Pemerintah menetapkan kriteria minimal tentang sistem pendidikan di seluruh
wilayah hukum Negara Kesatuan Republik Indonesia berupa Standar Nasional
Pendidikan (SNP).(Tilaar 2006)
Menurut Undang-Undang Republik Indonesia No. 20 Tahun 2003 Pasal 1
Ayat (17) SNP adalah kriteria minimal tentang sistem pendidikan di seluruh
wilayah hukum Negara Kesatuan Republik Indonesia. SNP mencakup Standar
Kompetensi Lulusan (SKL), Standar Isi (ISI), Standar Proses (PRS), Standar
Pendidik dan Tenaga Kependidikan (PTK),Sarana dan Prasarana (SARPRAS),
Pengelolaan (PNG), Pembiayaan, serta Penilaian (Tilaar2006).Fungsi SNP adalah
mengukur kualitas pendidikan, pemetaan masalah pendidikan, penyusunanstrategi
dan rencana pengembangan sesudah diperolehdata dari evaluasi belajar nasional
seperti Ujian Nasional (UN). Hasil UN memiliki kaitan yang erat dengan
pencapaian SNP. Sekolah dengan pencapaian SNP yang tinggi diharapkan
memiliki hasil UN yang baik(Tilaar 2006).
SNP yang sudah diterapkan pemerintahbelum dapat diterapkan dengan baik
oleh seluruh wilayah di Pulau Jawa. Berdasarkan data pencapaian SNP untuk
SMA di Pulau Jawa menunjukkannilai pencapaian SNPyang bervariasi sebagai
contoh yaitu pada pencapaian SNP untuk sekolah yang memiliki akreditasi A, B,
maupun C menunjukkanterdapatbeberapa kasus sekolahyang memiliki nilai
pencapaian SNP yang tinggidi salah satu standar atau lebih, hal ini berlaku
sebaliknya. Keragaman pencapaian nilai SNP juga terjadi pada sekolah yang
berstatus negeri dan swasta.Hal ini menunjukkan bahwa terdapat beberapa faktor
lain yang perlu ditelitiyang menyebabkan terdapatnya keragaman nilai pencapaian
SNP di Pulau Jawa. Perbedaan ketercapaian SNP ini dapat mempengaruhi nilai
UN. Oleh karena itu, faktor-faktor lain seperti akreditasi, status sekolah, provinsi,
dan kabupaten/kota juga perlu diteliti untuk melihat pengaruhnya terhadap nilai
UN. Suatu analisis diperlukan untuk mengetahui SNP dan faktor-faktor lain yang
mempengaruhi nilai UN sehingga sekolah dapat lebih memaksimumkan
pencapaian standar-standar yang berkontribusi besar terhadap nilai UN.
Metode yang dapat digunakan untuk melihat faktor-faktor penciri yang
berpengaruh terhadap nilai UN adalah Classificasion and Regression
Tree(CART). Menurut Breimen et al. (1993), CART merupakan metode analisis
statistiknonparametrik yang dikembangkan untuk analisis klasifikasi, baik
digunakan untuk peubah respon dengan skala pengukuran numerik maupun
kategorik, selain itu CART merupakan salah satu metode analisis yang dapat
digunakan untuk melihat faktor-faktor yang memepengaruhi peubah
respon.Keunggulan dariCART adalah tidak ada asumsi yang harus dipenuhi dan
mudah untuk diinterpretasikan.
Pengunaan metode analisis CART pada data contoh terkadang
mengakibatkan ketidakstabilan dari hasil pembentukan pohon regresi. Menurut

2

Berk (2008), ketidakstabilan bisa diakibatkan oleh ukuran data contoh yang kecil,
simpul terminal yang heterogen, dan korelasi yang cukup tinggi antar peubah
penjelas. Metode pohon gabungan (ensamble tree) adalah suatu metode untuk
menangani ketidakstabilan pohon regresi (Sartono dan Syafitri 2010). Metode
pohon gabunganyang digunakan pada penelitian ini untuk menghasilkan peubahpeubah yang stabil dalam pohon regresi adalah random forest.
Random forestmerupakan pohon gabungan yang berasal dari pengembangan
metode CART.Metode random forest menggunakan tahapan bootstrap untuk
pengambilan contoh pada setiap pembentukan pohon regresi. Pengidentifikasian
peubah penjelas yang berpengaruh terhadap peubah respon yang dilakukan
dalamrandom forest menghasilkan ukuran tingkat kepentingan (variable
importance) peubah penjelas yang digunakan untuk mendapatkan peubah penjelas
yang stabil.

Tujuan Penelitian
Tujuan penelitian ini adalah menganalisis faktor-faktor yang berpengaruh
terhadap ujian nasional SMA di Pulau Jawa menggunakan pendekatan pohon
regresi sehingga didapatkan peubah-peubah yang menjadi penciri untuk
mendapatkan hasil UN yang maksimal dan untuk mengklasifikasikan sekolahsekolah SMA sesuai dengan nilai UN dan pencapaian SNP yang dimiliki.

TINJAUAN PUSTAKA
Standar Nasional Pendidikan
Berdasarkan Peraturan Pemerintah No.19 Tahun 2005, ruang lingkup
standar nasional pendidikan meliputi:
1. Standar Isi, standar nasional pendidikan yang mencakup lingkup materi dan
tingkat kompetensi pada jenjang dan jenis pendidikan tertentu. Standar isi
diatur lebih lanjut dalam Permendiknas No.22 Tahun 2006.
2. Standar Proses, yaitu standar nasional pendidikan yang berkaitan dengan
pelaksanaan pembelajaran pada satu satuan pendidikan untuk mencapai satndar
kompetensi lulusan. Standar Proses diatur lebih lanjut dalam Permendiknas
No.41 Tahun 2007.
3. Standar Kompetensi Lulusan, yaitu standar nasional pendidikan yang
digunakan sebagai pedoman dalam penentuan kelulusan peserta didik dari
satuan pendidikan. Standar Kompetensi Lulusan diatur lebih lanjut dalam
Permendiknas No.23 Tahun 2006.
4. Standar Pendidik dan Tenaga Kependidikan, yaitu standar nasional pendidikan
yang mengharuskan pendidik untuk memiliki kualifikasi dan kompetensi
sebagai agen pembelajaran, serta memiliki kemampuan untuk mewujudkan
tujuan pendidikan nasional. Standar Pendidik dan Tenaga Kependidikan diatur
lebih lanjut dalam Permendiknas No.18 Tahun 2007.
5. Standar Sarana dan Prasarana, yaitu standar nasional pendidikan yang berkaitan
dengan kriteria minimal sarana dan prasarana yang mencakup ruang belajar,

3

tempat berolahraga, tempat beribadah, serta sumber belajar lain yang
diperlukan untuk menunjang proses pembelajaran. Standar Sarana dan
Prasarana diatur dalam Permendiknas No. 24 Tahun 2007.
6. Standar Pengelolaan, yaitu standar nasional pendidikan yang berkaitan dengan
perencanaan, pelaksanaan, dan pengawasan kegiatan pendidikan pada tingkat
satuan pendidikan. Standar Pengelolaan diatur lebih lanjut dalam Permendiknas
No.19 Tahun 2007.
7. Standar Pembiayaan Pendidikan, yaitu standar nasional pendidikan yang terdiri
dari biaya investasi, biaya operasi, dan biaya personal. Standar Pembiayaan
Pendidikan diatur lebih lanjut dalam Permendiknas No.69 Tahun 2009.
8. Standar Penilaian Pendidikan,yaitu standar nasional pendidikan yang berkaitan
dengan mekanisme, prosedur, dan instrumen penilaian hasil belajar peserta
didik. Standar Penilaian Pendidikan diatur lebih lanjut dalam Permendiknas
No.20 Tahun 2007.

CART (Classificasion and Regression Tree)
CART adalah metode statistik nonparametrik yang dikembangkan
berdasarkan kaidah pohon keputusan. Pohon keputusan dibentuk menggunakan
algoritma penyekatan secara biner (binary recursive partititoning). Dikatakan
biner karena CART mengelompokkan peubah respon berdasarkan peubahpeubah penjelasnya ke dalam dua sekatan yang disebut simpul anak. Proses
pengelompokan tersebut dilakukan secara berulang sehingga membentuk struktur
pohon biner, seperti pada Gambar 1.
node/simpul

A
Ya

Tidak

C

X1