The Application of Regression Tree on Student’s Achievement at Al- Atiqiyah Senior High School Sukabumi
APLIKASI REGRESSION TREE PADA PRESTASI
SISWA SMA AL-ATIQIYAH SUKABUMI
PIPIH
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2012
PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI
Dengan ini saya menyatakaan bahwa tesis Aplikasi Regression Tree pada
Prestasi Siswa SMA Al-Atiqiyah adalah karya saya dengan arahan dari komisi
pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan
tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang
diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan
dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.
Bogor, Juli 2012
Pipih
NIM G151070121
ABSTRACT
PIIPIH. The Application of Regression Tree on Student’s Achievement at AlAtiqiyah Senior High School Sukabumi. Supervised by ERFIANI and HARI
WIJAYANTO.
Regression Tree (Regression Trees) is a non-parametric technique. This technique
is used to explore the large and complex data. Complex dimensions can be formed
large data, mixed data types, such as continuous and categorical, either nominal or
ordinal. One application of regression tree is in the field of education, including to
determine the factors that affect student’s achievement (academic ability) students
that is the results of National Examination (UN). There are many factors
influenced student’s achievement, those are internal and external factors. There
are four factors that most influenced on student’s achievement, those are
environment where the student lived, the average score of student’s report, final
test, and gender.
Keyword: regression tree, student’s achievement, complex data
RINGKASAN
PIPIH. Aplikasi Regression Tree pada Prestasi Siswa SMA Al-Atiqiyah
Sukabumi. Dibimbing oleh ERFIANI dan HARI WIJAYANTO.
Regression Tree (Pohon Regresi) adalah salah satu metode yang
menggunakan kaidah pohon keputusan (decision tree). Pohon keputusan dibentuk
dengan algoritma penyekatan rekursif. Keabsahan penggunaan analisis regresi
sangat tergantung pada berbagai asumsi, sehingga sulit untuk mendapatkan
dugaan persamaan regresi yang memenuhi semua asumsi. Masalah tersebut dapat
diatasi dengan metode regresi yang tidak lagi terikat pada berbagai asumsi. Salah
satu pendekatan yang dapat digunakan untuk mengatasi masalah ini adalah
dengan menggunakan regresi dengan metode pohon biner (Breimen et al. 1993).
Metode berstruktur pohon telah digunakan di berbagai riset dalam beberapa
tahun terakhir terutama di bidang terapan. Salah satu riset yang menggunakan
metode tersebut antara lain riset pemasaran (segmentasi pasar), kedokteran
(diagnosis), ilmu komputer, botani, psikologi, dan linguistik (Faridhan 2003).
Penyusunan pohon keputusan dalam ilmu sosial dimulai pada awal 1960 (AID).
Leo Breiman, Jerome H. Friedman, Richard A. Olshen dan Charles J. Stone
sekitar tahun 1980-an dalam buku Breiman et al. (1993) mengusulkan suatu
algoritma baru untuk penyusunan pohon yaitu Classification and Regression Tree
(CART). Penyusunan pohon dapat dilihat sebagai salah satu cara pemilihan
variabel.
Salah satu bidang penerapan analisis pohon regresi adalah bidang pendidikan.
Data kemampuan akademik siswa berupa nilai hasil Ujian Nasional (UN) dapat
dijadikan sebagai salah satu indikator untuk mengukur prestasi siswa. Tingkat
keberhasilan akademik siswa dipengaruhi oleh faktor internal dan eksternal siswa.
Faktor internal yang mempengaruhi intelegensi diantaranya kesehatan,
intelegensi, minat dan motivasi. Faktor eksternal diantaranya yaitu keluarga,
sekolah, masyarakat dan lingkungan sekitar (Djaali 2007)
Tujuan dari penelitian ini adalah menentukan pohon optimal dari pohon
regresi untuk mencari semua kemungkinan peubah (faktor-faktor penciri) yang
berpengaruh terhadap nilai Ujian Nasional siswa SMA Al-Atiqiyah Sukabumi,
dan memberikan masukan kepada SMA Al-Atiqiyah agar lebih meningkatkan
prestasi siswa dengan memperhatikan faktor-faktor yang paling berpengaruh
terhadap nilai Ujian Nasional.
Data yang digunakan dalam penelitian ini adalah data primer yang diperoleh
dari arsip SMA Al-Atiqiyah. Data yang dianalisis adalah seluruh siswa tahun
2011 dan 2012 untuk program IPS dan IPA yang berjumlah 181 orang. Peubah
respon yang diamati adalah nilai Ujian Nasional, sedangkan peubah penjelas yang
digunakan adalah faktor-faktor internal dan eksternal yang dapat mempengaruhi
intelegensi siswa yaitu, jenis kelamin, jurusan di SMA, nilai UAS, rata-rata nilai
rapor, status akreditasi sekolah asal, tempat tinggal selama sekolah, pendidikan
terakhir ayah, pekerjaan ayah, penghasilan ayah perbulan.
Tahapan analisis data dimulai dengan melakukan eksplorasi dan uji nilai
tengah terhadap masing-masing peubah. Hasil uji nilai tengah menunjukkan
bahwa terdapat 5 peubah yang memiliki nilai p-value yang nyata yaitu peubah
jenis kelamin, nilai UAS, nilai rapor, tempat tinggal selama sekolah, dan
pendidikan orang tua. Pohon optimum yang diperoleh dari hasil pohon regresi
berdasarkan aturan Cost Complexity Minimum dan penggunaan validasi Silang
lipat-10 (10-fold Cross validation) menghasilkan lima buah simpul terminal.
Kajian ini menunjukkan bahwa keberhasilan prestasi akademik (UN) siswa SMA
Al-Atiqiyah dipengaruhi oleh tempat tinggal siswa selama menempuh pendidikan,
nilai rata-rata raport dari tiap semester, nilai ujian akhir sekolah, dan jenis kelamin
siswa. Dilihat dari hasil karakteristik kelompok nilai UN siswa menunjukkan
bahwa kelompok siswa yang tinggal di pesantren dan nilai Ujian Akhir Sekolah
lebih dari 8.42 merupakan kelompok siswa dengan nilai UN tertinggi yaitu 8.26,
sedangkan untuk kelompok siswa yang yang tinggal di luar pesantren (tinggal
dengan orangtua ataupun kost) dan memiliki nilai rata-rata raport sewaktu di SMA
lebih dari 7.99 dan berjenis kelamin laki-laki merupakan kelompok siswa dengan
nilai UN terendah yaitu sebesar 7.43.
Kata Kunci: pohon regresi, prestasi akademik, data yang komplek
© Hak Cipta milik IPB, tahun 2012
Hak Cipta dilindungi Undang-undang
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan
atau menyebutkan sumbernya.Pengutipan hanya untuk kepentingan pendidikan,
penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau
tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan
yang wajar bagi IPB.
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh Karya tulis
dalam bentuk apa pun tanpa izin IPB
APLIKASI REGRESSION TREE PADA PRESTASI
SISWA SMA AL-ATIQIYAH SUKABUMI
PIPIH
Tesis
Sebagai salah satu syarat untuk memperoleh gelar
Magister Sains pada
Program Studi Statistika
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2012
Penguji Luar Komisi pada Ujian Tesis: Dr. Ir. I Made Sumertajaya, M.Si
Judul Tesis
Nama
NRP
Program Studi
: Aplikasi Regression Tree pada Prestasi Siswa SMA ALAtiqiyah Sukabumi
: Pipih
: G151070121
: Statistika
Disetujui
Komisi Pembimbing
Dr. Ir. Hari Wijayanto, M.Si
Anggota
Dr. Ir. Erfiani, M.Si
Ketua
Diketahui,
Ketua Program Studi Statistika
Dekan Sekolah Pascasarjana
Dr. Ir. Erfiani, M.Si
Dr. Ir. Dahrul Syah, M.Sc.Agr
Tanggal Ujian: 25 Juli 2012
Tanggal Lulus:
PRAKATA
Segala puji bagi Allah SWT, rahmat dan salamnya semoga tercurah kepada
Nabi Muhammad SAW. Berkat pertolonganNya dan kekuatanNya penulis dapat
menyelesaikan tesis yang berjudul “ Aplikasi Regression Tree pada Prestasi Siswa
SMA Al-Atiqiyah Sukabumi”.
Pada kesempatan ini penulis mengucapkan terimakasih kepada:
1. Dr. Ir. Erfiani M.Si sebagai ketua komisi pembimbing yang telah
memberikan bimbingan dengan penuh kesabaran dan informasinya yang
sangat bermanfaat bagi penulis.
2. Dr. Ir. Hari Wijayanto M. Si. sebagai anggota komisi pembimbing yang telah
memberi masukan dan koreksinya dengan penuh kesabaran dan ketelitian.
3. Dr. Ir. I Made Sumertajaya, M.Si sebagai penguji luar komisi pada ujian tesis.
4. KH. Drs. Wawan Khoerul Anwar MPd. Sebagai Ketua Yayasan Al-Atiqiyah,
KH.Asep Saefulloh S.E. sebagai Kepala Sekolah SMA Al-Atiqiyah, yang
telah memberikan izin untuk kuliah dan dukungannya.
5. Suami tercinta, Dr. Sulasman, M. Hum. yang berjasa dalam pemulihan
kesehatan dan penuh kesabaran untuk memberikan motivasi. Ibuku tercinta,
Hj. Siti Aisyah yang selalu mendo’akan, anak-anakku tersayang Jilsy Dzikrina
Zulvi, Muhammad Zaky Avicenna, dan Faza Fauzan Adhima untuk pengertian
dan do’anya, serta semua keluarga yang telah banyak membantu selama
penulis kuliah.
6. Mba Ida Mariati Hutabarat, M.Si., teman-teman Statistika S2 2007-2011, dan
Adik-adik S1 tersayang (Ferdian, Betha, dan Agus) yang banyak membantu
dalam penulisan tesis.
7. Dewan Guru Al-Atiqiyah khususnya Saepudin Rahmatulloh MSi, Encep
Abdur Rozak, Lala Agus Salim, Deni, Ence yang banyak membantu
mengumpulkan data dan memberikan dukungannya, semua santri yang selalu
mendo’kan, dan yang suka nganter ke kampus.
8. Pak Heri, Pak Iyan, Pak Herman, Iyus, yang telah membantu penulis selama
kuliah di Pascasarjana.
Bogor, Juli 2012
Pipih
RIWAYAT HIDUP
Penulis dilahirkan di Sukabumi Jawa Barat dengan nama lengkap Siti
Sofiyah dengan nama panggilan Pipih (kemudian nama itu yang tertulis dalam
ijazah SD) pada tanggal 18 April 1970 dari pasangan Bapak KH. Zaenul Falah
dan Ibu Hj. Siti Aisyah. Penulis merupakan anak ke enam dari sepuluh bersaudara
yaitu Siti Muhlisoh(Alm), Asep Saefulloh SE,Wawan Haerul Anwar MPd, Siti
Kulsum, Drs. Hasan Sadili, Ajiz Hakim M. Ag., Nuraeni S. Ag., Hindun
Megawati S. Pi., Nina Nuraena S.Pd..
Penulis memulai pendidikan di SDN Cibodas II dan lulus pada tahun 1983.
Selanjutnya penulis menyelesaikan pendidikan di MTs Al-Atiqiyah tahun 1986
dan SMA Islam Cipasung Tasikmalaya tahun 1989. Pada tahun 1993, penulis
menyelesaikan studi Strata 1 Jurusan Pendidikan Matematika IAIN Syarif
Hidayatullah Jakarta. Pada tahun 2007, penulis melanjutkan pendidikan Program
Studi Statistika pada Sekolah Pascasarjana IPB. Pada tahun 1996, penulis menjadi
guru PNS bidang studi Matematika di MTsN Pacet Cianjur, kemudian mutasi ke
MTs. Al-Atiqiyah hingga sekarang.
Pada tahun 1996 bersama keluarga yang didukung masyarakat mendirikan
SMA Al-Atiqiyah. Pada tanggal 1 Januari 1997 penulis menikah dengan DR.
Sulasman M.Hum. dan dikaruniai tiga orang anak yaitu Jilsy Dzikrina Zulvi,
Muhammad Zaky M.Avisena, Faza Fauzan Adhima.
DAFTAR ISI
Halaman
DAFTAR TABEL ........................................................................................... i
DAFTAR GAMBAR ...................................................................................... iii
DAFTAR LAMPIRAN ................................................................................... v
PENDAHULUAN .......................................................................................... 1
Latar Belakang Masalah ............................................................................. 1
Tujuan ......................................................................................................... 2
TINJAUAN PUSTAKA ................................................................................. 3
Metode Regresi ........................................................................................... 3
Metode Berbasis Pohon .............................................................................. 3
Pohon Regresi ............................................................................................. 5
Aturan Penyekatan ..................................................................................... 6
Aturan Growing dan Kriteria Goodness-of-Split
, ........................... 6
Penentuan Ukuran Pohon yang Layak ....................................................... 7
Penentuan Nilai Dugaan Respon pada Setiap Simpul Akhir ...................... 9
Faktor yang mempengaruhi Prestasi Belajar .............................................. 9
METODOLOGI .............................................................................................. 11
Metode Pengumpulan Data ........................................................................ 11
Metode Analisis .......................................................................................... 11
HASIL DAN PEMBAHASAN ....................................................................... 13
Deskripsi Data ............................................................................................. 13
Karaktristik Siswa SMA Al-Atiqiyah Sukabumi ....................................... 13
Pohon Regresi untuk Peubah Respon Nilai UN ......................................... 29
KESIMPULAN DAN SARAN ....................................................................... 35
Kesimpulan ................................................................................................. 35
Saran ........................................................................................................... 35
DAFTAR PUSTAKA ..................................................................................... 37
i
DAFTAR TABEL
Halaman
Tabel 1 Statistik deskriptif: Nilai UN ............................................................. 13
Tabel 2 Statistik deskriptif: Nilai UN (L); Nilai UN(P) ................................. 14
Tabel 3 Statistik deskriptif: Nilai UN IPA; Nilai UN IPS .............................. 16
Tabel 4 Statistik deskriptif: Nilai UAS ........................................................... 18
Tabel 5 Statistik deskriptif: Rata-Rata Raport ................................................ 18
Tabel 6 Statistik deskriptf: Nilai UN(A); Nilai UN(B) ................................... 19
Tabel 7 Statistik deskriptif: Nilai UN(Pesantren); Nilai UN (Orang Tua);
dan Nilai UN (Saudara/kost) ............................................................... 21
Tabel 8 Statistik deskriptif: Nilai UN (Ortu SD); Nilai UN (Ortu SMP);
Nilai UN(Ortu SMA); dan Nilai UN (Ortu PT) ................................ 23
Tabel 9 Statistik deskriptif: Nilai UN (Ortu PNS); Nilai UN (Ortu Petani);
Nilai UN (Ortu Pedagang); dan Nilai UN (Ortu Swasta) . ................ 25
Tabel 10 Statistik deskriptif: Nilai UN (Penghasilan10 jt) ........................ 27
Tabel 11 Karakteristik Kelompok Nilai UN Siswa ......................................... 31
Tabel 12 Uji T Dua Sampel dan SK: UN (Laki-laki); UN (Perempuan) ......... 39
Tabel 13 Uji T Dua Sampel dan SK: UN (IPA); UN (IPS) ............................. 39
Tabel 14 Uji T Dua Sampel dan SK: UN (A); UN (B) .................................... 39
Tabel 15 ANOVA: UN versus Tempat Tinggal .............................................. 39
Tabel 16 ANOVA: UN versus Pendidikan Ortu .............................................. 39
ii
Halaman
Tabel 17 ANOVA: Nilai UN (y) versus Pekerjaan Orang Tua (x8) ................ 40
Tabel 18 ANOVA: Nilai UN versus Penghasilan Orang Tua .......................... 40
Tabel 19 Deskriptif siswa yang tinggal di Pesantren dengan di rumah
Orangtua dan rumah saudara/kost .................................................... 41
Tabel 20 Uji-T Dua Sampel dan SK: UAS (Pesantren); UAS
(Ortu dan Saudara) ............................................................................. 41
Tabel 21 Deskriptif siswa yang mempunyai nilai UAS ≤ 8.42 dengan nilai
UAS > 8.42 pada siswa yang bertempat tinggal di pesantren.......... 41
Tabel 22 Uji T Dua Sampel dan SK: UAS 8.42 ....................... 41
Tabel 23 Deskriptif siswa yang mempunyai nilai rata-rata raport ≤ 7.99
dengan nilai UAS > 7.99 pada siswa yang bertempat tinggal
di rumah ayah dan saudara/kost ....................................................... 41
Tabel 24 Uji T Dua Sampel dan SK: Raport 7,99 .................. 42
Tabel 25 Deskriptif siswa berdasarkan jenis kelamin pada siswa yang
mempunyai nilai UAS > 7.99 dan bertempat tinggal
di rumah ayah dan saudara/kost ......................................................... 45
Tabel 26 Uji-T Dua Sampel dan SK: UAS(Laki-laki) – UAS(Perempuan)..... 45
iii
DAFTAR GAMBAR
Halaman
Gambar 1 Diagram Pohon ............................................................................... 4
Gambar 2 Sebaran Nilai UN ........................................................................... 14
Gambar 3 Pie Chart Nilai UN ......................................................................... 14
Gambar 4 Box Plot Garis Nilai UN Berdasarkan Jenis Kelamin ................... 15
Gambar 5 Diagram Batang Nilai UN Berdasarkan Jenis Kelamin ................. 15
Gambar 6 Box Plot Nilai UN Berdasarkan Jurusan ........................................ 17
Gambar 7 Diagram Batang Nilai UN Berdasarkan Jurusan di SMA ............... 17
Gambar 8 Scatter Plot Antara Nilai UN dan Nilai UAS ................................. 18
Gambar 9 Scatter Plot Antara nilai UN dan Rata-rata Nilai Raport ............... 19
Gambar 10 Box Plot Nilai UN Berdasarkan Status Akreditasi ....................... 20
Gambar 11 Diagram Batang Nilai UN Berdasarkan Akreditasi ..................... 21
Gambar 12 Box Plot Nilai UN Berdasarkan Tempat Tinggal ........................ 22
Gambar 13 Diagram Batang Nilai UN Berdasarkan Tempat Tinggal ............ 22
Gambar 14 Box Plot Nilai UN Berdasarkan Pendidikan Orang Tua .............. 24
Gambar 15 Diagram Batang Nilai UN Berdasarkan Pendidikan Orang Tua .. 24
Gambar 16 Box Plot Nilai UN Berdasarkan Pekerjaan Orang Tua ................ 25
Gambar 17 Diagram Batang Nilai UN Berdasarkan Pekerjaan Orang Tua ..... 26
Gambar 18 Box Plot Nilai UN Berdasarkan Penghasilan Ayah ..................... 28
iv
Gambar 19 Diagram Batang Nilai UN Berdasarkan Penghasilan Ayah .......... 28
Gambar 20 Hasil Pohon Regresi Nilai UN ...................................................... 30
v
DAFTAR LAMPIRAN
Halaman
Lampiran 1.
Uji Beda Untuk Semua Peubah ............................................ 39
Lampiran 2.
Uji Beda Untuk Peubah Penciri Dalam Regression Tree. ........... 41
Lampiran 3
Daftar Kegiatan Harian Pondok Pesantren .......................... 43
Lampiran 4
Data...................................................................................... 44
PENDAHULUAN
Latar Belakang
Analisis regresi adalah salah satu analisis yang dapat melakukan pendugaan.
Analisis regresi juga dapat digunakan untuk mencari peubah penjelas yang dapat
menerangkan keragaman respon. Adanya pengaruh ini dapat diidentifikasi dengan
menggunakan spesisifikasi model tertentu. Dengan kata lain analisis regresi juga
dapat digunakan untuk mencari peubah-peubah yang menerangkan keragaman
respon. (Aunuddin, 2005).
Keabsahan penggunaan analisis regresi sangat tergantung pada berbagai
asumsi, seringkali sulit untuk mendapatkan dugaan persamaan regresi yang
memenuhi semua asumsi. Salah satu pendekatan yang dapat digunakan untuk
mengatasi masalah ini adalah dengan menggunakan regresi dengan metode pohon
biner (Breiman et al. 1993).
Salah satu metode pada metode pohon biner adalah pohon regresi. Pohon
regresi (regression tree) adalah salah satu metode yang menggunakan kaidah
pohon keputusan (decision tree). Pohon keputusan dibentuk dengan algoritma
penyekatan rekursif. Penggunaan algoritma ini dimulai dengan munculnya
program Automatic Interaction Detection (AID) dari Morgan & Sonquist pada
tahun 1963 (Davis & Anderson 1989).
Kajian mengenai metode pohon regresi dan pohon klasifikasi (CART,
Classification and Regression Tree) dipelopori oleh Breimen dan Freidman pada
tahun
1973.
Perkembangannya
ditandai
dengan
diterbitkannya
buku
”Classification and Regression Tree” pada tahun 1984. Metode pohon regresi
diilhami oleh program AID, sedangkan metode pohon klasifikasi diilhami oleh
program Theta Automatic Interaction Detection (THAID) yang dikembangkan
oleh Morgan dan Messenger pada awal tahun 1970-an (Breiman et al 1993).
Kelebihan metode pohon regresi, antara lain dapat mengeksplorasi data yang
kompleks. Kekompleksan tersebut dapat berupa dimensinya yang besar atau jenis
peubahnya campuran, misalnya numerik dan kategorik, baik nominal maupun
ordinal. Kelebihan lain dari pohon regresi yaitu dapat mengidentifikasi peubahpeubah penjelas yang mempunyai hubungan struktural dengan peubah responnya
dan memprediksi dugaan respon dari satu atau beberapa amatan baru, memiliki
2
kemampuan dalam mendeteksi interaksi antar peubah secara lokal atau bekerja
untuk menemukan subgrup data yang bermakna. Interpretasi hasilnya lebih mudah
daripada interpretasi regresi klasik, karena identifikasi pengaruh dari peubah
penjelas dalam pohon regresi dilakukan dalam masing-masing subgrup data bukan
dalam keseluruhan data seperti halnya regresi biasa. Pohon regresi juga cenderung
resisten terhadap pengaruh pencilan (Davis & Anderson 1989).
Salah satu penerapan analisis pohon regresi adalah pada bidang pendidikan.
Data kemampuan akademik siswa berupa nilai hasil Ujian Nasional (UN) dapat
dijadikan sebagai salah satu indikator untuk mengukur prestasi siswa. Tingkat
keberhasilan akademik siswa dipengaruhi oleh faktor internal dan eksternal siswa.
Faktor internal siswa yaitu kesehatan, intelegensi, minat dan motivasi serta cara
belajar, sedangkan faktor eksternal diantaranya yaitu keluarga, sekolah,
masyarakat dan lingkungan sekitar (Djaali 2007). Berdasarkan uraian tersebut,
peneliti ingin menerapkan metode pohon regresi (regressiontree) untuk
mengetahui faktor-faktor yang berpengaruh terhadap nilai Ujian Nasional siswa
SMA Al-Atiqiyah Sukabumi.
Tujuan
Tujuan dari penelitian ini adalah :
1.
Menentukan pohon optimal dari pohon regresi untuk mencari semua
kemungkinan peubah (faktor-faktor penciri) yang berpengaruh terhadap nilai
Ujian Nasional siswa SMA Al-Atiqiyah Sukabumi.
2.
Memberikan masukan kepada SMA Al-Atiqiyah agar lebih meningkatkan
prestasi siswa dengan memperhatikan faktor-faktor yang paling berpengaruh
terhadap nilai Ujian Nasional.
TINJAUAN PUSTAKA
Metode Regresi
Metode regresi adalah salah satu analisis data yang dapat digunakan untuk
memprediksi pengaruh yang timbul akibat perubahan suatu
peubah terhadap
peubah yang lain. Dalam kajian ilmiah analisis regresi digunakan untuk
mengetahui pengaruh peubah-peubah penjelas terhadap peubah respon. Dalam
teknik regresi kita mengasumsikan ada satu output (respon) dan satu atau lebih
input (penjelas). Peubah outputnya biasanya bersifat numerik.
Keabsahan penggunaan analisis regresi sangat tergantung pada berbagai
asumsi, kadang kala sulit untuk mendapatkan dugaan persamaan regresi yang
memenuhi semua asumsi. Salah satu pendekatan yang pernah dilakukan adalah
regresi dengan metode pohon biner pada penyekatan ruang peubah penjelas untuk
melihat adanya perbedaan dugaan respon (Breiman et al. 1993). Tujuan lain dari
persamaan regresi adalah menghasilkan
regresi yang akurat dan dapat
mengetahui lebih jauh mengenai struktur (yang bersifat memprediksi) dari data
tersebut.
Metode Berbasis Pohon
Metode berstruktur pohon telah digunakan diberbagai riset dalam beberapa
tahun terakhir terutama dibidang terapan. Salah satu riset yang menggunakan
metode tersebut antara lain riset pemasaran (segmentasi pasar), kedokteran
(diagnosis), ilmu komputer, botani, psikologi, dan linguistik (Faridhan 2003).
Penyusunan pohon keputusan dalam ilmu sosial dimulai pada awal 1960 (AID).
Leo Breiman, Jerome H. Friedman, Richard A. Olshen dan Charles J. Stone
sekitar tahun 1980-an dalam buku Breiman et al.(1993)
mengusulkan suatu
algoritma baru untuk penyusunan pohon yaitu Classification and Regression Tree
(CART). Penyusunan pohon dapat dilihat sebagai salah satu cara pemilihan
variabel.
CART adalah salah satu metode atau algoritma dari salah satu teknik
eksplorasi data yaitu teknik pohon keputusan. CART merupakan metodologi
statistik nonparametrik yang dikembangkan untuk topik analisis klasifikasi, baik
4
untuk peubah respon kategorik maupun numerik. CART menghasilkan suatu
pohon klasifikasi jika peubah responnya kategorik, dan menghasilkan pohon
regresi jika peubah responnya numerik kontinu.
Tujuan utama CART adalah untuk mendapatkan suatu kelompok data yang
akurat sebagai penciri dari suatu pengklasifikasian. Struktur pohon pada metode
ini diperoleh melalui suatu algoritma penyekatan rekursif terhadap ruang penjelas
X. Metode penyekatan tersebut dimulai dengan menyekat peubah penjelas
menjadi dua anak gugus yang disebut simpul (node). Selanjutnya anak gugus ini
disekat lagi menjadi dua anak gugus yang baru. Penyekatan ini diulang sampai
diperoleh sekatan-sekatan yang berdasarkan aturan tertentu tidak dapat disekat
lebih lanjut. Sekatan akhir yang dihasilkan disebut simpul akhir (terminal node),
sedangkan sekatan yang masih mungkin disekat lebih lanjut dinamakan simpul
dalam (nonterminal node). Hasil dari proses penyekatan ini disajikankan dalam
suatu struktur pohon seperti terlihat dalam Gambar 1 (Breiman et al. 1993).
t1
Sekat 1
t3
t2
Sekat 2
t4
Sekat 3
t5
t6
t7
Sekat 4
t8
t9
Gambar 1 Diagram Pohon
Lewis (2000) menyebut simpul asal sebagai simpul induk (parent node);
simpul induk dapat disekat menjadi simpul anak tambahan (additional children
node). Struktur pohon memiliki satu simpul akar (pada Gambar 1 dinyatakan
5
dengan t1) yang mengandung semua gugus data. Pada Gambar 1, simpul dalam
dilambangkan dengan lingkaran sedangkan simpul akhir dilambangkan dengan
persegi. Dugaan respon dilakukan pada semua simpul akhir (pada Gambar 1
dinyatakan dengan t4, t5, t6, t8 dan t9).
Pada Gambar 1 simpul dalam dilambangkan dengan lingkaran sedangkan
simpul akhir dilambangkan dengan persegi. Diagram yang dihasilkan oleh CART
ini merupakan suatu model, biasanya diinterpretasikan ke dalam suatu tabel untuk
penjelasannya. Hal ini berbeda dengan regresi konvensional dimana model regresi
dapat dituliskan menjadi model matematik atau persamaan regresinya.
Pohon Regresi
Pohon regresi adalah suatu teknik non-parametrik yang secara rekursif
membagi kelompok-kelompok ke dalam sub-kelompok yang lebih kecil yang
memaksimalkan perbedaan sesuai hasil yang diinginkan. Metode pohon regresi ini
adalah gabungan dari metode gerombol (cluster) dan metode stepwise regression.
Karakteristik dari pohon regresi dijabarkan sebagai berikut:
1. Ada sebanyak p peubah penjelas X1,X2,...,Xp dan ada satu peubah respon yang
numerik kontinu (Y)
2. Peubah penjelas bersifat kategorik atau numerik kontinu
3. Peubah respon bersifat numerik kontinu
4. Membutuhkan jumlah sampel yang relatif besar
Proses pembentukan pohon regresi dan kriteria atau ukuran yang digunakannya
memerlukan empat komponen (Breiman et al. 1993):
1. Aturan penyekatan
2. Kriteria goodness-of-split φ (s, t ) yang merupakan alat evaluasi bagi penyekatan
(split) s pada simpul t
3. Ukiuran yang digunakan untuk menentukan ukuran pohon yang layak (right
sized tree)
4. Statistik yang digunakan sebagai ringkasan dari tiap simpul akhir
6
Aturan Penyekatan
Pohon regresi dibentuk dari penyekatan data pada tiap simpul ke dalam dua
simpul anak. Aturannya adalah sebagai berikut:
1. Tiap penyekatan tergantung pada nilai yang hanya berasal dari satu peubah
penjelas.
2. Untuk peubah numerik kontinu Xj penyekatan yang diperbolehkan adalah Xj ≤
c untuk c ε R1, dimana c adalah nilai tengah antara dua nilai amatan peubah Xj
berurutan yang berbeda. Jadi jika Xj mempunyai n nilai yang berbeda maka
akan terdapat sebanyak-banyaknya n-1 penyekatan.
3. Untuk peubah penjelas kategorik, penyekatan yang terjadi berasal dari semua
kemungkinan penyekatan berdasarkan terbentuknya dua anak gugus yang
saling lepas (disjoint). Jika peubah Xj merupakan peubah kategorik nominal
dengan L kategori, maka akan ada 2L-1-1 penyekatan, sedangakan jika berupa
peubah kategorik ordinal, maka akan ada L-1 penyekatan yang mungkin.
Aturan Growing dan Kriteria Goodness-of-Split φ (s, t )
Pohon regresi dibentuk dengan penyekatan yang rekursif berdasarkan kriteria
tertentu. Proses penyekatan dilakukan pada tiap simpul dengan cara sebagai
berikut:
1. Cari semua kemungkinan penyekatan pada tiap peubah penjelas
2. Pilih “penyekatan terbaik” dari masing-masing peubah penjelas dan pilih
“penyekatan
terbaik”
dari
“kumpulan
penyekatan
terbaik”
tersebut.
“Penyekatan terbaik” adalah penyekatan yang memaksimumkan ukuran
kehomogenan di dalam masing-masing simpul anak relatif terhadap simpul
induknya dan yang memaksimumkan ukuran penyekatan (separation) antara
dua simpul anak tersebut.
Jumlah kuadrat sisaan (JKS) digunakan sebagai kriteria kehomogenan di dalam
masing-masing simpul. Misalkan simpul t berisi anak contoh
{( X n , Yn )},
n(t)
adalah banyaknya amatan dalam simpul t dan rataan respon dalam simpul t adalah
7
Y (t ) =
(1)
1
∑Yn
n(t ) xn ∈t
maka jumlah kuadrat sisaan di dalam simpul t adalah:
JKS(t ) = ∑ [Yn − Y (t )]
2
(2)
xn ∈t
Keterangan :
Yn = nilai individu peubah respon ke-n
Y (t ) = nilai tengah peubah respon pada simpul ke-t
Misalkan ada penyekatan s yang menyekat t menjadi simpul anak kiri tL dan
simpul anak kanan tR. Fungsi penyekatan yang digunakan adalah:
φ(s, t ) = JKS(t ) − {JKS(t L ) + JKS(t R )}
(3)
dan penyekat terbaik s* adalah:
φ (s * , t ) = max φ (s, t )
s∈Ω
(4)
dengan Ω adalah gugus yang berisi semua kemungkinan penyekatan.
Pohon regresi dibentuk melalui penyekatan simpul secara rekursif yang
memaksimumkan fungsi φ di atas. Penyekatan tersebut dihentikan jika banyaknya
amatan dalam simpul tersebut berjumlah “tertentu” atau pada saat nilai φ lebih
kecil dari suatu nilai ambang (treshold). Pemilihan aturan penghentian ini tentu
saja akan berpengaruh pada ukuran pohon akhir yang terbentuk. Breiman et al.
(1993) menetapkan penghentian dilakukan ketika banyaknya amatan pada simpul
akhir kurang atau sama dengan 5. Penyekatan juga dapat dilakukan ketika
banyaknya amatan kurang dari 25 amatan (Schmoor et al. 1993 dalam kudus
1999).
Penentuan Ukuran Pohon yang Layak
Pohon yang dibentuk dengan aturan splitting atau growing di atas berukuran
sangat besar. Hal ini karena aturan penghentian (stopping rule) yang digunakan
hanya berdasarkan banyaknya amatan pada simpul akhir atau besarnya
peningkatan tingkat kehomogenan. Lebih banyak penyekatan yang dilakukan
mengakibatkan makin kecilnya tingkat kesalahan prediksi. Hal tersebut terjadi
8
karena simpul akhir bisa hanya berisi satu amatan. Masalahnya adalah bagaimana
menentukan ukuran pohon yang layak. Pohon yang besar bisa menimbulkan
dugaan adanya overfitting. Sebaliknya kasus underfitting terjadi karena tidak
( )
adanya penyekatan lebih lanjut akibat adanya tetapan ambang φ s * , t , padahal
sebenarnya penyekatan yang terjadi adalah layak. Cara mengatasi masalah ini
adalah mencari ukuran pohon yang layak (optimum) berdasarkan aturan Cost
Complexity Minimum dan penggunaan validasi Silang lipat-10 (10-fold Cross
validation).
Pencarian pohon regresi dengan ukuran yang layak dilakukan dengan (1)
penentuan pohon awal yang besar, (2) secara iteratif pohon tersebut dipangkas
(prunning) menjadi sekuen pohon yang makin kecil dan tersarang, (3) dipilih
pohon terbaik dari sekuen ini dengan menggunakan penduga contoh uji (test
sample estimate) atau penduga validasi silang (cross validation estimate).
Untuk mendapatkan test sample estimate Rts(T), amatan dibagi dua secara acak
menjadi Learning sample L1 dan test sample L2. L1 digunakan untuk membentuk
sekuen pohon {Tk) melalui proses pemangkasan, sedangkan L2 digunakan untuk
membentuk Rts(Tk). Jika L2 berukuran n2, maka
R ts (Tk ) =
1
n2
∑) [y
( xn , yn ∈L2
− yˆ k ( xn )]
2
n
(5)
dengan ŷ k ( x n ) adalah dugaan respon dari amatan ke-n pada pohon ke-k. Pohon
yang terbaik adalah Tk0, yang memenuhi kriteria:
R ts (Tk 0 ) = min R ts (Tk )
(6)
k
Untuk membentuk cross validation estimate RCV(T) dengan V-fold amatan
induk L yang berukuran n dibagi secara acak menjadi V kelompok, yakni L1,
L2,...,LV yang berukuran sama. Learning sample ke-v adalah L-v=L-LV, v=1,2,...,V
yang digunakan untuk membentuk sekuen pohon {Tk} dan sekuen parameter
complexity (α k ) . Jika terdapat v sekuen {Tk} dan v sekuen (α k ) . Kemudian
gunakan amatan induk L untuk membentuk sekuen {Tk} dan (α k ) . Definisikan
9
α k' = α k α k +1 . Jika yˆ k−v (xn ) adalah dugaan respon dari amatan ke–n pada pohon
yang bersesuaian dengan α k' yang dibentuk oleh Learning sample ke-v, maka
R CV (Tk ) =
[
]
2
1 V
y n − yˆ k−v (xn )
∑
∑
n v=1 ( xn , yn )∈Lv
(7)
Pohon terbaik adalah Tk0, yang memenuhi kriteria:
R CV (Tk 0 ) = min R CV (Tk )
(8)
k
cross validation estimate dengan 10-fold ( validasi silang lipat 10), menghasilkan
resubstitution estimate yang paling kecil (Breiman et al. 1993).
Penentuan nilai dugaan respon pada setiap simpul akhir
Nilai dugaan respon pada masing-masing kelompok pengamatan yang
dihasilkan adalah rataan responnya.
Faktor Yang Mempengaruhi Prestasi Belajar
Djaali (2007) mengatakan bahwa dalam Psikologi Pendidikan, faktor–faktor
yang dapat mempengaruhi prestasi belajar, yaitu:
a. Faktor dari dalam diri
Faktor dari dalam diri terdiri dari:
1. Kesehatan
Kesehatan sangat penting dalam keadaan belajar, karena apabila dalam
keadaan sakit seorang siswa akan tidak bergairah untuk belajar. Selain itu,
secara psikologi gangguan pikiran dan perasaan kecewa karena konplik
juga dapat mengganggu proses belajar.
2. Intelegensi
Menurut Gardner dalam teori Multiple Intellegence, intelegensi memiliki
tujuh dimensi yang semiotonom, yaitu linguistik, musik, matematik logis,
visual spesial, kinestetik fisik, sosial interpersonal dan intrapersonal.
3. Minat dan Motivasi
Minat yang besar terhadap sesuatu terutama dalam belajar akan
mengakibatkan proses belajar lebih mudah dilakukan. Motivasi merupakan
dorongan agar siswa mau melakukan sesuatu. Motivasi bisa berasal dari
dalam diri siswa ataupun dari luar lingkungan.
10
4. Cara belajar
Perlu untuk diperhatikan bagaimana teknik belajar, bagaimana bentuk
catatan buku, pengaturan waktu belajar, dan tempat serta fasilitas belajar.
b. Faktor dari dalam Lingkungan
Faktor yang berpengaruh kepada siswa dalam hal belajar dari lingkungan
yaitu:
1. Keluarga
Situasi keluarga sangat berpengaruh pada keberhasilan siswa. Pendidikan
orangtua, status ekonomi, rumah, hubungan dengan ayah dan saudara,
bimbingan
orangtua,
dukungan
orangtua,
yang
demikian
sangat
mempengaruhi prestasi belajar siswa.
2. Sekolah
Tempat, gedung sekolah, kualitas guru, perangkat kelas, relasi teman
sekolah, rasio jumlah murid per kelas, juga mempengaruhi anak dalam
proses belajar. Hal demikian menyebabkan siswa semangat belajar apabila
di lingkungan sekolah sangat menunjang dan fasilitas belajar lengkap.
Apabila fasilitas kurang lengkap, akan menyebabkan siswa kurang
semangat dalam belajar.
3. Masyarakat
Apabila masyarakat sekitar adalah masyarakat yang berpendidikan dan
moral yang baik, terutama anak-anak mereka. Hal ini dapat sebagai pemicu
siswa untuk lebih giat belajar, karena yang demikian itu bisa jadi motivasi
dan gambaran dari orang-orang yang memiliki ilmu.
4. Lingkungan sekitar
Bangunan rumah, suasana sekitar, keadaan lalu lintas dan iklim juga dapat
mempengaruhi pencapaian tujuan belajar. Dari sekian banyak faktor yang
harus diperhatikan, tentu tidak ada situasi 100% yang dapat dilakukan
secara keseluruhan dan sempurna. Tetapi berusaha untuk memenuhinya
sesempurna mungkin bukanlah faktor yang mustahil untuk dilakukan.
METODOLOGI
Bahan Analisis
Data yang digunakan dalam penelitian ini adalah data primer
yang
diperoleh dari arsip SMA Al-Atiqiyah. Data yang dianalisis adalah seluruh siswa
tahun 2011 dan 2012 untuk program IPS dan IPA yang berjumlah 181 orang.
Peubah respon (Y) yang diamati adalah nilai Ujian Nasional, sedangkan peubah
penjelas yang digunakan adalah:
X1 = Jenis kelamin
: (1) laki-laki (2) perempuan
X2 = Jurusan di SMA
: (1) IPA (2) IPS
X3 = Nilai Ujian Akir Sekolah (UAS)
: Numerik
X4 = Rata-rata nilai raport
: Numerik
X5 = Status akreditasi SMP
: (1) A (2) B (3) belum terakreditasi
X6 = Tempat tinggal selama sekolah
: (1) pesantren (2) rumah orang tua
(3) rumah saudara atau kost
X7 = Pendidikan ayah
: (1) SD (2) SMP (3) SMA (4) PT
X8 = Pekerjaan ayah
: (1) PNS (2) petani (3) pedagang
(4) swasta
X9 = Penghasilan ayah per bulan
: (1) < 5 juta (2) 5-10 juta
(3) >10 juta
Metode Analisis
Analisis data dilakukan dalam beberapa tahap. Tahapan-tahapan analisis
dalam penelitian ini adalah:
1. Melakukan analisis deskriptif peubah respon dan peubah penjelas untuk
mengetahui gambaran umum tentang karakteristik siswa-siswi SMA AlAtiqiyah, kemudian melakukan uji terhadap peubah penjelas untuk
mengetahui pengaruh bersama dari masing-masing kategori peubah penjelas
terhadap respon.
12
Hipotesis yang digunakan :
H0 :
H1 :
untuk i=1,2, …, 9
Kriteria uji : Tolak H0 Jika Fhitung > Ftabel atau p-value < α = 0,05
2.
Melakukan analisis pohon regresi
a. Penentuan pohon awal yang besar
b. Secara iteratif pohon tersebut dipangkas (pruning) menjadi sekuen
pohon yang makin kecil dan tersarang
c. Memilih pohon terbaik dari sekuen ini dengan menggunakan
penduga contoh uji (test sample estimate) atau penduga validasi
silang (cross validation estimate).
3.
Menentukan nilai dugaan respon bagi setiap simpul akhir.
Nilai dugaan respon pada masing-masing kelompok pengamatan yang
dihasilkan adalah rataan responnya.
4.
Melakukan uji beda nilai tengah (Uji-t) terhadap setiap sekatan hasil
regresi pohon.
Hipotesis yang digunakan :
H0 :
H1 :
untuk i,j = 1,2, …, 9 dan
Kriteria uji : Tolak H0 Jika thitung > ttabel atau p-value < α = 0,05
5. Melakukan interpretasi hasil
Melakukan interpretasi hasil pohon regresi yang didapat, dengan proses
analisis dilakukan menggunakan Software MS. Excell 2007 , SPSS 16,
dan Minitab 16.
HASIL DAN PEMBAHASAN
Deskripsi Data
Data pengamatan adalah seluruh siswa SMA Al-Atiqiyah tahun 2011 dan
2012 yang berjumlah 181 siswa. Siswa yang berjenis kelamin laki-laki sebanyak
59 orang (33%) dan jenis kelamin perempuan 122 orang (67%). Adapun jurusan
yang mereka pilih, yaitu 73 orang (40%) memilih jurusan IPA dan 108 orang
(60%) berjurusan IPS.
Siswa yang
berasal dari SMP yang terakreditasi A
sebanyak 167 orang (93%) dan 13 orang (7%) berasal dari sekolah menengah
pertama yang terakreditasi B. Tempat tinggal siswa selama sekolah adalah tinggal
di pondok pesantren 73 orang (40%), rumah orangtua 102 orang (57%) dan yang
tinggal di rumah saudara atau kost sebanyak 6 orang (3%).
Kondisi seluruh siswa mempunyai latar pendidikan ayah yang berbeda.
Jumlah siswa yang memiliki ayah berpendidikan terakhir SD 20 orang (11%),
SMP 89 orang (49%), SMA 64 orang (35%) dan Perguruan Tinggi 8 orang (5%).
Sementara itu, pekerjaan ayah siswa tersebut terdiri atas 5 orang (3 %) PNS, 28
orang (15%) pedagang, 10 orang (6%) petani, dan 138 orang (76 %) sebagai
pekerja swasta. Adapun penghasilan ayah siswa yang menjadi objek penelitian ini
antara lain, penghasilan per bulan yang kurang dari 5 juta sebanyak 173 orang
(95%), penghasilan
antara 5 sampai 10 juta sebanyak 5 orang (3%), dan
penghasilan lebih dari 10 juta sebanyak 3 orang (2%).
Karakteristik Siswa SMA Al-Atiqiyah Sukabumi
a.
Deskripsi Siswa Berdasarkan Nilai UN
Tabel 1 Deskripsi Nilai UN
Peubah
Rataan
S.baku
Min.
Q1
Median
Q3
Maks.
Nilai UN
7.83
0.33
7.09
7.59
7.85
8.02
8.89
Berdasarkan hasil analisis deskripsi siswa nilai UN pada Tabel 1, penyebaran
data siswa SMA Al-Atiqiyah Sukabumi dengan peubah responnya nilai UN dapat
14
diketahui bahwa rata-rata nilai UN adalah sebesar 7.83, nilai UN terendah 7.09,
sedangkan untuk nilai UN tertinggi 8.89. Keragaman nilai UN siswa kecil. Hal ini
berarti bahwa setiap siswa memiliki kemampuan yang relatif sama. Diagram
kotak garis yang tersaji pada Gambar 1 menunjukkan bahwa terdapat nilai UN
dari 2 (dua) siswa merupakan pencilan. Frekuensi nilai UN menurut empat
kelompok selang dapat dilihat pada Gambar 2. Nilai UN siswa sebagian besar
(sekitar 55%) berada pada selang [7.50,7.99] dan hanya 3% nilai UN nya yang
berada di atas 8.50.
9,0
Nilai UN
8,5
8,0
7,5
7,0
Gambar 2 Sebaran Nilai UN
> 8.50
8.00 - 8.49
7.50 - 7.99
7.00 - 7.49
Gambar 3 Pie Chart Nilai UN
15
b. Deskripsi Nilai UN Berdasarkan Jenis Kelamin
Tabel 2 Deskripsi Nilai UN (L) dan Nilai UN (P)
Peubah
Rataan
S.baku
Min.
Q1
Med.
Q3
Maks.
UN (L)
7.68
0.31
7.09
7.4
7.74
7.93
8.59
UN (P)
7.90
0.32
7.18
7.7
7.92
8.08
8.89
|t-hit|
p-value
4.45
0.000
Berdasarkan hasil analisis pada Tabel 2, dapat diketahui bahwa rata-rata nilai UN
perempuan (7.90) lebih besar dari rata-rata nilai UN laki-laki (7.68). Nilai UN
terendah untuk jenis kelamin laki-laki adalah sebesar 7.09, sedangkan untuk jenis
kelamin perempuan adalah sebesar 7.18. Untuk nilai UN tertinggi pada jenis
kelamin laki-laki adalah sebesar 8.59 untuk jenis kelamin perempuan adalah
sebesar 8.89. Berdasarkan nilai p-value untuk uji-t pada Tabel 2, didapat pvalue=0,000 kurang dari α= 0,05, maka Ho ditolak, artinya nilai hasil UN laki-laki
dan UN perempuan berbeda nyata. Pada gambar 4 terlihat, nilai UN untuk jenis
kelamin perempuan terdapat data pencilan, yaitu amatan yang mempunyai nilai
UN 8.66, 8.77, 8.99.
9,0
Nilai UN
8,5
8,0
7,5
7,0
Laki-Laki
Perempuan
Gambar 4 Box plot nilai UN berdasarkan jenis kelamin
16
Persen
40
30
20
laki-laki
10
perempuan
0
7.00 - 7.49
7.50 - 7.99 8.00 - 8.49
> 8.50
Nilai UN
Gambar 5 Diagram Batang Nilai UN berdasarkan Jenis Kelamin
Penyebaran nilai UN siswa SMA Al-Atiqiyah berdasarkan peubah jenis
kelamin dapat dilihat pada diagram batang yang tersaji pada Gambar 5. Diagram
batang tersebut menggambarkan bahwa kisaran nilai UN untuk jenis kelamin lakilaki dan perempuan antara 7.50-7.99 memiliki persentase terbesar yaitu masingmasing sebesar 37% untuk perempuan, dan 18% untuk laki-laki. Selain itu, dapat
dilihat bahwa prestasi perempuan
lebih baik dibandingkan dengan laki-laki
karena mungkin karena faktor cara belajar, perempuan lebih tekun dari pada siswa
laki-laki.
c.
Deskripsi Siswa Berdasarkan Jurusan
Tabel 3 Deskripsi Nilai UN IPA dan Nilai UN IPS
Peubah
Rataan
S.baku
Min
Q1
Median
Q3
Maks
|t-hit|
p-value
IPA
7.78
0.32
7.09
7.57
7.81
7.93
8.77
- 1.2
0.064
IPS
7.87
0.34
7.30
7.60
7.91
8.07
8.89
Berdasarkan hasil analisis Tabel 3, dapat diketahui bahwa rata-rata nilai UN
untuk jurusan IPS (7.87) lebih besar dari rata-rata nilai UN untuk jurusan IPA
(7.78). Nilai UN terendah untuk jurusan IPA adalah sebesar 7.09, sedangkan
jurusan IPS adalah sebesar 7.30. Untuk nilai UN tertinggi pada jurusan IPA
adalah sebesar 8.77 dan untuk jurusan IPS adalah sebesar 8.89.
17
9,0
Nilai UN
8,5
8,0
7,5
7,0
IPA
IPS
Gambar 6 Diagram Kotak Garis Nilai UN berdasarkan Jurusan
Dari digram kotak garis gambar 6 bisa dilihat terdapat data pencilan atas pada
nilai UN jurusan IPA, yaitu amatan yang mempunyai nilai UN 8.67, 8.77.
Sedangkan pada nilai UN jurusan IPS mempunyai pencilan atas pada data amatan
dengan nilai UN 8.89.
Persen
30
20
10
IPA
IPS
0
Nilai UN
Gambar 7 Diagram Batang Nilai UN Berdasarkan Jurusan di SMA
Penyebaran nilai UN siswa SMA Al-Atiqiyah berdasarkan peubah jurusan di
SMA dapat dilihat pada Gambar 7. Diagram batang menggambarkan bahwa
jurusan IPA dan IPS, kisaran nilai UN antara 7.50-7.99 mempunyai persentase
terbesar yaitu masing-masing sebesar 27% dan 28%. Jurusan IPS rata-rata nilai
UN 7,87 dan IPA rata-ratanya 7,76.
18
Untuk melihat perbedaan nilai UN berdasarkan jurusan dapat dilihat pada
lampiran 1. Berdasarkan uji beda nilai tengah dapat diketahui bahwa tidak ada
perbedaan nilai UN antara jurusan IPA dan IPS. Hal ini dapat dilihat dari niai pvalue (0.064) yang lebih besar dari taraf nyata 5%, artinya jurusan IPA dan IPS,
tidak berpengaruh terhadap UN.
d. Deskripsi Siswa BerdasarkanNilai Ujian Akhir (UAS)
Tabel 4 Deskripsi Nilai UAS
Peubah
Nilai UAS
Rataan
S.baku Min
8.36
0.22
Q1
6.80 8.24
Median Q3
8.33
Maks
8.47 8.99
Berdasarkan hasil analisis Tabel 4, dapat diketahui bahwa rata-rata nilai UAS
siswa SMA Al-Atiqiyah Sukabumi adalah sebesar 8.36. Nilai UAS terendah siswa
SMA Al-Atiqiyah Sukabumi adalah sebesar 6.80, sedangkan untuk nilai tertinggi
adalah sebesar 8.99.
9,0
Nilai UN
8,5
8,0
7,5
7,0
7,0
7,5
8,0
8,5
9,0
Nilai UAS
Gambar 8
Scatter plot antara nilai UN dan nilai UAS
Berdasarkan scatter plot Gambar 8, dapat dilihat bahwa terdapat hubungan
antara nilai UAS dengan nilai UN. Semakin tinggi nilai UAS, maka nilai UN akan
cenderung semakin tinggi. Nilai UAS terendah sebesar 6.80, mempunyai nilai UN
sebesar 7.40, sedangkan nilai UAS tertinggi yaitu sebesar 8.99, mempunyai nilai
UN sebesar 8.28.
19
Gambar 8 juga menunjukkan bahwa hubungan rata-rata raport dengan nilai
UN membentuk dua gerombol. Gerombol pertama yang bagian atas menunjukkan
bahwa mayoritas siswa yang bertempat tinggal di pesantren dan
mayoritas
berjenis kelamin perempuan, sedangkan gerombol kedua siswa yang tempat
tinggal di rumah ayah atau ibu (orang tua).
e.
Deskripsi Siswa Berdasarkan Rata-rata Nilai Raport
Tabel 5 Deskripsi Rata-Rata Raport
Peubah Rataan
S.baku
Min
Q1
Median
Q3
Maks
Raport
0.347
7.48
7.84
8.17
8.42
8.97
8.15
Berdasarkan hasil analisis Tabel 5, dapat diketahui bahwa rataan nilai ratarata raport siswa SMA Al-Atiqiyah Sukabumi adalah sebesar 8.15. Rata-rata nilai
rapot terendah siswa SMA Al-Atiqiyah Sukabumi adalah sebesar 7.48, sedangkan
untuk nilai tertinggi adalah sebesar 8.97.
9,0
Nilai
UN
C34
8,5
8,0
7,5
7,0
7,50
7,75
8,00
8,25
Raport
8,50
8,75
9,00
Gambar 9 Scatter Plot antara nilai UN dan rata-rata nilai raport
Berdasarkan scatter plot Gambar 9. dapat dilihat bahwa terdapat hubungan
antara rata-rata nilai raport dengan nilai UN. Semakin tinggi rata-rata nilai raport,
maka nilai UN akan cenderung semakin tinggi. Pada rata-rata nilai raport terendah
yaitu sebesar 7.48, mempunyai nilai UN sebesar 7.65, sedangkan rata-rata nilai
raport tertinggi yaitu sebesar 8.97, mempunyai nilai UN sebesar 8.28. Gambar 9
20
juga menunjukkan bahwa hubungan rata-rata raport dengan nilai UN membentuk
dua gerombol. Gerombol pertama yang bagian atas menunjukkan bahwa
mayoritas siswa yang bertempat tinggal di pesantren dan
mayoritas berjenis
kelamin perempuan, sedangkan gerombol kedua siswa yang tempat tinggal di
rumah ayah atau ibu (orang tua).
f.
Deskripsi Siswa Berdasarkan Status Akreditasi
Tabel 6 Deskripsi Nilai UN (A); Nilai UN (B)
Peubah
Rataan
S.baku
Min
Q1
Median
Q3
Maks
UN (A)
7.83
0.34
7.09
7.58
7.85
8.02
8.89
UN (B)
7.84
0.25
7.23
7.70
7.87
8.02
8.19
|t-Hit|
pvalue
-0.1
0.94
Berdasarkan hasil analisis Tabel 6, dapat diketahui bahwa rata-rata nilai UN
untuk status akreditasi A (7.83) lebih kecil dari rata-rata nilai UN status akreditasi
B (7.84). Untuk penyebaran nilai UN untuk status akreditasi A adalah 0.34,
sedangkan untuk status akreditasi mempunyai nilai penyebaran sebesar 0.25.
Artinya adalah untuk siswa yang berasal dari sekolah yang terakreditasi B nilai
UN menyebar lebih seragam dibandingkan dengan akreditasi A. Nilai UN
terendah untuk status akreditasi A adalah sebesar 7.09, sedangkan untuk akreditasi
B adalah sebesar 7.23. Untuk nilai UN tertinggi pada akreditasi A adalah sebesar
8.9 dan untuk akreditasi B adalah sebesar 8.19.
9,0
Nilai UN
8,5
8,0
7,5
7,0
Nilai UN (A)
Nilai UN (B)
Gambar 10 Box Plot Nilai UN berdasarkan status akreditasi
21
Dari Box Plot Gambar 10 bisa dilihat terdapat data pencilan atas pada nilai
UN untuk status akreditasi A, yaitu amatan yang mempunyai nilai UN 8.77 dan
8.89. Sedangkan pada nilai UN untuk akreditasi B tidak mempunyai amatan
pencilan.
Penyebaran nilai UN siswa SMA Al-Atiqiyah berdasarkan peubah status
akreditasi sekolah SMA Al-Atiqiyah Sukabumi dapat dilihat pada Gambar 11.
Dari diagram di bawah dapat diketahui bahwa siswa berasal dari sekolah yang
berakreditas A, kisaran nilai UN antara 7.50-7.99 mempunyai persentase tertinggi
yaitu 49%.
Untuk melihat perbedaan nilai UN berdasarkan jurusan dapat dilihat pada
lampiranPersen
1. Berdasarkan uji beda nilai tengah dapat diketahui bahwa tidak ada
perbedaan nilai UN antara status akreditasi A dengan akreditasi B. Hal ini dapat
dilihat dari niai p-value (0.940) yang lebih besar dari taraf nyata 5%.
60
50
40
30
A
20
B
10
0
7.00 ‐ 7.49
7.50 ‐ 7.99
8.00 ‐ 8.49
> 8.50
UN
Gambar 11 Diagram Batang Nilai UN Berdasarkan Akreditasi
22
g.
Deskripsi Siswa Berdasarkan Tempat Tinggal
Tabel 7 Deskripsi Nilai UN (Pesantren); Nilai UN (Ayah ); Nilai UN
(Saudara/Kost)
Peubah
Rataan
UN (Pesantren)
UN (Ayah)
8.06
7.68
UN (Sdr/kost)
7.57
S.
Min.
Q1
Med.
Q3
Maks
F-Hit
p-value
0.32
0.23
7.21
7.09
7.93
7.5
8.06
7.73
8.2
7.89
8.89
7.99
44.61
0.000
0.27
7.28
7.3
7.54
7.85
7.94
baku
Berdasarkan hasil analisis Tabel 7, dapat diketahui bahwa rata-rata nilai UN
untuk siswa yang tinggal di pesantren (8.06) mempunyai nilai rataan yang paling
tinggi jika dibandingkan dengan yang lainnya. Nilai UN terendah untuk siswa
yang tinggal di pesantren adalah sebesar 7.21, untuk siswa yang tinggal bersama
ayah adalah sebesar 7.09, dan untuk siswa yang tinggal bersama saudara/kost
adalah sebesar 7.28. Untuk nilai UN tertinggi pada siswa yang tinggal di
pesantren adalah sebesar 8.89, sedangkan untuk siswa yang tinggal bersama
ayah adalah sebesar 7.99, dan untuk siswa yang tinggal bersama saudara/kost
adalah sebesar 7.94.
9,0
Nilai UN
8,5
8,0
7,5
7,0
Pesantren
Orang Tua
Saudara/ Kost
Gambar 12 Box Plot Nilai UN berdasarkan tempat tinggal
Dari Box Plot Gambar 12 dapat dilihat terdapat data pencilan atas pada nilai
UN untuk siswa yang tinggal di pesantren, yaitu amatan yang mempunyai nilai
23
UN 8.66, 8.77 dan 8.89. Sedangkan untuk pencilan bawahnya berada pada
amatan dengan nilai UN 7.21, 7.3, 7.46, dan 7.49.
Perse