Kelulusan Mahasiswa Universitas Gunadarma”. Variabel yang digunakan data NEM, IP semester 1, IP semester 2, IPK semester 1-2, gaji orang tua, dan pekerjaan orang
tua. Model analisis yang dipergunakan adalah algoritma naive bayes dan algoritma C4.5 yang merupakan algoritma dari metode teorema bayes dan decision tree. Hasil
penelitian menunjukkan bahwa dengan menggunakan algoritma C4.5 kesalahan yang dihasilkan dalam proses prediksi lebih sedikit, untuk algoritma decision tree
memiliki kompleksitas yang lebih besar, sedangkan algoritma naive bayes bila diimplementasikan menggunakan data yang digunakan dalam proses training akan
menghasilkan nilai kesalahan yang lebih besar karena pada naive bayes nilai suatu atribut adalah independent terhadap nilai lainnya dalam satu atribut yang sama.
Namun memiliki akurasi yang lebih tinggi bila dimplementasikan ke data yang berbeda dari data training dan ke dalam data yang jumlahnya lebih besar.
2.2. Regresi
Sir Francis Galton 1822 – 1911, memperkenalkan model peramalan, penaksiran, atau pendugaan, yang selanjutnya dinamakan regresi, sehubungan dengan
penelitiannya terhadap tinggi badan manusia. Penelitian tersebut membandingkan antara tinggi anak laki-laki dan tinggi badan ayahnya. Galton menunjukkan bahwa
tinggi badan anak laki-laki dari ayah yang tinggi setelah beberapa generasi cenderung mundur regressed mendekati nilai tengah populasi. Dengan kata lain,
anak laki-laki dari ayah yang badannya sangat tinggi cederung lebih pendek dari pada ayahnya, sedangkan anak laki-laki dari ayah yang badannya sangat pendek
cenderung lebih tinggi dari ayahnya. Walpole, 1992. Analisis regresi digunakan untuk menentukan bentuk dari hubungan antar
variabel. Tujuan utama dalam penggunaan analisis ini adalah untuk meramalkan atau menduga nilai dari satu variabel dalam hubungannya dengan variabel yang lain yang
diketahui melalui persamaan garis regresinya. Hasan, 2002. Adakalanya, setelah kita memperoleh data berdasarkan sampel, kita ingin
menduga nilai dari suatu variabel yang bersesuaian dengan nilai tertentu dari variabel . Hal ini diperoleh dengan menaksir nilai dari kurva kuadrat minimum
yang sesuai dengan data yang kita himpun dari sampel. Kurva yang diperoleh dan
Universitas Sumatera Utara
kita bentuk dari data sampel itu disebut kurva regresi terhadap , karena diduga dari Spiegel, 1988.
Dalam melakukan analisis regresi, sebagian besar mahasiswa biasanya tidak melakukan pengamatan populasi secara langsung. Hal itu dilakukan selain
pertimbangan waktu, tenaga, juga berdasarkan pertimbangan biaya yang relatif besar jika melakukan pengamatan terhadap populasi. Dalam hal ini, lazimnya digunakan
persamaan regresi linier sederhana sampel sebagai penduga persamaan regresi linier sederhana populasi dengan bentuk persamaan seperti berikut :
dan atau . Dan karena antara dan memiliki hubungan, maka nilai
dapat digunakan untuk menduga atau meramal nilai . dinamakan variabel bebas karena variabel ini nilai-nilainya tidak bergantung pada variabel lain. Dan disebut
variabel terikat juga karena variabel yang nilai-nilainya bergantung pada variabel lain. Hubungan antar variabel yang akan dipelajari disini hanyalah hubungan linier
sederhana, yakni hubungan yang hanya melibatkan dua variabel dan dan
berpangkat satu. Hasan, 2002. Regresi sederhana, adalah bentuk regresi dengan model yang bertujuan untuk
mempelajari hubungan antara dua variabel, yakni variabel independen bebas dan variabel dependen terikat. Jika ditulis dalam bentuk persamaan, model regresi
sederhana adalah dan atau
di mana, adalah
variabel tak bebas terikat, adalah variabel bebas, dan atau a adalah penduga
bagi intercept α, dan atau b adalah penduga bagi koefisien regresi β atau dengan kata lain α dan β adalah parameter yang nilainya tidak diketahui sehingga
diduga melalui statistik sampel. Sambas dan Maman, 2007. Menurut kelaziman dalam ilmu statistika ada dua macam hubungan antara
dua variabel yang relatif sering digunakan, yakni bentuk hubungan dan keeratan hubungan. Bentuk hubungan dapat diketahui melalui analisis regresi sedangkan
keeratan hubungan dapat diketahui dengan analisis korelasi. Analisis regresi dipergunakan untuk menelaah hubungan antara dua variabel atau lebih terutama
untuk menelusuri pola hubungan yang modelnya belum diketahui dengan baik atau untuk mengetahui bagaimana variasi dari beberapa variabel independen
Universitas Sumatera Utara
mempengaruhi variabel dependen dalam suatu fenomena yang komplek. Jika ,
, , …,
adalah variabel-variabel independen dan adalah variabel dependen, maka terdapat hubungan fungsional antara dan
, dimana variasi dari akan diiringi pula oleh variasi dari . Jika dibuat secara matematis hubungan itu dapat
dijabarkan sebagai berikut: = f ,
, , …,
, , dimana adalah variabel dependen tak bebas, adalah variabel independen bebas dan adalah variabel
residu disturbace term. Berkaitan dengan analisis regresi ini, setidaknya ada empat kegiatan yang
lazim dilaksanakan yakni : 1 mengadakan estimasi terhadap parameter berdasarkan data empiris, 2 menguji berapa besar variasi variabel dependen dapat diterangkan
oleh variasi independen, 3 menguji apakah estimasi parameter tersebut signifikan atau tidak, dan 4 melihat apakah tanda magnitud dari estimasi parameter cocok
dengan teori. Nazir, 2003. Hubungan antar variabel dapat berupa hubungan linier ataupun hubungan
tidak linier. Misalnya, berat badan orang dewasa sampai pada tahap tertentu bergantung pada tinggi badan, keliling lingkaran bergantung pada diameternya, dan
tekanan gas bergantung pada suhu dan volumenya. Jika dalam ilmu pemasaran, nilai penjualan akan bergantung pada biaya promosi. Hubungan-hubungan itu bila
dinyatakan dalam bentuk matematis akan memberikan persamaan-persamaan tertentu. Untuk dua variabel, hubungan liniernya dapat dinyatakan dalam bentuk
persamaan linier, yakni: dan atau
. Hubungan antara dua variabel pada persamaan linier jika digambarkan secara scatter diagram, semua
nilai dan akan berada pada suatu garis lurus. Dan dalam ilmu ekonomi, garis itu
dinamakan garis regresi. Hasan, 2002.
2.3. Regresi Linier 2.3.1. Regresi Linier Sederhana