3 Model Linear untuk Regresi

(1)

Model Linear untuk Regresi

Departemen Matematika, Universitas Indonesia – Depok 16424

Dr. rer. nat. Hendri Murfi

Intelligent Data Analysis (IDA) Group

Telp. +62-21-7862719/7863439, Fax. +62-21-7863439, Email. [email protected] MMA10991 Topik Khusus - Machine Learning

Machine Learning

y(x,w) t

x₁ x₂

x_D

Input Model/Metode Output

Diberikan data pelatihan (training data), yaitu x_idan/atau t_i, i = 1 sd N

• Preprocessing: pemilihan/ekstraksi fitur dari data, misal x_i = (x₁, x₂, .., x_D)T • Learning: penentuan parameter metode, misal w, berdasarkan data

pelatihan

• Testing: pengujian metode dengan data baru. Data penguji (testing data) tersebut harus dilakukan preprocessing yang sama dengan data

pembelajaran sebelum dieksekusi oleh metode

(2)

Diberikan data pelatihan x_i, i = 1 sd N, dan/ataut_i, i = 1 as N

• Supervised Learning. Data pelatihan disertai target, yaitu {x_i, t_i}, i = 1 sd N. Tujuan pembelajaran adalah membangun model yang dapat

menghasilkan output yang benar untuk suatu data input, misal untuk regresi, klasifikasian, regresi ordinal, ranking, dll

• Unsupervised Learning. Data pelatihan tidak disertai target, yaitu x_i, i = 1 sd N. Tujuan pembelajaran adalah membagun model yang dapat

menemukan komponen/variabel/fitur tersembunyi pada data pelatihan, yang dapat digunakan untuk: pengelompokan (clustering), reduksi

dimensi (dimension reduction), rekomendasi, dll

Learning

Supervised Learning

• Regresi

– Nilai output ti bernilai kontinu (riil)

– Bertujuan memprediksi output

dengan akurat untuk data baru

• Klasifikasi

– Nilai output ti bernilai diskrit (kelas)

– Bertujuan mengklasifikasi data baru

(3)

• Model linear adalah kombinasi linear dari fungsi nonlinear dari variabel input (fungsi basis):

dimana x = (x₁, x₂, ..., x_D)T_{adalah variabel input, dan}_w_{= (}_w

0, w1, ..., wM-1) T

adalah parameter, φφφφ(x) = (φ₀(x)_,φ₁(x)_, ..., φ_Μ−1(x))T_{adalah vektor}_{fungsi basis}

φ_j(x), M adalah jumlah total parameter dari model

• Biasanya, φ₀(x) = 1, sehingga w₀ berfungsi sebagai bias

• Ada banyak pilihan yang mungkin untuk fungsi basis φ(x), misal fungsi linear, fungsi polinomial, fungsi gaussian, fungsi sigmoidal, dll

Model Linear

Regresi

• Regresi linear sederhana (simple linear regression) adalah masalah regresi dengan variabel input x berdimensi satu. Misal kita menggunakan polinomial φ_j(x) = xj_{sebagai fungsi basis, dan M}

= M-1, maka bentuk umum dari regresi linear sederhana tersebut adalah:

Regresi Linear Sederhana

(4)

Regresi Linear Sederhana

Polynomial Curve Fitting

Diberikan data pelatihan {x_i, t_i}, i = 1 sd N

• Masalah: bagaimana mendapatkan kurva polinomial yang cocok untuk data pelatihan tersebut

• Solusi: mencari kurva polinomial yang memiliki kesalahan (error) terkecil pada data pelatihan tersebut

• Persoalan ini sering juga disebut sebagai polynomial curve fitting

Fungsi Error

• Salah satu fungsi error yang sering digunakan adalah fungsi sum-of-squares error

sbb:

• Salah satu metode yang

digunakan untuk mencari nilai

w yang meminimumkan fungsi error adalah metode kuadrat terkecil (least squares)

(5)

Metode Kuadrat Terkecil

• Setelah penurunan E(w) terhadap w, maka persoalan penentuan nilai parameter w menjadi persoalan penentuan solusi sistem persamaan linear:

Aw = t

dimana

Regresi Linear Sederhana

Contoh Kasus

Seorang ahli biologi telah melakukan eksperimen sebanyak 7 kali untuk melihat pertumbuhan bakteri berdasarkan kadar Nitrogen, dan diperoleh kondisi sbb:

Tentukan regresi linear polinomial berorde 1 berdasarkan data tsb. Selanjutnya, prediksi pertumbuhan bakteri jika diberikan Nitrogen sebanyak 5 gram.

Solusi:

Dari persoalan diatas diketahui x = kadar nitrogen, t = pertumbuhan bakteri, N=6 dan

M=1, sehingga:

dan model linear yang dihasilkan adalah y(x) = -2.35 + 1.19x. Sementara prediksi pertumbuhan bakteri untuk 5 gram Nitrogen adalah y(5) = -2.35 + 1.19*5 = 3.6

Kadar Nitrogen (gram) 3 4 6 7 8 9 Pertumbuhan Bakteri 1 3 4 6 8 8

[

37 37 255

]

, t=

[

217

]

, dan w=

[

w₁

]

adalah solusi SPL Aw=t , yaitu w=

[

−2.35 1.19

]

Regresi Linear Sederhana

(6)

Contoh Kasus: Menggunakan Weka

@RELATION bakteri @ATTRIBUTE kadar NUMERIC @ATTRIBUTE pertumbuhan NUMERIC @DATA

3,1 4,3 6,4 7,6 8,8 9,8

Format data*:

*Disimpan dalam file dengan ekstensi arff (misal: bakteri.arff)

Regresi Linear Sederhana

Contoh Kasus: Menggunakan Weka

Model hasil:

y(x) = -2.35 + 1.19x

(7)

• Karakteristik model regresi linear polinomial ditentukan

oleh nilai M (orde polinomial atau jumlah parameter). Pemilihan nilai M yang optimal dikenal juga dengan istilah

pemilihan model (model selection)

Pemilihan Model

(8)

Root-Mean-Square (RMS) Error:

Pemilihan Model

Under-fitting dan Over-fitting

• Jumlah data pembelajaran

seharusnya tidak lebih sedikit dari jumlah parameter

(9)

• Pada aplikasi praktis, kita sering menemukan kondisi

dimana untuk persoalan yang kompleks ketersediaan data pembelajaran terbatas.

• Salah satu teknik yang digunakan untuk mengkontrol

fenomena over-fitting adalah regularisasi (regularization),

yaitu dengan cara menambah finalti ke fungsi error.

Regularisasi

Penghalusan Kurva

(10)

Pengecilan Nilai Bobot

Regularisasi

Mengatasi over-fitting

(11)

• Fungsi sum square error adalah

nilai bobot w yang meminimum fungsi error adalah

dimana

Regresi Linear Umum

• Fungsi regularized sum square error adalah

nilai bobot w yang meminimum fungsi erroe adalah

dimana

Regresi Linear Umum

(12)

Referensi

• Bishop, C. H., Pattern Recognition and Machine Learning, Springer, 2006 (Bab 1.1, Bab 1.3, Bab 1.4, Bab 3.1)

(1)

• Karakteristik model regresi linear polinomial ditentukan oleh nilai M (orde polinomial atau jumlah parameter). Pemilihan nilai M yang optimal dikenal juga dengan istilah pemilihan model (model selection)

Pemilihan Model

(2)

Root-Mean-Square (RMS) Error:

Pemilihan Model

Under-fitting dan Over-fitting

• Jumlah data pembelajaran

seharusnya tidak lebih sedikit dari jumlah parameter

(3)

• Pada aplikasi praktis, kita sering menemukan kondisi dimana untuk persoalan yang kompleks ketersediaan data pembelajaran terbatas.

• Salah satu teknik yang digunakan untuk mengkontrol fenomena over-fitting adalah regularisasi (regularization), yaitu dengan cara menambah finalti ke fungsi error.

Regularisasi

Penghalusan Kurva

(4)

Pengecilan Nilai Bobot

Regularisasi

Mengatasi over-fitting

(5)

• Fungsi sum square error adalah

nilai bobot w yang meminimum fungsi error adalah

dimana

Regresi Linear Umum

• Fungsi regularized sum square error adalah

nilai bobot w yang meminimum fungsi erroe adalah

dimana

Regresi Linear Umum

(6)

Referensi

• Bishop, C. H., Pattern Recognition and Machine Learning,

3 Model Linear untuk Regresi

Model Linear untuk Regresi

Machine Learning

Learning

Supervised Learning

Regresi

Regresi Linear Sederhana

Regresi Linear Sederhana

Regresi Linear Sederhana

[

]

[

]

[

]

[

]

Regresi Linear Sederhana

Regresi Linear Sederhana

Pemilihan Model

Pemilihan Model

Pemilihan Model

Regularisasi

Regularisasi

Regresi Linear Umum

Regresi Linear Umum

Referensi

Pemilihan Model

Pemilihan Model

Pemilihan Model

Regularisasi

Regularisasi

Regresi Linear Umum

Regresi Linear Umum

Referensi

Dokumen yang terkait

Perbandingan Metode Fuzzy Dengan Regresi Linear Berganda Dalam Peramalan Jumlah Produksi (Studi Kasus: Produksi Kelapa Sawit di PT. Perkebunan Nusantara III (PERSERO) Medan Tahun 2011-2012)

Optimisasi Persoalan Linear Integer Chance Constrained

Metode Goal Linear Programming Untuk Menentukan Regresi Berganda

Konsistensi Persamaan Normal Dari Model Regresi Linear Berganda

METODE BAYESIAN PADA MODEL REGRESI LINEAR

METODE RANK NONPARAMETRIK PADA MODEL REGRESI LINEAR

Regresi linear intrinsik.

Analisis Model Regresi Nonparametrik Sirkular-Linear Berganda.

METODE RANK NONPARAMETRIK PADA MODEL REGRESI LINEAR.

ANALISIS MODEL REGRESI NONPARAMETRIK SIRKULAR-LINEAR BERGANDA

Dokumen yang Anda mencari sudah siap untuk unduhkan