Regresi Proses Gaussian untuk Pemodelan Kalibrasi

REGRESI PROSES GAUSSIAN
UNTUK PEMODELAN KALIBRASI

MOCH. ABDUL MUKID

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2009

PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASINYA
Dengan ini saya menyatakan bahwa tesis dengan judul Regresi Proses
Gaussian untuk Pemodelan Kalibrasi adalah karya saya sendiri dengan arahan dari
komisi pembimbing dan belum diajukan dalam bentuk apapun kepada perguruan
tinggi manapun. Sumber informasi yang berasal atau dikutip dari karya yang
diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks
dan dicantumkan dalam daftar pustaka dibagian akhir tesis ini.

Bogor,


Agustus 2009

Moch. Abdul Mukid
NIM G151070011

ABSTRACT
MOCH. ABDUL MUKID. Gaussian Process Regression for Calibration
Modeling. Under the Supervision of AJI HAMIM WIGENA and ERFIANI.
Multivariate calibration models have been developed usually by using
principal component regression and partial least squares regression. This research
proposes the application of Gaussian process regression as an alternative method
to develop a calibration model. Gaussian process regression is one of the
nonparametric regression methods that do not determine the mathematical
relationship between exploratory and response variables. This method is applied
to the measurement of curcumin concentration based on FTIR spectra. To handle
the high dimensionality of spectra data, principal component analysis was initially
performed, followed by applying the Gaussian process regression. Using three
principal components, 99,03% of the original data’s variability can be explained.
Based on the leverage value, few spectra were detected as outliers and will not be
used for the final calculation. This model was attempted for various covariance

functions. The results indicate that the most relevant and suitable covariance
function for curcumin concentration measurement was Square Exponential –
isotropic (SE–iso). The hyperparameter values for SE–iso were estimated by
2
Maximum Marginal Likelihood Method. Based on RYvs
and RMSE criteria, the

performance of Gaussian process regression is better than that of principal
component regression.
Keywords: Spectroscopic Calibration , Gaussian Process Regression, Covariance
Function, Hyperparameter, Maximum Marginal Likelihood

RINGKASAN
MOCH. ABDUL MUKID. Regresi Proses Gaussian untuk Pemodelan Kalibrasi.
Dibawah bimbingan AJI HAMIM WIGENA dan ERFIANI.
Di Indonesia tanaman obat telah lama digunakan oleh masyarakat dan
industri dalam pembuatan jamu. Penggunaan tanaman obat yang semakin meluas
sudah selayaknya diikuti dengan usaha untuk menjamin kualitas tanaman obat
tersebut. Hal ini untuk menjamin agar produksinya dapat bersaing dan diterima
oleh masyarakat. Salah satu indikator kualitas tanaman obat adalah konsentrasi

senyawa aktifnya. Proses penentuan konsentrasi senyawa aktif yang dikandung
oleh suatu tanaman obat perlu dilakukan secara cepat dan akurat. Salah satu
metodenya adalah dengan membuat model kalibrasi yang diperoleh dari contoh
tanaman obat.
Pada pemodelan kalibrasi spektroskopi kendala yang sering dihadapi
adalah banyaknya peubah penjelas yang jauh lebih besar dari pada banyaknya
pengamatan. Hal ini cenderung akan menyebabkan adanya multikolinearitas antar
peubah penjelas yang pada akhirnya menyebabkan penduga parameter yang tidak
stabil dan mengurangi ketepatan prediksi model. Untuk mengatasi hal tersebut,
biasanya model-model kalibrasi peubah ganda dikembangkan dengan
menggunakan regresi komponen utama maupun regresi kuadrat terkecil parsial
(Erfiani, 2005).
Dalam penelitian ini diusulkan penerapan regresi proses Gaussian sebagai
sebuah metode alternatif untuk mengembangkan sebuah model kalibrasi. Metode
ini diterapkan pada pengukuran konsentrasi kurkumin berdasarkan atas data
spektra yang diukur dengan menggunakan FTIR. Untuk mengatasi besarnya
dimensi dari data spectra, prapemrosesan dilakukan dengan menggunakan
Analisis Komponen Utama (AKU). Dengan menggunakan tiga komponen utama
yang pertama diketahui bahwa 99,03% keragaman data asal dapat dijelaskan.
Berdasarkan nilai leverage, beberapa pengamatan terdeteksi sebagai pencilan dan

dikeluarkan dalam perhitungan selanjutnya. Model ini telah dicobakan pada
berbagai jenis fungsi peragam dan hasilnya mengindikasikan bahwa fungsi
peragam yang cocok dan relevan untuk memodelkan pengukuran konsentrasi
kurkumin adalah Kuadrat Eksponensial – isotropik (KE-iso). Selanjutnya nilainilai hiperparamater dari fungsi peragam KE-iso diduga dengan menggunakan
metode kemungkinan marginal maksimum. Berdasarkan atas kriteria nilai-nilai
2
RYvs
dan RMSE, kinerja regresi proses Gaussian jauh lebih baik jika

dibandingkan dengan regresi komponen utama. Pada regresi proses Gaussian nilai
2
mencapai 88,77% dan nilai RMSE sebesar 0,1753 sedangkan pada regresi
RYvs

2
komponen utama nilai RYvs
hanya mencapai 40,18% dan nilai RMSE sebesar


0,3901.


© Hak Cipta milik IPB, tahun 2009
Hak Cipta dilindungi Undang-Undang
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan
atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan,
penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau
tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan
yang wajar IPB.
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis
dalam bentuk apa pun tanpa izin IPB.

REGRESI PROSES GAUSSIAN
UNTUK PEMODELAN KALIBRASI

MOCH. ABDUL MUKID

Tesis
Sebagai salah satu syarat untuk memperoleh gelar
Magister Sains pada
Program Studi Statistika


SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2009

Penguji Luar Komisi pada Ujian Tesis: Dr. Ir. I Gusti Putu Purnaba, DEA

Judul Tesis
Nama
NIM

: Regresi Proses Gaussian untuk Pemodelan Kalibrasi
: Moch. Abdul Mukid
: G151070011

Disetujui
Komisi Pembimbing

Dr. Ir. Aji Hamim Wigena, M.Sc.


Dr. Ir Erfiani, M.Si.

Ketua

Anggota

Diketahui

Ketua Program Studi Statistika

Dekan Sekolah Pascasarjana

Dr. Ir. Aji Hamim Wigena, M.Sc. Prof. Dr. Ir. Khairil Anwar Notodiputro, M.S.

Tanggal Ujian : 5 Agustus 2009

Tanggal Lulus:

PRAKATA

Alhamdulillah, puji syukur penulis panjatkan kepada Allah SWT atas
berkat, rahmat dan karunia-Nya sehingga penulis dapat menyelesaikan penelitian
dan penulisan tesis ini.
Tesis ini berjudul “Regresi Proses Gaussian Untuk Pemodelan Kalibrasi“
disusun berdasarkan penelitian yang dilakukan di Departemen Statistika FMIPAIPB. Penelitian yang dilakukan penulis merupakan bagian dari payung penelitian
Hibah Pascasarjana ”Pengembangan Model Kalibrasi Multirespon dan Teknik
Adulterasi Obat Bahan Alam” 2008-2010 yang merupakan kerjasama antara
Departemen Statistika dan Biofarmaka, Institut Pertanian Bogor yang didanai oleh
Dirjen Pendidikan Tinggi, Departemen Pendidikan Nasional.
Terima kasih yang sedalam-dalamnya penulis sampaikan kepada Bapak
Dr. Ir. Aji Hamim Wigena, M.Sc selaku ketua Program Studi Statistika Sekolah
Pascasarjana IPB yang sekaligus sebagai ketua komisi pembimbing dalam
penyusunan tesis ini. Rasa terima kasih juga penulis sampaikan kepada Dr. Ir.
Erfiani, M.Si selaku anggota dalam komisi pembimbing yang senantiasa
memberikan masukan dan arahan dalam penelitian ini . Penulis juga mengucapkan
terima kasih yang sebesar-besarnya kepada Prof. Dr. Khairil Anwar Notodiputro,
M.S selaku ketua tim peneliti Hibah Pascasarjana tahun 2003-2005 dengan topik
”Pengembangan Model untuk Pendugaan Kandungan Senyawa Bioaktif atau
Senyawa Penciri Beberapa Tanaman Obat”, atas izin yang telah diberikan kepada
penulis untuk menggunakan sebagian data hasil penelitiannya. Tidak lupa pula

ungkapan terima kasih penulis sampaikan kepada seluruh teman-teman STK 2007
atas diskusi dan dukungan morilnya selama menyelesaikan penulisan tesis ini.
Penulis menyadari bahwa masih banyak kekurangan dalam penyusunan
tesis ini, oleh karena itu kritik, saran dan masukan sangat penulis harapkan demi
penyempurnaan dan perbaikan tulisan ini. Semoga karya ilmiah ini bermanfaat
untuk semua pembaca. Amin.

Bogor,

Agustus 2009

Penulis

RIWAYAT HIDUP
Penulis dilahirkan di Grobogan, Jawa Tengah pada tanggal 17 Agustus
1978. Tahun 1996 penulis masuk program sarjana di Jurusan Matematika,
Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Diponegoro
melalui jalur UMPTN dan lulus pada tahun 2001. Pada tahun 2007 penulis
mendapat kesempatan untuk mengikuti program magister pada program studi
statistika, Sekolah Pascasarjana, Institut Pertanian Bogor. Beasiswa pendidikan

pascasarjana penulis peroleh dari Direktorat Jenderal Pendidikan Tinggi
Departemen Pendidikan Nasional.

REGRESI PROSES GAUSSIAN
UNTUK PEMODELAN KALIBRASI

MOCH. ABDUL MUKID

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2009

PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASINYA
Dengan ini saya menyatakan bahwa tesis dengan judul Regresi Proses
Gaussian untuk Pemodelan Kalibrasi adalah karya saya sendiri dengan arahan dari
komisi pembimbing dan belum diajukan dalam bentuk apapun kepada perguruan
tinggi manapun. Sumber informasi yang berasal atau dikutip dari karya yang
diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks

dan dicantumkan dalam daftar pustaka dibagian akhir tesis ini.

Bogor,

Agustus 2009

Moch. Abdul Mukid
NIM G151070011

ABSTRACT
MOCH. ABDUL MUKID. Gaussian Process Regression for Calibration
Modeling. Under the Supervision of AJI HAMIM WIGENA and ERFIANI.
Multivariate calibration models have been developed usually by using
principal component regression and partial least squares regression. This research
proposes the application of Gaussian process regression as an alternative method
to develop a calibration model. Gaussian process regression is one of the
nonparametric regression methods that do not determine the mathematical
relationship between exploratory and response variables. This method is applied
to the measurement of curcumin concentration based on FTIR spectra. To handle
the high dimensionality of spectra data, principal component analysis was initially
performed, followed by applying the Gaussian process regression. Using three
principal components, 99,03% of the original data’s variability can be explained.
Based on the leverage value, few spectra were detected as outliers and will not be
used for the final calculation. This model was attempted for various covariance
functions. The results indicate that the most relevant and suitable covariance
function for curcumin concentration measurement was Square Exponential –
isotropic (SE–iso). The hyperparameter values for SE–iso were estimated by
2
Maximum Marginal Likelihood Method. Based on RYvs
and RMSE criteria, the

performance of Gaussian process regression is better than that of principal
component regression.
Keywords: Spectroscopic Calibration , Gaussian Process Regression, Covariance
Function, Hyperparameter, Maximum Marginal Likelihood

RINGKASAN
MOCH. ABDUL MUKID. Regresi Proses Gaussian untuk Pemodelan Kalibrasi.
Dibawah bimbingan AJI HAMIM WIGENA dan ERFIANI.
Di Indonesia tanaman obat telah lama digunakan oleh masyarakat dan
industri dalam pembuatan jamu. Penggunaan tanaman obat yang semakin meluas
sudah selayaknya diikuti dengan usaha untuk menjamin kualitas tanaman obat
tersebut. Hal ini untuk menjamin agar produksinya dapat bersaing dan diterima
oleh masyarakat. Salah satu indikator kualitas tanaman obat adalah konsentrasi
senyawa aktifnya. Proses penentuan konsentrasi senyawa aktif yang dikandung
oleh suatu tanaman obat perlu dilakukan secara cepat dan akurat. Salah satu
metodenya adalah dengan membuat model kalibrasi yang diperoleh dari contoh
tanaman obat.
Pada pemodelan kalibrasi spektroskopi kendala yang sering dihadapi
adalah banyaknya peubah penjelas yang jauh lebih besar dari pada banyaknya
pengamatan. Hal ini cenderung akan menyebabkan adanya multikolinearitas antar
peubah penjelas yang pada akhirnya menyebabkan penduga parameter yang tidak
stabil dan mengurangi ketepatan prediksi model. Untuk mengatasi hal tersebut,
biasanya model-model kalibrasi peubah ganda dikembangkan dengan
menggunakan regresi komponen utama maupun regresi kuadrat terkecil parsial
(Erfiani, 2005).
Dalam penelitian ini diusulkan penerapan regresi proses Gaussian sebagai
sebuah metode alternatif untuk mengembangkan sebuah model kalibrasi. Metode
ini diterapkan pada pengukuran konsentrasi kurkumin berdasarkan atas data
spektra yang diukur dengan menggunakan FTIR. Untuk mengatasi besarnya
dimensi dari data spectra, prapemrosesan dilakukan dengan menggunakan
Analisis Komponen Utama (AKU). Dengan menggunakan tiga komponen utama
yang pertama diketahui bahwa 99,03% keragaman data asal dapat dijelaskan.
Berdasarkan nilai leverage, beberapa pengamatan terdeteksi sebagai pencilan dan
dikeluarkan dalam perhitungan selanjutnya. Model ini telah dicobakan pada
berbagai jenis fungsi peragam dan hasilnya mengindikasikan bahwa fungsi
peragam yang cocok dan relevan untuk memodelkan pengukuran konsentrasi
kurkumin adalah Kuadrat Eksponensial – isotropik (KE-iso). Selanjutnya nilainilai hiperparamater dari fungsi peragam KE-iso diduga dengan menggunakan
metode kemungkinan marginal maksimum. Berdasarkan atas kriteria nilai-nilai
2
RYvs
dan RMSE, kinerja regresi proses Gaussian jauh lebih baik jika

dibandingkan dengan regresi komponen utama. Pada regresi proses Gaussian nilai
2
mencapai 88,77% dan nilai RMSE sebesar 0,1753 sedangkan pada regresi
RYvs

2
komponen utama nilai RYvs
hanya mencapai 40,18% dan nilai RMSE sebesar


0,3901.

© Hak Cipta milik IPB, tahun 2009
Hak Cipta dilindungi Undang-Undang
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan
atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan,
penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau
tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan
yang wajar IPB.
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis
dalam bentuk apa pun tanpa izin IPB.

REGRESI PROSES GAUSSIAN
UNTUK PEMODELAN KALIBRASI

MOCH. ABDUL MUKID

Tesis
Sebagai salah satu syarat untuk memperoleh gelar
Magister Sains pada
Program Studi Statistika

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2009

Penguji Luar Komisi pada Ujian Tesis: Dr. Ir. I Gusti Putu Purnaba, DEA

Judul Tesis
Nama
NIM

: Regresi Proses Gaussian untuk Pemodelan Kalibrasi
: Moch. Abdul Mukid
: G151070011

Disetujui
Komisi Pembimbing

Dr. Ir. Aji Hamim Wigena, M.Sc.

Dr. Ir Erfiani, M.Si.

Ketua

Anggota

Diketahui

Ketua Program Studi Statistika

Dekan Sekolah Pascasarjana

Dr. Ir. Aji Hamim Wigena, M.Sc. Prof. Dr. Ir. Khairil Anwar Notodiputro, M.S.

Tanggal Ujian : 5 Agustus 2009

Tanggal Lulus:

PRAKATA
Alhamdulillah, puji syukur penulis panjatkan kepada Allah SWT atas
berkat, rahmat dan karunia-Nya sehingga penulis dapat menyelesaikan penelitian
dan penulisan tesis ini.
Tesis ini berjudul “Regresi Proses Gaussian Untuk Pemodelan Kalibrasi“
disusun berdasarkan penelitian yang dilakukan di Departemen Statistika FMIPAIPB. Penelitian yang dilakukan penulis merupakan bagian dari payung penelitian
Hibah Pascasarjana ”Pengembangan Model Kalibrasi Multirespon dan Teknik
Adulterasi Obat Bahan Alam” 2008-2010 yang merupakan kerjasama antara
Departemen Statistika dan Biofarmaka, Institut Pertanian Bogor yang didanai oleh
Dirjen Pendidikan Tinggi, Departemen Pendidikan Nasional.
Terima kasih yang sedalam-dalamnya penulis sampaikan kepada Bapak
Dr. Ir. Aji Hamim Wigena, M.Sc selaku ketua Program Studi Statistika Sekolah
Pascasarjana IPB yang sekaligus sebagai ketua komisi pembimbing dalam
penyusunan tesis ini. Rasa terima kasih juga penulis sampaikan kepada Dr. Ir.
Erfiani, M.Si selaku anggota dalam komisi pembimbing yang senantiasa
memberikan masukan dan arahan dalam penelitian ini . Penulis juga mengucapkan
terima kasih yang sebesar-besarnya kepada Prof. Dr. Khairil Anwar Notodiputro,
M.S selaku ketua tim peneliti Hibah Pascasarjana tahun 2003-2005 dengan topik
”Pengembangan Model untuk Pendugaan Kandungan Senyawa Bioaktif atau
Senyawa Penciri Beberapa Tanaman Obat”, atas izin yang telah diberikan kepada
penulis untuk menggunakan sebagian data hasil penelitiannya. Tidak lupa pula
ungkapan terima kasih penulis sampaikan kepada seluruh teman-teman STK 2007
atas diskusi dan dukungan morilnya selama menyelesaikan penulisan tesis ini.
Penulis menyadari bahwa masih banyak kekurangan dalam penyusunan
tesis ini, oleh karena itu kritik, saran dan masukan sangat penulis harapkan demi
penyempurnaan dan perbaikan tulisan ini. Semoga karya ilmiah ini bermanfaat
untuk semua pembaca. Amin.

Bogor,

Agustus 2009

Penulis

RIWAYAT HIDUP
Penulis dilahirkan di Grobogan, Jawa Tengah pada tanggal 17 Agustus
1978. Tahun 1996 penulis masuk program sarjana di Jurusan Matematika,
Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Diponegoro
melalui jalur UMPTN dan lulus pada tahun 2001. Pada tahun 2007 penulis
mendapat kesempatan untuk mengikuti program magister pada program studi
statistika, Sekolah Pascasarjana, Institut Pertanian Bogor. Beasiswa pendidikan
pascasarjana penulis peroleh dari Direktorat Jenderal Pendidikan Tinggi
Departemen Pendidikan Nasional.

DAFTAR ISI
Halaman
DAFTAR TABEL ........................................................................................ xii
DAFTAR GAMBAR ................................................................................... xiii
DAFTAR LAMPIRAN .................................................................................. xiv
PENDAHULUAN
Latar Belakang ......................................................................................... 1
Tujuan Penelitian ..................................................................................... 2
TINJAUAN PUSTAKA
Spektroskopi FTIR (Fourier Transform Infrared) ...................................
High Performance Liquid Chromatography (HPLC) ..............................
Kandungan Senyawa Aktif pada Temulawak ..........................................
Regresi Proses Gaussian ..........................................................................
Fungsi Peragam ........................................................................................
Pendugaan Nilai Hiperparameter Fungsi Peragam ..................................
Prediksi dalam Regresi Proses Gaussian ..................................................

3
4
5
6
7
10
11

DATA DAN METODE
Bahan ....................................................................................................... 14
Metode ..................................................................................................... 14
HASIL DAN PEMBAHASAN
Deskripsi Spektrum Kurkumin ................................................................
Reduksi Peubah Penjelas .........................................................................
Deteksi Pengamatan Pencilan ..................................................................
Pemilihan Gugus Uji dan Gugus Kalibrasi ..............................................
Pemilihan Fungsi peragam .......................................................................
Pemodelan Regresi Proses Gaussian ........................................................
Pengujian Sebaran Galat ..........................................................................

18
19
19
20
22
23
25

SIMPULAN DAN SARAN ........................................................................... 26
DAFTAR PUSTAKA .................................................................................... 27
LAMPIRAN ................................................................................................... 28

DAFTAR TABEL
1. Ragam kumulatif komponen utama .......................................................... 15
2. Nilai leverage untuk masing-masing contoh ........................................... 17
3. Nilai RMSEP setiap jenis fungsi peragam ............................................... 19

DAFTAR GAMBAR
1. Diagram alur penelitian ............................................................................. 14
2. Spektra kurkumin serbuk temulawak ....................................................... 15
3. Dendogram penggerombolan berdasarkan 3 komponen utama ............... 18
4. Plot antara Y dan Y prediksi untuk model regresi proses Gaussian ........ 21
5. Plot antara Y dan Y prediksi untuk model regresi komponen utama ...... 21
6. Plot peluang normal peubah acak galat .................................................... 22

DAFTAR LAMPIRAN

1. Data Konsentrasi Kurkumin dan Tiga Komponen Utama Transmitan .... 28
2. Syntax program MATLAB untuk menghitung nilai RMSEP .................. 29
3. Syntax program MATLAB untuk menghitung nilai RMSE .................... 31

PENDAHULUAN
Latar Belakang
Di Indonesia tanaman obat telah lama digunakan oleh masyarakat dan
industri dalam pembuatan jamu. Akhir-akhir ini perusahaan farmasi pun telah
memanfaatkan tanaman obat tradisional pada produk-produknya. Penggunaan
tanaman obat yang semakin meluas sudah selayaknya diikuti dengan usaha untuk
menjamin kualitas tanaman obat tersebut. Hal ini untuk menjamin agar
produksinya dapat bersaing dan diterima oleh masyarakat. Salah satu indikator
kualitas tanaman obat adalah konsentrasi senyawa aktifnya.
Proses penentuan konsentrasi senyawa aktif yang dikandung oleh suatu
tanaman obat perlu dilakukan secara cepat dan akurat. Secara kuantitatif dan
kualitatif suatu senyawa aktif dapat diketahui antara lain melalui metode HPLC
(High Performance Liquid Chromatography) dan FTIR (Fourier Trasform
Infrared). Penentuan konsentrasi senyawa aktif dilakukan melalui proses yang
panjang meliputi penghancuran bahan, pelarutan, dan pengukuran dengan HPLC.
Proses ini memerlukan waktu dan biaya yang relatif mahal. Untuk itu sangat
diperlukan metode yang handal tetapi relatif mudah untuk digunakan. Salah satu
metodenya adalah dengan membuat sebuah model kalibrasi. Model ini
menyatakan hubungan antara konsentrasi senyawa aktif hasil pengukuran HPLC
dengan persen transmitan (absorban) yang diukur dengan menggunakan FTIR.
Tujuan dari pembentukan model ini adalah untuk memprediksi konsentrasi
senyawa aktif dengan akurasi yang tinggi dari nilai persen transmitan yang secara
ekonomi lebih murah dan mudah diperoleh (Erfiani, 2005).
Beberapa penulis telah mengembangkan model kalibrasi untuk kasus yang
berbeda. Atok (2005) menggunakan Jaringan Syaraf Tiruan dengan metode pra
pemrosesan

Analisis

Komponen

Utama,

sedangkan

Djuraidah

(2003)

membandingkan kinerja model PLS non-linear dengan Jaringan Syaraf Tiruan
pada model kalibrasi. Erfiani (2005) mengembangkan model kalibrasi dengan
pendekatan Bayes dimana reduksi peubahnya melalui pendekatan regresi
terpenggal, sedangkan Sony (2005) menggunakan Regresi Komponen Utama
dimana metode wavelet digunakan untuk pra pemrosesan. Selain pendekatan
parametrik, beberapa penulis juga mengembangkan model kalibrasi dengan

1

pendekatan non parametrik. Tonah (2005) menggunakan regresi sinyal P-Spline
untuk kalibarasi kandungan gingerol dimana metode prapemrosesannya adalah
koreksi pencaran multiplikatif.
Pada penelitian ini penulis menggunakan pendekatan regresi proses
Gaussian untuk membangun model kalibrasi pada pengukuran konsentrasi
kurkumin berdasarkan data persen transmitannya. Aspek penting yang harus
diketahui dalam pemodelan dengan pendekatan regresi proses Gaussian adalah
fungsi peragam. Fungsi peragam adalah sebuah fungsi dari input-input model
yang menghasilkan sebuah nilai peragam bagi output-output yang bersesuaian
(Rasmussen, 1996). Regresi proses Gaussian pada awalnya diusulkan oleh
O’Hagan (1978) yang memandang sebagai sebuah alternatif pendekatan untuk
jaringan syaraf tiruan. Regresi proses Gaussian dapat juga diturunkan dari
perspektif regresi nonparametrik Bayesian dengan penempatan secara langsung
sebaran prior Gaussian bagi fungsi-fungsi regresi f(x) (MacKay 1998, diacu dalam
Williams 2002).
Regresi proses Gaussian telah digunakan oleh beberapa peneliti untuk
pemodelan. Rasmussen dan Williams (2006) menggunakan regresi proses
Gaussian untuk pemodelan pembelajaran gerak lengan tangan robot sedangkan
Chen et al. (2007) menggunakan regresi proses Gaussian untuk pemodelan
kalibrasi spektroskopi dan membandingkan hasilnya dengan regresi komponen
utama, jaringan syaraf tiruan dan regresi PLS.
Tujuan Penelitian
Penelitian ini bertujuan untuk menerapkan regresi proses Gaussian pada
pemodelan kalibrasi spektroskopi dengan melakukan kajian terhadap penggunaan
berbagai fungsi peragam.

2

TINJAUAN PUSTAKA
Spektroskopi FTIR (Fourier Transform Infrared)
FTIR merupakan salah satu teknik spektroskopi infra merah. Instrumentasi
spektrum infra merah dibagi kedalam tiga jenis radiasi yaitu infra merah dekat
(bilangan gelombang 12800-4000 cm-1), infra merah pertengahan (bilangan
gelombang 4000-200 cm-1), dan infra merah jauh (bilangan gelombang 200-10
cm-1) (Nur dan Adijuawana, 1989). FTIR termasuk dalam kategori radiasi infra
merah pertengahan (bilangan gelombang 4000-200 cm-1).
Hampir setiap senyawa yang memiliki ikatan kovalen akan menyerap
berbagai frekuensi radiasi elektromagnetik dalam daerah spektrum inframerah.
Setiap tipe ikatan yang berbeda mempunyai sifat frekuensi vibrasi yang berbeda,
dan karena tipe ikatan yang sama dalam dua senyawa yang berbeda terletak dalam
lingkungan yang sedikit berbeda, maka tidak akan ada dua molekul yang berbeda
strukturnya akan mempunyai bentuk serapan inframerah atau spektrum
inframerah yang tepat sama.
Jika I0 adalah intensitas IR yang masuk kedalam contoh dan I adalah
intensitas IR yang diteruskan (transmitted) oleh contoh, maka :
Absorban (A) = Log (I0 / I) dan transmitan (T) = 100 (I/I0).
Sehingga hubungan absorban dengan transmitan adalah :
A = - log ( T/100).
Karena kekuatan serapan proporsional terhadap konsentrasi, maka FTIR
dapat digunakan untuk analisis kuantitatif yang menghubungkan konsentrasi
dengan absorban atau persen transmitan. Untuk menduga konsentrasi suatu
senyawa tertentu dalam contoh, diperlukan pengukuran nilai-nilai absorban dari
contoh pada berbagai bilangan gelombang.
Plot antara transmitan dengan bilangan gelombang menghasilkan spektrum
infra merah. Karena setiap tipe ikatan yang berbeda mempunyai sifat frekuensi
vibrasi yang berbeda, maka tidak ada molekul yang berbeda strukturnya akan
mempunyai bentuk serapan infra merah atau spektrum infra merah yang tepat
sama. Dengan membandingkan spektrum infra merah dari dua senyawa yang
diperkirakan identik maka dapat dikatakan bahwa kedua senyawa tersebut identik

3

atau tidak. Pelacakan tersebut lazim dikenal dengan bentuk sidik jari (Finger
Print) dari dua spektrum infra merah. Kondisi puncak spektrum infra merah kedua
senyawa tepat sama maka dikatakan dalam banyak hal kedua senyawa tersebut
sama atau identik (Sostrohamidjoyo 1990, diacu dalam Erfiani 2005).

High Performance Liquid Chromatography (HPLC)
Kromatografi adalah suatu metode pemisahan komponen-komponen suatu
campuran, komponen-komponen tersebut akan terdistribusi diantara dua fase.
Salah satu fase dibuat diam dan dinamakan fase diam atau fase stasioner, fase
lainnya disebut fase gerak atau fase mobil yang bergerak diantara celah-celah atau
pada permukaan fase stasioner. Pergerakan fase mobil ini mengakibatkan
pergerakan diferensial dari komponen-komponen contoh (Nur dan Adijuwana,
1989). Metode pemisahaan ini memerlukan waktu sangat singkat dan lebih efektif
dibandingkan dengan pemisahaan lain. Fase diam pada kromatografi dapat berupa
cair atau padatan sedangkan fase gerak dapat berupa cair atau gas. Berdasarkan
jenis fasenya kromatografi dapat digolongkan menjadi empat jenis yaitu: cairpadatan, gas-padatan, cair-cair, dan gas-cair.
Kromatografi cair adalah semua metode kromatografi yang menggunakan
cairan sebagai fase mobil. Kromatografi cair meliputi metode kromatografi
sederhana dan kromatografi modern. HPLC adalah salah satu metode
kromatografi

yang

termasuk

kromatografi

cair

modern.

HPLC

adalah

kromatografi yang menggunakan cairan sebagai fase gerak dan sebagai fase diam
dapat berupa suatu padatan atau senyawa tertentu yang terikat secara kimia
dengan padatan pendukungnya.
HPLC biasanya digunakan untuk memisahkan senyawa yang tidak dapat
dipisahkan dengan kromatografi gas, karena sifatnya yang tidak mudah menguap,
sehingga tidak mampu melewati kolom dan sample tidak tahan pada suhu tinggi
sehingga akan mengalami dekomposisi pada kondisi pemisahan. HPLC dapat
mengatasi permasalahan tersebut, karena HPLC mampu memisahkan senyawa
yang tidak mudah menguap dan stabil pada suhu tinggi. Selain itu berbagai
macam fase diam dan fase gerak dapat digunakan pada HPLC yang
memungkinkan metode ini memisahkan berbagai jenis senyawa.

4

HPLC pada dasarnya adalah suatu kromatografi kolom yang menggunakan
kolom yang terbuat dari bahan kemasan, maka untuk mendapatkan laju alir yang
memadai, digunakan tekanan sampai 5000 lb/inci atau sekitar 2000 kg/cm. Teknik
pemisahan HPLC dilakukan dengan menginjeksikan sedikit sampel yang
berbentuk cairan ke dalam aliran cairan (fase mobil/fase gerak) yang berjalan
melalui kolom yang berisi partikel dari suatu fase stasioner. Pemisahan campuran
kedalam komponennya tergantung pada tingkat retensi masing-masing komponen
di dalam kolom. Kecendrungan suatu komponen ditahan di dalam kolom
ditentukan oleh partisinya diantara cairan fase mobil dan fase stasioner.
HPLC digunakan terutama untuk golongan senyawa tak atsiri, misalnya
terpenoid tinggi, segala jenis fenol, alkaloid, lipid dan gula. HPLC berhasil paling
baik untuk senyawa yang dapat dideteksi pada daerah spektrum UV atau spektrum
sinar tampak.
HPLC berbeda dengan kromatografi lainnya terutama dalam penggunaan
partikel padatan sebagai pengisi kolom yang mempunyai ukuran partikel seragam
dengan diameter kecil, dengan demikian diharapkan akan diperoleh efisiensi
kolom yang tinggi tetapi sebagai akibatnya diperlukan dan dibutuhkan pompa
bertekanan tinggi yang berfungsi mengalirkan pelarut fasa gerak secara terus
menerus. Dengan alasan tersebut HPLC sering disebut dengan kromatografi cair
kinerja tinggi. Dalam kromatografi cair kinerja tinggi selain proses pemisahan
terkait pula proses penginderaan, pemantauan dan perhitungan hasil. Proses
penginderaan dapat dilakukan oleh beberapa macam alat detektor dan
pemilihannya bergantung pada senyawa yang diteliti. HPLC dapat digunakan
untuk analisis kualitatif dan kuantitatif sebagai sarana untuk pemurnian memalui
pemurnian secara preparatif (Lindsay 1992, diacu dalam Erfiani 2005).

Kandungan Senyawa Aktif pada Temulawak
Menurut Sinambela (1985), komposisi rimpang temulawak dapat dibagi
menjadi dua fraksi utama yaitu zat warna kurkuminoid dan minyak atsiri. warna
kekuningan temulawak disebabkan adanya kurkuminoid. Kandungan utama
kurkuminoid

terdiri

dari

senyawa

kurkumin,

desmetoksikurkumin

dan

bisdesmetoksikurkumin. Rimpang temulawak segar, selain terdiri dari senyawa

5

kurkuminoid dan minyak atsiri juga mengandung lemak, protein, selulosa, pati,
dan mineral. Kadar masing-masing zat tersebut tergantung pada umur rimpang
yang dipanen serta juga dipengaruhi oleh letak dan ketinggian tempat temulawak
berada.
Temulawak mempunyai berbagai macam khasiat, yaitu sebagai: analgesik,
anthelmintik, antibakteri, antijamur, antidiabetik, antidiare, antiinflamasi, antihepatotoksik,

antioksidan,

antitumor,

antidepresan,

diuretik,

hipotermik,

hipolipidemik, insektisida, dan lain-lain. Khasiat temulawak tersebut telah
dibuktikan melalui teknik ilmu pengetahuan modern baik oleh ilmuwan dalam
maupun luar negeri.

Regresi Proses Gaussian
Proses stokastik adalah suatu kumpulan dari peubah-peubah acak

{Y

x

x ∈ X } yang diindekskan dengan sebuah himpunan X yang beranggotakan d

peubah penjelas. Proses-proses stokastik ditentukan oleh pemberian sebaran
peluang bersama untuk setiap himpunan bagian manapun dari Yx1 ,K , Yxk dengan

sebuah cara yang konsisten. Proses Gaussian adalah suatu proses stokastik dimana
himpunan berhingga manapun dari himpunan peubah acak Y mempunyai sebaran
bersama Gaussian ganda (Williams, 2002). Sebuah proses Gaussian secara
lengkap ditentukan oleh fungsi rataan μ (x ) = E [Yx ] dan fungsi peragam

[(

)(

)]

k (x i , x j ) = E Yxi − μ (x i ) Yx j − μ (x j ) .

Regresi proses Gaussian dapat diturunkan dari sudut pandang regresi
nonparametric Bayesian yaitu dengan penempatan secara langsung sebaran prior
Gaussian bagi fungsi-fungsi regresi f(x) (MacKay 1998, diacu dalam Williams
2002). Misal untuk setiap output yi bergantung pada input xi dibawah sebuah
fungsi fi sebagai berikut :
y i = f (x i ) + ε i

(1)

dimana εi adalah peubah acak galat yang secara bebas dan identik menyebar
Gaussian dengan rataan nol dan ragam σ 2 , sedangkan x i adalah vektor input ke-i
dimana i = 1,......,n. Apabila fungsi-fungsi f dikumpulkan dalam sebuah vektor f =

6

[ f1 ,L, f n ]T maka menurut Proses Gaussian untuk metode regresi , sebaran prior
atas vektor f adalah Gaussian Ganda dengan vektor rataan 0 dan matrik peragam
K, yaitu
f X, θ ~ N (0, K )

(2)

dimana K adalah matrik n x n yang bergantung pada X dan θ sedangkan θ adalah
vektor parameter dari fungsi peragam. Setiap elemen ke (i,j) dari matrik K adalah
k(xi,xj) dimana k ( .,.) adalah sebuah fungsi yang definit non negatif yang memuat

parameter θ . Selanjutnya k ( .,.) disebut sebagai fungsi peragam.
Persamaan (1) dapat dinyatakan dalam bentuk persamaan vektor, yaitu

y =f +ε

(3)

dimana y adalah vektor amatan dari respon, f adalah vektor dari fungsi-fungsi
regresi dan ε adalah vektor galat.
Sebagai implikasi langsung atas penetapan sebaran prior Gaussian ganda
bagi vektor f dan asumsi bahwa vektor galat ε menyebar Gaussian maka sebaran
bagi vektor amatan y adalah Gaussian ganda dengan nilai tengah 0 dan matrik
ragam peragam K + σ 2 I . Tidak setiap vektor amatan y selalu memiliki nilai
tengah 0 sehingga untuk memenuhinya setiap amatan dari yi akan dikurangi
dengan nilai rata-rata dari keseluruhan amatan.

Fungsi Peragam
Fungsi peragam adalah sebuah fungsi dari input-input model yang
menghasilkan sebuah nilai peragam bagi output-output yang bersesuaian
(Rasmussen, 1996). Satu-satunya syarat bagi sebuah fungsi peragam adalah
mampu membangkitkan sebuah matrik ragam peragam yang definit non negatif
untuk sembarang himpunan titik-titik input.
Secara garis besar fungsi peragam dapat dibedakan menjadi dua, yaitu
fungsi peragam yang stasioner dan fungsi peragam yang tidak stasioner. Fungsi
peragam yang stasioner adalah sebuah fungsi dari xi – xj (jarak euclid antara dua
buah input). Fungsi peragam yang stasioner invarian terhadap translasi namun
seringkali gagal dalam menyesuaikan terhadap kemulusan dari fungsi yang
diteliti. Sebaliknya fungsi peragam yang tidak stasioner adalah bukan merupakan

7

fungsi dari jarak antara dua buah input, namun fungsi peragam jenis ini mampu
menyesuaikan terhadap kemulusan fungsi (Paciorek dan Schervish, 2005). Fungsi
peragam yang stasioner diantaranya adalah kuadrat eksponensial sedangkan yang
termasuk fungsi peragam tidak stasioner adalah fungsi-fungsi peragam linear
(Rasmussen dan Williams, 2006). Beberapa fungsi peragam yang umum
digunakan dalam model regresi proses Gaussian adalah sebagai berikut:
a. Fungsi peragam kuadrat eksponensial dengan ukuran jarak isotropik (KE-iso).
Fungsi peragam ini memiliki formula
−1

T Δ
(x i − x j )⎞⎟⎟
k (x i , x j ) = σ 2f exp⎜⎜ − (x i − x j )
2



dimana σ 2f

(4)

⎡l12 L 0 ⎤


adalah ragam signal dan Δ = ⎢ M O M ⎥ sedangkan lm adalah
⎢ 0 L l d2 ⎥



parameter skala panjang untuk m = 1, ..., d. Dalam fungsi peragam ini nilai
parameter skala panjang dianggap sama yaitu l1 = l 2 = L = l d = l . Fungsi
peragam ini menunjukkan ide bahwa kasus dengan input-input yang
berdekatan memiliki korelasi yang tinggi pada output-outputnya. Nilai
parameter skala panjang yang sama menunjukkan bahwa setiap dimensi input
memiliki tingkat “penting” yang sama dalam memprediksi nilai peragam dari
output-output yang bersesuaian.
b. Fungsi peragam kuadrat eksponensial dengan ukuran jarak Automatic
Relevance Determination (KE-ARD).
Fungsi peragam ini memiliki formula
−1

T Δ
(x i − x j )⎞⎟⎟
k (x i , x j ) = σ 2f exp⎜⎜ − (x i − x j )
2



dimana σ 2f

(5)

⎡l12 L 0 ⎤


adalah ragam signal dan Δ = ⎢ M O M ⎥ sedangkan lm adalah
⎢ 0 L l d2 ⎥



parameter skala panjang untuk m = 1, ..., d. Dalam fungsi peragam ini nilai
parameter skala panjang dianggap berbeda antara satu dengan yang lainnya.
Fungsi peragam KE-ARD menunjukkan ide yang sama dengan KE-iso yaitu

8

bahwa kasus dengan input-input yang berdekatan memiliki korelasi yang
tinggi pada output-outputnya. Selain itu pada fungsi KE-ARD memungkinkan
untuk mendeteksi tingkat “penting” yang berbeda dari setiap dimensi input
dalam memprediksi nilai peragam bagi output-output yang bersesuaian. Makin
besar nilai skala panjang menunjukkan bahwa input tersebut makin tidak
penting peranannya sebaliknya makin kecil nilai skala panjang makin penting
peranan input tersebut dalam pendugaan peragam bagi output-output yang
bersesuaian.
c. Fungsi peragam linear dengan hiperparameter tunggal (Linear-1).
Fungsi peragam ini memiliki formula

k (x i , x j ) = x Ti Δ−1 x j +

1
t

(6)

⎡t1 L 0 ⎤
dimana t adalah parameter yang mengendalikan bias dan Δ = ⎢⎢ M O M ⎥⎥
⎢⎣ 0 L t d ⎥⎦

sedangkan t1 = t 2 = L = t d = t .
d. Fungsi peragam linear dengan parameter Automatic Relevance Determination
(Linear-ARD).
Fungsi peragam ini memiliki formula
k (x i , x j ) = x Ti Δ−1 x j

(7)

⎡t12 L 0 ⎤


dimana Δ = ⎢ M O M ⎥ . Dalam fungsi peragam ini, parameter-parameter
⎢ 0 L t d2 ⎥


ARD dianggap nilainya berbeda antara satu dengan yang lainnya.
e. Fungsi peragam Matern 3 dengan ukuran jarak isotropik.
Fungsi peragam ini memiliki formula
T
T
k (x i , x j ) = σ 2f ⎛⎜1 + 3(x i − x j ) Δ−1 (x i − x j ) ⎞⎟ exp⎛⎜ − 3(x i − x j ) Δ−1 (x i − x j ) ⎞⎟





(8)

9

dimana σ 2f

⎡l12 L 0 ⎤


adalah ragam signal dan Δ = ⎢ M O M ⎥ sedangkan lm adalah
⎢ 0 L l d2 ⎥



parameter skala panjang untuk m = 1, ..., d. Dalam fungsi peragam ini nilai
parameter skala panjang dianggap dianggap sama yaitu l1 = l 2 = L = l d = l .
Selain fungsi-fungsi peragam diatas, fungsi peragam daptt dibuat dengan
mengkombinasikan fungsi-fungsi peragam di atas, karena penjumlahan maupun
perkalian dari fungsi-fungsi peragam akan menghasilkan sebuah fungsi peragam
juga (Rasmussen dan Williams, 2006).
Dari beberapa jenis fungsi peragam yang telah disebutkan, tampak bahwa
setiap fungsi peragam memiliki parameter-parameter tertentu. Sebagai contoh
fungsi peragam Kuadrat Eksponensial memiliki parameter-parameter ragam signal
( σ 2f ) dan skala panjang (l). Selanjutnya parameter-parameter tersebut ditulis

[

]

dalam sebuah vektor parameter θ = σ 2f , l . Untuk menunjukkan bahwa parameterparameter ini berbeda dengan parameter dalam regresi parametrik, selanjutnya
parameter-parameter tadi disebut dengan hiperparameter (Rasmussen dan
Williams, 2006).

Pendugaan Nilai Hiperparameter Fungsi Peragam
Terdapat beberapa metode yang dapat digunakan untuk menduga nilainilai hiperparameter. Williams (2002) menyatakan bahwa untuk menduga nilai θ
dapat digunakan metode kemungkinan marginal maksimum ( Maximum Marginal
Likelihood ) , metode aposterior maksimum, dan metode simulasi hybrid Monte
Carlo. Metode lain yang bisa digunakan adalah metode Cross Validation dan
metode Generalized Cross Validation (Wahba, 1990 dalam Williams 2002).
Dalam penelitian ini, pendugaan nilai hiperparameter menggunakan
metode kemungkinan marginal maksimum. Fungsi kemungkinan marginal
diperoleh dengan mengintegralkan fungsi kemungkinan yang telah dikalikan
dengan sebaran prior bagi f, yaitu

p(y X, θ ) = ∫ p(y f, X, θ )p(f X, θ )df

(9)

10

Dibawah kerangka kerja Proses Gaussian

sebaran prior atas f X, θ adalah

Gaussian ganda, yaitu f X, θ ~ N (0, K ) atau
1
1
n
log p (f X, θ ) = − f T K −1f − log K − log 2π
2
2
2

(10)

Peubah acak y f , X, θ dan f X, θ masing-masing menyebar Gaussian Ganda
sehingga peubah acak y X, θ

menyebar Gaussian ganda juga (Timm, 2002),

sehingga fungsi kemungkinan marginalnya menurut Rasmussen (2006) adalah

(

1
log p (y X, θ ) = − y T K + σ 2
2

)

−1

1
n
y − log K + σ 2 I − log 2π
2
2

(11)

Penduga bagi nilai hiperparameter fungsi peragam tidak dapat diperoleh
secara langsung melalui statistik penduganya oleh karena itu untuk menemukan
nilai dugaannya dilakukan secara numerik. Salah satu metode yang dapat
digunakan adalah metode Conjugate Gradient (Fletcher dan Reeves, 1964).
Metode Conjugate gradient adalah sebuah algoritma yang dirancang untuk
menemukan nilai minimum lokal terdekat dari fungsi banyak peubah dengan
syarat gradien dari fungsi tersebut dapat dihitung. Usaha untuk memaksimumkan
fungsi kemungkinan marginal ekuivalen dengan meminimumkan fungsi
kemungkinan marginal negatif.
Misal h adalah fungsi yang didefinisikan pada persamaan (11) dan
∇h(θ 0 ) =

∂h
(θ 0 ) adalah turunan berarah dari fungsi h terhadap parameter θ .
∂θ&

Berikut ini adalah algoritma dari metode Conjugate Gradient untuk fungsi
nonlinear.
Langkah 1: Menentukan nilai awal θ 0 .
Langkah 2: d 0 ← −∇h(θ 0 )
Langkah 3: for k = 0,1, ..., n-1 do
a) Cari nilai α k yang meminimumkan g (α ) = h(θ k + αd k )
b) θ k +1 ← θ k + α k d k
c) β k ←

∇h(θ k +1 )
∇h(θ k )

2

2

11

d) d k +1 ← −∇h(θ k +1 ) + β k d k
e) θ 0 ← θ n
langkah 4: Kembali kelangkah 2 sampai diperoleh nilai β k − β k −1 < ε , dimana
nilai ε ditetapkan terlebih dahulu yang nilainya kecil sekali (mendekati nol).
Rassmusen (1996) telah mengembangkan sebuah program dalam bahasa
Matlab untuk metode Conjugate Gradient ini.

Prediksi Dalam Regresi Proses Gaussian

Misal diberikan beberapa amatan dan sebuah fungsi peragam, selanjutnya
akan ditentukan sebuah prediksi dengan menggunakan model proses Gaussian.
Untuk melakukan hal itu, jika x* sebuah titik uji dan f * adalah fungsi yang
bersesuaian dengan x* , maka dibawah kerangka kerja Proses Gaussian , sebaran
bersama dari f dan f * adalah Gaussian Ganda dengan rataan nol, yaitu:
⎛ ⎡K
⎡f ⎤
⎢ * ⎥ X, θ ~ N ⎜⎜ 0, ⎢ T
⎣f ⎦
⎝ ⎣k

(

)

(

dimana k = [k x * , x1 , K , k x * , x n

)

T

k⎤⎞

κ ⎥⎦ ⎟⎠

(12)

adalah vektor n x 1 yang dibentuk dari

(

)

peragam antara x* dan input-input model. Sedangkan κ = k x * , x * adalah sebuah
skalar. Apabila peubah galat mengikuti sebaran seperti pada persamaan (1) maka
sebaran bersama dari peubah teramati y dan y* adalah

⎛ ⎡K + σ 2 I
⎡y ⎤
k ⎤ ⎞⎟
⎜ 0, ⎢
~
X,
θ
N
⎢ *⎥

T

κ + σ 2 ⎦ ⎟⎠
⎣y ⎦
⎝ ⎣ k

(13)

Sehingga sebaran marginal dari y * adalah Gaussian juga, yaitu :

(

y * y, X, θ ~ N m(x * ), v(x * )

)

(14)

dimana rataan dan ragam adalah

( ) (
v(x ) = κ + σ

) y
(K + σ I )

m x* = k T K + σ 2 I
*

2

− kT

−1

2

−1

(15)

k

(16)

12

( )

Nilai dugaan bagi y* adalah m(x*) dan ragam bagi dugaan y* adalah v x * . Secara

[

]

umum untuk m buah titik uji X * = x *1 , K , x *m maka sebaran y* adalah Gaussian
Ganda dengan parameter-parameter,

m(X * ) = K * (K + σ 2 I ) y
T

−1

(17)

v(X * ) = K ** + σ 2 I − K * (K + σ 2 I ) K
T

−1

(18)

dimana K * adalah matrik n x m dari peragam antara input-input training dan titiktitik uji. Matrik K ** dengan ukuran m x m tersusun dari peragam antara titik-titik
uji.

13

BAHAN DAN METODE
Bahan
Data yang digunakan dalam penelitian ini adalah data sekunder yang
merupakan bagian dari data penelitian Hibah Pascasarjana tahun 2003-2005 hasil
kerjasama antara Departemen Statistika IPB dengan Pusat Studi Biofarmaka
LPPM IPB. Penelitian tersebut didanai oleh Dirjen Pendidikan Tinggi,
Departemen Pendidikan Nasional. Data yang digunakan adalah persen transmitan
kurkumin dari serbuk temulawak hasil pengukuran spektrometer FTIR dan data
konsentrasi senyawa aktif kurkumin yang diukur dengan menggunakan HPLC.
Temulawak yang dijadikan contoh diambil dari beberapa daerah sentra tanaman
obat, yaitu Bogor, Sukabumi, Kulon Progo, Karanganyar, dan Cianjur dan Balitro.
Data-data tersebut diperoleh dari Pusat Studi Biofarmaka Institut pertanian Bogor.

Metode Penelitian
Penelitian ini terdiri atas 6 tahapan, yaitu (1) pra pemrosesan, (2) deteksi
pengamatan pencilan, (3) pemilihan gugus kalibrasi dan gugus uji, (4) pemilihan
fungsi peragam, (5) pemodelan dan (6) pengujian. Keenam tahapan tersebut lebih
jelasnya dapat dilihat pada Gambar 1.

Tahap pertama: Pra pemrosesan
Tahap pra pemrosesan adalah tahapan mereduksi jumlah peubah penjelas. Dalam
tahapan ini digunakan Analisis Komponen Utama (AKU). Terdapat dua aktifitas
dasar dari AKU, yaitu :
1. Pembuatan matriks korelasi atau matriks ragam-peragam. Aktifitas ini
diperlukan sebagai pemahaman awal terhadap karakteristik data. Karena data
hasil pengukuran FTIR mempunyai satuan pengukuran yang sama maka
matrik input yang digunakan adalah matrik ragam-peragam.
2. Penentuan jumlah komponen utama. Metode yang digunakan didasarkan atas
proporsi keragaman kumulatif total yang mampu dijelaskan. Jika λ1 , λ2 , K, λ p

14

adalah akar ciri dari matrik ragam peragam maka proporsi kumulatif dari k
k

komponen utama pertama adalah

∑λ

i

∑λ

i

i =1
p

i =1

, k = 1,2, K p

Tahap kedua : Deteksi pengamatan pencilan
Metode yang digunakan untuk mendeteksi pencilan adalah dengan melihat nilai
leverage setiap contoh yaitu dengan langkah-langkah sebagai berikut:
1. Menghitung

hi =

nilai

leverage

untuk

setiap

contoh

dengan

formula

A ˆ
t
1
+ ∑ ia dimana tˆia adalah skor untuk contoh ke-i pada komponen
N a =1 λˆa

utama ke-a dan λ̂ a adalah jumlah kuadrat dari skor-skor contoh untuk
kalibrasi yang bersesuaian dengan komponen a, sedangkan N adalah
banyaknya contoh yang digunakan.
2. Membandingkan nilai leverage masing-masing contoh dengan R =

1+ A
.
N

Jika nilai laverage lebih dari 3R maka contoh tersebut dikategorikan sebagai
sebuah pencilan (Naes et al, 2002).

Tahap ketiga : Pemilihan gugus uji dan gugus kalibrasi
Langkah-langkahnya adalah sebagai berikut:
1. Melakukan penggerombolan spektrum berdasarkan komponen-komponeun
utama yang terpilih. Metode pautan yang digunakan adalah pautan lengkap
dan jarak statistik yang digunakan adalah jarak euclid.
2. Menentukan banyaknya gerombol berdasarkan dendogram yang dihasilkan
pada langkah 1.
3. Mengambil beberapa contoh dari masing-masing gerombol untuk menjadi
bagian dari gugus uji.
4. Data yang tidak terambil pada bagian (3) akan menjadi bagian dari gugus
kalibrasi.

15

Tahap keempat : Pemilihan Fungsi peragam
Langkah-langkah dalam tahap pemilihan fungsi peragam adalah sebagai
berikut:
1. Menetapkan fungsi peragam tertentu.
2. Mengambil gugus uji dan gugus kalibrasi tertentu.
3. Melakukan pendugaan nilai-nilai hiperparameter dengan menggunakan
metode kemungkinan marginal maksimum.
4. Nilai-nilai hiperparameter yang diperoleh dari poin (3) digunakan dalam
regresi proses Gaussian sehingga diperoleh nilai Root Mean Square Error of

Prediction (RMSEP) nya.
5. Mengulangi langkah (1) – (4) untuk semua kemungkinan susunan gugus data
uji dan gugus data kalibrasi.
6. Menghitung nilai rata-rata RMSEP dari seluruh nilai RMSEP yang diperoleh.
7. Mengulangi langkah (1) – (6) untuk berbagai jenis fungsi peragam yang lain.
8. Membandingkan dugaan nilai RMSEP dari berbagai fungsi peragam tersebut.
9. Fungsi peragam yang menghasilkan nilai RMSEP yang terkecil akan
digunakan dalam pemodelan regresi proses Gaussian.

Tahap kelima : Pemodelan
Langkah-langkah dalam tahap pemodelan adalah sebagai berikut:
1. Melakukan pendugaan nilai-nilai hiperparameter bagi fungsi peragam yang
terpilih pada tahap keenam dengan menggunakan keseluruhan contoh.
Pendugaan dilakukan dengan menggunakan metode kemungkinan marginal
maksimum.
2. Nilai-nilai hiperparameter yang diperoleh dari poin (1) digunakan dalam
regresi proses gaussian sehingga diperoleh nilai prediksi bagi setiap input
data.
3. Menghitung nilai Root Mean Square Error (RMSE).
2
4. Menghitung RYvs
.


Tahap keenam : Pengujian
Tahap terakhir adalah pengujian sebaran normal terhadap peubah acak
galat. Dalam hal ini akan digunakan uji Kolmogorov-Smirnov.

16

Mulai
Pengukuran Persen
Transmitan dan
Konsentrasi
Analisis Komponen
Utama

Pra pemrosesan

Nilai Leverage

Deteksi Pencilan

ya
Ada
Pencilan?
tidak
Pemilihan Gugus
Uji dan Kalibrasi

Pemilihan
Fungsi Peragam

ToolBox GPML

Pemodelan
Regresi Proses
Gaussian

Uji Kolmogorov
Smirnov

Pengujian
Sebaran Galat
Selesai

Gambar 1 Diagram alur penelitian

17

HASIL DAN PEMBAHASAN

Deskripsi Spektrum Kurkumin
Data persen transmitan diperoleh dari pengukuran dengan menggunakan
FTIR pada 1866 bilangan gelombang yang berkisar antara 4000 – 400 cm-1.
Grafik spektrum kurkumin dari 20 contoh serbuk temulawak yang berasal dari
berbagai daerah dapat dilihat pada Gambar 2. Berdasarkan Gambar 2 spektrum
kurkumin dari berbagai daerah tersebut sebagian besar memiliki pola yang hampir
sama kecuali untuk beberapa spektrum yang menunjukkan pola yang agak
berbeda. Tampak bahwa spektrum kurkumin dari contoh serbuk temulawak yang
diambil dari daerah cianjur (contoh cj2) dan bogor (contoh bg2) agak berbeda.
Pada indeks bilangan gelombang disekitar 1500 cm-1 ketika spektrum
kurkumin serbuk temulawak dari sebagain besar contoh memiliki pola grafik yang
cekung ke atas, tetapi temulawak yang diambil dari daerah cianjur menujukkan
pola grafik yang cekung kebawah. Sedangkan spektrum kurkumin serbuk
temulawak yang diambil dari daerah Bogor (contoh bg2) menunjukkan pola yang
cenderung konstan di setiap bilangan gelombang