Pendekatan Model Rata-Rata Sebagai Metode Alternatif Dalam Penanganan Regresi Berdimensi Tinggi

PENDEKATAN MODEL RATA-RATA SEBAGAI METODE
ALTERNATIF DALAM PENANGANAN REGRESI
BERDIMENSI TINGGI

NIDA ASHMA ADILAH

DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2015

PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Pendekatan Model
Rata-Rata sebagai Metode Alternatif dalam Penanganan Regresi Berdimensi
Tinggi adalah benar karya saya denganarahan dari komisi pembimbing dan belum
diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber
informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak
diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam
Daftar Pustaka di bagian akhir skripsi ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, Agustus 2015
Nida Ashma Adilah
NIM G14110026

ABSTRAK
NIDA ASHMA ADILAH. Pendekatan Model Rata-Rata sebagai Metode
Alternatif dalam Penanganan Regresi Berdimensi Tinggi. Dibimbing oleh
BAGUS SARTONO dan LA ODE ABDUL RAHMAN.
Pendekatan model rata-rata mengatasi kekurangan pada regresi berdimensi
tinngi dengan jumlah peubah penjelas � lebih banyak dari jumlah amatannya
. Kondisi < � memberikan pengaruh matriks rancangan peubah penjelas
tidak mempunyai matriks kebalikan yang bersifat unik sehingga tidak dapat
menggunakan metode kuadrat terkecil untuk pendugaan parameter regresi. Tujuan
penelitian ini adalah menduga respon dengan merata-ratakan nilai dugaan respon
setiap kelompok model yang terboboti. Data yang digunakan adalah data
spektrum FTIR (Fourier Transform Infrared) serbuk tanaman obat yang memiliki
komposisi utama berupa temulawak dan komposisi campuran berupa bangle dan
kunyit. Penelitian ini hanya berfokus pada pendugaan persentase temulawak

sajayang diperoleh dari pengukuran spektroskopi FTIR pada bilangan gelombang
4000-650 cm-1. Hasil penelitian menunjukkan bahwa pengelompokan peubah
penjelas yang lbaik adalah kelompok dengan model yang lebih sedikit dengan
peubah penjelas yang lebih banyak pada setiap kelompoknya. Pembobot model
yang terbesar adalah model yang memiliki nilai korelasi antara nilai dugaan
respon kelompokdanpeubah responnya terkuat.
Kata kunci: data spektrum FTIR, pendekatan model rata-rata, regresi berdimensi
tinggi

ABSTRACT
NIDA ASHMA ADILAH. Model Averaging Approach as Alternative Method for
High-Dimensional Regression. Supervised by BAGUS SARTONO and LA ODE
ABDUL RAHMAN.
Model averaging approach is used to overcome the problems of highdimensional regression, that is the number of predictors � more than the
number of observations
. The condition of < � effects the design matrix has
no unique general inverse matrix. So that least-square method can not be used.
The purpose of this research is to estimate response value by averaging the
response value of each model with their weights. The data that used in this
research is FTIR (Fourier Transform Infrared) spectrum data of herb powder

which contain ginger as primary composition and mixture compositions (bangle
and turmeric). This study focuses on estimating the proportion of ginger from
FTIR spectroscopic measurementbetween 4000-650 cm-1. The result showed that
better grouping of predictors is a group with fewer models with more predictors
in each model. The largest model weight is a model that has largest coefficient
correlation between fitted value and its response.
Keywords: FTIR spectrum data, high-dimensional regression, model averaging
approach

PENDEKATANMODEL RATA-RATASEBAGAI METODE
ALTERNATIF DALAM PENANGANAN REGRESI
BERDIMENSI TINGGI

NIDA ASHMA ADILAH

Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Statistika
pada
Departemen Statistika


DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2015

PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas
segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang
dipilih dalam penelitian yang dilaksanakan sejak bulan Desember 2014 ini ialah
Analisis Regresi, dengan judul Pendekatan Model Rata-Rata sebagai Metode
Alternatif dalam Penanganan Regresi Berdimensi Tinggi.
Terima kasih penulis ucapkan kepada Bapak Dr Bagus Sartono, MSi dan
Bapak La Ode Abdul Rahman, MSi selaku pembimbing. Di samping itu,
penghargaan penulis sampaikan kepada Bapak Rudi Heryanto, MSi selaku kepala
laboratorium Pusat Studi Biofarmaka IPB, Bapak Dr Farit Mochamad
Affendiselaku dosen Departemen Statistika yang telah membantu dalam
mendesain penelitian. Ungkapan terima kasih juga disampaikan kepada ayah, ibu,
serta seluruh keluarga, atas segala doa dan kasih sayangnya.

Semoga karya ilmiah ini bermanfaat.

Bogor, Agustus 2015
Nida Ashma Adilah

DAFTAR ISI
DAFTAR TABEL

vi

DAFTAR GAMBAR

vi

DAFTAR LAMPIRAN

vi

PENDAHULUAN


1

Latar Belakang

1

Tujuan Penelitian

2

TINJAUAN PUSTAKA

2

Spektroskopi FTIR (Fourier Transform Infrared)

2

Pendekatan Model Rata-rata


3

Korelasi Marjinal (Marginal Correlation)

3

Pembobot Model

3

METODE

4

Data

4

Prosedur Analisis Data


4

HASIL DAN PEMBAHASAN

6

Eksplorasi Data

6

Korelasi Marjinal antara Nilai Absorban dan Persentase Temulawak

8

Penentuan Kandidat Model dan Optimasi Pembobot Model

9

Perbandingan Nilai Jumlah Kuadrat Sisaan
SIMPULAN DAN SARAN


12
13

Simpulan

13

Saran

14

DAFTAR PUSTAKA

14

LAMPIRAN

15


RIWAYAT HIDUP

16

DAFTAR TABEL
1
2
3
4

Daerah identifikasi spektrum IR kurkuminoid
Pembobot model dan nilai korelasi marjinal pengelompokan tipe 1
Pembobot model dan nilai korelasi marjinal pengelompokan tipe 2
Pembobot model dan nilai korelasi marjinal pengelompokan tipe 3

2
9
10
11


DAFTAR GAMBAR
1 Spektrum inframerah serbuk simplisia dengan temulawak 100%
2 Perbandingan spektrum FTIR serbuk simplisia temulawak, bangle, dan
kunyit
3 Perbandingan spektrum inframerah temulawak 100% - 80%
4 Nilai korelasi antara nilai absorban dan persentase temulawak
5 Sebaran nilai korelasi antara nilai absorban dan persentase temulawak
6 Perbandingan nilai jumlah kuadrat sisaan untuk setiap
tipe
pengelompokan

6
7
7
8
8
12

DAFTAR LAMPIRAN
1 Kode dan komposisi sampel

15

1

PENDAHULUAN
Latar Belakang
Beberapa data hasil penelitian kimia sering kali menggunakan analisis
statistika untuk mendeskripsikan suatu gugus fungsi, mengklasifikasi senyawa
tertentu, mengetahui hubungan antara satu peubah dan peubah lainnya atau
memprediksi suatu peubah menggunakan model yang terbangun dari peubahpeubah yang ada. Salah satu data yang memerlukan analisis statistika cukup
intensif adalah data spektrum FTIR (Fourier Transform Infra Red) suatu serbuk
simplisia yang digunakan untuk mengidentifikasi kandungan komposisi tanaman
temulawak, kunyit, dan bangle. Data ini merupakan hasil percobaan Pusat Studi
Biofarmaka LPPM IPB tahun 2015. Data sampel sebanyak 280 serbuk simplisia
dengan kombinasi komposisi tanaman obat tertentu dianalisis menggunakan ATRFTIR (Attenuated Total Reflectance Fourier Transform Infra Red) sehingga
diperoleh 1798 spektrum FTIR berupa nilai reflektan yang telah dikonversi
menjadi nilai absorban untuk dicatat sebagai peubah penjelas dengan peubah
respon persentase komposisi utama yaitu temulawak. Analisis statistika
diperlukan untuk mengetahui persentase temulawak dalam serbuk simplisia
berdasarkan spektrum FTIR.
Dengan demikian diperlukan pendugaan hubungan antara spektrum FTIR
dengan kandungan temulawak. Salah satu analisis statistika yang digunakan untuk
mengetahui hubungan suatu peubah dengan peubah lainnya adalah analisis regresi
(Draper &Smith 1992). Metode Kuadrat Terkecil adalah salah satu metode
pendugaan parameter dalam pemodelan analisis regresi. Pendugaan parameter
regresi diperoleh dengan menyelesaikan persamaan ̂ = �′ � − �′ , dengan ̂
sebagai vektor penduga parameter regresi, matriks � adalah matriks rancangan
peubah bebas, dan adalah vektor peubah respon. Salah satu syarat cukup dalam
menggunakan metode ini adalah banyaknya amatan (n) harus lebih besar dari
banyaknya peubah penjelas (p) agar matriks �′ � mempunyai matriks kebalikan.
Sedangkan jika ≤ � maka akan menyebabkan matriks �′ � bersifat singular
dan tidak memiliki matriks kebalikan (Notodiputro 2003). Artinya, terdapat
kendala pendugaan parameter regresi menggunakan MKT pada data spektrum
FTIR, yaitu adanya masalah pada tingginya dimensi peubah penjelas yang
dilibatkan sedangkan jumlah amatannya sangat terbatas atau yang biasa disebut
regresi berdimensi tinggi (high-dimensional regression). Oleh karena itu,
diperlukan metode lain untuk mengatasi permasalahan regresi berdimensi tinggi.
Regresi berdimensi tinggi merupakan kondisi dimana banyaknya peubah
penjelas (p) lebih besar dari banyaknya amatan (n). Metode yang dapat dilakukan
untuk analisis data berdimensi tinggi antara lain analisis komponen utama,
partial-least square, Metode Lasso, Bayesian Lasso, least-angle regression, the
smoothly clipped absolute deviation, dan pendekatan model rata-rata (Ando dan
Li 2014).
Pada penelitian ini diharapkan tetap menggunakan MKT pada pendugaan
parameter regresi tetapi tetap dapat mengatasi kendala regresi berdimensi tinggi.
Sehingga metode yang dapat diterapkan sebagai solusi alternatif adalah
pendekatan model rata-rata. Pendekatan model rata-rata yaitu analisis regresi

2

dengan mengelompokkan peubah penjelas berdasarkan kriteria tertentu kemudian
nilai dugaan respon dari model yang dibangun pada setiap kelompok dirataratakan dengan bobot tertentu. Kriteria pengelompokan yang digunakan adalah
korelasi marjinal. Salah satu alasan penerapan metode ini adalah hasil simulasi
menunjukkan bahwa metode ini memberikan hasil prediksi yang lebih valid dari
metode lainnya seperti lasso, grup lasso, dan smoothly clipped absolute deviation
(Ando dan Li 2014).
Tujuan Penelitian
Tujuan dari penelitian ini adalah menerapkan pendekatan model rata-rata
dalam menangani masalah pendugaan respon pada regresi berdimensi tinggi
(high-dimensional regression).

TINJAUAN PUSTAKA
Spektroskopi FTIR (Fourier Transform Infrared)
Spektroskopi FTIR adalah teknik pengukuran untuk mengumpulkan
spektrum inframerah (IR). Spektrum IR suatu senyawa dapat menggambarkan
struktur molekul senyawa tersebut dengan mengukur absorbsi radiasi, refleksi
atau emisi di daerah IR.
Spektroskopi IR dibagi menjadi tiga jenis radiasi yaitu inframerah dekat
(bilangan gelombang 12800–4000 cm-1), inframerah tengah (bilangan gelombang
4000-200 cm-1), dan inframerah jauh (bilangan gelombang 200-10 cm-1). FTIR
merupakan salah satu teknik spektroskopi inframerah pertengahan (Nur &
Adijuwana 1989).
Spektrum inframerah senyawa tumbuhan dapat diukur dalam bentuk cairan,
bentuk gerusan dalam minyak nujol, dan bentuk padat yang dicampur dengan
kalium bromide. Setiap senyawa akan menyerap berbagai frekuensi radiasi
elektromagnetik dalam daerah spektrum inframerah. Setiap ikatan yang berbeda
mempunya sifat frekuensi vibrasi yang berbeda pula. Tipe ikatan yang sama
dalam dua senyawa yang berbeda dan terletak di lingkungan yang berbeda, maka
molekul tersebut tidak akan mempunyai struktur serapan yang tepat sama.
FTIR dapat digunakan untuk analisis kuantitatif yang menghubungkan
konsentrasi dengan nilai absorban. Nilai absorban merupakan nilai yang diukur
pada berbagai bilangan gelombang yang digunakan untuk menduga konsentrasi
suatu senyawa.
Tabel 1 Daerah identifikasi spektrum IR kurkuminoid
No
1
2
3
4
5
6

Jenis Vibrasi
Ikatana Hidrogen OH
C-H alkana
Karbonil
Aromatik -C=C rentangan
R - O-Ar
Sidik Jari

Bilangan Gelombang (cm-1)
3600-3300
3000-2850
1820-1660
1660-1450
1300-1000
900-700

Intensitas
sedang-kuat
Kuat
sangat kuat
Kuat
Sedang

3

Pendekatan Model Rata-Rata
Pendekatan model rata-rata (model averaging approach) adalah suatu
pendekatan untuk meningkatkan keakuratan pendugaan regresi klasik dengan
membuat beberapa kelompok berbeda. Pada data berdimensi tinggi, model-model
berbeda tersebut diperoleh dengan memodelkan terhadap kelompok-kelompok
peubah dengan banyak peubah di masing-masing kelompok lebih sedikit dari
banyaknya amatan. Misalkan, peubah penjelas dikelompokkan menjadi M
kelompok, yaitu � , � , … �� dan dari setiap kelompok disusun model regresi
linear � , = , , … , � dengan � adalah banyaknya peubah penjelas pada setiap
kelompok. Model hasil pengelompokan dapat dituliskan sebagai berikut:
� ∶

= ∑

∈��

+ �,

dengan � adalah kelompok peubah penjelas,
dan merupakan peubah
penjelas dan peubah respon yang telah dibakukan. Kemudian dituliskan dengan
notasi matriks = �
+ �, dengan � adalah matriks peubah penjelas pada
kelompok ke-k,
adalah parameter regresi sebanyak�pada model ke-k dan �
merupakan vektor sisaan berdimensi
amatan. Koefisien regresi didapatkan
menggunakan MKT:
̂ = ���
‖ −�


sehingga didapatkan ̂ = �′ � − �′ dan nilai dugaan respon kelompok keadalah �̂ = � ̂ , untuk = , … , �. Nilai dugaan respon akhir �̂ diduga
dengan merata-ratakan nilai dugaan respon setiap kelompokdengan bobot tertentu.
Korelasi Marjinal (Marginal Correlation)
Korelasi marjinal (marginal correlation) merupakan nilai yang menjelaskan
kekuatan hubungan antara peubah respon dan peubah penjelasnya. Asumsi
matriks rancangan X telah dibakukan sehingga pada setiap kolom
adalah




‖� ‖ =

� � =
dan vektor peubah respon yang

dibakukan pula ( − − ‖ ‖ =
− − ′ = , sehingga nilai korelasi
− − �′ .
marjinal dapat diduga dengan ̂ =
Pembobot Model

Pembobot model merupakan bobot yang diberikan pada nilai dugaan respon
setiap model. Pembobot model yang dipilih adalah pembobot yang dapat
meminimumkan kriteria validasi silang. Validasi silang membagi data menjadi
dua yaitu data latih dan data validasi. Data latih akan digunakan untuk membentuk
suatu model, sedangkan data validasi akan digunakan untuk penentuan bobot dari
respon pada model yang terbentuk sebelumnya dari data latih.
Validasi silang lipat K yaitu salah satu metode validasi silang dengan
membagi seluruh data secara acak ke dalam � subcontoh. Salah satu subcontoh
digunakan sebagai data validasi, sedangkan � − subcontoh digunakan sebagai
data latih. Proses validasi silang dilakukan pada setiap kelompok peubah yang

4

sebelumnya terbentuk dan berulang sampai � kali, dengan masing-masing K
subcontoh digunakan satu kali sebagai validasi model. Misalkan, matriks Hat
� �′ � − � dinotasikan sebagai � maka nilai dugaan respon akhir adalah
sebagai berikut:


�̂ = ∑
=





� � �

�̂ = ∑
=









=∑
=

� =�

merupakan pembobot model yang diduga melalui proses validasi silang.
Pembobot model yang dipilih adalah bobot yang meminimumkan kriteria validasi
silang:
̂ = ���
���� ��

≤ } dan ∑�=
= (Ando dan Li 2014).
dengan�� = { ∈ [ , ]� ∶ ≤
Jumlah kuadrat sisaan dari nilai dugaan respon data validasi pada validasi silang
lipat � digunakan untuk membentuk kriteria validasi silang:
��

=

− �̂



− �̂ =

−�

METODE



�−�

Data
Data yang digunakan dalam penelitian ini merupakan data hasil percobaan
yang dilakukan oleh Pusat Studi Biofarmaka LPPM IPB yang bekerjasama
dengan Depertemen Statistika IPB tahun 2015. Data sampel merupakan data
spektrum FTIR persentase tanaman obat pada serbuk simplisia dengan berat
empat gram yang mengandung dua komposisi yaitu komposisi utama dan
kompisisi campuran. Komposisi utama berupa temulawak, sedangkan komposisi
campuran terdiri dari kunyit dan bangle. Proses pengambilan data dimulai dengan
penyiapan sampel dalam bentuk simplisia, kemudian pencampuran komposisi
sampel. Penelitian ini hanya menduga kandungan temulawak pada serbuk
simplisia tanaman obat yang dijadikan sebagai peubah respon. Jumlah sampel
dalam penelitian ini sebanyak 280 dengan kombinasi persentase komposisi utama
dan komposisi campuran ditunjukkan pada Lampiran 1. Kemudian dilanjutkan
dengan analisis menggunakan ATR-FTIR sehingga diperoleh 1798 (p = 1798)
spektrum FTIR berupa nilai absorban yang dicatat sebagai peubah penjelas pada
bilangan gelombang 4000-650 cm-1.
Prosedur Analisis Data
Analisis dalam penelitian menggunakan Ms. Excel 2007 dan Minitab 16.
Tahapan analisis yang dilakukan dalam penelitian ini adalah sebagai berikut:
1. Melakukan eksplorasi data
2. Menentukan kandidat model
a. Menghitung korelasi marjinal antara peubah penjelas dan peubah respon

5

b. Mengurutkan peubah penjelas yang memiliki nilai korelasi terkuat hingga
yang terlemah, kemudian lakukan pengelompokan berdasarkan nilai
korelasi marjinalnya
c. Pengelompokan dilakukan sebanyak tiga kali untuk melihat karakteristik
setiap tipe pengelompokan:
 Pengelompokan tipe 1 : Membentuk 9 model dengan masing-masing
model mempunyai kurang lebih 200 peubah penjelas yaitu 7 model
dengan 200 peubah penjelas dan 2 model dengan 199 peubah penjelas
 Pengelompokan tipe 2 : Membentuk 10 model dengan masing-masing
model mempunyai kurang lebih 180 peubah penjelas yaitu 8 model
dengan 180 peubah penjelas dan 2 model dengan 179 peubah penjelas
 Pengelompokan tipe 3 : Membentuk 12 model dengan masing-masing
model mempunyai kurang lebih 150 peubah penjelas yaitu 10 model
dengan 150 peubah penjelas dan 2 model dengan 149 peubah penjelas
d. Berdasarkan hasil pengelompokan tersebut, didapatkan peubah penjelas
yang lebih kecil dari amatannya � < , sehingga memungkinkan untuk
melakukan pendugaan parameter regresi menggunakan MKT pada setiap
kelompok dan didapatkan nilai dugaan responnya sebagai berikut:


�̂ = ∑ ̂
=

.

.

keterangan:
: , , ,…,�
: , , ,…,�
: vektor nilai dugaan respon kelompok ke�̂
̂.
: dugaan parameter regresi ke- pada kelompok ke

.

: vektor peubah penjelas ke- pada kelompok ke-

Pengelompokan tipe 1 :
�̂ = ̂
�̂ = ̂



�̂ = ̂

.

.

.

.

.

.

Pengelompokan tipe 2 :
�̂ = ̂
�̂ = ̂
�̂

= ̂

.

.

.

.

.

.

+ ̂
+ ̂

.

.

+ ̂

.

+ ̂
+ ̂
+ ̂

.
.
.

.

.

.

+ ⋯+ ̂
+ ⋯+ ̂

.

.

+⋯+ ̂

.

+⋯+ ̂
+⋯+ ̂

.

.
.
.

.

.

+ ⋯+ ̂

.

.

.

.

.

.

.

.

.

.

.

.

6



Pengelompokan tipe 3 :
�̂ = ̂ .
�̂ = ̂ .

.

.

+ ̂
+ ̂

.

.

.

.
.
.

.

+⋯+ ̂
+⋯+ ̂

.

.

.

.

�̂ = ̂ .
+ ̂.
+ ⋯+ ̂ .
.
.
.
e. Menduga nilai dugaan respon akhir pada setiap kelompok
 Pengelompokan tipe 1:
�̂ = ̂ �̂ + ̂ �̂ + ⋯ + ̂ �̂
 Pengelompokan tipe 2:
�̂ = ̂ �̂ + ̂ �̂ + ⋯ + ̂ �̂
 Pengelompokan tipe 3:
�̂ = ̂ �̂ + ̂ �̂ + ⋯ + ̂ �̂
3. Mengoptimasi pembobot model ̂
a. Melakukan validasi silang lipat 10, sehingga diperoleh nilai dugaan respon
yang merupakan data validasi {�̂ , … , �̂ � } untuk menduga pembobot
model.
b. Memilih dugaan pembobot model ̂ yang meminimumkan nilai kriteria
��
.

HASIL DAN PEMBAHASAN
Eksplorasi Data

Teknik spektroskopi FTIR dapat menghasilkan spektrum FTIR dari suatu
senyawa yang kompleks. Pola spektrum disusun oleh serapan vibrasi dari seluruh
konsituen dalam senyawa. Spektrum FTIR dijadikan alat investigasi komposisi
suatu sampel biologis. Gambar 1 merupakan plot antara nilai-nilai absorban dan
bilangan gelombang 4000-650 cm-1 dari 10 sampel serbuk simplisia tanaman obat
yang memiliki kandungan temulawak murni, sehingga dari plot tersebut dapat
dilihat pola spektrumnya.
0,60
Sampel 1

Nilai Absorban

0,50

Sampel 2

0,40

Sampel 3

0,30

Sampel 4

0,20

Sampel 5

0,10

Sampel 6

-0,10

3999
3788
3578
3367
3157
2946
2735
2525
2314
2104
1893
1682
1472
1261
1051
840

0,00

Bilangan Gelombang

Sampel 7
Sampel 8

Gambar 1 Spektrum inframerah serbuk simplisia dengan temulawak 100%

7

Gambar 1 memperlihatkan pola yang sama untuk puncak atau lembah setiap
spektrum pada selang bilangan gelombang tertentu. Puncak atau lembah yang
cukup jelas adalah pada bilangan gelombang 3500-3200cm-1, 3000-2850cm-1,
1700-1550cm-1, dan 1130-930cm-1. Hal itu menunjukkan bahwa puncak atau
lembah yang terbentuk merupakan daerah identifikasi yang terdapat ikatan-ikatan
kimia yaitu ikatan hidrogen O-H, C-H alkana, aromatik –C=C, dan R-O-Ar.
0,6

Nilai Absorban

0,5
0,4
0,3

Temulawak

0,2

Bangle
Kunyit

0,1

-0,1

3999
3788
3578
3367
3157
2946
2735
2525
2314
2104
1893
1682
1472
1261
1051
840

0

Bilangan Gelombang

Gambar 2 Perbandingan spektrum FTIR serbuk simplisia temulawak, bangle, dan
kunyit
Gambar 2 merupakan gambar sampel spektrum temulawak, bangle, dan
kunyit murni. Jika gambar sampel spektrum tersebut dibandingkan, secara kasat
mata dapat dilihat perbedaannya. Perbedaan spektrum tersebut adalah adanya
pergeseran puncak atau lembah yang mengindikasikan bahwa adanya perbedaan
ikatan kimia antara temulawak, bangle, dan kunyit.
0,6
T 100%
0,5

T 80%
T 90%

Nilai Absorban

0,4

T 92%
0,3

T 93%
T 94%

0,2

T 95%
0,1

T 96%
T 97%

-0,1

3999
3822
3645
3468
3291
3114
2937
2760
2583
2406
2228
2051
1874
1697
1520
1343
1166
989
812

0

T 98%
T 99%

Bilangan Gelombang

Gambar 3 Perbandingan spektrum inframerah temulawak 100% - 80%
Persentase temulawak yang dominan pada serbuk simplisia akan memiliki
pola spektrum yang sama dengan puncak atau lembah yang sama. Oleh karena
adanya kemiripan setiap spektrum FTIR serbuk simplisia dengan persentase

8

temulawak yang dominan, maka dilakukan analisis regresi untuk mengetahui
persentase temulawak melalui nilai absorban dari spektrum tersebut.
Korelasi Marjinal antara Nilai Absorban dan Persentase Temulawak

1
0,8
0,6
0,4
0,2
0
-0,2
-0,4
-0,6
-0,8
-1

x1798
x1719
x1640
x1561
x1482
x1403
x1324
x1245
x1166
x1087
x1008
x929
x850
x771
x692
x613
x534
x455
x376
x297
x218
x139
x60

Nilai Korelasi

Analisis korelasi antara persentase temulawak dan nilai absorban pada
bilangan gelombang 4000-650 cm-1 sebagai peubah respon dan peubah penjelas
dilakukan untuk mengelompokkan peubah penjelas.

Peubah Penjelas

Gambar 4 Nilai korelasi antara nilai absorban dan persentase temulawak
Nilai korelasi antara nilai absorban dan persentase temulawak sebagian
besar kuat seperti ditunjukkan pada Gambar 4, namun pada rentang bilangan
gelombang ke-550 hingga ke-570 (x550-x570) dan bilangan gelombang ke-1308
hingga ke-1518 (x1308-x1518) mempunyai nilai korelasi yang rendah sehingga
mengindikasikan bahwa nilai absorban pada rentang bilangan gelombong tersebut
tidak memberikan pengaruh nyata terhadap perbedaan persentase temulawak.

Gambar 5 Sebaran nilai korelasi antara nilai absorban dan persentase temulawak
Seperti ditunjukkan Gambar 5, sebaran nilai korelasi menunjukkan jumlah
peubah penjelas dengan korelasi kuat lebih banyak dibandingkan dengan peubah
penjelas yang memiliki korelasi lemah, sehingga dalam penelitian ini seluruh
peubah penjelas akan digunakan untuk menduga persentase temulawak tanpa
menyisihkan peubah-peubah penjelas yang memiliki korelasi lemah.

9

Penentuan Kandidat Model dan Optimasi Pembobot Model
Penentuan kandidat model dilakukan dengan melakukan pengelompokan
peubah penjelas yang sebelumnya telah dibakukan dan diurutkan berdasarkan
nilai korelasi marjinal yang terkuat hingga terlemah. Pengelompokan diulang
sebanyak 3 kali untuk mengetahui tipe pengelompokan yang paling baik.
Pengelompokan Tipe 1
Pengelompokan tipe 1 yaitu pengelompokan peubah penjelas dengan
membentuk 9 model yang terdiri dari 200 peubah penjelas pada 7 model dan 199
peubah penjelas pada 2 model. Model-model pengelompokan tipe 1 adalah:
�̂
�̂
�̂
�̂
�̂
�̂
�̂
�̂
�̂

=
=
=
=
=
=
=
=
=

.
.
− .
.
− .
.
.
.
.

.

.

.

.

.

.
.
.

.

+
+

+
+
+
+



.
.
.
.
.
.
.
.
.

.
.

.

.
.
.
.
.

.

+
+
+
+
+
+
+
+
+











+
+



+

+
+

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.

.

Pembobot model diduga dengan meminimumkan JKS (jumlah kuadrat
sisaan) dan nilai JKS paling minimum yang didapatkan adalah 0.2114. Tabel 2
merupakan tabel pembobot model dan nilai korelasi marjinal antara nilai dugaan
respon dan peubah respon pada setiap model.
Tabel 2 Pembobot model dan nilai korelasi marjinal pengelompokan tipe 1
Model Ke-

Pembobot Model

1
2
3
4
5
6
7
8
9

0.2149
0.2114
0.0518
0.0791
0.1230
0.1467
0.0708
0.1022
0.0000

Nilai Korelasi �̂ ,
0.9991
0.9988
0.9989
0.9981
0.9986
0.9987
0.9983
0.9980
0.9967

Tabel 2 menjelaskan bahwa nilai korelasi tertinggi terdapat pada model 1
sebesar 0.9991 dengan pembobot model sebesar 0.21492. Setelah dilakukan
pembobotan model, maka nilai dugaan respon akhirnya didapatkan sebagai
berikut:

10

− .
− .
− .
− .
− .
− .
− .
− .
.
.
.
.
�̂ = .
+ .
+ ⋯+
=
.
.
.
.
.
.
.
.
[ .
]
[ .
] [ .
[ .
]
]
Hasil perhitungan nilai korelasi antara nilai dugaan respon akhir dan peubah
responnya sebesar 0.9996, artinya nilai korelasi setelah diboboti lebih besar dari
nilai korelasi model pertama.
Pengelompokan Tipe 2
Pengelompokan tipe 2 yaitu pengelompokan peubah penjelas dengan 180
peubah penjelas pada 8 model dan 179 peubah penjelas pada 2 model terahir.
Model-model yang terbangun pada pengelompokan tipe 2 sebagai berikut:
�̂ =
�̂ =
�̂ =
�̂ =
�̂ =
�̂ =
�̂ =
�̂ =
�̂ =
�̂ =

.

.


.



.

.

.
.
.
.
.

.

.

.

.

.

.

.
.
.

.












.
.
.
.
.
.
.
.
.
.

.
.

.

.
.
.
.
.

.

.

+
+
+
+
+
+
+
+
+
+












+

+

+
+

+



.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.

.

Penentuan pembobot model juga dilakukan dengan meminimumkan JKS.
Namun pada pengelompokan tipe 2 ini nilai JKS paling minimum adalah 0.265.
Tabel 3 Pembobot model dan nilai korelasi marjinal pengelompokan tipe 2
Model ke-

Pembobot Model

1
2
3
4
5
6
7
8
9
10

0.226
0.152
0.133
0.120
0.000
0.175
0.055
0.119
0.014
0.006

Nilai Korelasi �̂ ,
0.999
0.998
0.999
0.998
0.997
0.998
0.998
0.998
0.997
0.995

Tabel 3 menunjukkan tabel perbandingan pembobot model dan nilai
korelasi peubah respon terhadap nilai dugaan respon setiap kelompoknya.Nilai
korelasi tertinggi terdapat pada model 1 sebesar 0.9990 dengan pembobot model
sebesar 0.2559.

11

− .
− .
− .
− .
− .
− .
− .
− .
.
.
.
.

̂= .
+ .
+⋯+ .
=
.
.
.
.
.
.
.
.
[ .
]
[ .
] [ .
]
[ .
]
Berdasarkan hasil perhitungan tersebut, nilai korelasi antara nilai dugaan
respon akhir dan peubah respon adalah 0.9995. Nilai tersebut lebih besar dari nilai
korelasi kelompok yang membangun model pertama.
Pengelompokan Tipe 3
Pengelompokan tipe 3 yaitu pengelompokan peubah penjelas yang terdiri
dari 150 peubah penjelas pada 10 model dan 149 peubah penjelas pada 2 model:
�̂ =
�̂ =
�̂ =
�̂ =
�̂ =
�̂ =
�̂ =
�̂ =
�̂ =
�̂ =
�̂ =
�̂ =

.
− .
.
.
− .
− .
− .
.
.
.
− .
.

.

.

.

.

.

.

.

.

.

.
.

.



+

+
+







.
.
.
.
.
.
.
.
.
.
.

.

.
.

.

.
.
.
.
.

.

.
.
,

+
+
+
+
+
+
+
+
+
+
+
+

…−
…+
…+
…−
…+
…+
…+
…−
…−
…−
…−
…−

.
.
.
.
.
.
.
.
.

.
.
.

.
.
.
.
.
.
.
.
.

.

.
.

Pembobot model pada pengelompokan tipe 3 yang dipilih adalah pembobot
model yang paling meminimumkan nilai JKS. Nilai JKS paling minimum pada
pengelompokan ini adalah 0.445.
Tabel 4 Pembobot model dan nilai korelasi marjinal pengelompokan tipe 3
Model ke-

Pembobot Model

1
2
3
4
5
6
7
8
9
10
11
12

0.338
0.153
0.022
0.093
0.038
0.000
0.181
0.092
0.018
0.064
0.000
0.000

Nilai Korelasi �̂ ,
0.999
0.998
0.998
0.998
0.997
0.996
0.998
0.997
0.996
0.996
0.996
0.994

12

Tabel 4 menunjukkan pembobot-pembobot model yang didapatkan untuk
setiap kelompok model. Nilai korelasi tertinggi terdapat pada model 1 sebesar
0.9990 dengan pembobot model sebesar 0.338. Pembobot-pembobot tersebut
digunakan untuk memboboti nilai dugaan respon setiap kelompoknya, sehingga
didapatkan nilai dugaan respon akhirnya sebagai berikut:
− .
− .
− .
− .
− .
− .
− .
− .
.
.
.
.
�̂ = .
+ .
+ ⋯+
=
.
.
.
.
.
.
.
.
[ .
]
[ .
]
[ .
] [ .
]

Hasil perhitungan nilai korelasi marjinal antara nilai dugaan respon akhir
dan peubah respon sebesar 0.9992 lebih besar dari nilai korelasi kelompok peubah
penjelas yang membangun model pertama.
Perbandingan Nilai Jumlah Kuadrat Sisaan
Berdasarkan perbandingan nilai korelasi antara nilai dugaan respon akhir
pada setiap tipe pengelompokan menunjukkan bahwa
dan peubah respon
pendekatan model rata-rata efisien untuk diterapkan karena nilai korelasinya lebih
besar dari nilai korelasi antara nilai dugaan respon pada masing-masing model dan
peubah respon.
Sedangkan untuk melihat tipe pengelompokan yang paling baik, dapat
dilakukan dengan melihat perbandingan nilai jumlah kuadrat sisaan yang juga
dijadikan sebagai kriteria validasi silang.
0,5000
0,4500
0,4000
0,3500
0,3000
0,2500
0,2000
0,1500
0,1000
0,0500
0,0000

0,4457

0,2658
0,2110

Tipe 1

Tipe 2

Tipe 3

Jumlah Kuadrat Sisaan

Gambar 6 Perbandingan nilai jumlah kuadrat sisaan untuk setiap tipe
pengelompokan
Gambar 6 memperlihatkan bahwa pengelompokan tipe 1 menghasilkan nilai
sisaan paling kecil yaitu 0.211. Artinya, pendekatan model rata-rata lebih baik
diterapkan dengan mengelompokkan peubah penjelas dengan model yang lebih
sedikit yang banyaknya peubah penjelas masing-masing kelompoknya lebih
banyak.

13

Ilustrasi Penerapan Pendekatan Model Rata-Rata
Berdasarkan model dan pembobot model yang didapatkan dari hasil
perhitungan, maka pada penelitian ini dapat dilakukan pendugaan persentase
komposisi temulawak suatu serbuk simplisia tanaman obat. Suatu serbuk simplisia
tanaman obat dengan komposisi temulawak yang sudah diketahui sebelumnya
yaitu 88% diukur dengan ATR-FTIR, pengukuran tersebut menghasilkan 1798
nilai absorban pada bilangan gelombang 4000-650 cm-1. Nilai-nilai tersebut
dikelompokkan sesuai dengan salah satu tipe pengelompokan, misalnya
pengelompokan tipe 1. Nilai dugaan respon setiap kelompoknya diduga dengan
menerapkan model-model pada pengelompokan tipe 1.
Tabel 5 Ilustrasi perhitungan nilai dugaan respon akhir
Model ke-k
1
2
3
4
5
6
7
8
9

�̂
0.8702
0.8705
0.8708
0.8702
0.8696
0.8697
0.8706
0.8699
0.8699
�̂

0.2149
0.2114
0.0518
0.0791
0.1230
0.1467
0.0708
0.1022
0.0000

�̂ ×
0.1870
0.1840
0.0451
0.0687
0.1069
0.1276
0.0616
0.0889
0.000
0.8701

Tabel 5 menujukkan hasil perhitungan nilai dugaan persentase komposisi
temulawak yaitu sebesar 0.8701 atau 87.01% dan memiliki selisih 0.0099 atau
0.99% dengan persentase komposisi temulawak sesungguhnya. Sehingga dapat
dinyatakan bahwa pendekatan model rata-rata ini tepat digunakan.

SIMPULAN DAN SARAN
Simpulan
Nilai absorban pada bilangan gelombang 3500-3200 cm-1, 3000-2850 cm-1,
1700-1550 cm-1, dan 1130-930 cm-1 merupakan daerah identifikasi yang
berpengaruh terhadap pendugaan persentase temulawak karena mencirikan
kandungan ikatan-ikatan kimia tertentu. Penelitian ini menunjukkan bahwa
pengelompokan yang paling baik adalah pengelompokan dengan model lebih
sedikit dengan peubah penjelas lebih banyak. Nilai korelasi terbesar yaitu model 1
pada masing-masing kelompok sehingga diberikan pembobot model paling besar
pula. Artinya, hasil pembobotan model menunjukkan bahwa semakin besar nilai
korelasi maka semakin besar pula pembobot modelnya. Selain itu, nilai korelasi
antara nilai dugaan respon akhir dan peubah respon lebih besar dari nilai korelasi
antara nilai dugaan respon setiap kelompok dan peubah respon. Berdasarkan hal
ini, pendekatan model rata-rata tepat dalam menangani regresi berdimensi tinggi.

14

Saran
Penelitian ini hanya fokus dalam pendugaan persentase komposisi utama
saja yaitu persentase temulawak. Penelitian selanjutnya dapat mengkaji kembali
data ini untuk pendugaan persentase komposisi campuran yang terdiri dari
persentase bangle dan kunyit. Selain itu, dalam mengelompokkan peubah penjelas
sebaiknya tidak ditentukan secara subjektif. Namun sebaiknya menggunakan
metode lain yang dapat meminimumkan resiko kesalahan.

DAFTAR PUSTAKA
Ando T, Li KC. 2014. A Model-Averaging Approach for High-Dimensional
Regression. Journal of the American Statistical Assosiation. 109(505): 254265.
Draper N, Smith H. 1992. Analisis Regresi Terapan. Ed ke-2. Sumantri B,
penerjemah. Jakarta (ID): Gramedia Pustaka Utama. Terjemahan dari:
Applied Regression Analysis.
Notodiputro KA. 2003. Pendekatan Statistika dalam Kalibrasi. Proseding
Konferensi Statistika dan Matematika Masyarakat Islam Asia Tenggara
Bandung.
Nur MA, Adijuwana H. 1989. Teknik Spektroskopi dalam Analisis Biologi.
Bogor: Institut Pertanian Bogor.
Tibshirani R. 1996. Regression Shrinkage and Selection via the LASSO. Journal
of the Royal Statistical Society Series B. 58(1): 267-288.

15

Lampiran 1 Kode dan komposisi sampel
Kode
TML
KYT
BGL
3.96.1
3.96.2
3.96.3
3.96.4
3.96.5
3.92.1
3.92.2
3.92.3
3.92.4
3.92.5
3.88.1
3.88.2
3.88.3
3.88.4
3.88.5
3.84.1
3.84.2
3.84.3
3.84.4
3.84.5
3.8.1
3.8.2
3.8.3
3.8.4
3.8.5
3.76.1
3.76.2
3.76.3
3.76.4

kunyit
0.00
100.00
0.00
0.00
0.25
0.50
0.75
1.00
0.00
0.50
1.00
1.50
2.00
0.00
0.75
1.50
2.25
3.00
0.00
1.00
2.00
3.00
4.00
0.00
1.25
2.50
3.75
5.00
0.00
1.50
3.00
4.50

komposisi (%)
bangle Temulawak
0.00
100.00
0.00
0.00
100.00
0.00
1.00
99.00
0.75
99.00
0.50
99.00
0.25
99.00
0.00
99.00
2.00
98.00
1.50
98.00
1.00
98.00
0.50
98.00
0.00
98.00
3.00
97.00
2.25
97.00
1.50
97.00
0.75
97.00
0.00
97.00
4.00
96.00
3.00
96.00
2.00
96.00
1.00
96.00
0.00
96.00
5.00
95.00
3.75
95.00
2.50
95.00
1.25
95.00
0.00
95.00
6.00
94.00
4.50
94.00
3.00
94.00
1.50
94.00

Kode
3.76.5
3.72.1
3.72.2
3.72.3
3.72.4
3.72.5
3.68.1
3.68.2
3.68.3
3.68.4
3.68.5
3.64.1
3.64.2
3.64.3
3.64.4
3.64.5
3.6.1
3.6.2
3.6.3
3.6.4
3.6.5
3.4.1
3.4.2
3.4.3
3.4.4
3.4.5
3.2.1
3.2.2
3.2.3
3.2.4
3.2.5

kunyit
6.00
0.00
1.75
3.50
5.25
7.00
0.00
2.00
4.00
6.00
8.00
0.00
2.25
4.50
6.75
9.00
0.00
2.50
5.00
7.50
10.00
0.00
3.75
7.50
11.25
15.00
0.00
5.00
10.00
15.00
20.00

komposisi (%)
bangle Temulawak
0.00
94.00
7.00
93.00
5.25
93.00
3.50
93.00
1.75
93.00
0.00
93.00
8.00
92.00
6.00
92.00
4.00
92.00
2.00
92.00
0.00
92.00
9.00
91.00
6.75
91.00
4.50
91.00
2.25
91.00
0.00
91.00
10.00
90.00
7.50
90.00
5.00
90.00
2.50
90.00
0.00
90.00
15.00
85.00
11.25
85.00
7.50
85.00
3.75
85.00
0.00
85.00
20.00
80.00
15.00
80.00
10.00
80.00
5.00
80.00
0.00
80.00

16

RIWAYAT HIDUP
Penulis dilahirkan di Kendal pada tanggal 17 November1993 dari ayah
Ruswito dan ibu Nur Alifah. Penulis adalah putri pertama dari tiga bersaudara.
Tahun 2011 penulis lulus dari SMA Negeri 1 Kendal dan pada tahun yang sama
penulis lulus seleksi masuk Institut Pertanian Bogor (IPB) melalui jalur undangan
SNMPTN dan diterima di Departemen Statistika, Fakultas Matematika dan Ilmu
Pengetahuan Alam.
Selama mengikuti perkuliahan, penulis menjadi asisten praktikum Metode
Statistika pada tahun ajaran 2014/2015, dan pengajar mata pelajaran matematika di
suatu bimbingan belajar untuk kelas XI SMA. Penulis juga pernah aktif sebagai
anggota Beta Club Himpunan Keprofesian Gamma Sigma Beta pada tahun 2013
dan menjadi bendahara Beta Club Himpunan Keprofesian Gamma Sigma Beta pada
tahun 2014. Pada bulan Juni - Agustus 2014 penulis melaksankan Praktik Lapangan
di Balai Besar Penelitian dan Pengem-bangan Bioteknologi dan Sumberdaya
Genetik Pertanian (BB Biogen) dengan judul Pengaruh Varietas terhadap
Pertumbuhan Tanaman Jewawut (Setaria Italic) dengan Analisis Rancangan Acak
Lengkap.
Penulis juga aktif mengikuti lomba non akademik seperti lomba kesenian.
Beberapa prestasi yang diraih oleh penulis adalah Juara II akustik PORSTAT tahun
2013, Juara II Drama Musikal SPIRIT FMIPA tahun 2014, dan Juara I Akustik
PORSTAT tahun 2014.