F. Generalized Exploratory Factor Analysis (GEFA) aproach to reduce the dimension of data in calibration modeling

PENDEKATAN GENERALIZED EXPLORATORY FACTOR
ANALYSIS (GEFA) UNTUK MEREDUKSI DIMENSI DATA
DALAM PEMODELAN KALIBRASI

ZULFIKAR F

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2013

PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA*
Dengan ini saya menyatakan bahwa tesis berjudul pendekatan generalized
exploratory factor analysis (GEFA) untuk mereduksi dimensi data dalam
pemodelan kalibrasi adalah benar karya saya dengan arahan dari komisi
pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi
mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan
maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan
dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut

Pertanian Bogor.
Bogor, 2013
Zulfikar F
G152100161

RINGKASAN
ZULFIKAR F. Pendekatan generalized exploratory factor analysis (GEFA) untuk
mereduksi dimensi data dalam pemodelan kalibrasi, dibimbing oleh KUSMAN
SADIK dan ANIK DJURAIDAH.
Generalized exploratory factor analysis (GEFA) merupakan pengembangan
metode analisis faktor yaitu suatu teknik statistika untuk mereduksi dimensi data
dengan cara menyatakan peubah asal sebagai kombinasi linear sejumlah faktor,
sehingga mampu menjelaskan keragaman data peubah asal. Metode GEFA
mengatasi kekurangan pada analisis faktor, yang bermasalah dengan jumlah
pengamatan lebih sedikit dari jumlah peubah. Kondisi jumlah pengamatan lebih
sedikit dari jumlah peubah memberikan sifat semi-definit positif pada matriks
korelasi atau matriks ragam peragam. Tujuan penelitian ini adalah untuk
mendapatkan model kalibrasi pada tanaman obat temulawak. Data penelitian
merupakan hasil pengukuran analisis high performance liquid cromatography
(HPLC) dan fourier transform infrared (FTIR) pada serbuk temulawak. Senyawa

aktif di peroleh dari analisis HPLC, selanjutnya disebut peubah respon (y).
Kemudian dari hasil pengukuran FTIR diperoleh persen transmitan sebanyak 1866
sebagai penciri gugus fungsi kimia kandungan serbuk temulawak, disebut peubah
bebas (X). Hasil pengukuran FTIR merupakan data kalibrasi dengan kondisi
jumlah pengamatan lebih sedikit dari jumlah peubah, sehingga untuk dapat
memberikan model yang baik, data tersebut perlu dilakukan reduksi.
Model kalibrasi diperoleh dari skor faktor merupakan hasil reduksi metode
GEFA terhadap data kalibrasi, kemudian diregresikan dengan peubah respon (y).
Untuk mengetahui keunggulan GEFA, dilakukan perbandingan dengan metode
reduksi lain yaitu Analisis Komponen Utama (AKU). Evaluasi model untuk
mengetahui kebaikan model kalibrasi, diukur dari keeratan (koefisien korelasi)
peubah respon (y) dengan peubah respon dugaan (��) dari model, nilai akar rataan
kuadrat galat (RMSE), prediksi galat (PRESS) dan nilai validasi silang nilai akar
rataan kuadrat galat (RMSECV).
Metode GEFA melalui algoritma GEFALS (generalized exploratory factor
analysis least square), memberikan hasil reduksi dengan pola grafik yang baik
dan mirip pola grafik data awal. Penduga loading faktor (L) dan ragam khusus
(Ψ) sudah baik pada banyak faktor (k) = 4, karena dari nilai kebaikan model
faktor yaitu RMS overall sebesar 0.0027 atau lebih kecil dari 0.05. Namun untuk
mendapatkan skor faktor (F) yang baik untuk model kalibrasi, terdapat pada

jumlah faktor k =14, dengan nilai RAdj sebesar 0.9398. Hasil reduksi metode
AKU menunjukan pola grafik yang tidak konsisten, sehingga tidak mampu
memberikan pola yang mirip dengan pola grafik pada data awal. Metode AKU
juga memberikan model kalibrasi terbaik pada jumlah k = 14, dengan nilai RAdj
sebesar 0.9392.
Evaluasi model kalibrasi dari hasil reduksi GEFA dan model kalibrasi hasil
reduksi AKU menunjukkan hampir mirip. Hal ini dilihat dari nilai koefisien
korelasi dan RMSE yang sama yaitu 0.992 dan 0.0136, namun pada nilai PRESS
dan RMSECV model kalibrasi GEFA memperoleh nilai lebih kecil, kemudian
pertimbangan grafik pola hasil reduksi metode GEFA yang sangat mirip dengan

pola data awal, hal ini mengidentifikasi hasil reduksi GEFA lebih baik dari pada
hasil reduksi AKU.
Kata kunci:generalized exploratory factor analysis (GEFA), analisis komponen
utama (AKU), model kalibrasi

SUMMARY
Zulfikar, F. Generalized Exploratory Factor Analysis (GEFA) Aproach to Reduce
The Dimension of Data in Calibration Modeling, under direction of KUSMAN
SADIK and ANIK DJURAIDAH.

Generalized Exploratory Factor Analysis (GEFA) is the development of
factor analysis method, a statistical technique to reduce the dimension of data by
declaring origin variables as a linear combination of a number of factors, so that
could explain the diversity of origin variables data. GEFA can resolve the
deficiencies in factor analysis, which is troubled by the number of observations
less than the number of variables. This condition give the semi-positive definite
properties to correlation matrix or covariance matrix. The objective of this
research was to obtain the calibration model of medicinal plants, temulawak. The
data used were the result of a high performance liquid cromatography (HPLC)
analysis and fourier transform infrared (FTIR) in the temulawak powder. An
active compound was obtained from HPLC analysis, furthermore it is called
dependent variable (y). The result of FTIR produce 1866 transmittance percentage
as a chemical functional group of identifier temulawak powder, called
independent variable. The results of FTIR was the calibration data with the
number of observations less than the number of variables, so as to be able to
provide a good model, the data reduction is needed. The calibration model was
obtained from the score factors, a result of the reduction of GEFA method, then it
was regressed to dependent variable (y). To know the advantages of GEFA,
conducted a comparisons with other reduction method, principal component
analysis (PCA). Evaluation of a model to determine the goodness of the

calibration model, measured from the closeness of dependent variable (y)
(correlation coefficient) with the estimation of dependent variable (��), root mean
square error (RMSE) value, prediction residuals (PRESS) and root mean square
error of cross validation (RMSECV).
GEFA method through the GEFALS algorithm (generalized least square
exploratory factor analysis), give the results of the reduction with good graphics
and similar patterns with preliminary data. loading factors estimator (L) and
specific variance (Ψ) have been good on a lot of factors (k) = 4, since the value
model goodness factors i.e. RMS overalls was 0.0027 or smaller than 0.05.
However, to get a good score factor (F) for the calibration model, contained in a
number of factors k = 14, with a value of RAdj was 0.9398. The results of PCA
reduction method showed an inconsistent graph patterns, so it is not able to give a
similar pattern with preliminary data. PCA method also give the best calibration
model on k = 14, with a value of RAdj was 0.9392.
Evaluation of the calibration model from the GEFA reduction and the PCA
reduction give the simillar reduction. It can be seen from the correlation
coeffiecient and RSME that give the same value, i.e. 0.992 and 0.0136, but the
PRESS values and RMSECV of GEFA calibration model obtain a smaller value,
and the graph pattern of the reduction of GEFA was similar with the preliminary
data, it implies that the results of GEFA reduction is better than PCA reduction.


Keywords: generalized exploratory factor analysis
component analysis (PCA), calibration model

(GEFA),

principal

© Hak Cipta Milik IPB, Tahun 2013
Hak Cipta Dilindungi Undang-Undang
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan
atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan,
penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau
tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan
IPB
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini
dalam bentuk apa pun tanpa izin IPB

PENDEKATAN GENERALIZED EXPLORATORY FACTOR
ANALYSIS (GEFA) UNTUK MEREDUKSI DIMENSI DATA

DALAM PEMODELAN KALIBRASI

ZULFIKAR F

Tesis
sebagai salah satu syarat untuk memperoleh gelar
Magister Sains
pada
Program Studi Statistika Terapan

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2013

Penguji pada Ujian Tesis : Dr. Ir. Aji Hamim Wigena, M.Sc

Judul Tesis : Pendekatan Generalized Exploratory Factor Analysis (GEF A)
untuk Mereduksi Dimensi Data dalam Pemodelan Kalibrasi
Nama


: Zulfikar F

NlM

: G152100161

Disetuj ui

0

eh

Komisi Pembimbing

Dr. Ir. Anik Djuraidah, MS
Anggota

Dr. Kusman Sadik, MS
Ketua


Diketahui oJeb

Ketua Program Studi
Statistika Terapan

Dr. IT. Anik Djuraidah, MS

Tanggal Ujian:
30 September 2013

Tanggal Lulus:

1 2 DEC 2013

Judul Tesis : Pendekatan Generalized Exploratory Factor Analysis (GEFA)
untuk Mereduksi Dimensi Data dalam Pemodelan Kalibrasi
Nama

: Zulfikar F


NIM

: G152100161

Disetujui oleh
Komisi Pembimbing

Dr. Kusman Sadik, MS
Ketua

Dr. Ir. Anik Djuraidah, MS
Anggota

Diketahui oleh

Ketua Program Studi
Statistika Terapan

Dekan Sekolah Pascasarjana


Dr. Ir. Anik Djuraidah, MS

Dr. Ir. Dahrul Syah, MSc Agr

Tanggal Ujian:
30 September 2013

Tanggal Lulus:

PRAKATA

Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas segala
karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalam
penelitian yang dilaksanakan sejak bulan Maret 2012 ini ialah pendekatan generalized
exploratory factor analysis (GEFA) untuk mereduksi dimensi data dalam pemodelan
kalibrasi.
Terima kasih penulis ucapkan kepada Bapak Dr Ir Kusman Sadik MS dan Ibu Dr Ir
Anik Djuraidah MS selaku pembimbing serta teman-teman yang telah banyak memberi saran
dalam penyelesaian karya ilmiah ini. Ungkapan terima kasih juga disampaikan kepada ibunda
Nuraini, istri tercinta Ika Sartika SKM, serta seluruh keluarga, atas segala doa dan kasih
sayangnya.
Semoga karya ilmiah ini bermanfaat.

Bogor, 2013
Zulfikar F

DAFTAR ISI
DAFTAR TABEL ............................................................................................... vi
DAFTAR GAMBAR .......................................................................................... vi
DAFTAR LAMPIRAN ....................................................................................... vi
1 PENDAHULUAN ........................................................................................... 1
Latar Belakang ............................................................................................ 1
Tujuan Penelitian ........................................................................................ 2
2 TINJAUAN PUSTAKA...................................................................................... 2
Generalized Exploratory Factor Analysis (GEFA) ....................................... 2
Analisis Komponen Utama (AKU) .............................................................. 5
Pemodelan Kalibrasi ...................................................................................6
Evaluasi Model ........................................................................................... 6
3 METODE. ....................................................................................................... 7
Sumber Data ............................................................................................... 7
Peubah Penelitian........................................................................................... 7
Metode Analisis .......................................................................................... 8
4 HASIL DAN PEMBAHASAN ........................................................................ 9
Deskripsi Spektrum Serbuk Temulawak........................................................9
Hasil Analisis Metode GEFA ................................................................... 10
Hasil Analisis Komponen Utama (AKU).................................................... 13
Model kalibrasi ........................................................................................ 14
Evaluasi Model Kalibrasi .......................................................................... 15
5 SIMPULAN DAN SARAN .......................................................................... 16
Simpulan................................................................................................... 16
Saran......................................................................................................... 17
DAFTAR PUSTAKA ........................................................................................ 18
LAMPIRAN ...................................................................................................... 20
RIWAYAT HIDUP............................................................................................ 29

DAFTAR TABEL
1
2
3
4

Data Konsentrasi HPLC pada 20 Daerah Sentra Tanaman Obat .................... 8
Akar ciri dan persentase kumulatif dari matriks X'X ................................... 11
Akar ciri dan proporsi kumulatif dari matriks ∑ .......................................... 13
Nilai R2 dan RAjd dari regresi skor faktor GEFA dan skor AKU pada masingmasing jumlah faktor ( k) ............................................................................ 15
5 Nilai RMSE, PRESS dan RMSECV pada masing-masing model................. 16

DAFTAR GAMBAR
1
2
3
4

Deskripsi data hasil pengukuran FTIR pada serbuk temulawak ...................... 9
Plot kuantil-kuantil persen transmitan serbuk temulawak .............................. 9
Perbandingan jumlah faktor dengan persentase kumulatif ragam ................. 11
Hasil reduksi metode GEFA untuk (a) k = 4, (b) k = 6, (c) k = 8,
(d) k =10, (e) k = 12 dan (f) k = 14 .............................................................. 12
5 Hasil reduksi GEFA untuk k = 4 setelah rotasi faktor .................................. 12
6 Hasil reduksi dengan metode AKU untuk (a) k = 6, (b) k = 10,
(c) k = 12, (d) k = 14 ................................................................................... 14
7 Hubungan peubah respon dengan penduga respon ....................................... 16
.......................................................................................................................

DAFTAR LAMPIRAN
1 Flow chart algoritma GEFALS .................................................................... 20
........................................................................................................................
2 Makro algoritma GEFALS dengan aplikasi MATLAB ............................... 22
3 Nilai penduga L dan Ψ hasil ekstraksi faktor GEFA untuk k = 4 ................. 23

1

PENDAHULUAN
Latar Belakang

Temulawak (Curcuma xanthorrhiza) merupakan salah satu tanaman obat
unggulan yang memiliki khasiat multifungsi. Rimpangnya yang berkhasiat obat
mampu mengatasi penyakit kelainan pada hati/ lever, kantong empedu, pankreas.
Selain itu juga dapat menambah nafsu makan, menurunkan kadar kolesterol dalam
darah, dapat meningkatkan sistem immunitas tubuh, berkhasiatanti bakteri, anti
diabetik, anti hepatotoksik, anti inflamasi, anti oksidan, anti tumor, diuretika,
depresan dan hipolipodemik (Raharjo & Rostiana 2003). Berdasarkan penelitian
bahwa kandungan senyawa kimia pada temulawak terdiri atas kurkuminoid,
minyak atsiri, resin lipida, amilum, amilase, fenolase dan mineral. Minyak atsiri
temulawak terdiri atas 31 komponen, dan beberapa diantaranya merupakan
komponen khas minyak atsiri, salah satunya adalah xanthorrhizol. Xanthorrhizol
memiliki aktivitas menekan atau mengurangi peradangan (Khaerana et al. 2008).
Dewasa ini banyak perusahaan farmasi dan jamu memanfaatkan tanaman
temulawak sebagai tanaman obat, sehingga kualitas tanaman obat ini mendapat
perhatian khusus untuk menjamin produksi agar tetap dapat bersaing dan diterima
di kalangan masyarakat. Salah satu indikator kualitas tanaman temulawak sebagai
tanaman obat yang baik adalah komposisi kandungan konsentrasi senyawa aktif
didalamnya. Proses penentuan konsentrasi senyawa aktif yang dikandung oleh
suatu tanaman obat perlu dilakukan secara cepat dan akurat. Secara kuantitatif dan
kualitatif suatu senyawa aktif dapat diketahui antara lain melalui metode high
performance liquid chromatograph (HPLC) dan fourier trasform infrared (FTIR).
Proses penentuan konsentrasi senyawa aktif dengan HPLC memerlukan waktu dan
biaya yang relatif mahal dibandingkan dengan FTIR. Untuk itu diperlukan metode
yang handal tetapi relatif mudah untuk digunakan. Salah satu metodenya adalah
dengan membuat sebuah model yang menyatakan hubungan antara konsentrasi
senyawa aktif hasil pengukuran HPLC dengan persen transmitan (absorban) yang
diukur dengan menggunakan FTIR (Erfiani 2005).
Metode alternatif yang dapat menyatakan hubungan antara konsentrasi
senyawa aktif hasil pengukuran HPLC dengan persen transmitan atau asorban
yang diukur dengan menggunakan FTIR adalah model kalibrasi. Menurut Naes et
al. (2002), model kalibrasi merupakan suatu fungsi hubungan antara satuan
pengukuran yang dapat diperoleh melalui proses yang relatif mudah atau murah
dan satuan pengukuran yang memerlukan waktu lama dan biaya mahal dalam
memperolehnya. Ukuran yang mahal tersebut adalah konsentrasi suatu unsur atau
senyawa yang dihasilkan oleh HPLC, sedangkan ukuran-ukuran yang murah
adalah persen transmitan pada bilangan gelombang yang dihasilkan oleh
spektrometer FTIR. Tujuan pemodelan kalibrasi peubah ganda adalah menemukan
model yang dapat digunakan untuk memprediksi konsentrasi senyawa secara
akurat berdasarkan informasi persen transmitan dari senyawa yang dianalisis
(Tonah et al. 2009) .
Secara umum, pada data kalibrasi terdapat beberapa permasalahan di
antaranya yaitu adanya multikolinearitas yang tinggi antar peubah penjelas (pada
data persen transmitan) dan banyaknya peubah penjelas jauh lebih besar daripada
banyaknya contoh yang dimiliki. Beberapa metode yang sudah digunakan dalam
model kalibrasi di antaranya adalah regresi ridge, regresi bertatar, pendekatan

Bayes (Rahayu 2003, Erfiani 2005), regresi kuadrat terkecil parsial (RKTP) dan
regresi komponen utama (RKU), jaringan syaraf tiruan (JST) (Djuraidah 2003).
Dimensi yang dimiliki data kalibrasi sangat besar, sehingga sebagian besar
analisis memerlukan pereduksian dimensi data terlebih dulu. Teknik reduksi data
yang digunakan dalam model kalibrasi di antaranya adalah komponen utama dan
transformasi fourier diskret (Atok 2005), transformasi wavelet diskret (Sunaryo
2005). Solusi alternatif lain yang dapat digunakan dalam teknik reduksi data pada
model kalibrasi adalah generalized exploratory factor analysis (GEFA).
GEFA merupakan suatu teknik statistika untuk mereduksi dimensi data
dengan cara menyatakan peubah asal sebagai kombinasi linear sejumlah faktor.
Prinsip kinerja GEFA hampir sama dengan analisis faktor yaitu mereduksi data
menjadi peubah baru (k) yang lebih sedikit dari jumlah peubah awal (p), memiliki
sifat ortogonal karena keragamannya berbeda dan mampu menerangkan faktor
yang dihasilkan, sehingga dapat diinterpretasikan karena dapat menjelaskan
keterkaitan (interrelationship) antar peubah asal. Namun analisis faktor tidak dapat
memberikan solusi yang baik dengan kondisi data kalibrasi, karena analisis faktor
mensyaratkan jumlah pengamatan (n) harus lebih banyak dari jumlah peubah (p),
syarat n > p agar matriks ragam peragam atau matrik korelasi dari suatu data
bersifat definit positif. Pada kondisi � ≤ � , solusi yang diberikan metode analisis
faktor menjadi kurang tepat atau solusi tidak wajar yaitu ragam nol bahkan
negatif, dalam banyak literatur disebut kasus Heywood (Mattjik & Sumertajaya
2011).
Tujuan Penelitian
Tujuan penelitian yang dilakukan adalah:
1. Mereduksi data kalibrasi hasil pengukuran FTIR dengan GEFA.
2. Meregresikan senyawa hasil pengukuran HPLC dengan hasil reduksi GEFA,
untuk mendapatkan model kalibrasi.
3. Membandingkan model kalibrasi hasil reduksi GEFA dengan model
kalibrasi hasil reduksi analisis komponen utama (AKU).

2 TINJAUAN PUSTAKA
Generalized Exploratory Factor Analysis (GEFA)
Misalkan � merupakan matriks data dengan jumlah n pengamatan dan
peubah bebas p (n > p), kemudian F dan U merupakan matriks dari faktor
bersama dan faktor khusus. Kemudian terkait asumsi model analisis faktor pada
matriks �� � dapat dipresentasikan (Trendafilov & Unkel 2011):
kendala:

� = ��′ + ��

� ′ � = �k � ′ � = �p .� ′ � = �pxk dan � matriks diagonal

(1)

(2)

dengan :
F = matrik faktor bersama dengan elemen ukuran n × k,
j = 1,2,....., k; k ≤ p
U = matrik faktor umum dengan ukuran n × p, dengan i = 1,2,......, p
� = matriks ragam spesifik atau ragam unik, berukuran p × p
L = laoding faktoruntuk peubah ke –idan faktor ke-j, berukuran p × k
persamaan (1) dan (2) dapat di representasikan dalam matriks korelasi:
� ′ � = ��′ + � 2

(3)

Persamaan (1) dan (3) merupakan model baku analisis faktor, dengan L
dinyatakan dengan loading faktor dan Ψ merupakan ragam spesifik, yang
diupayakan dapat memberikan nilai yang paling sesuai untuk �′�. Proses
penemuan dugaan nilai {L,Ψ} untuk sejumlah komponen (k) dilakukan dengan
ekstraksi faktor.
Metode generalized exploratory factor analysis(GEFA) merupakan salah
satu ekstraksi faktor yang modifikasi dari metode kuadrat terkecil tak-terbobot
(unweighted least squares), dengan persamaan umum sebagai berikut
(Bartholomew & Knott 1999):
min |�(� ′ � − ��′ − � � )�|2F
(4)
dengan ||�||F = (tr(� ′ �))

1�
2

disebut notasi norma Frobenius

De Leeuw (2004) menyatakan model analisis faktor pada persamaan (3)
sebagai dekomposisi matriks data tertentu, kemudian untuk mendapatkan L dan Ψ
dilakukan minimisasi kuadrat terkecil dengan memperhatikan kriteria kebaikan
dari fungsi:
� (�, �, �, �) = ||� − ��′ − ��||2F

kendala :
� ′ � = �k . �′� = �p .� ′ � = �pxk dan Ψ matriks diagonal.

(5)
(6)

Misalkan B = [F U] dan A = [L Ψ] merupakan matriks gabungan dengan
ukuran n × (k + p) dan p × (k + p). Implikasinya � ′ � = �p×k , kemudian
persamaan diatas dapat ditulis ulang (Trendafilov & Unkel 2011):
� = |�� − ��′ �|2F = ||�||2F + tr(�� ′ ��′ ) − 2tr(� ′ ��)

(7)

Menurut Trendafilov dan Unkel (2011), meminimisasi f bergantung pada B
ortonormal merupakan masalah Procrustes, sehingga ekivalen dengan
memaksimumkan tr(� ′ ��). Solusi dari masalah maksimalisasi ini diberikan oleh
�∗ = ��′, dimana �� = ���′ merupakan penguraian nilai singular (singular
value decompotition / SVD) dari �� .Dari B* diperoleh matriks F* dan matriks U*
yang baru, kemudian L dan � juga diperbarui �∗ = �′� ∗ dan � ∗ = diag(�∗ ′ �).
Mengikuti model analisis faktor klasik dan syaratnya, maka prosedur iteratif
menemukan {F,U} dan {L,Ψ} kontinu pada nilai fungsi (f) tertentu hingga kriteria
kekonvergenan terpenuhi. Solusi ini hanya unik untuk n ≥ p, karena rank (��) ≤
min{rank(�), rank(�)} = p < k + p.

Jika n < p maka rank U berada pada n, sehingga U'U = In merupakan matriks
identitas yang memiliki diagonal bernilai nol. Matriks korelasi � ditulis ulang
menjadi:
� ′ � = ��′ + ��′��
(8)

Misalkan r merupakan jumlah elemen nol pada Ψ, sehingga rank (Ψ) = p – r.
Asumsi ini menyatakan r-peubah yang sesuai dengan ragam khusus sama dengan
nol adalah r-peubah pertama. Selanjutnya misalkan matriks U dapat dipartisi,
sehingga matriks U = [U1 U2] dengan U1 dan U2 merupakan sekatan matriks
dengan masing-masing berukuran n × r dan n × ( p – r), kemudian diperoleh:
�= �

�1

�(p−r)×r

�r×(p−r)

�2

dengan �1 = �r , kondisi � ′ �� = � dapat ditulis :
�′
� ′ �� = � 1′ � [�1
�2
�′ �
= � 1′ 1
�2 �1

�2 ] �

�1

�(p−r)×r

�1
�1′ �2
��

�2 �2 �(p−r)×r

�′ � �
= � 1′ 1 1
�2 �1 �1

�r×(p−r)
�,
�2

�r×(p−r)
�,
�2

�1
�1′ �2 �2
�=�

�(p−r)×r
�2 �2 �2

�r×(p−r)
�=�
�2

(9)

Kemudian �1 = �� dan batas pada persamaan (8) tereduksi menjadi
�1′ �2 �2 = �(p−r)×r dan �2′ �2 �2 = �2 . Ketika �2 > 0, berarti bahwa �1′ �2 =
�r×(p−r) dan karena U2 submatriks dari U sehingga rank � ≤ n − k. juga berarti
p − r ≤ n − k.Selanjutnya diperoleh r ≥ p − n + k > k, kemungkinan peubah
dengan ragam khusus sama dengan nol akan selalu lebih banyak dari jumlah faktor
bersama yang terpilih. Menurut Horn dan Johnson (1986) analisis faktor dengan
asumsi rank(�) = � − 1 dapat ditulis; n − 1 ≤ rank(��′ + ��) ≤ rank(��′ ) +
rank(��) ≤ k + p − r. dengan r ≥ p − n + k + 1. Hal ini menunjukkan bahwa
untuk n, p dan k dengan ragam khusus nol dapat mengambil hanya dua nilai. yaitu
r ∈ [p − n + k, p − n + k + 1]. akibatnya jika rank (�) < � − 1, maka jumlah rnol pada ragam khusus akan meningkat.
Trendifilov & Unkel (2011) memberikan solusi disebut generalized
exploratory factor analysis (GEFA), untuk mengatasi analisis faktor klasik yang
bermasalah dengan n < p, sehingga persamaan (1) kendalanya diperbaharui :
� ′ � = �k , �′�� = �, � ′ � = �p×k dan � matriks diagonal

(10)

Rank (F) = k, � ′ � + �� ′ = �� , � ′ �� = � (matriks diagonal).

(11)

Jika n < p + k dengan k-faktor terbatas pada � ′ � = �k dan � ′ � = �pxk
adalah ekivalen dengan batasan � ′ � + ��′ = �n bukan pada �′�� = �,
kemudian rank F = k, maka model GEFA membutuhkan minimisasi dari
persamaaan (5) dengan kendala diperbarui:

Sehingga, jika dimisalkan B = [F U] dan A = [L Ψ] untuk mendapatkan
bentuk seperti persamaan (7) yang mengikuti standar masalah Procrustes, maka
diperoleh solusi dengan memaksimalkan tr(� ′ ��) pada (f ):
2

2

� = �|� − ��′ |�F = �|�|�F + tr (� ′ ��′ �) − 2 tr(� ′ ��)

(12)

kendala �� ′ = �

Persamaan (12) terikat pada B, sedangkan bentuk tr(� ′ ��′ �) tidak terikat
pada F dan U karena � ′ � ≠ �, kemudian solusi persamaan (12) ekivalen dengan
memaksimumkan tr(� ′ ��) dan solusi dari masalah maksimalisasi ini diberikan
oleh �∗ = ��′, dengan T dan R diperoleh dari singular value decompotition
(SVD) �′�′ = ���′. Dari B* diperoleh matriks F* dan matriks U* yang baru,

kemudian L dan �diperbarui �∗ = �′� ∗ dan � ∗ = diag(� ∗ �. Dengan
memanfaatkan prosedur iteratif untuk menemukan {F,U} dan {L,Ψ} terus berlanjut
hingga kriteria kekonvergenan terpenuhi. Jika k-faktor diperoleh pada model
GEFA maka juga akan sama diperoleh pada loadingnya apabila dilakukan rotasi
faktor. Misalkan sembarang matriks T ortogonal dengan ukuran k × k, kemudian
persamaan (1) ditulis ulang:
� = ��� ′ �′ + ��

(13)

dengan LT sebagai loading faktor dan FT sebagai faktor bersama. Untuk
interpretasi dan menghindari ketidak-pastian rotasi, sifat rank (L) = k dapat
diselesaikan dengan L yang dalam bentuk matriks Λ�×� segitiga bawah. Anderson
& Rubin (1956) menyatakan usaha ini merupakan sejenis memperbaiki parameter
(reparametrization) dan pertama kali digunakan oleh Trendafilov (2005),
Selanjutnya loss function GEFA dimodifikasi:
�′ 2
�(Λ, �, �, �) = �� − [� �] � ��
� F

(14)

Analisis Komponen Utama

Analisis komponen utama merupakan suatu teknik analisis statistik untuk
mereduksi data dengan cara mentransformasi peubah-peubah asal yang masih
saling berkorelasi satu dengan yang lain menjadi satu set peubah baru yang tidak
berkorelasi lagi. Peubah-peubah baru tersebut disebut sebagai komponen utama
(Johnson & Wichern 1982).
Komponen utama tergantung kepada matriks ragam peragam (Σ) dan
matriks korelasi (ρ) dari peubah asal, dan analisis komponen tidak memerlukan
asumsi berdistibusi normal peubah ganda. Misalkan �1 , �2 , ⋯ , �� merupakan
vektor peubah yang diamati dengan matriks ragam peragam (�), maka komponen
utama pertama (�1 ) didefinisikan:
�1 = ∑��� �� = �1 ′�

(15)

dengan memaksimumkan ragam �1 , yaitu �1 ′ ∑ �1 dan kendala �1 ′�1 = 1.
Selanjutnya untuk komponen utama kedua, dilambangkan oleh �2 didefinisikan
sebagai �2 = �2 ′� yang memaksimumkan ragam �2 , dengan kendala �1 ′�1 = 1,
dan tidak ada korelasi antara �1 dan �2 (peragam �1 dan �2 yaitu �1 ′ ∑ �2 = 0,
sehingga �1 ′�2 = 0). Demikian seterusnya untuk komponen utama ke-i sampai
yang ke-p.
Pemodelan Kalibrasi
Model kalibrasi peubah ganda merupakan suatu hubungan antara satuan
pengukuran yang dapat diperoleh melalui proses yang relatif mudah atau murah
dengan satuan pengukuran yang memerlukan waktu lama dan biaya mahal. Secara
umum data kalibrasi memiliki multikolinieritas yang tinggi antar peubah penjelas
dan dimensinya jauh lebih besar daripada jumlah pengamatan. Oleh karena itu,
sebagian besar pendekatan pemodelan kalibrasi memerlukan pereduksian data
terlebih dahulu (Tonah et al. 2009).
Model kalibrasi dapat dipandang sebagai regresi linier yang ditulis
�� = �0 + �1 �1� + �2 �2� + ⋯ + �� ��� + �� , (i = 1, 2, . . . , n) ,
nilai harapan nya adalah :
� (�� ) = �0 �� + � (��) ��

(16)

dengan X merupakan matriks spektrum (peubah penjelas) yang dihasilkan pada p
bilangan gelombang dengan kondisi ukuran p >> n. Selain itu matriks X memiliki
dimensi yang sangat besar dan antara peubah penjelas sering terdapat
multikolinieritas, sehingga perlu dilakukan pereduksian.
Evaluasi Model
Evaluasi model dilakukan untuk mengetahui kebaikan dan kemampuan
prediksi model yang diberikan oleh metode dalam penelitian. Sisaan (residual)
memegang peranan penting dalam menilai kebaikan dan kemampuan prediksi
model, Untuk itu masing-masing model akan dilakukan evaluasi dengan
menggunakan pendekatan sisaan yaitu :
a.

Akar rataan kuadrat galat (root mean squared error /RMSE).


1
���� = � �(�� − ��� )2


(17)

�=1

Dengan ��� merupakan nilai-nilai dari peubah prediksi dan RMSE merupakan
ukuran untuk menilai kebaikan model yang cocok dengan data.
b.

Validasi silang akar rataan kuadrat galat (root mean square error cross
validation /RMSECV).
RMSECV digunakan untuk mengetahui kemampuan model dalam
memprediksi pada data contoh yang baru. RMSECV berkaitan dengan nilai
PRESS, dengan persamaan sebagai berikut:

�����
������ = �


(18)

PRESS merupakan kuadrat galat prediksi diperoleh dari:


����� = � ��2 , dan �� =
�=1

��
atau �� = �� − ���,−�
1 − ℎ��

Dengan ei merupakan sisaan dan hii merupakan diagonal dari hatmatriks (H) =
X(X'X)-1X' , sedangkan ���,−� menyatakan prediksi titik data ke-i oleh model
yang tidak memanfaatkan titik data ke-i dalam penghitungan koefisiennya.
3 METODE
Sumber Data
Data yang digunakan dalam penelitian ini adalah data primer yang
merupakan bagian dari data penelitian Hibah Pasca sarjana tahun 2003-2005 hasil
kerjasama antara Departemen Statistika IPB dengan Pusat Studi Biofarmaka
LPPM IPB. Data yang digunakan adalah persen transmitan kurkumin dari serbuk
temulawak hasil pengukuran spektrometer FTIR dan data konsentrasi senyawa
aktif kurkumin yang diukur dengan menggunakan HPLC. Temulawak yang
dijadikan contoh diambil dari beberapa daerah sentra tanaman obat, yaitu Bogor,
Sukabumi, Kulon Progo, Karanganyar, Cianjur dan Balitro.
Peubah Penelitian
Peubah bebas (X) merupakan bilangan gelombang diperoleh dari sumbu-x
pada spektrum FTIR, panjang intervalnya berkisar dari 4000 cm-1 - 400 cm-1.
Identifikasi karakteristik gugus fungsi diketahui dari daerah puncak spektrum IR,
dipisahkan menjadi empat wilayah. Rentang wilayah pertama dari 4000 cm-1 2500 cm-1 diidentifikasikan penyerapan yang disebabkan oleh gugus fungsi NH,
CH dan obligasi OH tunggal, rentang wilayah kedua dari 2500 cm-1 - 2000 cm-1
diidentifikasikan penyerapan gugus fungsi ikatan rangkap tiga, rentang wilayah
berkisar dari 2000 cm-1 - 1500 cm-1 penyerapan disebabkan oleh ikatan rangkap
seperti C=O, C=N dan C=C dan rentang wilayah keempat dari 1500 cm-1 - 400 cm1
dikenal sebagai daerah sidik jari dari spektrum FTIR dan mengandung sejumlah
besar puncak serapan yang account untuk berbagai macam ikatan tunggal. Jika
semua puncak dalam spektrum IR, termasuk yang di rentang wilayah ke empat,
maka dapat disimpulkan bahwa dua senyawa adalah identik.
Peubah bebas (X) pada penelitian ini merupakan bilangan gelombang
diperoleh dari hasil penyerapan persen transmitan pada serbuk kurkumin sebanyak
1866 dari 20 daerah pengamatan yang berbeda. Sedangkan peubah respon (y) pada
penelitian ini adalah konsentrasi HPLC dari 20 daerah pengamatan seperti yang
terlihat pada Tabel 1.

Tabel 1 Data Konsentrasi HPLC pada 20 Daerah Sentra Tanaman Obat
No
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

Daerah Sentra
Kulon Progo 1
Kulon Progo 2
Kulon Progo 3
Kulon Progo 4
Karanganyar 1
Karanganyar 2
Kulon Progo 5
Kulon Progo 6
Karanganyar 3
Karanganyar 4
Balitro 1
Balitro 2
Cianjur 1
Cianjur 2
Bogor 1
Bogor 2
Kuningan 1
Kuningan 2
Sukabumi 1
Sukabumi 2

Konsentrasi HPLC
0.65
0.63
0.92
0.9
1.61
1.66
1.01
1.13
0.47
0.5
1.38
1.57
1.57
1.74
0.13
0.12
1.11
0.97
1.3
1.24

Metode Analisis
Data penelitian diolah menggunakan metode GEFA mengikuti algoritma
GEFALS(generalized exploratory factor analysis least square). Diagram
algoritma disajikan pada Lampiran 1 dengan mengikuti langkah-langkah sebagai
berikut:
1. F = rand (n,k) dan U = rand(n,p)
2. Menghitung L = Z'F dan � = diag(� ′ �)
3. Membentuk matriks blok B = [F U] dan A = [L Ψ]
4. Menentukan fungsi ����� = ‖�‖2� dan � = ‖� − ��′‖2�
5. while |����� − �| < 10−6
if n ≥ p + k,
�∗ = ��′ ; dengan SVD dari �� = ���′
else
�∗ = ��′; dengan SVD dari �′�′ = ���′ .
end if
� ∗ = � ∗ (: ,1 + �),
� ∗ = � ∗ (: , � + 1 ∶ � + �)
�∗ = �′� ∗ dan � ∗ = diag(� ∗ ′ �)
����� = �, � ∗ = ‖� − �∗ �∗′ ‖2�
end while
6. Kemudian jika kriteria kekonvergenan sudah terpenuhi, maka faktor
bersama atau skor faktor (F) di regresikan dengan peubah respon (y).

4 HASIL DAN PEMBAHASAN
Deskripsi Spektrum Serbuk Temulawak
Data persen transmitan diperoleh dari hasil pengukuran dengan
menggunakan FTIR dengan 1866 bilangan gelombang berkisar pada interval 4000
cm-1 hingga 400 cm-1. Pada Gambar 1 menunjukkan indeks panjang gelombang
sekitar 1500 cm-1 spektrum kurkumin serbuk temulawak dari sebagian besar
sampel memiliki pola grafik yang cekung ke atas, namun temulawak berasal dari
Cianjur2 (data 14) menunjukkan pola grafik yang cekung kebawah.

Gambar 1 Deskripsi data hasil pengukuran FTIR pada serbuk temulawak
Tampak pada Gambar 1 spektrum kurkumin serbuk temulawak yang diambil
dari Bogor 2 menunjukkan pola yang cenderung konstan di setiap bilangan
gelombang, sehingga layak diduga bahwa kedua spektrum kurkumin tersebut
merupakan spektrum pencilan (Santi 2010).

Gambar 2 Plot kuantil-kuantil persen transmitan serbuk temulawak
Gambar 2 memperlihatkan hubungan linier antara kuantil Khi-Kuadrat
dengan jarak Mahalanobis (d2), kurang begitu kuat, hasilnya diperlihatkan
2
oleh kecilnya koefisien korelasi antara �(�)
dengan d2 yaitu sebesar -0.232, dengan

2
(�(�)
)

demikian data peubah hasil FTIR dianggap belum mengikuti sebaran normal
berganda. Selanjutnya perhitungan koefisien korelasi pada persen transmitan
serbuk temulawak menunjukan maksimum rata-rata 0.896, dengan koefisien
korelasi minimum adalah 0.694 dan koefisien korelasi maksimum adalah 0.999.
Semua koefisien korelasi antar data tersebut nyata (karena semua nilai P-value <
0.05), hal ini menunjukkan bahwa peubah dari gugus fungsional struktur kimia
tersebut memiliki korelasi yang sangat kuat dan cenderung terjadi
multikolinieritas.
Hasil Analisis Metode GEFA
Hasil pengukuran FTIR diperoleh persen kurkumin yang dicatat pada 1866
panjang gelombang merupakan yang berguna sebagai penciri struktur kimia
(gugus fungsional), kemudian dipresentasikan bentuk matriks berukuran20 ×
1866 (�20×1866 ). Dimensi matriks tersebut, tidak layak jika langsung dilakukan
analisis regresi berganda. Para peneliti biasanya akan melakukan reduksi data
sebelum melakukan analisis statistik tahapan selanjutnya. Salah satu teknik
mereduksi data adalah dengan menggunakan metode analisis faktor, namun
analisis faktor mendapatkan hambatan teknis yaitu kondisi matriks data n < p,
karena kondisi ini berakibat matriks korelasi atau matriks ragam peragam bersifat
semi-definit positif, sehingga akan memberikan solusi tak wajar yaitu
menghasilkan ragam nol dan ragam negatifatau di sebut kasus Heywood (Mattjik
& Sumertajaya 2011).
Jumlah faktor (k) pada metode GEFA ditentukan diawal, kemudian bisa
dievaluasi kembali dengan memperhatikan besaran persentase komulatif akar ciri
yang diberikan oleh matriks �′�. Hal ini sedikit berbeda dengan analisis faktor
klasik di mana perkiraan jumlah faktor (k) dengan memposisikan secara tepat ke
struktur korelasi atau peragam dari data contoh. Kinerja metode GEFA dimulai
dari menduplikasi nilai faktor bersama (F) dan nilai faktor umum (U) dari bilangan
acak.
Tabel 2 Akar ciri dan persentase kumulatif dari matriks X'X
Jumlah
(k)

faktor
1
2
3
4
5
6
7
8
9
10
11
12
13

Akar ciri
Persentase
16852.201
99.4046
68.1596
0.4020
24.5135
0.1446
6.4210
0.0379
0.7696
0.0045
0.4599
0.0027
0.2946
0.0017
0.1716
0.0010
0.0631
0.0004
0.0314
0.0002
0.0197
0.0001
0.0134
0.0001
0.0103
0.0001

Persentase
kumulatif
99.4046
99.8066
99.9512
99.9891
99.9936
99.9963
99.9981
99.9991
99.9995
99.9997
99.9998
99.9999
99.9999

Tabel 2 menunjukkan persentase akar ciri dari matriks �′�, nilai akar ciri
pertama sangat tinggi dibandingkan dengan nilai akar ciri selanjutnya. Hal ini
menunjukkan tingginya tingkat keragaman pada data dan di perkuat dengan
informasi dari grafik perbandingan jumlah faktor dengan persentase kumulatif
keragaman (Tabel 2 dan Gambar 3). Umumnya penentukan jumlah faktor dalam
analisis faktor dengan mempertimbangkan nilai akar ciri lebih besar dari 1 (satu),
maka dari Tabel 2 dan Gambar 3 hanya terdapat 4 faktor (k=4) dengan persentase
kumulatif ragam sebesar 99.9891.

Gambar 3 Perbandingan jumlah faktor dengan persentase kumulatif ragam
̂ ) dan dugaan ragam khusus (�
� ) pada metode
Hasil dugaan loading faktor (�
GEFA dengan algoritma GEFALS terhadap k = 4 dapat dilihat pada tabel di
̂ ) dan penduga ragam
Lampiran 3. Sebelum menerima penduga loading faktor (�
� ) sebagai penduga akhir, perlu diperhatikan besaran elemen-elemen dari
khusus (�
matriks sisaan (Res). Pada kasus ideal, matriks sisaan (Res) selalu memiliki
elemen diagonal nol (Res = 0). Dengan demikian, jika elemen non-diagonal juga
dekat dengan nilai nol atau jika nilai akar kuadrat tengah dari seluruh unsur non
diagonal matriks sisa disebut RMS Overall kurang dari 0.05, maka penduga
̂ ) dan penduga ragam khusus (�
� ) sudah dianggap baik (Mattjik &
loading faktor (�
Sumertajaya 2011). Hasil metode GEFA mendapatkan nilai RMS Overall sebesar
0.0007 (kurang dari 0.05), sehingga mengikuti asumsi atas penduga loading faktor
̂ ) dan penduga ragam khusus (�
� ), dapat disimpulkan bahwa hasil reduksi
(�
metode GEFA dengan k = 4 dianggap sudah baik.
Hasil ekstraksi faktor metode GEFA banyak terdapat nilai ragam khusus (Ψ)
sama dengan nol. Hal ini disebabkan faktor dibentuk dari matriks semi definit
positif, sehingga jumlah nol pada ragam khusus akan meningkat. Implikasi nya
menyebabkan ragam masing-masing peubah (xi) yaitu rata-rata sebesar 8.845,
merupakan sebagian besar kontribusi dari faktor bersama dalam analisis atau
disebut komunalitas ragam bersama (h2i). Kondisi ragam khusus (Ψ) bernilai nol,
sesuai dengan pernyataan Trendafilov dan Unkel (2011) bahwa jika kondisi data
dengan pengamatan (n) lebih sedikit dari pada jumlah peubah prediktor (p) maka
ragam khusus sama dengan nol kemungkinan ada, berarti faktor dengan ragam nol
harus diterima dalam analisis faktor.

Gambar 4 Hasil reduksi dengan metode GEFA untuk (a). k=4, (b). k= 6, (c). k=8,
(d). k=10, (e). k=12, (f). k=14.
Gambar 4 merupakan representasi laoding faktor dari hasil reduksi persen
kurkumin dengan menggunakan metode GEFA. Secara umum pola grafik persen
kurkumin serbuk temulawak (Gambar 1) dengan pola grafik hasil reduksi GEFA
(Gambar 4) terlihat ada kemiripan. Hal ini menunjukkan hasil reduksi GEFA
mampu tidak menghilangkan karakteristik dari data awal (persen kurkumin).
Pada kasus-kasus terapan, rotasi faktor bertujuan untuk memudahkan
interpretasi dalam menentukan peubah-peubah yang tergabung dalam suatu faktor.
Penyelesaian rotasi faktor pada metode GEFA dapat dilakukan dengan
menggunakan algoritma GEFALS pada software MATLAB dengan menambahkan
sintaks TRIL pada perhitungan loading faktor (L) yang bertujuan untuk bentuk
matriks Λ� ×� segitiga bawah, Anderson & Rubin (1956) menyatakan usaha ini
merupakan sejenis memperbaiki parameter.

Gambar 5 Hasil reduksi GEFA setelah dilakukan rotasi faktor pada k = 4
Jika sebelum dilakukan rotasi faktor pada hasil reduksi GEFA (Gambar 4
(a)) menunjukkan bahwa pola loading faktor (L) pada grafik saling berdekatan
(Gambar 4a), kemudian setelah dilakukan rotasi faktor, pola grafik loading faktor
ke-1 (L1) terpisah dari loading faktor yang lain (Gambar 5). Hal ini menunjukan
bahwa ada perbedaan nilai ragam yang cukup signifikan antara loading faktor ke-1
(L1) dengan loading faktor yang lain, yaitu untuk ragam L1 sebesar 16852.201,
sedangkan L2, L3 dan L4 berturut-turut sebesar 68.1596, 24.5135 dan 6.4210.
Selain memperhatikan jumlah akar ciri lebih dari satu, penentuan jumlah
faktor yang terpilih dapat juga dilakukan berdasarkan apriori (subyektif), misalnya
untuk kepentingan penelitian (Mattjik & Sumertajaya 2011). Dalam penelitian ini
pemilihan jumlah faktor dilakukan untuk kepentingan model kalibrasi, yaitu
jumlah faktor yang terpilih mampu memberikan model yang terbaik, dengan
memperhatikan nilai R2 yang diberikan oleh model tersebut. Umumnya semakin
meningkatnya jumlah peubah yang diambil, akan linier dengan meningkatnya nilai
R2 dari suatu model regresi. Jumlah faktor hasil reduksi GEFA akan dipilih untuk
model kalibrasi, ketika memberikan nilai skor faktor yang mampu berkontribusi
untuk nilai R2 yang baik.
Hasil Analisis Komponen Utama
Untuk perbandingan, data persen kurkumin juga dilakukan reduksi dengan
metode yang paling sering digunakan yaitu analisis komponen utama (AKU).
Analisis komponen utama bertujuan untuk menerangkan struktur ragam peragam
melalu kombinasi linier dari peubah asal. Secara umum analisis ini bertujuan
untuk mereduksi dimensi data dan menginterpretasikannya. Selain itu analisis ini
juga dapat mentransformasikan peubah-peubah yang berkorelasi menjadi peubahpeubah yang tidak berkorelasi.
Penentuan jumlah faktor atau komponen pada metode AKU, sama dengan
penentuan jumlah faktor pada analisis faktor yaitu bisa diperoleh dengan
pertimbangan nilai akar ciri dari matriks ragam peragam atau matriks korelasi
suatu data pengamatan. Pada penelitian ini akar ciri diperoleh dari matriks ragam
peragam ( ∑ ) dari data persen kurkumin yang sudah dibakukan (distandarisasi
dalam bentuk skor Z).

Tabel 3 Akar ciri dan proporsi kumulatif dari matriks ∑
K Akar ciri Proporsi
1 1674.9074 0.8976
2
100.8004 0.0540
3
75.4779 0.0404
4
10.1649 0.0054
5
1.9528 0.0010
6
1.1650 0.0006
7
0.5760 0.0003
8
0.5672 0.0003
9
0.1852 0.0001
10
0.0622 0.0000
11
0.0559 0.0000
12
0.0350 0.0000
13
0.0198 0.0000

Proporsi
kumulatif
0.8976
0.9516
0.9921
0.9975
0.9986
0.9992
0.9995
0.9998
0.9999
0.9999
1.0000
1.0000
1.0000

Jika penentuan jumlah komponen (k) pada metode AKU dengan
mempertimbangkan nilai akar ciri, maka jumlah komponen yang terpilih
adalah k = 6, karena nilai akar cirinya lebih besar dari satu. Namun untuk
kepentingan penelitian jumlah komponen yang diambil akan disesuaikan
dengan jumlah faktor yang dipilih dari metode GEFA. Koefisien komponen
utama dari beberapa jumlah faktor (k) dipresentasikan dalam grafik seperti
dibawah ini.

Gambar 6 Hasil reduksi dengan metode AKU untuk (a). k=6, (b). k= 10, (c). k=12,
(d). k=14

Grafik koefisien komponen pada Gambar 6 diatas, sangat berbeda dengan
pola grafik persen kurkumin pada Gambar 1. Semakin meningkat jumlah
komponen yang dipilih, maka diperoleh pola grafik koefisien komponen semakin
berbeda dari Gambar 1, hal ini menunjukkan bahwa metode AKU masih kurang
baik memberikan informasi untuk pengelompokan data berdasarkan keragaman
atau karakteristik data.
Model Kalibrasi
Nilai faktor bersama (F) yang berpadanan dengan data pengamatan disebut
skor faktor. Skor faktor dapat digunakan sebagai data yang telah tereduksi untuk
analisis statistika selanjutnya, misalnya untuk tujuan diagnostik (Mattjik &
Sumertajaya 2011). Metode GEFA melalui algoritma GEFALS menemukan skor
faktor atau faktor bersama (F), faktor khusus (U), loading faktor (L) dan ragam
khusus (Ψ) secara bersamaan. Kemudian untuk analisis statistika lanjutan yaitu
pemodelan kalibrasi berganda, skor faktor diregresikan dengan peubah respon y
(nilai konsentrasi senyawa aktif serbuk temulawak). Selanjutnya, hasil R2 dan RAdj
dari regresi masing-masing skor faktor yang diperoleh pada jumlah faktor dari
metode GEFA dan skor AKU dapat dilihat pada tabel.
Tabel 4 Nilai R2 dan RAjd dari regresi skor faktor GEFA dan skor AKU pada
masing-masing jumlah faktor ( k)
GEFA
AKU
Jumlah
No faktor
R2
RAdj
R2
RAdj
(k)
1
2
3
4
5
6
7

4
6
8
10
12
13
14

0.5436
0.6416
0.7363
0.7592
0.8320
0.9512
0.9842

0.4218
0.4762
0.5445
0.4913
0.5440
0.8455
0.9398

0.5432
0.6415
0.7361
0.7589
0.8319
0.9522
0.9840

0.4214
0.4760
0.5442
0.4910
0.5438
0.8485
0.9392

Tabel 4 menunjukkan model regresi yang diperoleh dari data hasil reduksi
GEFA dan AKU sangat berimbang, artinya kebaikan kedua model tersebut pada
jumlah faktor atau komponen yang sama adalah baik, karena menghasilkan nilai
R2 dan RAdj yang sangat mirip. Model regresi dengan peubah bebas merupakan
hasil reduksi GEFA dan AKU disebut model kalibrasi, dipilih jumlah k yang
memberikan nilai R2 dan RAdj terbaik, yaitu k = 14. Kemudian kedua model
kalibrasi tersebut dipresentasikan seperti berikut :
a.

Model kalibrasi dari GEFA
y = 1.030 - 0.549F1 - 0.155F2 - 0.640F3 + 0.424F4 0.050F5 - 0.039F6 +
0.122F7 + 0.483F8 + 0.041F9 + 0.208F10 - 1.049F11 + 1.335F12 +
0.406F13 - 0.560 F14

b.

Model kalibrasi dari AKU
y = 1.031 + 0.001K1 - 0.004 K2 + 0.032 K3 +0.072 K4 + 0.108 K5 +
0.035 K6 + 0.195 K7 - 0.045 K8 - 0.011 K9 + 0.299 K10 + 0.045 K11 +
0.712 K12 + 1.218 K13 + 0.770 K14
Evaluasi Model Kalibrasi

Evaluasi model dilakukan untuk mengetahui tingkat kebaikan model yang
sudah diperoleh melalui suatu metode. Model kalibrasi merupakan model yang
didapatkan dengan menggunakan analisis regresi biasanya yang menjadi perhatian
untuk mengetahui kebaikan model dilihat dari nilai R2 dan RAdj, Kemudian model
kalibrasi juga dievaluasi dengan memperhatikan kedekatan (koefisien korelasi)
peubah respon dengan dugaannya yang diperoleh dari model. Selain itu model
juga di evaluasi dari besaran sisaan (residual) dan kebaikan model jika digunakan
untuk memprediksi.

Gambar 7 Hubungan peubah respon dengan penduga respon
Pada gambar diatas nilai penduga respon (��) model kalibrasi dari GEFA dan
AKU sama-sama menunjukkan kedekatan yang baik dengan peubah respon.
indikasinya bisa dilihat semua titik masing-masing metode mengikut i pola linier
dan saling berhimpitan. Koefisien korelasi antara peubah respon dengan penduga
peubah respon dari model GEFA dan model AKU sama besarnya yaitu 0.992.
Kemudian evaluasi model dilanjutkan dengan membandingkan nilai root
mean square error (RMSE) dengan pertimbangan setiap model memiliki nilai
galat yang paling kecil merupakan model terbaik. Selain itu, membandingkan
model juga dilihat dari kemampuan memprediksi atau menaksir rataan respon
yang tidak digunakan dalam membuat calon model, maksudnya ialah model
diperiksa dengan validitas silang (cross validation) atau dengan memanfaatkan
nilai root mean square error cross validation (RMSECV).
Tabel 5 Nilai RMSE, PRESS dan RMSECV pada masing-masing model
Model Kalibrasi
GEFA
AKU

K
14
14

RMSE
0.0136
0.0136

PRESS
15.994
16.145

RMSECV
0.894
0.898

Jika diperhatikan Tabel 5 diatas, model kalibrasi dari hasil reduksi metode
GEFA dan metode AKU, tidak ada perbedaan pada nilai RMSE, karena selisih
antara masing-masing nilai yang diperoleh model dari kedua metode tersebut sama
dengan nol. Namun pada nilai dugaan sisaan (PRESS) dari metode GEFA lebih
kecil dari nilai dugaan sisaa (PRESS) metode AKU, sehingga hal ini
mengakibatkan nilai RMSECV dari model kalibrasi metode GEFA juga lebih
kecil.
5

SIMPULAN DAN SARAN
Simpulan

Reduksi data kalibrasi dari pengukuran FTIR dengan menggunakan metode
GEFA sudah diperoleh pada jumlah faktor k= 4 dengan persentase 99.9891,
namun untuk mendapatkan model kalibrasi yang baik diambil faktor sebanyak
k=14. Metode GEFA mampu mempertahankan pola grafik seperti data awal, dan
hal ini tidak mampu ditunjukan oleh metode AKU. Model kalibrasi hasil reduksi
metode GEFA diperoleh dengan meregresikan skor faktor atau faktor bersama (F)
dengan peubah respon (y) yaitu nilai konsentrasi senyawa aktif serbuk temulawak.
Kemudian perbandingan model kalibrasi hasil reduksi GEFA dan model kalibrasi
hasil reduksi AKU dengan jumlah hasil reduksi yang sama