Penyusunan paket R untuk pengembangan PAKAR (paket analisis regresi)

RINGKASAN
KAMELIA. Penyusunan Paket R untuk Pengembangan Pakar (Paket Analisis Regresi). Dibimbing
oleh AGUS MOHAMAD SOLEH dan UTAMI DYAH SYAFITRI.
R merupakan perangkat lunak statistika berbasis open source dan berbasis pemrograman,
sehingga tidak semua orang terbiasa untuk menggunakannya. Sejak tahun 2009, Departemen
Statistika Institut Pertanian Bogor melakukan pengembangan paket dalam R dengan ant armuka
user friendly untuk memudahkan penggunaan R sebagai alat analisis statistika. Analisis statistika
yang sudah dikembangkan dalam paket tersebut diantaranya analisis regresi, analisis peubah
ganda, analisis deret waktu, dan analisis perancangan percob aan. Namun paket yang telah
dikembangkan masih memiliki beberapa kekurangan, sehingga penelitian ini dilakukan untuk
menyempurnakan beberapa kekurangan tersebut.
Paket yang disusun dalam penelitian ini merupakan pe ngembangan dari Pakar (Paket Analisis
Regresi) yang telah disusun sebelumnya oleh Melisa (2009). Paket ini diberi nama Pakar 2.0.
Komponen analisis regresi yang ditambahkan dalam Pakar 2.0 meliputi analisis regresi komponen
utama, analisis regresi gulud, analisis regresi logistik biner, analisis r egresi logistik ordinal,
analisis regresi logistik multinomial, dan analisis regresi kuadrat terkecil parsial. Untuk
menjalankan fungsi-fungsinya, Pakar 2.0 membutuhkan paket lain yaitu tcltk, tkrplot, RODBC,
R2HTML, car, nortest, tseries, stats, foreign, MASS, nnet, dan pls. Menu utama pada Pakar 2.0
meliputi menu File, menu Edit, menu Data, menu Statistika, dan menu Bantuan. Hasil pengujian
Pakar 2.0 dengan membandingkan keluaran dari perangkat lunak statistika lain secara umum
sudah menunjukkan hasil yang relatif sama, kecuali pada beberapa kasus uji. Perbedaan pada

beberapa kasus uji tersebut disebabkan adanya perbedaan kategori acuan pada regresi logistik dan
perbedaan nilai desimal hasil iterasi.
Kata kunci : Pakar, regresi komponen utama, regresi gulud, regresi logistik, regresi kuadrat
terkecil parsial.

1

PENDAHULUAN
Latar Belakang
R merupakan perangkat lunak statistika
berbasis
open
source
dan
berbasis
pemrograman, sehingga tidak semua orang
terbiasa untuk menggunakannya. Sejak tahun
2009, Departemen Statistika Institut Pertanian
Bogor melakukan pengembangan paket dal am
R dengan antarmuka user friendly untuk

memudahkan penggunaan R sebagai alat
analisis statistika. Analisis statistika yang
sudah dikembangkan dalam paket tersebut
diantaranya analisis regresi, analisis peubah
ganda, analisis deret waktu, dan analisis
perancangan percobaan. Namun paket yang
telah dikembangkan masih memiliki beberapa
kekurangan, sehingga penelitian ini dilakukan
untuk menyempurnakan beberapa kekurangan
tersebut.
Paket analisis regresi (Pakar) merupakan
bagian dari paket R yang telah dikemba ngkan.
Pakar meliputi perhitungan statistika dasar,
plot pengepasan garis, analisis regresi linier,
dan analisis regresi bertatar (Melisa 2009).
Komponen analisis regresi dan sistem
manajemen data pada Pakar masih terbatas.
Batasan tersebut yaitu hanya sa tu dataset yang
dapat digunakan dalam sistem, impor dan
ekspor data masih terbatas pada file Excel

dengan ekstensi .csv dan .xls, serta
keterbatasan menu untuk memodifikasi data.
Penelitian
ini
dilakukan
untuk
mengembangkan Pakar dengan menambahkan
beberapa
analisis
regresi
dan
menyempurnakan sistem manajemen data.
Paket hasil pengembangan Pakar akan diberi
nama Pakar 2.0.
Tujuan
Tujuan dari penelitian ini adalah
menyusun paket R untuk mengembangkan
paket analisis regresi (Pakar) dengan
menambahkan analisis regresi komponen
utama, analisis regresi gulud, analisis regresi

logistik biner, analisis regresi logistik ordinal,
analisis regresi logistik multinomial, dan
analisis regresi kuadrat terkecil parsial dengan
antarmuka user friendly serta mengatasi
batasan-batasan yang ada pada Pakar.

TINJAUAN PUSTAKA
Pakar 2.0 merupakan suatu sistem dengan
antarmuka user friendly pada lingkungan R.
Menurut Hornik (2010), R merupakan

implementasi sebuah lingkungan komputasi
dan pemrograman bahasa statistika. R disusun
dari bahasa S dan bahasa Scheme oleh Ross
Ihaka dan Robert Gentleman. Paket R
merupakan sebuah ekstensi dari sistem dasar
R yang terdiri atas kode, data, dan
dokumentasi. Paket R dapat diunduh secara
bebas pada http://CRAN.R-Project.org. Untuk
membuat paket R pada lingkungan Windows

dibutuhkan Rtools, LaTeX, dan HTML Help
Workshop sebagai perangkat lunak tambahan.
Komponen
analisis
regresi
yang
ditambahkan dalam Pakar 2.0 antara lain
regresi komponen utama, regresi gulud,
regresi logistik, dan regresi kuadrat terkecil
parsial.
Regresi Komponen Utama (RKU)
Regresi Komponen Utama (RKU)
merupakan implementasi dari Analisis
Komponen Utama (AKU). RKU digunakan
untuk mengatasi masalah multikolinier antar
peubah bebas. Prinsip dari RKU adalah
mentransformasi
peubah-peubah
bebas
menjadi peubah-peubah baru yang saling

ortogonal. Kemudian peubah -peubah baru
tersebut diregresikan dengan peubah bebas.
Transformasi peubah bebas menjadi peubah
baru tersebut adalah dengan AKU.
Komponen
utama
yang
dibentuk
berdasarkan matriks ragam-peragam adalah
sebagai berikut. Misalkan Σ merupakan
matriks ragam-peragam dari vektor x 1,x2,…,xp
dengan pasangan akar ciri dan vektor ciri yang
saling ortonormal (λ 1,e1), (λ2,e2), …, (λ p,ep)
dengan λ 1≥λ2 ≥ … ≥ λp≥0, maka komponen
utama ke-i didefinisikan sebagai berikut
(Jollife 2002):

λ1 merupakan akar ciri terbesar yang
memaksimumkan ragam KU 1 dan e1
merupakan vektor ciri yang berpadanan

dengan λ 1. Urutan KU1, KU2, …, KU p harus
memenuhi persyaratan λ 1 ≥ λ2 ≥ … ≥ λp.
Sementara itu, kontribusi keragaman dari
setiap komponen utama ke -k terhadap
keragaman total adalah:
λ

λ
λ

λ …

λ

Matriks Σ dapat berupa matriks ragam peragam atau matriks korelasi.
Model regresi komponen utama adalah
sebagai berikut:

1


PENDAHULUAN
Latar Belakang
R merupakan perangkat lunak statistika
berbasis
open
source
dan
berbasis
pemrograman, sehingga tidak semua orang
terbiasa untuk menggunakannya. Sejak tahun
2009, Departemen Statistika Institut Pertanian
Bogor melakukan pengembangan paket dal am
R dengan antarmuka user friendly untuk
memudahkan penggunaan R sebagai alat
analisis statistika. Analisis statistika yang
sudah dikembangkan dalam paket tersebut
diantaranya analisis regresi, analisis peubah
ganda, analisis deret waktu, dan analisis
perancangan percobaan. Namun paket yang
telah dikembangkan masih memiliki beberapa

kekurangan, sehingga penelitian ini dilakukan
untuk menyempurnakan beberapa kekurangan
tersebut.
Paket analisis regresi (Pakar) merupakan
bagian dari paket R yang telah dikemba ngkan.
Pakar meliputi perhitungan statistika dasar,
plot pengepasan garis, analisis regresi linier,
dan analisis regresi bertatar (Melisa 2009).
Komponen analisis regresi dan sistem
manajemen data pada Pakar masih terbatas.
Batasan tersebut yaitu hanya sa tu dataset yang
dapat digunakan dalam sistem, impor dan
ekspor data masih terbatas pada file Excel
dengan ekstensi .csv dan .xls, serta
keterbatasan menu untuk memodifikasi data.
Penelitian
ini
dilakukan
untuk
mengembangkan Pakar dengan menambahkan

beberapa
analisis
regresi
dan
menyempurnakan sistem manajemen data.
Paket hasil pengembangan Pakar akan diberi
nama Pakar 2.0.
Tujuan
Tujuan dari penelitian ini adalah
menyusun paket R untuk mengembangkan
paket analisis regresi (Pakar) dengan
menambahkan analisis regresi komponen
utama, analisis regresi gulud, analisis regresi
logistik biner, analisis regresi logistik ordinal,
analisis regresi logistik multinomial, dan
analisis regresi kuadrat terkecil parsial dengan
antarmuka user friendly serta mengatasi
batasan-batasan yang ada pada Pakar.

TINJAUAN PUSTAKA

Pakar 2.0 merupakan suatu sistem dengan
antarmuka user friendly pada lingkungan R.
Menurut Hornik (2010), R merupakan

implementasi sebuah lingkungan komputasi
dan pemrograman bahasa statistika. R disusun
dari bahasa S dan bahasa Scheme oleh Ross
Ihaka dan Robert Gentleman. Paket R
merupakan sebuah ekstensi dari sistem dasar
R yang terdiri atas kode, data, dan
dokumentasi. Paket R dapat diunduh secara
bebas pada http://CRAN.R-Project.org. Untuk
membuat paket R pada lingkungan Windows
dibutuhkan Rtools, LaTeX, dan HTML Help
Workshop sebagai perangkat lunak tambahan.
Komponen
analisis
regresi
yang
ditambahkan dalam Pakar 2.0 antara lain
regresi komponen utama, regresi gulud,
regresi logistik, dan regresi kuadrat terkecil
parsial.
Regresi Komponen Utama (RKU)
Regresi Komponen Utama (RKU)
merupakan implementasi dari Analisis
Komponen Utama (AKU). RKU digunakan
untuk mengatasi masalah multikolinier antar
peubah bebas. Prinsip dari RKU adalah
mentransformasi
peubah-peubah
bebas
menjadi peubah-peubah baru yang saling
ortogonal. Kemudian peubah -peubah baru
tersebut diregresikan dengan peubah bebas.
Transformasi peubah bebas menjadi peubah
baru tersebut adalah dengan AKU.
Komponen
utama
yang
dibentuk
berdasarkan matriks ragam-peragam adalah
sebagai berikut. Misalkan Σ merupakan
matriks ragam-peragam dari vektor x 1,x2,…,xp
dengan pasangan akar ciri dan vektor ciri yang
saling ortonormal (λ 1,e1), (λ2,e2), …, (λ p,ep)
dengan λ 1≥λ2 ≥ … ≥ λp≥0, maka komponen
utama ke-i didefinisikan sebagai berikut
(Jollife 2002):

λ1 merupakan akar ciri terbesar yang
memaksimumkan ragam KU 1 dan e1
merupakan vektor ciri yang berpadanan
dengan λ 1. Urutan KU1, KU2, …, KU p harus
memenuhi persyaratan λ 1 ≥ λ2 ≥ … ≥ λp.
Sementara itu, kontribusi keragaman dari
setiap komponen utama ke -k terhadap
keragaman total adalah:
λ

λ
λ

λ …

λ

Matriks Σ dapat berupa matriks ragam peragam atau matriks korelasi.
Model regresi komponen utama adalah
sebagai berikut:

2

dengan
adalah vektor peubah respons,
adalah vektor koefisien regresi kom ponen utama dari m buah komponen utama,
adalah matriks berukuran (n x m) yang
kolomnya merupakan skor komponen utama,
serta
adalah komponen error model (Jollife
2002).
Regresi Gulud
Regresi gulud juga digunakan untuk
mengatasi masalah multikolinieritas antar
peubah
bebas.
Multikolinieritas
ini
mengakibatkan nilai dugaan parameter model
menjadi tidak stabil. Regresi gulud didasarkan
pada konsep bahwa penduga berbias namun
memiliki ragam yang lebih kecil akan lebih
disukai.
Menurut Myers (1990), prosedur regresi
gulud adalah dengan menambahkan sebuah
konstanta k yang berada dalam selang [0,1] ke
dalam matriks ( X’X) pada pendugaan
parameter regresi sehingga diperoleh:

adalah penduga berbias bagi
namun
memiliki ragam yang lebih kecil daripada .
Ada beberapa cara untuk menentukan nilai k
yang optimum. Salah satunya adalah dengan
menggunakan metode ridge trace. Metode ini
merupakan penelusuran nilai k yang optimum
dengan mencoba berbagai macam nilai k dan
melihat pengaruhnya pada nilai
yang
didapatkan. Plot antara
dengan berbagai
nilai k dapat digunakan untuk melihat metode
tersebut secara eksploratif.

adalah peluang terjadinya y = 1. Model
regresi logistik dengan E( Y= 1|x) sebagai
π( x) adalah:
exp
1

exp

Fungsi hubung yang sesuai untuk model
regresi logistik biner adalah fungsi logit.
Transformasi logit sebagai fungsi dari π( x)
adalah (Hosmer dan Lemeshow 2000):
ln

1

Regresi Logistik Ordinal
Model regresi logistik ordinal digunakan
untuk menganalisis peubah respons berskala
ordinal dengan lebih dari dua kategori.
Menurut Hosmer dan Lemeshow (2000), salah
satu cara yang dapat digunakan untuk
membentuk model dengan respons kategorik
yang berskala ordinal adalah dengan
membentuk fungsi logit dari peluang
kumulatif :
|

dengan k bernilai 0, 1, 2, …, K -1. K adalah
banyaknya nilai respons yang
mungkin
terjadi, dan
adalah peluang kumulatif
kategori k. Fungsi logit dari peluang kumulatif
adalah sebagai berikut (Hosmer dan
Lemeshow 2000):
|
|

Regresi Logistik
Menurut Hosmer dan Lemeshow (2000)
regresi logistik adalah metode analisis
statistika yang mendeskripsikan hubungan
antara peubah respons yang memiliki dua
kategori atau lebih dengan satu atau lebih
peubah bebas berskala kategori atau kontinu.
Pendugaan parameter yang digunakan dalam
regresi logistik adalah metode kemungkinan
maksimum (maximum likelihood). Model
regresi logistik terdiri atas regresi logistik
dengan respons biner, ordinal, dan
multinomial.
Regresi Logistik Biner
Model regresi logistik biner merupak an
model matematika yang dapat digunakan
untuk memodelkan hubungan antara peubah
bebas X dengan peubah respons Y yang
bersifat biner. Peubah respons Y mengikuti
sebaran Bernoulli dengan y = 0 atau 1 dan

Regresi Logistik Multinomial
Model regresi logistik multinomial
digunakan untuk menganalisis peubah respons
berskala nominal dengan lebih dari dua
kategori. Misalkan πj ( x) = P( Y= j|x) dimana
j=0,1,2,…,K-1 adalah peubah nominal yang
digunakan dalam model. Berikut adalah
persamaan umum yang digunakan untuk
menyatakan peluang bersyarat bagi setiap
kategori (Hosmer dan Lemeshow 2000):
exp
|



exp

Misalkan ada tiga kategori maka terdapat tiga
fungsi peluang bersyarat. Fungsi penghubung
logit untuk peluang bersyar at tersebut adalah:

3

|
0|

Pengujian Parameter Regresi Logistik
Pengujian peranan peubah bebas dalam
model secara bersama-sama adalah dengan
uji rasio kemungkinan (likelihood ratio test)
menggunakan statistik uji-G. Rumus umum
untuk statistik uji-G adalah:
2

dimana L0 adalah fungsi kemungkinan tanpa
peubah bebas dan L 1 adalah fungsi
kemungkinan dengan peubah bebas. Hipotesis
yang digunakan adalah sebagai berikut:
H0 : β 1 = β 2 = … = β p = 0
H1 : minimal ada satu β j ≠ 0
dimana j = 1,2,...,p. Statistik uji-G mengikuti
sebaran χ 2 dengan derajat bebas p. Hipotesis
nol ditolak jika G > χ 2 p(α) .
Pengujian peubah bebas secara parsial
dilakukan menggunakan statistik uji Wald
dengan rumus umum:

Hipotesis yang digunakan dalam uji Wald:
H0 : β j = 0
H1 : βj ≠ 0 dimana j = 1,2,...,p.
Statistik uji Wald mengikuti sebaran normal
baku. H 0 ditolak jika |W| > Z α/2 (Hosmer dan
Lemeshow 2000).
Rasio Odds
Dalam kajian hubungan antar peubah
kategorik dikenal adanya ukuran asosiasi atau
ukuran keeratan hubungan antara peubah
kategorik. Rasio odds merupakan salah satu
ukuran asosiasi yang dapat diperoleh melalui
analisis regresi logistik. Odds sendiri diartika n
sebagai rasio peluang kejadian sukses dengan
kejadian tidak sukses dari peubah respons.
Rasio odds didefinisikan sebagai exp β
dengan selang kepercayaan (Hosmer dan
Lemeshow 2000):

Selain untuk melihat kebaikan model, statistik
AIC juga digunakan untuk pemilihan peubah
bebas (stepwise, forward, dan backward) yang
berbasis pada fungsi kemungkinan. Nilai AIC
yang semakin kecil menandakan model yang
semakin baik.
Sisaan
Dalam regresi linier, sisaan didefinisikan
sebagai beda antara respons dan dugaan
respons
. Dalam regresi logistik,
terdapat beberapa cara untuk menghitung
sisaan, diantaranya (Hosmer dan Lemeshow
2000):
1. Sisaan Pearson
Sisaan Pearson didefinisikan sebagai:
,

1

dimana adalah peluang kejadian sukses.
2. Sisaan Deviance
Sisaan deviance didefinisikan sebagai:
,

2

1

1
1

dimana tanda + atau – digunakan untuk
memastikan bahwa sisaan deviance
memiliki tanda yang sama dengan
.
Regresi Kuadrat Terkecil Parsial
Metode regresi kuadrat terkecil parsial
(RKTP) adalah suatu metode untuk
melakukan pendugaan model ketika banyak
terdapat peubah bebas dalam model dan
peubah-peubah tersebut saling berkorelasi.
Untuk meregresikan sekumpulan peubah Y
dengan peubah X 1, X2, …, Xp, metode PLSR
melibatkan peubah bebas baru yang berperan
seperti X. Peubah ini disebut peubah laten
dimana setiap komponennya merupakan
kombinasi linier dari X 1, X2, .., Xp. Peubah
laten ini kemudian dinotasikan sebagai T.
Metode RKTP menggambarkan hubungan
eksternal dan hubungan internal antar peubah
X dan peubah Y. Hubungan eksternal tersebut
ditulis dengan persamaan berikut (Naes et al.
2002):


Akaike Information Criterion (AIC)
Ravishanker dan Dey (2002) menyatakan
bahwa salah cara untuk melihat kebaikan
model regresi logistik adalah menggunakan
statistik Akaike Information Criterion (AIC):
2

2



T adalah adalah matriks skor komponen
dengan kolom-kolom yang berupa vektor
laten. Matriks P berisi vektor muatan (loading
vector) dan q adalah vektor muatan. E dan f
masing-masing adalah matriks dan vektor

4

sisaan. Matriks T dihitung sebagai kombinasi
linier dari X dengan W yang saling ortogonal
sehingga diperoleh:
dimana W adalah matriks dengan kolom kolom yang berupa vektor pembobot.
Validasi Silang
Validasi
silang
digunakan
untuk
menentukan jumlah komponen optimum pada
analisis regresi komponen utama dan analisis
regresi kuadrat terkecil parsial. Pemilihan
jumlah komponen yang optimum ini
diperlukan
untuk
mengatasi
masa lah
overfitting. Overfitting disebabkan oleh
jumlah peubah bebas yang lebih banyak
daripada amatan atau karena peubah bebas
yang saling berkorelasi. Akibat dari
overfitting ini adalah model yang dihasilkan
sudah sesuai menggambarkan keadaan data
contoh namun kurang baik untuk memprediksi
data baru.
Menurut Draper dan Smith (1992) terdapat
dua pendekatan validasi silang, diantaranya
buang satu amatan dan buang sekelompok
amatan. Validasi silang ini menghasilkan
statistik-statistik untuk melihat kemampuan
model dalam memprediksi diantaranya
(Myers 1990):
1. PRESS (Prediction Sum of Square)


,

dengan , adalah nilai dugaan respons
tanpa amatan yang dibuang. Model yang
baik adalah model dengan nilai PRESS
yan relatif kecil.
2.
(R2 Prediction)
1



merefleksikan kemampuan model
dalam memprediksi amatan baru. Nilai
yang besar menggambarkan bahwa
model tersebut mampu melakukan prediksi
dengan baik.
3. RMSECV (Root Mean Square Error of
Cross Validation)
RMSECV adalah kuadrat tengah sisaan
berdasarkan hasil validasi silang. Semakin
kecil nilai RMSECV maka model tersebut
akan semakin baik.


,

METODOLOGI
Pembuatan paket R ini mengikuti kaidah
rekayasa perangkat lunak dengan model air
terjun, berikut tahapannya:
1. Analisis dan identifikasi kebutuhan sistem
Tahapan ini dilakukan dengan menggali
kebutuhan sistem dengan memperhatikan
kebutuhan pengguna yang diadopsi dari
perangkat lunak yang sudah ada seperti
SPSS, Minitab, dan SAS.
2. Analisis perancangan sistem
Tahapan ini dilakukan dengan merancang
sistem yang sudah direncanakan melalui
diagram aliran data dan antarmuka.
3. Implementasi dan pengujian unit
Rancangan yang sudah dibangun pada
tahap
sebelumnya
kemudian
diimplementasikan dalam bahasa S
menggunakan perangkat lunak R dan
paket-paket
R
yang
berhubungan.
Pembuatan antarmuka memanfaatkan
paket R yang bernama tcltk.

Analisis dan
identifikasi kebutuhan
Analisis perancangan
sistem
Implementasi dan
pengujian unit
Integrasi dan
pengujian sistem
Operasi dan
pemeliharaan
Gambar 1 Tahapan penyusunan paket R dengan model air terjun.

4

sisaan. Matriks T dihitung sebagai kombinasi
linier dari X dengan W yang saling ortogonal
sehingga diperoleh:
dimana W adalah matriks dengan kolom kolom yang berupa vektor pembobot.
Validasi Silang
Validasi
silang
digunakan
untuk
menentukan jumlah komponen optimum pada
analisis regresi komponen utama dan analisis
regresi kuadrat terkecil parsial. Pemilihan
jumlah komponen yang optimum ini
diperlukan
untuk
mengatasi
masa lah
overfitting. Overfitting disebabkan oleh
jumlah peubah bebas yang lebih banyak
daripada amatan atau karena peubah bebas
yang saling berkorelasi. Akibat dari
overfitting ini adalah model yang dihasilkan
sudah sesuai menggambarkan keadaan data
contoh namun kurang baik untuk memprediksi
data baru.
Menurut Draper dan Smith (1992) terdapat
dua pendekatan validasi silang, diantaranya
buang satu amatan dan buang sekelompok
amatan. Validasi silang ini menghasilkan
statistik-statistik untuk melihat kemampuan
model dalam memprediksi diantaranya
(Myers 1990):
1. PRESS (Prediction Sum of Square)


,

dengan , adalah nilai dugaan respons
tanpa amatan yang dibuang. Model yang
baik adalah model dengan nilai PRESS
yan relatif kecil.
2.
(R2 Prediction)
1



merefleksikan kemampuan model
dalam memprediksi amatan baru. Nilai
yang besar menggambarkan bahwa
model tersebut mampu melakukan prediksi
dengan baik.
3. RMSECV (Root Mean Square Error of
Cross Validation)
RMSECV adalah kuadrat tengah sisaan
berdasarkan hasil validasi silang. Semakin
kecil nilai RMSECV maka model tersebut
akan semakin baik.


,

METODOLOGI
Pembuatan paket R ini mengikuti kaidah
rekayasa perangkat lunak dengan model air
terjun, berikut tahapannya:
1. Analisis dan identifikasi kebutuhan sistem
Tahapan ini dilakukan dengan menggali
kebutuhan sistem dengan memperhatikan
kebutuhan pengguna yang diadopsi dari
perangkat lunak yang sudah ada seperti
SPSS, Minitab, dan SAS.
2. Analisis perancangan sistem
Tahapan ini dilakukan dengan merancang
sistem yang sudah direncanakan melalui
diagram aliran data dan antarmuka.
3. Implementasi dan pengujian unit
Rancangan yang sudah dibangun pada
tahap
sebelumnya
kemudian
diimplementasikan dalam bahasa S
menggunakan perangkat lunak R dan
paket-paket
R
yang
berhubungan.
Pembuatan antarmuka memanfaatkan
paket R yang bernama tcltk.

Analisis dan
identifikasi kebutuhan
Analisis perancangan
sistem
Implementasi dan
pengujian unit
Integrasi dan
pengujian sistem
Operasi dan
pemeliharaan
Gambar 1 Tahapan penyusunan paket R dengan model air terjun.

6

Gambar 3 Diagram aliran data level 1.
menjadi input untuk pro
roses 2. Proses 2
dapat didekomposisi men
enjadi Proses 2.1
Pilih Dataset Aktif, Proses
P
2.2 Edit
Dataset Aktif, Prosess 2.3 Kalkulator,
Proses 2.4 Bangkitkan Bilangan
Bila
Acak, dan
Proses 2.5 Pilih Peubah.. Setelah
Se
pengguna
memilih peubah, maka dataset
d
telah siap
digunakan
untuk
an
analisis.
Proses
manajemen data ini ditampilkan
dita
pada
Lampiran 2. Data yang telah
te
diolah dalam
sistem kemudian dapatt disimpan
d
melalui
dua proses, yaitu Prose
oses 10.1 Ekspor
Dataset dan Proses 10.2
.2 Simpan Dataset
(Lampiran 3).
 Aliran data pada Pro
roses 5 Analisis
Regresi dijelaskan oleh
G
h Gambar
4. Proses
6.2
Analisis
Reg
egresi
Logistik
didekomposisi lagi menj
enjadi Proses 6.2.1
Regresi Logistik Bine
iner, Proses 6.2.2
Regresi Logistik Ordin
dinal, dan Proses
6.2.3 Regresi Logisti
istik Multinomial
(Lampiran 4). Kemudian
ian Proses 6.2.1 dan
Proses 6.2.2 akan masuk
uk ke Proses 6.2.4
Fungsi Penghubung. Proses
P
6.2.4 ini
didekomposisi kembali
ali menjadi tiga
fungsi penghubung, yaitu
ya
logit, probit
dan complementary
log-log yang
disajikan dalam Lamp
piran 5. Setelah
menentukan fungsi penghubung,
pe
data
yang masuk dapat langsung
lan
dianalisis
baik melalui prosedurr pemilihan
p
model
regresi terbaik (stepwis
ise, forward, dan

(Lampiran 6).
backward) ataupun tidak (L
Nilai sisaan, nilai peluang rrespons, dan
respons hasil
nilai dugaan kategori res
analisis regresi logistikk kemudian
t. Proses 5.7
disimpan dalam dataset.
erkecil Parsial
Analisis Regresi Kuadrat Ter
didekomposisi kembali berdasarkan
sa digunakan,
empat algoritma yang biasa
wide kernel,
yaitu algoritma kernel, w
SIMPLS dan orthogonal sscores atau
LS. Proses ini
biasa dikenal dengan NIPALS.
dijelaskan pada Lampirann 7. Analisis
regresi komponen utamaa melibatkan
keluaran dari analisis kompponen utama
yang merupakan bagian dari proses
analisis peubah ganda. Nilaii aakar ciri dan
vektor ciri yang dihasilkann dari analisis
unakan dalam
komponen utama akan digun
uk melakukan
analisis regresi linier untuk
onen utama.
analisis regresi kompone
pat langsung
Selanjutnya pengguna dapa
egresi kuadrat
mencetak hasil analisis regr
nalisis regresi
terkecil parsial dan hasil ana
lakukan Proses
komponen utama atau melak
da dua jenis
6.6 Validasi Silang. Ada
unakan, yaitu
validasi silang yang digun
ang lebih dari
buang satu amatan dan buan
Nilai dugaan
satu amatan (Lampiran 8).. N
respons, sisaan, skor X dann skor Y dari
analisis regresi komponenn utama dan
terkecil parsial
analisis regresi kuadrat terk
tersimpan dalam dataset.

7

Gam
ambar 4 Diagram aliran data level 2 proses 1.
Implementasii Sistem
Si
Implementasi
sistem
menggunakan
program R.2.11.1 dan beberapa paket
tambahan lainnya untuk men
enjalankan fungsi fungsi pada Pakar 2.0. Tabe
bel 1 menunjukkan
paket-paket
yang
dipe
iperlukan
untuk
menjalankan Pakar 2.0. Pake
aket standar adalah
paket yang sudah tersedia dalam
da
program R.
Sedangkan paket tambahan adalah
a
paket yang
harus diunduh melaluii http://CRAN.RProject.org.
Tabel 1. Paket-paket yang dibutuhkan
d
untuk
menjalankan Pakarr 2.0
2
No.
1.
2.
3.
4.
5.
6.
7.

Paket standar
tcltk
stats
foreign
MASS
nnet

Paket
P
tambahan
tkrplot
tk
RODBC
R
R2HTML
R
car
ca
nortest
n
tseries
ts
pls
p

Pakar 2.0 tersusun oleh
h pilihan menu di
bagian atas dan jendela hasil
sil di bagian bawah
menu untuk menampilkan keluaran.
ke
Pakar 2.0
terdiri atas lima menu utamaa yaitu Menu File,
Menu Edit, Menu Data, Men
enu Statistika, dan
Menu Bantuan. Lingkungan
n utama
u
dan skema
menu Pakar 2.0 disajikan pad
ada Lampiran 9.

Menu File
lapan submenu
Menu File terdiri atas delapa
yaitu:
1. Buat Dataset Baru
kan
untuk
Submenu
ini
digunaka
memasukkan data ke dalam ssistem secara
langsung. Sebelum membuatt ddataset baru,
pengguna harus memberii nnama untuk
dataset tersebut.
2. Memuat Dataset
ntuk memuat
Submenu ini digunakan untu
dataset yang telah disimpan ddalam file R
.rdata. Namun
dengan ekstensi .rda atau .rd
unakan untuk
fungsi ini tidak dapat digun
pan pada paket
memuat dataset yang tersimpan
R tambahan.
3. Impor Dataset
Submenu ini terdiri atas limaa fungsi yaitu
”, “Ms. Excel”
“SPSS”, “.csv (,)”, “.csv (;)”,
fungsi tersebut
dan “Ms. Access”. Fungsi-fun
na
untuk
memungkinkan
pengguna
SPSS (.sav dan
mengimpor dataset dari file SP
dan .csv), dan
.por), Ms. Excel (.xls, .xlsx, da
b). Impor data
Ms. Access (.mdb dan .accdb)
at digunakan
dengan ekstensi .csv dapat
gan pembatas
untuk mengimpor file denga
ngimpor data,
“,” dan “;”. Sebelum meng
pengguna harus memberii nnama untuk
ata tersebut.
dataset yang akan diimpor data

8

4. Ekspor Dataset
Submenu ini terdiri atas empat fungsi yaitu
“SPSS”, “.csv (,)”, “.csv (;)”, dan “Ms.
Excel 2003”. Fungsi-fungsi tersebut
memungkinkan
pengguna
untuk
mengekspor dataset aktif ke file SPSS
(.sps) dan Ms. Excel 2003 (.xls dan .csv).
Ekspor data dengan ekstensi .csv dapat
digunakan untuk mengekspor file dengan
pembatas “,” dan “;”.
5. Simpan Dataset
Submenu simpan dataset digunakan untuk
menyimpan dataset hasil input langsung
atau dataset hasil pengolahan data dengan
Pakar 2.0. Dataset tersebut akan tersimpan
dengan ekstensi .rda atau .rdata.
6. Simpan Hasil
Submenu ini digunakan untuk menyimpan
keluaran yang terdapat pada jendela hasil
dalam bentuk teks dengan ekstensi .txt.
Selain itu hasil juga dapat disimpan
dengan ekstensi .doc.
7. Hasil HTML
Submenu
ini
digunakan
untuk
menampilkan keluaran yang dicetak ke
jendela hasil dalam format HTML. Fungsi
ini aktif jika tombol cek “Tampilkan
Output HTML” dan direktori folder terisi.
Jika fungsi ini aktif maka setiap pengguna
mencetak keluaran ke jendela hasil,
keluaran tersebut juga akan ditampilkan
oleh browser yang terdapat pada komputer
pengguna.
8. Keluar
Submenu ini digunakan untuk keluar dari
Pakar 2.0.
Menu Edit
Menu edit terdiri atas tujuh submenu untuk
melakukan edit pada jendela hasil. Ketujuh
submenu tersebut antara lain :
1. Cut
Submenu
ini
digunakan
untuk
mengirimkan objek yang terpilih pada
jendela hasil ke clipboard sistem komputer
dan menghapus objek yang terpilih pada
jendela hasil.
2. Salin
Submenu
ini
digunakan
untuk
mengirimkan objek yang terpilih pada
jendela hasil ke clipboard sistem
komputer. Fungsi ini biasanya digunakan
untuk menyalin objek yang terpilih.
3. Paste
Submenu
ini
digunakan
untuk
menampilkan objek yang ada pada
clipboard sistem komputer ke jendela

hasil. Fungsi ini biasanya digunakan untuk
menampilkan objek yang sudah disalin.
4. Hapus
Submenu ini digunakan untuk menghapus
objek yang terpilih pada jendela hasil.
5. Undo
Submenu
ini
digunakan
untuk
mengembalikan tampilan jendela hasil ke
tampilan sebelum tampilan terakhir.
6. Pilih Semua
Submenu ini digunakan untuk memilih
semua objek yang ada pada jendela hasil.
7. Bersihkan Jendela
Submenu ini digunakan untuk menghapus
semua objek yang ada pada jendela hasil.
Untuk menggunakan fungsi pada menu edit,
pengguna harus mengaktifkan kursor pada
jendela hasil. Fungsi-fungsi dalam menu ini
mempunyai kegunaan yang sama dengan
fungsi klik kanan pada jendela hasil.
Menu Data
Menu data merupakan menu untuk
memodifikasi, memilih, melihat, mengedit,
dan mencetak dataset. Menu ini dapat
dijalankan jika terdapat dataset aktif pada
program. Submenu dalam menu data antara
lain:
1. Pilih Dataset Aktif
Submenu pilih dataset aktif digunakan
untuk memilih dataset mana yang akan
digunakan,
sehingga
memungkinkan
pengguna untuk memiliki lebih dari satu
dataset dalam sistem.
2. Lihat Dataset Aktif
Submenu ini digunakan untuk melihat
dataset aktif.
3. Edit Dataset Aktif
Submenu ini digunakan untuk mengedit
data atau menambahkan data baru pada
dataset aktif.
4. Kalkulator
Submenu
kalkulator
terdiri
atas
perhitungan aritmatika standar (+, -, *, /,
^), operator perbandingan (>, =,