Penyusunan paket R untuk pengembangan paket analisis multivariat (AMV)
RINGKASAN
DEFRI RAMADHAN ISMANA . Penyusunan Paket R untuk Pengembangan Paket Analisis
Multivariat (AMV). Dibimbing oleh AGUS M. SOLEH dan UTAMI DYAH SYAFITRI .
Pengembangan paket R untuk analisis statistika yang memiliki antarmuka user friendly telah
dilakukan sejak tahun 2009 pada Departemen Statistika Institut Pertanian Bogor. Salah satu paket
R yang dikembangkan ialah Paket AMV (Analisis Multivariat), yaitu paket untuk melakukan
prosedur analisis peubah ganda (Miranti 2010). Analisis peubah ganda pada AMV hanya
mencakup analisis komponen utama, analisis gerombol hierarki, analisis gerombol k -means,
analisis faktor, dan analisis biplot. Paket AMV masih memiliki beberapa kekurangan, untuk itu
perlu dilakukan perbaikan.
Penelitian ini dilakukan untuk memperbaiki paket AMV sebelumnya dengan menambahkan
beberapa analisis peubah ganda serta mengatasi batasan-batasan yang ada pada paket AMV. Hasil
perbaikan paket AMV dinamakan paket AMV 2.0. Paket AMV 2.0 menambahkan fungsi analisis
korelasi kanonik, analisis diskriminan, analisis diskriminan kanonik, analisis korespondensi
sederhana, dan analisis korespondensi berganda serta mengatasi batasan -batasan pada sistem
manajemen data yang terdapat pada AMV sebelumnya. Selain itu, AMV 2.0 menambahkan fungsi
untuk membangkitkan bilangan acak, dan fungsi untuk menamp ilkan output dalam format HTML.
Pengujian paket AMV 2.0 dilakukan dengan menggunakan metode blackbox yang
membandingkan keluaran AMV 2.0 dengan perangkat lunak SAS, SPSS, dan Minitab . Hasil
pengujian menunjukkan bahwa AMV 2.0 mampu menghasilkan output yang sesuai untuk analisisanalisis peubah ganda yang dibuat.
Kata kunci: paket AMV, paket AMV 2.0, analisis peubah ganda
PENYUSUNAN PAKET R UNTUK PEN GEMBANGAN PAKET
ANALISIS MULTIVARIAT (AMV)
DEFRI RAMADHAN ISMANA
Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Statistika pada
Departemen Statistika
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
2011
Judul :
Nama :
NIM :
Penyusunan Paket R untuk Pen gembangan Paket Analisis Multivariat
(AMV)
Defri Ramadhan Ismana
G14062952
Menyetujui,
Pembimbing I
Pembimbing II
Agus M. Soleh, S.Si, MT
NIP. 197503151999031004
Utami Dyah Syafitri, M.Si
NIP. 197709172005012001
Mengetahui,
Ketua Departemen Statistika
Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor
Dr. Ir. Hari Wijayanto
NIP. 196504211990021001
Tanggal Lulus :
KATA PENGANTAR
Segala puji dan syukur dipanjatkan kehadirat Allah SWT atas segala rahmat dan karunia -Nya
sehingga penulis dapat menyelesaikan karya ilmiah ini. Shalawat serta salam semoga sela lu
tercurahkan kepada Rasulullah SAW, keluarga, sahabat dan umatnya hingga akhir zaman. Karya
ilmiah ini berjudul ”Penyusunan Paket R untuk Pengembangan Paket Analisis Multivariat
(AMV)”.
Banyak ilmu, pelajaran, dan masukan yang penulis dapatkan dan rasakan selama proses
penyusunan karya ilmiah ini, sehingga pada kesempatan kali ini penulis ingin mengucapkan terima
kasih kepada:
1. Bapak Agus M. Soleh, S.Si, MT dan Ibu Utami Dyah Syafitri, M.Si selaku dosen
pembimbing.
2. Bapak Prof. Dr. Ir. Aunuddin selaku penguji luar atas semua sarannya.
3. Keluarga yang sangat penulis sayangi, terima kasih atas segala doa, dukungan, cinta , dan
kasih sayang yang telah diberikan selama ini.
4. Kamelia dan M. Mufti Mubarak atas bantuan, dukungan, serta kebersamaannya.
5. Bapak Harianto Tanudjaja, Rahma Anisa, Tri Miranti, Imam Apriyanto, Dea R. Putri, Anita
Kumala Sari, Tri Wahyu S., Lemma F. Boer, Tendi, Retno atas saran, bantuan, serta
dukungannya.
Akhir kata, penulis meminta maaf apabila dalam proses penyusunan karya ilmiah ini terdapat
kesalahan-kesalahan yang dilakukan oleh penulis . Semoga karya ilmiah ini dapat bermanfaat bagi
yang memerlukannya.
Bogor, Februari 2011
Defri Ramadhan Ismana
RIWAYAT HIDUP
Penulis dilahirkan di kota Ciamis pada tanggal 4 Mei 1988 sebagai anak kedua dari pasangan
Agus Sudjati dan M. Suarjethi. Pendidikan penulis berawal dari Sekolah Dasar Negeri Padasuka 2
Bandung pada tahun 1994, dan melanjutkan pendidikannya ke SLTP Negeri 16 Bandung pada
tahun 2000. Pada tahun 2003 penulis melanjutkan pendidikan di SMA Negeri 1 4 Bandung, dan
lulus pada tahun 2006. Pada tahun yang sama penulis diterima sebagai mahasiswa di Institut
Pertanian Bogor melalui jalur Seleksi Penerimaan Mahasiswa Baru ( SPMB). Pada tahun kedua di
IPB, penulis memilih program studi Statistika sebagai mayor, serta memilih Matematika Keuangan
dan Aktuaria sebagai minor pada tahun berikutnya.
Selama masa perkuliahan, penulis aktif dalam kegiatan Himpunan Keprofesian Gamma Sigma
Beta (GSB) sebagai Kepala Departemen Database and Computational pada tahun 2008/2009.
Penulis juga aktif mengikuti kepanitiaan acara yang menjadi Program Kerja GSB, antara lain
Statistika Ria, LJPS, WCS, dan SAS.
Pada tahun ajaran 2008/2009 penulis berkesempatan menjadi asisten praktikum untuk mata
kuliah Komputasi Statistika di program Sarjana Departemen Statistika IPB dan program Ekstensi
Ilmu Komputer IPB. Penulis mengikuti kegiatan praktik lapang di PT. Ganesha Cipta Informatika
pada bulan Februari 2010 - April 2010.
DAFTAR ISI
Halaman
DAFTAR TABEL ..........................................................................................................................viii
DAFTAR GAMBAR .....................................................................................................................viii
DAFTAR LAMPIRAN ..................................................................................................................viii
PENDAHULUAN............................................................................................................................. 1
Latar Belakang .............................................................................................................................. 1
Tujuan ........................................................................................................................................... 1
TINJAUAN PUSTAKA .................................................................................................................... 1
Analisis Korelasi Kanonik ............................................................................................................ 1
Analisis Diskriminan .................................................................................................................... 2
Analisis Diskriminan Kanonik ......................................................................................................3
Analisis Korespondensi ................................................................................................................ 3
Pembangkitan Bilangan Acak .......................................................................................................4
Sebaran Binomial ..................................................................................................................... 4
Sebaran Seragam ...................................................................................................................... 4
Sebaran Normal ........................................................................................................................ 4
METODOLOGI ................................................................................................................................ 4
HASIL DAN PEMBAHASAN .........................................................................................................5
Kebutuhan Sistem ......................................................................................................................... 5
Analisis Perancangan Sistem ........................................................................................................6
Implementasi Sistem ..................................................................................................................... 7
Menu File .................................................................................................................................7
Menu Edit .................................................................................................................................8
Menu Data ................................................................................................................................ 8
Menu Statistika ......................................................................................................................... 8
Menu Bantuan ........................................................................................................................ 10
Pengujian ....................................................................................................................................10
Batasan dan Pemasangan Sistem ................................................................................................ 11
KESIMPULAN DAN SARAN ....................................................................................................... 11
Kesimpulan .................................................................................................................................11
Saran ........................................................................................................................................... 12
DAFTAR PUSTAKA ..................................................................................................................... 12
LAMPIRAN ....................................................................................................................................13
DAFTAR TABEL
1.
2.
Paket-paket yang digunakan dalam implementasi sistem AMV 2.0 .........................................7
Perbandingan output paket AMV 2.0 dengan output SAS, Minitab, dan SPSS menggunakan
metode blackbox ..................................................................................................................... 11
DAFTAR GAMBAR
1.
2.
3.
Halaman
Tahapan pengembangan paket AMV 2.0 .................................................................................. 5
Diagram aliran data level 0 .......................................................................................................6
Diagram aliran data level 1 .......................................................................................................6
DAFTAR LAMPIRAN
Halaman
Diagram Aliran Data Level 2 Proses Input Data (1) ............................................................... 14
Diagram Aliran Data Level 2 Proses Manajemen Data (2) .................................................... 14
Diagram Aliran Data Level 2 Proses Analisis Peubah Ganda (5) ........................................... 15
Diagram Aliran Data Level 3 Proses Analisis Korelasi Kanonik (5.8) ...................................15
Diagram Aliran Data Level 3 Proses Analisis Diskriminan (5.9) ........................................... 16
Diagram Aliran Data Level 3 Proses Analisis Diskriminan Kanonik (5.10) .......................... 16
Diagram Aliran Data Level 3 Proses Analisis Korespondensi Sederhana (5.11) ................... 17
Diagram Aliran Data Level 3 Proses Analisis Korespondensi Berganda (5.12)..................... 17
Skema Menu File .................................................................................................................... 18
Skema Menu Edit ................................................................................................................... 18
Skema Menu Data................................................................................................................... 18
Skema Menu Statistika ........................................................................................................... 19
Skema Menu Bantuan ............................................................................................................. 19
Lingkungan Utama Paket AMV 2.0 ....................................................................................... 20
Kotak Dialog Analisis Korelasi Kanonik ............................................................................... 21
Kotak Dialog Analisis Diskriminan ........................................................................................ 22
Kotak Dialog Analisis Diskriminan Kanonik ......................................................................... 23
Kotak Dialog Analisis Korespondensi Sederhana ..................................................................24
Kotak Dialog Analisis Korespondensi Berganda ....................................................................26
Perbandingan Output Analisis Korelasi Kanonik AMV 2.0 dengan Perangkat Lunak
Lainnya ...................................................................................................................................27
21. Perbandingan Output Analisis Diskriminan Kuadratik AMV 2.0 dengan Perangkat Lunak
Lainnya ...................................................................................................................................27
22. Perbandingan Output Analisis Diskriminan Kanonik AMV 2.0 dengan Perangkat Lunak
Lainnya ...................................................................................................................................28
23. Perbandingan Output Analisis Korespondensi Sederhana AMV 2.0 dengan Perangkat Lunak
Lainnya ...................................................................................................................................28
24. Perbandingan Output Analisis Korespondensi Berganda AMV 2.0 dengan Perangkat Lunak
Lainnya ...................................................................................................................................29
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
1
PENDAHULUAN
Latar Belakang
Statistika merupakan ilmu yang berkaitan
erat dengan komputasi. Analisis statistika
semakin berkembang sejalan dengan majunya
dunia komputasi. Berkembangnya analisis
statistika tentu saja diikuti oleh perkembangan
perangkat lunak statistika. Saat ini banyak
perangkat lunak statistika yang dapat
digunakan dengan mudah oleh praktisi. Akan
tetapi harga perangkat lunak tersebut sangat
tinggi dibandingkan daya beli masyarakat
Indonesia
pada
umumnya,
sehingga
menyebabkan
banyaknya
penggunaan
perangkat lunak untuk analisis statistika yang
dilakukan secara ilegal (pembajakan) di
Indonesia.
Tingkat pembajakan perangkat lunak dapat
dikurangi dengan memanfaatkan perangkat
lunak yang dapat dipakai dan dikembangkan
secara bebas (open source). Salah satu
perangkat lunak statistika yang dapat dip akai
dan dikembangkan secara bebas ialah R.
Penggunaan R untuk analisis statistika di
Indonesia masih sangat kurang karena
perangkat ini tidak mudah digunakan
khususnya bagi peminat statistika yang
nonstatistisi dan nonprogramer. Oleh karena
itu, diperlukan pembuatan paket R dengan
antarmuka
user
friendly
sehingga
memudahkan pengguna nonstatistisi dan
nonprogramer untuk melakukan analisis
statistika.
Sejak tahun 2009, Departemen Statistika
Institut
Pertanian
Bogor
mulai
mengembangkan paket R untuk analisis
statistika yang memiliki tampilan antarmuka
user friendly. Salah satu paket R yang
dikembangkan ialah Paket AMV (Analisis
Multivariat), yaitu paket untuk melakukan
prosedur analisis peubah ganda. Analisis
peubah ganda pada AMV hanya mencakup
analisis komponen utama, analisis gerombol
hierarki, analisis gerombol k -means, analisis
faktor, dan analisis biplot (Miranti 2010).
Selain itu, AMV juga memiliki fungsi untuk
melakukan uji normal ganda. Paket AMV
memiliki beberapa kekurangan, yaitu hanya
satu dataset yang dapat digunakan dalam
sistem. Selain itu, impor data hanya terbatas
pada file Excel dengan ekstensi .csv atau .xls.
Menu untuk manipulasi data pada AMV pun
masih terbatas. Oleh karena itu, diperlukan
penyempurnaan pada paket AMV agar
semakin mempermudah pengguna.
Tujuan
Tujuan dari penelitian ini ialah menyusun
paket R untuk mengembangkan paket AMV
analisis korelasi
dengan menambahkan
kanonik, analisis diskriminan, analisis
diskriminan
kanonik
dan
analisis
korespondensi yang memiliki antarmuka user
friendly serta memperbaiki kekurangan yang
ada pada paket AMV . Hasil dari
pengembangan ini kemudian akan diberi nama
paket AMV 2.0.
TINJAUAN PUSTAKA
Pengembangan paket AMV dilakukan
pada lingkungan R. R adalah sebuah sistem
untuk komputasi statistika dan grafik (Hornik,
2010). Desain R sangat dipengaruhi oleh
bahasa S dan bahasa Scheme. R dapat
dikembangkan dan distribusikan secara bebas.
R terdiri dari paket-paket yang berisi fungsifungsi, data, dan dokumentasi dalam R. Ada
dua jenis paket R yaitu paket standar yang
harus ada dalam R (paket ini terpasang
langsung ketika program R terpasang) dan
paket tambahan yang dikembangkan oleh
banyak ahli (paket ini dapat diunduh pada
http://CRAN.R-project.org). Pembuatan paket
R di lingkungan Windows membutuhkan
perangkat lunak tambahan yaitu Rtools,
LaTex, dan HTML Help Workshop. R dapat
dioperasikan pada sistem operasi Un ix,
Windows, dan Mac.
Analisis peubah ganda yang ditambahkan
pada paket AMV 2.0 antara lain analisis
korelasi kanonik, analisis korespondensi,
analisis diskriminan, dan analisis diskriminan
kanonik.
Analisis Korelasi Kanonik
Menurut Dillon dan Goldstein (1984),
analisis korelasi kanonik adalah salah satu
teknik analisis statistik yang digunakan untuk
melihat hubungan antara segugus peubah
tidak bebas dengan segugus peubah bebas.
Korelasi kanonik mirip dengan korelasi
sederhana biasa. Perbedaannya, korela si
kanonik menggambarkan hubungan antar
peubah kanonik dan bukan peubah asli itu
sendiri.
Tujuan dari analisis korelasi kanonik
adalah mencari pasangan kombinasi linear
dari q peubah tidak bebas yang berkorelasi
maksimum dengan kombinasi linear p peubah
bebas. Selain itu, antara satu pasangan dengan
pasangan lain diharapkan tidak berkorelasi.
2
Kombinasi linear dari kedua gugus tersebut
dapat dituliskan sebagai berikut :
dilakukan uji lambda Wilks terhadap korelasi
kanonik. Hipotesis yang diuji sebagai berikut :
H0 :
H1 :
′
′
dimana vektor koefisien , vektor koefisien ,
vektor peubah bebas , dan vektor peubah
tidak bebas
dapat dituliskan sebagai
berikut :
=0
≠0
Statistik uji lambda Wilks dapat dicari dengan
menggunakan persamaan berikut :
∏
1
dimana M = min (p,q). Statistik uji lambda
Wilks dapat didekati dengan statistik uji F,
yaitu :
/
1
.
/
dengan
Pasangan dari kombinasi linier antara U
dan V disebut peubah kanonik dan korelasinya
disebut korelasi kanonik. Korelasi antara U
dan V diperoleh dari fungsi berikut :
,
′
′
1
1.5
2
2
2
5 ,jika
5
2
′
4
merupakan matriks ragam peragam dari
gugus peubah bebas,
merupakan matriks
ragam peragam dari gugus peubah tidak
bebas, dan
merupakan matriks peragam
dari gugus peubah bebas dan gugus peubah
tidak bebas.
Pasangan kombinasi linear Ui dan Vi yang
memaksimumkan Corr(Ui, Vi) yaitu :
i = 1, 2, .... , p , dengan asumsi p ≤ q
Nilai λ1 ≥ λ2 ≥ .... ≥ λp merupakan akar ciri
yang
dari matriks
tidak lain adalah korelasi kanonik kuadrat
(ρ12, ρ22, ... , ρp2) dan e1, e2,...., ep adalah
vektor ciri yang bersesuaian dengan akar ciri
tersebut. Nilai λ1 ≥ λ2 ≥ .... ≥ λp juga
merupakan p akar ciri terbesar dari matriks
dan f1, f2,...., fp
adalah vektor ciri yang bersesuaian dengan
akar ciri tersebut (Johnson dan Wichern
2002).
Untuk menguji bahwa q peubah tak bebas
berhubungan dengan p peubah bebas
0
0 ,lainnya
dimana N adalah jumlah observasi , p adalah
jumlah peubah bebas, dan q adalah jumlah
peubah tidak bebas. H0 ditolak jika nilai
>
.
,
Analisis Diskriminan
Analisis diskriminan merupakan teknik
statistik yang dapat digunakan untuk
memisahkan beberapa gugus objek yang
berasal dari dua atau lebih kelompok, serta
mengalokasikan suatu objek baru yang belum
diketahui dari kelompok mana ke dalam suatu
kelompok yang telah ditentukan sebelumnya.
Salah satu pendeketan analisis diskriminan
adalah dengan menggunakan model peluang.
Jika
merupakan peluang prior dari
kelompok, dan
adalah fungsi
kepekatan peluang dari sebaran setiap
kelompok, maka sebaran peluang posterior
setiap kelompok untuk peubah bebas adalah
3
Pengalokasian
kelompok
meminimumkan salah klasifikasi
dengan cara memilih kelompok
mempunyai nilai maksimum
,
dikenal sebagai aturan Bayes.
Jika sebaran dari kelompok
normal ganda dengan nilai tengah
ragam peragam
, maka aturan
meminimumkan
2 log
yang
adalah
yang
hal ini
adalah
dan
Bayes
2
′
|
|
2
Perbedaan antara Qc untuk dua kelompok
adalah fungsi kuadrat dari , sehingga metode
ini dikenal sebagai analisis diskriminan
kuadratik (Venables dan Ripley 2002).
Analisis Diskriminan Kanonik
Dalam SAS/STAT 9.2 User’s Guide,
analisis diskriminan kanonik merupakan
analisis korelasi kanonik antara peubah
kuantitatif dengan peubah boneka hasil
transformasi peubah kelompok. Vektor
peubah tidak bebas
pada analisis
diskriminan kanonik adalah peubah boneka
hasil transformasi peubah kelompok. Fungsi
diskriminan kanonik merupakan p eubah
kanonik yang merupakan kombinasi linier dari
vektor peubah bebas , fungsi tersebut dapat
dituliskan sebagai berikut :
i = 1, 2, .... , p , dengan asumsi p ≤ q
Nilai λ1 ≥ λ2 ≥ .... ≥ λp merupakan akar ciri
dari matriks
yang tidak lain adalah korelasi kanonik
kuadrat (ρ12, ρ22, ... , ρp2) dan e1, e2,...., ep
adalah vektor ciri yang bersesuaian dengan
akar ciri tersebut.
merupakan matriks
ragam peragam gabungan yang dapat
diperoleh dari persamaan berikut :
∑
1
∑
dimana
merupakan matriks ragam-peragam
dari setiap kelompok dan
adalah jumlah
observasinya, dengan k=1, 2, ... g. p dan q
adalah jumlah peubah bebas dan jumlah
peubah tidak bebas, serta
adalah jumlah
kelompok .
Analisis Korespondensi
Analisis korespondensi adalah suatu
metode yang menyajikan baris dan kolom dari
matriks data (tabel kontingensi) sebagai titik
pada ruang vektor dengan dimensi yang lebih
rendah (Greenacre 1984). Konsep yang
digunakan dalam analisis ini adalah
penguraian
nilai
singular
terampat
(generalized singular value decomposition ,
GSVD). Analisis korespondensi dar i tabel
kontingensi dua arah disebut analisis
korespondensi sederhana.
Matriks korespondensi
dapat diperoleh
dengan cara membagi setiap unsur matriks N
dengan total semua unsur N, dimana N adalah
tabel kontingensi dua arah tidak negatif dari
dua peubah dengan masing-masing peubah
mempunyai a dan b kategori. Matriks
dinotasikan sebagai berikut :
1
dengan ..
..
Dari matriks korespondensi
, diperoleh
vektor baris dan vektor kolom :
1 dan
1
dimana 1 adalah sebuah vektor satuan. Vektor
adalah vektor yang unsur -unsurnya
merupakan jumlah unsur dari vektor -vektor
baris matriks
dan vektor
adalah vektor
yang unsur-unsurnya
merupakan jumlah
unsur dari vektor-vektor kolom matriks .
Matriks profil baris dan kolom dinyatakan
sebagai berikut :
dan
dimana :
= Matriks diagonal dengan dii adalah total
baris ke-i dari matriks
= Matriks diagonal dengan djj adalah total
kolom ke-i dari matriks
Untuk menentukan koordinat dari profil
dari baris dan kolom pada grafik dilakukan
penguraian GSVD terhadap matriks
,
penguraian tersebut sebagai berikut :
′
adalah matriks berukuran a × m, adalah
matriks berukuran b × m dimana berlaku
, m adalah rank dari
matriks
yang sama dengan rank dari
matriks
atau min(a,b)-1.
adalah matriks
diagonal dimana unsur-unsur diagonalnya
merupakan nilai singular ( λ1,..., λm) dari
matriks
. Matriks
dan
diperoleh
dari
penguraian
nilai
singular
dari
/
/
. Total inersia
(merepresentasikan semua informasi dalam
seluruh ruang) adalah ∑
.
Koordinat utama profil baris dan kolom
dinyatakan sebagai berikut :
dan
4
sedangkan koordinat standar profil baris dan
kolom yaitu :
dan
Analisis korespondensi untuk tabel
kontingensi banyak arah disebut análisis
korespondensi berganda. Pada análisis
korespondensi berganda matriks N yang
digunakan merupakan tabel Burt. Tabel Burt
merupakan matriks
. Matriks
mempunyai jumlah baris yang sama dengan
jumlah individu dalam sampel dan jumlah
kolom yang sama dengan jumlah semua
kategori yang berhubungan dengan semua
peubah. Masing-masing unsur dalam satu
baris matriks
bernilai satu jika individu
tersebut ada dalam kategori dan nol jika
sebaliknya.
Pembangkitan Bilangan Acak
Selain menambahkan analisis peubah
ganda, AMV 2.0 juga menambahkan fungsi
untuk membangkitkan bilangan acak.
Bilangan acak yang dapat dibangkitkan yaitu
bilangan acak yang diambil dari data yang
menyebar binomial, seragam, dan normal.
Sebaran Binomial
Jika dilakukan n percobaan yang saling
bebas, dimana setiap hasil percobaan
mempunyai peluang “sukses” sebesar p dan
peluang “gagal” sebesar 1 -p, maka X yang
merupakan jumlah terjadinya kejadian
“sukses” pada n percobaan tersebut dapat
dikatakan menyebar binomial dengan
parameter (n, p). Sebaran binomial dengan
parameter (n, p) memiliki fungsi massa
peluang :
1
, i = 0, 1, …, n
dengan i merupakan banyaknya kejadian
“sukses” (Ross 1989). Pembangkitan bilangan
acak dari data yang menyebar binomial
dilakukan dengan algoritma
Binomial
Triangle Parallelogram Exponential and
Combined (BTPEC).
Sebaran Seragam
Sebaran seragam termasuk k e dalam
kelompok sebaran kontinu. Menurut Ross
(1989), suatu peubah acak dikatakan
menyebar seragam pada interval (a,b) jika
memiliki fungsi kepekatan peluang :
1
,
0,
jika
Pembangkitan bilangan acak dari data yang
menyebar
seragam
dilakukan
dengan
algoritma Mersenne Twister.
Sebaran Normal
Jika X merupakan peubah acak yang
menyebar normal dengan parameter µ 2 dan σ2,
maka fungsi kepekatan peluang X yaitu :
√
,∞<
< ∞
Kurva dari fungsi kepekatan peluang
tersebut berbentuk lonceng yang simetrik pada
µ. Dimana µ merupakan nilai tengah dari X
dan σ merupakan simpangan baku dari X
(Ross 1989). Pembangkitan bilangan acak dari
data yang menyebar normal dilakukan dengan
algoritma Inversion.
METODOLOGI
Penyusunan paket R ini mengikuti kaidah
rekayasa perangkat lunak dengan model air
terjun (waterfall) melalui tahapan-tahapan
sebagai berikut:
1. Analisis dan Identifikasi Kebutuhan
Sistem
Tahap ini bertujuan untuk memperhatikan
kebutuhan pengguna meliputi batasan,
tujuan, masukan, dan keluaran dari
perangkat lunak. Tahapan ini dilakukan
dengan
menggali
informasi
yang
dibutuhkan oleh pengguna perangkat lunak
statistika yang diadopsi dari per angkat
lunak yang sudah ada seperti Minitab,
SPSS, dan SAS.
2. Analisis Perancangan Sistem
Tahap ini bertujuan untuk menentukan
arsitektur sistem secara keseluruhan.
Tahapan ini dilakukan dengan membuat
diagram aliran data dan merancang
antarmuka sistem.
3. Implementasi dan Pengujian Unit
Pada tahap ini rancangan sistem yang
sebelumnya telah dibuat direalisasikan
menjadi serangkaian perangkat lunak
dengan
menggunakan
bahasa
pemrograman. Pembangunan tampilan
antarmuka menggunakan paket tcltk.
Implementasi sistem juga diiringi dengan
pengujian tiap unit sistem untuk melihat
apakah tiap unit telah memenuhi
spesifikasi yang telah ditentukan.
4. Integrasi dan Pengujian Sistem
Pada tahap ini semua unit sistem disatukan
menjadi suatu perangkat lunak yang utuh
5
Analisis dan
identifikasi
kebutuhan
Analisis
perancangan
sistem
Implementasi
dan Pengujian
Unit
Integrasi dan
pengujian
sistem
Operasi dan
pemeliharaan
Gambar 1 Tahapan pengembangan paket AMV 2.0.
serta dilakukan pengujian terhadap
perangkat lunak tersebut. Pengujian
perangkat lunak dilakukan dengan metode
blackbox yaitu dengan membandingkan
keluaran perangkat lunak yang dibuat
dengan keluaran perangkat lunak statistika
yang sudah ada sebelumnya (Minitab,
SPSS, dan SAS).
5. Operasi dan Pemeliharaan
Tahapan ini mencakup koreksi terhadap
kesalahan yang tidak ditemukan pada
tahap sebelumnya dan perbaikan terhadap
kesalahan tanpa membuat sistem baru.
Selain itu, dilakukan juga dokumentasi
perangkat lunak melalui pembuatan User
Manual dan dokumen perangkat lunak
lainnya.
Tahapan pengembangan perangkat lunak
tersebut merupakan suatu siklus dengan aliran
sesuai Gambar 1. Tahapan berikutnya tidak
boleh dimulai sebelum tahapan sebelumnya
selesai (Sommerville 2003).
HASIL DAN PEMBAHASAN
Kebutuhan Sistem
Analisis peubah ganda merupakan salah
satu teknik statistika yang banyak digunakan
dalam berbagai bidang. Proses perhitungan
pada analisis peubah ganda cukup rumit jika
dilakukan secara manual, oleh karena itu
diperlukan
sistem
komputasi
untuk
mempermudahnya. AMV merupakan suatu
sistem berantarmuka user friendly yang dibuat
untuk melakukan prosedur analisis peubah
ganda pada lingkungan R. Adapun analisis
peubah ganda yang disajikan da lam paket
AMV antara lain ialah analisis komponen
utama, analisis faktor, analisis biplot, analisis
gerombol hierarki dan analisis gerombol k means. Selain itu, AMV memiliki fungsi
untuk melakukan uji normal ganda. Pada
paket AMV 2.0 ditambahkan analisis korelasi
kanonik, analisis diskriminan, analisis
diskriminan
kanonik,
dan
a nalisis
korespondensi.
Selain penambahan analisis peubah ganda,
pada AMV 2.0 juga ditambahkan fungsi
kalkulator sebagai alat manipulasi data,
fungsi
membangkitkan bilangan acak
(binomial, seragam, normal), dan fungsi
untuk menampilkan output dalam bentuk
HTML. Impor data
dilengkapi dengan
penambahan ekstensi file dari SPSS,
Ms. Excel 2007, dan Ms. Access, serta file
yang berekstensi .csv dengan pemisahnya
berupa “;”. Ekspor data dilengkapi dengan
penambahan ekstensi file ke SPSS dan ke file
yang berekstensi .csv dengan pemisahnya
berupa “;”. Keterbatasan AMV yang hanya
dapat menggunakan satu dataset saja dalam
6
sistem diatasi dengan
pemilihan dataset.
m
membuat
fungsi
Analisis Perancanga
gan Sistem
Tahapan perancangan ssistem dilakukan
dengan membuat diagram aliran data dan
desain antarmuka untuk sis
sistem yang telah
diidentifikasi sebelumnya.. Diagram aliran
cangan sistem yang
data merupakan alat perancan
ta dengan konsep
berorientasi pada alur data
digunakan
untuk
dekomposisi
dapat
dig
penggambaran analisis maaupun rancangan
omunikasikan oleh
sistem yang mudah dikom
profesional sistem kepada ppemakai maupun
pembuat program.
Pada Gambar 2 dapat dili
ilihat bahwa AMV
2.0
memungkinkan
pe
pengguna
untuk
memasukan data ke dala
alam sis tem dan
menerima hasil pengolahann yyang ditampilkan
ke monitor atau disimpan
an ke dalam file.
Diagram aliran data level
el 1 (Gambar 3)
merupakan dekomposisii sistem secara
keseluruhan yang dibuat oleh
leh tujuh penelitian.
AMV 2.0 hanya menjalank
nkan proses Input
Data (1), proses Manajemeen Data (2), dan
proses Analisis Peubah Ganda
nda (5).
ata level 0.
Gambar 2 Diagram aliran data
didekomposisi
Proses Input Data dapat di
level 2
lagi menjadi diagram aliran data
d
(Lampiran 1) yang tersusun olehh proses Input
por Data (1.2),
Data Langsung (1.1), proses Impo
rsimpan (1.3),
proses Memuat Data yang Tersi
Proses
dan proses Bangkitkan Data (1.4).
(1
Manajemen Data (Lampiran 2) didekomposisi
did
et Aktif (2.1),
lagi menjadi proses Pilih Dataset
proses
proses Edit Dataset Aktif (2.2),
(2
itkan Bilangan
Kalkulator (2.3), proses Bangkitk
(2.5).
Acak (2.4), dan proses Pilih Peubah
Pe
proses
Proses Analisis Peubah Ganda adalah
ad
sudah dibuat oleh AMV sebelumnya.
Ganda
Dekomposisi proses Analisis Peubah
Pe
Gambar 3 Diagram aliran data level 1.
7
menjadi diagram aliran level 2 (Lampiran 3)
pada AMV 2.0 menambahkan proses Analisis
Korelasi Kanonik (5.8), proses Analisis
Diskriminan
(5.9),
proses
Analisis
Diskriminan Kanonik (5.10), proses Analisis
Korespondensi Sederhana (5.11), dan proses
Analisis Korespondensi berganda (5.12).
Proses-proses tersebut dapat didekomposisi
lagi menjadi diagram aliran data level 3 yang
dapat dilihat pada Lampiran 4, 5, 6, 7 dan 8.
Implementasi Sistem
Implementasi
sistem
AMV
2.0
menggunakan program R dan paket tcltk
untuk membuat tampilan anta rmukanya.
Selain itu, implementasi sistem AMV 2.0 juga
memanfaatkan paket-paket lainnya baik paket
standar maupun paket tambahan yang harus
diunduh terlebih dahulu. Nama-nama paket
tersebut tersaji pada Tabel 1.
Tabel 1 Paket-paket yang digunakan dalam
implementasi sistem AMV 2.0
No. Paket
Paket
Tambahan
Standar
1.
RODBC
MASS
2.
tkrplot
foreign
3.
car
Matrix
4.
mvShapiroTest tcltk
5.
R2HTML
6.
zoo
7.
CCA
8.
CCP
9.
candisc
10. ca
Sama seperti AMV sebelumnya, AMV 2.0
tersusun oleh pilihan menu di bagian atas dan
jendela hasil di bawah menu untuk
menampilkan output. Menu AMV 2.0 terdiri
dari lima menu utama yaitu Menu File, Menu
Edit, Menu Data, Menu Statistika dan Menu
Bantuan. Menu Edit merupakan menu baru
yang tidak ada pada AMV sebelumnya.
Skema menu-menu tersebut dapat dilihat pada
Lampiran 9, 10, 11, 12, dan 13. Lingkungan
utama paket AMV 2.0 dapat dilihat pada
Lampiran 14.
Menu File
Menu File terdiri dari delapan submenu
yaitu :
1. Buat Dataset Baru
Submenu ini berfungsi untuk membuat
dataset ke dalam sistem secara manual.
Sebelum membuat dataset, pengguna
harus memberi nama untuk dataset yang
akan dibuatnya tersebut.
2. Memuat Dataset
Submenu ini digunakan untuk memuat
dataset yang tersimpan dalam file R
dengan ekstensi .rda , .Rda , .RDA, atau
.RData.
3. Simpan Dataset
Submenu ini digunakan untuk menyimpan
dataset dalam file R dengan ekstensi .rda,
.Rda, .RDA, atau .RData.
4. Impor Dataset
Submenu ini terdiri dari lima fungsi yait u
“SPSS”, “.csv (,)”, “.csv (;)”, “Ms. Excel”,
dan “Ms. Access”. Fungsi “SPSS”
digunakan untuk mengimpor data dari file
SPSS dengan ekstensi .sav atau .por.
Fungsi “.csv (,)” digunakan untuk
mengimpor data dari file dengan ekstensi
.csv dimana pembatasnya berupa “,”.
Fungsi “.csv (;)” digunakan untuk
mengimpor data dari file dengan ekstensi
.csv dimana pembatasnya berupa “;”.
Fungsi “Ms. Excel” digunakan untuk
mengimpor data dari file Ms. Excel
dengan ekstensi .xlsx atau .xls. Fungsi
“Ms.
Access”
digunakan
untuk
mengimpor data dari file Ms. Access
dengan ekstensi .mdb atau .accdb.
5. Ekspor Dataset
Submenu ini terdiri dari empat fungsi yaitu
“SPSS”, “.csv (,)”, “.csv (;)”, dan “Ms.
Excel 2003”. Fungsi “SPSS” digunakan
untuk mengekspor dataset aktif ke file
SPSS dengan ekstensi .sps. Fungsi “.csv
(,)” digunakan untuk mengekspor dataset
aktif ke file dengan ekstensi .csv dimana
pembatasnya berupa “,”. Fungsi “csv (;)”
digunakan untuk mengekspor dataset aktif
ke file dengan ekstensi .csv dimana
pembatasnya berupa “;”. Fungsi “Ms.
Excel 2003” digunakan untuk mengekspor
dataset aktif ke file Ms. Excel 2003.
6. Simpan Hasil
Submenu ini ini digunakan untuk
menyimpan hasil yang terdapat pada
jendela hasil dalam bentuk teks dengan
ekstensi .txt dan .doc.
7. Hasil HTML
Submenu ini ini digunakan untuk
menampilkan output yang dicetak ke
jendela hasil dalam format HTML. Fungsi
ini aktif jika tombol cek “Tampilkan
output HTML” dan direktori folder terisi.
Jika fungsi ini aktif maka setiap pengguna
mencetak output ke jendela hasil, output
tersebut akan ditampilkan juga oleh
browser yang terdapat pada komputer
pengguna.
8
8. Keluar
Submenu ini ini digunakan untuk keluar
dari sistem AMV 2.0.
Menu Edit
Semua submenu yang ada pada menu ini
hanya berfungsi untuk mengedit jendela hasil.
Submenu-submenu itu antara lain :
1. Cut
Submenu
ini
digunakan
untuk
mengirimkan objek yang terpilih pada
jendela hasil ke clipboard sistem komputer
dan menghapus objek yang terpilih
tersebut pada jendela hasil.
2. Salin
Submenu
ini
digunakan
untuk
mengirimkan objek yang terpilih pada
jendela hasil ke clipboard sistem
komputer. Fungsi ini biasanya digunakan
untuk menyalin objek yang terpilih.
3. Paste
Submenu
ini
digunakan
untuk
menampilkan objek yang ada pada
clipboard sistem komputer ke jendela
hasil. Fungsi ini biasanya digunakan untuk
menampilkan objek yang sudah disalin
sebelumnya.
4. Hapus
Submenu ini digunakan untuk menghapus
objek yang terpilih pada jendela hasil.
5. Undo
Submenu
ini
digunakan
untuk
mengembalikan tampilan je ndela hasil ke
tampilan sebelum tampilan terakhir.
6. Pilih Semua
Submenu ini digunakan untuk memilih
semua objek yang ada pada jendela hasil.
7. Bersihkan Jendela
Submenu ini digunakan untuk menghapus
semua objek yang ada pada jendela hasil.
Menu Data
Menu ini memiliki enam submenu.
Sebagian besar submenu tersebut berfungsi
untuk manajemen data. Submenu tersebut
antara lain :
1. Pilih Dataset Aktif
Submenu ini digunakan untuk memilih
satu dataset aktif. Dataset aktif adalah
dataset yang siap untuk dianalisis. F ungsi
ini memungkinkan sistem AMV 2.0 untuk
menampung lebih dari satu dataset.
2. Lihat Dataset Aktif
Submenu ini digunakan untuk melihat
dataset aktif.
3. Edit Dataset Aktif
Submenu ini digunakan untuk mengedit
dataset aktif.
4. Kalkulator
Submenu
ini
digunakan
un tuk
memanipulasi dataset aktif. Operasi yang
terdapat pada kalkulator yaitu operasi
aritmatika,
trigonometri,
dan
perbandingan.
5. Bangkitkan Bilangan Acak
Submenu ini terdiri dari tiga fungsi yaitu
fungsi membangkitkan bilangan acak
seragam, fungsi membangki tkan bilangan
acak binomial, dan fungsi untuk
membangkitkan bilangan acak normal.
6. Cetak Dataset
Submenu
ini
digunakan
untuk
menampilkan dataset aktif ke dalam
jendela hasil.
Menu Statistika
Menu ini berisi fungsi-fungsi untuk
analisis peubah ganda. Pada menu ini terdapat
delapan
submenu.
Submenu
analisis
gerombol, submenu analisis komponen utama,
submenu analisis faktor, submenu analisis
biplot, dan submenu uji normal ganda
merupakan submenu yang ada pada AMV
sebelumnya, sehingga tidak akan dijelaskan
pada bagian ini. Tiga submenu baru pada
menu statistika antara lain submenu analisis
korelasi
kanonik,
submenu
analisis
diskriminan,
dan
submenu
analisis
korespondensi. Fungsi-fungsi yang terdapat
pada ketiga submenu itu antara lain :
1. Analisis Korelasi Kanonik
Fungsi ini digunakan untuk melakukan
analisis
korelasi
kanonik.
Untuk
menjalankan fungsi ini pengguna harus
mengisi kotak peubah respon dan kotak
peubah prediktor dengan peubah -peubah
yang memiliki jenis data numerik. Pada
fungsi ini terdapat pilihan un tuk
menampilkan skor peubah kanonik untuk
setiap observasi.
Output yang dihasilkan dari fungsi ini
antara lain korelasi kanonik beserta uji
statistiknya, koefisien dari peubah
kanonik, koefisien baku dari peubah
kanonik, korelasi antara peubah kanonik
dengan peubah asalnya, serta skor dari
peubah kanonik untuk semua observasi.
Output skor dari peubah kanonik tidak
ditampilkan di jendela hasil, tetapi
langsung dimasukan ke dataset aktif.
Kotak dialog untuk fungsi ini dapat dilihat
pada Lampiran 15. Sintaks R untuk
melakukan analisis korelasi kanonik
menggunakan fungsi “ cc” yang berasal
dari paket CCA, sementa ra itu untuk
9
melakukan pengujian korelasi kanonik
digunakan fungsi “ p.asym” yang berasal
daru paket CCP. Contoh penggunaan
fungsi-fungsi tersebut adalah sebagai
berikut :
kankor
DEFRI RAMADHAN ISMANA . Penyusunan Paket R untuk Pengembangan Paket Analisis
Multivariat (AMV). Dibimbing oleh AGUS M. SOLEH dan UTAMI DYAH SYAFITRI .
Pengembangan paket R untuk analisis statistika yang memiliki antarmuka user friendly telah
dilakukan sejak tahun 2009 pada Departemen Statistika Institut Pertanian Bogor. Salah satu paket
R yang dikembangkan ialah Paket AMV (Analisis Multivariat), yaitu paket untuk melakukan
prosedur analisis peubah ganda (Miranti 2010). Analisis peubah ganda pada AMV hanya
mencakup analisis komponen utama, analisis gerombol hierarki, analisis gerombol k -means,
analisis faktor, dan analisis biplot. Paket AMV masih memiliki beberapa kekurangan, untuk itu
perlu dilakukan perbaikan.
Penelitian ini dilakukan untuk memperbaiki paket AMV sebelumnya dengan menambahkan
beberapa analisis peubah ganda serta mengatasi batasan-batasan yang ada pada paket AMV. Hasil
perbaikan paket AMV dinamakan paket AMV 2.0. Paket AMV 2.0 menambahkan fungsi analisis
korelasi kanonik, analisis diskriminan, analisis diskriminan kanonik, analisis korespondensi
sederhana, dan analisis korespondensi berganda serta mengatasi batasan -batasan pada sistem
manajemen data yang terdapat pada AMV sebelumnya. Selain itu, AMV 2.0 menambahkan fungsi
untuk membangkitkan bilangan acak, dan fungsi untuk menamp ilkan output dalam format HTML.
Pengujian paket AMV 2.0 dilakukan dengan menggunakan metode blackbox yang
membandingkan keluaran AMV 2.0 dengan perangkat lunak SAS, SPSS, dan Minitab . Hasil
pengujian menunjukkan bahwa AMV 2.0 mampu menghasilkan output yang sesuai untuk analisisanalisis peubah ganda yang dibuat.
Kata kunci: paket AMV, paket AMV 2.0, analisis peubah ganda
PENYUSUNAN PAKET R UNTUK PEN GEMBANGAN PAKET
ANALISIS MULTIVARIAT (AMV)
DEFRI RAMADHAN ISMANA
Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Statistika pada
Departemen Statistika
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
2011
Judul :
Nama :
NIM :
Penyusunan Paket R untuk Pen gembangan Paket Analisis Multivariat
(AMV)
Defri Ramadhan Ismana
G14062952
Menyetujui,
Pembimbing I
Pembimbing II
Agus M. Soleh, S.Si, MT
NIP. 197503151999031004
Utami Dyah Syafitri, M.Si
NIP. 197709172005012001
Mengetahui,
Ketua Departemen Statistika
Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor
Dr. Ir. Hari Wijayanto
NIP. 196504211990021001
Tanggal Lulus :
KATA PENGANTAR
Segala puji dan syukur dipanjatkan kehadirat Allah SWT atas segala rahmat dan karunia -Nya
sehingga penulis dapat menyelesaikan karya ilmiah ini. Shalawat serta salam semoga sela lu
tercurahkan kepada Rasulullah SAW, keluarga, sahabat dan umatnya hingga akhir zaman. Karya
ilmiah ini berjudul ”Penyusunan Paket R untuk Pengembangan Paket Analisis Multivariat
(AMV)”.
Banyak ilmu, pelajaran, dan masukan yang penulis dapatkan dan rasakan selama proses
penyusunan karya ilmiah ini, sehingga pada kesempatan kali ini penulis ingin mengucapkan terima
kasih kepada:
1. Bapak Agus M. Soleh, S.Si, MT dan Ibu Utami Dyah Syafitri, M.Si selaku dosen
pembimbing.
2. Bapak Prof. Dr. Ir. Aunuddin selaku penguji luar atas semua sarannya.
3. Keluarga yang sangat penulis sayangi, terima kasih atas segala doa, dukungan, cinta , dan
kasih sayang yang telah diberikan selama ini.
4. Kamelia dan M. Mufti Mubarak atas bantuan, dukungan, serta kebersamaannya.
5. Bapak Harianto Tanudjaja, Rahma Anisa, Tri Miranti, Imam Apriyanto, Dea R. Putri, Anita
Kumala Sari, Tri Wahyu S., Lemma F. Boer, Tendi, Retno atas saran, bantuan, serta
dukungannya.
Akhir kata, penulis meminta maaf apabila dalam proses penyusunan karya ilmiah ini terdapat
kesalahan-kesalahan yang dilakukan oleh penulis . Semoga karya ilmiah ini dapat bermanfaat bagi
yang memerlukannya.
Bogor, Februari 2011
Defri Ramadhan Ismana
RIWAYAT HIDUP
Penulis dilahirkan di kota Ciamis pada tanggal 4 Mei 1988 sebagai anak kedua dari pasangan
Agus Sudjati dan M. Suarjethi. Pendidikan penulis berawal dari Sekolah Dasar Negeri Padasuka 2
Bandung pada tahun 1994, dan melanjutkan pendidikannya ke SLTP Negeri 16 Bandung pada
tahun 2000. Pada tahun 2003 penulis melanjutkan pendidikan di SMA Negeri 1 4 Bandung, dan
lulus pada tahun 2006. Pada tahun yang sama penulis diterima sebagai mahasiswa di Institut
Pertanian Bogor melalui jalur Seleksi Penerimaan Mahasiswa Baru ( SPMB). Pada tahun kedua di
IPB, penulis memilih program studi Statistika sebagai mayor, serta memilih Matematika Keuangan
dan Aktuaria sebagai minor pada tahun berikutnya.
Selama masa perkuliahan, penulis aktif dalam kegiatan Himpunan Keprofesian Gamma Sigma
Beta (GSB) sebagai Kepala Departemen Database and Computational pada tahun 2008/2009.
Penulis juga aktif mengikuti kepanitiaan acara yang menjadi Program Kerja GSB, antara lain
Statistika Ria, LJPS, WCS, dan SAS.
Pada tahun ajaran 2008/2009 penulis berkesempatan menjadi asisten praktikum untuk mata
kuliah Komputasi Statistika di program Sarjana Departemen Statistika IPB dan program Ekstensi
Ilmu Komputer IPB. Penulis mengikuti kegiatan praktik lapang di PT. Ganesha Cipta Informatika
pada bulan Februari 2010 - April 2010.
DAFTAR ISI
Halaman
DAFTAR TABEL ..........................................................................................................................viii
DAFTAR GAMBAR .....................................................................................................................viii
DAFTAR LAMPIRAN ..................................................................................................................viii
PENDAHULUAN............................................................................................................................. 1
Latar Belakang .............................................................................................................................. 1
Tujuan ........................................................................................................................................... 1
TINJAUAN PUSTAKA .................................................................................................................... 1
Analisis Korelasi Kanonik ............................................................................................................ 1
Analisis Diskriminan .................................................................................................................... 2
Analisis Diskriminan Kanonik ......................................................................................................3
Analisis Korespondensi ................................................................................................................ 3
Pembangkitan Bilangan Acak .......................................................................................................4
Sebaran Binomial ..................................................................................................................... 4
Sebaran Seragam ...................................................................................................................... 4
Sebaran Normal ........................................................................................................................ 4
METODOLOGI ................................................................................................................................ 4
HASIL DAN PEMBAHASAN .........................................................................................................5
Kebutuhan Sistem ......................................................................................................................... 5
Analisis Perancangan Sistem ........................................................................................................6
Implementasi Sistem ..................................................................................................................... 7
Menu File .................................................................................................................................7
Menu Edit .................................................................................................................................8
Menu Data ................................................................................................................................ 8
Menu Statistika ......................................................................................................................... 8
Menu Bantuan ........................................................................................................................ 10
Pengujian ....................................................................................................................................10
Batasan dan Pemasangan Sistem ................................................................................................ 11
KESIMPULAN DAN SARAN ....................................................................................................... 11
Kesimpulan .................................................................................................................................11
Saran ........................................................................................................................................... 12
DAFTAR PUSTAKA ..................................................................................................................... 12
LAMPIRAN ....................................................................................................................................13
DAFTAR TABEL
1.
2.
Paket-paket yang digunakan dalam implementasi sistem AMV 2.0 .........................................7
Perbandingan output paket AMV 2.0 dengan output SAS, Minitab, dan SPSS menggunakan
metode blackbox ..................................................................................................................... 11
DAFTAR GAMBAR
1.
2.
3.
Halaman
Tahapan pengembangan paket AMV 2.0 .................................................................................. 5
Diagram aliran data level 0 .......................................................................................................6
Diagram aliran data level 1 .......................................................................................................6
DAFTAR LAMPIRAN
Halaman
Diagram Aliran Data Level 2 Proses Input Data (1) ............................................................... 14
Diagram Aliran Data Level 2 Proses Manajemen Data (2) .................................................... 14
Diagram Aliran Data Level 2 Proses Analisis Peubah Ganda (5) ........................................... 15
Diagram Aliran Data Level 3 Proses Analisis Korelasi Kanonik (5.8) ...................................15
Diagram Aliran Data Level 3 Proses Analisis Diskriminan (5.9) ........................................... 16
Diagram Aliran Data Level 3 Proses Analisis Diskriminan Kanonik (5.10) .......................... 16
Diagram Aliran Data Level 3 Proses Analisis Korespondensi Sederhana (5.11) ................... 17
Diagram Aliran Data Level 3 Proses Analisis Korespondensi Berganda (5.12)..................... 17
Skema Menu File .................................................................................................................... 18
Skema Menu Edit ................................................................................................................... 18
Skema Menu Data................................................................................................................... 18
Skema Menu Statistika ........................................................................................................... 19
Skema Menu Bantuan ............................................................................................................. 19
Lingkungan Utama Paket AMV 2.0 ....................................................................................... 20
Kotak Dialog Analisis Korelasi Kanonik ............................................................................... 21
Kotak Dialog Analisis Diskriminan ........................................................................................ 22
Kotak Dialog Analisis Diskriminan Kanonik ......................................................................... 23
Kotak Dialog Analisis Korespondensi Sederhana ..................................................................24
Kotak Dialog Analisis Korespondensi Berganda ....................................................................26
Perbandingan Output Analisis Korelasi Kanonik AMV 2.0 dengan Perangkat Lunak
Lainnya ...................................................................................................................................27
21. Perbandingan Output Analisis Diskriminan Kuadratik AMV 2.0 dengan Perangkat Lunak
Lainnya ...................................................................................................................................27
22. Perbandingan Output Analisis Diskriminan Kanonik AMV 2.0 dengan Perangkat Lunak
Lainnya ...................................................................................................................................28
23. Perbandingan Output Analisis Korespondensi Sederhana AMV 2.0 dengan Perangkat Lunak
Lainnya ...................................................................................................................................28
24. Perbandingan Output Analisis Korespondensi Berganda AMV 2.0 dengan Perangkat Lunak
Lainnya ...................................................................................................................................29
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
1
PENDAHULUAN
Latar Belakang
Statistika merupakan ilmu yang berkaitan
erat dengan komputasi. Analisis statistika
semakin berkembang sejalan dengan majunya
dunia komputasi. Berkembangnya analisis
statistika tentu saja diikuti oleh perkembangan
perangkat lunak statistika. Saat ini banyak
perangkat lunak statistika yang dapat
digunakan dengan mudah oleh praktisi. Akan
tetapi harga perangkat lunak tersebut sangat
tinggi dibandingkan daya beli masyarakat
Indonesia
pada
umumnya,
sehingga
menyebabkan
banyaknya
penggunaan
perangkat lunak untuk analisis statistika yang
dilakukan secara ilegal (pembajakan) di
Indonesia.
Tingkat pembajakan perangkat lunak dapat
dikurangi dengan memanfaatkan perangkat
lunak yang dapat dipakai dan dikembangkan
secara bebas (open source). Salah satu
perangkat lunak statistika yang dapat dip akai
dan dikembangkan secara bebas ialah R.
Penggunaan R untuk analisis statistika di
Indonesia masih sangat kurang karena
perangkat ini tidak mudah digunakan
khususnya bagi peminat statistika yang
nonstatistisi dan nonprogramer. Oleh karena
itu, diperlukan pembuatan paket R dengan
antarmuka
user
friendly
sehingga
memudahkan pengguna nonstatistisi dan
nonprogramer untuk melakukan analisis
statistika.
Sejak tahun 2009, Departemen Statistika
Institut
Pertanian
Bogor
mulai
mengembangkan paket R untuk analisis
statistika yang memiliki tampilan antarmuka
user friendly. Salah satu paket R yang
dikembangkan ialah Paket AMV (Analisis
Multivariat), yaitu paket untuk melakukan
prosedur analisis peubah ganda. Analisis
peubah ganda pada AMV hanya mencakup
analisis komponen utama, analisis gerombol
hierarki, analisis gerombol k -means, analisis
faktor, dan analisis biplot (Miranti 2010).
Selain itu, AMV juga memiliki fungsi untuk
melakukan uji normal ganda. Paket AMV
memiliki beberapa kekurangan, yaitu hanya
satu dataset yang dapat digunakan dalam
sistem. Selain itu, impor data hanya terbatas
pada file Excel dengan ekstensi .csv atau .xls.
Menu untuk manipulasi data pada AMV pun
masih terbatas. Oleh karena itu, diperlukan
penyempurnaan pada paket AMV agar
semakin mempermudah pengguna.
Tujuan
Tujuan dari penelitian ini ialah menyusun
paket R untuk mengembangkan paket AMV
analisis korelasi
dengan menambahkan
kanonik, analisis diskriminan, analisis
diskriminan
kanonik
dan
analisis
korespondensi yang memiliki antarmuka user
friendly serta memperbaiki kekurangan yang
ada pada paket AMV . Hasil dari
pengembangan ini kemudian akan diberi nama
paket AMV 2.0.
TINJAUAN PUSTAKA
Pengembangan paket AMV dilakukan
pada lingkungan R. R adalah sebuah sistem
untuk komputasi statistika dan grafik (Hornik,
2010). Desain R sangat dipengaruhi oleh
bahasa S dan bahasa Scheme. R dapat
dikembangkan dan distribusikan secara bebas.
R terdiri dari paket-paket yang berisi fungsifungsi, data, dan dokumentasi dalam R. Ada
dua jenis paket R yaitu paket standar yang
harus ada dalam R (paket ini terpasang
langsung ketika program R terpasang) dan
paket tambahan yang dikembangkan oleh
banyak ahli (paket ini dapat diunduh pada
http://CRAN.R-project.org). Pembuatan paket
R di lingkungan Windows membutuhkan
perangkat lunak tambahan yaitu Rtools,
LaTex, dan HTML Help Workshop. R dapat
dioperasikan pada sistem operasi Un ix,
Windows, dan Mac.
Analisis peubah ganda yang ditambahkan
pada paket AMV 2.0 antara lain analisis
korelasi kanonik, analisis korespondensi,
analisis diskriminan, dan analisis diskriminan
kanonik.
Analisis Korelasi Kanonik
Menurut Dillon dan Goldstein (1984),
analisis korelasi kanonik adalah salah satu
teknik analisis statistik yang digunakan untuk
melihat hubungan antara segugus peubah
tidak bebas dengan segugus peubah bebas.
Korelasi kanonik mirip dengan korelasi
sederhana biasa. Perbedaannya, korela si
kanonik menggambarkan hubungan antar
peubah kanonik dan bukan peubah asli itu
sendiri.
Tujuan dari analisis korelasi kanonik
adalah mencari pasangan kombinasi linear
dari q peubah tidak bebas yang berkorelasi
maksimum dengan kombinasi linear p peubah
bebas. Selain itu, antara satu pasangan dengan
pasangan lain diharapkan tidak berkorelasi.
2
Kombinasi linear dari kedua gugus tersebut
dapat dituliskan sebagai berikut :
dilakukan uji lambda Wilks terhadap korelasi
kanonik. Hipotesis yang diuji sebagai berikut :
H0 :
H1 :
′
′
dimana vektor koefisien , vektor koefisien ,
vektor peubah bebas , dan vektor peubah
tidak bebas
dapat dituliskan sebagai
berikut :
=0
≠0
Statistik uji lambda Wilks dapat dicari dengan
menggunakan persamaan berikut :
∏
1
dimana M = min (p,q). Statistik uji lambda
Wilks dapat didekati dengan statistik uji F,
yaitu :
/
1
.
/
dengan
Pasangan dari kombinasi linier antara U
dan V disebut peubah kanonik dan korelasinya
disebut korelasi kanonik. Korelasi antara U
dan V diperoleh dari fungsi berikut :
,
′
′
1
1.5
2
2
2
5 ,jika
5
2
′
4
merupakan matriks ragam peragam dari
gugus peubah bebas,
merupakan matriks
ragam peragam dari gugus peubah tidak
bebas, dan
merupakan matriks peragam
dari gugus peubah bebas dan gugus peubah
tidak bebas.
Pasangan kombinasi linear Ui dan Vi yang
memaksimumkan Corr(Ui, Vi) yaitu :
i = 1, 2, .... , p , dengan asumsi p ≤ q
Nilai λ1 ≥ λ2 ≥ .... ≥ λp merupakan akar ciri
yang
dari matriks
tidak lain adalah korelasi kanonik kuadrat
(ρ12, ρ22, ... , ρp2) dan e1, e2,...., ep adalah
vektor ciri yang bersesuaian dengan akar ciri
tersebut. Nilai λ1 ≥ λ2 ≥ .... ≥ λp juga
merupakan p akar ciri terbesar dari matriks
dan f1, f2,...., fp
adalah vektor ciri yang bersesuaian dengan
akar ciri tersebut (Johnson dan Wichern
2002).
Untuk menguji bahwa q peubah tak bebas
berhubungan dengan p peubah bebas
0
0 ,lainnya
dimana N adalah jumlah observasi , p adalah
jumlah peubah bebas, dan q adalah jumlah
peubah tidak bebas. H0 ditolak jika nilai
>
.
,
Analisis Diskriminan
Analisis diskriminan merupakan teknik
statistik yang dapat digunakan untuk
memisahkan beberapa gugus objek yang
berasal dari dua atau lebih kelompok, serta
mengalokasikan suatu objek baru yang belum
diketahui dari kelompok mana ke dalam suatu
kelompok yang telah ditentukan sebelumnya.
Salah satu pendeketan analisis diskriminan
adalah dengan menggunakan model peluang.
Jika
merupakan peluang prior dari
kelompok, dan
adalah fungsi
kepekatan peluang dari sebaran setiap
kelompok, maka sebaran peluang posterior
setiap kelompok untuk peubah bebas adalah
3
Pengalokasian
kelompok
meminimumkan salah klasifikasi
dengan cara memilih kelompok
mempunyai nilai maksimum
,
dikenal sebagai aturan Bayes.
Jika sebaran dari kelompok
normal ganda dengan nilai tengah
ragam peragam
, maka aturan
meminimumkan
2 log
yang
adalah
yang
hal ini
adalah
dan
Bayes
2
′
|
|
2
Perbedaan antara Qc untuk dua kelompok
adalah fungsi kuadrat dari , sehingga metode
ini dikenal sebagai analisis diskriminan
kuadratik (Venables dan Ripley 2002).
Analisis Diskriminan Kanonik
Dalam SAS/STAT 9.2 User’s Guide,
analisis diskriminan kanonik merupakan
analisis korelasi kanonik antara peubah
kuantitatif dengan peubah boneka hasil
transformasi peubah kelompok. Vektor
peubah tidak bebas
pada analisis
diskriminan kanonik adalah peubah boneka
hasil transformasi peubah kelompok. Fungsi
diskriminan kanonik merupakan p eubah
kanonik yang merupakan kombinasi linier dari
vektor peubah bebas , fungsi tersebut dapat
dituliskan sebagai berikut :
i = 1, 2, .... , p , dengan asumsi p ≤ q
Nilai λ1 ≥ λ2 ≥ .... ≥ λp merupakan akar ciri
dari matriks
yang tidak lain adalah korelasi kanonik
kuadrat (ρ12, ρ22, ... , ρp2) dan e1, e2,...., ep
adalah vektor ciri yang bersesuaian dengan
akar ciri tersebut.
merupakan matriks
ragam peragam gabungan yang dapat
diperoleh dari persamaan berikut :
∑
1
∑
dimana
merupakan matriks ragam-peragam
dari setiap kelompok dan
adalah jumlah
observasinya, dengan k=1, 2, ... g. p dan q
adalah jumlah peubah bebas dan jumlah
peubah tidak bebas, serta
adalah jumlah
kelompok .
Analisis Korespondensi
Analisis korespondensi adalah suatu
metode yang menyajikan baris dan kolom dari
matriks data (tabel kontingensi) sebagai titik
pada ruang vektor dengan dimensi yang lebih
rendah (Greenacre 1984). Konsep yang
digunakan dalam analisis ini adalah
penguraian
nilai
singular
terampat
(generalized singular value decomposition ,
GSVD). Analisis korespondensi dar i tabel
kontingensi dua arah disebut analisis
korespondensi sederhana.
Matriks korespondensi
dapat diperoleh
dengan cara membagi setiap unsur matriks N
dengan total semua unsur N, dimana N adalah
tabel kontingensi dua arah tidak negatif dari
dua peubah dengan masing-masing peubah
mempunyai a dan b kategori. Matriks
dinotasikan sebagai berikut :
1
dengan ..
..
Dari matriks korespondensi
, diperoleh
vektor baris dan vektor kolom :
1 dan
1
dimana 1 adalah sebuah vektor satuan. Vektor
adalah vektor yang unsur -unsurnya
merupakan jumlah unsur dari vektor -vektor
baris matriks
dan vektor
adalah vektor
yang unsur-unsurnya
merupakan jumlah
unsur dari vektor-vektor kolom matriks .
Matriks profil baris dan kolom dinyatakan
sebagai berikut :
dan
dimana :
= Matriks diagonal dengan dii adalah total
baris ke-i dari matriks
= Matriks diagonal dengan djj adalah total
kolom ke-i dari matriks
Untuk menentukan koordinat dari profil
dari baris dan kolom pada grafik dilakukan
penguraian GSVD terhadap matriks
,
penguraian tersebut sebagai berikut :
′
adalah matriks berukuran a × m, adalah
matriks berukuran b × m dimana berlaku
, m adalah rank dari
matriks
yang sama dengan rank dari
matriks
atau min(a,b)-1.
adalah matriks
diagonal dimana unsur-unsur diagonalnya
merupakan nilai singular ( λ1,..., λm) dari
matriks
. Matriks
dan
diperoleh
dari
penguraian
nilai
singular
dari
/
/
. Total inersia
(merepresentasikan semua informasi dalam
seluruh ruang) adalah ∑
.
Koordinat utama profil baris dan kolom
dinyatakan sebagai berikut :
dan
4
sedangkan koordinat standar profil baris dan
kolom yaitu :
dan
Analisis korespondensi untuk tabel
kontingensi banyak arah disebut análisis
korespondensi berganda. Pada análisis
korespondensi berganda matriks N yang
digunakan merupakan tabel Burt. Tabel Burt
merupakan matriks
. Matriks
mempunyai jumlah baris yang sama dengan
jumlah individu dalam sampel dan jumlah
kolom yang sama dengan jumlah semua
kategori yang berhubungan dengan semua
peubah. Masing-masing unsur dalam satu
baris matriks
bernilai satu jika individu
tersebut ada dalam kategori dan nol jika
sebaliknya.
Pembangkitan Bilangan Acak
Selain menambahkan analisis peubah
ganda, AMV 2.0 juga menambahkan fungsi
untuk membangkitkan bilangan acak.
Bilangan acak yang dapat dibangkitkan yaitu
bilangan acak yang diambil dari data yang
menyebar binomial, seragam, dan normal.
Sebaran Binomial
Jika dilakukan n percobaan yang saling
bebas, dimana setiap hasil percobaan
mempunyai peluang “sukses” sebesar p dan
peluang “gagal” sebesar 1 -p, maka X yang
merupakan jumlah terjadinya kejadian
“sukses” pada n percobaan tersebut dapat
dikatakan menyebar binomial dengan
parameter (n, p). Sebaran binomial dengan
parameter (n, p) memiliki fungsi massa
peluang :
1
, i = 0, 1, …, n
dengan i merupakan banyaknya kejadian
“sukses” (Ross 1989). Pembangkitan bilangan
acak dari data yang menyebar binomial
dilakukan dengan algoritma
Binomial
Triangle Parallelogram Exponential and
Combined (BTPEC).
Sebaran Seragam
Sebaran seragam termasuk k e dalam
kelompok sebaran kontinu. Menurut Ross
(1989), suatu peubah acak dikatakan
menyebar seragam pada interval (a,b) jika
memiliki fungsi kepekatan peluang :
1
,
0,
jika
Pembangkitan bilangan acak dari data yang
menyebar
seragam
dilakukan
dengan
algoritma Mersenne Twister.
Sebaran Normal
Jika X merupakan peubah acak yang
menyebar normal dengan parameter µ 2 dan σ2,
maka fungsi kepekatan peluang X yaitu :
√
,∞<
< ∞
Kurva dari fungsi kepekatan peluang
tersebut berbentuk lonceng yang simetrik pada
µ. Dimana µ merupakan nilai tengah dari X
dan σ merupakan simpangan baku dari X
(Ross 1989). Pembangkitan bilangan acak dari
data yang menyebar normal dilakukan dengan
algoritma Inversion.
METODOLOGI
Penyusunan paket R ini mengikuti kaidah
rekayasa perangkat lunak dengan model air
terjun (waterfall) melalui tahapan-tahapan
sebagai berikut:
1. Analisis dan Identifikasi Kebutuhan
Sistem
Tahap ini bertujuan untuk memperhatikan
kebutuhan pengguna meliputi batasan,
tujuan, masukan, dan keluaran dari
perangkat lunak. Tahapan ini dilakukan
dengan
menggali
informasi
yang
dibutuhkan oleh pengguna perangkat lunak
statistika yang diadopsi dari per angkat
lunak yang sudah ada seperti Minitab,
SPSS, dan SAS.
2. Analisis Perancangan Sistem
Tahap ini bertujuan untuk menentukan
arsitektur sistem secara keseluruhan.
Tahapan ini dilakukan dengan membuat
diagram aliran data dan merancang
antarmuka sistem.
3. Implementasi dan Pengujian Unit
Pada tahap ini rancangan sistem yang
sebelumnya telah dibuat direalisasikan
menjadi serangkaian perangkat lunak
dengan
menggunakan
bahasa
pemrograman. Pembangunan tampilan
antarmuka menggunakan paket tcltk.
Implementasi sistem juga diiringi dengan
pengujian tiap unit sistem untuk melihat
apakah tiap unit telah memenuhi
spesifikasi yang telah ditentukan.
4. Integrasi dan Pengujian Sistem
Pada tahap ini semua unit sistem disatukan
menjadi suatu perangkat lunak yang utuh
5
Analisis dan
identifikasi
kebutuhan
Analisis
perancangan
sistem
Implementasi
dan Pengujian
Unit
Integrasi dan
pengujian
sistem
Operasi dan
pemeliharaan
Gambar 1 Tahapan pengembangan paket AMV 2.0.
serta dilakukan pengujian terhadap
perangkat lunak tersebut. Pengujian
perangkat lunak dilakukan dengan metode
blackbox yaitu dengan membandingkan
keluaran perangkat lunak yang dibuat
dengan keluaran perangkat lunak statistika
yang sudah ada sebelumnya (Minitab,
SPSS, dan SAS).
5. Operasi dan Pemeliharaan
Tahapan ini mencakup koreksi terhadap
kesalahan yang tidak ditemukan pada
tahap sebelumnya dan perbaikan terhadap
kesalahan tanpa membuat sistem baru.
Selain itu, dilakukan juga dokumentasi
perangkat lunak melalui pembuatan User
Manual dan dokumen perangkat lunak
lainnya.
Tahapan pengembangan perangkat lunak
tersebut merupakan suatu siklus dengan aliran
sesuai Gambar 1. Tahapan berikutnya tidak
boleh dimulai sebelum tahapan sebelumnya
selesai (Sommerville 2003).
HASIL DAN PEMBAHASAN
Kebutuhan Sistem
Analisis peubah ganda merupakan salah
satu teknik statistika yang banyak digunakan
dalam berbagai bidang. Proses perhitungan
pada analisis peubah ganda cukup rumit jika
dilakukan secara manual, oleh karena itu
diperlukan
sistem
komputasi
untuk
mempermudahnya. AMV merupakan suatu
sistem berantarmuka user friendly yang dibuat
untuk melakukan prosedur analisis peubah
ganda pada lingkungan R. Adapun analisis
peubah ganda yang disajikan da lam paket
AMV antara lain ialah analisis komponen
utama, analisis faktor, analisis biplot, analisis
gerombol hierarki dan analisis gerombol k means. Selain itu, AMV memiliki fungsi
untuk melakukan uji normal ganda. Pada
paket AMV 2.0 ditambahkan analisis korelasi
kanonik, analisis diskriminan, analisis
diskriminan
kanonik,
dan
a nalisis
korespondensi.
Selain penambahan analisis peubah ganda,
pada AMV 2.0 juga ditambahkan fungsi
kalkulator sebagai alat manipulasi data,
fungsi
membangkitkan bilangan acak
(binomial, seragam, normal), dan fungsi
untuk menampilkan output dalam bentuk
HTML. Impor data
dilengkapi dengan
penambahan ekstensi file dari SPSS,
Ms. Excel 2007, dan Ms. Access, serta file
yang berekstensi .csv dengan pemisahnya
berupa “;”. Ekspor data dilengkapi dengan
penambahan ekstensi file ke SPSS dan ke file
yang berekstensi .csv dengan pemisahnya
berupa “;”. Keterbatasan AMV yang hanya
dapat menggunakan satu dataset saja dalam
6
sistem diatasi dengan
pemilihan dataset.
m
membuat
fungsi
Analisis Perancanga
gan Sistem
Tahapan perancangan ssistem dilakukan
dengan membuat diagram aliran data dan
desain antarmuka untuk sis
sistem yang telah
diidentifikasi sebelumnya.. Diagram aliran
cangan sistem yang
data merupakan alat perancan
ta dengan konsep
berorientasi pada alur data
digunakan
untuk
dekomposisi
dapat
dig
penggambaran analisis maaupun rancangan
omunikasikan oleh
sistem yang mudah dikom
profesional sistem kepada ppemakai maupun
pembuat program.
Pada Gambar 2 dapat dili
ilihat bahwa AMV
2.0
memungkinkan
pe
pengguna
untuk
memasukan data ke dala
alam sis tem dan
menerima hasil pengolahann yyang ditampilkan
ke monitor atau disimpan
an ke dalam file.
Diagram aliran data level
el 1 (Gambar 3)
merupakan dekomposisii sistem secara
keseluruhan yang dibuat oleh
leh tujuh penelitian.
AMV 2.0 hanya menjalank
nkan proses Input
Data (1), proses Manajemeen Data (2), dan
proses Analisis Peubah Ganda
nda (5).
ata level 0.
Gambar 2 Diagram aliran data
didekomposisi
Proses Input Data dapat di
level 2
lagi menjadi diagram aliran data
d
(Lampiran 1) yang tersusun olehh proses Input
por Data (1.2),
Data Langsung (1.1), proses Impo
rsimpan (1.3),
proses Memuat Data yang Tersi
Proses
dan proses Bangkitkan Data (1.4).
(1
Manajemen Data (Lampiran 2) didekomposisi
did
et Aktif (2.1),
lagi menjadi proses Pilih Dataset
proses
proses Edit Dataset Aktif (2.2),
(2
itkan Bilangan
Kalkulator (2.3), proses Bangkitk
(2.5).
Acak (2.4), dan proses Pilih Peubah
Pe
proses
Proses Analisis Peubah Ganda adalah
ad
sudah dibuat oleh AMV sebelumnya.
Ganda
Dekomposisi proses Analisis Peubah
Pe
Gambar 3 Diagram aliran data level 1.
7
menjadi diagram aliran level 2 (Lampiran 3)
pada AMV 2.0 menambahkan proses Analisis
Korelasi Kanonik (5.8), proses Analisis
Diskriminan
(5.9),
proses
Analisis
Diskriminan Kanonik (5.10), proses Analisis
Korespondensi Sederhana (5.11), dan proses
Analisis Korespondensi berganda (5.12).
Proses-proses tersebut dapat didekomposisi
lagi menjadi diagram aliran data level 3 yang
dapat dilihat pada Lampiran 4, 5, 6, 7 dan 8.
Implementasi Sistem
Implementasi
sistem
AMV
2.0
menggunakan program R dan paket tcltk
untuk membuat tampilan anta rmukanya.
Selain itu, implementasi sistem AMV 2.0 juga
memanfaatkan paket-paket lainnya baik paket
standar maupun paket tambahan yang harus
diunduh terlebih dahulu. Nama-nama paket
tersebut tersaji pada Tabel 1.
Tabel 1 Paket-paket yang digunakan dalam
implementasi sistem AMV 2.0
No. Paket
Paket
Tambahan
Standar
1.
RODBC
MASS
2.
tkrplot
foreign
3.
car
Matrix
4.
mvShapiroTest tcltk
5.
R2HTML
6.
zoo
7.
CCA
8.
CCP
9.
candisc
10. ca
Sama seperti AMV sebelumnya, AMV 2.0
tersusun oleh pilihan menu di bagian atas dan
jendela hasil di bawah menu untuk
menampilkan output. Menu AMV 2.0 terdiri
dari lima menu utama yaitu Menu File, Menu
Edit, Menu Data, Menu Statistika dan Menu
Bantuan. Menu Edit merupakan menu baru
yang tidak ada pada AMV sebelumnya.
Skema menu-menu tersebut dapat dilihat pada
Lampiran 9, 10, 11, 12, dan 13. Lingkungan
utama paket AMV 2.0 dapat dilihat pada
Lampiran 14.
Menu File
Menu File terdiri dari delapan submenu
yaitu :
1. Buat Dataset Baru
Submenu ini berfungsi untuk membuat
dataset ke dalam sistem secara manual.
Sebelum membuat dataset, pengguna
harus memberi nama untuk dataset yang
akan dibuatnya tersebut.
2. Memuat Dataset
Submenu ini digunakan untuk memuat
dataset yang tersimpan dalam file R
dengan ekstensi .rda , .Rda , .RDA, atau
.RData.
3. Simpan Dataset
Submenu ini digunakan untuk menyimpan
dataset dalam file R dengan ekstensi .rda,
.Rda, .RDA, atau .RData.
4. Impor Dataset
Submenu ini terdiri dari lima fungsi yait u
“SPSS”, “.csv (,)”, “.csv (;)”, “Ms. Excel”,
dan “Ms. Access”. Fungsi “SPSS”
digunakan untuk mengimpor data dari file
SPSS dengan ekstensi .sav atau .por.
Fungsi “.csv (,)” digunakan untuk
mengimpor data dari file dengan ekstensi
.csv dimana pembatasnya berupa “,”.
Fungsi “.csv (;)” digunakan untuk
mengimpor data dari file dengan ekstensi
.csv dimana pembatasnya berupa “;”.
Fungsi “Ms. Excel” digunakan untuk
mengimpor data dari file Ms. Excel
dengan ekstensi .xlsx atau .xls. Fungsi
“Ms.
Access”
digunakan
untuk
mengimpor data dari file Ms. Access
dengan ekstensi .mdb atau .accdb.
5. Ekspor Dataset
Submenu ini terdiri dari empat fungsi yaitu
“SPSS”, “.csv (,)”, “.csv (;)”, dan “Ms.
Excel 2003”. Fungsi “SPSS” digunakan
untuk mengekspor dataset aktif ke file
SPSS dengan ekstensi .sps. Fungsi “.csv
(,)” digunakan untuk mengekspor dataset
aktif ke file dengan ekstensi .csv dimana
pembatasnya berupa “,”. Fungsi “csv (;)”
digunakan untuk mengekspor dataset aktif
ke file dengan ekstensi .csv dimana
pembatasnya berupa “;”. Fungsi “Ms.
Excel 2003” digunakan untuk mengekspor
dataset aktif ke file Ms. Excel 2003.
6. Simpan Hasil
Submenu ini ini digunakan untuk
menyimpan hasil yang terdapat pada
jendela hasil dalam bentuk teks dengan
ekstensi .txt dan .doc.
7. Hasil HTML
Submenu ini ini digunakan untuk
menampilkan output yang dicetak ke
jendela hasil dalam format HTML. Fungsi
ini aktif jika tombol cek “Tampilkan
output HTML” dan direktori folder terisi.
Jika fungsi ini aktif maka setiap pengguna
mencetak output ke jendela hasil, output
tersebut akan ditampilkan juga oleh
browser yang terdapat pada komputer
pengguna.
8
8. Keluar
Submenu ini ini digunakan untuk keluar
dari sistem AMV 2.0.
Menu Edit
Semua submenu yang ada pada menu ini
hanya berfungsi untuk mengedit jendela hasil.
Submenu-submenu itu antara lain :
1. Cut
Submenu
ini
digunakan
untuk
mengirimkan objek yang terpilih pada
jendela hasil ke clipboard sistem komputer
dan menghapus objek yang terpilih
tersebut pada jendela hasil.
2. Salin
Submenu
ini
digunakan
untuk
mengirimkan objek yang terpilih pada
jendela hasil ke clipboard sistem
komputer. Fungsi ini biasanya digunakan
untuk menyalin objek yang terpilih.
3. Paste
Submenu
ini
digunakan
untuk
menampilkan objek yang ada pada
clipboard sistem komputer ke jendela
hasil. Fungsi ini biasanya digunakan untuk
menampilkan objek yang sudah disalin
sebelumnya.
4. Hapus
Submenu ini digunakan untuk menghapus
objek yang terpilih pada jendela hasil.
5. Undo
Submenu
ini
digunakan
untuk
mengembalikan tampilan je ndela hasil ke
tampilan sebelum tampilan terakhir.
6. Pilih Semua
Submenu ini digunakan untuk memilih
semua objek yang ada pada jendela hasil.
7. Bersihkan Jendela
Submenu ini digunakan untuk menghapus
semua objek yang ada pada jendela hasil.
Menu Data
Menu ini memiliki enam submenu.
Sebagian besar submenu tersebut berfungsi
untuk manajemen data. Submenu tersebut
antara lain :
1. Pilih Dataset Aktif
Submenu ini digunakan untuk memilih
satu dataset aktif. Dataset aktif adalah
dataset yang siap untuk dianalisis. F ungsi
ini memungkinkan sistem AMV 2.0 untuk
menampung lebih dari satu dataset.
2. Lihat Dataset Aktif
Submenu ini digunakan untuk melihat
dataset aktif.
3. Edit Dataset Aktif
Submenu ini digunakan untuk mengedit
dataset aktif.
4. Kalkulator
Submenu
ini
digunakan
un tuk
memanipulasi dataset aktif. Operasi yang
terdapat pada kalkulator yaitu operasi
aritmatika,
trigonometri,
dan
perbandingan.
5. Bangkitkan Bilangan Acak
Submenu ini terdiri dari tiga fungsi yaitu
fungsi membangkitkan bilangan acak
seragam, fungsi membangki tkan bilangan
acak binomial, dan fungsi untuk
membangkitkan bilangan acak normal.
6. Cetak Dataset
Submenu
ini
digunakan
untuk
menampilkan dataset aktif ke dalam
jendela hasil.
Menu Statistika
Menu ini berisi fungsi-fungsi untuk
analisis peubah ganda. Pada menu ini terdapat
delapan
submenu.
Submenu
analisis
gerombol, submenu analisis komponen utama,
submenu analisis faktor, submenu analisis
biplot, dan submenu uji normal ganda
merupakan submenu yang ada pada AMV
sebelumnya, sehingga tidak akan dijelaskan
pada bagian ini. Tiga submenu baru pada
menu statistika antara lain submenu analisis
korelasi
kanonik,
submenu
analisis
diskriminan,
dan
submenu
analisis
korespondensi. Fungsi-fungsi yang terdapat
pada ketiga submenu itu antara lain :
1. Analisis Korelasi Kanonik
Fungsi ini digunakan untuk melakukan
analisis
korelasi
kanonik.
Untuk
menjalankan fungsi ini pengguna harus
mengisi kotak peubah respon dan kotak
peubah prediktor dengan peubah -peubah
yang memiliki jenis data numerik. Pada
fungsi ini terdapat pilihan un tuk
menampilkan skor peubah kanonik untuk
setiap observasi.
Output yang dihasilkan dari fungsi ini
antara lain korelasi kanonik beserta uji
statistiknya, koefisien dari peubah
kanonik, koefisien baku dari peubah
kanonik, korelasi antara peubah kanonik
dengan peubah asalnya, serta skor dari
peubah kanonik untuk semua observasi.
Output skor dari peubah kanonik tidak
ditampilkan di jendela hasil, tetapi
langsung dimasukan ke dataset aktif.
Kotak dialog untuk fungsi ini dapat dilihat
pada Lampiran 15. Sintaks R untuk
melakukan analisis korelasi kanonik
menggunakan fungsi “ cc” yang berasal
dari paket CCA, sementa ra itu untuk
9
melakukan pengujian korelasi kanonik
digunakan fungsi “ p.asym” yang berasal
daru paket CCP. Contoh penggunaan
fungsi-fungsi tersebut adalah sebagai
berikut :
kankor