Program Magister Manajemen Fakultas Ekon
PENGENALAN MS. EXCEL
Pendahuluan
Microsoft Excel atau Microsoft Office Excel adalah sebuah program aplikasi lembar kerja spreadsheet yang dibuat dan didistribusikan oleh Microsoft Corporation
untuk sistem operasi Microsoft Windows dan Mac OS. Aplikasi ini memiliki fitur kalkulasi dan pembuatan grafik yang, dengan menggunakan strategi marketing Microsoft yang agresif, menjadikan Microsoft Excel sebagai salah satu program komputer yang populer digunakan di dalam komputer mikro hingga saat ini. Bahkan, saat ini program ini merupakan program spreadsheet paling banyak digunakan oleh banyak pihak, baik di platform PC berbasis Windows maupun platform Macintosh berbasis Mac OS, semenjak versi 5.0 diterbitkan pada tahun 1993. Aplikasi ini merupakan bagian dari Microsoft Office System, dan versi terakhir adalah versi Microsoft Office Excel 2007 yang diintegrasikan di dalam paket Microsoft Office System 2007 .
Sebelum mulai memasuki pembahasan Microsoft Excel, ada baiknya kita mengenal lebih dulu bagaimana tampilan Microsoft Excel itu, beserta beberapa istilah-istilah umum yang akan digunakan.
Cell
Function Bar
Column Heading
Row Heading
Dalam Microsoft Excel terdapat 4 komponen utama yaitu :
1. Row Heading
Row Heading (Kepala garis), adalah penunjuk lokasi baris pada lembar kerja yang aktif. Row Heading juga berfungsi sebagai salah satu bagian dari penunjuk sel (akan dibahas setelah ini). Jumlah baris yang disediakan oleh Microsoft Excel adalah 65.536 baris.
2. Column Heading
Column Heading
(Kepala kolom), adalah penunjuk lokasi kolom pada lembar kerja yang aktif. Sama halnya dengan Row Heading, Column Heading juga berfungsi sebagai salah satu bagian dari
penunjuk sel (akan dibahas setelah ini). Kolom di simbol dengan abjad A – Z dan gabungannya. Setelah kolom Z, kita akan menjumpai kolom AA, AB sd AZ lalu kolom BA, BB sd BZ begitu seterus sampai kolom terakhir yaitu IV (berjumlah 256 kolom). Sungguh suatu lembar kerja yang sangat besar, bukan. (65.536 baris dengan 256 kolom).
3. Cell Pointer
Cell Pointer (penunjuk sel), adalah penunjuk sel yang aktif. Sel adalah perpotongan antara kolom dengan baris. Sel diberi nama menurut posisi kolom dan baris. Contoh. Sel A1 berarti perpotongan antara kolom A dengan baris 1.
4. Formula Bar
Formula Bar, adalah tempat kita untuk mengetikkan rumus-rumus yang akan kita gunakan nantinya. Dalam Microsoft Excel pengetikkan rumus harus diawali dengan tanda ‘=’ . Misalnya kita ingin menjumlahkan nilai yang terdapat pada sel A1 dengan B1, maka pada formula bar dapat diketikkan =A1+B1 .
Menggerakkan Penunjuk Sel (Cell Pointer)
Cell Pointer berfungsi untuk penunjuk sel aktif. Yang dimaksud dengan sel aktif ialah sel yang akan dilakukan suatu operasi tertentu. Untuk menggerakan ponter dengan Mouse dapat dilakukan dengan meng-klik sel yang diinginkan. Untuk sel yang tidak kelihatan kita dapat menggunakan Scroll Bar untuk menggeser layar hingga sel yang dicari kelihatan lalu klik sel tersebut. Untuk kondisi tertentu kita lebih baik menggunakan keyboard. Berikut daftar tombol yang digunakan untuk menggerakan pointer dengan keyboard :
Pindah satu sel ke kiri, atas, kanan atau bawah
Tab
Pindah satu sel ke kanan
Enter
Pindah satu sel ke bawah
Shift + Tab
Pindah satu sel ke kiri
Shift + Enter
Pindah satu sel ke atas
Home
Pindah ke kolom A pada baris yang sedang dipilih
Ctrl + Home
Pindah ke sel A1 pada lembar kerja yang aktif
Ctrl + End
Pindah ke posisi sel terakhir yang sedang digunakan
PgUp
Pindah satu layar ke atas
PgDn
Pindah satu layar ke bawah
Alt + PgUp
Pindah satu layar ke kiri
Alt + PgDn
Pindah satu layar ke kanan
Ctrl + PgUp
Pindah dari satu tab lembar kerja ke tab lembar berikutnya
Ctrl + PgDn
Pindah dari satu tab lembar kerja ke tab lembar sebelumnya
Format Worksheets
M ENAMBAHKAN BORDER DAN COLOR
Kita dapat menambahkan border pada lembar kerja kita. Caranya adalah dengan memblok terlebih dahulu cell yang akan kita beri border, kemudian klik tombol pada tab home
Kemudian pilihlah jenis border yang diinginkan. Microsoft Excel 2007 menyediakan pula style border yang dapat langsung kita gunakan. Untuk menggunakannya klik tombol CELL STYLES pada tab home :
ME RGE CELLS A LLIGN C ELL C ONTENTS
Microsoft Excel juga menyediakan fasilitas merge cells dan memiliki fungsi yang sama seperti pada Microsoft word. Klik tombol berikut pada tab home.
Dan untuk mengatur alignment klik tombol berikut :
o Menggunakan Rumus (Formula)
Rumus merupakan bagian terpenting dari Program Microsoft Excel , karena setiap tabel dan dokumen yang kita ketik akan selalu berhubungan dengan rumus dan fungsi. Operator matematika yang akan sering digunakan dalam rumus adalah ;
Pengurangan Perkalian Pembagian Perpangkatan
Persentase
Proses perhitungan akan dilakukan sesuai dengan derajat urutan dari operator ini, dimulai dari pangkat (), kali (), atau bagi (), tambah (+) atau kurang (-).
o Menggunakan Fungsi
Fungsi sebenarnya adalah rumus yang sudah disediakan oleh Microsoft Excel, yang akan membantu dalam proses perhitungan. kita tinggal memanfaatkan sesuai dengan kebutuhan. Pada umumnya penulisan fungsi harus dilengkapi dengan argumen, baik berupa angka, label, rumus, alamat sel atau range. Argumen ini harus ditulis dengan diapit tanda kurung ().
Beberapa Fungsi yang sering digunakan:
1. Fungsi Average(…)
Fungsi ini digunakan untuk mencari nilai rata-rata dari sekumpulan data(range). Bentuk umum penulisannya adalah
=AVERAGE(number1,number2,…), dimana number1, number2, dan seterusnya adalah range data yang akan dicari nilai rata-ratanya.
2. Fungsi Logika IF(…)
Fungsi ini digunakan jika data yang dimasukkan mempunyai kondisi tertentu. Misalnya, jika nilai sel A1=1, maka hasilnya 2, jika tidak, maka akan bernilai 0. Biasanya fungsi ini dibantu oleh operator relasi (pembanding) seperti berikut ;
Sama dengan
Lebih kecil dari
Lebih besar dari
Lebih kecil atau sama dengan
Lebih besar atau sama dengan
Tidak sama dengan
3. Fungsi Max(…)
Fungsi ini digunakan untuk mencari nilai tertinggi dari sekumpulan data (range). Bentuk umum penulisannya adalah =MAX(number1,number2,…), dimana number1, number2, dan seterusnya adalah range data (numerik) yang akan dicari nilai tertingginya.
4. Fungsi Min(…)
Sama halnya dengan fungsi max, bedanya fungsi min digunakan untuk mencari nilai terendah dari sekumpulan data numerik.
5. Fungsi Sum(…)
Fungsi SUM digunakan untuk menjumlahkan sekumpulan data pada suatu range. Bentuk umum penulisan fungsi ini adalah =SUM(number1,number2,…). Dimana number1, number2 dan seterusnya adalah range data yang akan dijumlahkan.
6. Fungsi Left(…)
Fungsi left digunakan untuk mengambil karakter pada bagian sebelah kiri dari suatu teks. Bentuk umum penulisannya adalah =LEFT(text,num_chars). Dimana text Fungsi left digunakan untuk mengambil karakter pada bagian sebelah kiri dari suatu teks. Bentuk umum penulisannya adalah =LEFT(text,num_chars). Dimana text
7. Fungsi Mid(…)
Fungsi ini digunakan untuk mengambil sebagian karakter bagian tengah dari suatu teks. Bentuk umum pemakaian fungsi ini adalah =MID(text,start_num,num_chars).
Artinya mengambil sejumlah karakter mulai dari start_num, sebanyak num_char.
8. Fungsi Right(…)
Fungsi ini merupakan kebalikan dari fungsi left, kalau fungsi left mengambil sejumlah karakter dari sebelah kiri, maka fungsi mengambil sejumlah karakter dari sebelah kanan teks.. Bentuk umum penulisannya adalah =RIGHT(text,num_chars). Dimana text adalah data yang akan diambil sebagian karakternya dari sebelah kanan, num_chars adalah jumlah karakter yang akan diambil.
9. Fungsi HLOOKUP dan VLOOKUP
Fungsi HLOOKUP dan VLOOKUP digunakan untuk membaca suatu tabel secara horizontal (VLOOKUP) atau secara vertikal (VLOOKUP). Bentuk umum penulisan fungsi ini adalah :
=HLOOKUP(Lookup_value, Table_array, Row_index_num,…) =VLOOKUP(Lookup_value, Table_array, Col_index_num,…)
Dari rumus diatas, dapat dilihat bahwa bedanya hanya pada nomor indeksnya saja, kalau kita pakai HLOOKUP, maka digunakan nomor indeks baris (Row_index_num), tapi kalu pakai VLOOKUP digunakan nomor indeks kolom (Col_index_num). Nomor indeks adalah angka untuk menyatakan posisi suatu kolombaris dalam tabel yang dimulai dengan nomor 1 untuk kolombaris pertama dalam range data tersebut.
o Menggunakan GRAFIK
Salah satu fungsi unggul dalam Ms Excel 2007 adalah grafik dimana dapat melihat hasil tabel diubah menjadi ke dalam grafik dengan cepat. Dengan fungsi grafik para ilmuwan dapat menampilkan data mereka. Ms Excel menyediakan berbagai macam bentuk grafik yang mencakupi Line, XY, Column, Bar, Batang, Area, Stock, dan sebagainya. Grafik dapat dilihat dalam menu INSERT sebagai berikut.
Setelah klik tombol
, maka akan muncul menu sebagai berikut :
Klik tombol ini
Setelah masuk ke Insert Chart, maka silakan pilih jenis grafik yang anda inginkan sesuai selera anda. Jika sudah terpilih jenis Chart yang anda inginkan, silakan klik OK. Namun, karena membuat grafik perlu sebuah tabel data untuk menampilkan grafiknya.
Analisis Regresi Linear Berganda dan Riskan Simulator
1. Analisis Regresi Linear Berganda
Regresi linear adalah alat statistik yang dipergunakan untuk mengetahui pengaruh antara satu atau beberapa variabel terhadap satu buah variabel. Variabel yang mempengaruhi sering disebut variabel bebas, variabel independen atau variabel penjelas. Variabel yang dipengaruhi sering disebut dengan variabel terikat atau variabel dependen.
Secara umum regresi linear terdiri dari dua, yaitu regresi linear sederhana yaitu dengan satu buah variabel bebas dan satu buah variabel terikat; dan regresi linear berganda dengan beberapa variabel bebas dan satu buah variabel terikat. Variabel independen adalah variabel yang menjelaskan atau mempengaruhi variabel lain. Sedangkan variabel dependen adalah variabel yang dijelaskan atau dipengaruhi oleh variabel independen. Analisis regresi linear merupakan metode statistik yang paling jamak dipergunakan dalam penelitian- penelitian sosial, terutama penelitian ekonomi. Program komputer yang paling banyak digunakan adalah SPSS (Statistical Package For Service Solutions). Model regresi linear berganda pada umumnya sebagai berikut :
Y=a+b 1 X 1 +b 2 X 2 +b 3 X 3 +…+b n X n
Keterangan: Y
: variabel terikat (dependent variable)
X 1 ,X 2 , … ,X n
: variabel bebas (independent variable)
a : konstanta
b 1 ,b 2 , … ,b n
: koefisien variabel
Tujuan menggunakan analisis regresi ialah
Membuat estimasi rata-rata dan nilai variabel tergantung dengan didasarkan pada
nilai variabel bebas. Menguji hipotesis karakteristik dependensi Untuk meramalkan nilai rata-rata variabel bebas dengan didasarkan pada nilai
variabel bebas diluar jangkaun sample.
Penggunaan regresi linear didasarkan pada asumsi diantaranya sbb:
Model regresi harus linier dalam parameter Variabel bebas tidak berkorelasi dengan disturbance term (Error) .
Nilai disturbance term sebesar 0 atau dengan simbol sebagai berikut:
(E(UX)=0. Varian untuk masing-masing error term (kesalahan) konstan Tidak terjadi otokorelasi Model regresi dispesifikasi secara benar. Tidak terdapat bias spesifikasi dalam
model yang digunakan dalam analisis empiris. Jika variabel bebas lebih dari satu, maka antara variabel bebas (explanatory) tidak
ada hubungan linier yang nyata Model kelayakan regresi linear didasarkan pada hal-hal sebagai berikut: Model regresi dikatakan layak jika angka signifikansi pada ANOVA sebesar <
0.05 Prediktor yang digunakan sebagai variabel bebas harus layak. Kelayakan ini
diketahui jika angka Standard Error of Estimate < Standard Deviation
Koefesien regresi harus signifikan. Pengujian dilakukan dengan Uji T. Koefesien
regresi signifikan jika T hitung > T table (nilai kritis) Tidak boleh terjadi multikolinieritas, artinya tidak boleh terjadi korelasi yang
sangat tinggi atau sangat rendah antar variabel bebas. Syarat ini hanya berlaku untuk regresi linier berganda dengan variabel bebas lebih dari satu.
Tidak terjadi otokorelasi. Terjadi otokorelasi jika angka Durbin dan Watson (DB)
sebesar < 1 dan > 3 Keselerasan model regresi dapat diterangkan dengan menggunakan nilai r 2 semakin
besar nilai tersebut maka model semakin baik. Jika nilai mendekati 1 maka model regresi semakin baik. Nilai r 2 mempunyai karakteristik diantaranya: 1) selalu positif,
2 2) Nilai r 2 maksimal sebesar 1. Jika Nilai r
sebesar 1 akan mempunyai arti
kesesuaian yang sempurna. Maksudnya seluruh variasi dalam variabel Y dapat diterangkan oleh model regresi. Sebaliknya jika r 2 sama dengan 0, maka tidak ada
hubungan linier antara X dan Y. Terdapat hubungan linier antara variabel bebas (X) dan variabel tergantung (Y) Data harus berdistribusi normal. Data berskala interval atau rasio. Kedua variabel bersifat dependen, artinya satu variabel merupakan variabel bebas
(disebut juga sebagai variabel predictor) sedang variabel lainnya variabel tergantung (disebut juga sebagai variabel response).
Model dikatakan baik menurut Gujarati (2006), jika memenuhi beberapa kriteria seperti di bawah ini:
Parsimoni: Suatu model tidak akan pernah dapat secara sempurna menangkap
realitas; akibatnya kita akan melakukan sedikit abstraksi ataupun penyederhanaan dalam pembuatan model.
Mempunyai Identifikasi Tinggi: Artinya dengan data yang ada, parameter-
parameter yang diestimasi harus mempunyai nilai-nilai yang unik atau dengan kata lain, hanya akan ada satu parameter saja.
Keselarasan (Goodness of Fit): Tujuan analisis regresi ialah menerangkan
sebanyak mungkin variasi dalam variabel tergantung dengan menggunakan variabel bebas dalam model. Oleh karena itu, suatu model dikatakan baik jika eksplanasi
diukur dengan menggunakan nilai adjusted r 2 yang setinggi mungkin.
Konsitensi Dalam Teori: Model sebaiknya segaris dengan teori. Pengukuran tanpa
teori akan dapat menyesatkan hasilnya. Kekuatan Prediksi: Validitas suatu model berbanding lurus dengan kemampuan
prediksi model tersebut. Oleh karena itu, pilihlah suatu model yang prediksi teoritisnya berasal dari pengalaman empiris.
Uji asumsi klasik
Uji asumsi klasik adalah persyaratan statistik yang harus dipenuhi pada analisis regresi linear berganda yang berbasis ordinary least square (OLS). Jadi analisis regresi yang tidak berdasarkan OLS tidak memerlukan persyaratan asumsi klasik, misalnya regresi logistik atau regresi ordinal. Demikian juga tidak semua uji asumsi klasik harus dilakukan pada analisis regresi linear, misalnya uji multikolinearitas tidak dapat dipergunakan pada Uji asumsi klasik adalah persyaratan statistik yang harus dipenuhi pada analisis regresi linear berganda yang berbasis ordinary least square (OLS). Jadi analisis regresi yang tidak berdasarkan OLS tidak memerlukan persyaratan asumsi klasik, misalnya regresi logistik atau regresi ordinal. Demikian juga tidak semua uji asumsi klasik harus dilakukan pada analisis regresi linear, misalnya uji multikolinearitas tidak dapat dipergunakan pada
Uji asumsi klasik juga tidak perlu dilakukan untuk analisis regresi linear yang bertujuan untuk menghitung nilai pada variabel tertentu. Misalnya nilai return saham yang dihitung
dengan market model, atau market adjusted model. Perhitungan nilai return yang diharapkan dilakukan dengan persamaan regresi, tetapi tidak perlu diuji asumsi klasik.
Setidaknya ada lima uji asumsi klasik, yaitu uji multikolinearitas, uji heteroskedastisitas, uji normalitas, uji autokorelasi dan uji linearitas. Tidak ada ketentuan yang pasti tentang urutan uji mana dulu yang harus dipenuhi. Analisis dapat dilakukan tergantung pada data yang ada. Sebagai contoh, dilakukan analisis terhadap semua uji asumsi klasik, lalu dilihat mana yang tidak memenuhi persyaratan. Kemudian dilakukan perbaikan pada uji tersebut, dan setelah memenuhi persyaratan, dilakukan pengujian pada uji yang lain.
1. Uji Normalitas
Uji normalitas adalah untuk melihat apakah nilai residual terdistribusi normal atau tidak. Model regresi yang baik adalah memiliki nilai residual yang terdistribusi normal. Jadi uji normalitas bukan dilakukan pada masing-masing variabel tetapi pada nilai residualnya. Sering terjadi kesalahan yang jamak yaitu bahwa uji normalitas dilakukan pada masing- masing variabel. Hal ini tidak dilarang tetapi model regresi memerlukan normalitas pada nilai residualnya bukan pada masing-masing variabel penelitian.
Pengertian normal secara sederhana dapat dianalogikan dengan sebuah kelas. Dalam kelas siswa yang bodoh sekali dan pandai sekali jumlahnya hanya sedikit dan sebagian besar berada pada kategori sedang atau rata-rata. Jika kelas tersebut bodoh semua maka tidak normal, atau sekolah luar biasa. Dan sebaliknya jika suatu kelas banyak yang pandai maka kelas tersebut tidak normal atau merupakan kelas unggulan. Pengamatan data yang normal akan memberikan nilai ekstrim rendah dan ekstrim tinggi yang sedikit dan kebanyakan mengumpul di tengah. Demikian juga nilai rata-rata, modus dan median relatif dekat.
Uji normalitas dapat dilakukan dengan uji histogram, uji normal P Plot, uji Chi Square, Skewness dan Kurtosis atau uji Kolmogorov Smirnov. Tidak ada metode yang paling baik atau paling tepat. Tipsnya adalah bahwa pengujian dengan metode grafik sering menimbulkan perbedaan persepsi di antara beberapa pengamat, sehingga penggunaan uji normalitas dengan uji statistik bebas dari keragu-raguan, meskipun tidak ada jaminan bahwa pengujian dengan uji statistik lebih baik dari pada pengujian dengan metode grafik.
Jika residual tidak normal tetapi dekat dengan nilai kritis (misalnya signifikansi Kolmogorov Smirnov sebesar 0,049) maka dapat dicoba dengan metode lain yang mungkin memberikan justifikasi normal. Tetapi jika jauh dari nilai normal, maka dapat dilakukan beberapa langkah yaitu: melakukan transformasi data, melakukan trimming data outliers atau menambah data observasi. Transformasi dapat dilakukan ke dalam bentuk Logaritma natural, akar kuadrat, inverse, atau bentuk yang lain tergantung dari bentuk kurva normalnya, apakah condong ke kiri, ke kanan, mengumpul di tengah atau menyebar ke samping kanan dan kiri.
2. Uji Multikolinearitas
Uji multikolinearitas adalah untuk melihat ada atau tidaknya korelasi yang tinggi antara variabel-variabel bebas dalam suatu model regresi linear berganda. Jika ada korelasi yang tinggi di antara variabel-variabel bebasnya, maka hubungan antara variabel bebas terhadap variabel terikatnya menjadi terganggu. Sebagai ilustrasi, adalah model regresi dengan variabel bebasnya motivasi, kepemimpinan dan kepuasan kerja dengan variabel terikatnya adalah kinerja. Logika sederhananya adalah bahwa model tersebut untuk mencari pengaruh antara motivasi, kepemimpinan dan kepuasan kerja terhadap kinerja. Jadi tidak boleh ada korelasi yang tinggi antara motivasi dengan kepemimpinan, motivasi dengan kepuasan kerja atau antara kepemimpinan dengan kepuasan kerja.
Alat statistik yang sering dipergunakan untuk menguji gangguan multikolinearitas adalah dengan variance inflation factor (VIF), korelasi pearson antara variabel-variabel bebas, atau dengan melihat eigenvalues dan condition index (CI).
Beberapa alternatif cara untuk mengatasi masalah multikolinearitas adalah sebagai berikut:
1. Mengganti atau mengeluarkan variabel yang mempunyai korelasi yang tinggi.
2. Menambah jumlah observasi.
3. Mentransformasikan data ke dalam bentuk lain, misalnya logaritma natural, akar kuadrat atau bentuk first difference delta.
4. Dalam tingkat lanjut dapat digunakan metode regresi bayessian yang masih jarang sekali digunakan.
3. Uji Heteroskedastisitas
Uji heteroskedastisitas adalah untuk melihat apakah terdapat ketidaksamaan varians dari residual satu ke pengamatan ke pengamatan yang lain. Model regresi yang memenuhi persyaratan adalah di mana terdapat kesamaan varians dari residual satu pengamatan ke pengamatan yang lain tetap atau disebut homoskedastisitas.
Deteksi heteroskedastisitas dapat dilakukan dengan metode scatter plot dengan memplotkan nilai ZPRED (nilai prediksi) dengan SRESID (nilai residualnya). Model yang baik didapatkan jika tidak terdapat pola tertentu pada grafik, seperti mengumpul di tengah, menyempit kemudian melebar atau sebaliknya melebar kemudian menyempit. Uji statistik yang dapat digunakan adalah uji Glejser, uji Park atau uji White.
Beberapa alternatif solusi jika model menyalahi asumsi heteroskedastisitas adalah dengan mentransformasikan ke dalam bentuk logaritma, yang hanya dapat dilakukan jika semua data bernilai positif. Atau dapat juga dilakukan dengan membagi semua variabel dengan variabel yang mengalami gangguan heteroskedastisitas.
4. Uji Autokorelasi
Uji autokorelasi adalah untuk melihat apakah terjadi korelasi antara suatu periode t dengan periode sebelumnya (t -1). Secara sederhana adalah bahwa analisis regresi adalah untuk
melihat pengaruh antara variabel bebas terhadap variabel terikat, jadi tidak boleh ada korelasi antara observasi dengan data observasi sebelumnya. Sebagai contoh adalah pengaruh antara tingkat inflasi bulanan terhadap nilai tukar rupiah terhadap dollar. Data tingkat inflasi pada bulan tertentu, katakanlah bulan Februari, akan dipengaruhi oleh tingkat inflasi bulan Januari. Berarti terdapat gangguan autokorelasi pada model tersebut.
Contoh lain, pengeluaran rutin dalam suatu rumah tangga. Ketika pada bulan Januari suatu keluarga mengeluarkan belanja bulanan yang relatif tinggi, maka tanpa ada pengaruh dari apapun, pengeluaran pada bulan Februari akan rendah.
Uji autokorelasi hanya dilakukan pada data time series (runtut waktu) dan tidak perlu dilakukan pada data cross section seperti pada kuesioner di mana pengukuran semua
variabel dilakukan secara serempak pada saat yang bersamaan. Model regresi pada penelitian di Bursa Efek Indonesia di mana periodenya lebih dari satu tahun biasanya memerlukan uji autokorelasi.
Beberapa uji statistik yang sering dipergunakan adalah uji Durbin-Watson, uji dengan Run Test dan jika data observasi di atas 100 data sebaiknya menggunakan uji Lagrange Multiplier. Beberapa cara untuk menanggulangi masalah autokorelasi adalah dengan mentransformasikan data atau bisa juga dengan mengubah model regresi ke dalam bentuk persamaan beda umum (generalized difference equation). Selain itu juga dapat dilakukan dengan memasukkan variabel lag dari variabel terikatnya menjadi salah satu variabel bebas, sehingga data observasi menjadi berkurang 1.
5. Uji Linearitas
Uji linearitas dipergunakan untuk melihat apakah model yang dibangun mempunyai hubungan linear atau tidak. Uji ini jarang digunakan pada berbagai penelitian, karena biasanya model dibentuk berdasarkan telaah teoretis bahwa hubungan antara variabel bebas dengan variabel terikatnya adalah linear. Hubungan antar variabel yang secara teori bukan merupakan hubungan linear sebenarnya sudah tidak dapat dianalisis dengan regresi linear, misalnya masalah elastisitas.
Jika ada hubungan antara dua variabel yang belum diketahui apakah linear atau tidak, uji linearitas tidak dapat digunakan untuk memberikan adjustment bahwa hubungan tersebut bersifat linear atau tidak. Uji linearitas digunakan untuk mengkonfirmasikan apakah sifat linear antara dua variabel yang diidentifikasikan secara teori sesuai atau tidak dengan hasil observasi yang ada. Uji linearitas dapat menggunakan uji Durbin-Watson, Ramsey Test atau uji Lagrange Multiplier.
Metode analisis regresi linear dengan variabel moderating :
1. Multiple Regression Analysis (MRA) Metode ini dilakukan dengan menambahkan variabel perkalian antara variabel bebas dengan variabel moderatingnya, sehingga persamaan umumnya adalah sebagai berikut: Y = a + b1 X1 + b2 X2 + b3 X1 X2 dengan Y adalah kinerja, X1 adalah kepuasan kerja, X2 kompensasi dan X1 X2 adalah perkalian antara kepuasan kerja dengan kompensasi. Hipotesis moderating diterima jika variabel X1 X2 mempunyai pengaruh signifikan terhadap Y, tidak tergantung apakah X1 dan X2 mempunyai pengaruh terhadap Y atau tidak. Model ini biasanya menyalahi asumsi multikolinearitas atau adanya korelasi yang tinggi antara variabel bebas dalam model regresi, sehingga menyalahi asumsi klasik. Hampir tidak ada model MRA yang terbebas dari masalah multikolinearitas, sehingga sebenarnya model ini tidak disarankan untuk dipergunakan.
2. Absolut residual Model ini mirip dengan MRA, tetapi variabel moderating didekati dengan selisih mutlak
(absolut residual) antara variabel bebas dengan variabel moderatingnya. Penerimaan hipotesis juga sama, dan model ini masih riskan terhadap gangguan multikolinearitas
meskipun risiko itu lebih kecil dari pada dengan metode MRA.
3. Residual Model ini menggunakan konsep lack of fit yaitu hipotesis moderating diterima terjadi jika terdapat ketidakcocokan dari deviasi hubungan linear antara variabel independen. Langkahnya adalah dengan meregresikan antara kepuasan kerja terhadap kompensasi dan dihitung nilai residualnya. Pada program SPSS dengan klik Save pada regreesion, lalu klik pada usntandardized residual. Nilai residual kemudian diambil nilai absolutnya lalu diregresikan antara kinerja terhadap absolut residual. Hipotesis moderating diterima jika nilai t hitung adalah negatif dan signifikan. Model ini terbebas dari gangguan multikolinearitas karena hanya menggunakan satu variabel bebas.
Output pertama yang dihasilkan oleh analisis regresi adalah Koefisien Korelasi Pearson Product-Moment. Koefisien ini yang menunjukkan derajat hubungan antara variabel X (customer experience) dan variabel Y (customer loyalty). Koefisien korelasi selalu di antara 1 dan -1 (-1 ≤ r ≤ +1).
Untuk menghitung Koefisien Korelasi Pearson Product-Moment secara manual, yaitu dengan:
Rumus Pearson Product-Moment Correlation:
n XY X Y
Keterangan Notasi: r=
[ n = Nilai Korelasi Pearson ( X ) ] [ n - ( Σ Y ) ]
r
X = Jumlah hasil pengamatan variabel X Y = Jumlah hasil pengamatan variabel Y XY = Jumlah dari hasil kali pengamatan variabel X dan variabel Y n X = Jumlah dari hasil pengamatan variabel X yang telah dikuadratkan
n Y = Jumlah dari hasil pengamatan variabel Y yang telah dikuadratkan
Tanda positif dan tanda negatif masing-masing menunjukkan hubungan positif dan hubungan negatif. Hubungan positif yaitu apabila semakin tinggi nilai variabel X (customer loyalty), maka semakin tinggi pula nilai variabel Y (customer loyalty), atau sebaliknya. Hubungan negatif yaitu apabila semakin tinggi nilai variabel X (customer loyalty), maka semakin rendah nilai variabel Y (customer loyalty), atau sebaliknya (Aaker, 2003: 510-511).
Bila ingin menghitung koefisien
a dan b secara manual, maka digunakan metode
kuadrat terkecil dengan rumus, (Sudjana, 2005:315):
Y
X XY
a
Program Magister Manajemen Fakultas Ekonomi Universitas Padjadjaran ©2010 n X
Keterangan :
n
= Banyaknya sampel
∑X
= Jumlah hasil pengamatan variabel X
∑Y
= Jumlah hasil pengamatan variabel Y ∑XY = Jumlah dari hasil kali pengamatan variabel X dengan variabel Y
∑X 2 = Jumlah dari hasil pengamatan variabel X yang telah dikuadratkan ∑Y 2 = Jumlah dari hasil pengamatan variabel Y yang telah dikuadratkan
Jika a berharga negatif, maka potongan garis a berada di bawah titik asal pada sumbu tegak. Koefisien b merupakan koefisien arah regresi, yang menyatakan berubahnya harga Y untuk setiap penambahan unit X. Jika b positif, maka garis regresinya condong ke sebelah kanan dan ini menyatakan bahwa rata-rata pertambahan Y untuk setiap unit pertambahan X. Jika b negatif, maka garis regresinya condong ke sebelah kiri dan ini menyatakan bahwa rata-rata berkurangnya Y untuk setiap pertambahan unit X, (Sudjana, 2005: 318).
Tabel 1 Pedoman Interpretasi terhadap Koefisien Korelasi Interval Koefisien
Tingkat Hubungan
0,00 – 0,199
Sangat rendah
Sangat kuat
Sumber: Sugiyono, 2006:183
Contoh soal :
Dalam menghitung potensi pajak suatu daerah dapat diukur menggunakan variabel Produk Domestik Regional Bruto (PDRB), jumlah penduduk, mobil penumpang, mobil barang, dan bus. Dari hasil penelitian diperoleh data pada Tabel 2.
Tentukan :
a) Persamaan regresinya dan interpretasikan artinya.
b) Tentukan koefisien korelasi, koefisien determinasi, dan koefisien non determinasi, serta interpretasikan artinya.
c) Tentukan persamaan regresi lower bound dan upper bound.
Langkah penyelesaian menggunakan SPSS v16 for windows
1. Buka source data di Desktop, nama file data : data pajak indonesia.xls
2. Buka SPSS v16 for windows.
3. Drag semua data (Pajak, PDRB, Penduduk, Mobil Penumpang, Mobil Barang, Bus, dan Sepeda Motor), kemudian copy (ctrl+c) dan paste (ctrl+v) pada data view SPSS.
4. Variabel dengan nama Pajak, PDRB, Penduduk, Mobil Penumpang, Mobil Barang, Bus, dan Sepeda Motor boleh diganti dengan
Adapun langkah-langkah analisis regresi linier sederhana dengan menggunakan Software SPSS 16 for Windows adalah sebagai berikut:
1. Pada Data View masukkan data variabel X (customer experience) dan variabel Y (customerloyalty).
2. Pilih Analyze, kemudian pilih Regression, lalu pilih Linear.
3. Masukkan variabel Y (pajak) ke dalam kotak Dependent.
4. Masukkan variabel X () ke dalam kotak Independent.
5. Pilih kotak Method, biarkan default pada metode Enter.
6. Abaikan kotak Selection Variable, Case Label, dan WLS Weight.
7. Klik Options, dan akan keluar kotak dialog Options.
8. Pada Stepping Method Criteria, pilih Uji F, lalu ketik pada Entry.05
9. Include constant in equation telah terpilih.
10. Pada Missing Values, pilih Exclude case listwise.
11. Klik Continue untuk melanjutkan ke kotak dialog utama.
12. Klik Statistics. Setelah muncul kotak Statistics, biarkan saja Estimates dan Model Fit yang telah terpilih secara default. Selanjutnya klik Descriptives.
13. Pada Residuals, klik Casewise diagnostics dan klik All Cases.
14. Klik Continue untuk melanjutkan.
15. Klik Plots, dan akan muncul kotak dialog Plots.
16. Klik SDRESID dan masukkan ke pilihan Y. Selanjutnya klik ZPRED, masukkan ke pilihan X. Lalu klik Next untuk melanjutkan ke pilihan kedua.
17. Masukkan ZPRED ke pilihan Y, lalu masukkan DEPENDENT ke pilihan X. Klik Next.
18. Pada Standardized Residual Plot, klik kotak di depan Normal Probability Plot.
19. Klik Continue, lalu tekan OK. (Triton, 2006: 120-124)
Dengan Ms. Excel
1. Klik DATA -> Data Analysis -> pilih Regression
2. Kemudian akan keluar dialog box seperti di samping :
Masukkan nilai Y pada kolom Input Y Range
dan nilai X 1 dan X 2 pada kolom Input X Range
Klik pilihan seperti pada gambar Pilih OK
3. Akan diperoleh hasil seperti pada gambar di bawah ini :
4. Sehingga diperoleh nilai b 0 ,b 1 , dan b 2 berurutan 4.131236, -0.5221258, dan
0,1490239.
5. Susun persamaan :
Y = 4.131236 – 0.52213 X 1 + 0.149024 X 2
Riskan Simulator
Pada masa lalu simulasi dijadikan cara terakhir, yang hanya digunakan jika metode analitik tidak dapat menyelesaikan masalah. Namun pada saat ini simulasi merupakan salah satu
alat yang sering digunakan untuk analisa kuantitatif. Mengapa model simulasi begitu populer ?
1. Model analitik sulit diperoleh, tergantung dari faktor kerumitan dari setiap spesifikasi model, misalnya untuk model capital budgeting (penganggaran modal) meliputi tingkat permintaan yang bersifat tidak pasti, untuk model inventory (persediaan) meliputi tingkat persediaan yang tidak pasti.
2. Model analitik biasanya hanya digunakan untuk memprediksi memperkirakan rata-rata atau sesuatu yang bersifat “steady-state” (tidak berubah terhadap waktu). Dalam memodelkan dunia nyata perlu adanya kemungkinan variasi terhadap pengamatan, atau bagaimana melakukan pengamatan untuk data yang bervariasi.
3. Simulasi dapat dilakukan dengan bermacam-macam software, dari spreadsheet itu sendiri (Excel, Lotus), spreadsheet add-ins (Crystal Ball, Risk), bahasa pemrograman komputer secara umum (PASCAL, C++) sampai dengan bahasa khusus untuk simulasi (SIMAN). Kemampuan model simulasi untuk mengatasi kerumitan, variasi pelaksanaan pengamatan, dan reproduksi perilaku yang berubah-ubah membuat simulasi itu menjadi alat yang sangat berguna (powerful).
SIMULASI DAN VARIABEL RANDOM
Simulasi adalah proses untuk menyelidiki perilaku sistem nyata dengan menggunakan model yang meniru perilaku sistem tersebut. Suatu model simulasi dibuat dengan mengidentifikasi pernyataan matematis dan hubungan logis yang mendeskripsikan operasional sistem. Secara umum komputer digunakan untuk mengerjakan perhitungan dalam simulasi. Simulasi berbeda dengan optimisasi. Nilai variabel keputusan pada model optimisasi merupakan output, yang berarti model menghasilkan sejumlah nilai untuk variabel tersebut yang akan memaksimumkan (atau meminimumkan) harga dari fungsi tujuan. Pada model simulasi nilai dari variabel keputusan merupakan input, yang berarti model mengevaluasi fungsi tujuan untuk beberapa buah nilai masukan. Model simulasi seringkali digunakan untuk menganalisa suatu keputusan yang berisiko (decision under risk), dimana perilaku dari satu faktor atau lebih tidak diketahui dengan pasti. Contoh : permintaan produk untuk bulan depan, kembalinya modal investasi, jumlah truk yang akan tiba esok hari untuk bongkar muatan selama jam 8:00 dan 9:00 pagi dan sebagainya. Pada beberapa kasus, faktor yang tidak diketahui secara pasti dikenal sebagai variabel
random. Perilaku variabel random digambarkan sebagai distribusi peluang (probability
distribution).
Simulasi jenis ini disebut Metode Riskan Simulator, seperti putaran rollet di Riskan Simulator, dimana dapat dianggap sebagai alat yang menimbulkan kejadian acak atau tidak
pasti.
MENGHASILKAN VARIABEL RANDOM
Ada 2 jenis variabel random :
Variabel random diskrit : sesuatu yang pasti (contoh bilangan bulat)
Variabel random kontinu : dapat berupa bilangan pecahan (yang jumlah kemungkinannya tidak terbatas).
Contoh penghasil variabel random : Game spinner (lihat Gambar 5.1) dapat digunakan untuk mensimulasikan permintaan. Misalnya 10 peluang permintaan sama dengan 8,
20 peluang permintaan sama dengan 9, 30 peluang permintaan sama dengan 10, 20 peluang permintaan sama dengan 11, 10 peluang permintaan sama dengan 12, 10 peluang permintaan sama dengan 13. Pada saat piringan berhenti, lihat sektor yang ditunjukkan, misalnya 9 berarti tingkat permintaan sama dengan 9.
Gambar Game Spinner
MENGGUNAKAN PEMBANGKIT ANGKA RANDOM PADA SPREADSHEET
Meskipun game spinner mudah dimengerti, metode ini mempunyai kekurangan bila dilakukan percobaan ribuan kali atau jika prosesnya dilakukan dengan menggunakan komputer. Untuk alasan tersebut dikembangkan Random Number Generator (RNG) (pembangkit angka random) pada spreadsheet.
Untuk menghasilkan tingkat permintaan, yang pertama dilakukan adalah menentukan range dari bilangan random untuk masing-masing permintaan yang mungkin. Total nilai yang dipilih untuk permintaan harus sama dengan peluang dari permintaan itu (lihat Tabel).
Tabel Hubungan Antara Bilangan Random dengan Tingkat Permintaan
Demand Number
RUMUS UNTUK MENGHASILKAN BILANGAN RANDOM
Untuk menghasilkan bilangan random pada Excel digunakan rumus :
INT(x – y +1)RAND())
Misalnya : INT (5RAND()) akan memberikan bilangan random kontinu antara 0 dan 5, INT (8+5RAND()) akan menghasilkan bilangan kontinu antara 8 dan 13 (yaitu lebih dari 12.99999…).
Tabel Menggunakan RAND() Untuk Menghasilkan Permintaan Diskrit
Values for RAND()
=INT(8+5RAND())
RUMUS LAIN
=-20LN(1-RAND()) akan menghasilkan distribusi bilangan random eksponensial dengan
rata-rata 20. =NORMINV(RAND(),1000,100) akan menghasilkan bilangan random berdistribusi
normal dengan rata-rata 1000 dan standar deviasi 100 di Excel
SIMULASI DENGAN SPREADSHEET ADD-INS RISKAN SIMULATOR
June Wilson adalah seorang manajer pengembangan produk baru, dimana sedang mempertimbangkan kemungkinan untuk penambahan dalam daftar alat berat PROTRAC. Biaya yang diperlukan untuk model G-9 (dimana di dalamnya tercakup pembelian beberapa peralatan baru, pelatihan karyawan baru dan sebagainya) diperkirakan 150.000. Produk baru akan dijual dengan harga 35.000 per unit. Biaya perbaikan tiap tahun diperkirakan 15.000. Variabel biaya sebesar 72 dari revenue tiap tahun. Depresiasi peralatan baru sebesar 10.000 per tahun setelah 4 tahun masa produksi yang diharapkan dari G-9. Nilai sisa dari peralatan setelah 4 tahun adalah tidak pasti, June memperkirakannya sama dengan 0. Biaya modal dari PROTRAC adalah 10 dan tingkat pajak 34.
(1) Berapakah expected value dari NPV? (2) Berapa kemungkinan NPV diasumsikan mempunyai nilai negatif?
SIMULASI DENGAN SPREADSHEET ADD-INS RISKAN SIMULATOR
Untuk menjawab dua pertanyaan diatas, maka perlu dibuat modelnya terlebih dahulu seperti yang telihat pada gambar 2.
Gambar
Spreadsheet Wilson dengan Permintaan yang Dipilih Secara Random
MENGEVALUASI PROPOSAL
1. Klik pada sel B21 (sel NPV).
2. Klik pada menu ORBS Define Cell.
3. Klik menu ORBS Preferences dan ubah “Trial” menjadi 1000.
Gambar Kotak dialog preferensi
4. Kemudian pilih menu ORBS Run dan setelah ORBS melakukan 1000 iterasi akan muncul sheet baru dengan nama Result. Dalam sheet Result terdapat tabel distribusi frekuensi beserta grafik dan deskriftif statistik.
Gambar Hasil dari simulasi ORBS
Downside Risk dan Upside Risk
June juga ingin mengetahui kemungkinan terbaik dan terburuk. Pada tampilan yang sama (Gambar 4), NPV terbesar adalah 49,068 dan yang terkecil adalah (24,156). Hal ini memberi June ide yang lebih baik tentang jangkauan NPV yang mungkin terjadi (73,224). Pada Gambar 5 dapat dilihat berapa persen kemungkinan NPV akan negatif yaitu 19,7.
Gambar 5 Persentase ORBS
Berikut ini merupakan kesimpulan dan komentar dari beberapa aspek yang telah dibahas adalah sebagai berikut :
1. Simulator spreadsheet memerlukan parameter dan keputusan sebagai input dan hasil perhitungan sebagai suatu output.
2. Masing-masing iterasi dari simulator spreadsheet (untuk parameter dan keputusan yang sama) akan menghasilkan nilai yang berbeda.
3. Penambahan jumlah iterasi dari spreadsheet simulator (untuk parameter yang sama) biasanya akan memperbaiki akurasi dari estimasi "expected value" pada hasil perhitungan. Jika digunakan 1000 atau 5000 percobaan pada simulasinya, maka avarage profit untuk masing-masing jumlah pemesanan akan cenderung lebih mendekati expected profit yang sebenarnya.
4. Pada simulasi tidak ada keyakinan bahwa telah ditemukan keputusan yang optimal, meskipun telah digunakan interval keyakinan 95 atau 99 yang secara statistik berarti telah cukup dilakukan percobaan. Keyakinan yang kurang dari 100 ini disebabkan simulasi hanya dapat memberikan estimasi yang diharapkan efektif dan bukan nilai eksak karena inputnya berupa bilangan random.
5. Manajemen perlu menaksir empat faktor utama dalam studi simulasi :
a. Apakah model bisa mewakili esensi dari permasalahan yang sebenarnya?
b. Apakah pengaruh kondisi awal dan akhir dari simulasi perlu diperhitungkan ?
c. Apakah percobaan sudah cukup dilakukan untuk masing-masing keputusan
sehingga average value dari perhitungan yang dilakukan merupakan indikasi bagi expected value yang sebenarnya?
d. Apakah keputusan telah cukup dievaluasi sehingga jawaban terbaik yang
ditemukan cukup dekat ke nilai optimum ?
Membuat scatter diagram perbandingan pajakjumlah kendaraan dan PDRB per kapita
1. Pada data excel seperti berikut :
2. Buat kolom pajakkendaraan dan pdrb per penduduk. Isi kolom tersebut dengan rumus =(c2d2) kemudian enter. Dan kolom PDRB per penduduk dengan rumus =(e2f2) kemudian enter.
3. Hasil perhitungan kemudian ditarik ke bawah untuk semua data.
4. Hitung rata-rata dengan cara =average(data) kemudian enter, dan standar deviasi dengan cara =stdev(data) kemudian enter.
5. Kurangi hasil angka pajak per kendaraan dan PDRB per penduduk dengan hasil rata- rata dengan rumus =G2-G26 (pajakkendaraan) dan =H2-H26 (pdrb per penduduk)
6. Untuk membuat scatter diagram dengan cara blok semua data pada kolom I dan J, klik insert kemudian pilih scatter seperti gambar dibawah ini :
7. Hasil yang diperoleh sebagai berikut :
8. Untuk mengganti layout scatter diagram dengan cara klik gambar kemudian pilih chart layout seperti pada gambar di bawah ini :
9. Kemudian ganti angka-angka pada dengan nama KabKota sesuai dengan nilai KabKota pada kolom I dan J. Hasil yang diperoleh sebagai berikut :
Untuk menghitung target PKB untuk setiap jenis kendaraan sebagai berikut :
1. Untuk data PKB seperti pada gambar di bawah ini :
2. Hitung pertumbuhan kendaraan tahun 2007 dengan cara =(B4-B3)B3, tarik sampai pertumbuhan 2010.
3. Hitung rata-rata dengan cara =average(pertumbuhan) kemudian enter
4. Hitung standar deviasi dengan cara =stdev(pertumbuhan) kemudian enter
5. Carilah nilai nilai maksimum dari nilai pertumbuhan dengan cara rata-rata+standar deviasi, dan nilai minimum dengan cara rata-rata – standar deviasi.
6. Hitunglah jumlah pertumbuhan kendaraan maksimum dengan cara nilai maksimum dikali jumlah kendaraan di tahun akhir (2010).
7. Hitunglah jumlah pertumbuhan kendaraan minimum dengan cara nilai minimum dikali jumlah kendaraan di tahun akhir (2010).
8. Hitung selisih kendaraan dengan cara jumlah pertumbuhan kendaraan maksimum dikurangi jumlah pertumbuhan kendaraan minimum.
9. Hitung angka random dengan cara =minimum+(selisihrand()) kemudian enter.
10. Hitung persamaan regresi dengan cara pilih data kemudian data analysis pilih regression seperti pada gambar di bawah ini :
11. Masukan nilai X (jumlah kendaraan) dan nilai Y (penerimaan PKB), pilih labels, constant is zero, confidence level dan output options pilih output range kemudian klik kolom yang berwarna putih dan tentukan tempat meletakkan hasil perhitungan. Seperti pada gambar dibawah ini :
12. Hasil regresi yang diperoleh sebagai berikut :
13. Hitung selisih KBM dengan cara upper – lower.
14. Hitung random KBM dengan cara =minimum(selisihrand()) kemudian enter.
15. Untuk menghitung penambahan PKB dengan cara =random kendaraanrandom KBM
16. Untuk menghitung target PKB tahun 2011 dengan cara =penambahan PKB+(PKB20100.9) kemudian enter. 0.9 diperoleh dari konstanta kendaraan yang tidak daftar ulang.
17. Hasilnya dirunning dengan riskan beta sebagai berikut :
18. Klik riskan beta kemudian akan muncul gambar sebagai berikut dan pilih enable macros.
19. Akan muncul menu addins pada kanan atas
20. Klik hasil random kemudian klik RISKAN pilih preference, RISKAN pilih define cell, RISKAN pilih run. Seperti pada gambar dibawah ini :
21. Hasil dapat dilihat pada sheet result sebagai berikut :
22. Untuk menentukan pesimis, moderat dan optimis dengan cara sebagai berikut:
Kelas
Batas Bawah
Batas Atas
Persen
Pesimis
51.10
Moderat
14507192320 19044954112
26.05
Optimis
19044954112 21691981824
Analisis Peubah Ganda (Multivariate Analysis)
3.2.2.1 Analisis Komponen Utama (Principal Component Analysis)
Analisis komponen utama merupakan suatu tehnik statistik untuk mengubah dari sebagian besar variabel asli yang digunakan yang saling berkorelasi satu dengan yang
lainnya menjadi satu set variabel baru yang lebih kecil dan saling bebas (tidak berkorelasi lagi). Jadi analisis komponen utama berguna untuk mereduksi data, sehingga lebih mudah
untuk menginterpretasikan data-data tersebut (Johnson Wichern, 1982).
Analisis komponen utama merupakan analisis antara dari suatu proses penelitian yang besar atau suatu awalan dari analisis berikutnya, bukan merupakan suatu analisis yang langsung berakhir. Misalnya komponen utama bisa merupakan masukan untuk regresi berganda atau analisis gerombol. (Johnson Wichern, 1982).
Secara aljabar linier komponen utama adalah kombinasi linier-kombinasi linier
tertentu dari p peubah acak x 1 ,x 2 ,x 3 ,….,x p . Secara geometris kombinasi linier ini
merupakan sistem koordinat baru yang didapat dari rotasi sistem semula dengan
x 1 ,x 2 ,….,x p sebagai sumbu koordinat. Sumbu baru tersebut merupakan arah dengan variabilitas maksimum dan memberikan kovariansi yang lebih sederhana.
Komponen utama tergantung kepada matrik ragam peragam dan matrik korelasi
dari x 1 ,x 2 ,…,x p , dimana pada analisisnya tidak memerlukan asumsi populasi harus
berdistribusi Normal Multivariate. Apabila komponen utama diturunkan dari populasi Normal Multivariate interpretasi dan inferensi dapat dibuat dari komponen sampel.
Melalui matrik ragam peragam bisa diturunkan akar ciri-akar cirinya yaitu 1 2 ….
p 0 dan vektor ciri-vektor cirinya yaitu 1 , 2 ,…., p .
Menyusutkan dimensi peubah asal X dapat dilakukan dengan membentuk peubah
baru Y= 1 1 + 2 2 +….+ p p atau Y = ’ p dimana adalah matrik transformasi yang
mengubah peubah asal X menjadi peubah baru Y yang disebut komponen utama, karena itu sering disebut vektor pembobot. Syarat untuk membentuk komponen utama yang merupakan kombinasi linier dari peubah X agar mempunyai keragaman yang besar adalah
dengan memilih ’= ( 1 2 … p ) sedemikian hingga Var (Y) = ’ maksimum dan ’
Persoalan ini dapat diselesaikan dengan Pengganda Lagrange (Lagrange Multiplier) dimana:
' f , ' 1
Fungsi ini mencapai maksimum jika turunan parsial pertama f(,) terhadap dan sama dengan nol.
f ,
0 2 0
f ,
0 ' 1 0
Jika persamaan di atas digandakan dengan vektor ’ maka:
2 ' 0 ' var X ' var Y
Dalam hal ini harus sebesar mungkin karena = Var (Y) sendiri diusahakan maksimum, sehingga yang diambil dari akar ciri maksimum dari . Selanjutnya ditentukan dari persamaan ( - I) = 0
Secara umum komponen utama ke-i adalah kombinasi linier terbobot peubah asal yang mampu menerangkan meragaman data ke-i, bisa ditulis sebagai berikut:
i = Y i1 1 + i2 2 +…+ ip p VAR (Y i )= I , i = 1, 2,…, p
Dari persamaan diatas diketahui ’ i-1 I = 0, maka Cov (Y i-1 -Y i ) = 0. Ini
menunjukkan bahwa komponen utama tidak saling berkorelasi dan komponen utama ke-i memiliki keragaman sama dengan akar ciri ke-i. Oleh karena itu keragaman total yang mampu diterangkan setiap komponen utama adalah proporsi antara akar ciri komponen tersebut terhadap jumlah akar ciri atau teras (trace) matrik .
Matrik ragam peragam yang digunakan dalam masalah ini jika peubah yang diamati ukurannya pada skala dengan perbedaan tidak besar atau jika satuan ukurannya
sama. Bila peubah yang diamati ukurannya pada skala dengan perbedaan yang sangat lebar atau satuan ukurannya tidak sama, maka peubah tersebut perlu dibakukan (standardized)
sehingga komponen utama ditentukan dari peubah baku.
Peubah baku (Z) didapat dari transformasi terhadap peubah asal dalam matrik berikut:
V X
V 12 adalah matrik simpangan baku dengan unsur diagonal utama adalah (
ii ) sedangkan
unsur lainnya adalah nol. Nilai harapan E(Z) = 0 dan keragamannya adalah Cov (Z) =
(V 12 ) -1 (V 12 ) -1 = Dengan demikian komponen utama dari Z dapat ditentukan dari vektor ciri yang didapat melalui matrik korelasi peubah asal . Untuk mencari akar ciri dan menentukan vektor pembobotnya sama seperti pada matrik . Sementara teras matrik korelasi akan sama dengan jumlah p peubah yang dipakai.
Penyusutan dimensi asal dengan cara mengambil sejumlah kecil komponen yang mampu menerangkan bagian terbesar keragaman data. Apabila komponen utama yang diambil sebanyak q buah, dimana q < p, maka proporsi keragaman yang bisa diterangkan