Analisis faktor yang mempengaruhi seseor
BAB I
PENDAHULUAN
1.1 LATAR BELAKANG
Tujuan analisis diskriminan adalah menguji ada-tidaknya hubungan sebab-akibat dari
sebuah fenomena. Ciri khusus analisis diskriminan adalah keharusan variabel dependen
bertipe kategori, sedangkan variabel independen bertipe rasio.
Kegunaan utama analisis diskriminan adalah kemampuan memprediksi terjadinya
variabel dependen dengan masukan data variabel independen, dan kemampuan memilih mana
variabel yang secara nyata mempengaruhi dependen dan mana yang tidak.
Berdasarkan kegunaan tersebut, maka penulis ingin menguji sebuah kasus yaitu
tentang analisis faktor yang mempengaruhi seseorang memilih bekerja atau kuliah. Dimana
variabel dependennya bertipe kategori, yaitu bekerja dan kuliah. Sedangkan umur responden,
biaya kuliah, pendapatan orang tua, jumlah saudara, nilai SMA dan IQ adalah variabel
independen, karena faktor inilah yang menjadi sebab responden memilih bekerja atau kuliah.
Dengan demikan akan diuji apakah ada hubungan kausalitas antara sikap responden secara
umum dengan atribut-atribut yang ada.
1.2 RUMUSAN MASALAH
1. Apakah memang ada perbedaan yang jelas antara perilaku responden, sehingga
mereka yang memilih bekerja dibedakan jelas dengan mereka yang memilih kuliah.
2. Jika memang ada perbedaan diantara kedua kelompok responden tersebut, faktor
mana yang perbedaannya memang nyata dan faktor mana yang sesungguhnya tidak
secara jelas berbeda?
1.3 TUJUAN
1. Mengetahui apakah ada perbedaan yang jelas antara perilaku responden yang
memilih bekerja dengan mereka yang memilih kuliah.
2. Mengetahui faktor mana yang perbedaannya memang nyata dan faktor mana yang
sesungguhnya tidak secara nyata jelas berbeda.
1
BAB II
PEMBAHASAN
UJI DATA
1. Uji Missing Value
Univariate Statistics
No. of Extremesa
Missing
N
Mean
Std. Deviation
Count
Percent
Low
High
Umur
41
19.0000
1.18322
9
18.0
0
0
BiayaKuliah
45
7.0178E2
127.40931
5
10.0
0
0
PendapatanOrangTua
44
9.3409E2
176.45499
6
12.0
0
0
JumlahSaudara
43
3.0698
.91014
7
14.0
0
0
NilaiSMA
46
81.0000
4.03320
4
8.0
0
0
IQ
44
1.1948E2
9.02577
6
12.0
0
0
Status
50
0
.0
a. Number of cases outside the range (Q1 - 1.5*IQR, Q3 + 1.5*IQR).
Pada tabel diatas, kolom N menunjukkan jumlah data yang terisi dan kolom missing
pada count menunjukkan jumlah data yang hilang dalam jumlah nyata, sementara oercent
untuk menghitung persentase dari data yang ada di bagian count. Pada variabel umur data
yang terisi adalah 41, dan data yang hilang adalah 9 atau sebanyak 18%. Pada variabel biaya
kuliah data yang terisi adalah 45, dan data yang hilang sebanyak 5 data atau sebanyak 10%.
Dan begitu seterusnya.
Kolom Mean dan Standard Deviation menunjukkan rata-rata dan deviasi standar
untuk setiap variabel yang valid (tidak missing). Untuk variabel umur, rata-rata usia 41
responden adalah 19 tahun dengan standar deviasi 1,18 tahun. Untuk variabel jumlah saudara,
dari 43 responden rata-ratanya adalah 3,06 orang dengan standar deviasi 0,91. Dan seterusnya
untuk data yang lain.
2
Summary of Estimated Means
Umur
BiayaKulia Pendapata JumlahSau
h
nOrangTua
dara
NilaiSMA
IQ
Listwise
18.7692
7.6308E2
9.3462E2
2.8462
83.1538
1.2438E2
All Values
19.0000
7.0178E2
9.3409E2
3.0698
81.0000
1.1948E2
EM
19.0278
7.0292E2
9.3246E2
3.0715
80.9106
1.1895E2
Jika digunakan metode LISTWISE, maka rata-rata umur menjadi 18,76 tahun, jumlah
saudara menjadi 2,84, nilai SMA menjadi 83,15 dan begitu seterusnya.
Jika digunakan ALL VALUE, maka nilai rata-rata umur menjadi 19,00, jumlah saudara 3,06,
nilai SMA menjadi 81,00.
Jika digunakan metode EM, maka rata-rata umur menjadi 19,02 tahun, jumlah saudara
menjadi 3,07 orang, nilai SMA menjadi 80,91. Dan begitu seterusnya.
3
Status
Total
Umur
Present
BiayaKuliah
PendapatanOtangTua
JumlahSaudara
NilaiSMA
Count
Kuliah
41
20
21
Percent
82.0
80.0
84.0
Missing
% SysMis
18.0
20.0
16.0
Present
Count
45
23
22
Percent
90.0
92.0
88.0
Missing
% SysMis
10.0
8.0
12.0
Present
Count
44
21
23
Percent
88.0
84.0
92.0
Missing
% SysMis
12.0
16.0
8.0
Present
Count
43
20
23
Percent
86.0
80.0
92.0
Missing
% SysMis
14.0
20.0
8.0
Present
Count
46
24
22
92.0
96.0
88.0
Percent
IQ
Bekerja
Missing
% SysMis
8.0
4.0
12.0
Present
Count
44
21
23
Percent
88.0
84.0
92.0
% SysMis
12.0
16.0
8.0
Missing
Indicator variables with less than 5% missing are not displayed.
Untuk variabel umur, dari 41 data yang valid, 20 data ada pada kategoti status
bekerja, dan 21 orang ada pada kategori status kuliah. Sedang dari komposisi data yang
missing, 20% data ang missing ada pada usia responden yang berstatus bekerja, sedangkan
16% berasal dari responden yang berstatus mahasiswa. Sedangkan 18% merupakan rata-rata
dari 20% dan 16%.
4
Missing Patterns (cases with missing values)
Missing and Extreme Value Patternsa
# Missing
Pendapata
% Missing
Status
NilaiSMA BiayaKuliah nOrangTu
Case
IQ
JumlahSaud
Umur
ara
a
Ani
1
14.3
S
Rian
1
14.3
S
Gian
1
14.3
S
Bowo
1
14.3
S
Ayu
1
14.3
S
Andika
1
14.3
S
Bima
1
14.3
S
Qori
1
14.3
S
Devi
1
14.3
S
Herlan
1
14.3
S
Mela
1
14.3
S
Andi
1
14.3
S
Zumaila
1
14.3
S
Boni
1
14.3
S
Roni
1
14.3
S
Adit
1
14.3
S
Rehat
1
14.3
S
Dela
1
14.3
S
Efal
1
14.3
S
Reisa
1
14.3
S
Noufal
1
14.3
S
Fais
1
14.3
S
Gilang
1
14.3
S
Romario
1
14.3
S
Putri
1
14.3
S
Yulia
1
14.3
S
Ami
1
14.3
S
Mita
1
14.3
S
Niken
1
14.3
S
Dini
1
14.3
S
Naila
1
14.3
S
5
Tabel diatas menggambarkan penyebaran data yang hilang hanya untuk responden
yang datanya tidak lengkapdan bukan seluruh responden. Responden yang bernama Ani
mempunyai satu missing value data pada variabel IQ, karena missing ada pada 1 dari 7
variabel, maka persentase missing adalah 14,3%.
Responden yang bernama Bima, mempunyai satu missing value data pada variabel
nilai SMA, karena missing ada pada 1 dari 7 variabel, maka persentase missing adalah
14,3%. Dan begitu seterusnya.
Tabulated Patterns
Missing Patternsa
Number
of
Cases
Complete if
Status
NilaiSMA
BiayaKulia Pendapata
h
IQ
nOtangTua
JumlahSau
Umur
dara
13
13
6
4
X
19
X
17
7
5
...b
X
20
X
18
9
X
6
X
22
19
a. Variables are sorted on missing patterns.
b. Number of complete cases if variables missing in that pattern (marked with X) are not used.
Tabel diatas menunjukkan sisi lain dari penyebaran missing value,dimana missing
value dinyatakan per variabel. Pada baris pertama, angka 13 menyatakan ada 13 data yang
valid, artinya tidak terdapat missing value pada semua variabelnya.
Angka 6 pada baris kedua menunjukkan adanya 5 data yang missing pada variabel IQ.
Jika dilihat pada tabel sebelumnya, maka responden yang mempunyai data missing pada
variabel IQ adalah Ani, Rian, Gian, Bowo, Ayu, Andika.
Angka 4 menunjukkan adanya 4 data yang missing pada variabel Nilai SMA. Maka
responden yang mempunyai missing pada variabel nilai SMA adalah Bima, Devi, Qori,
Herlan. Dan seterusnya untuk baris berikutnya.
Dan pada kolom complete, jika 6 data yang missing di variabel IQ diperbaiki
sehingga menjadi tidak missing, maka semua data yang tidak missing menjadi: 13+6=19 data
yang lengkap. Jika data yang missing di variabel di nilai SMA ada 4 data diperbaiki maka
semua data yang tidak missing menjadi : 13+4 = 17 dan begitu seterusnya.
6
Listwise Correlations
BiayaKulia Pendapata JumlahSau
Umur
Umur
h
nOtangTua
dara
NilaiSMA
IQ
1
BiayaKuliah
.520
1
PendapatanOrangTua
-.172
.101
1
JumlahSaudara
-.190
-.243
-.139
1
NilaiSMA
-.031
-.317
.103
.044
1
.139
-.261
-.145
.181
.628
IQ
1
Tabel diatas menunjukkan korelasi antar-variabel untuk 13 data. Angka 0,520 pada
tabel diatas menyatakan besar korelasi antara variabel umur dan biaya kuliah. Angka 0,101
menunjukkan korelasi antar variabel pendapatan orang tua dengan biaya kuliah. Dan
demikian seterusnya untuk korelasi variabel yang lain.
Angka 0,628 menunjukkan korelasi antara variabel IQ dan nilai SMA. Angka korelasi
yang besar ini menyatakan bahwa terjadinya missing value dari variabel IQ berpengaruh kuat
pada terjadinya missing value pada variabel nilai SMA. Sebaliknya angka korelasi variabel
pendapatan orang tua dan biaya kuliah sebesar 0,101 yang dibawah 0,5. Hal ini berarti
adanya tingkat keacakan yang tinggi pada missing value, karena pengaruh antar-variabel
lemah.
7
Pairwise Frequencies
BiayaKulia Pendapata JumlahSau
Umur
h
nOtangTua
dara
NilaiSMA
IQ
Status
Umur
41
BiayaKuliah
36
45
PendapatanOtangTua
35
39
44
JumlahSaudara
34
38
37
43
NilaiSMA
37
41
40
39
46
IQ
35
39
38
37
40
44
Status
41
45
44
43
46
44
50
Metode pairwise akan memasangkan (pair) variabel yang mempunyai data lengkap,
dan tidak menghilangkan sebuah baris begitu saja. Dengan demikian jumlah data bisa
berbeda-beda tergantung kelengkapan data dua variabel yang dipasangkan.
Jika yang dipasangkan variabel umur dan biaya kuliah, maka akan ada 36 data yang
valid. Namun jika yang dipasangkan variabel biaya kuliah dengan IQ maka akan ada 39 data
yang valid. Demikian seterusnya untuk kombinasi variabel lainnya.
Pairwise Correlations
BiayaKulia Pendapata JumlahSau
Umur
Umur
h
nOtangTua
dara
NilaiSMA
IQ
1
BiayaKuliah
.028
1
PendapatanOtangTua
-.447
.312
1
JumlahSaudara
-.063
-.107
-.038
1
NilaiSMA
-.076
-.017
.112
.008
1
.025
.154
.003
.148
.563
IQ
1
Tabel diatas mempunyai tafsiran yang sama dengan analisis korelasi antar-variabel
dengan metode listwise. Angka korelasi yang diatas 0,5 berjumlah sangat sedikit, sehingga
bisa dikatakan missing value adalah acak (random). Pada tabel diatas angka diatas 0,5 tidak
ada sehingga bisa dikaan missing adalah acak.
8
EM Correlationsa
BiayaKulia Pendapata JumlahSau
Umur
Umur
h
nOrangTua
dara
NilaiSMA
IQ
1
BiayaKuliah
-.003
1
PendapatanOrangTua
-.426
.307
1
.015
-.088
-.054
1
-.076
-.031
.045
.014
1
.012
.156
-.044
.144
.551
JumlahSaudara
NilaiSMA
IQ
1
a. Little's MCAR test: Chi-Square = 24,899, DF = 30, Sig. = ,730
Pada tabel hanya ada 1 data yang diatas 0,5 yaitu 0,551 artinya pola penyebarab
missing value adalah random. Terlihat angka MCAR yang ditampilkan adalah 0,730, maka
missing value adalah acak karena besar dari 0,05.
Kesimpulan : missing value yang terjadi adalah bersifatacak. Karena bersifat acak
dan tidak memiliki pola tertentu, maka bisa dilakukan perlakuan lanjutan.
2. Mengisi Missing Value
Result Variables
Case Number of Non-Missing
Values
N of Replaced
Result Variable
1
2
3
6
Last
N of Valid Cases
Function
9
1
50
50 SMEAN(Umur)
BiayaKuliah_1
5
1
50
50
6
1
50
50
7
1
50
50
NilaiSMA_1
4
1
50
50
IQ_1
6
1
50
50 SMEAN(IQ)
PendapatanOtan
JumlahSaudara_
1
5
First
Umur_1
gTua_1
4
Missing Values
Creating
SMEAN(BiayaKu
liah)
SMEAN(Pendap
atanOtangTua)
SMEAN(Jumlah
Saudara)
SMEAN(NilaiSM
A)
9
Dari tabel result variables diatas terlihat ada 9 data untuk variabel umur yang diganti, 5
variabel biaya kuliah, 6 variabel pendapatan orang tua, 7 variabel jumlah saudara, 4 variabel
nilai SMA san 6 vriabel IQ.
3. Uji Data Outlier
a. Standarisasi Data
Descriptive Statistics
N
Minimum
Maximum
Mean
Std. Deviation
SMEAN(Umur)
50
17.00
21.00
19.0000
1.06904
SMEAN(BiayaKuliah)
50
500.00
980.00
7.0178E2
120.73396
50
600.00
1200.00
9.3409E2
165.29896
SMEAN(JumlahSaudara)
50
1.00
5.00
3.0698
.84262
SMEAN(NilaiSMA)
50
75.00
90.00
81.0000
3.86507
SMEAN(IQ)
50
105.00
135.00
1.1948E2
8.45514
Valid N (listwise)
50
SMEAN(PendapatanOtangT
ua)
Dari tabel diatas dapat dilihat bahwa rata-rata umur responden adalah 19,00 tahun
dengan standar deviasi 1,06 tahun. Rata-rata jumlah saudara responden adalah 3,06 orang
dengan standar deviasi 0,84. Dan begitu seterusnya.
b. Box Plot
Umur
Tidak ada satu pun data Umur yang ada di luar BoxPlot. Dengan demikian, bisa
dikatakan tidak ada data outlier ataupun ekstrem pada variabel ini.
10
Biaya Kuliah
Terlihat tidak ada satu pun data biaya kuliah yang ada di luar BoxPlot. Dengan
demikian Dengan demikian, bisa dikatakan tidak ada data outlier ataupun ekstrem pada
variabel ini.
4. Uji Normalitas Data
11
Terlihat sebaran data dari variabel IQ bergerombol di sekitar garis uji yang mengarah
ke kanan atas, dan tidak ada data yang terletak jauh dari sebaran data. Dengan demikian, data
tersebut bisa dikatakan normal.
Terlihat sebaran data dari variabel IQ bergerombol di sekitar garis uji yang mengarah
ke kanan atas, dan tidak ada data yang terletak jauh dari sebaran data. Dengan demikian, data
tersebut bisa dikatakan normal.
5. Uji Homokedastisitas Data
Test of Homogeneity of Variance
Levene Statistic
SMEAN(BiayaKuliah)
df2
Sig.
Based on Mean
.859
1
48
.359
Based on Median
.959
1
48
.332
.959
1
47.764
.332
.861
1
48
.358
1.683
1
48
.201
.133
1
48
.717
.133
1
40.406
.717
1.441
1
48
.236
Based on Median and with
adjusted df
Based on trimmed mean
SMEAN(NilaiSMA)
df1
Based on Mean
Based on Median
Based on Median and with
adjusted df
Based on trimmed mean
12
Pada baris Biaya Kuliah dari tabel output diatas, dan dengan dasar Mean, didapat
angka SIG adalah 0,359. Karena angka SIG > 0,05, maka Ho diterima. Hal ini berarti varians
dari data biaya kuliah responden yang memilih bekerja relatif sama dengan data biaya kuliah
responden yang memilih kuliah. Sehingga bisa disimpulkan telah terjadi homoskedastisitas
variabel biaya kuliah dengan dasar grup status.
Pada baris nilai SMA, dan dengan dasar Mean didapat angka SIG adalah 0,201 maka
Ho diterima. Hal ini berarti varians dari data nilai SMA responden yang memilih bekerja
relatif sama dengan data nilai SMA responden yang memilih kuliah. Sehingga terjadi
homoskedastisitas variabel nilai SMA dengan dasar grup Status.
6. Uji Linearitas Data
Terlihat garis regresi pada grafik diatas yang cenderung mendatar. Kemudian jika
dilihat pada persamaan regresi koefisien praktis mendekati 0 (0,0004171). Hal ini
membuktikan tidak adanya linearitas pada hubungan dua variabel tersebut, yang berarti
semakin besar atau semakin kecil umur seseorang tidak ada hubungannya dengan tingginya
IQ seseorang
13
Pada gambar diatas dapat dilihat garis regresi yang mengarah kekanan atas, ini
membuktikan adanya linearitas pada hubungan dua variabel tersebut yaitu variabel biaya
kuliah dengan variabel pendapatan orang tua. Artinya semakin tinggi biaya kuliahnya maka
semakin tinggi pula pendapatan orang tuanya.
14
ANALISIS DISKRIMINAN
1. Menilai Variabel Yang Layak Untuk Analisis
Tests of Equality of Group Means
Wilks' Lambda
F
df1
df2
Sig.
SMEAN(Umur)
.930
3.613
1
48
.063
SMEAN(BiayaKuliah)
.994
.314
1
48
.578
.834
9.542
1
48
.003
SMEAN(JumlahSaudara)
.970
1.478
1
48
.230
SMEAN(NilaiSMA)
.779
13.642
1
48
.001
SMEAN(IQ)
.767
14.587
1
48
.000
SMEAN(PendapatanOtangT
ua)
a. Dengan angka Wilk’s Lambda
Angka Wilks’s Lambda berkisar 0 sampai1. Jika angka mendekati 0 maka data tiap grup
cenderung berbeda, sedang jika angka mendekati 1, data tiap grup cenderung sama.
Dari tabel diatas terlihat angka Wilk’s Lambda berkisar antara 0,767 sampai0,994
(mendekati 1). Dari kolom Sig bisa dilihat bahwa hanya variabel biaya kuliah yang
cenderung tidak berbeda. Hal ini berarti biaya kuliah untuk mereka yang bekerja atau kuliah
ternyata tidak berbeda secara nyata. Hanya disini mendekati angka 1 dulit ditentukan secara
pasti, karena hampir semua variabel diatas mempunyai angka Wilk’s Lambda yang besar,
namun hanya satu variabel yang tidak lolos. Untuk itu dilakukan pengujian ANOVA
b. Dengan F test
Variabel pendapatan orang tua, angka Sig nya dibawah 0,05 (0,003). Artinya ada
perbedaan antar-grup atau responden yang memilih bekerja atau kuliah. Mungkin
mereka yang pendapatan orang tuanya lebih tinggi akan memilih kuliah dibanding
mereka yang orang tuanya berpendapatan lebih rendah. Atau mungkin sebaliknya.
Variabel Nilai SMA, angka Sig nya 0,001. Artinya ada perbedaan antar grup. Mungkin
mereka yang nilai SMAnya lebih tinggi akan memilih untuk kuliah daripada mereka
yang nilai SMAnya lebih rendah. Atau sebaliknya.
Variabel Biaya Kuliah, angka Signya 0,578. Halini berarti biaya kuliah seorang
responden tidak mempengaruhi mereka untuk memilih bekerja atau kuliah. Kesimpulan
ini hampir sama dengan jika berpatokan pada angka Wilk’s Lambda yang hampir
mendekati 1 untuk variabel biaya kuliah.
15
Variabel jumlah saudara, angka Signya adalah jauh diatas 0,05 yaitu 0,230. Artinya
jumlah saudara seorang responden tidak memengaruhi seorang responden untuk
memilih bekerja atau kuliah.
Dari enam variabel, ada tiga varibel yang berbeda secara signifikan untuk dua grup
signifikan, yaitu pendapatan orang tua, nilai SMA dan IQ. Dengan demikian, seorang
responden memilih bekerja atau kuliah dipengaruhi oleh pendapatan orang tua
responden tersebut, nilai ketika di SMA, dan IQ yang dimiliki oleh responden tersebut.
Test Results
Box's M
F
23.940
Approx.
.986
df1
21
df2
8.474E3
Sig.
.477
Tests null hypothesis of equal
population covariance matrices.
Dari tabel terlihat bahwa angka Signya jauh diatas 0,05 yaitu 0,477, yang berarti
group covariance matrices adalah sama. Hal ini berarti data diatas sudah memenuhi asumsi
analisis diskriminan, sehingga proses bisa dilanjutkan.
Asumsinya adalah:
Varians variabel bebas untuk tiap grup seharusnya sama. Jika demikian, seharusnya
varians dari responden yang memilih bekerja sama dengan varians responden yang
memilih kuliah.
Varians diantara variabel-variabel bebas seharusnya juga sama. Jika denikian,
seharusnya varians dari umur sama dengan varians dari biaya kuliah, sama dengan
variabel biaya kuliah, pendapatan orang tua dan sebagainya.
Log Determinants
Status
Rank
Log Determinant
Bekerja
6
25.049
Kuliah
6
24.532
Pooled within-groups
6
25.289
The ranks and natural logarithms of determinants
printed are those of the group covariance matrices.
16
Terlihat angka Log determinant untuk kategori bekerja 25,049 dan kuliah (24,532)
tidak berbeda banyak, sehingga group covariance matrices akan relatif sama untuk kedua
grup.
2. Proses Diskriminan.
Group Statistics
Valid N (listwise)
Status
Bekerja
Mean
SMEAN(PendapatanOtangT
ua)
SMEAN(NilaiSMA)
SMEAN(IQ)
Kuliah
SMEAN(PendapatanOtangT
ua)
SMEAN(NilaiSMA)
SMEAN(IQ)
Total
SMEAN(PendapatanOtangT
ua)
SMEAN(NilaiSMA)
SMEAN(IQ)
Std. Deviation
Unweighted
Weighted
8.6745E2
125.94122
25
25.000
79.2000
3.24037
25
25.000
1.1544E2
7.79536
25
25.000
1.0007E3
175.13980
25
25.000
82.8000
3.64005
25
25.000
1.2352E2
7.15340
25
25.000
9.3409E2
165.29896
50
50.000
81.0000
3.86507
50
50.000
1.1948E2
8.45514
50
50.000
Tabel Group Statistics pada dasarnya berisi data statistik (deskriptif) yang utama, yakni
rata-rata dan standar deviasi, dari kedua grup responden.
Responden yang memilih bekerja, rata-rata nilai SMA nya adalah 79,20 sedangkan
responden yang memilih kuliah rata-rata nilai SMA nya adalah 82, 80. Sedangkan responden
yang memilih bekerja, rata-rata pendapatan orang tuanya adalah 867,550 dan responden yang
memilih kuliah, rata-rata pendapatan orangtuanya adalah 1,000,000. Dan responden yang
memilih bekerja juga rata-rata memiliki IQ sekitar 115,44 sedangkan responden yang
memilih kuliah, rata-rata memiliki IQ sekitar 123,52.
Dari tabel diatas juga terlihat bahwa ada 25 responden yang memilih bekerja, dan 25
responden yang memilih kuliah. Jika melihat semua variabel terisi angka 25 dan 25
semuanya, maka pada kasus ini tidak ada data yang hilang (missing), sehingga total data
untuk semua variabel adalah 50 responden.
17
Variables Entered/Removeda,b,c,d
Min. D Squared
Exact F
Step
1
Entered
SMEAN(IQ
)
2
Statistic
1.167
SMEAN(Pe
ndapatanO
2.552
tangTua)
Between Groups
Bekerja and
Kuliah
Bekerja and
Kuliah
Statistic
df1
df2
Sig.
14.587
1
48.000
.000
15.617
2
47.000
6.302E-6
At each step, the variable that maximizes the Mahalanobis distance between the two closest groups
is entered.
a. Maximum number of steps is 6.
b. Maximum significance of F to enter is .05.
c. Minimum significance of F to remove is .10.
d. F level, tolerance, or VIN insufficient for further computation.
Tabel ini menyajikan variabel mana saja dari enam variabel input yang bisa
dimasukkan dalam persamaan diskriminan. Karena proses adalah stepwise (beratahap) maka
akan dimulai dengan variabel yang mempunyai angka F hitung (statistik) terbesar.
Tahap pemasukan variabel bebas :
Pada tahap pertama, angka F hitung variabel IQ adalah 14,587, maka pada tahap
pertama ini variabel IQ terpilih.
Pada tahap kedua, angka F hitung mencapai 15,617, maka pada tahap kedua ini variabel
Pendapatan orang tua terpilih.
Kedua variabel tersebut memiliki 2 variabel yang tentunya mempunyai Sig dibawah
0,05, seperti variabel IQ Signya 0,000 dan variabel pendapatan mempunyai Sig jauh dibawah
0,05 yaitu 6,301E-6 atau 0,000006301.
Dengan demikian, dari tiga variabel yang dimasukkan, hanya ada dua variabel yang
signifikan. Atau bisa dikatakan IQ dan pendapatan orang tua mempengaruhi perilaku
responden untuk memilih bekerja atau kuliah. Atau mereka yang memiliki IQ dan pendapatan
orang tua diatas rata-rata akan memilih untuk kuliah, dan begitu seterusnya.
18
Variables in the Analysis
Sig. of F to
Step
Tolerance
1
SMEAN(IQ)
2
SMEAN(IQ)
SMEAN(PendapatanOtangT
ua)
Remove
Min. D Squared Between Groups
1.000
.000
.939
.000
.763
.939
.001
1.167
Bekerja and
Kuliah
Bekerja and
Kuliah
Pada step 1, variabel IQ adalah variabel pertama yang dimasukkan kedalam model
diskriminan. Hal ini disebabkan variabel tersebut mempunyai angka Sig. Of F to Remove
yang paling sedikit yaitu 0,000 (jauh di bawah 0,05).
Kemudian pada step 2, dimasukkan variabel kedua yakni, variabel pendapatan orang
tua. Variabel tersebut memenuhi syarat, karena mempunyai angka Sig. Of F to Remove
dibawah 0,05 yakni 0,001.
Variables Not in the Analysis
Step
0
Tolerance
SMEAN(IQ)
SMEAN(NilaiSMA)
SMEAN(PendapatanOtangTu
a)
1
SMEAN(NilaiSMA)
SMEAN(PendapatanOtangTu
a)
2
SMEAN(NilaiSMA)
Min. Tolerance
Sig. of F to Enter Min. D Squared Between Groups
1.000
1.000
.000
1.167
1.000
1.000
.001
1.091
1.000
1.000
.003
.763
.867
.867
.038
1.655
.939
.939
.001
2.552
.865
.826
.050
3.114
Bekerja and
Kuliah
Bekerja and
Kuliah
Bekerja and
Kuliah
Bekerja and
Kuliah
Bekerja and
Kuliah
Bekerja and
Kuliah
Tabel diatas merupakan kebalikan dari tabel sebelumnya, dimana pada tabel ini adalah
proses pengeluaran. Pada step 0 (awal) ketiga variabel tersebut secara lengkap ditayangkan
dengan angka Sig. Of F to Remove sebagai faktor penguji. Terlihat angka Sig. Terkecil
adalah pada variabel IQ yaitu 0,00. Maka variabel IQ dikeluarkan dari step 0 tersebut, yang
berarti variabel tersebut bukan termasuk variabel yang tidak dianalisis.
19
Pada step 1, terlihat ada 2 variabel, dan variabel pendapatan orang tua dengan Sig of F
to Remove adalah 0,001 sehingga variabel tersebut dikeluarkan. Sekarang hanya ada satu
variabel yaitu variabel nilai SMA, dan variabel tersebut mempunyai Sig of F to Remove
diatas 0,05 (yakni 0,826). Karena sudah tidak ada data variabel yang memenuhi syarat, maka
proses pengeluaran variabel berhenti, dan variabel tersebut tidak bisa dikeluarkan, yang
berarti variabel tersebut termasuk pada variable not in the analysis, atau variabel yang tidak
dianalisis lebih lanjut.
Wilks' Lambda
Exact F
Number of
Step
Variables
Lambda
df1
df2
df3
Statistic
df1
df2
Sig.
1
1
.767
1
1
48
14.587
1
48.000
.000
2
2
.601
2
1
48
15.617
2
47.000
.000
Wilks’s Lambda pada prinsipnya adalah varians total dalam diskriminant scores yang
tidak bisa dijelaskan oleh perbedaan diantara grup-grup yang ada. Pada step 1, jumlah
variabel yang dimasukkan ada satu (IQ), dengan angka Wilk’s Lambda adalah 0,767. Hal ini
berarti 76,7% varans tidak dapat dijelaskan oleh perbedaan antar grup-grup. Kemudian pada
step 2, dengan tambahan variabel pendapatan orang tua, angka Wilk’s Lambda turun menjadi
0,601 atau 60,1%. Penurunan angka Wilk’s Lambda tentu baik bagi model diskriminan,
karena varians yang tidak bisa dijelaskan juga semakin kecil.
Dari kolom F dan Sig-nya, erlihat baik pada pemasukan variabel 1 dan 2, semuanya
adalah signifikan secara statistik. Hal ini berarti kedua variabel tersebut (IQ dan pendapatan
orang tua) memang berbeda untuk kedua pilihan responden.
Eigenvalues
Functio
n
Canonical
Eigenvalue
.665a
1
% of Variance
100.0
Cumulative %
Correlation
100.0
.632
a. First 1 canonical discriminant functions were used in the analysis.
Canonical Correlation mengukur keeratan hubungan antara diskriminant score dengan
grup. Angka 0,632 menunjukkan keeratan yang cukup tinggi, dengan ukuran skala asosiasi 0
sampai 1.
20
Wilks' Lambda
Test of
Functio
n(s)
Wilks' Lambda
1
Chi-square
.601
Df
23.949
Sig.
2
.000
Tabel diatas menyatakanangka akhir dari Wilk’s Lambda, yang sebenarnya sama saja
dengan angka terakhir dari step 2 pembuatan model diskriminan. Angka Chi-Square sebesar
23,949 dengan signifikan yang tinggi menunjukkan perbedaan yang jelas antara dua grup
responden.
Structure Matrix
Function
1
SMEAN(IQ)
.676
SMEAN(PendapatanOtangT
.547
ua)
SMEAN(NilaiSMA)a
.217
Pooled within-groups correlations between
discriminating variables and standardized
canonical discriminant functions
Variables ordered by absolute size of
correlation within function.
a. This variable not used in the analysis.
Tabel Structure Matrix menjelaskan korelasi antara variabel independen dengan fungsi
diskriminan yang terbentuk terlihat variabel IQ paling erat hubungannya dengan fungsi
diskriminan, diikuti oleh variabel pendapatan orang tua dan nilai SMA.
Prior Probabilities for Groups
Cases Used in Analysis
Status
Prior
Unweighted
Weighted
Bekerja
.500
25
25.000
Kuliah
.500
25
25.000
Total
1.000
50
50.000
21
Tabel diatas memperlihatkan komposisi ke 50 responden, yang dengan model
diskriminan menghasilkan 25 responden ada di grup bekerja,dan 25 responden digrup kuliah.
22
BAB III
PENUTUP
3.1 KESIMPULAN
Dari proses uji data sampai analisis output, dapat disimpulkan bahwa ada perbedaan
yang signifikan antara responden yang memilih bekerja dan responden yang memilih kuliah.
Hal ini dibuktikan pada analisis Wilk’s Lambda, dimana variabel yang terlihat berbeda
adalah variabel IQ dan pendapatan orang tua.
Variabel yang membuat perilaku seseorang yang memilih bekerja atau kuliah
berbeda adalah variabel Iqdan pendapatan orang tua. Hal ini terlihat pada step analisis awal,
baik bagian Variable In Analysis maupun Variable Not In Analysis.
Jadi, IQ dan pendapatan orang tua mempengaruhi perilaku responden untuk memilih
bekerja atau kuliah. Atau mereka yang memiliki IQ dan pendapatan orang tua diatas rata-rata
akan memilih untuk kuliah, dan sebaliknya mereka yang memiliki IQ dan pendapatan orang
tua yang lebih rendah memilih untuk bekerja.
3.2 SARAN
Kritik dan saran sangat penulis harapkan dalam makalah ini, segala kekurangan yang
ada dalam makalah ini mungkin karena kelalaian atau ketidaktahuan penulis dalam
penyusunannya. Segala hal yang tidak relevan, kekurangan dalam pengetikan atau bahkan
ketidakjelasan dalam makalah ini merupakan proses penulis dalam mempelajari bidang studi
ini dan diharapkan bagi pembaca dapat mengambil manfaat dari makalah ini.
23
DAFTAR PUSTAKA
Santoso , Singgih. 2012. Aplikasi SPSS pada Statistik Multivariat. Elex Media Komputindo :
Jakarta.
24
PENDAHULUAN
1.1 LATAR BELAKANG
Tujuan analisis diskriminan adalah menguji ada-tidaknya hubungan sebab-akibat dari
sebuah fenomena. Ciri khusus analisis diskriminan adalah keharusan variabel dependen
bertipe kategori, sedangkan variabel independen bertipe rasio.
Kegunaan utama analisis diskriminan adalah kemampuan memprediksi terjadinya
variabel dependen dengan masukan data variabel independen, dan kemampuan memilih mana
variabel yang secara nyata mempengaruhi dependen dan mana yang tidak.
Berdasarkan kegunaan tersebut, maka penulis ingin menguji sebuah kasus yaitu
tentang analisis faktor yang mempengaruhi seseorang memilih bekerja atau kuliah. Dimana
variabel dependennya bertipe kategori, yaitu bekerja dan kuliah. Sedangkan umur responden,
biaya kuliah, pendapatan orang tua, jumlah saudara, nilai SMA dan IQ adalah variabel
independen, karena faktor inilah yang menjadi sebab responden memilih bekerja atau kuliah.
Dengan demikan akan diuji apakah ada hubungan kausalitas antara sikap responden secara
umum dengan atribut-atribut yang ada.
1.2 RUMUSAN MASALAH
1. Apakah memang ada perbedaan yang jelas antara perilaku responden, sehingga
mereka yang memilih bekerja dibedakan jelas dengan mereka yang memilih kuliah.
2. Jika memang ada perbedaan diantara kedua kelompok responden tersebut, faktor
mana yang perbedaannya memang nyata dan faktor mana yang sesungguhnya tidak
secara jelas berbeda?
1.3 TUJUAN
1. Mengetahui apakah ada perbedaan yang jelas antara perilaku responden yang
memilih bekerja dengan mereka yang memilih kuliah.
2. Mengetahui faktor mana yang perbedaannya memang nyata dan faktor mana yang
sesungguhnya tidak secara nyata jelas berbeda.
1
BAB II
PEMBAHASAN
UJI DATA
1. Uji Missing Value
Univariate Statistics
No. of Extremesa
Missing
N
Mean
Std. Deviation
Count
Percent
Low
High
Umur
41
19.0000
1.18322
9
18.0
0
0
BiayaKuliah
45
7.0178E2
127.40931
5
10.0
0
0
PendapatanOrangTua
44
9.3409E2
176.45499
6
12.0
0
0
JumlahSaudara
43
3.0698
.91014
7
14.0
0
0
NilaiSMA
46
81.0000
4.03320
4
8.0
0
0
IQ
44
1.1948E2
9.02577
6
12.0
0
0
Status
50
0
.0
a. Number of cases outside the range (Q1 - 1.5*IQR, Q3 + 1.5*IQR).
Pada tabel diatas, kolom N menunjukkan jumlah data yang terisi dan kolom missing
pada count menunjukkan jumlah data yang hilang dalam jumlah nyata, sementara oercent
untuk menghitung persentase dari data yang ada di bagian count. Pada variabel umur data
yang terisi adalah 41, dan data yang hilang adalah 9 atau sebanyak 18%. Pada variabel biaya
kuliah data yang terisi adalah 45, dan data yang hilang sebanyak 5 data atau sebanyak 10%.
Dan begitu seterusnya.
Kolom Mean dan Standard Deviation menunjukkan rata-rata dan deviasi standar
untuk setiap variabel yang valid (tidak missing). Untuk variabel umur, rata-rata usia 41
responden adalah 19 tahun dengan standar deviasi 1,18 tahun. Untuk variabel jumlah saudara,
dari 43 responden rata-ratanya adalah 3,06 orang dengan standar deviasi 0,91. Dan seterusnya
untuk data yang lain.
2
Summary of Estimated Means
Umur
BiayaKulia Pendapata JumlahSau
h
nOrangTua
dara
NilaiSMA
IQ
Listwise
18.7692
7.6308E2
9.3462E2
2.8462
83.1538
1.2438E2
All Values
19.0000
7.0178E2
9.3409E2
3.0698
81.0000
1.1948E2
EM
19.0278
7.0292E2
9.3246E2
3.0715
80.9106
1.1895E2
Jika digunakan metode LISTWISE, maka rata-rata umur menjadi 18,76 tahun, jumlah
saudara menjadi 2,84, nilai SMA menjadi 83,15 dan begitu seterusnya.
Jika digunakan ALL VALUE, maka nilai rata-rata umur menjadi 19,00, jumlah saudara 3,06,
nilai SMA menjadi 81,00.
Jika digunakan metode EM, maka rata-rata umur menjadi 19,02 tahun, jumlah saudara
menjadi 3,07 orang, nilai SMA menjadi 80,91. Dan begitu seterusnya.
3
Status
Total
Umur
Present
BiayaKuliah
PendapatanOtangTua
JumlahSaudara
NilaiSMA
Count
Kuliah
41
20
21
Percent
82.0
80.0
84.0
Missing
% SysMis
18.0
20.0
16.0
Present
Count
45
23
22
Percent
90.0
92.0
88.0
Missing
% SysMis
10.0
8.0
12.0
Present
Count
44
21
23
Percent
88.0
84.0
92.0
Missing
% SysMis
12.0
16.0
8.0
Present
Count
43
20
23
Percent
86.0
80.0
92.0
Missing
% SysMis
14.0
20.0
8.0
Present
Count
46
24
22
92.0
96.0
88.0
Percent
IQ
Bekerja
Missing
% SysMis
8.0
4.0
12.0
Present
Count
44
21
23
Percent
88.0
84.0
92.0
% SysMis
12.0
16.0
8.0
Missing
Indicator variables with less than 5% missing are not displayed.
Untuk variabel umur, dari 41 data yang valid, 20 data ada pada kategoti status
bekerja, dan 21 orang ada pada kategori status kuliah. Sedang dari komposisi data yang
missing, 20% data ang missing ada pada usia responden yang berstatus bekerja, sedangkan
16% berasal dari responden yang berstatus mahasiswa. Sedangkan 18% merupakan rata-rata
dari 20% dan 16%.
4
Missing Patterns (cases with missing values)
Missing and Extreme Value Patternsa
# Missing
Pendapata
% Missing
Status
NilaiSMA BiayaKuliah nOrangTu
Case
IQ
JumlahSaud
Umur
ara
a
Ani
1
14.3
S
Rian
1
14.3
S
Gian
1
14.3
S
Bowo
1
14.3
S
Ayu
1
14.3
S
Andika
1
14.3
S
Bima
1
14.3
S
Qori
1
14.3
S
Devi
1
14.3
S
Herlan
1
14.3
S
Mela
1
14.3
S
Andi
1
14.3
S
Zumaila
1
14.3
S
Boni
1
14.3
S
Roni
1
14.3
S
Adit
1
14.3
S
Rehat
1
14.3
S
Dela
1
14.3
S
Efal
1
14.3
S
Reisa
1
14.3
S
Noufal
1
14.3
S
Fais
1
14.3
S
Gilang
1
14.3
S
Romario
1
14.3
S
Putri
1
14.3
S
Yulia
1
14.3
S
Ami
1
14.3
S
Mita
1
14.3
S
Niken
1
14.3
S
Dini
1
14.3
S
Naila
1
14.3
S
5
Tabel diatas menggambarkan penyebaran data yang hilang hanya untuk responden
yang datanya tidak lengkapdan bukan seluruh responden. Responden yang bernama Ani
mempunyai satu missing value data pada variabel IQ, karena missing ada pada 1 dari 7
variabel, maka persentase missing adalah 14,3%.
Responden yang bernama Bima, mempunyai satu missing value data pada variabel
nilai SMA, karena missing ada pada 1 dari 7 variabel, maka persentase missing adalah
14,3%. Dan begitu seterusnya.
Tabulated Patterns
Missing Patternsa
Number
of
Cases
Complete if
Status
NilaiSMA
BiayaKulia Pendapata
h
IQ
nOtangTua
JumlahSau
Umur
dara
13
13
6
4
X
19
X
17
7
5
...b
X
20
X
18
9
X
6
X
22
19
a. Variables are sorted on missing patterns.
b. Number of complete cases if variables missing in that pattern (marked with X) are not used.
Tabel diatas menunjukkan sisi lain dari penyebaran missing value,dimana missing
value dinyatakan per variabel. Pada baris pertama, angka 13 menyatakan ada 13 data yang
valid, artinya tidak terdapat missing value pada semua variabelnya.
Angka 6 pada baris kedua menunjukkan adanya 5 data yang missing pada variabel IQ.
Jika dilihat pada tabel sebelumnya, maka responden yang mempunyai data missing pada
variabel IQ adalah Ani, Rian, Gian, Bowo, Ayu, Andika.
Angka 4 menunjukkan adanya 4 data yang missing pada variabel Nilai SMA. Maka
responden yang mempunyai missing pada variabel nilai SMA adalah Bima, Devi, Qori,
Herlan. Dan seterusnya untuk baris berikutnya.
Dan pada kolom complete, jika 6 data yang missing di variabel IQ diperbaiki
sehingga menjadi tidak missing, maka semua data yang tidak missing menjadi: 13+6=19 data
yang lengkap. Jika data yang missing di variabel di nilai SMA ada 4 data diperbaiki maka
semua data yang tidak missing menjadi : 13+4 = 17 dan begitu seterusnya.
6
Listwise Correlations
BiayaKulia Pendapata JumlahSau
Umur
Umur
h
nOtangTua
dara
NilaiSMA
IQ
1
BiayaKuliah
.520
1
PendapatanOrangTua
-.172
.101
1
JumlahSaudara
-.190
-.243
-.139
1
NilaiSMA
-.031
-.317
.103
.044
1
.139
-.261
-.145
.181
.628
IQ
1
Tabel diatas menunjukkan korelasi antar-variabel untuk 13 data. Angka 0,520 pada
tabel diatas menyatakan besar korelasi antara variabel umur dan biaya kuliah. Angka 0,101
menunjukkan korelasi antar variabel pendapatan orang tua dengan biaya kuliah. Dan
demikian seterusnya untuk korelasi variabel yang lain.
Angka 0,628 menunjukkan korelasi antara variabel IQ dan nilai SMA. Angka korelasi
yang besar ini menyatakan bahwa terjadinya missing value dari variabel IQ berpengaruh kuat
pada terjadinya missing value pada variabel nilai SMA. Sebaliknya angka korelasi variabel
pendapatan orang tua dan biaya kuliah sebesar 0,101 yang dibawah 0,5. Hal ini berarti
adanya tingkat keacakan yang tinggi pada missing value, karena pengaruh antar-variabel
lemah.
7
Pairwise Frequencies
BiayaKulia Pendapata JumlahSau
Umur
h
nOtangTua
dara
NilaiSMA
IQ
Status
Umur
41
BiayaKuliah
36
45
PendapatanOtangTua
35
39
44
JumlahSaudara
34
38
37
43
NilaiSMA
37
41
40
39
46
IQ
35
39
38
37
40
44
Status
41
45
44
43
46
44
50
Metode pairwise akan memasangkan (pair) variabel yang mempunyai data lengkap,
dan tidak menghilangkan sebuah baris begitu saja. Dengan demikian jumlah data bisa
berbeda-beda tergantung kelengkapan data dua variabel yang dipasangkan.
Jika yang dipasangkan variabel umur dan biaya kuliah, maka akan ada 36 data yang
valid. Namun jika yang dipasangkan variabel biaya kuliah dengan IQ maka akan ada 39 data
yang valid. Demikian seterusnya untuk kombinasi variabel lainnya.
Pairwise Correlations
BiayaKulia Pendapata JumlahSau
Umur
Umur
h
nOtangTua
dara
NilaiSMA
IQ
1
BiayaKuliah
.028
1
PendapatanOtangTua
-.447
.312
1
JumlahSaudara
-.063
-.107
-.038
1
NilaiSMA
-.076
-.017
.112
.008
1
.025
.154
.003
.148
.563
IQ
1
Tabel diatas mempunyai tafsiran yang sama dengan analisis korelasi antar-variabel
dengan metode listwise. Angka korelasi yang diatas 0,5 berjumlah sangat sedikit, sehingga
bisa dikatakan missing value adalah acak (random). Pada tabel diatas angka diatas 0,5 tidak
ada sehingga bisa dikaan missing adalah acak.
8
EM Correlationsa
BiayaKulia Pendapata JumlahSau
Umur
Umur
h
nOrangTua
dara
NilaiSMA
IQ
1
BiayaKuliah
-.003
1
PendapatanOrangTua
-.426
.307
1
.015
-.088
-.054
1
-.076
-.031
.045
.014
1
.012
.156
-.044
.144
.551
JumlahSaudara
NilaiSMA
IQ
1
a. Little's MCAR test: Chi-Square = 24,899, DF = 30, Sig. = ,730
Pada tabel hanya ada 1 data yang diatas 0,5 yaitu 0,551 artinya pola penyebarab
missing value adalah random. Terlihat angka MCAR yang ditampilkan adalah 0,730, maka
missing value adalah acak karena besar dari 0,05.
Kesimpulan : missing value yang terjadi adalah bersifatacak. Karena bersifat acak
dan tidak memiliki pola tertentu, maka bisa dilakukan perlakuan lanjutan.
2. Mengisi Missing Value
Result Variables
Case Number of Non-Missing
Values
N of Replaced
Result Variable
1
2
3
6
Last
N of Valid Cases
Function
9
1
50
50 SMEAN(Umur)
BiayaKuliah_1
5
1
50
50
6
1
50
50
7
1
50
50
NilaiSMA_1
4
1
50
50
IQ_1
6
1
50
50 SMEAN(IQ)
PendapatanOtan
JumlahSaudara_
1
5
First
Umur_1
gTua_1
4
Missing Values
Creating
SMEAN(BiayaKu
liah)
SMEAN(Pendap
atanOtangTua)
SMEAN(Jumlah
Saudara)
SMEAN(NilaiSM
A)
9
Dari tabel result variables diatas terlihat ada 9 data untuk variabel umur yang diganti, 5
variabel biaya kuliah, 6 variabel pendapatan orang tua, 7 variabel jumlah saudara, 4 variabel
nilai SMA san 6 vriabel IQ.
3. Uji Data Outlier
a. Standarisasi Data
Descriptive Statistics
N
Minimum
Maximum
Mean
Std. Deviation
SMEAN(Umur)
50
17.00
21.00
19.0000
1.06904
SMEAN(BiayaKuliah)
50
500.00
980.00
7.0178E2
120.73396
50
600.00
1200.00
9.3409E2
165.29896
SMEAN(JumlahSaudara)
50
1.00
5.00
3.0698
.84262
SMEAN(NilaiSMA)
50
75.00
90.00
81.0000
3.86507
SMEAN(IQ)
50
105.00
135.00
1.1948E2
8.45514
Valid N (listwise)
50
SMEAN(PendapatanOtangT
ua)
Dari tabel diatas dapat dilihat bahwa rata-rata umur responden adalah 19,00 tahun
dengan standar deviasi 1,06 tahun. Rata-rata jumlah saudara responden adalah 3,06 orang
dengan standar deviasi 0,84. Dan begitu seterusnya.
b. Box Plot
Umur
Tidak ada satu pun data Umur yang ada di luar BoxPlot. Dengan demikian, bisa
dikatakan tidak ada data outlier ataupun ekstrem pada variabel ini.
10
Biaya Kuliah
Terlihat tidak ada satu pun data biaya kuliah yang ada di luar BoxPlot. Dengan
demikian Dengan demikian, bisa dikatakan tidak ada data outlier ataupun ekstrem pada
variabel ini.
4. Uji Normalitas Data
11
Terlihat sebaran data dari variabel IQ bergerombol di sekitar garis uji yang mengarah
ke kanan atas, dan tidak ada data yang terletak jauh dari sebaran data. Dengan demikian, data
tersebut bisa dikatakan normal.
Terlihat sebaran data dari variabel IQ bergerombol di sekitar garis uji yang mengarah
ke kanan atas, dan tidak ada data yang terletak jauh dari sebaran data. Dengan demikian, data
tersebut bisa dikatakan normal.
5. Uji Homokedastisitas Data
Test of Homogeneity of Variance
Levene Statistic
SMEAN(BiayaKuliah)
df2
Sig.
Based on Mean
.859
1
48
.359
Based on Median
.959
1
48
.332
.959
1
47.764
.332
.861
1
48
.358
1.683
1
48
.201
.133
1
48
.717
.133
1
40.406
.717
1.441
1
48
.236
Based on Median and with
adjusted df
Based on trimmed mean
SMEAN(NilaiSMA)
df1
Based on Mean
Based on Median
Based on Median and with
adjusted df
Based on trimmed mean
12
Pada baris Biaya Kuliah dari tabel output diatas, dan dengan dasar Mean, didapat
angka SIG adalah 0,359. Karena angka SIG > 0,05, maka Ho diterima. Hal ini berarti varians
dari data biaya kuliah responden yang memilih bekerja relatif sama dengan data biaya kuliah
responden yang memilih kuliah. Sehingga bisa disimpulkan telah terjadi homoskedastisitas
variabel biaya kuliah dengan dasar grup status.
Pada baris nilai SMA, dan dengan dasar Mean didapat angka SIG adalah 0,201 maka
Ho diterima. Hal ini berarti varians dari data nilai SMA responden yang memilih bekerja
relatif sama dengan data nilai SMA responden yang memilih kuliah. Sehingga terjadi
homoskedastisitas variabel nilai SMA dengan dasar grup Status.
6. Uji Linearitas Data
Terlihat garis regresi pada grafik diatas yang cenderung mendatar. Kemudian jika
dilihat pada persamaan regresi koefisien praktis mendekati 0 (0,0004171). Hal ini
membuktikan tidak adanya linearitas pada hubungan dua variabel tersebut, yang berarti
semakin besar atau semakin kecil umur seseorang tidak ada hubungannya dengan tingginya
IQ seseorang
13
Pada gambar diatas dapat dilihat garis regresi yang mengarah kekanan atas, ini
membuktikan adanya linearitas pada hubungan dua variabel tersebut yaitu variabel biaya
kuliah dengan variabel pendapatan orang tua. Artinya semakin tinggi biaya kuliahnya maka
semakin tinggi pula pendapatan orang tuanya.
14
ANALISIS DISKRIMINAN
1. Menilai Variabel Yang Layak Untuk Analisis
Tests of Equality of Group Means
Wilks' Lambda
F
df1
df2
Sig.
SMEAN(Umur)
.930
3.613
1
48
.063
SMEAN(BiayaKuliah)
.994
.314
1
48
.578
.834
9.542
1
48
.003
SMEAN(JumlahSaudara)
.970
1.478
1
48
.230
SMEAN(NilaiSMA)
.779
13.642
1
48
.001
SMEAN(IQ)
.767
14.587
1
48
.000
SMEAN(PendapatanOtangT
ua)
a. Dengan angka Wilk’s Lambda
Angka Wilks’s Lambda berkisar 0 sampai1. Jika angka mendekati 0 maka data tiap grup
cenderung berbeda, sedang jika angka mendekati 1, data tiap grup cenderung sama.
Dari tabel diatas terlihat angka Wilk’s Lambda berkisar antara 0,767 sampai0,994
(mendekati 1). Dari kolom Sig bisa dilihat bahwa hanya variabel biaya kuliah yang
cenderung tidak berbeda. Hal ini berarti biaya kuliah untuk mereka yang bekerja atau kuliah
ternyata tidak berbeda secara nyata. Hanya disini mendekati angka 1 dulit ditentukan secara
pasti, karena hampir semua variabel diatas mempunyai angka Wilk’s Lambda yang besar,
namun hanya satu variabel yang tidak lolos. Untuk itu dilakukan pengujian ANOVA
b. Dengan F test
Variabel pendapatan orang tua, angka Sig nya dibawah 0,05 (0,003). Artinya ada
perbedaan antar-grup atau responden yang memilih bekerja atau kuliah. Mungkin
mereka yang pendapatan orang tuanya lebih tinggi akan memilih kuliah dibanding
mereka yang orang tuanya berpendapatan lebih rendah. Atau mungkin sebaliknya.
Variabel Nilai SMA, angka Sig nya 0,001. Artinya ada perbedaan antar grup. Mungkin
mereka yang nilai SMAnya lebih tinggi akan memilih untuk kuliah daripada mereka
yang nilai SMAnya lebih rendah. Atau sebaliknya.
Variabel Biaya Kuliah, angka Signya 0,578. Halini berarti biaya kuliah seorang
responden tidak mempengaruhi mereka untuk memilih bekerja atau kuliah. Kesimpulan
ini hampir sama dengan jika berpatokan pada angka Wilk’s Lambda yang hampir
mendekati 1 untuk variabel biaya kuliah.
15
Variabel jumlah saudara, angka Signya adalah jauh diatas 0,05 yaitu 0,230. Artinya
jumlah saudara seorang responden tidak memengaruhi seorang responden untuk
memilih bekerja atau kuliah.
Dari enam variabel, ada tiga varibel yang berbeda secara signifikan untuk dua grup
signifikan, yaitu pendapatan orang tua, nilai SMA dan IQ. Dengan demikian, seorang
responden memilih bekerja atau kuliah dipengaruhi oleh pendapatan orang tua
responden tersebut, nilai ketika di SMA, dan IQ yang dimiliki oleh responden tersebut.
Test Results
Box's M
F
23.940
Approx.
.986
df1
21
df2
8.474E3
Sig.
.477
Tests null hypothesis of equal
population covariance matrices.
Dari tabel terlihat bahwa angka Signya jauh diatas 0,05 yaitu 0,477, yang berarti
group covariance matrices adalah sama. Hal ini berarti data diatas sudah memenuhi asumsi
analisis diskriminan, sehingga proses bisa dilanjutkan.
Asumsinya adalah:
Varians variabel bebas untuk tiap grup seharusnya sama. Jika demikian, seharusnya
varians dari responden yang memilih bekerja sama dengan varians responden yang
memilih kuliah.
Varians diantara variabel-variabel bebas seharusnya juga sama. Jika denikian,
seharusnya varians dari umur sama dengan varians dari biaya kuliah, sama dengan
variabel biaya kuliah, pendapatan orang tua dan sebagainya.
Log Determinants
Status
Rank
Log Determinant
Bekerja
6
25.049
Kuliah
6
24.532
Pooled within-groups
6
25.289
The ranks and natural logarithms of determinants
printed are those of the group covariance matrices.
16
Terlihat angka Log determinant untuk kategori bekerja 25,049 dan kuliah (24,532)
tidak berbeda banyak, sehingga group covariance matrices akan relatif sama untuk kedua
grup.
2. Proses Diskriminan.
Group Statistics
Valid N (listwise)
Status
Bekerja
Mean
SMEAN(PendapatanOtangT
ua)
SMEAN(NilaiSMA)
SMEAN(IQ)
Kuliah
SMEAN(PendapatanOtangT
ua)
SMEAN(NilaiSMA)
SMEAN(IQ)
Total
SMEAN(PendapatanOtangT
ua)
SMEAN(NilaiSMA)
SMEAN(IQ)
Std. Deviation
Unweighted
Weighted
8.6745E2
125.94122
25
25.000
79.2000
3.24037
25
25.000
1.1544E2
7.79536
25
25.000
1.0007E3
175.13980
25
25.000
82.8000
3.64005
25
25.000
1.2352E2
7.15340
25
25.000
9.3409E2
165.29896
50
50.000
81.0000
3.86507
50
50.000
1.1948E2
8.45514
50
50.000
Tabel Group Statistics pada dasarnya berisi data statistik (deskriptif) yang utama, yakni
rata-rata dan standar deviasi, dari kedua grup responden.
Responden yang memilih bekerja, rata-rata nilai SMA nya adalah 79,20 sedangkan
responden yang memilih kuliah rata-rata nilai SMA nya adalah 82, 80. Sedangkan responden
yang memilih bekerja, rata-rata pendapatan orang tuanya adalah 867,550 dan responden yang
memilih kuliah, rata-rata pendapatan orangtuanya adalah 1,000,000. Dan responden yang
memilih bekerja juga rata-rata memiliki IQ sekitar 115,44 sedangkan responden yang
memilih kuliah, rata-rata memiliki IQ sekitar 123,52.
Dari tabel diatas juga terlihat bahwa ada 25 responden yang memilih bekerja, dan 25
responden yang memilih kuliah. Jika melihat semua variabel terisi angka 25 dan 25
semuanya, maka pada kasus ini tidak ada data yang hilang (missing), sehingga total data
untuk semua variabel adalah 50 responden.
17
Variables Entered/Removeda,b,c,d
Min. D Squared
Exact F
Step
1
Entered
SMEAN(IQ
)
2
Statistic
1.167
SMEAN(Pe
ndapatanO
2.552
tangTua)
Between Groups
Bekerja and
Kuliah
Bekerja and
Kuliah
Statistic
df1
df2
Sig.
14.587
1
48.000
.000
15.617
2
47.000
6.302E-6
At each step, the variable that maximizes the Mahalanobis distance between the two closest groups
is entered.
a. Maximum number of steps is 6.
b. Maximum significance of F to enter is .05.
c. Minimum significance of F to remove is .10.
d. F level, tolerance, or VIN insufficient for further computation.
Tabel ini menyajikan variabel mana saja dari enam variabel input yang bisa
dimasukkan dalam persamaan diskriminan. Karena proses adalah stepwise (beratahap) maka
akan dimulai dengan variabel yang mempunyai angka F hitung (statistik) terbesar.
Tahap pemasukan variabel bebas :
Pada tahap pertama, angka F hitung variabel IQ adalah 14,587, maka pada tahap
pertama ini variabel IQ terpilih.
Pada tahap kedua, angka F hitung mencapai 15,617, maka pada tahap kedua ini variabel
Pendapatan orang tua terpilih.
Kedua variabel tersebut memiliki 2 variabel yang tentunya mempunyai Sig dibawah
0,05, seperti variabel IQ Signya 0,000 dan variabel pendapatan mempunyai Sig jauh dibawah
0,05 yaitu 6,301E-6 atau 0,000006301.
Dengan demikian, dari tiga variabel yang dimasukkan, hanya ada dua variabel yang
signifikan. Atau bisa dikatakan IQ dan pendapatan orang tua mempengaruhi perilaku
responden untuk memilih bekerja atau kuliah. Atau mereka yang memiliki IQ dan pendapatan
orang tua diatas rata-rata akan memilih untuk kuliah, dan begitu seterusnya.
18
Variables in the Analysis
Sig. of F to
Step
Tolerance
1
SMEAN(IQ)
2
SMEAN(IQ)
SMEAN(PendapatanOtangT
ua)
Remove
Min. D Squared Between Groups
1.000
.000
.939
.000
.763
.939
.001
1.167
Bekerja and
Kuliah
Bekerja and
Kuliah
Pada step 1, variabel IQ adalah variabel pertama yang dimasukkan kedalam model
diskriminan. Hal ini disebabkan variabel tersebut mempunyai angka Sig. Of F to Remove
yang paling sedikit yaitu 0,000 (jauh di bawah 0,05).
Kemudian pada step 2, dimasukkan variabel kedua yakni, variabel pendapatan orang
tua. Variabel tersebut memenuhi syarat, karena mempunyai angka Sig. Of F to Remove
dibawah 0,05 yakni 0,001.
Variables Not in the Analysis
Step
0
Tolerance
SMEAN(IQ)
SMEAN(NilaiSMA)
SMEAN(PendapatanOtangTu
a)
1
SMEAN(NilaiSMA)
SMEAN(PendapatanOtangTu
a)
2
SMEAN(NilaiSMA)
Min. Tolerance
Sig. of F to Enter Min. D Squared Between Groups
1.000
1.000
.000
1.167
1.000
1.000
.001
1.091
1.000
1.000
.003
.763
.867
.867
.038
1.655
.939
.939
.001
2.552
.865
.826
.050
3.114
Bekerja and
Kuliah
Bekerja and
Kuliah
Bekerja and
Kuliah
Bekerja and
Kuliah
Bekerja and
Kuliah
Bekerja and
Kuliah
Tabel diatas merupakan kebalikan dari tabel sebelumnya, dimana pada tabel ini adalah
proses pengeluaran. Pada step 0 (awal) ketiga variabel tersebut secara lengkap ditayangkan
dengan angka Sig. Of F to Remove sebagai faktor penguji. Terlihat angka Sig. Terkecil
adalah pada variabel IQ yaitu 0,00. Maka variabel IQ dikeluarkan dari step 0 tersebut, yang
berarti variabel tersebut bukan termasuk variabel yang tidak dianalisis.
19
Pada step 1, terlihat ada 2 variabel, dan variabel pendapatan orang tua dengan Sig of F
to Remove adalah 0,001 sehingga variabel tersebut dikeluarkan. Sekarang hanya ada satu
variabel yaitu variabel nilai SMA, dan variabel tersebut mempunyai Sig of F to Remove
diatas 0,05 (yakni 0,826). Karena sudah tidak ada data variabel yang memenuhi syarat, maka
proses pengeluaran variabel berhenti, dan variabel tersebut tidak bisa dikeluarkan, yang
berarti variabel tersebut termasuk pada variable not in the analysis, atau variabel yang tidak
dianalisis lebih lanjut.
Wilks' Lambda
Exact F
Number of
Step
Variables
Lambda
df1
df2
df3
Statistic
df1
df2
Sig.
1
1
.767
1
1
48
14.587
1
48.000
.000
2
2
.601
2
1
48
15.617
2
47.000
.000
Wilks’s Lambda pada prinsipnya adalah varians total dalam diskriminant scores yang
tidak bisa dijelaskan oleh perbedaan diantara grup-grup yang ada. Pada step 1, jumlah
variabel yang dimasukkan ada satu (IQ), dengan angka Wilk’s Lambda adalah 0,767. Hal ini
berarti 76,7% varans tidak dapat dijelaskan oleh perbedaan antar grup-grup. Kemudian pada
step 2, dengan tambahan variabel pendapatan orang tua, angka Wilk’s Lambda turun menjadi
0,601 atau 60,1%. Penurunan angka Wilk’s Lambda tentu baik bagi model diskriminan,
karena varians yang tidak bisa dijelaskan juga semakin kecil.
Dari kolom F dan Sig-nya, erlihat baik pada pemasukan variabel 1 dan 2, semuanya
adalah signifikan secara statistik. Hal ini berarti kedua variabel tersebut (IQ dan pendapatan
orang tua) memang berbeda untuk kedua pilihan responden.
Eigenvalues
Functio
n
Canonical
Eigenvalue
.665a
1
% of Variance
100.0
Cumulative %
Correlation
100.0
.632
a. First 1 canonical discriminant functions were used in the analysis.
Canonical Correlation mengukur keeratan hubungan antara diskriminant score dengan
grup. Angka 0,632 menunjukkan keeratan yang cukup tinggi, dengan ukuran skala asosiasi 0
sampai 1.
20
Wilks' Lambda
Test of
Functio
n(s)
Wilks' Lambda
1
Chi-square
.601
Df
23.949
Sig.
2
.000
Tabel diatas menyatakanangka akhir dari Wilk’s Lambda, yang sebenarnya sama saja
dengan angka terakhir dari step 2 pembuatan model diskriminan. Angka Chi-Square sebesar
23,949 dengan signifikan yang tinggi menunjukkan perbedaan yang jelas antara dua grup
responden.
Structure Matrix
Function
1
SMEAN(IQ)
.676
SMEAN(PendapatanOtangT
.547
ua)
SMEAN(NilaiSMA)a
.217
Pooled within-groups correlations between
discriminating variables and standardized
canonical discriminant functions
Variables ordered by absolute size of
correlation within function.
a. This variable not used in the analysis.
Tabel Structure Matrix menjelaskan korelasi antara variabel independen dengan fungsi
diskriminan yang terbentuk terlihat variabel IQ paling erat hubungannya dengan fungsi
diskriminan, diikuti oleh variabel pendapatan orang tua dan nilai SMA.
Prior Probabilities for Groups
Cases Used in Analysis
Status
Prior
Unweighted
Weighted
Bekerja
.500
25
25.000
Kuliah
.500
25
25.000
Total
1.000
50
50.000
21
Tabel diatas memperlihatkan komposisi ke 50 responden, yang dengan model
diskriminan menghasilkan 25 responden ada di grup bekerja,dan 25 responden digrup kuliah.
22
BAB III
PENUTUP
3.1 KESIMPULAN
Dari proses uji data sampai analisis output, dapat disimpulkan bahwa ada perbedaan
yang signifikan antara responden yang memilih bekerja dan responden yang memilih kuliah.
Hal ini dibuktikan pada analisis Wilk’s Lambda, dimana variabel yang terlihat berbeda
adalah variabel IQ dan pendapatan orang tua.
Variabel yang membuat perilaku seseorang yang memilih bekerja atau kuliah
berbeda adalah variabel Iqdan pendapatan orang tua. Hal ini terlihat pada step analisis awal,
baik bagian Variable In Analysis maupun Variable Not In Analysis.
Jadi, IQ dan pendapatan orang tua mempengaruhi perilaku responden untuk memilih
bekerja atau kuliah. Atau mereka yang memiliki IQ dan pendapatan orang tua diatas rata-rata
akan memilih untuk kuliah, dan sebaliknya mereka yang memiliki IQ dan pendapatan orang
tua yang lebih rendah memilih untuk bekerja.
3.2 SARAN
Kritik dan saran sangat penulis harapkan dalam makalah ini, segala kekurangan yang
ada dalam makalah ini mungkin karena kelalaian atau ketidaktahuan penulis dalam
penyusunannya. Segala hal yang tidak relevan, kekurangan dalam pengetikan atau bahkan
ketidakjelasan dalam makalah ini merupakan proses penulis dalam mempelajari bidang studi
ini dan diharapkan bagi pembaca dapat mengambil manfaat dari makalah ini.
23
DAFTAR PUSTAKA
Santoso , Singgih. 2012. Aplikasi SPSS pada Statistik Multivariat. Elex Media Komputindo :
Jakarta.
24