PENGGUNAAN PROGRAM R DALAM MENYELESESAIKAN PERMASALAHAN STATISTIKA
LAPORAN PRAKTIKUM KOMPUTASI STATISTIKA PENGGUNAAN PROGRAM R DALAM MENYELESESAIKAN PERMASALAHAN STATISTIKA Oleh : WIDNU PRAMANA PUTRA BARUS (10835) GEMPUR SAFAR (10877) ADHIARSA RAKHMAN (11063) ARYA ANDIKA DUMANAUW (11093) Asisten: JIM OKLAHOMA MEILIANA BUDI EKAWATI Dosen Pengampu : Dr.rer.nat. DEDI ROSADI, S.Si., M.Sc. LABORATORIUM KOMPUTASI STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS GADJAH MADA YOGYAKARTA 2009 analisis residual pada model yang telah diperoleh! Ingat, asumsi analisis residual :
8.00 Analisislah data di atas, hingga diperoleh model regresi terbaik, kemudian lakukan
9.00 412.60
9.00 366.25
14.23
36.15
34.55
7.00 400.25
16.59
37.44
33.98
6.00 423.22
13.02
36.85
33.45
18.78
35.92
36.10
32.79
5.00 400.23
13.56
37.12
32.26
8.00 423.00
15.26
35.84
29.80
9.00 362.02
18.29
33.72
34.76
15.26
6.00 323.45
12.45
13.45
39.33
44.98
8.00 512.33
14.32
38.98
40.12
8.00 451.29
19.25
36.96
36.99
8.00 415.25
35.91
9.00 435.23
36.87
9.00 365.21
12.89
34.79
36.25
10.00 352.16
13.33
37.91
36.21
8.00 430.22
15.78
38.20
35.99
28.94
13.67
1. Berikut ini adalah data keuntungan penjualan (Y) suatu produk yang dipengaruhi oleh
jenis promosi :Penjualan Iklan Koran Iklan TV Iklan Radio Jumlah Outlet
39.17
29.38
24.86
8.00 254.25
12.03
33.63
23.45
8.00 320.14
19.58
34.25
23.25
5.00 330.92
18.45
23.21
6.00 235.26
10.00 452.62
15.26
29.49
22.98
5.00 254.26
13.44
32.28
22.41
7.00 295.15
13.23
27.90
20.98
215.36
13.87
24.88
35.42
25.89
26.25
5.00 354.25
15.87
30.22
26.23
7.00 265.21
12.23
32.33
26.23
11.00 300.12
12.05
32.09
8.00 265.99
29.19
18.97
29.14
25.87
8.00 222.32
12.88
33.44
25.12
9.00 312.25
16.35
32.82
25.00
9.00 302.21
15.69
- Normalitas
- Homoskedastisitas
- No Autokorelasi
- No Multikolinearitas (Tidak perlu dilakukan penanganan jika asumsi-asumsi untuk analisis residual tidak terpenuhi !)
28
12
33 83 101
94
22
23
36
14
33
56 Bebas
25
10
41 76 122
83
36
86
22
58
35
23
72
32
60 89 136 120
48
93 35 126 38 153
Terbatas
25
31 83 110 64 128
91
19 99 118 87 140
Diasumsikan data berdistribusi normal dan variansi nya sama. Apakah ada efek antara lingkungan dan galur dengan unjuk kerja tikus? (Petunjuk : Gunakan Anava 2 arah !)
3. a. Diketahui seseorang berusia 25 tahun , peluang dia tetap hidup sampai 1 tahun
lagi adalah 0.9 , dengan begitu, probabilitasnya dia akan mati sebelum satu tahun adalah 0.1 .Usia Bambang sekarang 25 tahun. Berapa peluang bambang meninggal sebelum usia 28? tunjukkan matrix stokastik / matrix transisi n- langkahnya! b. Tanpa mengganti probabilitas kematian pada poin a, terdapat tambahan asumsi dimana peluang seseorang yang sehat berusia 25 tahun menderita suatu penyakit kronis sebelum 1 thn kedepan adalah 0.2, Dan peluang seseorang dengan umur yang sama dan telah menderita penyakit tersebut untuk mati sebelum 1 tahun kedepan adalah 3 kali lipat peluang kematian seseorang yang sehat. Dan diketahui seseorang yang telah terjang kit penyakit ini tidak mungkin untuk sembuh. Berapa kemungkinannya Sinta akan bertahan sampai setidaknya 2 tahun dari sekarang? tunjukkan juga matrix stokastiknya!
4. a. Dengan mengunakan operasi matriks di R dan aturan Cramer selesaikan persamaan berikut: digunakan untuk semua data.
5. a. Tulislah fungsi untuk menghitung sudut terkecil yang terbentuk antara jarum
panjang dan jarum pendek saat menunjuk jam tertentu. sebagai contoh jika pengguna memasukkan jam 3.30 fungsi akan menampilkan output “75 derajat”. Input dari fungsi ini adalah dua bilangan bulat yang melambangkan jam dan menit. Output dari fungsi ini adalah sudut terkecil yang dibentuk oleh jam tersebut.b. Tuliskan fungsi untuk mencari semua nilai x, y dan z yang memenuhi persamaan linear berikut: dengan
Fungsi ini harus menuliskan “segitiga” jika titik-titik tersebut dapat membentuk segitiga dan “bukan segitiga” jika titik-titik tersebut tidak dapat membentuk segitiga. Sebagai contoh jika pengguna memasukkan tiga titik masing-masing (1,1), (3,3), dan (5,5) fungsi akan menampilkan “bukan segitiga”. Bila pengguna memasukkan (1,1), (3,3) dan (5,0) fungsi akan menampilkan “segitiga”. Input dari pengguna adalah enam bilangan real yang melambangkan nilai x dan y dari tiga koordinat titik. Output dari fungsi ini adalah “segitiga” atau “bukan segitiga”.
6. Buat fungsi untuk menampilkan segitiga cantik sama kaki yang mengandung 2
karakter dimana karakternya tidak boleh sama dengan karakter di kanan, kiri, atas dan bawahnya(selang seling gitu lho!)dengan inputnya adalah tinggi segitiga-nya! berikut contoh outputnya untuk input 8 dan 15:Pemodelan Regresi (menggunakan Rcmdr): Scatter Diagram : Graph Scatterplot (scatterplot matrix) pilih sumbu x dan y
Fit Models Linear Regression Output : Dari output tersebut diperoleh bahwa :
R-square = 0.9721 yang berarti bahwa model regresi dengan 4 variabel independet
tersebut mampu menjelaskan 97.21% variasi dalam penjualan. Adjusted R-square = 0.9677Untuk uji overall test, kita dapat melihat nilai output pada baris terakhir, terlihat bahwa
p-value < 2.2e-16 yang dapat disimpulkan bahwa model regresi dengan 4 variabel
independen tersebut layak untuk digunakan.Selanjutnya untuk uji partial kelayakan masing-masing variabel independen, terlihat
bahwa ada variabel independen yang tidak signifikan, yaitu Iklan Radio, maka
dilakukan regresi ulang tanpa mengikutsertakan variabel ini. Dan diperoleh : Terlihat semua variabel telah signifikan, sehingg diperoleh model regresi :Penjualan= - 370.5591+ 2.1453 IklanKoran + 19.9495 IklanTV – 4.0195 JumlahOutlet
Analisis Residual Models
Numerical Diagnostic pilih analisis residual yang ingin dilakukan
Normalitas Residual Models Graphs Basic Diagnostic Plots Dari Normal QQ-Plot tersebut terlihat bahwa nilai observasi (titik-titik) terletak dekat dengan garis diagonal yang menandakan residual berdistribusi normal. Atau dengan menggunakan uji Shapiro-Wilk karena data berjumlah 30 (<50) dengan terlebih dahulu menyimpan nilai residual dengan cara Models
Add Observation Statistics to Data aktifkan Residual Setelah itu pilih Statistics
Summaries Shapiro –Wilk test of Normality pilih residual Terlihat bahwa nilai p-value > alpha 0.05 yang berarti asumsi kenormalan data terpenuhi. No autokorelasi
Statistics
Summaries Durbin Watson Test For autokorelation
Durbin-Watson test
data: Penjualan ~ Iklan.Koran + Iklan.TV + Jumlah.Outlet DW = 1.5966, p-value = 0.1804 alternative hypothesis: true autocorelation is not 0 dari output tersebut terlihat bahwa p-value = 0.1804 > alpha 0.05 yang berartoi bahwa Hipothesis nol tidak ditolak, sehingga dapat disimpulkan bahwa asusmsi no autokorelasi residual terpenuhi. Non Multikolinearitas Untuk mengetahui apakah asumsi no Multikolinieritas terpenuhi, langsung di cek dengan mengetikkan sintax vif(nama model regresi fit yang diperoleh) multikolinearitas terpenuhi Homoskedastisitas Terlihat bahwa asumsi homoskedastisitas tidak terpenuhi karena terlihat titik-titik residual terletak menyebar jauh dari nol. Dan cenderung membentuk pola kuadratik
Analisis Variansi 2 Arah : Statistics means Multi-way ANOVA Output : Anova Table (Type II tests) Response: kesalahan Sum Sq Df F value Pr(>F) galur 18154 2 9.0356 0.0005448 *** lingkungan 14876 1 14.8076 0.0003988 *** galur:lingkungan 1235 2 0.6148 0.5455629 Residuals 42193 42
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Dari output tersebut terlihat bahwa efek galur dan efek lingkungan masing-masing secara terpisah signifikan untuk tingkat signifikansi 5%, sedangkan untuk interaksi antara galur dan lingkungan tidak signifikan. Jadi, peluang budi meninggal sebelum usia 28 tahun adalah 0.271
b. syntax
4. a. Dengan mengunakan operasi matriks di R dan aturan Cramer akan diselesaikan persamaan berikut: Script R dan hasil : a=matrix(c(1,-3,-1,0,4,-2,2,6,3),nrow=3) b=matrix(c(6,30,8,0,4,-2,2,6,3),nrow=3) c=matrix(c(1,-3,-1,6,30,8,2,6,3),nrow=3) d=matrix(c(1,-3,-1,0,4,-2,6,30,8),nrow=3) x=det(b)/det(a) y=det(c)/det(a) z=det(d)/det(a) { cat("x1=",x,"\n") cat("x2=",y,"\n") cat("x3=",z,"\n") } x1= -0.909091 x2= 1.636364 x3= 3.454545 untuk semua data Script : reg.ganda=function(x,y) { X=cbind(1,x) n=length(y) p=ncol(X) b=solve(t(X)%*%X)%*%(t(X)%*%y) dfr=p-1 dfe=n-p dft=n-1 ssr=round((t(b)%*%(t(X)%*%y)-(sum(y))^2/n)[1],3) sse=round((t(y)%*%y-t(b)%*%t(X)%*%y)[1],3) sst=ssr+sse msr=round(ssr/dfr,3) mse=round(sse/dfe,3) fhit=round(msr/mse,3) p_v=round(pf((fhit),dfr,dfe,lower.tail=FALSE),3) rsquare=round(ssr/sst,3) r=round(sqrt(rsquare),3) adjrsquare=round(rsquare-((p-1)*(1-rsquare)/(n-p)),3) yhead=X%*%b ehead=y-yhead min=round(min(ehead),3) max=round(max(ehead),3) q1=round(quantile(ehead)[2],3) q2=round(quantile(ehead)[3],3)
residual=cbind(min,q1,q2,q3,max) colnames(residual)=c("Min","1Q","Median","3Q","Max") rownames(residual)="" skuadrat=mse*solve(t(X)%*%X) sb=NULL for(i in 1:ncol(skuadrat)){ for(j in 1:nrow(skuadrat)) { if(i==j)
{ sb[i]=sqrt(skuadrat[i,j]) } }
} t_hit=round(b/sb,4) p_value=round(2*pt(abs(t_hit),dfe,lower.tail=FALSE),4) beta=NULL for(i in 1:ncol(X)) { beta[i]=i-1 }
coefficients=data.frame(Beta=beta,Estimate.Std=b,Std.Error=sb,t_val ue=t_hit,P_value=p_value)
anova=data.frame(smbr.var=c("Regresi","Sesatan","Total"),db=c(dfr,d
fe,dft),SS=c(ssr,sse,sst),MS=c(msr,mse," "),F_hit=c(fhit," "," "),P_value=c(p_v," "," ")) model=data.frame(R=r,R.Square=rsquare,Adj.R.Square=adjrsquare) s=coefficients) } { cat("\tANALISIS REGRESI GANDA\n") cat("usage:\n") cat("regganda(x,y)\n") cat("\tx=matrix(x)\n") cat("\ty=matrix(y)\n") }
5. a. Fungsi untuk Menghitung Sudut Terkecil yang Terbentuk dari 2 Jarum Jam Script di R : Contoh : berikut: dengan Script : Output :
c. Fungsi Untuk menentukan apakah 3 koordinat titik membentuk segitiga atau tidak Script :
6. fungsi untuk menampilkan segitiga cantik sama kaki yang mengandung 2 karakter
dimana karakternya tidak sama dengan karakter di kanan, kiri, atas dan bawahnya dengan input adalah tinggi segitiga Script :