PENGGUNAAN PROGRAM R DALAM MENYELESESAIKAN PERMASALAHAN STATISTIKA

  LAPORAN PRAKTIKUM KOMPUTASI STATISTIKA PENGGUNAAN PROGRAM R DALAM MENYELESESAIKAN PERMASALAHAN STATISTIKA Oleh : WIDNU PRAMANA PUTRA BARUS (10835) GEMPUR SAFAR (10877) ADHIARSA RAKHMAN (11063) ARYA ANDIKA DUMANAUW (11093) Asisten: JIM OKLAHOMA MEILIANA BUDI EKAWATI Dosen Pengampu : Dr.rer.nat. DEDI ROSADI, S.Si., M.Sc. LABORATORIUM KOMPUTASI STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS GADJAH MADA YOGYAKARTA 2009 analisis residual pada model yang telah diperoleh! Ingat, asumsi analisis residual :

  8.00 Analisislah data di atas, hingga diperoleh model regresi terbaik, kemudian lakukan

  9.00 412.60

  9.00 366.25

  14.23

  36.15

  34.55

  7.00 400.25

  16.59

  37.44

  33.98

  6.00 423.22

  13.02

  36.85

  33.45

  18.78

  35.92

  36.10

  32.79

  5.00 400.23

  13.56

  37.12

  32.26

  8.00 423.00

  15.26

  35.84

  29.80

  9.00 362.02

  18.29

  33.72

  34.76

  15.26

  6.00 323.45

  12.45

  13.45

  39.33

  44.98

  8.00 512.33

  14.32

  38.98

  40.12

  8.00 451.29

  19.25

  36.96

  36.99

  8.00 415.25

  35.91

  9.00 435.23

  36.87

  9.00 365.21

  12.89

  34.79

  36.25

  10.00 352.16

  13.33

  37.91

  36.21

  8.00 430.22

  15.78

  38.20

  35.99

  28.94

  13.67

  

1. Berikut ini adalah data keuntungan penjualan (Y) suatu produk yang dipengaruhi oleh

jenis promosi :

Penjualan Iklan Koran Iklan TV Iklan Radio Jumlah Outlet

  39.17

  29.38

  24.86

  8.00 254.25

  12.03

  33.63

  23.45

  8.00 320.14

  19.58

  34.25

  23.25

  5.00 330.92

  18.45

  23.21

  6.00 235.26

  10.00 452.62

  15.26

  29.49

  22.98

  5.00 254.26

  13.44

  32.28

  22.41

  7.00 295.15

  13.23

  27.90

  20.98

  215.36

  13.87

  24.88

  35.42

  25.89

  26.25

  5.00 354.25

  15.87

  30.22

  26.23

  7.00 265.21

  12.23

  32.33

  26.23

  11.00 300.12

  12.05

  32.09

  8.00 265.99

  29.19

  18.97

  29.14

  25.87

  8.00 222.32

  12.88

  33.44

  25.12

  9.00 312.25

  16.35

  32.82

  25.00

  9.00 302.21

  15.69

  • Normalitas
  • Homoskedastisitas
  • No Autokorelasi
  • No Multikolinearitas (Tidak perlu dilakukan penanganan jika asumsi-asumsi untuk analisis residual tidak terpenuhi !)
unjuk kerjanya dalam suatu test lorong-lorong yang rumit. Skor kesalahan bagi 48 tikus yang dicobakan adalah sebagai berikut: Galur Lingkungan Cerdik Campuran Dungu

  28

  12

  33 83 101

  94

  22

  23

  36

  14

  33

  56 Bebas

  25

  10

  41 76 122

  83

  36

  86

  22

  58

  35

  23

  72

  32

  60 89 136 120

  48

  93 35 126 38 153

  Terbatas

  25

  31 83 110 64 128

  91

  19 99 118 87 140

  Diasumsikan data berdistribusi normal dan variansi nya sama. Apakah ada efek antara lingkungan dan galur dengan unjuk kerja tikus? (Petunjuk : Gunakan Anava 2 arah !)

3. a. Diketahui seseorang berusia 25 tahun , peluang dia tetap hidup sampai 1 tahun

lagi adalah 0.9 , dengan begitu, probabilitasnya dia akan mati sebelum satu tahun adalah 0.1 .Usia Bambang sekarang 25 tahun. Berapa peluang bambang meninggal sebelum usia 28? tunjukkan matrix stokastik / matrix transisi n- langkahnya! b. Tanpa mengganti probabilitas kematian pada poin a, terdapat tambahan asumsi dimana peluang seseorang yang sehat berusia 25 tahun menderita suatu penyakit kronis sebelum 1 thn kedepan adalah 0.2, Dan peluang seseorang dengan umur yang sama dan telah menderita penyakit tersebut untuk mati sebelum 1 tahun kedepan adalah 3 kali lipat peluang kematian seseorang yang sehat. Dan diketahui seseorang yang telah terjang kit penyakit ini tidak mungkin untuk sembuh. Berapa kemungkinannya Sinta akan bertahan sampai setidaknya 2 tahun dari sekarang? tunjukkan juga matrix stokastiknya!

  

4. a. Dengan mengunakan operasi matriks di R dan aturan Cramer selesaikan persamaan berikut: digunakan untuk semua data.

5. a. Tulislah fungsi untuk menghitung sudut terkecil yang terbentuk antara jarum

panjang dan jarum pendek saat menunjuk jam tertentu. sebagai contoh jika pengguna memasukkan jam 3.30 fungsi akan menampilkan output “75 derajat”. Input dari fungsi ini adalah dua bilangan bulat yang melambangkan jam dan menit. Output dari fungsi ini adalah sudut terkecil yang dibentuk oleh jam tersebut.

  b. Tuliskan fungsi untuk mencari semua nilai x, y dan z yang memenuhi persamaan linear berikut: dengan

  Fungsi ini harus menuliskan “segitiga” jika titik-titik tersebut dapat membentuk segitiga dan “bukan segitiga” jika titik-titik tersebut tidak dapat membentuk segitiga. Sebagai contoh jika pengguna memasukkan tiga titik masing-masing (1,1), (3,3), dan (5,5) fungsi akan menampilkan “bukan segitiga”. Bila pengguna memasukkan (1,1), (3,3) dan (5,0) fungsi akan menampilkan “segitiga”. Input dari pengguna adalah enam bilangan real yang melambangkan nilai x dan y dari tiga koordinat titik. Output dari fungsi ini adalah “segitiga” atau “bukan segitiga”.

  

6. Buat fungsi untuk menampilkan segitiga cantik sama kaki yang mengandung 2

karakter dimana karakternya tidak boleh sama dengan karakter di kanan, kiri, atas dan bawahnya(selang seling gitu lho!)dengan inputnya adalah tinggi segitiga-nya! berikut contoh outputnya untuk input 8 dan 15:

  Pemodelan Regresi (menggunakan Rcmdr): Scatter Diagram : Graph Scatterplot (scatterplot matrix) pilih sumbu x dan y

   Fit Models Linear Regression Output : Dari output tersebut diperoleh bahwa :

R-square = 0.9721 yang berarti bahwa model regresi dengan 4 variabel independet

tersebut mampu menjelaskan 97.21% variasi dalam penjualan. Adjusted R-square = 0.9677

Untuk uji overall test, kita dapat melihat nilai output pada baris terakhir, terlihat bahwa

p-value < 2.2e-16 yang dapat disimpulkan bahwa model regresi dengan 4 variabel

independen tersebut layak untuk digunakan.

Selanjutnya untuk uji partial kelayakan masing-masing variabel independen, terlihat

bahwa ada variabel independen yang tidak signifikan, yaitu Iklan Radio, maka

dilakukan regresi ulang tanpa mengikutsertakan variabel ini. Dan diperoleh : Terlihat semua variabel telah signifikan, sehingg diperoleh model regresi :

Penjualan= - 370.5591+ 2.1453 IklanKoran + 19.9495 IklanTV – 4.0195 JumlahOutlet

Analisis Residual Models

  

Numerical Diagnostic pilih analisis residual yang ingin dilakukan

 Normalitas Residual Models

   Graphs Basic Diagnostic Plots Dari Normal QQ-Plot tersebut terlihat bahwa nilai observasi (titik-titik) terletak dekat dengan garis diagonal yang menandakan residual berdistribusi normal. Atau dengan menggunakan uji Shapiro-Wilk karena data berjumlah 30 (<50) dengan terlebih dahulu menyimpan nilai residual dengan cara Models

   Add Observation Statistics to Data aktifkan Residual Setelah itu pilih Statistics

   Summaries Shapiro –Wilk test of Normality pilih residual Terlihat bahwa nilai p-value > alpha 0.05 yang berarti asumsi kenormalan data terpenuhi.  No autokorelasi

  Statistics

Summaries Durbin Watson Test For autokorelation

  Durbin-Watson test

data: Penjualan ~ Iklan.Koran + Iklan.TV + Jumlah.Outlet DW = 1.5966, p-value = 0.1804 alternative hypothesis: true autocorelation is not 0 dari output tersebut terlihat bahwa p-value = 0.1804 > alpha 0.05 yang berartoi bahwa Hipothesis nol tidak ditolak, sehingga dapat disimpulkan bahwa asusmsi no autokorelasi residual terpenuhi.  Non Multikolinearitas Untuk mengetahui apakah asumsi no Multikolinieritas terpenuhi, langsung di cek dengan mengetikkan sintax vif(nama model regresi fit yang diperoleh) multikolinearitas terpenuhi  Homoskedastisitas Terlihat bahwa asumsi homoskedastisitas tidak terpenuhi karena terlihat titik-titik residual terletak menyebar jauh dari nol. Dan cenderung membentuk pola kuadratik

Analisis Variansi 2 Arah : Statistics

   means Multi-way ANOVA Output : Anova Table (Type II tests) Response: kesalahan Sum Sq Df F value Pr(>F) galur 18154 2 9.0356 0.0005448 *** lingkungan 14876 1 14.8076 0.0003988 *** galur:lingkungan 1235 2 0.6148 0.5455629 Residuals 42193 42

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Dari output tersebut terlihat bahwa efek galur dan efek lingkungan masing-masing secara terpisah signifikan untuk tingkat signifikansi 5%, sedangkan untuk interaksi antara galur dan lingkungan tidak signifikan. Jadi, peluang budi meninggal sebelum usia 28 tahun adalah 0.271

  b. syntax

  

4. a. Dengan mengunakan operasi matriks di R dan aturan Cramer akan diselesaikan persamaan berikut: Script R dan hasil : a=matrix(c(1,-3,-1,0,4,-2,2,6,3),nrow=3) b=matrix(c(6,30,8,0,4,-2,2,6,3),nrow=3) c=matrix(c(1,-3,-1,6,30,8,2,6,3),nrow=3) d=matrix(c(1,-3,-1,0,4,-2,6,30,8),nrow=3) x=det(b)/det(a) y=det(c)/det(a) z=det(d)/det(a) { cat("x1=",x,"\n") cat("x2=",y,"\n") cat("x3=",z,"\n") } x1= -0.909091 x2= 1.636364 x3= 3.454545 untuk semua data Script : reg.ganda=function(x,y) { X=cbind(1,x) n=length(y) p=ncol(X) b=solve(t(X)%*%X)%*%(t(X)%*%y) dfr=p-1 dfe=n-p dft=n-1 ssr=round((t(b)%*%(t(X)%*%y)-(sum(y))^2/n)[1],3) sse=round((t(y)%*%y-t(b)%*%t(X)%*%y)[1],3) sst=ssr+sse msr=round(ssr/dfr,3) mse=round(sse/dfe,3) fhit=round(msr/mse,3) p_v=round(pf((fhit),dfr,dfe,lower.tail=FALSE),3) rsquare=round(ssr/sst,3) r=round(sqrt(rsquare),3) adjrsquare=round(rsquare-((p-1)*(1-rsquare)/(n-p)),3) yhead=X%*%b ehead=y-yhead min=round(min(ehead),3) max=round(max(ehead),3) q1=round(quantile(ehead)[2],3) q2=round(quantile(ehead)[3],3)

residual=cbind(min,q1,q2,q3,max) colnames(residual)=c("Min","1Q","Median","3Q","Max") rownames(residual)="" skuadrat=mse*solve(t(X)%*%X) sb=NULL for(i in 1:ncol(skuadrat))

  { for(j in 1:nrow(skuadrat)) { if(i==j)

  { sb[i]=sqrt(skuadrat[i,j]) } }

  } t_hit=round(b/sb,4) p_value=round(2*pt(abs(t_hit),dfe,lower.tail=FALSE),4) beta=NULL for(i in 1:ncol(X)) { beta[i]=i-1 }

coefficients=data.frame(Beta=beta,Estimate.Std=b,Std.Error=sb,t_val ue=t_hit,P_value=p_value)

anova=data.frame(smbr.var=c("Regresi","Sesatan","Total"),db=c(dfr,d

fe,dft),SS=c(ssr,sse,sst),MS=c(msr,mse," "),F_hit=c(fhit," "," "),P_value=c(p_v," "," ")) model=data.frame(R=r,R.Square=rsquare,Adj.R.Square=adjrsquare) s=coefficients) } { cat("\tANALISIS REGRESI GANDA\n") cat("usage:\n") cat("regganda(x,y)\n") cat("\tx=matrix(x)\n") cat("\ty=matrix(y)\n") }

  5. a. Fungsi untuk Menghitung Sudut Terkecil yang Terbentuk dari 2 Jarum Jam Script di R : Contoh : berikut: dengan Script : Output :

  c. Fungsi Untuk menentukan apakah 3 koordinat titik membentuk segitiga atau tidak Script :

  

6. fungsi untuk menampilkan segitiga cantik sama kaki yang mengandung 2 karakter

dimana karakternya tidak sama dengan karakter di kanan, kiri, atas dan bawahnya dengan input adalah tinggi segitiga Script :