Importing Data pada Command Line
3.2. Importing Data pada Command Line
Secara umum, proses importing data pada R dapat dilakukan dengan dua cara, yaitu menggunakan perintah‐perintah di command line dan menggunakan fasilitas GUI R ‐Cmdr (lihat bagian 2.1 sebelumnya). Pada bagian ini akan dijelaskan penggunaan perintah pada command line untuk importing data.
3.2.1. Membaca File ASCII
Suatu file ASCII biasanya terdiri dari bilangan‐bilangan yang dipisahkan meng‐ gunakan spasi, tab, tanda akhir baris atau tanda baris baru, serta pembatas yang lain. Misalkan data file ASCII yang dibuat di NOTEPAD dengan nama latihan5.txt berisi data seperti berikut ini.
Anggap bahwa file ASCII dengan nama latihan5.txt ini sudah tersimpan pada direktori
kerja R. Proses impor data dapat dilakukan dengan perintah scan dan latihan5.txt
sebagai argumennya. Apabila data tidak berada pada direktori kerja R, maka tulis juga direktori tersebut pada argumennya. Berikut ini adalah contoh proses impor data file ASCII.
> scan("latihan5.txt")
Read 36 items [1] 50 28 75 35 49 64 88 94 54 34 28 56 87 42 33 67 31 98 58 47 37 66 64 25 66 [26] 35 87 58 93 86 69 29 96 86 57 80
> data5.scan=scan("latihan5.txt")
Read 36 items
> data5.scan
> matrix5.scan=matrix(scan("latihan5.txt"),6)
Read 36 items
> matrix5.scan
> data6.scan=scan("c:\\Kerja_R\\latihan5.txt")
Read 36 items
> data6.scan
3.2.2. Importing Data File Excel
Data file Excel dengan ekstensi .XLS dapat diimpor secara langsung meng‐ gunakan fasilitas GUI R‐Cmdr (lihat bagian sebelumnya). Untuk dapat diimpor ke dalam R dengan fasilitas command line, maka data file Excel harus terlebih dulu diubah menjadi format Text Tab Delimited (ekstensi .TXT) atau CSV comma delimited (ekstensi .CSV). Setelah itu, data ini dapat diimpor menggunakan perintah read.table atau read.csv.
Misalkan saja data file Excel yang akan diimpor adalah seperti pada gambar berikut ini dan telah disimpan menjadi file data1.txt atau data1.csv.
Gambar
3.1. Jendela data1.txt pada Excel yang akan diimpor ke R
Proses impor data1.txt dapat dilakukan dengan perintah read.table, sedangkan, impor data1.csv dilakukan dengan perintah read.csv. Argumen optional header=T digunakan dengan tujuan agar R menggunakan baris pertama dari file sebagai header atau nama dari variabel. Seperti pada bagian sebelumnya, apabila data tidak berada pada direktori kerja R, maka tulis juga direktori tersebut pada argumennya. Berikut ini adalah contoh proses impor data file dengan ekstensi .TXT dan .CSV.
> latihan2 <‐ read.table("data1.txt", header=TRUE) # atau > latihan2 <‐ read.table("c:\\Kerja_R\\data1.txt", header=TRUE) # atau > latihan2 <‐ read.table("c:/Kerja_R/data1.txt", header=TRUE)
> latihan2
Responden Matematika BIndonesia BInggris IPK1
1 Adi 8.0 9.1 8.4 3.35 2 Budi 7.6 8.8 8.5 3.02 3 Dany 6.9 8.1 7.2 2.90
4 Eka 8.9 9.2 9.0 3.42 5 Fery 9.5 9.6 9.5 3.75 6 Nuri 7.3 8.7 7.9 3.26 7 Rury 6.5 7.5 8.2 2.76
> latihan3 <‐ read.csv("data1.csv", header=TRUE)
> latihan3
Responden.Matematika.BIndonesia.BInggris.IPK1 1 Adi;8;9.1;8.4;3.35 2 Budi;7.6;8.8;8.5;3.02 3 Dany;6.9;8.1;7.2;2.9 4 Eka;8.9;9.2;9;3.42 5 Fery;9.5;9.6;9.5;3.75 6 Nuri;7.3;8.7;7.9;3.26 7 Rury;6.5;7.5;8.2;2.76
3.2.3. Importing Data dari Paket Statistik
R mempunyai paket atau library foreign untuk melakukan importing data dari file dalam format paket statistika yang lain. Sampai saat ini yang tersedia pada R adalah importing data file dari paket‐paket statistika berikut :
MINITAB : gunakan perintah read.mtp untuk membaca file ‘Minitab
Portable Worksheet’ atau data dengan ekstensi .MTP. File ini dapat dibuat di MINITAB dengan perintah SAVE AS dan pilihan .MTP
SPSS : gunakan perintah read.spss untuk membaca file ‘.SAV’. SAS
: gunakan perintah read.ssd atau read.xport.
S+ : gunakan perintah read.S STATA
: gunakan perintah read.dta Systat
: gunakan perinah read.systat Epi info
: gunakan perintah read.epiinfo untuk membaca file ‘.REC’.
Pada bagian ini akan diberikan contoh hanya untuk mengimpor data file SPSS dan MINITAB yang seringkali digunakan dalam analisis data statistik. Misalkan data file SPSS yang sudah dimiliki diberi nama WORLD95.SAV dan telah disimpan di direktori kerja R. Proses impor data ini ke dalam R dengan menggunakan perintah command line adalah sebagai berikut.
> latihan4 <‐ read.spss("World95.sav", use.value.labels=TRUE, max.value.labels=Inf, to.data.frame=TRUE)
> latihan4[,1:5] # hanya menampilkan 5 kolom pertama saja
COUNTRY POPULATN DENSITY URBAN RELIGION 1 Afghanistan 20500 25.0 18 Muslim 2 Argentina 33900 12.0 86 Catholic 3 Armenia 3700 126.0 68 Orthodox 4 Australia 17800 2.3 85 Protstnt 5 Austria 8000 94.0 58 Catholic 6 Azerbaijan 7400 86.0 54 Muslim
Perintah use.value.labels=TRUE digunakan untuk mendapatkan variabel yang bertipe FACTOR dengan “value label” seperti yang ada pada data file di SPSS.
Berikut ini adalah proses impor data file MINITAB dalam ekstensi .MTP ke dalam R dengan menggunakan perintah command line. Misalkan data file MINITAB yang sudah dimiliki adalah FA.MTW dan telah disimpan ke dalam ekstensi .MTP menjadi FA.MTP.
> latihan5 <‐ read.mtp("C:/Kerja_R/Fa.MTP")
> latihan5 $X [1] 10 8 13 9 11 14 6 4 12 7 5
$Y1 [1] 8.04 6.95 7.58 8.81 8.33 9.96 7.24 4.26 10.84 4.82 5.68
$Y2 [1] 9.14 8.14 8.74 8.77 9.26 8.10 6.13 3.10 9.13 7.26 4.74
$Y3 [1] 7.46 6.77 12.74 7.11 7.81 8.84 6.08 5.39 8.15 6.42 5.73
$X4 [1] 8 8 8 8 8 8 8 19 8 8 8
$Y4 [1] 6.58 5.76 7.71 8.84 8.47 7.04 5.25 12.50 5.56 7.91 6.89