Importing Data pada Command Line

3.2. Importing Data pada Command Line

Secara umum, proses importing data pada R dapat dilakukan dengan dua cara, yaitu menggunakan perintah‐perintah di command line dan menggunakan fasilitas GUI R ‐Cmdr (lihat bagian 2.1 sebelumnya). Pada bagian ini akan dijelaskan penggunaan perintah pada command line untuk importing data.

3.2.1. Membaca File ASCII

Suatu file ASCII biasanya terdiri dari bilangan‐bilangan yang dipisahkan meng‐ gunakan spasi, tab, tanda akhir baris atau tanda baris baru, serta pembatas yang lain. Misalkan data file ASCII yang dibuat di NOTEPAD dengan nama latihan5.txt berisi data seperti berikut ini.

Anggap bahwa file ASCII dengan nama latihan5.txt ini sudah tersimpan pada direktori

kerja R. Proses impor data dapat dilakukan dengan perintah scan dan latihan5.txt

sebagai argumennya. Apabila data tidak berada pada direktori kerja R, maka tulis juga direktori tersebut pada argumennya. Berikut ini adalah contoh proses impor data file ASCII.

> scan("latihan5.txt")

Read 36 items [1] 50 28 75 35 49 64 88 94 54 34 28 56 87 42 33 67 31 98 58 47 37 66 64 25 66 [26] 35 87 58 93 86 69 29 96 86 57 80

> data5.scan=scan("latihan5.txt")

Read 36 items

> data5.scan

> matrix5.scan=matrix(scan("latihan5.txt"),6)

Read 36 items

> matrix5.scan

> data6.scan=scan("c:\\Kerja_R\\latihan5.txt")

Read 36 items

> data6.scan

3.2.2. Importing Data File Excel

Data file Excel dengan ekstensi .XLS dapat diimpor secara langsung meng‐ gunakan fasilitas GUI R‐Cmdr (lihat bagian sebelumnya). Untuk dapat diimpor ke dalam R dengan fasilitas command line, maka data file Excel harus terlebih dulu diubah menjadi format Text Tab Delimited (ekstensi .TXT) atau CSV comma delimited (ekstensi .CSV). Setelah itu, data ini dapat diimpor menggunakan perintah read.table atau read.csv.

Misalkan saja data file Excel yang akan diimpor adalah seperti pada gambar berikut ini dan telah disimpan menjadi file data1.txt atau data1.csv.

Gambar

3.1. Jendela data1.txt pada Excel yang akan diimpor ke R

Proses impor data1.txt dapat dilakukan dengan perintah read.table, sedangkan, impor data1.csv dilakukan dengan perintah read.csv. Argumen optional header=T digunakan dengan tujuan agar R menggunakan baris pertama dari file sebagai header atau nama dari variabel. Seperti pada bagian sebelumnya, apabila data tidak berada pada direktori kerja R, maka tulis juga direktori tersebut pada argumennya. Berikut ini adalah contoh proses impor data file dengan ekstensi .TXT dan .CSV.

> latihan2 <‐ read.table("data1.txt", header=TRUE) # atau > latihan2 <‐ read.table("c:\\Kerja_R\\data1.txt", header=TRUE) # atau > latihan2 <‐ read.table("c:/Kerja_R/data1.txt", header=TRUE)

> latihan2

Responden Matematika BIndonesia BInggris IPK1

1 Adi 8.0 9.1 8.4 3.35 2 Budi 7.6 8.8 8.5 3.02 3 Dany 6.9 8.1 7.2 2.90

4 Eka 8.9 9.2 9.0 3.42 5 Fery 9.5 9.6 9.5 3.75 6 Nuri 7.3 8.7 7.9 3.26 7 Rury 6.5 7.5 8.2 2.76

> latihan3 <‐ read.csv("data1.csv", header=TRUE)

> latihan3

Responden.Matematika.BIndonesia.BInggris.IPK1 1 Adi;8;9.1;8.4;3.35 2 Budi;7.6;8.8;8.5;3.02 3 Dany;6.9;8.1;7.2;2.9 4 Eka;8.9;9.2;9;3.42 5 Fery;9.5;9.6;9.5;3.75 6 Nuri;7.3;8.7;7.9;3.26 7 Rury;6.5;7.5;8.2;2.76

3.2.3. Importing Data dari Paket Statistik

R mempunyai paket atau library foreign untuk melakukan importing data dari file dalam format paket statistika yang lain. Sampai saat ini yang tersedia pada R adalah importing data file dari paket‐paket statistika berikut :

ƒ MINITAB : gunakan perintah read.mtp untuk membaca file ‘Minitab

Portable Worksheet’ atau data dengan ekstensi .MTP. File ini dapat dibuat di MINITAB dengan perintah SAVE AS dan pilihan .MTP

ƒ SPSS : gunakan perintah read.spss untuk membaca file ‘.SAV’. ƒ SAS

: gunakan perintah read.ssd atau read.xport.

ƒ S+ : gunakan perintah read.S ƒ STATA

: gunakan perintah read.dta ƒ Systat

: gunakan perinah read.systat ƒ Epi info

: gunakan perintah read.epiinfo untuk membaca file ‘.REC’.

Pada bagian ini akan diberikan contoh hanya untuk mengimpor data file SPSS dan MINITAB yang seringkali digunakan dalam analisis data statistik. Misalkan data file SPSS yang sudah dimiliki diberi nama WORLD95.SAV dan telah disimpan di direktori kerja R. Proses impor data ini ke dalam R dengan menggunakan perintah command line adalah sebagai berikut.

> latihan4 <‐ read.spss("World95.sav", use.value.labels=TRUE, max.value.labels=Inf, to.data.frame=TRUE)

> latihan4[,1:5] # hanya menampilkan 5 kolom pertama saja

COUNTRY POPULATN DENSITY URBAN RELIGION 1 Afghanistan 20500 25.0 18 Muslim 2 Argentina 33900 12.0 86 Catholic 3 Armenia 3700 126.0 68 Orthodox 4 Australia 17800 2.3 85 Protstnt 5 Austria 8000 94.0 58 Catholic 6 Azerbaijan 7400 86.0 54 Muslim

Perintah use.value.labels=TRUE digunakan untuk mendapatkan variabel yang bertipe FACTOR dengan “value label” seperti yang ada pada data file di SPSS.

Berikut ini adalah proses impor data file MINITAB dalam ekstensi .MTP ke dalam R dengan menggunakan perintah command line. Misalkan data file MINITAB yang sudah dimiliki adalah FA.MTW dan telah disimpan ke dalam ekstensi .MTP menjadi FA.MTP.

> latihan5 <‐ read.mtp("C:/Kerja_R/Fa.MTP")

> latihan5 $X [1] 10 8 13 9 11 14 6 4 12 7 5

$Y1 [1] 8.04 6.95 7.58 8.81 8.33 9.96 7.24 4.26 10.84 4.82 5.68

$Y2 [1] 9.14 8.14 8.74 8.77 9.26 8.10 6.13 3.10 9.13 7.26 4.74

$Y3 [1] 7.46 6.77 12.74 7.11 7.81 8.84 6.08 5.39 8.15 6.42 5.73

$X4 [1] 8 8 8 8 8 8 8 19 8 8 8

$Y4 [1] 6.58 5.76 7.71 8.84 8.47 7.04 5.25 12.50 5.56 7.91 6.89