Karakteristik Hadoop Multi-Node pada Client Server terhadap Data Kecil.

(1)

v

Universitas Kristen Maranatha

ABSTRAK

Seiring dengan berkembangnya teknologi yang ada, maka ukuran data yang diolah juga akan semakin besar. Hadoop adalah salah satu kerangka kerja perangkat lunak untuk server yang menangani data besar. Hadoop itu sendiri adalah sebuah proyek open source berkembang dengan Apache, yang telah berlangsung selama kurang lebih sembilan tahun, di mana dua tahun setelahnya, Hadoop digunakan oleh Google untuk pengolahan data. Metode dalam penelitian ini akan menggunakan lima server dengan Hadoop terinstal, satu master dan empat server slave. Dalam penelitian ini akan merumuskan beberapa masalah yang akan diamati. Sehingga akan dilakukan beberapa percobaan untuk melihat karakteristik Hadoop. Penelitian ini akan dilakukan tiga percobaan, mencabut master client dan melihat keadaan client server, melakukan pengukuran penerimaan data pada client server dan penambahan client server. Lalu dari percobaan yang dilakukan, data akan dikumpulkan dan dibuat grafik. Sehingga dapat ditarik kesimpulan dari percobaan tersebut.


(2)

vi

Universitas Kristen Maranatha

ABSTRACT

This point is the era where technology highly evolved quickly and rapidly. Along with the development of anything, so the size of the data process will also bigger. Hadoop is the one of the framework for server sofware theat handles data large. Hadoop itself is a project open source developing by Apache. Who has run for nine years, where two years later, Hadoop used by Google to data processing. Methods in this research will use of five server with Hadoop installed, one a master and four server slave. In this research will formulate a few problems to be observed. So that will be carried out severa experiments to see the characteristics of Hadoop. This research will be conducted three experiments. Deprive master client and assess the situation client server, take measurements of the reception client data on servers and the addition of client server. Then from experiments conducted, data will be collected and made a chart. So that conclusions may be drawn from these experiments.


(3)

vii

Universitas Kristen Maranatha

DAFTAR ISI

LEMBAR PENGESAHAN ... i

PERNYATAAN ORISINALITAS LAPORAN PENELITIAN ... ii

PERNYATAAN PUBLIKASI LAPORAN PENELITIAN ... iii

PRAKATA ... iv

ABSTRAK ... v

ABSTRACT ... vi

DAFTAR ISI ... vii

DAFTAR GAMBAR ... ix

BAB 1 PENDAHULUAN ... 1

1.1 Latar Belakang ... 1

1.2 Rumusan Masalah ... 2

1.3 Tujuan ... 2

1.4 Ruang Lingkup Penelitian ... 2

1.5 Metodelogi Penelitian ... 3

1.6 Sistematika Laporan ... 3

BAB 2 KAJIAN TEORI ... 5

2.1 Hadoop ... 5

2.2 Hadoop Single–Node ... 8

2.3 Hadoop Multi–Node ... 9

2.4 Penelitian Terkait ... 10

BAB 3 ANALISIS DAN RANCANGAN SISTEM ... 11

3.1 Pemodelan ... 11

3.2 Skenario ... 11

3.2.1 Skenario 1 ... 12

3.2.2 Skenario 2 ... 13

3.2.3 Skenario 3 ... 14 BAB 4 IMPLEMENTASI ... Error! Bookmark not defined.


(4)

viii

Universitas Kristen Maranatha

4.1 Konfigurasi Client Server Hadoop ... 16

4.1.1 Host dan hostname ... 16

4.2 Hadoop ... 19

4.3 SSH(Secure Shell) ... 21

4.4 Hue ... 21

BAB 5 PENGUJIAN ... 22

5.1 Skenario 1 ... 22

5.2 Skenario 2 ... 23

5.3 Skenario 3 ... 40

5.3.1 Untuk Client Server ... 40

BAB 6 SIMPULAN DAN SARAN ... 43

6.1 Simpulan ... 43

6.2 Saran ... 44

DAFTAR PUSTAKA ... 45 LAMPIRAN A DATA PERCOBAAN ... A-1 LAMPIRAN B INSTALASI HADOOP ... B-1


(5)

ix

Universitas Kristen Maranatha

DAFTAR GAMBAR

GAMBAR 2.1ECOSYSTEM YANG TERDAPAT PADA HADOOP [4] ... 5

GAMBAR 2.2CARA KERJA HDFS ... 6

GAMBAR 2.3SECURE SHELL (SSH)[6] ... 7

GAMBAR 2.4ARSITEKTUR HDFSSINGLE-NODE ... 8

GAMBAR 2.5ARSITEKTUR HDFSMULTI-NODE ... 9

GAMBAR 2.6DATA PENELITIAN TERKAIT ... 10

GAMBAR 3.1ANALYSIS MODELING EXAMPLE ... 11

GAMBAR 3.2SKENARIO 1 ... 12

GAMBAR 3.3SKENARIO 2 ... 13

GAMBAR 3.4SKENARIO 3 ... 15

GAMBAR 4.1HOSTNAME ... 16

GAMBAR 4.2HOSTS ... 17

GAMBAR 4.3HADOOP CONFIG FOLDER ... 17

GAMBAR 4.4 CORE-SITE.XML ... 18

GAMBAR 4.5 YARN-SITE.XML ... 19

GAMBAR 4.6 HDFS-SITE.XML ... 19

GAMBAR 4.7MASUK KE BASHRC ... 20

GAMBAR 4.8 FILE .BASHRC ... 20

GAMBAR 4.9 FILE HADOOP-ENV.SH ... 20

GAMBAR 4.10 FILE HUE.INI ... 21

GAMBAR 5.1JPS DARI MASTER SERVER ... 22

GAMBAR 5.2 MASTER SERVER TELAH DI REBOOT ... 22

GAMBAR 5.3SERVER HADOOP ONLINE KEMBALI ... 23

GAMBAR 5.4 FILE INFORMATION DARI PORT 50070 ... 24

GAMBAR 5.5DATA NODE LOGS ... 24

GAMBAR 5.6 FILE INFORMATION DAN FOLDER TEMPAT FILE DISIMPAN ... 25

GAMBAR 5.7 GRAFIK TOTAL DURASI PADA SLAVE 1 DENGAN MENGGUNAKAN REGRESI LINEAR ... 26

GAMBAR 5.8HASIL TRAFFIC CACTI PERCOBAAN 1 PADA SLAVE 1[127MB] ... 26

GAMBAR 5.9 GRAFIK TOTAL DURASI PADA SLAVE 2 DENGAN MENGGUNAKAN REGRESI LINEAR ... 27

GAMBAR 5.10HASIL TRAFFIC CACTI PERCOBAAN 1 PADA SLAVE 2[127MB] ... 27

GAMBAR 5.11 GRAFIK TOTAL DURASI PADA SLAVE 3 DENGAN MENGGUNAKAN REGRESI LINEAR .... 28

GAMBAR 5.12HASIL TRAFFIC CACTI PERCOBAAN 1 PADA SLAVE 3[127MB] ... 28

GAMBAR 5.13 GRAFIK TOTAL DURASI PADA SLAVE 4 DENGAN MENGGUNAKAN REGRESI LINEAR .... 29

GAMBAR 5.14HASIL TRAFFIC CACTI PERCOBAAN 1 PADA SLAVE 4[127MB] ... 29


(6)

x

Universitas Kristen Maranatha

LINEAR ... 30

GAMBAR 5.16 GRAFIK TOTAL DURASI PADA SLAVE 1 DENGAN MENGGUNAKAN REGRESI LINEAR .... 31

GAMBAR 5.17HASIL TRAFFIC CACTI PERCOBAAN 2 PADA SLAVE 1[235MB] ... 31

GAMBAR 5.18 GRAFIK TOTAL DURASI PADA SLAVE 2 DENGAN MENGGUNAKAN REGRESI LINEAR .... 32

GAMBAR 5.19HASIL TRAFFIC CACTI PERCOBAAN 2 PADA SLAVE 2[235MB] ... 32

GAMBAR 5.20 GRAFIK TOTAL DURASI PADA SLAVE 3 DENGAN MENGGUNAKAN REGRESI LINEAR .... 33

GAMBAR 5.21HASIL TRAFFIC CACTI PERCOBAAN 2 PADA SLAVE 3[235MB] ... 33

GAMBAR 5.22 GRAFIK TOTAL DURASI PADA SLAVE 4 DENGAN MENGGUNAKAN REGRESI LINEAR .... 34

GAMBAR 5.23HASIL TRAFFIC CACTI PERCOBAAN 2 PADA SLAVE 4[235MB] ... 34

GAMBAR 5.24RATA-RATA PER SLAVE PERCOBAAN 2[235MB] DENGAN MENGGUNAKAN REGRESI LINEAR ... 35

GAMBAR 5.25 GRAFIK TOTAL DURASI PADA SLAVE 1 DENGAN MENGGUNAKAN REGRESI LINEAR .... 35

GAMBAR 5.26HASIL TRAFFIC CACTI PERCOBAAN 3 PADA SLAVE 1[314MB] ... 36

GAMBAR 5.27 GRAFIK TOTAL DURASI PADA SLAVE 2 DENGAN MENGGUNAKAN REGRESI LINEAR .... 36

GAMBAR 5.28HASIL TRAFFIC CACTI PERCOBAAN 3 PADA SLAVE 2[314MB] ... 37

GAMBAR 5.29 GRAFIK TOTAL DURASI PADA SLAVE 3 DENGAN MENGGUNAKAN REGRESI LINEAR .... 37

GAMBAR 5.30HASIL TRAFFIC CACTI PERCOBAAN 3 PADA SLAVE 3[314MB] ... 38

GAMBAR 5.31 GRAFIK TOTAL DURASI PADA SLAVE 4 DENGAN MENGGUNAKAN REGRESI LINEAR .... 38

GAMBAR 5.32HASIL TRAFFIC CACTI PERCOBAAN 3 PADA SLAVE 4[314MB] ... 39

GAMBAR 5.33RATA-RATA PER SLAVE PERCOBAAN 3[314MB] DENGAN MENGGUNAKAN REGRESI LINEAR ... 39

GAMBAR 5.34DATA DAN HASIL RATA-RATA PEMROSESAN DATA DENGAN BLOCK SIZE 128MB. 40 GAMBAR 5.35 CLONE MESIN ... 41

GAMBAR 5.36 TYPE CLONE ... 41

GAMBAR 5.37 EDIT FILE HOST ... 41

GAMBAR 5.38EDIT HOSTNAME... 42

GAMBAR 5.39 EDIT FILE INTERFACES ... 42

GAMBAR 5.40 HAPUS DAN BUAT KEMBALI FOLDER DATANODE ... 42


(7)

1

Universitas Kristen Maranatha

BAB 1

PENDAHULUAN

1.1 Latar Belakang

Saat ini adalah era dimana teknologi sangat berkembang dengan cepat dan pesat. Seiring dengan berkembangnya teknologi yang ada, maka ukuran data yang diolah juga akan semakin besar.

Data yang memiliki ukuran yang semakin besar tentunya membutuhkan tempat penyimpanan yang sangat besar dan sistem pengelolaan yang tepat agar mudah dalam mengolahnya. Ada beberapa platform yang dapat digunakan untuk menyimpan dan mengolah data yang besar antara lain 1010data, Actian, Amazon Web Services (AWS), Cloundera, IBM SmartCloud, dan lain-lain. Untuk menganalisis data berukuran besar tersebut big data [1] menjadi kunci dasar persaingan, mendasari gelombang baru pertumbuhan produktivitas, inovasi, dan surplus konsumen. Untuk membangun sistem super computer yang berguna untuk menyimpan dan mengolah data yang berukuran besar (big data) secara baik dan cepat membutuhkan biaya yang tidak murah. Untuk mengatasi hal ini, maka platforms yang digunakan untuk menyimpan dan mengolah big data menggunakan sebuah sistem yang disebut parallel computing. [2]

Parallel computing adalah penggunaan beberapa komputer yang saling terhubung untuk mengolah data dalam ukuran yang besar. Salah satu platform yang masih sering digunakan sampai saat ini untuk mengolah data yang berukuran besar (big data) secara terdistribusi dan dapat berjalan diatas cluster adalah Hadoop. [2]

Penyimpanan HDFS (Hadoop Distributed File System) adalah metadata, merupakan struktur direktori HDFS dan file dalam bentuk tree. Hal ini juga mencakup berbagai atribut direktori dan file (kepemilikan, perizinan, kuota, dan faktor replikasi).


(8)

2

Universitas Kristen Maranatha 1.2 Rumusan Masalah

Berikut masalah–masalah yang mungkin akan terjadi dan perlu dijawab. Masalah–masalah yang ada sebagai berikut:

1. Bagaimana karakteristik penerimaan data dalam client server?

2. Apakah pengaruh ukuran file dibawah 500 MB terhadap waktu saat perpindahan data?

3. Bagaimana keterkaitan konfigurasi terhadap block data yang dikirim ke slave?

1.3 Tujuan

Tujuan yang dapat dari rumusan masalah adalah sebagai berikut: 1. Mengamati karakteristik penerimaan data dalam client server.

2. Mengamati pengaruh ukuran file dibawah 500MB terhadap waktu saat perpindahan data.

3. Mengamati dan mengukur block data yang dikirim ke slave berdasar konfigurasi pada master.

1.4 Ruang Lingkup Penelitian

Ruang lingkup dari penelitian ini terbatas pada hal-hal berikut ini:

1. Membahas karakteristik pada Hadoop dalam pengiriman data dari master server ke client server, mengamati keadaan client server apabila master server dimatikan secara tiba-tiba, mengamati apa yang terjadi bila ada penambahan client server baru.

2. Perancangan yang dibuat adalah dengan menjalankan Hadoop secara multi node (cluster).

3. Physical machine yang digunakan terdiri dari lima komputer yang terdiri dari satu komputer sebagai master server dan empat komputer sebagai client server memiliki spesifikasi CPU Intel i5-2320 3.00ghz, RAM 4 GB dengan sistem operasi Windows 7.

4. Virtual machine yang digunakan memiliki spesifikasi CPU Intel i5-2320 3.00ghz, RAM 1GB dengan sistem operasi OS Linux Ubuntu 14.03.3 server amd64 yang berjalan diatas Oracle VM Virtual Box v5.0.2 pada setiap masing-masing komputernya.


(9)

3

Universitas Kristen Maranatha

5. Percobaan dilakukan pada satu komputer bertindak sebagai master server dan empat komputer sebagai client server.

6. Ukuran file yang digunakan untuk pengiriman data dibatasi hanya menggunakan tiga ukuran file yang berbeda yaitu 127MB, 235MB, 314MB semua dengan file format mp4.

7. Block size yang digunakan dibatasi hanya menggunakan ukuran 128 MB. 8. Jumlah replikasi pada penyebaran per blocknya dibatasi hanya menggunakan

tiga replikasi.

1.5 Metodelogi Penelitian

Pada penelitian ini dilakukan berawal dengan mencari informasi mengenai Hadoop. Segala informasi mengenai Hadoop yang didapat melalui internet, buku atau e-book. Melakukan penginstalan dan konfigurasi Hadoop dengan beberapa server, menginstal traffic monitoring agar dapat dilakukan monitoring jaringan antara server atau node yang ada. Lalu dilakukan beberapa percobaan dan dibuat laporan mengenai hasil percobaan.

1.6 Sistematika Laporan

Pada proses penyusunan laporan ini, sistematika penulisan yang akan digunakan adalah sebagai berikut :

BAB I – PENDAHULUAN

Pada bab ini berisi latar belakang, rumusan masalah, tujuan, ruang lingkup penelitian, dan metodologi penelitian ini.

BAB II – DASAR TEORI

Pada bab ini berisi penjelasan dari teori–teori yang didapat dalam sumber–sumber yang didapat yang menunjang percobaan yang akan dilakukan.

BAB III – ANALISA DAN PEMODELAN

Pada bab ini berisi penjelasan permodelan rancangan dari penelitian beserta detail mengenai skenario yang akan dilakukan.


(10)

4

Universitas Kristen Maranatha BAB IV – HASIL IMPLEMENTASI

Pada bab ini berisi settingan atau konfigurasi yang dbutuhkan pada sistem Hadoop.

BAB V – PENGUJIAN

Pada bab ini berisi penjelasan hasil pengujian dan analisis dari skenario rancangan penelitian yang terdapat pada bab 3.

BAB VI – SIMPULAN DAN SARAN

Pada bab ini berisi simpulan dan saran penelitian dari sistem Hadoop serta dari keseluruhan hasil penelitian yang dapat digunakan pada penelitian selanjutnya.


(11)

43

Universitas Kristen Maranatha

BAB 6

SIMPULAN DAN SARAN

6.1Simpulan

Berikut kesimpulan yang didapat setelah implementasi dan pengujian berakhir :

1. Jika master server mati akan hal yang tidak diinginkan, maka node dari slave tetap akan berjalan dalam status stand by dan menunggu hingga master server kembali berjalan.

2. Pada saat data disebar dari master ke slave, data akan tersebar ke block2 secara acak dan dapat terlihat dimana data masuk duluan dan data selesai terkirim di HUE.

3. Kecepatan rata-rata pengiriman data pada file berukuran 127 MB sebesar 5,391 detik, ukuran file 235 MB sebesar 9,019 detik, ukuran file 314 MB sebesar 13,854 MB

4. Pada ukuran 127 MB dinaikkan 235 MB didapatkan penambahan waktu sebanyak 3,628 detik, dari ukuran 235 MB dinaikkan 314 MB didapatkan penambahan waktu sebanyak 4,835 detik, sedangkan pada ukuran 127 MB dinaikkan 314 MB didapatkan penambahan waktu sebanyak 8,463 detik. Sehingga semakin dinaikkannya ukuran file yang ditambahkan maka akan semakin bertambah waktu yang dibutuhkan untuk pengiriman dan penerimaan data.

5. Bila terdapat penambahan slave baru, master yang akan mejalankan slave baru itu tanpa mengganggu traffic pada slave yang lainnya.


(12)

44

Universitas Kristen Maranatha 6.2Saran

Berikut saran yang dapat diberikan untuk penelitian selanjutnya mengenai Hadoop :

1. Percobaan selanjutnya disarankan untuk melakukan pengiriman data dengan file format selain mp4.

2. Untuk penelitian selanjutnya agar tidak menggunakan Oracle VirtualBox, karena kurang stabilnya pengaturan pada mesin virtual. [11]


(13)

45

Universitas Kristen Maranatha

DAFTAR PUSTAKA

[1] C. Lam, Hadoop In Action, Stamford: Mainning Publications.Co, 2011. [2] P. Khusumanegara, “Analisis Performa Kecepatan MapReduce Pada Hadoop

Menggunakan TCP Packet Flow Analysis,” Universitas Indonesia, Juni 2014. [Online]. Available: http://www.academia.edu. [Diakses 29 Juni 2016]. [3] Canonical Ltd., “About Ubuntu,” [Online]. Available:

http://www.ubuntu.com.

[4] J. Ellingwood, “Understanding the SSH Encryption and Connection Process,” [Online]. Available: https://www.digitalocean.com.

[5] Nurasto, “Apa sih hadoop?,” Nurasto.com, 5 November 2011. [Online]. Available: http://www.nurasto.com/2011/11/05/apa-sih-hadoop/. [Diakses 29 Juni 2016].

[6] Canonical Ltd, “About Ubuntu,” Ubuntu, 2016. [Online]. Available: http://www.ubuntu.com.

[7] OpenBSD, 9 March 2016. [Online]. Available: http://www.openssh.com/. [8] F. G. Ramadhan, Cloud Indonesia, [Online]. Available:

http://cloudindonesia.com/tutorial-instalasi-network-monitoring-system-cacti-on-centos-6/.

[9] H.Team, “gethue,” hue, 11 September 2014. [Online]. Available: http://gethue.com/how-to-build-hue-on-ubuntu-14-04-trusty/. [Diakses 30 Juni 2016].

[10] K. Statistik, “Regresi Linear Berganda,” Konsultan Statistik, 2015. [Online]. Available: http://www.konsultanstatistik.com/2009/03/regresi-linear.html. [11] T. White, Hadoop: The Definitive Guide, Doug Cutting: O'REILLY, 2009. [12] S. M. Sulistyo Heripracoyo, “Big Data,” 28 may 2014. [Online]. Available:

http://sis.binus.ac.id/2014/04/29/big-data/.

[13] “Techterms.com,” 27 Agustus 2013. [Online]. Available: http://techterms.com/definition/big_data.


(14)

46

Universitas Kristen Maranatha

[14] “Hadoop Wiki,” September 2015. [Online]. Available: http://wiki.apache.org/hadoop/PoweredBy.

[15] D. deRoos, P. C. Zikopoulos, B. Brown, R. Coss and R. B.Melnyk, Hadoop for dummies, Hoboken, New Jersey: John Wiley & Sons, Inc., 2014.

[16] H. Team, “gethue,” hue, 11 September 2014. [Online]. Available: http://gethue.com/how-to-build-hue-on-ubuntu-14-04-trusty/. [Diakses maret 2016].

[17] Object Management Group, “Business Process Model and Notation Resource

Page,” 9 June 2014. [Online]. Available:

http://www.omg.org/bpmn/index.htm. [Diakses 12 Jan 2016].

[18] The Cacti Group, Inc, “About Cacti,” [Online]. Available: http://www.cacti.net/.

[19] K. Tannir, Optimizing Hadoop for MapReduce, Packt Publishing Ltd, 2014. [20] K. P, Analisis Performa Kecepatan Mapreduce Pada Hadoop Menggunakan

TCP Packet Flow Analysis, Depok: Universitas Indonesia, 2014.

[21] G. Linux, “Apache Hadoop,” Gudang Linux, 29 September 2013. [Online]. Available: http://gudanglinux.com/glossary/apache-hadoop/. [Diakses 29 Juni 2016].

[22] S. Kapahi, “what is hadoop,” edureka.co, 18 march 2013. [Online]. Available: http://www.edureka.co/blog/what-is-hadoop/.


(1)

3

Universitas Kristen Maranatha 5. Percobaan dilakukan pada satu komputer bertindak sebagai master server dan

empat komputer sebagai client server.

6. Ukuran file yang digunakan untuk pengiriman data dibatasi hanya menggunakan tiga ukuran file yang berbeda yaitu 127MB, 235MB, 314MB semua dengan file format mp4.

7. Block size yang digunakan dibatasi hanya menggunakan ukuran 128 MB.

8. Jumlah replikasi pada penyebaran per blocknya dibatasi hanya menggunakan tiga replikasi.

1.5 Metodelogi Penelitian

Pada penelitian ini dilakukan berawal dengan mencari informasi mengenai Hadoop. Segala informasi mengenai Hadoop yang didapat melalui internet, buku atau e-book. Melakukan penginstalan dan konfigurasi Hadoop dengan beberapa server, menginstal traffic monitoring agar dapat dilakukan monitoring jaringan antara server atau node yang ada. Lalu dilakukan beberapa percobaan dan dibuat laporan mengenai hasil percobaan.

1.6 Sistematika Laporan

Pada proses penyusunan laporan ini, sistematika penulisan yang akan digunakan adalah sebagai berikut :

BAB I – PENDAHULUAN

Pada bab ini berisi latar belakang, rumusan masalah, tujuan, ruang lingkup penelitian, dan metodologi penelitian ini.

BAB II – DASAR TEORI

Pada bab ini berisi penjelasan dari teori–teori yang didapat dalam sumber–sumber yang didapat yang menunjang percobaan yang akan dilakukan.

BAB III – ANALISA DAN PEMODELAN

Pada bab ini berisi penjelasan permodelan rancangan dari penelitian beserta detail mengenai skenario yang akan dilakukan.


(2)

BAB IV – HASIL IMPLEMENTASI

Pada bab ini berisi settingan atau konfigurasi yang dbutuhkan pada sistem Hadoop.

BAB V – PENGUJIAN

Pada bab ini berisi penjelasan hasil pengujian dan analisis dari skenario rancangan penelitian yang terdapat pada bab 3.

BAB VI – SIMPULAN DAN SARAN

Pada bab ini berisi simpulan dan saran penelitian dari sistem Hadoop serta dari keseluruhan hasil penelitian yang dapat digunakan pada penelitian selanjutnya.


(3)

43

Universitas Kristen Maranatha

BAB 6

SIMPULAN DAN SARAN

6.1Simpulan

Berikut kesimpulan yang didapat setelah implementasi dan pengujian berakhir :

1. Jika master server mati akan hal yang tidak diinginkan, maka node dari slave tetap akan berjalan dalam status stand by dan menunggu hingga master server kembali berjalan.

2. Pada saat data disebar dari master ke slave, data akan tersebar ke block2 secara acak dan dapat terlihat dimana data masuk duluan dan data selesai terkirim di HUE.

3. Kecepatan rata-rata pengiriman data pada file berukuran 127 MB sebesar 5,391 detik, ukuran file 235 MB sebesar 9,019 detik, ukuran file 314 MB sebesar 13,854 MB

4. Pada ukuran 127 MB dinaikkan 235 MB didapatkan penambahan waktu sebanyak 3,628 detik, dari ukuran 235 MB dinaikkan 314 MB didapatkan penambahan waktu sebanyak 4,835 detik, sedangkan pada ukuran 127 MB dinaikkan 314 MB didapatkan penambahan waktu sebanyak 8,463 detik. Sehingga semakin dinaikkannya ukuran file yang ditambahkan maka akan semakin bertambah waktu yang dibutuhkan untuk pengiriman dan penerimaan data.

5. Bila terdapat penambahan slave baru, master yang akan mejalankan slave baru itu tanpa mengganggu traffic pada slave yang lainnya.


(4)

6.2Saran

Berikut saran yang dapat diberikan untuk penelitian selanjutnya mengenai Hadoop :

1. Percobaan selanjutnya disarankan untuk melakukan pengiriman data dengan file format selain mp4.

2. Untuk penelitian selanjutnya agar tidak menggunakan Oracle VirtualBox, karena kurang stabilnya pengaturan pada mesin virtual. [11]


(5)

45

Universitas Kristen Maranatha

DAFTAR PUSTAKA

[1] C. Lam, Hadoop In Action, Stamford: Mainning Publications.Co, 2011. [2] P. Khusumanegara, “Analisis Performa Kecepatan MapReduce Pada Hadoop

Menggunakan TCP Packet Flow Analysis,” Universitas Indonesia, Juni 2014. [Online]. Available: http://www.academia.edu. [Diakses 29 Juni 2016]. [3] Canonical Ltd., “About Ubuntu,” [Online]. Available:

http://www.ubuntu.com.

[4] J. Ellingwood, “Understanding the SSH Encryption and Connection Process,” [Online]. Available: https://www.digitalocean.com.

[5] Nurasto, “Apa sih hadoop?,” Nurasto.com, 5 November 2011. [Online]. Available: http://www.nurasto.com/2011/11/05/apa-sih-hadoop/. [Diakses 29 Juni 2016].

[6] Canonical Ltd, “About Ubuntu,” Ubuntu, 2016. [Online]. Available: http://www.ubuntu.com.

[7] OpenBSD, 9 March 2016. [Online]. Available: http://www.openssh.com/. [8] F. G. Ramadhan, Cloud Indonesia, [Online]. Available:

http://cloudindonesia.com/tutorial-instalasi-network-monitoring-system-cacti-on-centos-6/.

[9] H.Team, “gethue,” hue, 11 September 2014. [Online]. Available: http://gethue.com/how-to-build-hue-on-ubuntu-14-04-trusty/. [Diakses 30 Juni 2016].

[10] K. Statistik, “Regresi Linear Berganda,” Konsultan Statistik, 2015. [Online]. Available: http://www.konsultanstatistik.com/2009/03/regresi-linear.html. [11] T. White, Hadoop: The Definitive Guide, Doug Cutting: O'REILLY, 2009. [12] S. M. Sulistyo Heripracoyo, “Big Data,” 28 may 2014. [Online]. Available:

http://sis.binus.ac.id/2014/04/29/big-data/.

[13] “Techterms.com,” 27 Agustus 2013. [Online]. Available: http://techterms.com/definition/big_data.


(6)

[14] “Hadoop Wiki,” September 2015. [Online]. Available: http://wiki.apache.org/hadoop/PoweredBy.

[15] D. deRoos, P. C. Zikopoulos, B. Brown, R. Coss and R. B.Melnyk, Hadoop for dummies, Hoboken, New Jersey: John Wiley & Sons, Inc., 2014.

[16] H. Team, “gethue,” hue, 11 September 2014. [Online]. Available: http://gethue.com/how-to-build-hue-on-ubuntu-14-04-trusty/. [Diakses maret 2016].

[17] Object Management Group, “Business Process Model and Notation Resource

Page,” 9 June 2014. [Online]. Available:

http://www.omg.org/bpmn/index.htm. [Diakses 12 Jan 2016].

[18] The Cacti Group, Inc, “About Cacti,” [Online]. Available: http://www.cacti.net/.

[19] K. Tannir, Optimizing Hadoop for MapReduce, Packt Publishing Ltd, 2014. [20] K. P, Analisis Performa Kecepatan Mapreduce Pada Hadoop Menggunakan

TCP Packet Flow Analysis, Depok: Universitas Indonesia, 2014.

[21] G. Linux, “Apache Hadoop,” Gudang Linux, 29 September 2013. [Online]. Available: http://gudanglinux.com/glossary/apache-hadoop/. [Diakses 29 Juni 2016].

[22] S. Kapahi, “what is hadoop,” edureka.co, 18 march 2013. [Online]. Available: http://www.edureka.co/blog/what-is-hadoop/.