Seminar Nasional Cyber Security dan Big Data Politeknik Negeri Lhokseumawe | Badan Pengawas Tenaga Nuklir
Statistical Thinking
di Era Big Data
Dr. Hizir Sofyan
Program Studi Statistika FMIPA
Universitas Syiah Kuala
Lhok Seumawe, 2 November 2017
•
•
•
•
Statistika dan Statistical Thinking
Big Data
Aplikasi Big Data
Kesimpulan
Posisi Sangat Strategis
ACEH
Global Trends:
Demographic Changing, Technology and
Innovation
Sophistication
Decision Making
Capability
202
0
Now
Speed
Kemampuan
Pengambilan
Keputusan
Harus Terus Diasah:
Higher Order Thinking,
Creative,
Intuitive Sharpness dan
Decision Support
System
PwC's Global Data and Analytics Survey: Big Decisions
TM. Base: 2,106 senior executives (July, 2016)
Sejarah Statistika
Statistika sudah
berkembang sejak awal
abad masehi
Akan tetapi
Statistika masih tergolong
ilmu muda, karena konsep
fundamental statistika baru
berkembang di abad 20
Statistical Thinking
Suatu kemampuan untuk mengerti proses statistika
secara keseluruhan diantaranya proses pengambilan
data, menentukan variabel, dan kemampuan menjawab
permasalahan yang ada.
Mengapa harus menggunakan Statistical
Thinking?
Semakin banyaknya
permintaan akan data,
menuntut statistical
thinking yang cepat dan
efisien dengan
komputerisasi
Karena Statistika adalah
“Titik Awal”
Statistical
Thinking
Data Statistik
Informasi
Knowledge
Inovasi
Statistika
Metodologi Baru
Komputasi Statistik
Penggunaan Komputasi Statistik dalam memecahkan
masalah dengan cepat dan tepat memainkan peranan
penting. Komputasi statistik meliputi: analisis numerik, ilmu
komputer dan statistika.
Selama dekade terakhir, yang paling
signifikan digunakan dalam
komputasi statistik adalah perangkat
lunak statistika
Open Source
Big Data?
Big Data adalah data yang melebihi proses
kapasitas dari konversi sistem database yang
ada. Data terlalu besar dan terlalu cepat atau
tidak sesuai dengan struktur arsitektur
database yang ada. Untuk mendapatkan nilai
dari data, maka harus memilih jalan alternatif
untuk memprosesnya
Dumbill, 2012
Internet Consumption
Big Data
Pada sekitar tahun 2000-an
istilah Big Data dikenalkan
pertama kali oleh analis
industri bernama Doug
Laney, yaitu 3V
Analisis Big Data
membantu organisasi
memanfaatkan data dan
menggunakannya untuk
mengidentifikasi peluangpeluang baru
Big Data
Big Data
Big Data
Big Data
Timing Big Data
SMALL
DATA
BIG
TO
DATA
Statistical Software
R adalah language dan environment untuk komputasi dan
grafik statistik
Sistem "S" yang dikembangkan oleh Bell Laboratories
R telah menjadi alat yang paling populer untuk pemrograman
dalam statistik selama tahun-tahun terakhir.
Menggunakan common language (bahasa inggris)
Ukuran file yang disimpan jauh lebih kecil dibanding
software lainnya
Open-Source Tools Untuk Solusi Big Data
Hadoop
Pengertian
Framework open source berbasis Java di bawah lisensi Apache untuk mensupport
aplikasi yang jalan pada Big Data. Hadoop berjalan pada lingkungan yang
menyediakan storage dan komputasi secara terdistribusi ke kluser-kluster dari komputer
Sejarah
Terinspirasi dari makalah tentang Google MapReduce dan Google File System (GFS) yang
ditulis oleh Jeffrey Dean dan Sanjay Ghemawat pada tahun 2003
Hadoop
Analisis Big Data
Analisis Big Data lebih banyak memakai
Machine Learning seperti Binary Tree,
Neural Network, K-Means, Clustering,
Classification, yaitu pengembangan dari
bidang Data Mining
Big Data dan Statistical Analysis?
Pemanfaatan dan Penggunaan Big Data dapat dikatakan Analisis
Statistika yang lebih modern. Oleh karena itu, era Big Data
merupakan peluang sekaligus tantangan.
Aplikasi Big Data dalam Jejaring Sosial
Google menjadi pelopor Big Data.
Google memperkenalkan Google Bigtable yang menjadi
sistem database berskala besar dan cepat untuk mengolah
berbagai jenis data dari bermacam layanan berbasis
internet
Setelah Google, jejaring sosial milik Mar Zuckerberg, menerapkan
sistem database sejenis untuk menangani melonjaknya pengguna
layanan. Dengan teknologi Big Data, Facebook tak pernah kesulitan
untuk menangani peredaran data yang melonjak drastis dalam enam
tahun terakhir yang berasal dari 1 miliar pengguna jejaring sosial
mereka.
Aplikasi Big Data dalam Perusahaan
Transportasi
Sensor yang dipasang di jalan raya dengan data yang
dikumpulkan dari GPS yang telah terpasang pada mobil dapat
mengetahui kondisi kepadatan lalu lintas.
Dengan menggabungkannya dengan sistem traffic light,
dipastikan
akan dapat mempercepat
suatu
Dengan menggabungkannya
denganwaktu
sistemtempuh
traffic light,
perjalanan
sehingga
mampu
mengurangiwaktu
pengeluaran
CO2.
dipastikan
akan dapat
mempercepat
tempuhgas
suatu
perjalanan sehingga mampu mengurangi pengeluaran gas CO2.
Aplikasi Big Data dalam Industri Primer
Pemasangan sensor cuaca pada ladang
pertanian dapat menggabungkan data cuaca
dengan data penghasilan maupun kualitas
produk. Sehingga dapat dicari cara yang
lebih efektif untuk meningkatkan kualitas
produk dan keuntungan yang lebih
Aplikasi Big Data dalam Industri
Penerbangan
Penting bagi
perusahaan
penerbangan untuk
melihat pola interaksi
calon penumpangnya
Aplikasi Big Data pada
BIG DATA
GOJEK melihat perilaku
pengguna
Olah data dan analisis
pengguna dan mitra
pengemudi
Menggunakan North Star
Metric, ukuran matriks
tunggal berupa tujuan utama
dalam bisnis
Tombol yang biasa ditekan
pengguna
Alur pemesanan
Merchant favorit di Go-Food
Aplikasi Big Data pada
BIG DATA
Menghasilk
an
Tao Cafe
Cafe tanpa kasir
Konsumen tidak perlu
mengantri untuk membayar
Cara Kerja
Konsumen
Konsumen memindai
memindai kode
kode QR
QR pada
pada aplikasi
aplikasi Taobao
Taobao di
di pintu
pintu masuk
masuk toko
toko
Konsumen
Konsumen akan
akan dimonitor
dimonitor lewat
lewat sejumlah
sejumlah kamera
kamera di
di gerai
gerai
Konsumen
Konsumen berbelanja
berbelanja
Konsumen
Konsumen keluar
keluar pintu
pintu check-out,
check-out, secara
secara otomatis
otomatis ponsel
ponsel melakukan
melakukan
pembayaran
pembayaran
Kesimpulan
• Data yang tersedia semakin besar dan
kompleks (BigData) maka untuk
menganalisisnya diperlukan kemampuan
Statistical Thinking.
• Gabungan Software R dengan Hadoop
dapat menjadi salah satu solusi.
• Aplikasi BigData sudah merambah hampir
kesemua bidang kehidupan
di Era Big Data
Dr. Hizir Sofyan
Program Studi Statistika FMIPA
Universitas Syiah Kuala
Lhok Seumawe, 2 November 2017
•
•
•
•
Statistika dan Statistical Thinking
Big Data
Aplikasi Big Data
Kesimpulan
Posisi Sangat Strategis
ACEH
Global Trends:
Demographic Changing, Technology and
Innovation
Sophistication
Decision Making
Capability
202
0
Now
Speed
Kemampuan
Pengambilan
Keputusan
Harus Terus Diasah:
Higher Order Thinking,
Creative,
Intuitive Sharpness dan
Decision Support
System
PwC's Global Data and Analytics Survey: Big Decisions
TM. Base: 2,106 senior executives (July, 2016)
Sejarah Statistika
Statistika sudah
berkembang sejak awal
abad masehi
Akan tetapi
Statistika masih tergolong
ilmu muda, karena konsep
fundamental statistika baru
berkembang di abad 20
Statistical Thinking
Suatu kemampuan untuk mengerti proses statistika
secara keseluruhan diantaranya proses pengambilan
data, menentukan variabel, dan kemampuan menjawab
permasalahan yang ada.
Mengapa harus menggunakan Statistical
Thinking?
Semakin banyaknya
permintaan akan data,
menuntut statistical
thinking yang cepat dan
efisien dengan
komputerisasi
Karena Statistika adalah
“Titik Awal”
Statistical
Thinking
Data Statistik
Informasi
Knowledge
Inovasi
Statistika
Metodologi Baru
Komputasi Statistik
Penggunaan Komputasi Statistik dalam memecahkan
masalah dengan cepat dan tepat memainkan peranan
penting. Komputasi statistik meliputi: analisis numerik, ilmu
komputer dan statistika.
Selama dekade terakhir, yang paling
signifikan digunakan dalam
komputasi statistik adalah perangkat
lunak statistika
Open Source
Big Data?
Big Data adalah data yang melebihi proses
kapasitas dari konversi sistem database yang
ada. Data terlalu besar dan terlalu cepat atau
tidak sesuai dengan struktur arsitektur
database yang ada. Untuk mendapatkan nilai
dari data, maka harus memilih jalan alternatif
untuk memprosesnya
Dumbill, 2012
Internet Consumption
Big Data
Pada sekitar tahun 2000-an
istilah Big Data dikenalkan
pertama kali oleh analis
industri bernama Doug
Laney, yaitu 3V
Analisis Big Data
membantu organisasi
memanfaatkan data dan
menggunakannya untuk
mengidentifikasi peluangpeluang baru
Big Data
Big Data
Big Data
Big Data
Timing Big Data
SMALL
DATA
BIG
TO
DATA
Statistical Software
R adalah language dan environment untuk komputasi dan
grafik statistik
Sistem "S" yang dikembangkan oleh Bell Laboratories
R telah menjadi alat yang paling populer untuk pemrograman
dalam statistik selama tahun-tahun terakhir.
Menggunakan common language (bahasa inggris)
Ukuran file yang disimpan jauh lebih kecil dibanding
software lainnya
Open-Source Tools Untuk Solusi Big Data
Hadoop
Pengertian
Framework open source berbasis Java di bawah lisensi Apache untuk mensupport
aplikasi yang jalan pada Big Data. Hadoop berjalan pada lingkungan yang
menyediakan storage dan komputasi secara terdistribusi ke kluser-kluster dari komputer
Sejarah
Terinspirasi dari makalah tentang Google MapReduce dan Google File System (GFS) yang
ditulis oleh Jeffrey Dean dan Sanjay Ghemawat pada tahun 2003
Hadoop
Analisis Big Data
Analisis Big Data lebih banyak memakai
Machine Learning seperti Binary Tree,
Neural Network, K-Means, Clustering,
Classification, yaitu pengembangan dari
bidang Data Mining
Big Data dan Statistical Analysis?
Pemanfaatan dan Penggunaan Big Data dapat dikatakan Analisis
Statistika yang lebih modern. Oleh karena itu, era Big Data
merupakan peluang sekaligus tantangan.
Aplikasi Big Data dalam Jejaring Sosial
Google menjadi pelopor Big Data.
Google memperkenalkan Google Bigtable yang menjadi
sistem database berskala besar dan cepat untuk mengolah
berbagai jenis data dari bermacam layanan berbasis
internet
Setelah Google, jejaring sosial milik Mar Zuckerberg, menerapkan
sistem database sejenis untuk menangani melonjaknya pengguna
layanan. Dengan teknologi Big Data, Facebook tak pernah kesulitan
untuk menangani peredaran data yang melonjak drastis dalam enam
tahun terakhir yang berasal dari 1 miliar pengguna jejaring sosial
mereka.
Aplikasi Big Data dalam Perusahaan
Transportasi
Sensor yang dipasang di jalan raya dengan data yang
dikumpulkan dari GPS yang telah terpasang pada mobil dapat
mengetahui kondisi kepadatan lalu lintas.
Dengan menggabungkannya dengan sistem traffic light,
dipastikan
akan dapat mempercepat
suatu
Dengan menggabungkannya
denganwaktu
sistemtempuh
traffic light,
perjalanan
sehingga
mampu
mengurangiwaktu
pengeluaran
CO2.
dipastikan
akan dapat
mempercepat
tempuhgas
suatu
perjalanan sehingga mampu mengurangi pengeluaran gas CO2.
Aplikasi Big Data dalam Industri Primer
Pemasangan sensor cuaca pada ladang
pertanian dapat menggabungkan data cuaca
dengan data penghasilan maupun kualitas
produk. Sehingga dapat dicari cara yang
lebih efektif untuk meningkatkan kualitas
produk dan keuntungan yang lebih
Aplikasi Big Data dalam Industri
Penerbangan
Penting bagi
perusahaan
penerbangan untuk
melihat pola interaksi
calon penumpangnya
Aplikasi Big Data pada
BIG DATA
GOJEK melihat perilaku
pengguna
Olah data dan analisis
pengguna dan mitra
pengemudi
Menggunakan North Star
Metric, ukuran matriks
tunggal berupa tujuan utama
dalam bisnis
Tombol yang biasa ditekan
pengguna
Alur pemesanan
Merchant favorit di Go-Food
Aplikasi Big Data pada
BIG DATA
Menghasilk
an
Tao Cafe
Cafe tanpa kasir
Konsumen tidak perlu
mengantri untuk membayar
Cara Kerja
Konsumen
Konsumen memindai
memindai kode
kode QR
QR pada
pada aplikasi
aplikasi Taobao
Taobao di
di pintu
pintu masuk
masuk toko
toko
Konsumen
Konsumen akan
akan dimonitor
dimonitor lewat
lewat sejumlah
sejumlah kamera
kamera di
di gerai
gerai
Konsumen
Konsumen berbelanja
berbelanja
Konsumen
Konsumen keluar
keluar pintu
pintu check-out,
check-out, secara
secara otomatis
otomatis ponsel
ponsel melakukan
melakukan
pembayaran
pembayaran
Kesimpulan
• Data yang tersedia semakin besar dan
kompleks (BigData) maka untuk
menganalisisnya diperlukan kemampuan
Statistical Thinking.
• Gabungan Software R dengan Hadoop
dapat menjadi salah satu solusi.
• Aplikasi BigData sudah merambah hampir
kesemua bidang kehidupan