Deteksi User Berpengaruh Berdasarkan Kombinasi Fitur Popularitas User Dan Topik Monomorphism Pada Data Twitter untuk Promosi Produk

Wijoyo, Deteksi User Berpengaruh Berdasarkan Kombinasi Fitur Popularitas User Dan Topik Monomorphism

Pada Data Twitter untuk Promosi Produk

Deteksi User Berpengaruh Berdasarkan Kombinasi Fitur Popularitas User Dan

Topik Monomorphism Pada Data Twitter untuk Promosi Produk

3 Satrio Hadi Wijoyo , Chastine Fatichah , Diana Purwitasari

Program Studi Teknik Informatika, Fakultas Teknologi Informasi, Institut Teknologi Sepuluh Nopember

ABSTRAK

User berpengaruh merupakan sebuah user yang biasanya populer di twitter dengan ditandai

memiliki banyak follower, isi tweet atau pendapatnya sering dikutip atau diikuti oleh akun lainnya dengan ditandai tweet yang sering di retweet, dan namanya sering disebut atau di-

mention . Akan tetapi, ketertarikan tweet user berpengaruh tidak dapat dilihat hanya dari fitur

retweet dan mention saja, melainkan dapat dilihat dari fitur topik monomorphism.Berdasarkan

permasalahan tersebut, suatu metode diusulkan kombinasi fitur popularitas user dan topik

monomorphism untuk mendeteksi user berpengaruh pada data twitter untuk promosi produk.

Berdasarkan hasil ujicoba, nilai rata-rata akurasi algoritma fuzzy inference system dari produk Iphone sebesar 75,75%, produk Samsung sebesar 79,25%, dan produk Apple sebesar 74,5%. Hasil ini menunjukkan bahwa deteksi user berpengaruh berdasarkan kombinasi fitur popularitas user dan topik monomorphism menghasilkan keluaran cukup baik.

Kata Kunci: Deteksi user berpengaruh, fitur popularitas user, topik monomorphism fuzzy inference

system,twitter.

ABSTRACT

User influence is a user who is usually popular on twitter with marked has many followers, tweet contents or opinions often quoted or followed by other accounts with tweets that are often marked retweet, and his name is often referred to, or mention. However, interest tweet user influence can not be seen only from the feature retweet and mention only, but can be seen from the features monomorphism topic. Based on this problems, a method is proposed combination of features user popularity and monomorphism topic to detect an user influence on the data user twitter for product promotion. Based on the test results, the average value of the accuracy of the algorithm fuzzy inference system of products amounted to 75.75% Iphone, Samsung products amounted to 79.25%, and 74.5% of Apple products. These results indicate that the effect on user detection based on a combination of features user popularity and monomorphism topic produce output is quite good.

Keywords: User influence detection, feature user popularity, monomorphism topic fuzzy inference

system, twitter.

1. Pendahuluan produk baru mereka melalui jaringan

adalah salah satu platform sosial. Keberhasilan perusahaan untuk

Twitter

yang paling populer dari media sosial promosi produk baru agar banyak lainnya sebagai sumber informasi. Twitter pelanggan tertarik menggunakan produk merupakan sebuah microblog yang dapat mereka, tidak serta merta hanya karena menyebarkan atau membagikan informasi user milik perusahaan sendiri di twitter. berupa tweet dengan sangat cepat dan Melainkan adanya peran aktif user berbasis real-time. Tweet adalah teks berpengaruh (influencer) yang melakukan tulisan 140 karakter yang ditampilkan pada promosi keunggulan produk ke jaringan halaman profil user (pengguna) [1]. pertemanannya. Sehingga banyak orang

Twitter telah dimanfaatkan banyak tertarik menggunakan produk perusahaan

perusahaan melakukan promosi-promosi tersebut [2]. User berpengaruh merupakan

Jurnal Inspiraton, Volume 6, Nomor 1, Juni 2016: 9 - 18

retweet dan mention. Akan tetapi, tweet user dapat diketahui dengan melihat

yang dimiliki dan dioperasikan oleh Twitter Inc., yang menawarkan jaringan sosial berupa mikroblog sehingga memungkinkan penggunanya untuk mengirim dan membaca pesan yang disebut kicauan (tweets). Tweets adalah teks tulisan hingga 140 karakter yang ditampilkan pada halaman profil pengguna (User). Pengguna dapat melihat tweets pengguna lain yang dikenal dengan sebutan pengikut (followers). Tweet yang menyebut nama user dan menunjukkan kemampuan user yang terlibat dengan user lain dalam percakapan disebut mention.

2. Deteksi User Berpengaruh pada Twitter Twitter adalah sebuah situs web

user berpengaruh yang sedang popular di twitter .

promosi produk. Selain itu, pada penelitian ini akan melakukan leveling atau tingkatan dari user berpengaruh menggunakan fuzzy untuk mengetahui seberapakah user tersebut berpengaruh di twitter. Dengan adanya usulan tersebut diharapkan pemilik produk atau perusahaan dapat mengetahui

monomorphism pada data twitter untuk

Berdasarkan permasalahan tersebut, suatu metode diusulkan untuk mendeteksi user berpengaruh berdasarkan kombinasi fitur popularitas user dan topik

dari segi penyebaran informasi secara dinamik. Cosine similarity digunakan untuk menghitung kesamaan antara dua topik sebagai topik similarity dari tweet user.

twitter

melakukan prediksi user berpengaruh di

monomorphism vs. polymorphism , high latency vs. Low latency, dan information inventor vs. information spreader untuk

terhadap suatu opini atau pendapat pada satu topik disebut monomorphism. Sedangkan polymorphism adalah ketertarikan seorang individu terhadap pendapat pada topik yang bervariasi [8]. Pada penelitian [9] menggunakan fitur

user

Ketertarikan seorang individu atau

kesamaan (similarity) tweet user tersebut pada topik-topik tertentu.

topik tidak dapat dilihat hanya dari fitur

sebuah user yang biasanya populer di

Penelitian tersebut menemukan bahwa jumlah followers tidak menunjukkan pengaruh signifikan pada penyebaran tweet dari user berpengaruh. Tetapi jumlah

twitter

dengan ditandai memiliki banyak

follower . Selain itu, isi tweet atau

pendapatnya sering dikutip atau diikuti oleh akun lainnya dengan ditandai tweet yang sering di retweet dan namanya sering disebut atau di-mention [3].

Banyak metode telah digunakan untuk mengetahui user berpengaruh pada data twitter . Pembentukan Graph digunakan untuk mengetahui user berpengaruh berdasarkan perhitungan jumlah friends, jumlah followers, jumlah

mention, jumlah retweet, dan jumlah URLs posted per user [4], [5], [6], dan [7].

retweet menunjukkan pengaruh interaksi

tweet user berpengaruh terhadap suatu

antar user. Keempat penelitian tersebut menggunakan Graph untuk mengetahui

user berpengaruh memberikan hasil yang

cukup baik, akan tetapi dalam pembentukan Graph membutuhkan node banyak. Semakin banyak node yang dibutuhkan maka semakin memakan waktu proses yang banyak.

Deteksi atau identifikasi user berpengaruh tidak selalu menggunakan pembentukan Graph hubungan antar user. Pada penelitian [3] menggunakan fitur popularitas user seperti fitur jumlah

follower, jumlah retweet, dan jumlah mention. Hasil penelitian menunjukkan

jika jumlah follower dari user tinggi maka menunjukkan user tersebut hanya popular di twitter. Sedangkan jika jumlah retweet dan jumlah mention yang tinggi maka menunjukkan bahwa tweet dari user menarik dan user tersebut memiliki pengaruh. Untuk mengetahui ketertarikan

Sedangkan retweet adalah tweet yang mengandung nama user dan menunjukkan

Wijoyo, Deteksi User Berpengaruh Berdasarkan Kombinasi Fitur Popularitas User Dan Topik Monomorphism

Pada Data Twitter untuk Promosi Produk

adalah bobot dari

( ⃗⃗⃗ , ⃗⃗⃗⃗ ) = ∑ ℎ ℎ=1

× ℎ

√∑ ( ℎ

)

2 =1 × √∑ ( ℎ )

2 =1

(1) dimana dan adalah tweet yang dilakukan user,

ℎ

term ke-h pada , ℎ

Cosine similarity adalah salah satu

adalah bobot dari

tweet term ke-h pada , dan h adalah indek dari term yang didapatkan.

4. Metodologi Penelitian

4.1. Metode yang Diusulkan

Pada bagian ini akan dibahas tentang deteksi user berpengaruh berdasarkan kombinasi fitur popularitas

user dan topik monomorphism pada data twitter untuk promosi produk. Desain

sistem dalam penelitian ini terdiri atas tiga bagian utama yaitu: praproses (preprocessing), ekstraksi fitur popularitas

user dan topik monomorphism, dan

konstruksi kombinasi atau pembobotan dari dua fitur tersebut. Diagram alir desain sistem dapat dilihat pada Gambar 1.

metode untuk mengukur kemiripan teks dengan menggunakan nilai cosinus sudut antara dua vektor. Konsepnya adalah jika terdapat dua vektor dokumen dan maka nilai cosinus antara dua pasangan teks tersebut dapat dihitung dengan menggunakan persamaan (1).

tinggi akan lebih diinginkan untuk pengguna bertujuan untuk mengumpulkan informasi umum [9].

kemampuan user yang menghasilkan konten dengan nilai bersamaan [1].

twitter dengan ditandai memiliki banyak follower . Selain itu, isi tweet atau

User berpengaruh (influencer) bisa

siapa saja, bukan hanya artis ataupun selebritis dunia hiburan seperti televisi dan perfileman tetapi juga pada bidang-bidang lain seperti politik, budaya, ekonomi, olahraga, dan sebagainya. Para selebriti tersebut, kemudian menggunakan twitter sebagai media mereka menyampaikan informasi kepada para penggemarnya. Banyak

user

yang berperan untuk menjadikan dirinya sebagai selebriti di

twitter . Berbagai jenis profesi bisa

dianggap sebagai selebriti seperti user berpengaruh. Peran selebriti untuk mendorong banyaknya promosi produk serta kampanye periklanan di twitter. Sehingga dibutuhkan deteksi user berpengaruh pada twitter.

User berpengaruh merupakan

sebuah user yang biasanya populer di

pendapatnya sering dikutip atau diikuti oleh akun lainnya dengan ditandai tweet yang sering di retweet dan namanya sering disebut atau di-mention [3]. User berpengaruh ini akan menyebarkan informasi di twitter dan nantinya diharapkan akan menyebar dan diperbincangkan banyak followers.

polymorphism

Pengertian monomorphism adalah kecenderungan atau ketertarikan bagi seseorang individu terhadap opini atau pendapat untuk hanya satu topik atau tunggal topik. Sedangkan polymorphism adalah kecenderungan atau ketertarikan suatu individu terhadap opini untuk berbagai topik atau bervariasi topik [8]. Dalam media sosial, pengguna dengan

monomorphism tinggi biasanya selalu

fokus pada satu topik yang tetap, sedangkan pengguna polymorphism tinggi akan melakukan posting berbagai topik dari waktu ke waktu. Mengetahui hal ini, pengguna media sosial bisa mendapatkan keuntungan aplikasi dengan tujuan yang berbeda. Misal,

user

berpengaruh

monomorphism tinggi harus peringkatnya

lebih tinggi dari user berpengaruh

polymorphism dalam aplikasi

rekomendasi. Namun, user berpengaruh

3. Monomorphism dan Polymorphism

Jurnal Inspiraton, Volume 6, Nomor 1, Juni 2016: 9 - 18

Gambar 1. Diagram Metode Penelitian

Setelah diperoleh dataset yang dibutuhkan untuk penelitian ini. Kemudian dilakukan tahap praproses data untuk menyiapkan data tweet agar siap diproses pada tahap selanjutnya. Tahap praproses dalam penelitian ini terdiri tiga bagian yaitu : pembersihan kata (cleaning term), pemenggalan kata (tokening term ), penghapusan stopword (stopword removal ), dan perhitungan bobot tf_idf.

4.1.2. Tahap Praproses Data

Gambar 2. Contoh Tweet Yang Sebuah Produk

4.1.1. Data Uji Coba

Samsung. Data tweet dikumpulkan atau dikoleksi selama 2 bulan dengan rentang dari tanggal 17 Maret 2015 sampai 16 Juni 2015.

Search API yang disediakan oleh twitter.

(3)

(2) = log ( )

menggunakan persamaan (2), dimana adalah frekuensi kata term ke-i pada dokumen ke-j. Konsep tersebut memberikan pengukuran terhadap pentingnya kata term ke-i pada dokumen tersebut. Sedangkan ditentukan melalui persamaan (3), dimana N adalah jumlah dokumen, adalah jumlah dari dokumen yang mengandung kata term ke- i . _ = ×

tf_idf dari term j dapat dihitung dengan

pembobotan term pada sebuah dokumen. Metode ini melakukan perbandingan antara frekuensi kemunculan term j pada kalimat i ( ) dengan frekuensi kalimat yang mengandung term j ( ). Bobot

Term Frequency Inverse Document Frequency (tf_idf) adalah konsep

Tahap berikutnya adalah pengumpulan data yang digunakan dalam penelitian ini adalah data tweet atau dokumen tweet dengan memanfaatkan

Sebuah aplikasi dibangun untuk mengambil data tweet tersebut dari twitter dengan menggunakan search API dengan dibatasi wilayah geografis indonesia untuk mendapatkan data bahasa Indonesia. Dengan menggunakan search API ini, diharapkan mendapatkan berbagai informasi yang dibutuhkan. Data tweet hanya dibatasi topik-topik produk dari

Gambar 2. menunjukkan contoh

mention diperoleh dari informasi teks tweet .

sudah di retweet oleh 7 orang. Pada penelitian ini, jumlah retweet dan jumlah

brand antara lain : Apple, Iphone, dan

Contohnya pada tweet yang dilakukan user dari kompas TV, dapat diperoleh jumlah

retweet secara langsung.

suatu tweet tersebut dapat informasi jumlah

tweet sebuah produk dari brand. Pada

retweet sebanyak 7. Berarti tweet tersebut

(8)

dengan merubah nama variabel agar tidak sama dengan variabel sebelumnya. Sehingga pembobotan kemunculan user dalam klaster disebut User Frequency

Pada penelitian ini untuk mengetahui user berpengaruh yang termasuk topik monomorphism atau

polymorphism dalam melakukan tweet

dihitung dengan cara lain, tidak dihitung menggunakan cosine similarity. Akan tetapi, dengan cara menghitung bobot kemunculan user dalam klaster topik

tweet . Adapun proses ekstraksi fitur topik monomorphism terdapat 2 tahapan, yaitu :

tahap klasterisasi tweet dan perhitungan bobot kemunculan user dalam klaster.

Pada tahap klasterisasi ini digunakan untuk mengkelompokkan atau membagi koleksi tweet ke dalam sejumlah

cluster . Algoritma klasterisasi yang

digunakan dalam penelitian ini adalah algoritma klasterisasi hierarkikal

agglomerative . Setelah itu, dilakukan

perhitungan bobot kemuculan user ini mengadopsi dari konsep perhitungan bobot

tf_idf

Inverse Cluster Frequency (uf_icf).

mention dari koleksi user.

Metode ini melakukan perbandingan antar frekuensi kemunculan user i pada cluster j ( ) dengan frekuensi cluster yang mengandung user i ( ). Bobot uf_icf dari

user i dapat dihitung dengan menggunakan persamaan (6).

_ = × (6) dimana adalah frekuensi user ke-i pada cluster ke-j. Sedangkan ditentukan melalui persamaan (7) berikut ini.

= log ( ) (7) dimana adalah jumlah dari cluster yang mengandung user ke-i dan N adalah jumlah cluster. Hasil dari perhitungan bobot kemunculan user berupa koleksi

user ( ) dan frekuensinya ( ), dimana

merupakan total jumlah user sebuah cluster .

Setelah didapatkan bobot uf_icf masing-masing user dalam klaster. Kemudian dilakukan perhitungan bobot topik monomorphism dari user. Perhitungan bobot topik monomorphism adalah menghitung jumlah bobot uf

Perhitungan bobot topik monomorphism mengikuti persamaan (8) seperti berikut.

( ) =

∑ _ ( ) max ( _ ( ))

4.1.4. Ekstraksi Fitur Topik Monomorphism

∑ ( ) merupakan jumlah mention nama dari user ke-i, dan max ( ( )) merupakan nilai maksimal dari jumlah

Wijoyo, Deteksi User Berpengaruh Berdasarkan Kombinasi Fitur Popularitas User Dan Topik Monomorphism

Pada Data Twitter untuk Promosi Produk

4.1.3. Ekstraksi Fitur Popularitas User

Perhitungan retweet pada penelitian ini diperoleh dari teks atau isi tweet. Tweet

user yang diposting ulang dengan adanya

tanda atau simbol tambahan seperti RT,

retweeting, retweet, dan lainnya, serta

simbol @nama_user [3]. Bobot retweet adalah menghitung jumlah retweet dari

tweet user berpengaruh yang terdapat pada twitter. Perhitungan bobot retweet dari tweet user mengikuti persamaan (4) seperti berikut.

( ) =

∑ ( ) max ( ( ))

(4) dimana

( ) merupakan bobot

mention dari user ke-i,

retweet dari user ke-i,

∑ ( ) merupakan jumlah retweet dari user ke-i, dan max ( ( )) merupakan nilai maksimal dari jumlah retweet dari sebuah koleksi retweet user, dan p merupakan jumlah user.

Bobot mention adalah menghitung jumlah mention dari user yang terdapat pada tweet. Nama user yang disebut dalam

tweet user

lain dengan adanya tanda atau simbol tambahan seperti @ serta nama dari

user tersebut. Perhitungan bobot mention mengikuti persamaan (5) seperti berikut.

( ) =

∑ ( ) max ( ( ))

(5) dimana

( ) merupakan bobot

– icf dari user yang terdapat pada cluster.

Jurnal Inspiraton, Volume 6, Nomor 1, Juni 2016: 9 - 18 1; 2 ≤ 0,32

dimana ) merupakan bobot

(

0,395− ₂

3 , ; 0,32 ≤

2 ≤ 0,395 ( 2 ) = {

0,395− 0.32 monomorphism dari user ke-i,

0; 2 ≥ 0,395

) merupakan jumlah bobot ∑ _ (

0; 2 ≤ 0,32 2 ≥ 0,525 2 − 0,32

dari user ke-i, dan _

2 ≤ 0,42 ( ) =

2 0,42 − 0,32 ; 0,32 ≤

(10)

0,525 −

max ( _ ( )) merupakan nilai

2 ≤ 0,525 { 0,525 − 0,42 ; 0,42 ≤

maksimal dari jumlah bobot _ dari 0;

2 ≤ 0,48 2 − 0,48

semua bobot _ user. Rentang nilai

( ) =

2 2 ≤ 0,525 2 − 0,48 ; 0,48 ≤

) antara 0 sampai 1. Jika nilai (

3 { 1; 2 ≥ 0,525

) mendekati angka 1 maka tweet ( Nilai fungsi keanggotaan dari bobot

tersebut termasuk topik

user monomorphism mengikuti persamaan (11).

1; 3 ≤ 0,32 monomorphism .

0,35− ₃ , ( ) = { ; 0,32 ≤

3 ≤ 0,35

3 0,35−0,32 0; 3 ≥ 0,35

4.1.5. Implentasi Fuzzy Inference System

0; ≤ 0,3

3 3 ≥ 0,525 untuk Deteksi User Berpengaruh

3 − 0,3 3 ≤ 0,433 ( ) =

3 0,433 − 0,3 ; 0,3 ≤

FIS (Fuzzy Inference System) untuk (11)

0,565 −

deteksi user berpengaruh mempunyai 3

3 ≤ 0,565 { 0,565 − 0,433 ; 0,433 ≤

0; 3 ≤ 0,5 variabel input dan 1 variabel output.

3 − 0,5

Variabel input terdiri atas rasio retweet, ( ) = {

3 3 ≤ 0,565 0,565 − 0,5 ; 0,5 ≤

rasio mention, dan monomorphism. Sedang

1; ≥ 0,565

untuk variabel keputusan atau user Keputusan (output), ada tiga kondisi berpengaruh didapatkan dari perbandingan

(label) yang mewakili parameter ini yang nilai variabel rasio retweet, rasio mention, antara lain meliputi : L (rendah), M dan nilai monomorphism. (sedang), dan H (tinggi). Nilai fungsi

Fungsi derajat keanggotaan linear keanggotaan dari output mengikuti turun digunakan untuk merepresentasikan persamaan (12) himpunan fuzzy rendah dan fungsi derajat

1; ≤ 0,055

keanggotaan linear naik untuk himpunan

0,06 − ( ) = { 0,06 − 0,055 ; 0,055 ≤ ≤ 0,06 fuzzy tinggi. Fungsi derajat keanggotaan

0; ≥ 0,06

segitiga digunakan untuk

( ) 0; ≤ 0,055 ≥ 0,1

merepresentasikan himpunan fuzzy normal.

− 0,055

Untuk fungsi keanggotaan rasio retweet (12)

= 0,0775 − 0,055 ; 0,055 ≤ ≤ 0,0775 0.1 −

memiliki label L (rendah), M (sedang), dan

; 0,0775 ≤ ≤ 0,1 { 0,1 − 0,0775

H (tinggi). Nilai fungsi keanggotaan dari

0; ≤ 0,095

rasio retweet mengikuti persamaan (9). − 0,095

( ) = { 1; 1 ≤ 0,401

0,1 − 0,095 ; 0,095 ≤ ≤ 0,1 0,413 −

1 1; ≥ 0,1 (

1 ) = { 1 ≤ 0,413 0,413 − 0,401 ; 0,401 ≤ 0;

1 ≥ 0,413

Pembentukan Aturan Fuzzy, dari tiga

0; 1 ≤ 0,401 1 ≥ 0,688 1 − 0,401

variabel input dan sebuah variabel output,

1 ≤ 0,545 ( 1 ) = 0,545 − 0,401 ; 0,401 ≤

dengan melakukan analisa data terhadap (9)

0,688 −

1 ≤ 0,688

batas tiap

– tiap himpunan fuzzy pada tiap-

{ 0,688 − 0,545 ; 0,545 ≤ 0; 1 ≤ 0,675

tiap variabelnya maka terdapat 22 aturan

1 − 0,675 ( 1 ) = { 1 ≤ 0,688

yang akan dipkai dalam sistem ini,

fuzzy 0,688 − 0,675 ; 0.675 ≤ 1;

1 ≥ 0,688 dengan susunan aturan IF Retweet AND Mention AND Monomomorphism THAN User Berpengaruh, contoh hasil aturan

Nilai fungsi keanggotaan dari rasio fuzzy pada Tabel 1.

mention mengikutin persamaan (10).

Wijoyo, Deteksi User Berpengaruh Berdasarkan Kombinasi Fitur Popularitas User Dan Topik Monomorphism

Pada Data Twitter untuk Promosi Produk

( )− ( ) max{ ( ), ( )}

secara khusus dengan menggunakan metode evaluasi Silhouette

Coefficient [11] (Rousseeuw, 1987). Silhouette coefficient akan mengukur

kualitas cluster yang dihasilkan sekaligus mengindikasikan derajat kepemilikan setiap objek atau data yang berada di dalam cluster. Nilai shilhoutte dari sebuah objek berada pada rentang antara -1 sampai dengan 1. Semakin dekat nilai

silhouette

objek ke 1, maka semakin tinggi derajat kepemilikan objek di dalam cluster. Dimana objek direpresentasikan dengan

tweet . Adapun perhitungan nilai silhoutte

( ( )) untuk tiap tweet menggunakan persamaan (14) dan (15). ( ) = max

≠

{ ( , )} (14)

( ) =

(15) dimana ( ) adalah jarak kedekatan tweet ke-i terhadap seluruh tweets yang ada di

Pada penelitian ini yang akan digunakan untuk uji akurasi adalah

cluster internal, yaitu cluster tempat tweet

ke-i berada. Sedangkan ( ) adalah jarak kedekatan antara tweet ke-i terhadap seluruh cluster eksternal, yaitu seluruh cluster selain cluster internal.

Nilai silhouette akan mengindikasikan derajat kepemilikian tiap objek berdasarkan 3 kriteria yaitu negatif, nol, dan positif. Nilai

( ( )) dengan kriteria negatif overlapping tinggi yang menunjukkan bahwa tweet ke-i tidak berada dalam cluster U. Nilai

( ( )) dengan kriteria nol menunjukkan bahwa

tweet ke-i adalah irisan dari cluster U dan V . Sedangkan nilai

( ( )) dengan kriteria positif menunjukkan bahwa objek tepat berada pada cluster U.

Setelah didapatkan nilai ( ( )) untuk tiap tweet pada tiap cluster langkah selanjutnya adalah rata-rata nilai

( ( )) untuk tiap cluster atau yang lebih dikenal dengan Average Silhouette Width (ASW). Nilai ASW ini mampu mengindikasikan kualitas clustering. Berdasarkan range nilai ASW yang dihasilkan dibedakan menjadi 4 kriteria (Rousseeuw, 1987), yaitu : sangat baik (dengan range 0,71≤ASW≤1), sudah baik (0,51≤ASW<0,71), cukup baik (0,26≤ASW<0,51), dan kurang baik (ASW<0,26).

4.2.2. Pengujian Pengukuran Kinerja Klasifikasi

Sebuah sistem yang melakukan klasifikasi diharapkan dapat melakukan

internal evaluation,

(13)

Tabel 1. Contoh Aturan Fuzzy

∫ ( ) ∫ ( )

Id Rule Variabel Input User

Berpengaruh Retweet Mention Mono R1 Rendah Rendah

Rendah Rendah R2 Rendah Rendah Sedang Rendah

R3 Rendah Rendah Tinggi Rendah R4

Rendah Sedang Rendah Rendah R5 Rendah

Sedang Sedang Sedang R6 Rendah Sedang Tinggi Rendah

R7 Rendah Tinggi Rendah Tinggi R8

Rendah Tinggi Sedang Rendah R9 Rendah

Tinggi Tinggi Rendah R10 Sedang Rendah Rendah Rendah

R11 Sedang Rendah Sedang Rendah R12

Sedang Rendah Tinggi Rendah R13 Sedang Sedang

Rendah Sedang R14 Sedang Sedang Sedang Rendah

R15 Sedang Sedang Tinggi Tinggi R16

Sedang Tinggi Rendah Tinggi R17 Tinggi Rendah

Rendah Rendah R18 Tinggi Rendah Sedang Sedang

R19 Tinggi Rendah Tinggi Sedang R20

Tinggi Sedang Rendah Sedang R21 Tinggi Sedang

Sedang Tinggi R22 Tinggi Tinggi Rendah Tinggi

Setelah didapatkan aturan inferensi untuk mendapatkan suatu himpunan fuzzy digunakan sebagai input dari proses

defuzzifikasi. Hasil dari defuzzifikasi ini

merupakan output dari sistem kendali logika fuzzy. Metode defuzzifikasi yang digunakan adalah metode centroid atau

center of area seperti pada persamaan (13).

∗

4.2. Pengujian

4.2.1. Pengujian Kualitas Clustering

Jurnal Inspiraton, Volume 6, Nomor 1, Juni 2016: 9 - 18

klasifikasi semuat set data dengan benar, tetapi tidak dapat dimungkiri bahwa kinerja suatu sistem tidak bisa 100% benar. sehingga sistem klasfikasi juga harus diukur kinerjanya. Umumnya, pengukuran kinerja klasifikasi dilakukan dengan matriks konfusi (confusion matrix). Matrik konfusi merupakan tabel pencatat hasil kerja klasifikasi. Kita dapat mengetahui jumlah data dari masing- masing kelas yang diprediksi secara benar dan data yang diklasifikasikan secara salah. Kuantitas matriks konfusi dapat di ringkas manjadi dua nilai, yaitu akurasi dan laju eror. Untuk menghitung akurasi digunakan persamaan (16).

= ℎ ℎ

(16)

Tabel 2. menunjukkan nilai k optimal untuk 500 dataset dan 600 dataset dari ketiga produk. Pada sampel 500 dataset yang digunakan ketiga produk menghasilkan kualitas clustering dengan kriteria “sangat bagus”. Nilai ASW terbesar ada pada produk Samsung sebesar 0,8804 dengan nilai k optimal adalah 5. Sedangkan untuk produk Iphone dan Apple masing-masing menghasilkan kualitas clustering dengan nilai ASW sebesar 0.8365 di k optimal adalah 3 dan nilai ASW sebesar 0.8263 di k optimal adalah 4. Nilai ASW terkecil ada pada topik produk Iphone sebesar 0.5103 dan nilai k optimal adalah 10. Tabel 3. Nilai k untuk 600 Data Data

3 0.8365 0.7864 0.7456 4 0.7709 0.8538 0.8263 5 0.8169 0.8804 0.6842 6 0.6726 0.8108 0.5506 7 0.5996 0.7555 0.7404 8 0.6764 0.7484 0.6572 9 0.5951 0.6179 0.6959 10 0.5103 0.6308 0.7231

AWS (500 Data) Iphone Samsung Apple

Jumlah k

Tiap Produk

Tweet

Tabel 2. Nilai k untuk 500 Data Data

5. Hasil dan Pembahasan

clustering untuk setiap nilai k akan

sebesar 500 tweets dan 600 tweets dari data untuk setiap produk brand. Pemberian beberapa variasi jumlah centroid (k) terhadap clustering untuk mendapatkan satu hasil clustering yang terbaik untuk proses selanjutnya. Ujicoba nilai k dimulai dari k=3 sampai k=10. Selanjutnya hasil

apple dengan jumlah masing-masing tweet

Pada uji coba 1 menggunakan dataset produk brand samsung, iphone, dan

uji coba yang digunakan pada penelitian ini data twiiter selama 25 hari sebanyak 285.883 tweet dan total user sebanyak 183.564 user.

centrality dari hasil software nodexl. Data

. Pengujian dilakukan dengan membandingkan nilai betweenness

system

Pada bab ini dijelaskan mengenai skenario pengujian beserta hasil pengujian yang dilakukan dan analisis hasil uji yang diperoleh. Pengujian dilakukan untuk mengetahui kualitas clustering dari algoritma hirarkikal agglomerative dan nilai akurasi dari algoritma fuzzy inference

Tweet Tiap Produk Jumlah k

AWS (600 Data) Iphone Samsung Apple

3 0,7773 0,7656 0,7841 4 0,8253 0,8083 0,8292 5 0,8611 0,8598 0,7463 6 0,8599 0,6880 0,7774 7 0,8232 0,6463 0,6613 8 0,7314 0,5913 0,5713 9 0,5909 0,5692 0,5009 10 0,5736 0,5038 0,5148

Tabel 3 menunjukkan hasil dari sampel 600 dataset yang digunakan ketiga produk menghasilkan kualitas clustering dengan kriteria “sangat bagus”. Nilai ASW

dihitung validasinya menggunakan metode Silhouette pada persamaan (14) dan (15).

Wijoyo, Deteksi User Berpengaruh Berdasarkan Kombinasi Fitur Popularitas User Dan Topik Monomorphism

Pada Data Twitter untuk Promosi Produk

6. Kesimpulan

com/. Diakses tanggal 10 Maret 2015. [2] Zhu, T., Bai, W., Bin, W., & Chuanxi,

Daftar Pustaka [1] Twitter.(2015)

dapat mendeteksi user berpengaruh lebih baik. Penambahan metode deteksi tweet yang tidak sesuai dengan kata kunci yang digunakan.

monomorphism . Sehingga memungkinkan

Pengembangan selanjutnya dari metode deteksi user berpengaruh untuk promosi produk adalah mencari atau memilih fitur yang lain yang digunakan sebagai fitur tambahan, selain fitur popularitas user dan fitur topik

7. Saran

Nilai rata-rata akurasi dari produk Iphone sebesar 77%, produk Samsung sebesar 781, dan produk Apple sebesar 74%.

inference system dihasilkan “cukup baik”.

Hasil ujicoba klasifikasi user berpengaruh menggunakan algoritma fuzzy

telah memberikan kualitas clustering masuk kriteria “sangat baik” pada range 0.71≤ASW≤1. Nilai ASW 0.8804 untuk 500 Dataset pada produk Samsung dan 0,8611 untuk 600 dataset pada produk Iphone.

Agglomerative hierarchical clustering

Berdasarkan ujicoba dan analisa hasil, maka dapat ditarik kesimpulan. Hasil ujicoba pengelompokkan tweets dari ketiga produk dengan menggunakan algoritma

Apple dengan nilai akurasi sebesar 73% pada hari ke-16 sampai hari ke-20. Hasil dan analisa tentang kualitas klasifikasi yang telah dijelaskan dengan menggunakan metode evaluasi nilai akurasi dapat disimpulkan bahwa performa dari algoritma fuzzy inference system dihasilkan “cukup baik”. Nilai rata-rata akurasi dari produk Iphone sebesar 77%, produk Samsung sebesar 81%, dan produk Apple sebesar 74%.

terbesar ada pada produk Iphone sebesar 0,8611 dengan nilai k optimal adalah 5. Sedangkan untuk produk Samsung dan Apple masing-masing menghasilkan kualitas clustering dengan nilai ASW sebesar 0,8598 di k optimal adalah 5 dan nilai ASW sebesar 0,8292 di k optimal adalah 4. Nilai ASW terkecil ada pada topik produk Apple sebesar 0,5009 dan nilai k optimal adalah 9.

Samsung tertinggi daripada produk Iphone dan Samsung sebesar 82% pada dataset hari ke-6 sampai hari ke-10. Sedangkan untuk nilai akurasi terendah adalah produk

Apple 75% 74% 73% Tabel 4. menunjukkan bahwa nilai akurasi fuzzy inference system dari produk

Iphone 80% 74% 77% Samsung 82% 77% 84%

System Nama Produk Data Ke-2 Data Ke-3 Data Ke-4

menggunakan data tweet dari hari kedua, 5 hari ketiga, dan 5 hari keempat. Tabel 4. Hasil Akurasi Fuzzy Inference

system. Sedangkan data testing

sebesar dengan jumlah data tweet dari total 5 hari pertama (dari hari ke-1 sampai hari ke-5),5 hari kedua (dari hari ke-6 sampai hari ke-10), 5 hari ketiga (dari hari ke-11 sampai hari ke-15), dan 5 hari keempat (dari hari ke-16 sampai hari ke-20) untuk setiap produk brand. Data tweet dari 5 hari pertama sebagai data training digunakan untuk mendapatkan fungsi membership dan aturan inference dari fuzzy inference

apple dengan jumlah masing-masing tweet

Pada uji coba 2 menggunakan dataset produk brand samsung, iphone, dan

yang telah dijelaskan dengan menggunakan metode evaluasi silhouette dapat disimpulkan bahwa nilai ASW untuk ketiga topik produk dengan bervariasi jumlah dataset p ada range 0.71≤ASW≤1 yang berarti bahwa kualitas clustering yang dihasilkan “sangat baik”.

clustering

Hasil dan analisa tentang kualitas

Z. (2014). Maximixing the spread of

Jurnal Inspiraton, Volume 6, Nomor 1, Juni 2016: 9 - 18

influence rangking in social networks.

535-544.

Information Sciences,

[3] Cha, M., H. Haddadi, F. Benevenuto, & K. P. Gummadi. (2010). Measuring user influence in twitter: the million follower fallacy. In Proceedings of 4th

international AAAI conference on

weblogs and social media (ICWSM

‘10), 10-17.

[4] Weng, J., E. P. Lim, J. Jiang, & Q. He.

(2010). TwitterRank: Finding topic- sensitive influential twitterers. In

Proceedings of the 3rd ACM

international conference on web

search and data mining (WSDM ‘10),

261-270.

[5] Romero, D. M., W. Galuba, S. Asur, &

B. A. Huberman. (2011). Influence and passivity in social media. In

Proceedings of the 20th international

conference companion on world wide

web (WWW ‘11), 113-114.

[6] Bakshy, E., J. M. Hofman, W. A.

Mason, & D. J. Watts. (2011). Everyone’s an influencer: Quantifying influence on twitter. In Proceedings of

the 4th ACM international conference

on web search and data mining

(WSDM ‘11). 65-74.

[7] Luiten, M., W. A. Kosters, & F. W.

Takes. (2012). Topical influence on twitter: a feature construction approach. [8] Rogers, E. M. (2013). Diffusion of innovations. Vol. 27. Free press. [9] Jingxuan, L., W. Peng, T. Li, T. Sun,

Q. Li, & J. Xu. (2014). Social network user influence sense-making and dynamics prediction. Expert systems with application , 5115-5124.

Deteksi User Berpengaruh Berdasarkan Kombinasi Fitur Popularitas User Dan Topik Monomorphism Pada Data Twitter untuk Promosi Produk

1. Pendahuluan produk baru mereka melalui jaringan

3. Monomorphism dan Polymorphism

4.1.1. Data Uji Coba

4.1.5. Implentasi Fuzzy Inference System

4.2. Pengujian

4.2.1. Pengujian Kualitas Clustering

5. Hasil dan Pembahasan

Dokumen yang terkait

ANALISIS PENGARUH SINYAL 3G PADA SMARTPHONE YANG MENYEBABKAN BATERAI CEPAT DROPLOWBAT Aminah H. Umar Teknik Elektro, Universitas Sawerigading Makassar amina.usman7578gmail.com Abstrak - Analisis Pengaruh Sinyal 3G Pada Smartphone yang Menyebabkan Baterai

Pengawasan Terhadap Kebijakan Pemerintah Tentang Upah Minimum Provinsi Di Kota Pekanbaru Pada Tahun 2007

KONFLIK DAN KEKERASAN ANTARA MASYARAKAT MELAYU TAMBUSAI DENGAN PT. TORGANDA PROPERTY Oleh : Sobri, M.A., S.IP Dosen Jurusan Kriminologi Fisipol – Universitas Islam Riau Pekanbaru Abstract - Konflik Dan Kekerasan Antara Masyarakat Melayu Tambusai Dengan Pt

Nurmasari, S.Sos Alumni Prodi Administrasi Negara Fisipol-Universitas Islam Riau, Pekanbaru Abstract - Analisis Kinerja Pegawai Pada Badan Kepegawaian Daerah Di Kabupaten Bengkalis

ANALISIS PERHITUNGAN PAJAK PENGHASILAN PASAL 21 ORANG PRIBADI PADA PT. KERTASARI SIBAYAK PEKANBARU La Ode Syarfan SE.,M.Si ., Okto Tb Gultom Abstrak - Analisis Perhitungan Pajak Penghasilan Pasal 21 Orang Pribadi Pada PT.Kertasari Sibayak Pekanbaru

Rekayasa Perangkat Lunak Mobile Commerce Berbasis Wireless Application Protocol (WAP) Pada PT. Anugrah Argon Medica

Pola Posisi Berbasis Fuzzy dalam Domain Frekuensi dan Pseudopolar Fourier Transform untuk Identifikasi Bintang Baru

Pelaksanaan Strategi CRM Pada PT.Asuransi Jiwa Sraya Persero Pekanbaru

Strategi Penentuan Query Region Berdasarkan Posisi Relatif Saliency Region Overlapping Block untuk Region Based Image Retrieval

Pengaruh Sikap Materialistis Terhadap Kepuasan Kerja Dan Organizational Citizenship Behavior (Studi Pada Koperasi Syariah Di Provinsi Jawa Timur)

Dukungan

Links

Deteksi User Berpengaruh Berdasarkan Kombinasi Fitur Popularitas User Dan Topik Monomorphism Pada Data Twitter untuk Promosi Produk

1. Pendahuluan produk baru mereka melalui jaringan

3. Monomorphism dan Polymorphism

4.1.1. Data Uji Coba

4.1.5. Implentasi Fuzzy Inference System

4.2. Pengujian

4.2.1. Pengujian Kualitas Clustering

5. Hasil dan Pembahasan

Dokumen yang terkait

ANALISIS PENGARUH SINYAL 3G PADA SMARTPHONE YANG MENYEBABKAN BATERAI CEPAT DROPLOWBAT Aminah H. Umar Teknik Elektro, Universitas Sawerigading Makassar amina.usman7578gmail.com Abstrak - Analisis Pengaruh Sinyal 3G Pada Smartphone yang Menyebabkan Baterai

Pengawasan Terhadap Kebijakan Pemerintah Tentang Upah Minimum Provinsi Di Kota Pekanbaru Pada Tahun 2007

KONFLIK DAN KEKERASAN ANTARA MASYARAKAT MELAYU TAMBUSAI DENGAN PT. TORGANDA PROPERTY Oleh : Sobri, M.A., S.IP Dosen Jurusan Kriminologi Fisipol – Universitas Islam Riau Pekanbaru Abstract - Konflik Dan Kekerasan Antara Masyarakat Melayu Tambusai Dengan Pt

Nurmasari, S.Sos Alumni Prodi Administrasi Negara Fisipol-Universitas Islam Riau, Pekanbaru Abstract - Analisis Kinerja Pegawai Pada Badan Kepegawaian Daerah Di Kabupaten Bengkalis

ANALISIS PERHITUNGAN PAJAK PENGHASILAN PASAL 21 ORANG PRIBADI PADA PT. KERTASARI SIBAYAK PEKANBARU La Ode Syarfan SE.,M.Si ., Okto Tb Gultom Abstrak - Analisis Perhitungan Pajak Penghasilan Pasal 21 Orang Pribadi Pada PT.Kertasari Sibayak Pekanbaru

Rekayasa Perangkat Lunak Mobile Commerce Berbasis Wireless Application Protocol (WAP) Pada PT. Anugrah Argon Medica

Pola Posisi Berbasis Fuzzy dalam Domain Frekuensi dan Pseudopolar Fourier Transform untuk Identifikasi Bintang Baru

Pelaksanaan Strategi CRM Pada PT.Asuransi Jiwa Sraya Persero Pekanbaru

Strategi Penentuan Query Region Berdasarkan Posisi Relatif Saliency Region Overlapping Block untuk Region Based Image Retrieval

Pengaruh Sikap Materialistis Terhadap Kepuasan Kerja Dan Organizational Citizenship Behavior (Studi Pada Koperasi Syariah Di Provinsi Jawa Timur)

Dokumen yang Anda mencari sudah siap untuk unduhkan