DETEKSI DINI PENYAKIT KANKER LEHER RAHIM (SERVIKS) DI KOTA BOGOR MENGUNAKAN SUPPORT VECTOR MACHINE (SVM) DAN REGRESI LOGISTIK BINER

  DETEKSI DINI PENYAKIT KANKER LEHER RAHIM (SERVIKS) DI KOTA BOGOR MENGUNAKAN SUPPORT VECTOR MACHINE (SVM) DAN REGRESI LOGISTIK BINER

  

JURUSAN STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

  

INSTITUT TEKNOLOGI SEPULUH NOPEMBER

SURABAYA 2014

Seminar Hasil Tugas Akhir Jurusan Statistika ITS

  Disusun oleh: Agil Darmawan Dosen Pembimbing: Dr. Santi Wulan Purnami, S.Si.,M.Si.

  PEMBAHASAN Pendahuluan Tinjauan Pustaka Metodologi Penelitian Analisis dan Pembahasan Kesimpulan dan Saran

  

PENDAHULUAN

Latar Belakang

  Negara-negara berkembang menyumbang 370.000 dari total 466.000 kasus serviks kanker yang diperkirakan terjadi di dunia dalam tahun 2000 (WHO, 2001) Di seluruh dunia, kanker serviks diklaim menjangkit 231.000 wanita per tahun, lebih dari 80% yang terjadi di negara berkembang (WHO, 2001) Kanker serviks memiliki tahap pra-ganas yang berlangsung beberapa tahun. Oleh karena itu untuk mendeteksi dini adanya kanker serviks dianjurkan untuk melakukan pemeriksaan Pap Smear (susanti, 2012).

  PENDAHULUAN Latar Belakang

  Penelitian Yayasan Kanker Indonesia yang memperkirakan, ada sekitar 52 juta perempuan Indonesia memiliki risiko terkena kanker serviks. (kotabogor.go.id) Faktor resiko kanker serviks bukan secara pasti menjadi penyebab terjangkitnya kanker serviks faktor yang menjadikan resiko terkena penyakit kanker menjadi besar.

  Salah satu faktor yang menjadikan resiko terjangkitnya kanker serviks menjadi besar adalah tidak rutinnya tes pap smear, penggunaan kontrasepsi hormonal, riwayat keluarga, merokok, dll (berbagai sumber))

  PENDAHULUAN

  RUMUSAN MASALAH

  PENDAHULUAN

  • Apa saja faktor-faktor yang mempengaruhi terjangkitnya penyakit kanker serviks di kota bogor menggunakan regresi logistik biner?
  • Bagaimana klasifikasi penyakit kanker serviks berdasarkan faktor-faktor yang mempengaruhi menggunakan Regresi Logistik Biner dan Support Vector Machine (SVM).
  • Bagaimana ketepatan klasifikasi menggunakan metode Regresi Logistik Biner dan Support Vector Machine (SVM).

  TUJUAN PENELITIAN

  • Untuk mengetahui faktor-faktor yang mempengaruhi terjangkitnya penyakit kanker serviks di kota bogor menggunakan regresi logistik biner.
  • Untuk mengetahui klasifikasi penyakit kanker serviks berdasarkan faktor-faktor yang mempengaruhi menggunakan Regresi Logistik Biner dan Support Vector Machine (SVM).
  • Untuk mengetahui ketepatan klasifikasi menggunakan metode Regresi Logistik Biner dan Support Vector Machine (SVM).

  MANFAAT PENELITIAN • Menambah khazanah penerapan ilmu statistika dalam bidang kesehatan.

  

PENDAHULUAN

  • Dengan mengetahui faktor – faktor yang mempengaruhi penyakit kanker serviks bisa memberikan masukan kepada instansi kesehatan untuk rutin memberikan penyuluhan dan fasilitas kesehatan terkait kanker serviks kepada masyarakat.
  • Dengan mengetahui model deteksi kanker serviks, bisa menjadi informasi penting bagi para tenaga medis untuk memprediksi / mendeteksi terjangkitnya kanker serviks.

  PENDAHULUAN Penelitian Sebelumnya

   Penelitian Intansari (2012) tentang kanker serviks menggunakan Bagging Logistik, menghasilkan akurasi klasifikasi sebesar 70,74%. Faktor yang berpengaruh adalah Usia, Jumlah anak, Usia pertama melahirkan, dan Penggunaan kontrasepsi.

   Penelitian Rachman (2012) tentang kanker payudara, didapatkan akurasi SVM sebesar 98,11%, jauh lebih besar dari akurasi Logistik Ordinal 56,6%.

TINJAUAN PUSTAKA

  Regresi Logistik Biner

  Regresi Logistik Biner adalah metode regresi yang mampu menyelesaikan kasus di mana variabel respon berupa dichotomous, ya-tidak, sukses-gagal, normal-cacat, hidup-mati, benar-salah, laki-laki-perempu-an, dan sebagainya. Varibel respon adalah data kategorik (Agresti, 2002).

  Fungsi Probabilitas untuk tiap y 1 y

      y = 0, 1 f y

  ( ) ( 1 )

  observasi :

      x   x 1 1 p p ...

e

  Model Regresi Logitik adalah : p = banyaknya prediktor (X)

    x

  ( )   

   x   x 1 1 p p ...

  

e

  1 

  Transformasi Logitnya adalah :

     ( x )         g ( x ) ln x ... x

  

  1

  1 p p

   

  

  

1 ( x )  

TINJAUAN PUSTAKA

       

  j = 0, 1, …, p

   

      i i n i ij n i ij i x x x y

  

1

 

  1

  ) (

  1 ) (  

       p j j x j p j j x j n i ij n i ij i j e e x x y L 1 1 1 1

     

  Regresi Logistik Biner Estimasi Parameter

  Estimasi parameter pada regresi Logistik menggunakan Maximum Likelihood.

  Nilai β didapatkan melalui turunan L(β) terhadap β dan hasilnya = 0

  1

        p j j x j n i j p j n i ij i e x y 1 1 log 0 1

     

     

     

       

  L(β) = log l(β) =

    

       n i y i y i n i i i i x x x f l 1 1 1 )) ( 1( ) ( ) ( ) (

       

TINJAUAN PUSTAKA

  Regresi Logistik Biner Uji Parameter (Serentak)

  H : β = β = … = β = 0

  1 2 p ≠ 0; p =

  H : minimal ada satu β

  1 p

  1, 2, …, l n n 1 Statistik

   n   n1    

  uji :

  n n      

  G 2 ln n   iy iy 1 i   1(  ) 1 i i

  Daerah penolakan; Tolak H jika

  2

  G >  atau P-value < (v,)

TINJAUAN PUSTAKA

  Regresi Logistik Biner Uji Parameter (Indivisu)

  H : β = 0

  i

  H : β ≠ 0 i = 1, 2,

  1 i

  …, p

  

  Statistik 

  i  

  W

  uji :

   SE

  ( ) i

  Daerah penolakan; Tolak H jika

  

  |W| > Z atau P-value <

   /2

TINJAUAN PUSTAKA

  Regresi Logistik Biner Uji Kebaikan Model

  H : Model sesuai H : Model tidak

  1

  sesuai Statistik

  g '

  2   ( ) o n

  2 k k k

  uji :

     '

     n 1( ) k

  1 k k k

2 Daerah penolakan; Tolak H  <

  2

    atau P-value &lt;

  (db,)

TINJAUAN PUSTAKA

  Regresi Logistik Biner Klasifikasi Prediksi Observa

  n11: kategori gagal yang diprediksi gagal

  si

  Gagal Sukses n12: kategori gagal yang diprediksi

  Gagal n n 11 12 sukses n21: kategori gagal sukses diprediksi Sukses n n 21 22

  gagal n22: kategori gagal sukses diprediksi sukses n11+n22 n22

  Akurasi : Specificity : n11+n12+n21+n22 n21+n22 n11

  Sensitifity :

  n11+n12

TINJAUAN PUSTAKA

  Regresi Logistik Biner Support Vector Machine

  SVM adalah metode learning machine yang bekerja atas prinsip

  Structural Risk Minimization (SRM) dengan tujuan menemukan hyperplane terbaik yang memisahkan dua buah class pada input space

  (Nugroho dan Witarto, 2003).

  Metode klasifikasi adalah usaha menemukan garis (hyperplane) yang memisahkan antara kedua kelompok / kelas/kategori.

TINJAUAN PUSTAKA

  Support Vector Machine Klasifikasi Linier    

      y   ,1 1 , i 1 2, ,..., l y y

  1

  1 Himpunan data diberikan label (target) i i i

  dan Jika +1 dan -1 terpisah secara linier didefinisikan :

     

  Problem ini dapat diselesaikan dengan

       w . x b (masuk class –1) w . x b

  1

  teknik metode Lagrange Multiplier :

   

  (masuk class +1)

     w x b .

  1 l

    2  

  1

   

      Lw , b ,  w   yw . x b  1  i i i

  2 

  1 i

  2 Penyesaian dengan meminimalkan 

    φ w 1 w l l

   

  1

2 Maximize :

      i i j i j i j y y x x

  ≥ 0

    i i 1 i , j 2  1   l

  Pemisahan hyperplane memenuhi

     yw . x b  ,0 i 1 ,..., l i

    i i y

   i 1

TINJAUAN PUSTAKA

  Support Vector Machine Non Linier

  Umumnya dua buah class pada input space tidak dapat terpisah secara sempurna. dimodifikasi dengan memasukkan slack variabel 

  , dengan  &gt; 0. Sehingga :

  l

   

  2

  1

  

 

      

    

  min w , w C

  i    

   

y w . x b

  1 w i i i

   i

  1

  2 Pemisah hyperplane menjadi : Paramater C dipilih untuk memberikan penalti yang lebih besar terhadap error klasifikasi SVM.

TINJAUAN PUSTAKA

  Support Vector Machine Non Linier separable

  Prinsip dasar SVM adalah linear classifier, dan selanjutnya dikembangkan agar dapat digunakan untuk kasus non-linear dengan memasukkan konsep Kernel. (Lin, 2003).

  Jenis Kernel Fungsi     p  

  K ( x , x ) x , x

  1 dimana i j i j     Polynomial p=1,…   2

       i j x x  

  K x x   Gaussian Radial ( , ) exp i j 2

    2 

  

Basis Function

  d q

    (RBF)

      :

  Kernel : K ( x , x ) i j

       

    K ( x , x ) tanh( . x x ) i j i j

  

  q d Sigmoid

TINJAUAN PUSTAKA

  Kanker Serviks

  Kanker ini merupakan kanker ganas yang terbentuk dalam jaringan ser-viks (organ yang menghubungkan uterus dengan vagina). Salah satu faktor utama tumbuhnya kanker jenis ini Infeksi Human Papilloma Virus (HPV). (www.parkwaycancercentre.com)

  Faktor resiko bukanlah penyebab mutlak akan

  terjangkitnya kanker rahim, namun faktor – faktor tersebut mampu meningkatkan resiko ter-kena penyakit kanker serviks menjadi lebih besar. (dr Junita Indarti, SpOG)

TINJAUAN PUSTAKA

  Faktor Resiko Kanker Serviks

TINJAUAN PUSTAKA

  Faktor Resiko Kanker Serviks

METODOLOGI PENELITIAN

  Sumber Data Sumber Data

  Data yang digunakan merupakan data sekunder mengenai Kanker Leher Rahim yang didapatkan dari Studi Kohort Faktor Risiko Penyakit Tidak Menular (PTM) di Kota Bogor 2011 oleh Kemenkes RI, dengan banyak data 1032 observasi.

METODOLOGI PENELITIAN

  Variabel Penelitian Kode Variabel Definisi Skala data Kode Variabel Definisi Skala data Y Diagnosa kanker serviks 1: Terjangkit Nominal X 2: Tidak terjangkit 8 Jenis kontrasepsi 1: Hormonal Nominal 2: Tidak hormonal

  X 1 Usia Usia pasien saat survey Rasio X 9 Waktu kontrasepsi Lama penggunaan kontrasepsi Rasio X 2 Status perkawinan 1: Iya Nominal X 2: Tidak 10 Riwayat kangker pada keluarga 1: Ada Nominal 2: Tidak

  X 3 Jumlah pasangan seksual 1: 1 pasangan Ordinal X 2: &gt; 1 pasangan 11 Vaksinasi HPV 1: Pernah Nominal 2: Tidak pernah X 4 Pendarahan di luar menstruasi 1: Iya Nominal X 12 Usia menikah Usia menikah Rasio 2: Tidak X 13 Uji Pap Smear 1: 1-2 tahun sekali Ordinal X 5 Usia pertama melahirkan Usia saat melahirkan anak pertama Rasio 2: 3 tahun sekali

  X 6 Jumlah anak Jumlah anak yang dilahirkan Rasio 3: &gt; 3 tahun sekali X 7 Penggunaan kontrasepsi 1: Iya Nominal X 14 Merokok 1: Iya Nominal

METODOLOGI PENELITIAN

  Langkah Analisis

  1. Melakukan pengumpulan data sekunder dari penelitian Kohort Litbangkes 2011.

  2. Melakukan statistika deskriptif untuk melihat karakteristi data.

  3. Mendapatkan faktor-faktor yang mempengaruhi terjangkitnya penyakit kanker serviks di Kota Bogor menggunakan Regresi Logistik Biner, dengan langkah analisis:

  a. Estimasi Parameter β menggunakan Maximum Likelihood

  b. Melakukan Uji Estimasi Parameter

  c. Uji Kesesuaian Model

  4. Membuat model klasifikasi penyakit kanker serviks menggunakan

  Regresi Logistik Biner. Dengan pembagian data :

  a. Training-testing 90:10

  b. Training-testing 70:30

METODOLOGI PENELITIAN

  Langkah Analisis

  

5. Menghitung klasifikasi penyakit kanker serviks menggunakan Support Vector Machine

(SVM). Dengan langkah analisis :

a. Menentukan skala data training-testing dengan 3 kombinasi;

  I. Training-testing 90:10

  II. Training-testing 70:30

  III. Training-testing 50:50

  b. Menentukan Fungsi Kernel yang dipakai, dalam penelitian kali ini menggunakan Polinomial.

  c. Menentukan parameter C dan p.

  d. Menghitung klasifikasi beserta ketepatan akurasinya.

6. Membandingkan performansi antara ketepatan klasifikasi Regresi Logistik Biner dengan Support Vector Machine (SVM).

ANALISA DAN PEMBAHASAN

  Statistika Deskriptif

  Variabel berskala rasio

  Mean Variabel (satuan) Min Max Tidak Usia (tahun) [X ] 1 43,17 42,6345 22 Terjangkit terjangkit Usia pertama melahirkan (tahun) [X ]

  65 5 22,2 22,50276 13

  41 Banyak anak (jumlah) [X ] Lama penggunaan kontrasepsi (hari) 6 3,2 3,219405 1

  10 30,33333 98,39869 1 968 Usia saat menikah (tahun) [X ] [X ] 9 12 21,6 21,36762 14

  88

ANALISA DAN PEMBAHASAN

  Statistika Deskriptif

  Variabel berskala 1000 nominal 903 910 1000 1000 1200 900 972 800 769 600 800 400 800 400 600 800 600 600 400 300 400 500 700 257 200 Terjangkit Tidak terjangkit 5 1 123 200 1 pasang &gt; 1 pasang Terjangkit Tidak terjangkit 5 1 200 116 Terjangkit Tidak terjangkit 6 54 200 100 Terjangkit Tidak terjangkit 4 2 Nikah Tidak

  Pendarahan Tidak Memakai Konrasepsi Tidak

ANALISA DAN PEMBAHASAN

  3 634 Terjangkit Tidak terjangkit 700 600 500 400 300 200 100 3 392 Hormonal Non hormonal 1 40 Terjangkit Tidak terjangkit 1200 1000 800 600 400 200

5

986 Riwayat keluarga Tidak ada

  5 Terjangkit Tidak terjangkit 1200 1000 800 600 400 200 6 1021 1 59 Terjangkit Tidak terjangkit 1200 1000 800 600 400 200 5 967 Tes Pap Smear Tidak 3 269 Terjangkit Tidak terjangkit 800 700 600 500 400 300 200 100 3 757 Merokok Tidak

  Statistika Deskriptif

ANALISA DAN PEMBAHASAN

  Variabel Diagnosa Total Terjangkit Tidak terjangkit Status pernikahan Nikah 5 903 908 Tidak 1 123 124 Jumlah pasangan 1 pasang 5 910 915 &gt; 1 pasang 1 116 117 Pendarahan saat

mens

Iya 54 Kontrsepsi 54 Tidak 6 972 978 Iya 4 769 773 Tidak 2 257 259 Jenis Kontrasepsi Hormonal 3 634 637 Non hormonal 3 392 395 Riwayat Keluarga Ada 1 40 41 Tidak 5 986 991 Vaksinasi HPV Pernah 5 Tes Pap Smear 5 Tidak 6 1021 1027 Pernah 1 59 60 Tidak 5 967 972

  Tabulasi Silang (crosstab)

  Statistika Deskriptif

ANALISA DAN PEMBAHASAN

  Regresi Logistik Biner

  Pada pengujian Regresi Logistik Biner ini menggunakan  = 0,2

  Uji Univariabel Variabel B df P- value Y dengan X Constant 5,440 1 ,014 1 Usia -,013 1 ,781 Y dengan X Constant 4,263 1 ,000 2 Status pernikahan ,728 1 ,531 Y dengan X 3 Jumlah.pasangan.s Constant 4,078 1 ,000

eks

,940 1 ,419 Y dengan X 4 Pendarahan mens 16,399 1 ,998 Constant 4,804 1 ,000 Y dengan X Constant 5,243 1 ,000 5 Usia melahirkan -,019 1 ,771

  Y dengan X Constant 4,509 1 ,000 6 Banyak anak ,137 1 ,632 Y dengan X 7 Kontrasepsi -,051 1 ,965 Constant 4,890 1 ,000 Variabel B df P- value Y dengan X 8 Jenis.kontrasepsi ,331 1 ,742 Constant 4,673 1 ,000 Y dengan X Constant 4,292 1 ,000 9 Lama kontrasepsi ,014 1 ,292 Y dengan X Constant 5,090 1 ,000 10 Riwayat keluarga -1,871 1 ,111 Y dengan X Constant 4,848 1 ,000 11 Vaksinasi HPV 16,355 1 1,000 Y dengan X Constant 4,766 1 ,000 12 Usia menikah ,004 1 ,939 Y dengan X Constant 5,071 1 ,000 13 Tes Pap Smear -1,545 1 ,186 Y dengan X Constant 5,935 1 ,000 14 Merokok -2,136 1 ,065

  Variabel yang signifikan pada adalah Riwayat Keluarga (X

  10

  ), Tes Pap Smear (X

  13

  ), dan Merokok (X

  14 ).

ANALISA DAN PEMBAHASAN

  Regresi Logistik Biner Uji Parameter (serentak)

  H : β =β =β =0 (Variabel independen tidak mempengaruhi

  10

  13

  14

  variabel dependen) H : Minimal satu β ≠0 (Minimal satu variabel independen yang

  1 i Chi- P-

  berpengaruh) Terlihat dari tabel bahwa nilai P-value 0,087 yang berarti kurang

  df square value dari  (0,2). Maka keputusannya adalah tolak H . Step 6,576 3 ,087

  Jadi ketiga prediktor secara bersama-sama berpengaruh terhadap Mode Block 6,576 3 ,087 terjangkitnya penyakit kanker serviks. Juga bisa disimpulkan

  6,576 3 ,087 l

  minimal ada satu dari tiga variabel independen yang Tolak H jika P-value mempengaruhi variabel dependen.

  &lt; 

ANALISA DAN PEMBAHASAN

  Regresi Logistik Biner Estimasi dan Uji Parameter (individu)

  H : β = 0

  i

  H : β ≠ 0 i = 10, 13,

  1 i

  14 P- Exp Terlihat variabel dengan P-value &lt; 0,2 adalah

  Wald value (B) β Riwayat

  Riwayat Keluarga dan Merokok. Maka

  2,149 ,143 - ,164

  keputusannya adalah tolak H . Jadi Riwayat

  keluarga 1,805

  keluarga dan Merokok berpengaruh signifikan

  • - Tes PapSmear 1,455 ,228

  ,228 terhadap kanker serviks. 1,478 -

  Merokok 2,722 ,099 ,145

  Tolak H jika P-value

  1,929

  &lt; 

  Constant 6,285 34,06 ,000 536,5

ANALISA DAN PEMBAHASAN

  Regresi Logistik Biner Estimasi dan Uji Parameter Exp (individu)

  Terlihat dari tabel nilai koefisien parameter (β )

  i (B) β Riwayat - adalah :

  ,164 T

  : [β , β , β , β ]

  keluarga 1,805

  10

  13

  14

  • - Tes PapSmear

  : [6.286, -1.805, -1.478, -1.929]

  ,228 1,478

  • - Merokok

  Seorang wanita yang tidak memiliki riwayat keluarga kemungkinan

  ,145 1,929

  terserang kanker serviks adalah 0,164 kali (lebih rendah) dari pada yang

  Constant 6,285 536,5

  memiliki riwayat keluarga. Seorang wanita yang tidak rutin tes Pap

74 Smear kemungkinan terserang kanker serviks adalah 0,228 kali (lebih

  rendah) dari pada yang pernah tes Pap Smear. Seorang wanita yang tidak punya kebiasaan merokok kemungkinan terserang kanker serviks adalah 0,145 kali (lebih rendah) dari pada yang terbiasa merokok.

ANALISA DAN PEMBAHASAN

  Regresi Logistik Biner Model Regresi Logistik Biner

  Model Logit : g 1 x =6,2851,805X1(1)1,929X3(1) Model regresi logistiknya adalah sebagai berikut :

  ) ( ˆ

  1 x

  

  = e 6,285−1,805X1(1)−1,929X3(1)

  1+e 6,285−1,805X1(1)−1,929X3(1)

  ) ( ˆ ( 1 ) ˆ

  1 x x

     

ANALISA DAN PEMBAHASAN

  Regresi Logistik Biner Uji Kebaikan Model

  H : Model telah sesuai H : Model tidak sesuai

  1 Tabel Hosmer and Lemeshow Test Chi- P-

  Terlihat bahwa nilai P-value lebih dari 0,2, maka

  df

  keputusannya adalah gagal tolak H . Jadi pada

  square value

  keyakinan 80% model yang terbentuk telah sesuai, atau

  ,716

  2 ,699 model tersebut mampu menjelaskan data. Jadi tidak ada perbedaan signifikan antara hasil pengamatan dengan

  Tolak H jika P-value kemungkinan nilai prediksi. &lt; 

ANALISA DAN PEMBAHASAN

  Regresi Logistik Biner Klasifikasi Kombinasi Akurasi Specivicity Sensitivity 50-50 99,4% 0% 100% 70-30 99,3% 0% 100% 90-10 99,02% 0% 100%

  Dari tabel di atas terlihat bahwa tingkat akurasi klasifikasi paling tinggi dihasilkan kombinasi traning:testing 50:50 yaitu sebesar 99,4%. Kombinasi 70:30 menghasilkan akurasi 99,3%. Sedangkan untuk kombinasi 90:10 menghasilkan akurasi 99,02%. Nilai

  sensitifity sama dengan nilai akurasi. Sedangkan nilai specificity bernilai 0%, karena semua prediksi mengarah ke kategori “tidak terjangkit” atau kelas y=0.

ANALISA DAN PEMBAHASAN

  Support Vector Machine

  Analisis SVM pada penelitian ini menggunakan fungsi kernel Polinomial dengan parameter p=2. Parameter SVM sebagai titik penalt dengan C=10.

  Kombinasi Akurasi Specivicity Sensitivity Support Vector 50-50 99,6% 0% 100% 512 70-30 100% 0% 100% 716 90-10 100% 0% 100% 923

  Dari tabel tersebut terlihat bahwa tingkat akurasi klasifikasi paling tinggi dihasilkan kombinasi training-testing 90-10 dan 70-30 yaitu sebesar 100%. Kombinasi 50-50 memiliki akurasi 99,6%. Ada indikasi bahwa akurasi klasifikasi akan semakin tinggi jika memperbanyak data training.

ANALISA DAN PEMBAHASAN

  Perbandingan Performansi Logistik Biner dan SVM Regresi Logistik Biner Support Vector Machine Kombinasi Akurasi Specivicity Sensitivity Akurasi Specivicity Sensitivity

  50-50 99,4% 0% 100% 99,6% 0% 100% 70-30 99,3% 0% 100% 100% 0% 100% 90-10 99,02% 0% 100% 100% 0% 100%

  Dari tabel di atas terlihat bahwa pada penelitian kali ini tingkat akurasi Support Vector Machine dan Regresi Logistik Biner mempunyai nilai akurasi yang sangat tinggi. Hal ini terjadi

  overfitting karena proporsi kategori respon yang tidak seimbang. Dari total 1032 responden, hanya 6 orang yang terjangkit. Selebihnya 1026 responden tidak terjangkit kanker serviks.

  Data dengan proporsi respon yang tidak seimbang ini menyebabkan prediksi secara keseluruhan mengarah kepada prediksi y = 0, atau prediksi bahwa responden tidak terjangkit kanker serviks. Karena tidak ada prediksi ke arah terjangkit (y = 1) maka nilai Specivicity adalah 0%, sedangkan

KESIMPULAN DAN SARAN

  Kesimpulan

  Faktor resiko yang berpengaruh signifikan pada taraf signifikasi 80% (=0,2) terhadap Kanker Serviks pada Analisis Regresi Logistik Biner adalah Riwayat Keluarga (X ) dan Merokok (X ).

  10

14 Model Logit yang terbentuk dengan memodelkan respon dengan prediktor yang

  signifikan dalam uji univariabel (Riwayat Keluarga, Tes Pap Smear, dan Merokok) adalah g 1 x =6,2851,805X10(1)1,929X14(1). Dari Model Logit tersebut didapatkan model Logistik yang menggambarkan proba-bilitas atau resiko dari suatu objek. Model regresi logis-tiknya adalah berikut :

  6,285−1,805X10(1)−1,929X14(1) e

   ˆ ( x )

  1 =

  6,285−1,805X10(1)−1,929X14(1) 1+e

    πˆ (x) 1 πˆ (x)

KESIMPULAN DAN SARAN

  Kesimpulan

  Performansi klasifikasi menggunakan SVM pada kombinasi 90:10 dan 70:30 adalah sebesar 100%, sedangkan kombinasi 50:50 sebesar 99,6%. Akurasi klasifikasi menggunakan Logistik Biner pada kombinasi 90:10 dan 70:30 adalah sebesar 100%, sedangkan kombinasi 50:50 sebesar 99,6%. Jadi dalam kasus ini akurasi antara SVM dengan Logistik Biner adalah sama. Nilai

  specificity sebesar 0%, sedangkan nilai sensitifity sebesar 100%. Hal ini

  menunjukkan bahwa arah prediksi menuju kepada prediksi kategori y=0 (tak terjangkit). Terjadi demikian karena proporsi kategori yang tidak seimbang antara y=1 dengan y=0.

KESIMPULAN DAN SARAN

  Saran

  1. Jika terdapat kasus dengan kategori respon yang tidak seimbang, maka untuk mendapatkan hasil yang lebih baik dan tidak terjadi

  over fitting perlu digunakan metode pengembangan SVM untuk inballanced data.

  2. Perlu dilakukan adanya komunikasi lebih baik antara peneliti dengan pihak yang memberikan data agar lebih memahami kasus, tertama metode sampling yang dipakai oleh Lembaga terkait hingga munculnya data.

  Daftar Pustaka

Agresti, Alan. (2002), Categorical Data Analysis Second Edition. New York: John Wiley &amp; Son’s, Inc.

  

Bogor, Kota. (2011). Seminar Kesehatan "Peduli Perempuan: Cintai Diri, Cegah, Dan Deteksi Kanker

Serviks Sejak Dini". Retrieved March, 2014, from Web Site: http://www.kotabogor.go.id

  

Canhope. (2014). Apa itu Kanker Serviks?. Retrieved March, 2014, from Web Site:

http://www.parkwaycancercentre .com Evennet, Karen. (2003). Pap Smear, Apa yang Perlu Anda Ke-tahui. Jakarta : Arcan Publisher

Gunn, Steve. (1998). Support Vector Machine for Classification and Regression. Taiwan : National

  Taiwan University

Hosmer, D.,W., Lemeshow, S. (2000). Applied Regression Logis-tic, Second Edition. Canada: John

Wiley &amp; Son’s, Inc.

Hsu, C.W., Chang, C.C., Lin, C.J. (2003). A Practical Guide to Support Vector Classification. England :

University of Southampton

Intansari, I.A.S. (2012). Klasifikasi Pasien Hasil pap Smear Test sebagai Pendeteksi Awal Upaya

  Penanganan Dini pada Penyakit Kanker Serviks di RS “X” Surabaya dengan metode Bagging Logistc Regression. Surabaya: Institut Teknologi Sepuluh Nopember.

  Daftar Pustaka

Junita. (2014). Faktor Resiko Kanker Rahim. Retrieved March, 2014, from Web Site:

  

Mc Cormick, C.,C., Giuntoli, R., L. (2011). Patient’s Guide to Cervical Cancer. Baltimore : The John

Hopkins Health Corporation

Modern Cancer Hospital Guangzhou. (2014). Faktor Resiko Kanker Rahim. Retrieved March, 2014,

from Web Site:

Nugroho, A.S., Handoko, D., Witarto, A.B. (2003). Support Vector Machine – Teori dan Aplikasinya

dalam Bioinformatika. BPPT

  Rouzeau, Vanessa. (2012). Cervical Cancer : A Review. Florida : Herzing University

Rahman, Farizi. (2012). Klasifikasi Tingkat Keganasan Breast Cancer Dengan Menggunakan Regresi

Logistik Ordinal Dan Support Vector Machine. Surabaya: Institut Teknologi Sepuluh Nopember.

  Susanti, Desi. (2012). Pemeriksaan Pap Smear. Riau : STIKES Tuanku Tambusai Bakinang Walpole, R. E. (1995). Pengantar Statistika Edisi ke-3. Jakarta: PT Gramedia Pustaka Utama World Health Organization. (2001). Effective screening programmes for cervical cancer in low- and middle-income developing countries. India : Bulletin of WHO