KLASIFIKASI PERUBAHAN HARGA OBLIGASI KORPORASI DI INDONESIA MENGGUNAKAN METODE NAIVE BAYES CLASSIFICATION - Diponegoro University | Institutional Repository (UNDIP-IR)
KLASIFIKASI PERUBAHAN HARGA OBLIGASI
KORPORASI DI INDONESIA MENGGUNAKAN
METODE NAIVE BAYES CLASSIFICATION
SKRIPSI
Disusun Oleh :
KHOTIMATUS SHOLIHAH
24010212140078
JURUSAN STATISTIKA
FAKULTAS SAINS DAN MATEMATIKA
UNIVERSITAS DIPONEGORO
SEMARANG
2016
KLASIFIKASI PERUBAHAN HARGA OBLIGASI KORPORASI
DI INDONESIA MENGGUNAKAN METODE NAIVE BAYES
CLASSIFICATION
nOl :
D su
KHOTIMATUS SHOLIHAH
24010212140078
D ajukan Sebagai Salah Satu Syarat untuk Memperoleh
Gelar Sarjana pada Jurusan Statistika
JURUSAN STATISTIKA
FAKULTAS SAINS DAN MATEMATIKA
UNIVERSITAS DIPONEGORO
SEMARANG
2016
i
Alhamdulillah, segala puji hanya milik Allah SWT, karena hanya limpahan rahmat dan
karuniaNya penulis mampu menyelesaikan Tugas Akhir yang berjudul
H
!"
ve Bayes Classification .
Pada kesempatan ini penulis ingin mengucapkan terima kasih kepada:
1. Ibu Dra. Dwi Ispriyanti, M.Si, selaku Ketua Jurusan Statistika Fakultas Sains dan Matematika
Universitas Diponegoro.
2. Ibu Di Asih I Maruddani, S.Si, M.Si selaku dosen pembimbing I dan Bapak Abdul Hoyyi,
S.Si., M.Si selaku dosen pembimbing II, yang telah memberikan bimbingan dan pengarahan
dalam penulisan tugas akhir ini.
3. Bapak/Ibu dosen Jurusan Statistika Fakultas Sains dan Matematika yang telah memberikan
ilmu yang bermanfaat.
4. Kedua orang tua yang selalu memberikan dukungan, do a, dan tidak pernah lelah mendidik
serta memberi cinta yang tulus dan iklas semenjak kecil.
5. Semua pihak yang telah memberikan bantuan dalam menyelesaikan tugas akhir ini yang tidak
dapat penulis sebutkan satu per satu.
Penulis menyadari bahwa laporan ini masih jauh dari sempurna. Oleh karena itu, kritik
dan saran yang membangun sangat penulis harapkan.
Semarang, Maret 2016
Penulis
iv
$%&'($)
*+,-./0- /1/,/2 034/5 35/6. 7/6.8/ 9:6:6./2 -panjang yang dapat dipindahtangankan
berisi janji dari pihak penerbit untuk membayar imbalan berupa bunga pada periode tertentu dan
melunasi pokok utang pada waktu yang telah ditentukan kepada pihak pembeli obligasi. Harga
obligasi yang mengalami perubahan setiap waktu dapat menguntungkan atau merugikan
investor. Investor hendaknya mengetahui kondisi terbaik untuk membeli obligasi dengan harga
diskon, atau menjual obligasi dengan harga premium. Dengan mengklasifikasikan perubahan
harga obligasi dapat membantu investor untuk mendapatkan return yang optimal. Salah satu
metode klasifikasi adalah Naive Bayes. Secara teori, metode tersebut mempunyai error yang
minimum dibandingkan metode klasifikasi yang lain. Bayes merupakan teknik prediksi berbasis
probabilistik sederhana yang berdasar pada penerapan teorema Bayes dengan asumsi
independensi yang kuat. Sebelum dilakukan klasifikasi, diperlukan preprocessing data yang
merupakan tahapan pemilihan fitur. Dalam hal ini dilakukan uji Mann Whitney untuk memilih
fitur yang independen tiap kelasnya. Teknik validasi yang digunakan adalah k-fold cross
validation. Berdasarkan hasil analisis, diperoleh akurasi rata-rata sebesar 78,52% dan error
21,48%. Dengan akurasi yang cukup tinggi dan error yang cukup rendah, hal ini dapat diartikan
bahwa metode Naive Bayes bekerja cukup baik dalam mengklasifikasi perubahan harga obligasi
korporasi di Indonesia.
Kata kunci : obligasi, klasifikasi, k-fold cross validation, Naive Bayes
#
;?;@>
-
ABCD EF G HIDEJH KBCL MINH DIOM FIPJNEMEIF QREPR PGC OI FBKD GCD PBCMGECF G SKIDLI TNBH
MRI EFFJIN MB SGU ECMINIFM TBN G PINMGEC SINEBD GCD NISGUHICM BT MRI SNECPESGK DIOM GM G FSIPETEID
MEHI
MB
MRI
OBCDF
.
OJUIN
.
ABCDF
SNEPI
PRGCLIF
GCU
MEHI
,
EM
PBJKD
OI
OICITEPEGK
BN
LEVI
DEFGDVGCMGLI MB ECVIFMBNF WCVIFMBNF FRBJKD XCBQ MRI OIFM PBCDEMEBCF MB OJU OBCDF BC G DEFPBJCM
.
,
,
BN FIKK MRIH GM G SNIHEJH SNEPI AU PKGFFETU MRI PRGCLECL BT OBCDF SNEPI EM PBJKD RIKS ECVIFMBNF
,
MB LGEC BSMEHJH NIMJNCY ZCI HIMRBD EF [GEVI AGUIF PKGFFETEPGMEBCY WC MRIBNU WM RGF MRI HECEHJH
INNBN NGMI EC PBHSGNEFBC MB GKK BMRIN PKGFFETEINF
MIPRCE\JI
QREPR
GFFJHSMEBCF
.
OGFID
BC
MRI
AITBNI PKGFFETUECL
,
GSSKEPGMEBC
.
-
AGUIF EF G FEHSKI SNBOGOEKEFMEP OGFID SNIDEPMEBC
BT
AGUIF
MRIBNIH
QEMR
FMNBCL
ECDISICDICPI
SNISNBPIFFECL DGMG EF NI\JENID GF G FMGLI TIGMJNI FIKIPMEBCY WC
, MRI ]GCC ^REMCIU MIFM PGC OI DBCI MB PRBBFI MRI ECDISICDICM TIGMJNIF BT IGPR PKGFF.
VGKEDGMEBC MIPRCEque in use is k-fold cross validation. Based on analysis, we gained average
accuracy at 78,52% and 21,8% error. With high accuracy and quite low error, it means that the
Naïve Bayes method works quite well on classifying the corporate bonds price changes in
Indonesia.
MREF PGFI
Keywords: bonds, classification, k-fold cross validation, Naive Bayes
vi
abcdbe fgf
l mn
hiii
AlAm nopok qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq
`
AlAm rsmtsuAhjm v qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq
``
AlAm rsmtsuAhjm vv qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq
```
hjk
hjk
hjk
wjxj rsmtjmx
Ay qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq
v
`
AzuxyAw qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq
v
AzuxyACxqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq
_`
DA{xjy vuvqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq
_``
EL...................................................................................
x
DAFTAR GAMBAR ..............................................................................
xi
DAFTAR LAMPIRAN...........................................................................
xii
DAFTAR ISTILAH ...............................................................................
xiii
pj{xjy xjz
BAB I PENDAHULUAN
1.1
Latar Belakang...................................................................
1
1.2
Rumusan Masalah..............................................................
4
1.3
Batasan Masalah ................................................................
5
1.4
Tujuan Penelitian ...............................................................
5
BAB II TINJAUAN PUSTAKA
2.1
Pasar Modal .......................................................................
6
2.2
Investasi .............................................................................
7
2.3
Pengertian Obligasi............................................................
7
_``
2~
}} }}
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
9
2.5
Pendapatan Obligasi ..........................................................
11
2.6
Peringkat Obligasi Perusahaan ..........................................
12
2.7
Konsep Klasifikasi.............................................................
13
2.8
Probabilitas ........................................................................
14
2.9
Classifier.......................................................
16
2.10 Karakteristik Naive Bayes .................................................
20
2.11 Pemilihan Fitur (Variabel) Berbasis Statistik ....................
21
2.12 Teknik Validasi Model ......................................................
22
2.13 Pengukuran Kinerja Klasifikasi.........................................
23
r
rst
s
BAB III METODOLOGI PENELITIAN
3.1
Sumber Data ......................................................................
24
3.2
Variabel Penelitian ............................................................
24
3.3
Tahapan Analisis ...............................................................
26
3.4
Diagram Alir Analisis........................................................
27
BAB IV HASIL DAN PEMBAHASAN
4.1
Deskripsi Data ...................................................................
4.2
Hubungan Antara Fitur dengan Perubahan
28
Harga Obligasi ...................................................................
30
4.3
Pemilihan Fitur Berbasis Statistik .....................................
34
4.4
Teknik Validasi Model ......................................................
40
4.5
Pengukuran Kinerja Klasifikasi.........................................
47
|}}}
BAB V PENUTUP
1.1
Kesimpulan ........................................................................
55
1.2
Saran ..................................................................................
56
DAFTAR PUSTAKA .............................................................................
57
LAMPIRAN............................................................................................
59
x
Hlmn
.................................................
¯°
C³´µ¶·¸³´ ¥¨§ ¹«¬¤º¤§¬¤ » ¹¢«¬ ......................
°¼
.......................................................
°¿
4 À¥¦§ Á§¨ ©ª«¤¦¬¤ ..........................................................
°Â
5 ¡¢£¤¥¦§¨ ©ª«¤¦¬¤ ....................................................................
°Â
¡¢£¤¥¦§¨ ©ª«¤¦¬¤ ¡¢£¬®¥
± ²¨£¤§¬
.
½ ¡¢£ª®¥ ¾£¦ ©ª«¤¦¬¤
,
Yield ...............................
¼É
.................
¼É
8 Ƥ«¤ ÆÅǤ¥« È¢¥¦¥ ¡¢£ª®¥ ¾£¦ ©ª«¤¦¬¤ ...................
¼¼
Yield È¢¥¦¥ ¡¢£ª®¥ ¾£¦ ©ª«¤¦¬¤ ..................................
¼¼
à ¹ÄÅ¥ ©ª«¤¦¬¤ Ƥ«¤ ÆÅǤ¥« È¥
Ê ¹ÄÅ¥ ©ª«¤¦¬¤ È¢¥¦¥ ¡¢£ª®¥ ¾£¦ ©ª«¤¦¬¤
Ë
Ì »¨
Training §¢¨¤§ k Í ¯ ÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎ
ÏÉ
Ȭ
Testing §¢¨¤§ k Í ¯ÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎ
ϯ
± ÀÇ«® »¨
Training ¡¢£ ¹¢«¬
ÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎ
ϯ
Training ..........................
ϼ
Training..................................
ϼ
Ñ ²¨£¤§¬
Confusion ¥¨§ »¨ Testing k Í ¯ ÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎ
Ï¿
à ²¨£¤§¬
Confusion ¥¨§ »¨ Testing k Í ° ÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎ
ÏÂ
Ê ²¨£¤§¬
Confusion ¥¨§ »¨ Testing k Í ¼ ÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎ
ÒÉ
Ó ²¨£¤§¬
Confusion ¥¨§ »¨ Testing k Í Ï ÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎ
Ò¯
Ë ²¨£¤§¬
Confusion ¥¨§ »¨ Testing k Í Ò ÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎ
Ò°
±Ì ²¨£¤§¬
Confusion ¥¨§ »¨ Testing k Í Ô ÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎ
Ò¼
½ À¥¦§ Á§¨ ©ª«¤¦¬¤ ÄÈ »¨
Ð ¡¢£¤¥¦§¨ ©ª«¤¦¬¤ ÄÈ »¨
x
ÕÖרÖÙ ÚÖÛÜÖÙ
ÝÞßÞàÞá
Úâãäâå
1æ çèÞéêÞà ëßèê ëáÞßèìèì
Úâãäâå
2æ ðÞáéñÞ òÞñóô õößèéÞìè ÷øáéÞá ùøêôöÞúÞá ÝÞêéÞ
ííííííííííííííííííííííííííííííííííííííííííííííííííííííííí
îï
õößèéÞìè íííííííííííííííííííííííííííííííííííííííííííííííííííííííííííííííííííííííííííííííí
ûü
Úâãäâå ýæ ùøêèáéñÞó õößèéÞìè ÷øáéÞá ùøêôöÞúÞá ÝÞêéÞ õößèéÞìè íííííííí
ûî
xi
1
ÿ
ÿ
ÿ
ÿ
! " # $%
ÿ
&'"
" (%)* + + ) ""
" (%)* ++++++++++++++++++++++++++ *,
2 Syntax Uji Mann-Whitney +++++++++++++++++++++++++++++++++++++++++++++++++ -%
. // 01
ÿ
Mann-Whitney ++++++++++++++++++++++++++++++++++++++++++++++++
-$
2 Syntax 3" " Naive Bayes 3"/4 #"4 4
ÿ
5
ÿ
ÿ
K-Fold Cross Validation +++++++++++++++++++++++++++++++++++
-*
6 // 3" " Naive Bayes +++++++++++++++++++++++++++++++++++++++++++++ - 7 #" &
8 ++++++++++++++++++++++++++++++++++++++++++++++++++++++ 9%
þÿÿ
?=@ AB?AC=D
At discount bond
EFGH;I; H; JKGK LKMNK OKIKM FPQ;NKI; QRP;L MRGHKL HKM; G;QK;
GFJ;GKQGSK
At premium bond
EFGH;I; H; JKGK LKMNK OKIKM FPQ;NKI; QRP;L T;GNN; HKM; G;QK;
GFJ;GKQGSK
Fixed rate bond
URG;I FPQ;NKI; SKGN JRJPRM;VKG T;GNVKT IWVW PWGNK TRTKO
IKJOK; ORM;FHR XKTWL TRJOF
YKMNK OKIKM
YKMNK XWKQZPRQ; SKGN PRMQKVW H; OKIKM KTKW SKGN TRMXKH; H;
[WMIK \]RV
Issuer
^;LKV SKGN JRGK_KMVKG FPQ;NKI;
EWOFG
`;GNVKT IWVW PWGNK KTKW ORGHKOKTKG KTKI ORJPRQ;KG FPQ;NKI;a
H;PKSKMVKG IRT;KO IRJRITRMKG KTKW TM;_WQKG
Maturity date
`KGNNKQ XKTWL TRJOF HKG LKMWI H;QWGKI;GSK OFVFV HKM; IWMKT
WTKGN
b;QK; GFJ;GKQ
YKMNK SKGN H;PRM;VKG HKG TRMTWQ;I OKHK FPQ;NKI; KTKW IKLKJ
cPQ;NKI;
dWMKT WTKGN XKGNVK JRGRGNKLZOKGXKGN SKGN HKOKT
H;O;GHKLTKGNKGVKG SKGN PRM;I; XKGX; HKM; O;LKV SKGN
JRGRMP;TVKG WGTWV JRJPKSKM ;JPKQKG PRMWOK PWGNK OKHK
ORM;FHR TRMTRGTW HKG JRQWGKI; OFVFV WTKGN OKHK _KVTW SKGN
:;;;
ghijk lfghmgnojm ohpjlj pfkjo phqrhif sriftjuf ghvuhrng
wriftjuf
wriftjuf yjmt lfohinjvojm sihk phqhvfmgjk jgjn phvuhvsjm
xsvpsvjuf
ljijq vjmtoj qhqhmnkf ugvnognv phvqsljijm
zhvfmtojg
xslh yjmt lfrjonojm nmgno qhmnm{noojm onjifgju unjgn unvjg
sriftjuf
ngjmt yjmt phmhgjpjmmyj lfijonojm sihk ihqrjtj
phqhvfmtojg h|ho
Return
}jrj jgju unjgn fm~hugjuf yjmt rfjujmyj lfmyjgjojm uhrjtjf
gjvf| phvuhmgjuh gjknmjm
Yield
zhmljpjgjmohnmgnmtjm jgju fm~hugjuf yjmt lfghvfqj sihk
fm~hugsv
Yield to maturity
fmtojg phmljpjgjm yjmt jojm lfghvfqj sihk fm~hugsv rfij
unjgn fm~hugjuf rhv{jmtoj pjm{jmt ljm rhvrnmtj uhphvgf
sriftjuf lfufqpjm ujqpjf {jgnk ghqps
efff
1
¡ ¢u£ £¤ ¥ ¦ §¨¡¢¡§ ¦¤ © ¤ª y
¢§¦¥ ¡¦§¥§¢« ¬¤ ¤¥¡y ¦§£ª¥ ¢ ¥ £¤¦¡¥ ¥¦
¥ ¡¦§£§® ¦§ ¡§ ¯¢¥ ¦£§ ¡ £ ¤§y ¡§
¦ ¥ « ° £ ¦£§ ¤ £ ¢§¦¥ ¥§ ¡¤y ¦§¦¤¥ ¢ ¥
« ±¤ª ¡ §¢ ® £¤u¦ ¡ª y ¡ ª ²uns ª unt ¥
m
r ª¥n ¦
sr r ¦§r ¦¤m
§nvts ¡§ yn um
® y§tu t n
m
syr ¥®t t nm§rntª® ¦n§rm
n¦¨§¡« ¡£ ³¦¤ ¦§¦
¡§ ¡¤ª ¡¢u¡£ ¯¥¢§¯ ¢ ¥ £ ´¢ ¡ ¢u£
(µ³£ ¦ ¥£¢§® ¶··)«
¬£¦©§ ¦ ¸¥ª£ ¦¦§ (¶··) ¹ ¢¥ ªº ¡£ ³¦¤
§¤§¥§ £ ¡£ § £¥³³§ ¡ ¢ £« »¤ §§ ¦§¥£¥ ¡£
³¦¤ ©¤¥ ¦ ¯ ¡§ ¡¥¤§ ¡® ¹§¢ ¯ ¡§ ¥³³§ ¦ ¯ ¡§
¥ « ¡£ ³¦¤ ¦§¥¢¥ §¤§¥§ ¯ ¡§ ¥³³§ ¥£ ¹¦§¥
¯¡§¤§¢¡ ¢ ºª ¹ £¢ ¥ ¦ ¥¢§ ¹§¢ §ª¥ ¹
§¤§¥§ ¥¤§ª ¦ (§¨¡¢³£) ¦ §ª¥ ¹ £¤ ¥ ¦ (¼½½¾¿À)«
¡£ ³¦¤ ¦§¥¢¥ §¤§¥§ ¯ ¡§ ¥ ® ¥£ £§¥
¥ ¥§ ¦ ¥¡¢ £³¤ª §¤ (return) § §¤§¥ ¦®
¡¡ § ¦ ¥£¥¢£§¡¢§¥ §¨¡¢¡§ ¹ ¦§§¤§ª«
Á
ÂÃÄÃÅ ÆÇÈÃÉ ÆÊÅËÌÃÍÃÎ ÄÃÅÃÎÃ ÌÊÆÏÊÎÐËÍ ÆÇÈÃÉ ÈÃÎ ÃÍËÆËÉÃÄÑ ÈÃÎÃ
ÃyÎÒ ÈÑÃÅÃÓÍÃÎÔ ËÎÐËÍ ÆÊÎÑÎÒÍÃÐÍÃÎ ÌÃÅÐÑÄÑÌÃÄÑ ÆÃÄÃyÅÃÍÃÐ ÈÃÉÃÆ ÌÊÎÒÃÅÃÓÃÎ
ÈÃÎà ÒËÎà ÆÊÎËÎÕÃÎÒ ÌÊÆÏÑÃÃyÃÎ ÌÊÆÏÃÎÒËÎÃÎ ÎÃÄÑÇÎÃÉ (ÖÓÆÃÈÔ Á×ר)Ù ÚÑ
ÛÎÈÇÎÊÄÑÃ ÐÊÅÈÃÌÃÐ ÏÊÅÏÃÒÃÑ ÆÃÜÃÆ ÄÊÍËÅÑÐÃÄ ÝÃÎÒ ÈÑÌÊÅÕËÃÉÏÊÉÑÍÃÎ ÈÑ ÈÃÉÃÆ ÌÃÄÃÅ
ÆÇÈÃÉÔ ÄÃÉÃÓ ÄÃÐËÎÝÃ ÃÈÃÉÃÓ ÇÏÉÑÒÃÄÑÙ
ÞÏÉÑÒÃÄÑ ÃÈÃÉÃÓ ÄËÅÃÐ ËÐÃÎÒ ÕÃÎÒÍà ÆÊÎÊÎÒÃÓßÌÃÎÕÃÎÒ ÝÃÎÒ ÈÃÌÃÐ
ÈÑÌÑÎÈÃÓÐÃÎÒÃÎÍÃÎ ÝÃÎÒ ÏÊÅÑÄÑ ÕÃÎÕÑ ÈÃÅÑ ÌÑÓÃÍ ÝÃÎÒ ÆÊÎÊÅÏÑÐÍÃÎ ËÎÐËÍ ÆÊÆÏÃÝÃÅ
ÑÆÏÃÉÃÎ ÏÊÅËÌÃ ÏËÎÒÃ ÌÃÈÃ ÌÊÅÑÇÈÊ ÐÊÅÐÊÎÐË ÈÃÎ ÆÊÉËÎÃÄÑ ÌÇÍÇÍ ËÐÃÎÒ ÌÃÈÃ
àÃÍÐË ÝÃÎÒ ÐÊÉÃÓ ÈÑÐÊÎÐËÍÃÎ ÍÊÌÃÈà ÌÑÓÃÍ ÌÊÆÏÊÉÑ ÇÏÉÑÒÃÄÑ ÐÊÅÄÊÏËÐÙ ÞÏÉÑÒÃÄÑ
ÆÊÆÌËÎÝÃÑ ÍÊËÎÐËÎÒÃÎ ÏÃÑÍ ÏÃÒÑ ÌÊÎÊÅÏÑÐ ÇÏÉÑÒÃÄÑ (áââãäå) ÃÐÃËÌËÎ ÏÃÒÑ ÑÎæÊÄÐÇÅÙ
çÃÒÑ issuer, ÇÏÉÑÒÃÄÑ ÆÊÅËÌÃÍÃÎ ÄÃÉÃÓ ÄÃÐË ÌÑÉÑÓÃÎ ÌÊÎÈÃÎÃÃÎ ÝÃÎÒ ÅÊÉÃÐÑè ÉÊÏÑÓ
ÆËÅÃÓ ÈÑÏÃÎÈÑÎÒÍÃÎ ÈÊÎÒÃÎ ÌÑÎÕÃÆÃÎ ÃÐÃËÌËÎ ÍÅÊÈÑÐ ÏÃÎÍÙ ÚÃÅÑ ÄËÈËÐ ÌÃÎÈÃÎÒ
ÑÎæÊÄÐÇÅÔ ÇÏÉÑÒÃÄÑ ÆÊÅËÌÃÍÃÎ ÃÉÐÊÅÎÃÐÑè ÑÎæÊÄÐÃÄÑ ÝÃÎÒ ÃÆÃÎ ÍÃÅÊÎà ÊèÊÍ ÏÊÅÄÑèÃÐ
ËÐÃÎÒ ÑÎÑ ÆÊÆÏÊÅÑÍÃÎ ÌÊÎÒÓÃÄÑÉÃÎ ÐÊÐÃÌ ÏÊÅËÌÃ ÍËÌÇÎ ÈÃÎ ÌÇÍÇÍ ËÐÃÎÒ ÌÃÈÃ
àÃÍÐË ÕÃÐËÓ ÐÊÆÌÇ ÝÃÎÒ ÐÊÉÃÓ ÈÑÐÊÎÐËÍÃÎ (éÑÕÃÝÃÎÐÇÔ Á×êë)Ù
ìÃÆËÎ ÈÊÆÑÍÑÃÎÔ ÇÏÉÑÒÃÄÑ ÐÊÐÃÌ ÆÊÆÑÉÑÍÑ ÅÑÄÑÍÇ ÄÊÏÃÒÃÑÆÃÎà ÑÎÄÐÅËÆÊÎ
ÑÎæÊÄÐÃÄÑ ÉÃÑÎÎÝÃÙ íÊÉÃÑÎ ÆÊÆÑÉÑÍÑ ÈÃÎà ÝÃÎÒ ÃÍÃÎ ÈÑÑÎæÊÄÐÃÄÑÍÃÎÔ ÄÊÇÅÃÎÒ
ÑÎæÊÄÐÇÅ ÕËÒà ÓÊÎÈÃÍÎÝà ÆÊÆÌËÎÝÃÑ ÌÊÎÒÊÐÃÓËÃÎ ÝÃÎÒ ÜËÍËÌ ÐÊÎÐÃÎÒ ÇÏÉÑÒÃÄÑÙ
íÊÌÊÅÐÑ ÓÃÉÎÝà ÑÎÄÐÅËÆÊÎ ÑÎæÊÄÐÃÄÑ ÉÃÑÎÎÝÃÔ ÇÏÉÑÒÃÄÑ ÕËÒà ÆÊÎÒÃÉÃÆÑ
ÌÊÅËÏÃÓÃÎ ÈÃÉÃÆ ÓÃÅÒÃÙ ÖÈà ÏÃÎÝÃÍ èÃÍÐÇÅ ÝÃÎÒ ÆÊÆÌÊÎÒÃÅËÓÑ ÌÊÅËÏÃÓÃÎ ÓÃÅÒÃ
ÇÏÉÑÒÃÄÑÙ îÃÏÇïzÑ (Á×××) ÆÊÎÝÊÏËÐÍÃÎ ÏÃÓàà èÃÍÐÇÅ ÝÃÎÒ ÆÊÆÌÊÎÒÃÅËÓÑ
ÌÊÅËÏÃÓÃÎ ÓÃÅÒà ÇÏÉÑÒÃÄÑ ÃÈÃÉÃÓ ÍËÌÇÎÔ ÕÃÎÒÍà àÃÍÐË ÕÃÐËÓ ÐÊÆÌÇ ÈÃÎ ÐÑÎÒÍÃÐ
ÓÃÄÑÉ ÈÑ ÆÃÎÃ ÇÏÉÑÒÃÄÑ ÈÑÌÊÅÈÃÒÃÎÒÍÃÎ
(yield).
ðÊÎËÅËÐ ñËÏÑÅ (Á×êÁ)Ô ÈÃÉÃÆ
ò
óôóõöõ÷ øùöõúûüõ üôùûúûõ õýþôüÿûüõ û û ùôùô û û û ÿø ûyýú
õ ô ÿõóùûýú ûý õ ûýÿû ûýûy ô õýú ûÿ øùöõúûüõ ô õø ô ôóùûûy ûý
t t
ty
øý ûý
ôý ÿ ýø ûúû ûý û û ÿõ (
ô öu
)
øùöõúûüõ û û ûýú õüôù ÿ øùöõúûüõ
ôýúûý ôóõ ó (at premium bond) ûõÿ øý õüõ õ óûýû ÷û úû ûüû øùöõúûüõ
öôùõ÷ ÿõýúúõ õ ûÿûü ýõöûõ ýøóõýûöý û û û
öû ûýú õüôù ÿ øùöõúûüõ ôýúûý
õü øý (at discount bond), ûõÿ øý õüõ õ óûýû ÷û úû ûüû øùöõúûüõ ùô û û õ
ùû û÷ ýõöûõ ýøóõýûöý û
û úû øùöõúûüõ
ûýú óôýúûöûóõ
ô ùû÷ûý üôÿõû
ûÿ
û ûÿ
óôýú ýÿ ýú ûý ûÿû óô úõ ûý õýþôüÿø ýþôüÿø ÷ôý û ý û óôýúôÿû÷ õ øý õüõ
ÿô ùûõ
ýÿ
óôóùôöõ øùöõúûüõ ôýúûý ÷û úû õü øý ûÿû óôý ûö øùöõúûüõ
ôýúûý ÷û úû ôóõ ó
ôýúûý óôýú öûüõ õ ûüõ ûý ô ùû÷ûý ÷û úû øùöõúûüõ
û ûÿ óôóùûýÿ õýþôüÿø ýÿ óôý û ûÿ ûý return ûýú ø ÿõóûö
ûÿû óõýõýú û ûöû÷ ôúõûÿûý óôöõ ÿõ ôýú ó öûý ôóû ûõûý ûÿû
÷õüÿø õü ýÿ
ùô
ûý ùôüû
(ûýÿøüû
)
Naive Bayes
û ùûý û óôÿø ô öûüõ õ ûüõ ûöûó ûÿû
Naive Bayes
ôÿø ô
ûüôÿ ø
(ò) Naive Bayes
óô û ûý ÿô ýõ
óô û ûý óôÿø ô
ôýú öûüõ õ ûüõûý ûýú ÿô ôýûö ôýúûý ÿõýú ûÿ ôû ûÿûý ûýú ùûõ
óôýôó ûý ôÿô ûÿ ûý øöû ûÿû ÷ ù ýúûý ûöûó üôÿ ûÿû
óõýõýú ûýÿû û öûõý
ôý ÿ
ô õ üõ ùô ùûüõü øùûùõöõüÿõ
üô ô ÷ûýû ûýú ùô ûüû û û ôýô û ûý ÿôø ôóû û ôü (ûÿ ûý û ôü) ôýúûý
ûü óüõ õý ô ôý ôýüõ ( ôÿõ û ÿô úûýÿ ýúûý) ûýú
()
ü öõÿ õ ôý ÷õ ûöûó
ýõû ý ûÿû û ûý ÿôÿû õ ûöûó û ÿõ ý û óûüõ÷ ùô ýúüõ ôýúûý ùûõ
ûÿ (ýûõ ) õùû øýõ
óôý ûÿû ûý ùû÷ û óôü õ ý ûü óüõ õý ô ôý ôýüõ
!
Naive Bayes m
pr#$#n#%l &o
r#tm #yn% t"#m
r su
k'##l m$#t"%&o
r
"u
eager
learner, #y&tu'&'"(#&nun
tk"m#l $)$#n*"m
+#,##n-*".#/&0#1-*"2+".#3#4#1 *#'#
'#/# .#/&0 )1/)$ '#*#/ 2"2"/#$#1 '"1%#1 +"1#4 ("/* 5"$/64 2#()$#1 $" .#+".
$".#(
y
$".)#4#11#
("0&1%%#
'&
#$0&4
2".#$)$#1 *"2"/##1 '"1%#1 +"1#4
*46("(
*"
.#/&0#17
26'".
()'#0
'#*#/
(84#("/967 :;",#4# /"64&7 2"/6'" $.#(&?&$#(&
Naive Bayes
2"2*)19#&
(@#1
2&1&2)2 '&+#1'&1%$#1 2"/6'" $.#(&?&$#(& 9#1% .#&1
'#1
error rate
K#2+"47
9#1%
)
:;;A =
>".#&1 &/)7 '&+#1'&1%$#1 '"1%#1 *"1%$.#(&?&$#( 2"1%%)1#$#1 4"%4"(& .6%&(/&$7
2"/6'"
Naive Bayes /&'#$ 2"2"4.)$#1 *"1%)3 (/#/&(/&$ ("*"4/& )3& (&%1&?&$#1(&=
B"/6'"
K"."+&0#1
Naive Bayes
2"4)*#$#1 2"/6'" 9#1% 2)'#0 '&&2*."2"1/#(&$#1=
.#&1 2"/6'" &1& #'#.#0 '#*#/ 2"1#1%#1&
missing value,
'#1 #*#+&.#
#()2(& (#.&1% +"+#( /"4*"1)0&7 2#$# /&1%$#/ #$)4#(&19# (#1%#/ /&1%%&
)
:;;C =
D"4'#(#4$#1
)4#
/"4("+)/7
*"1).&(
/"4/#4&$
*"4)+#0#1 0#4%# 6+.&%#(& 2"1%%)1#$#1 2"/6'"
1EF
)1/)$
(>&+#461&7
2"1%$.#(&?&$#(&$#1
Naive Bayes Classification.
GHIHJKL MKJKNKO
D"4'#(#4$#1
.#/#4
+".#$#1%
*"42#(#.#0#1 ("+#%#& +"4&$)/
/"4("+)/7
2#$#
'#*#/
'&*"46."0
4)2)(#1
:
Naive Bayes?
KORPORASI DI INDONESIA MENGGUNAKAN
METODE NAIVE BAYES CLASSIFICATION
SKRIPSI
Disusun Oleh :
KHOTIMATUS SHOLIHAH
24010212140078
JURUSAN STATISTIKA
FAKULTAS SAINS DAN MATEMATIKA
UNIVERSITAS DIPONEGORO
SEMARANG
2016
KLASIFIKASI PERUBAHAN HARGA OBLIGASI KORPORASI
DI INDONESIA MENGGUNAKAN METODE NAIVE BAYES
CLASSIFICATION
nOl :
D su
KHOTIMATUS SHOLIHAH
24010212140078
D ajukan Sebagai Salah Satu Syarat untuk Memperoleh
Gelar Sarjana pada Jurusan Statistika
JURUSAN STATISTIKA
FAKULTAS SAINS DAN MATEMATIKA
UNIVERSITAS DIPONEGORO
SEMARANG
2016
i
Alhamdulillah, segala puji hanya milik Allah SWT, karena hanya limpahan rahmat dan
karuniaNya penulis mampu menyelesaikan Tugas Akhir yang berjudul
H
!"
ve Bayes Classification .
Pada kesempatan ini penulis ingin mengucapkan terima kasih kepada:
1. Ibu Dra. Dwi Ispriyanti, M.Si, selaku Ketua Jurusan Statistika Fakultas Sains dan Matematika
Universitas Diponegoro.
2. Ibu Di Asih I Maruddani, S.Si, M.Si selaku dosen pembimbing I dan Bapak Abdul Hoyyi,
S.Si., M.Si selaku dosen pembimbing II, yang telah memberikan bimbingan dan pengarahan
dalam penulisan tugas akhir ini.
3. Bapak/Ibu dosen Jurusan Statistika Fakultas Sains dan Matematika yang telah memberikan
ilmu yang bermanfaat.
4. Kedua orang tua yang selalu memberikan dukungan, do a, dan tidak pernah lelah mendidik
serta memberi cinta yang tulus dan iklas semenjak kecil.
5. Semua pihak yang telah memberikan bantuan dalam menyelesaikan tugas akhir ini yang tidak
dapat penulis sebutkan satu per satu.
Penulis menyadari bahwa laporan ini masih jauh dari sempurna. Oleh karena itu, kritik
dan saran yang membangun sangat penulis harapkan.
Semarang, Maret 2016
Penulis
iv
$%&'($)
*+,-./0- /1/,/2 034/5 35/6. 7/6.8/ 9:6:6./2 -panjang yang dapat dipindahtangankan
berisi janji dari pihak penerbit untuk membayar imbalan berupa bunga pada periode tertentu dan
melunasi pokok utang pada waktu yang telah ditentukan kepada pihak pembeli obligasi. Harga
obligasi yang mengalami perubahan setiap waktu dapat menguntungkan atau merugikan
investor. Investor hendaknya mengetahui kondisi terbaik untuk membeli obligasi dengan harga
diskon, atau menjual obligasi dengan harga premium. Dengan mengklasifikasikan perubahan
harga obligasi dapat membantu investor untuk mendapatkan return yang optimal. Salah satu
metode klasifikasi adalah Naive Bayes. Secara teori, metode tersebut mempunyai error yang
minimum dibandingkan metode klasifikasi yang lain. Bayes merupakan teknik prediksi berbasis
probabilistik sederhana yang berdasar pada penerapan teorema Bayes dengan asumsi
independensi yang kuat. Sebelum dilakukan klasifikasi, diperlukan preprocessing data yang
merupakan tahapan pemilihan fitur. Dalam hal ini dilakukan uji Mann Whitney untuk memilih
fitur yang independen tiap kelasnya. Teknik validasi yang digunakan adalah k-fold cross
validation. Berdasarkan hasil analisis, diperoleh akurasi rata-rata sebesar 78,52% dan error
21,48%. Dengan akurasi yang cukup tinggi dan error yang cukup rendah, hal ini dapat diartikan
bahwa metode Naive Bayes bekerja cukup baik dalam mengklasifikasi perubahan harga obligasi
korporasi di Indonesia.
Kata kunci : obligasi, klasifikasi, k-fold cross validation, Naive Bayes
#
;?;@>
-
ABCD EF G HIDEJH KBCL MINH DIOM FIPJNEMEIF QREPR PGC OI FBKD GCD PBCMGECF G SKIDLI TNBH
MRI EFFJIN MB SGU ECMINIFM TBN G PINMGEC SINEBD GCD NISGUHICM BT MRI SNECPESGK DIOM GM G FSIPETEID
MEHI
MB
MRI
OBCDF
.
OJUIN
.
ABCDF
SNEPI
PRGCLIF
GCU
MEHI
,
EM
PBJKD
OI
OICITEPEGK
BN
LEVI
DEFGDVGCMGLI MB ECVIFMBNF WCVIFMBNF FRBJKD XCBQ MRI OIFM PBCDEMEBCF MB OJU OBCDF BC G DEFPBJCM
.
,
,
BN FIKK MRIH GM G SNIHEJH SNEPI AU PKGFFETU MRI PRGCLECL BT OBCDF SNEPI EM PBJKD RIKS ECVIFMBNF
,
MB LGEC BSMEHJH NIMJNCY ZCI HIMRBD EF [GEVI AGUIF PKGFFETEPGMEBCY WC MRIBNU WM RGF MRI HECEHJH
INNBN NGMI EC PBHSGNEFBC MB GKK BMRIN PKGFFETEINF
MIPRCE\JI
QREPR
GFFJHSMEBCF
.
OGFID
BC
MRI
AITBNI PKGFFETUECL
,
GSSKEPGMEBC
.
-
AGUIF EF G FEHSKI SNBOGOEKEFMEP OGFID SNIDEPMEBC
BT
AGUIF
MRIBNIH
QEMR
FMNBCL
ECDISICDICPI
SNISNBPIFFECL DGMG EF NI\JENID GF G FMGLI TIGMJNI FIKIPMEBCY WC
, MRI ]GCC ^REMCIU MIFM PGC OI DBCI MB PRBBFI MRI ECDISICDICM TIGMJNIF BT IGPR PKGFF.
VGKEDGMEBC MIPRCEque in use is k-fold cross validation. Based on analysis, we gained average
accuracy at 78,52% and 21,8% error. With high accuracy and quite low error, it means that the
Naïve Bayes method works quite well on classifying the corporate bonds price changes in
Indonesia.
MREF PGFI
Keywords: bonds, classification, k-fold cross validation, Naive Bayes
vi
abcdbe fgf
l mn
hiii
AlAm nopok qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq
`
AlAm rsmtsuAhjm v qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq
``
AlAm rsmtsuAhjm vv qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq
```
hjk
hjk
hjk
wjxj rsmtjmx
Ay qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq
v
`
AzuxyAw qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq
v
AzuxyACxqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq
_`
DA{xjy vuvqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq
_``
EL...................................................................................
x
DAFTAR GAMBAR ..............................................................................
xi
DAFTAR LAMPIRAN...........................................................................
xii
DAFTAR ISTILAH ...............................................................................
xiii
pj{xjy xjz
BAB I PENDAHULUAN
1.1
Latar Belakang...................................................................
1
1.2
Rumusan Masalah..............................................................
4
1.3
Batasan Masalah ................................................................
5
1.4
Tujuan Penelitian ...............................................................
5
BAB II TINJAUAN PUSTAKA
2.1
Pasar Modal .......................................................................
6
2.2
Investasi .............................................................................
7
2.3
Pengertian Obligasi............................................................
7
_``
2~
}} }}
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
9
2.5
Pendapatan Obligasi ..........................................................
11
2.6
Peringkat Obligasi Perusahaan ..........................................
12
2.7
Konsep Klasifikasi.............................................................
13
2.8
Probabilitas ........................................................................
14
2.9
Classifier.......................................................
16
2.10 Karakteristik Naive Bayes .................................................
20
2.11 Pemilihan Fitur (Variabel) Berbasis Statistik ....................
21
2.12 Teknik Validasi Model ......................................................
22
2.13 Pengukuran Kinerja Klasifikasi.........................................
23
r
rst
s
BAB III METODOLOGI PENELITIAN
3.1
Sumber Data ......................................................................
24
3.2
Variabel Penelitian ............................................................
24
3.3
Tahapan Analisis ...............................................................
26
3.4
Diagram Alir Analisis........................................................
27
BAB IV HASIL DAN PEMBAHASAN
4.1
Deskripsi Data ...................................................................
4.2
Hubungan Antara Fitur dengan Perubahan
28
Harga Obligasi ...................................................................
30
4.3
Pemilihan Fitur Berbasis Statistik .....................................
34
4.4
Teknik Validasi Model ......................................................
40
4.5
Pengukuran Kinerja Klasifikasi.........................................
47
|}}}
BAB V PENUTUP
1.1
Kesimpulan ........................................................................
55
1.2
Saran ..................................................................................
56
DAFTAR PUSTAKA .............................................................................
57
LAMPIRAN............................................................................................
59
x
Hlmn
.................................................
¯°
C³´µ¶·¸³´ ¥¨§ ¹«¬¤º¤§¬¤ » ¹¢«¬ ......................
°¼
.......................................................
°¿
4 À¥¦§ Á§¨ ©ª«¤¦¬¤ ..........................................................
°Â
5 ¡¢£¤¥¦§¨ ©ª«¤¦¬¤ ....................................................................
°Â
¡¢£¤¥¦§¨ ©ª«¤¦¬¤ ¡¢£¬®¥
± ²¨£¤§¬
.
½ ¡¢£ª®¥ ¾£¦ ©ª«¤¦¬¤
,
Yield ...............................
¼É
.................
¼É
8 Ƥ«¤ ÆÅǤ¥« È¢¥¦¥ ¡¢£ª®¥ ¾£¦ ©ª«¤¦¬¤ ...................
¼¼
Yield È¢¥¦¥ ¡¢£ª®¥ ¾£¦ ©ª«¤¦¬¤ ..................................
¼¼
à ¹ÄÅ¥ ©ª«¤¦¬¤ Ƥ«¤ ÆÅǤ¥« È¥
Ê ¹ÄÅ¥ ©ª«¤¦¬¤ È¢¥¦¥ ¡¢£ª®¥ ¾£¦ ©ª«¤¦¬¤
Ë
Ì »¨
Training §¢¨¤§ k Í ¯ ÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎ
ÏÉ
Ȭ
Testing §¢¨¤§ k Í ¯ÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎ
ϯ
± ÀÇ«® »¨
Training ¡¢£ ¹¢«¬
ÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎ
ϯ
Training ..........................
ϼ
Training..................................
ϼ
Ñ ²¨£¤§¬
Confusion ¥¨§ »¨ Testing k Í ¯ ÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎ
Ï¿
à ²¨£¤§¬
Confusion ¥¨§ »¨ Testing k Í ° ÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎ
ÏÂ
Ê ²¨£¤§¬
Confusion ¥¨§ »¨ Testing k Í ¼ ÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎ
ÒÉ
Ó ²¨£¤§¬
Confusion ¥¨§ »¨ Testing k Í Ï ÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎ
Ò¯
Ë ²¨£¤§¬
Confusion ¥¨§ »¨ Testing k Í Ò ÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎ
Ò°
±Ì ²¨£¤§¬
Confusion ¥¨§ »¨ Testing k Í Ô ÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎ
Ò¼
½ À¥¦§ Á§¨ ©ª«¤¦¬¤ ÄÈ »¨
Ð ¡¢£¤¥¦§¨ ©ª«¤¦¬¤ ÄÈ »¨
x
ÕÖרÖÙ ÚÖÛÜÖÙ
ÝÞßÞàÞá
Úâãäâå
1æ çèÞéêÞà ëßèê ëáÞßèìèì
Úâãäâå
2æ ðÞáéñÞ òÞñóô õößèéÞìè ÷øáéÞá ùøêôöÞúÞá ÝÞêéÞ
ííííííííííííííííííííííííííííííííííííííííííííííííííííííííí
îï
õößèéÞìè íííííííííííííííííííííííííííííííííííííííííííííííííííííííííííííííííííííííííííííííí
ûü
Úâãäâå ýæ ùøêèáéñÞó õößèéÞìè ÷øáéÞá ùøêôöÞúÞá ÝÞêéÞ õößèéÞìè íííííííí
ûî
xi
1
ÿ
ÿ
ÿ
ÿ
! " # $%
ÿ
&'"
" (%)* + + ) ""
" (%)* ++++++++++++++++++++++++++ *,
2 Syntax Uji Mann-Whitney +++++++++++++++++++++++++++++++++++++++++++++++++ -%
. // 01
ÿ
Mann-Whitney ++++++++++++++++++++++++++++++++++++++++++++++++
-$
2 Syntax 3" " Naive Bayes 3"/4 #"4 4
ÿ
5
ÿ
ÿ
K-Fold Cross Validation +++++++++++++++++++++++++++++++++++
-*
6 // 3" " Naive Bayes +++++++++++++++++++++++++++++++++++++++++++++ - 7 #" &
8 ++++++++++++++++++++++++++++++++++++++++++++++++++++++ 9%
þÿÿ
?=@ AB?AC=D
At discount bond
EFGH;I; H; JKGK LKMNK OKIKM FPQ;NKI; QRP;L MRGHKL HKM; G;QK;
GFJ;GKQGSK
At premium bond
EFGH;I; H; JKGK LKMNK OKIKM FPQ;NKI; QRP;L T;GNN; HKM; G;QK;
GFJ;GKQGSK
Fixed rate bond
URG;I FPQ;NKI; SKGN JRJPRM;VKG T;GNVKT IWVW PWGNK TRTKO
IKJOK; ORM;FHR XKTWL TRJOF
YKMNK OKIKM
YKMNK XWKQZPRQ; SKGN PRMQKVW H; OKIKM KTKW SKGN TRMXKH; H;
[WMIK \]RV
Issuer
^;LKV SKGN JRGK_KMVKG FPQ;NKI;
EWOFG
`;GNVKT IWVW PWGNK KTKW ORGHKOKTKG KTKI ORJPRQ;KG FPQ;NKI;a
H;PKSKMVKG IRT;KO IRJRITRMKG KTKW TM;_WQKG
Maturity date
`KGNNKQ XKTWL TRJOF HKG LKMWI H;QWGKI;GSK OFVFV HKM; IWMKT
WTKGN
b;QK; GFJ;GKQ
YKMNK SKGN H;PRM;VKG HKG TRMTWQ;I OKHK FPQ;NKI; KTKW IKLKJ
cPQ;NKI;
dWMKT WTKGN XKGNVK JRGRGNKLZOKGXKGN SKGN HKOKT
H;O;GHKLTKGNKGVKG SKGN PRM;I; XKGX; HKM; O;LKV SKGN
JRGRMP;TVKG WGTWV JRJPKSKM ;JPKQKG PRMWOK PWGNK OKHK
ORM;FHR TRMTRGTW HKG JRQWGKI; OFVFV WTKGN OKHK _KVTW SKGN
:;;;
ghijk lfghmgnojm ohpjlj pfkjo phqrhif sriftjuf ghvuhrng
wriftjuf
wriftjuf yjmt lfohinjvojm sihk phqhvfmgjk jgjn phvuhvsjm
xsvpsvjuf
ljijq vjmtoj qhqhmnkf ugvnognv phvqsljijm
zhvfmtojg
xslh yjmt lfrjonojm nmgno qhmnm{noojm onjifgju unjgn unvjg
sriftjuf
ngjmt yjmt phmhgjpjmmyj lfijonojm sihk ihqrjtj
phqhvfmtojg h|ho
Return
}jrj jgju unjgn fm~hugjuf yjmt rfjujmyj lfmyjgjojm uhrjtjf
gjvf| phvuhmgjuh gjknmjm
Yield
zhmljpjgjmohnmgnmtjm jgju fm~hugjuf yjmt lfghvfqj sihk
fm~hugsv
Yield to maturity
fmtojg phmljpjgjm yjmt jojm lfghvfqj sihk fm~hugsv rfij
unjgn fm~hugjuf rhv{jmtoj pjm{jmt ljm rhvrnmtj uhphvgf
sriftjuf lfufqpjm ujqpjf {jgnk ghqps
efff
1
¡ ¢u£ £¤ ¥ ¦ §¨¡¢¡§ ¦¤ © ¤ª y
¢§¦¥ ¡¦§¥§¢« ¬¤ ¤¥¡y ¦§£ª¥ ¢ ¥ £¤¦¡¥ ¥¦
¥ ¡¦§£§® ¦§ ¡§ ¯¢¥ ¦£§ ¡ £ ¤§y ¡§
¦ ¥ « ° £ ¦£§ ¤ £ ¢§¦¥ ¥§ ¡¤y ¦§¦¤¥ ¢ ¥
« ±¤ª ¡ §¢ ® £¤u¦ ¡ª y ¡ ª ²uns ª unt ¥
m
r ª¥n ¦
sr r ¦§r ¦¤m
§nvts ¡§ yn um
® y§tu t n
m
syr ¥®t t nm§rntª® ¦n§rm
n¦¨§¡« ¡£ ³¦¤ ¦§¦
¡§ ¡¤ª ¡¢u¡£ ¯¥¢§¯ ¢ ¥ £ ´¢ ¡ ¢u£
(µ³£ ¦ ¥£¢§® ¶··)«
¬£¦©§ ¦ ¸¥ª£ ¦¦§ (¶··) ¹ ¢¥ ªº ¡£ ³¦¤
§¤§¥§ £ ¡£ § £¥³³§ ¡ ¢ £« »¤ §§ ¦§¥£¥ ¡£
³¦¤ ©¤¥ ¦ ¯ ¡§ ¡¥¤§ ¡® ¹§¢ ¯ ¡§ ¥³³§ ¦ ¯ ¡§
¥ « ¡£ ³¦¤ ¦§¥¢¥ §¤§¥§ ¯ ¡§ ¥³³§ ¥£ ¹¦§¥
¯¡§¤§¢¡ ¢ ºª ¹ £¢ ¥ ¦ ¥¢§ ¹§¢ §ª¥ ¹
§¤§¥§ ¥¤§ª ¦ (§¨¡¢³£) ¦ §ª¥ ¹ £¤ ¥ ¦ (¼½½¾¿À)«
¡£ ³¦¤ ¦§¥¢¥ §¤§¥§ ¯ ¡§ ¥ ® ¥£ £§¥
¥ ¥§ ¦ ¥¡¢ £³¤ª §¤ (return) § §¤§¥ ¦®
¡¡ § ¦ ¥£¥¢£§¡¢§¥ §¨¡¢¡§ ¹ ¦§§¤§ª«
Á
ÂÃÄÃÅ ÆÇÈÃÉ ÆÊÅËÌÃÍÃÎ ÄÃÅÃÎÃ ÌÊÆÏÊÎÐËÍ ÆÇÈÃÉ ÈÃÎ ÃÍËÆËÉÃÄÑ ÈÃÎÃ
ÃyÎÒ ÈÑÃÅÃÓÍÃÎÔ ËÎÐËÍ ÆÊÎÑÎÒÍÃÐÍÃÎ ÌÃÅÐÑÄÑÌÃÄÑ ÆÃÄÃyÅÃÍÃÐ ÈÃÉÃÆ ÌÊÎÒÃÅÃÓÃÎ
ÈÃÎà ÒËÎà ÆÊÎËÎÕÃÎÒ ÌÊÆÏÑÃÃyÃÎ ÌÊÆÏÃÎÒËÎÃÎ ÎÃÄÑÇÎÃÉ (ÖÓÆÃÈÔ Á×ר)Ù ÚÑ
ÛÎÈÇÎÊÄÑÃ ÐÊÅÈÃÌÃÐ ÏÊÅÏÃÒÃÑ ÆÃÜÃÆ ÄÊÍËÅÑÐÃÄ ÝÃÎÒ ÈÑÌÊÅÕËÃÉÏÊÉÑÍÃÎ ÈÑ ÈÃÉÃÆ ÌÃÄÃÅ
ÆÇÈÃÉÔ ÄÃÉÃÓ ÄÃÐËÎÝÃ ÃÈÃÉÃÓ ÇÏÉÑÒÃÄÑÙ
ÞÏÉÑÒÃÄÑ ÃÈÃÉÃÓ ÄËÅÃÐ ËÐÃÎÒ ÕÃÎÒÍà ÆÊÎÊÎÒÃÓßÌÃÎÕÃÎÒ ÝÃÎÒ ÈÃÌÃÐ
ÈÑÌÑÎÈÃÓÐÃÎÒÃÎÍÃÎ ÝÃÎÒ ÏÊÅÑÄÑ ÕÃÎÕÑ ÈÃÅÑ ÌÑÓÃÍ ÝÃÎÒ ÆÊÎÊÅÏÑÐÍÃÎ ËÎÐËÍ ÆÊÆÏÃÝÃÅ
ÑÆÏÃÉÃÎ ÏÊÅËÌÃ ÏËÎÒÃ ÌÃÈÃ ÌÊÅÑÇÈÊ ÐÊÅÐÊÎÐË ÈÃÎ ÆÊÉËÎÃÄÑ ÌÇÍÇÍ ËÐÃÎÒ ÌÃÈÃ
àÃÍÐË ÝÃÎÒ ÐÊÉÃÓ ÈÑÐÊÎÐËÍÃÎ ÍÊÌÃÈà ÌÑÓÃÍ ÌÊÆÏÊÉÑ ÇÏÉÑÒÃÄÑ ÐÊÅÄÊÏËÐÙ ÞÏÉÑÒÃÄÑ
ÆÊÆÌËÎÝÃÑ ÍÊËÎÐËÎÒÃÎ ÏÃÑÍ ÏÃÒÑ ÌÊÎÊÅÏÑÐ ÇÏÉÑÒÃÄÑ (áââãäå) ÃÐÃËÌËÎ ÏÃÒÑ ÑÎæÊÄÐÇÅÙ
çÃÒÑ issuer, ÇÏÉÑÒÃÄÑ ÆÊÅËÌÃÍÃÎ ÄÃÉÃÓ ÄÃÐË ÌÑÉÑÓÃÎ ÌÊÎÈÃÎÃÃÎ ÝÃÎÒ ÅÊÉÃÐÑè ÉÊÏÑÓ
ÆËÅÃÓ ÈÑÏÃÎÈÑÎÒÍÃÎ ÈÊÎÒÃÎ ÌÑÎÕÃÆÃÎ ÃÐÃËÌËÎ ÍÅÊÈÑÐ ÏÃÎÍÙ ÚÃÅÑ ÄËÈËÐ ÌÃÎÈÃÎÒ
ÑÎæÊÄÐÇÅÔ ÇÏÉÑÒÃÄÑ ÆÊÅËÌÃÍÃÎ ÃÉÐÊÅÎÃÐÑè ÑÎæÊÄÐÃÄÑ ÝÃÎÒ ÃÆÃÎ ÍÃÅÊÎà ÊèÊÍ ÏÊÅÄÑèÃÐ
ËÐÃÎÒ ÑÎÑ ÆÊÆÏÊÅÑÍÃÎ ÌÊÎÒÓÃÄÑÉÃÎ ÐÊÐÃÌ ÏÊÅËÌÃ ÍËÌÇÎ ÈÃÎ ÌÇÍÇÍ ËÐÃÎÒ ÌÃÈÃ
àÃÍÐË ÕÃÐËÓ ÐÊÆÌÇ ÝÃÎÒ ÐÊÉÃÓ ÈÑÐÊÎÐËÍÃÎ (éÑÕÃÝÃÎÐÇÔ Á×êë)Ù
ìÃÆËÎ ÈÊÆÑÍÑÃÎÔ ÇÏÉÑÒÃÄÑ ÐÊÐÃÌ ÆÊÆÑÉÑÍÑ ÅÑÄÑÍÇ ÄÊÏÃÒÃÑÆÃÎà ÑÎÄÐÅËÆÊÎ
ÑÎæÊÄÐÃÄÑ ÉÃÑÎÎÝÃÙ íÊÉÃÑÎ ÆÊÆÑÉÑÍÑ ÈÃÎà ÝÃÎÒ ÃÍÃÎ ÈÑÑÎæÊÄÐÃÄÑÍÃÎÔ ÄÊÇÅÃÎÒ
ÑÎæÊÄÐÇÅ ÕËÒà ÓÊÎÈÃÍÎÝà ÆÊÆÌËÎÝÃÑ ÌÊÎÒÊÐÃÓËÃÎ ÝÃÎÒ ÜËÍËÌ ÐÊÎÐÃÎÒ ÇÏÉÑÒÃÄÑÙ
íÊÌÊÅÐÑ ÓÃÉÎÝà ÑÎÄÐÅËÆÊÎ ÑÎæÊÄÐÃÄÑ ÉÃÑÎÎÝÃÔ ÇÏÉÑÒÃÄÑ ÕËÒà ÆÊÎÒÃÉÃÆÑ
ÌÊÅËÏÃÓÃÎ ÈÃÉÃÆ ÓÃÅÒÃÙ ÖÈà ÏÃÎÝÃÍ èÃÍÐÇÅ ÝÃÎÒ ÆÊÆÌÊÎÒÃÅËÓÑ ÌÊÅËÏÃÓÃÎ ÓÃÅÒÃ
ÇÏÉÑÒÃÄÑÙ îÃÏÇïzÑ (Á×××) ÆÊÎÝÊÏËÐÍÃÎ ÏÃÓàà èÃÍÐÇÅ ÝÃÎÒ ÆÊÆÌÊÎÒÃÅËÓÑ
ÌÊÅËÏÃÓÃÎ ÓÃÅÒà ÇÏÉÑÒÃÄÑ ÃÈÃÉÃÓ ÍËÌÇÎÔ ÕÃÎÒÍà àÃÍÐË ÕÃÐËÓ ÐÊÆÌÇ ÈÃÎ ÐÑÎÒÍÃÐ
ÓÃÄÑÉ ÈÑ ÆÃÎÃ ÇÏÉÑÒÃÄÑ ÈÑÌÊÅÈÃÒÃÎÒÍÃÎ
(yield).
ðÊÎËÅËÐ ñËÏÑÅ (Á×êÁ)Ô ÈÃÉÃÆ
ò
óôóõöõ÷ øùöõúûüõ üôùûúûõ õýþôüÿûüõ û û ùôùô û û û ÿø ûyýú
õ ô ÿõóùûýú ûý õ ûýÿû ûýûy ô õýú ûÿ øùöõúûüõ ô õø ô ôóùûûy ûý
t t
ty
øý ûý
ôý ÿ ýø ûúû ûý û û ÿõ (
ô öu
)
øùöõúûüõ û û ûýú õüôù ÿ øùöõúûüõ
ôýúûý ôóõ ó (at premium bond) ûõÿ øý õüõ õ óûýû ÷û úû ûüû øùöõúûüõ
öôùõ÷ ÿõýúúõ õ ûÿûü ýõöûõ ýøóõýûöý û û û
öû ûýú õüôù ÿ øùöõúûüõ ôýúûý
õü øý (at discount bond), ûõÿ øý õüõ õ óûýû ÷û úû ûüû øùöõúûüõ ùô û û õ
ùû û÷ ýõöûõ ýøóõýûöý û
û úû øùöõúûüõ
ûýú óôýúûöûóõ
ô ùû÷ûý üôÿõû
ûÿ
û ûÿ
óôýú ýÿ ýú ûý ûÿû óô úõ ûý õýþôüÿø ýþôüÿø ÷ôý û ý û óôýúôÿû÷ õ øý õüõ
ÿô ùûõ
ýÿ
óôóùôöõ øùöõúûüõ ôýúûý ÷û úû õü øý ûÿû óôý ûö øùöõúûüõ
ôýúûý ÷û úû ôóõ ó
ôýúûý óôýú öûüõ õ ûüõ ûý ô ùû÷ûý ÷û úû øùöõúûüõ
û ûÿ óôóùûýÿ õýþôüÿø ýÿ óôý û ûÿ ûý return ûýú ø ÿõóûö
ûÿû óõýõýú û ûöû÷ ôúõûÿûý óôöõ ÿõ ôýú ó öûý ôóû ûõûý ûÿû
÷õüÿø õü ýÿ
ùô
ûý ùôüû
(ûýÿøüû
)
Naive Bayes
û ùûý û óôÿø ô öûüõ õ ûüõ ûöûó ûÿû
Naive Bayes
ôÿø ô
ûüôÿ ø
(ò) Naive Bayes
óô û ûý ÿô ýõ
óô û ûý óôÿø ô
ôýú öûüõ õ ûüõûý ûýú ÿô ôýûö ôýúûý ÿõýú ûÿ ôû ûÿûý ûýú ùûõ
óôýôó ûý ôÿô ûÿ ûý øöû ûÿû ÷ ù ýúûý ûöûó üôÿ ûÿû
óõýõýú ûýÿû û öûõý
ôý ÿ
ô õ üõ ùô ùûüõü øùûùõöõüÿõ
üô ô ÷ûýû ûýú ùô ûüû û û ôýô û ûý ÿôø ôóû û ôü (ûÿ ûý û ôü) ôýúûý
ûü óüõ õý ô ôý ôýüõ ( ôÿõ û ÿô úûýÿ ýúûý) ûýú
()
ü öõÿ õ ôý ÷õ ûöûó
ýõû ý ûÿû û ûý ÿôÿû õ ûöûó û ÿõ ý û óûüõ÷ ùô ýúüõ ôýúûý ùûõ
ûÿ (ýûõ ) õùû øýõ
óôý ûÿû ûý ùû÷ û óôü õ ý ûü óüõ õý ô ôý ôýüõ
!
Naive Bayes m
pr#$#n#%l &o
r#tm #yn% t"#m
r su
k'##l m$#t"%&o
r
"u
eager
learner, #y&tu'&'"(#&nun
tk"m#l $)$#n*"m
+#,##n-*".#/&0#1-*"2+".#3#4#1 *#'#
'#/# .#/&0 )1/)$ '#*#/ 2"2"/#$#1 '"1%#1 +"1#4 ("/* 5"$/64 2#()$#1 $" .#+".
$".#(
y
$".)#4#11#
("0&1%%#
'&
#$0&4
2".#$)$#1 *"2"/##1 '"1%#1 +"1#4
*46("(
*"
.#/&0#17
26'".
()'#0
'#*#/
(84#("/967 :;",#4# /"64&7 2"/6'" $.#(&?&$#(&
Naive Bayes
2"2*)19#&
(@#1
2&1&2)2 '&+#1'&1%$#1 2"/6'" $.#(&?&$#(& 9#1% .#&1
'#1
error rate
K#2+"47
9#1%
)
:;;A =
>".#&1 &/)7 '&+#1'&1%$#1 '"1%#1 *"1%$.#(&?&$#( 2"1%%)1#$#1 4"%4"(& .6%&(/&$7
2"/6'"
Naive Bayes /&'#$ 2"2"4.)$#1 *"1%)3 (/#/&(/&$ ("*"4/& )3& (&%1&?&$#1(&=
B"/6'"
K"."+&0#1
Naive Bayes
2"4)*#$#1 2"/6'" 9#1% 2)'#0 '&&2*."2"1/#(&$#1=
.#&1 2"/6'" &1& #'#.#0 '#*#/ 2"1#1%#1&
missing value,
'#1 #*#+&.#
#()2(& (#.&1% +"+#( /"4*"1)0&7 2#$# /&1%$#/ #$)4#(&19# (#1%#/ /&1%%&
)
:;;C =
D"4'#(#4$#1
)4#
/"4("+)/7
*"1).&(
/"4/#4&$
*"4)+#0#1 0#4%# 6+.&%#(& 2"1%%)1#$#1 2"/6'"
1EF
)1/)$
(>&+#461&7
2"1%$.#(&?&$#(&$#1
Naive Bayes Classification.
GHIHJKL MKJKNKO
D"4'#(#4$#1
.#/#4
+".#$#1%
*"42#(#.#0#1 ("+#%#& +"4&$)/
/"4("+)/7
2#$#
'#*#/
'&*"46."0
4)2)(#1
:
Naive Bayes?