KLASIFIKASI PERUBAHAN HARGA OBLIGASI KORPORASI DI INDONESIA MENGGUNAKAN METODE NAIVE BAYES CLASSIFICATION - Diponegoro University | Institutional Repository (UNDIP-IR)

KLASIFIKASI PERUBAHAN HARGA OBLIGASI
KORPORASI DI INDONESIA MENGGUNAKAN
METODE NAIVE BAYES CLASSIFICATION

SKRIPSI

Disusun Oleh :
KHOTIMATUS SHOLIHAH
24010212140078

JURUSAN STATISTIKA
FAKULTAS SAINS DAN MATEMATIKA
UNIVERSITAS DIPONEGORO
SEMARANG
2016

KLASIFIKASI PERUBAHAN HARGA OBLIGASI KORPORASI
DI INDONESIA MENGGUNAKAN METODE NAIVE BAYES
CLASSIFICATION

nOl :

D su
KHOTIMATUS SHOLIHAH
24010212140078

D ajukan Sebagai Salah Satu Syarat untuk Memperoleh
Gelar Sarjana pada Jurusan Statistika

JURUSAN STATISTIKA

FAKULTAS SAINS DAN MATEMATIKA
UNIVERSITAS DIPONEGORO
SEMARANG
2016

i

  


Alhamdulillah, segala puji hanya milik Allah SWT, karena hanya limpahan rahmat dan

karuniaNya penulis mampu menyelesaikan Tugas Akhir yang berjudul
H   



  
     !"



   

ve Bayes Classification .

Pada kesempatan ini penulis ingin mengucapkan terima kasih kepada:
1. Ibu Dra. Dwi Ispriyanti, M.Si, selaku Ketua Jurusan Statistika Fakultas Sains dan Matematika
Universitas Diponegoro.
2. Ibu Di Asih I Maruddani, S.Si, M.Si selaku dosen pembimbing I dan Bapak Abdul Hoyyi,
S.Si., M.Si selaku dosen pembimbing II, yang telah memberikan bimbingan dan pengarahan
dalam penulisan tugas akhir ini.

3. Bapak/Ibu dosen Jurusan Statistika Fakultas Sains dan Matematika yang telah memberikan
ilmu yang bermanfaat.
4. Kedua orang tua yang selalu memberikan dukungan, do a, dan tidak pernah lelah mendidik
serta memberi cinta yang tulus dan iklas semenjak kecil.
5. Semua pihak yang telah memberikan bantuan dalam menyelesaikan tugas akhir ini yang tidak
dapat penulis sebutkan satu per satu.
Penulis menyadari bahwa laporan ini masih jauh dari sempurna. Oleh karena itu, kritik
dan saran yang membangun sangat penulis harapkan.
Semarang, Maret 2016
Penulis

iv

$%&'($)

*+,-./0- /1/,/2 034/5 35/6. 7/6.8/ 9:6:6./2 -panjang yang dapat dipindahtangankan
berisi janji dari pihak penerbit untuk membayar imbalan berupa bunga pada periode tertentu dan
melunasi pokok utang pada waktu yang telah ditentukan kepada pihak pembeli obligasi. Harga
obligasi yang mengalami perubahan setiap waktu dapat menguntungkan atau merugikan
investor. Investor hendaknya mengetahui kondisi terbaik untuk membeli obligasi dengan harga

diskon, atau menjual obligasi dengan harga premium. Dengan mengklasifikasikan perubahan
harga obligasi dapat membantu investor untuk mendapatkan return yang optimal. Salah satu
metode klasifikasi adalah Naive Bayes. Secara teori, metode tersebut mempunyai error yang
minimum dibandingkan metode klasifikasi yang lain. Bayes merupakan teknik prediksi berbasis
probabilistik sederhana yang berdasar pada penerapan teorema Bayes dengan asumsi
independensi yang kuat. Sebelum dilakukan klasifikasi, diperlukan preprocessing data yang
merupakan tahapan pemilihan fitur. Dalam hal ini dilakukan uji Mann Whitney untuk memilih
fitur yang independen tiap kelasnya. Teknik validasi yang digunakan adalah k-fold cross
validation. Berdasarkan hasil analisis, diperoleh akurasi rata-rata sebesar 78,52% dan error
21,48%. Dengan akurasi yang cukup tinggi dan error yang cukup rendah, hal ini dapat diartikan
bahwa metode Naive Bayes bekerja cukup baik dalam mengklasifikasi perubahan harga obligasi
korporasi di Indonesia.

Kata kunci : obligasi, klasifikasi, k-fold cross validation, Naive Bayes

#

;?;@>

-


ABCD EF G HIDEJH KBCL MINH DIOM FIPJNEMEIF QREPR PGC OI FBKD GCD PBCMGECF G SKIDLI TNBH
MRI EFFJIN MB SGU ECMINIFM TBN G PINMGEC SINEBD GCD NISGUHICM BT MRI SNECPESGK DIOM GM G FSIPETEID
MEHI

MB

MRI

OBCDF

.

OJUIN

.

ABCDF

SNEPI


PRGCLIF

GCU

MEHI

,

EM

PBJKD

OI

OICITEPEGK

BN

LEVI


DEFGDVGCMGLI MB ECVIFMBNF WCVIFMBNF FRBJKD XCBQ MRI OIFM PBCDEMEBCF MB OJU OBCDF BC G DEFPBJCM

.

,

,

BN FIKK MRIH GM G SNIHEJH SNEPI AU PKGFFETU MRI PRGCLECL BT OBCDF SNEPI EM PBJKD RIKS ECVIFMBNF

,

MB LGEC BSMEHJH NIMJNCY ZCI HIMRBD EF [GEVI AGUIF PKGFFETEPGMEBCY WC MRIBNU WM RGF MRI HECEHJH
INNBN NGMI EC PBHSGNEFBC MB GKK BMRIN PKGFFETEINF
MIPRCE\JI

QREPR

GFFJHSMEBCF


.

OGFID

BC

MRI

AITBNI PKGFFETUECL

,

GSSKEPGMEBC

.

-

AGUIF EF G FEHSKI SNBOGOEKEFMEP OGFID SNIDEPMEBC

BT

AGUIF

MRIBNIH

QEMR

FMNBCL

ECDISICDICPI

SNISNBPIFFECL DGMG EF NI\JENID GF G FMGLI TIGMJNI FIKIPMEBCY WC

, MRI ]GCC ^REMCIU MIFM PGC OI DBCI MB PRBBFI MRI ECDISICDICM TIGMJNIF BT IGPR PKGFF.
VGKEDGMEBC MIPRCEque in use is k-fold cross validation. Based on analysis, we gained average
accuracy at 78,52% and 21,8% error. With high accuracy and quite low error, it means that the
Naïve Bayes method works quite well on classifying the corporate bonds price changes in
Indonesia.


MREF PGFI

Keywords: bonds, classification, k-fold cross validation, Naive Bayes

vi

abcdbe fgf

l mn

hiii

AlAm nopok qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq

`

AlAm rsmtsuAhjm v qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq

``


AlAm rsmtsuAhjm vv qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq

```

hjk

hjk

hjk

wjxj rsmtjmx

Ay qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq

v

`

AzuxyAw qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq

v

AzuxyACxqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq

_`

DA{xjy vuvqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq

_``

EL...................................................................................

x

DAFTAR GAMBAR ..............................................................................

xi

DAFTAR LAMPIRAN...........................................................................

xii

DAFTAR ISTILAH ...............................................................................

xiii

pj{xjy xjz

BAB I PENDAHULUAN
1.1

Latar Belakang...................................................................

1

1.2

Rumusan Masalah..............................................................

4

1.3

Batasan Masalah ................................................................

5

1.4

Tujuan Penelitian ...............................................................

5

BAB II TINJAUAN PUSTAKA
2.1

Pasar Modal .......................................................................

6

2.2

Investasi .............................................................................

7

2.3

Pengertian Obligasi............................................................

7

_``

2~

€‚ƒ„}}‚ …†‡}ˆ}

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

9

2.5

Pendapatan Obligasi ..........................................................

11

2.6

Peringkat Obligasi Perusahaan ..........................................

12

2.7

Konsep Klasifikasi.............................................................

13

2.8

Probabilitas ........................................................................

14

2.9

‰Š‹Œ ŽŠ

Classifier.......................................................

16

2.10 Karakteristik Naive Bayes .................................................

20

2.11 Pemilihan Fitur (Variabel) Berbasis Statistik ....................

21

2.12 Teknik Validasi Model ......................................................

22

2.13 Pengukuran Kinerja Klasifikasi.........................................

23

r

rst

s

BAB III METODOLOGI PENELITIAN
3.1

Sumber Data ......................................................................

24

3.2

Variabel Penelitian ............................................................

24

3.3

Tahapan Analisis ...............................................................

26

3.4

Diagram Alir Analisis........................................................

27

BAB IV HASIL DAN PEMBAHASAN
4.1

Deskripsi Data ...................................................................

4.2

Hubungan Antara Fitur dengan Perubahan

28

Harga Obligasi ...................................................................

30

4.3

Pemilihan Fitur Berbasis Statistik .....................................

34

4.4

Teknik Validasi Model ......................................................

40

4.5

Pengukuran Kinerja Klasifikasi.........................................

47

|}}}

BAB V PENUTUP
1.1

Kesimpulan ........................................................................

55

1.2

Saran ..................................................................................

56

DAFTAR PUSTAKA .............................................................................

57

LAMPIRAN............................................................................................

59

‘

x

’“”•“– •“—˜™

Hšlšmšn
.................................................

¯°

C³´µ¶·¸³´ ­¥¨­§ ¹«š¬¤º¤§š¬¤ »­š ¹¢«š¬ ......................

°¼

.......................................................

°¿

•›œž

4  À𥦧š Á𧍭 ©ª«¤¦š¬¤ ..........................................................

°Â

•›œž

5  ¡¢£¤¥¦§š¨ ©ª«¤¦š¬¤ ....................................................................

°Â

•›œž Ÿ  ¡¢£¤¥¦§š¨ ©ª«¤¦š¬¤ ¡¢£­¬š®šš¥

•›œž ±  ²š¨£¤§¬

.

•›œž ½ ¡¢£­ªš®š¥ ¾š£¦š ©ª«¤¦š¬¤

,

Yield ...............................

¼É

.................

¼É

8  Ƥ«š¤ ÆÅǤ¥š« È¢¥¦š¥ ¡¢£­ªš®š¥ ¾š£¦š ©ª«¤¦š¬¤ ...................

¼¼

Yield È¢¥¦š¥ ¡¢£­ªš®š¥ ¾š£¦š ©ª«¤¦š¬¤ ..................................

¼¼

•›œž à ¹­ÄÅ¥ ©ª«¤¦š¬¤ Ƥ«š¤ ÆÅǤ¥š« Ț¥

•›œž Ê  ¹­ÄÅ¥ ©ª«¤¦š¬¤ È¢¥¦š¥ ¡¢£­ªš®š¥ ¾š£¦š ©ª«¤¦š¬¤

•›œž

•›œž Ë 

•›œž ŸÌ  »š¨š

Training §¢¨¤§š k Í ¯ ÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎ

ÏÉ

•›œž ŸŸ  »š¨š

Testing §¢¨¤§š k Í ¯ÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎ

ϯ

•›œž Ÿ±  À­Ç«š® »š¨š

Training ¡¢£ ¹¢«š¬

ÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎ

ϯ

Training ..........................

ϼ

Training..................................

ϼ

•›œž ŸÑ  ²š¨£¤§¬

Confusion ­¥¨­§ »š¨š Testing k Í ¯ ÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎ

Ï¿

•›œž ŸÃ  ²š¨£¤§¬

Confusion ­¥¨­§ »š¨š Testing k Í ° ÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎ

ÏÂ

•›œž ŸÊ  ²š¨£¤§¬

Confusion ­¥¨­§ »š¨š Testing k Í ¼ ÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎ

ÒÉ

•›œž ŸÓ  ²š¨£¤§¬

Confusion ­¥¨­§ »š¨š Testing k Í Ï ÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎ

Ò¯

•›œž ŸË  ²š¨£¤§¬

Confusion ­¥¨­§ »š¨š Testing k Í Ò ÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎ

Ò°

•›œž ±Ì  ²š¨£¤§¬

Confusion ­¥¨­§ »š¨š Testing k Í Ô ÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎÎ

Ò¼

•›œž Ÿ½  À𥦧š Á𧍭 ©ª«¤¦š¬¤ ĚȚ »š¨š

•›œž ŸÐ  ¡¢£¤¥¦§š¨ ©ª«¤¦š¬¤ ĚȚ »š¨š

x

ÕÖרÖÙ ÚÖÛÜÖÙ

ÝÞßÞàÞá

Úâãäâå

1æ çèÞéêÞà ëßèê ëáÞßèìèì

Úâãäâå

2æ ðÞáéñÞ òÞñóô õößèéÞìè ÷øáéÞá ùøêôöÞúÞá ÝÞêéÞ

ííííííííííííííííííííííííííííííííííííííííííííííííííííííííí

îï

õößèéÞìè íííííííííííííííííííííííííííííííííííííííííííííííííííííííííííííííííííííííííííííííí

ûü

Úâãäâå ýæ ùøêèáéñÞó õößèéÞìè ÷øáéÞá ùøêôöÞúÞá ÝÞêéÞ õößèéÞìè íííííííí

ûî

xi

 

 1       
ÿ

ÿ

ÿ

ÿ





! " #  $%
ÿ

&'"
" (%)* + + ) ""
" (%)* ++++++++++++++++++++++++++ *,
 2 Syntax Uji Mann-Whitney +++++++++++++++++++++++++++++++++++++++++++++++++ -%
 . // 01

ÿ

Mann-Whitney ++++++++++++++++++++++++++++++++++++++++++++++++

-$

 2 Syntax 3" " Naive Bayes 3"/ 4  #"4 4
ÿ

5 
ÿ

ÿ

K-Fold Cross Validation +++++++++++++++++++++++++++++++++++

-*

 6 // 3" " Naive Bayes +++++++++++++++++++++++++++++++++++++++++++++ - 7 # " &
8   ++++++++++++++++++++++++++++++++++++++++++++++++++++++ 9%

þÿÿ

?=@ AB?AC=D

At discount bond

EFGH;I; H; JKGK LKMNK OKIKM FPQ;NKI; QRP;L MRGHKL HKM; G;QK;
GFJ;GKQGSK

At premium bond

EFGH;I; H; JKGK LKMNK OKIKM FPQ;NKI; QRP;L T;GNN; HKM; G;QK;
GFJ;GKQGSK

Fixed rate bond

URG;I FPQ;NKI; SKGN JRJPRM;VKG T;GNVKT IWVW PWGNK TRTKO
IKJOK; ORM;FHR XKTWL TRJOF

YKMNK OKIKM

YKMNK XWKQZPRQ; SKGN PRMQKVW H; OKIKM KTKW SKGN TRMXKH; H;
[WMIK \]RV

Issuer

^;LKV SKGN JRGK_KMVKG FPQ;NKI;

EWOFG

`;GNVKT IWVW PWGNK KTKW ORGHKOKTKG KTKI ORJPRQ;KG FPQ;NKI;a
H;PKSKMVKG IRT;KO IRJRITRMKG KTKW TM;_WQKG

Maturity date

`KGNNKQ XKTWL TRJOF HKG LKMWI H;QWGKI;GSK OFVFV HKM; IWMKT
WTKGN

b;QK; GFJ;GKQ

YKMNK SKGN H;PRM;VKG HKG TRMTWQ;I OKHK FPQ;NKI; KTKW IKLKJ

cPQ;NKI;

dWMKT WTKGN XKGNVK JRGRGNKLZOKGXKGN SKGN HKOKT
H;O;GHKLTKGNKGVKG SKGN PRM;I; XKGX; HKM; O;LKV SKGN
JRGRMP;TVKG WGTWV JRJPKSKM ;JPKQKG PRMWOK PWGNK OKHK
ORM;FHR TRMTRGTW HKG JRQWGKI; OFVFV WTKGN OKHK _KVTW SKGN
:;;;

ghijk lfghmgnojm ohpjlj pfkjo phqrhif sriftjuf ghvuhrng
wriftjuf

wriftjuf yjmt lfohinjvojm sihk phqhvfmgjk jgjn phvuhvsjm

xsvpsvjuf

ljijq vjmtoj qhqhmnkf ugvnognv phvqsljijm

zhvfmtojg

xslh yjmt lfrjonojm nmgno qhmnm{noojm onjifgju unjgn unvjg

sriftjuf

ngjmt yjmt phmhgjpjmmyj lfijonojm sihk ihqrjtj
phqhvfmtojg h|ho

Return

}jrj jgju unjgn fm~hugjuf yjmt rfjujmyj lfmyjgjojm uhrjtjf
gjvf| phvuhmgjuh gjknmjm

Yield

zhmljpjgjmohnmgnmtjm jgju fm~hugjuf yjmt lfghvfqj sihk
fm~hugsv

Yield to maturity

€fmtojg phmljpjgjm yjmt jojm lfghvfqj sihk fm~hugsv rfij
unjgn fm~hugjuf rhv{jmtoj pjm{jmt ljm rhvrnmtj uhphvgf
sriftjuf lfufqpjm ujqpjf {jgnk ghqps

efff

ƒ„ƒ …
†‡ˆ‰„Š‹Œ‹„ˆ

1Ž

‘’ “”•–—˜
™š›œžŸ žž ¡ ¢užšŸ£ ›š›š£¤ ¥ž ¦ž §ž¨š¡¢¡§ ¦¤› © ›¤ª yžŸ

¢§¦¥ ¡š¦§¥§¢« ¬¤› ­š¤¥¡žžžy ¦§£ª¥ž  ž¢ ¥ œš£¤ž¦¡¥ž ¥š­¦
¥š››­ ž ¡šž¦§£§® ¦§ ¡›­§žŸ ›š›ž¯¢¥ž ¦£§ ¡ ›œš£ ¤§žžy ¡šœŸ§
­šž¦ ¥ žŸ« ° ›œš£ ¦£§ ¤ £ ¢§¦¥ › žŸ¥§ž ¡š¤›žy ¦§ž¦¤¥ž  ž¢ ¥
­š›œžŸ žž« ±¤šª ¡šœœ §¢ ® ­š£¤u¦  ¡ª yžŸ ¡ žŸŸ ª ²unsŸŸ ª unt ¥
m
šžŸr ª¥n ¦ž

sr šr ¦§r ¦¤m
§nvšts ¡§ ynŸ œšœum
® y§tu tœ žŸn

m
syr ¥®t tœ žŸn­ššm§rntª® ¦n­šžš§rm

n¦š¨§¡« ™¡£ ›³¦¤ ¦§­ž¦žŸ

¡šœŸ§ ¡¤ª ¡¢u¡£ž š¯š¥¢§¯  ž¢ ¥ ›š›­š£ ´š­¢ ­š›œžŸ žž ¡ ¢užšŸ£
(µž³£Ÿ ¦ž ™¥£¢§® ¶··‚)«

¬£›¦©§ ¦ž ¸¥ª£ ¦¦§ž (¶··‚) ›šž¹šœ ¢¥ž œªº ­¡£ ›³¦¤
›š›§¤§¥§ ­š£ž œš¡£ œŸ§ ­š£š¥³ž³›§ž ¡ ¢  žšŸ£« »¤ §ž§ ¦§¥£šž¥ž ­¡£
›³¦¤ ›šž©¤ž¥ž ¦  ¯ žŸ¡§ ¡š¥¤§Ÿ ¡® ¹§¢  ¯ žŸ¡§ š¥³ž³›§ ¦ž ¯ žŸ¡§
¥š žŸž« ™¡£ ›³¦¤ ¦§¥¢¥ž ›š›§¤§¥§ ¯ žŸ¡§ š¥³ž³›§ ¥£šž ›šž¹š¦§¥ž
¯¡§¤§¢¡ ¢  ºªž ¹žŸ ›š›­š£¢š› ¥ž ¦  ¥š­šž¢§žŸž ¹§¢  ­§ª¥ ¹žŸ
›š›§¤§¥§ ¥š¤šœ§ªž ¦ž (§ž¨š¡¢³£) ¦ž ­§ª¥ ¹žŸ ›š›š£¤ ¥ž ¦ž (¼½½¾¿À)«
™¡£ ›³¦¤ ¦§¥¢¥ž ›š›§¤§¥§ ¯ žŸ¡§ ¥š žŸž® ¥£šž ›š›œš£§¥ž
¥š› žŸ¥§žž ¦ž ¥š¡š›­¢ž ›š›­š£³¤šª §›œ¤ž (return) œŸ§ ­š›§¤§¥ ¦ž®
¡š¡ § ¦šžŸž ¥£¥¢š£§¡¢§¥ §ž¨š¡¢¡§ ¹žŸ ¦§­§¤§ª«

‚

Á

ÂÃÄÃÅ ÆÇÈÃÉ ÆÊÅËÌÃÍÃÎ ÄÃÅÃÎÃ ÌÊÆÏÊÎÐËÍ ÆÇÈÃÉ ÈÃÎ ÃÍËÆËÉÃÄÑ ÈÃÎÃ
ÃyÎÒ ÈÑÃÅÃÓÍÃÎÔ ËÎÐËÍ ÆÊÎÑÎÒÍÃÐÍÃÎ ÌÃÅÐÑÄÑÌÃÄÑ ÆÃÄÃyÅÃÍÃÐ ÈÃÉÃÆ ÌÊÎÒÃÅÃÓÃÎ
ÈÃÎà ÒËÎà ÆÊÎËÎÕÃÎÒ ÌÊÆÏÑÃÃyÃÎ ÌÊÆÏÃÎÒËÎÃÎ ÎÃÄÑÇÎÃÉ (ÖÓÆÃÈÔ Á×ר)Ù ÚÑ
ÛÎÈÇÎÊÄÑÃ ÐÊÅÈÃÌÃÐ ÏÊÅÏÃÒÃÑ ÆÃÜÃÆ ÄÊÍËÅÑÐÃÄ ÝÃÎÒ ÈÑÌÊÅÕËÃÉÏÊÉÑÍÃÎ ÈÑ ÈÃÉÃÆ ÌÃÄÃÅ
ÆÇÈÃÉÔ ÄÃÉÃÓ ÄÃÐËÎÝÃ ÃÈÃÉÃÓ ÇÏÉÑÒÃÄÑÙ
ÞÏÉÑÒÃÄÑ ÃÈÃÉÃÓ ÄËÅÃÐ ËÐÃÎÒ ÕÃÎÒÍà ÆÊÎÊÎÒÃÓßÌÃÎÕÃÎÒ ÝÃÎÒ ÈÃÌÃÐ
ÈÑÌÑÎÈÃÓÐÃÎÒÃÎÍÃÎ ÝÃÎÒ ÏÊÅÑÄÑ ÕÃÎÕÑ ÈÃÅÑ ÌÑÓÃÍ ÝÃÎÒ ÆÊÎÊÅÏÑÐÍÃÎ ËÎÐËÍ ÆÊÆÏÃÝÃÅ
ÑÆÏÃÉÃÎ ÏÊÅËÌÃ ÏËÎÒÃ ÌÃÈÃ ÌÊÅÑÇÈÊ ÐÊÅÐÊÎÐË ÈÃÎ ÆÊÉËÎÃÄÑ ÌÇÍÇÍ ËÐÃÎÒ ÌÃÈÃ
àÃÍÐË ÝÃÎÒ ÐÊÉÃÓ ÈÑÐÊÎÐËÍÃÎ ÍÊÌÃÈà ÌÑÓÃÍ ÌÊÆÏÊÉÑ ÇÏÉÑÒÃÄÑ ÐÊÅÄÊÏËÐÙ ÞÏÉÑÒÃÄÑ
ÆÊÆÌËÎÝÃÑ ÍÊËÎÐËÎÒÃÎ ÏÃÑÍ ÏÃÒÑ ÌÊÎÊÅÏÑÐ ÇÏÉÑÒÃÄÑ (áââãäå) ÃÐÃËÌËÎ ÏÃÒÑ ÑÎæÊÄÐÇÅÙ
çÃÒÑ issuer, ÇÏÉÑÒÃÄÑ ÆÊÅËÌÃÍÃÎ ÄÃÉÃÓ ÄÃÐË ÌÑÉÑÓÃÎ ÌÊÎÈÃÎÃÃÎ ÝÃÎÒ ÅÊÉÃÐÑè ÉÊÏÑÓ
ÆËÅÃÓ ÈÑÏÃÎÈÑÎÒÍÃÎ ÈÊÎÒÃÎ ÌÑÎÕÃÆÃÎ ÃÐÃËÌËÎ ÍÅÊÈÑÐ ÏÃÎÍÙ ÚÃÅÑ ÄËÈËÐ ÌÃÎÈÃÎÒ
ÑÎæÊÄÐÇÅÔ ÇÏÉÑÒÃÄÑ ÆÊÅËÌÃÍÃÎ ÃÉÐÊÅÎÃÐÑè ÑÎæÊÄÐÃÄÑ ÝÃÎÒ ÃÆÃÎ ÍÃÅÊÎà ÊèÊÍ ÏÊÅÄÑèÃÐ
ËÐÃÎÒ ÑÎÑ ÆÊÆÏÊÅÑÍÃÎ ÌÊÎÒÓÃÄÑÉÃÎ ÐÊÐÃÌ ÏÊÅËÌÃ ÍËÌÇÎ ÈÃÎ ÌÇÍÇÍ ËÐÃÎÒ ÌÃÈÃ
àÃÍÐË ÕÃÐËÓ ÐÊÆÌÇ ÝÃÎÒ ÐÊÉÃÓ ÈÑÐÊÎÐËÍÃÎ (éÑÕÃÝÃÎÐÇÔ Á×êë)Ù
ìÃÆËÎ ÈÊÆÑÍÑÃÎÔ ÇÏÉÑÒÃÄÑ ÐÊÐÃÌ ÆÊÆÑÉÑÍÑ ÅÑÄÑÍÇ ÄÊÏÃÒÃÑÆÃÎà ÑÎÄÐÅËÆÊÎ
ÑÎæÊÄÐÃÄÑ ÉÃÑÎÎÝÃÙ íÊÉÃÑÎ ÆÊÆÑÉÑÍÑ ÈÃÎà ÝÃÎÒ ÃÍÃÎ ÈÑÑÎæÊÄÐÃÄÑÍÃÎÔ ÄÊÇÅÃÎÒ
ÑÎæÊÄÐÇÅ ÕËÒà ÓÊÎÈÃÍÎÝà ÆÊÆÌËÎÝÃÑ ÌÊÎÒÊÐÃÓËÃÎ ÝÃÎÒ ÜËÍËÌ ÐÊÎÐÃÎÒ ÇÏÉÑÒÃÄÑÙ
íÊÌÊÅÐÑ ÓÃÉÎÝà ÑÎÄÐÅËÆÊÎ ÑÎæÊÄÐÃÄÑ ÉÃÑÎÎÝÃÔ ÇÏÉÑÒÃÄÑ ÕËÒà ÆÊÎÒÃÉÃÆÑ
ÌÊÅËÏÃÓÃÎ ÈÃÉÃÆ ÓÃÅÒÃÙ ÖÈà ÏÃÎÝÃÍ èÃÍÐÇÅ ÝÃÎÒ ÆÊÆÌÊÎÒÃÅËÓÑ ÌÊÅËÏÃÓÃÎ ÓÃÅÒÃ
ÇÏÉÑÒÃÄÑÙ îÃÏÇïzÑ (Á×××) ÆÊÎÝÊÏËÐÍÃÎ ÏÃÓàà èÃÍÐÇÅ ÝÃÎÒ ÆÊÆÌÊÎÒÃÅËÓÑ
ÌÊÅËÏÃÓÃÎ ÓÃÅÒà ÇÏÉÑÒÃÄÑ ÃÈÃÉÃÓ ÍËÌÇÎÔ ÕÃÎÒÍà àÃÍÐË ÕÃÐËÓ ÐÊÆÌÇ ÈÃÎ ÐÑÎÒÍÃÐ
ÓÃÄÑÉ ÈÑ ÆÃÎÃ ÇÏÉÑÒÃÄÑ ÈÑÌÊÅÈÃÒÃÎÒÍÃÎ

(yield).

ðÊÎËÅËÐ ñËÏÑÅ (Á×êÁ)Ô ÈÃÉÃÆ

ò

óôóõöõ÷ øùöõúûüõ üôùûúûõ õýþôüÿûüõ û û ùôùô û û û ÿø ûyýú


 

 

õ ô ÿõóùûýú ûý õ ûýÿû ûýûy ô õýú ûÿ øùöõúûüõ ô õø ô ôóùûûy ûý

  





t t

ty



 



 









 

øý ûý




ôý ÿ ýø ûúû ûý û û ÿõ (





ô öu











  



)

øùöõúûüõ û û ûýú õüôù ÿ øùöõúûüõ








ôýúûý ôóõ ó (at premium bond) ûõÿ øý õüõ õ óûýû ÷û úû ûüû øùöõúûüõ






 



öôùõ÷ ÿõýúúõ õ ûÿûü ýõöûõ ýøóõýûöý û û û
















öû ûýú õüôù ÿ øùöõúûüõ ôýúûý








õü øý (at discount bond), ûõÿ øý õüõ õ óûýû ÷û úû ûüû øùöõúûüõ ùô û û õ







 











 



ùû û÷ ýõöûõ ýøóõýûöý û


 

û úû øùöõúûüõ

ûýú óôýúûöûóõ

 

ô ùû÷ûý üôÿõû



 

ûÿ



û ûÿ

  

 

óôýú ýÿ ýú ûý ûÿû óô úõ ûý õýþôüÿø ýþôüÿø ÷ôý û ý û óôýúôÿû÷ õ øý õüõ


ÿô ùûõ










ýÿ







 









 









óôóùôöõ øùöõúûüõ ôýúûý ÷û úû õü øý ûÿû óôý ûö øùöõúûüõ

ôýúûý ÷û úû ôóõ ó





















ôýúûý óôýú öûüõ õ ûüõ ûý ô ùû÷ûý ÷û úû øùöõúûüõ


 



 



û ûÿ óôóùûýÿ õýþôüÿø ýÿ óôý û ûÿ ûý return ûýú ø ÿõóûö

 



 



 









ûÿû óõýõýú û ûöû÷ ôúõûÿûý óôöõ ÿõ ôýú ó öûý ôóû ûõûý ûÿû





÷õüÿø õü ýÿ




ùô



ûý ùôüû



















(ûýÿøüû









)

 



Naive Bayes













û ùûý û óôÿø ô öûüõ õ ûüõ ûöûó ûÿû
 



Naive Bayes

ôÿø ô







 



 

ûüôÿ ø











(ò) Naive Bayes





óô û ûý ÿô ýõ
 







óô û ûý óôÿø ô
 

ôýú öûüõ õ ûüõûý ûýú ÿô ôýûö ôýúûý ÿõýú ûÿ ôû ûÿûý ûýú ùûõ




óôýôó ûý ôÿô ûÿ ûý øöû ûÿû ÷ ù ýúûý ûöûó üôÿ ûÿû

óõýõýú ûýÿû û öûõý








ôý ÿ

 



ô õ üõ ùô ùûüõü øùûùõöõüÿõ

   







üô ô ÷ûýû ûýú ùô ûüû û û ôýô û ûý ÿôø ôóû û ôü (ûÿ ûý û ôü) ôýúûý
 





  



 



 

ûü óüõ õý ô ôý ôýüõ ( ôÿõ û ÿô úûýÿ ýúûý) ûýú


 





 













 



 

 



 











 











()

ü öõÿ õ ôý ÷õ ûöûó


 

ýõû ý ûÿû û ûý ÿôÿû õ ûöûó û ÿõ ý û óûüõ÷ ùô ýúüõ ôýúûý ùûõ




ûÿ (ýûõ ) õùû øýõ



óôý ûÿû ûý ùû÷ û óôü õ ý ûü óüõ õý ô ôý ôýüõ










!

Naive Bayes m
pr#$#n#%l &o
r#tm #yn% t"#m
r su
k'##l m$#t"%&o
r
"u

eager

learner, #y&tu'&'"(#&nun
tk"m#l $)$#n*"m
+#,##n-*".#/&0#1-*"2+".#3#4#1 *#'#
'#/# .#/&0 )1/)$ '#*#/ 2"2"/#$#1 '"1%#1 +"1#4 ("/&#* 5"$/64 2#()$#1 $" .#+".

$".#(

y

$".)#4#11#

("0&1%%#

'&

#$0&4

2".#$)$#1 *"2"/##1 '"1%#1 +"1#4

*46("(

*"

.#/&0#17

26'".

()'#0

'#*#/

(84#("/967 :;",#4# /"64&7 2"/6'" $.#(&?&$#(&

Naive Bayes

2"2*)19#&

(@#1

2&1&2)2 '&+#1'&1%$#1 2"/6'" $.#(&?&$#(& 9#1% .#&1

'#1

error rate
K#2+"47

9#1%

)

:;;A =

>".#&1 &/)7 '&+#1'&1%$#1 '"1%#1 *"1%$.#(&?&$#( 2"1%%)1#$#1 4"%4"(& .6%&(/&$7

2"/6'"

Naive Bayes /&'#$ 2"2"4.)$#1 *"1%)3 (/#/&(/&$ ("*"4/& )3& (&%1&?&$#1(&=
B"/6'"

K"."+&0#1

Naive Bayes

2"4)*#$#1 2"/6'" 9#1% 2)'#0 '&&2*."2"1/#(&$#1=

.#&1 2"/6'" &1& #'#.#0 '#*#/ 2"1#1%#1&

missing value,

'#1 #*#+&.#

#()2(& (#.&1% +"+#( /"4*"1)0&7 2#$# /&1%$#/ #$)4#(&19# (#1%#/ /&1%%&

)

:;;C =

D"4'#(#4$#1

)4#

/"4("+)/7

*"1).&(

/"4/#4&$

*"4)+#0#1 0#4%# 6+.&%#(& 2"1%%)1#$#1 2"/6'"

1EF

)1/)$

(>&+#461&7

2"1%$.#(&?&$#(&$#1

Naive Bayes Classification.

GHIHJKL MKJKNKO

D"4'#(#4$#1

.#/#4

+".#$#1%

*"42#(#.#0#1 ("+#%#& +"4&$)/

/"4("+)/7

2#$#

'#*#/

'&*"46."0

4)2)(#1

:
Naive Bayes?