5. Information Extraction and Named Entity Recognition

  Information Information

Extraction and Extraction and

Named Entity Named Entity Recognition Recognition Tim Teaching Tim Teaching

Information Extraction Information Extraction

   

Information extraction (IE) systems Information extraction (IE) systems

    Menemukan dan memahami bagian Menemukan dan memahami bagian tertentu yang relevan dalam teks yang tertentu yang relevan dalam teks yang

  tidak terstruktur tidak terstruktur

    Mengumpulkan informasi dari banyak Mengumpulkan informasi dari banyak kumpulan teks kumpulan teks

   

Menghasilkan sebuah Menghasilkan sebuah representasi representasi

  informasi yang relevan dan terstruktur: informasi yang relevan dan terstruktur :

    Relasi (seperti dalam database) Relasi (seperti dalam database)

Information Extraction Information Extraction

    Information extraction (IE) systems Information extraction (IE) systems

   

  Tujuan: Tujuan:

  1. Membuat informasi menjadi lebih

  1. Membuat informasi menjadi lebih

  terorganisir dengan baik sehingga terorganisir dengan baik sehingga berguna untuk manusia berguna untuk manusia

  2. Informasi ditampilkan dalam sebuah Informasi ditampilkan dalam sebuah

  2.

  format yang tepat secara format yang tepat secara semantic semantic sehingga memungkinkan dilakukan sehingga memungkinkan dilakukan inferensi inferensi pada tahap selanjutnya oleh pada tahap selanjutnya oleh

Information Extraction Information Extraction

   

  IE systems mengekstrak informasi yang terstruktur, jelas dan faktual dari yang terstruktur, jelas dan faktual dari teks yang tidak terstruktur teks yang tidak terstruktur

  IE systems mengekstrak informasi

    Singkatnya : Siapa melakukan apa ke siapa, Singkatnya : Siapa melakukan apa ke siapa, kapan dan di mana? kapan dan di mana?

Information Extraction Information Extraction

   Tugas yang sering dilakukan pada IE: Tugas yang sering dilakukan pada IE:

    Mengidentifkasi entitas nama Mengidentifkasi entitas nama   Mengidentifkasi relasi antar entitas Mengidentifkasi relasi antar entitas  Memasukkan ke database dengan format tertentu Memasukkan ke database dengan format tertentu

   Tugas yang lain: Tugas yang lain:

   Mengekstraksi Kejadian

  Mengekstraksi Kejadian  Membuat Template Otomatis dari informasi dalam teks Membuat Template Otomatis dari informasi dalam teks  dsb dsb

    Manfaat dan Aplikasi: natural language Manfaat dan Aplikasi: natural language

  

Information Extraction Information Extraction

Information Extraction Information Extraction

   Contoh,

   Mengumpulkan data pemasukan, laba, pimpinan, kantor dsb dari laporan perusahaan

   Kantor Pusat BHP Billiton Limited, dan kantor utama BHP Billiton Group, terletak di Melbourne, Australia.

   Kantor Pusat(“BHP Biliton Limited”, “Melbourne, Australia”)

   Mempelajari interkasi produk obat dari

   Contoh,

   Mengumpulkan data pemasukan, laba, pimpinan, kantor dsb dari laporan perusahaan

   Kantor Pusat BHP Billiton Limited, dan kantor utama BHP Billiton Group, terletak di Melbourne, Australia.

   Kantor Pusat(“BHP Biliton Limited”, “Melbourne, Australia”)

   Mempelajari interkasi produk obat dari

  

Information Extraction Information Extraction

Low Level IE Low Level IE

  

Contoh Low Level IE, deteksi event

pada Apple mail atau Gmail Biasanya berbasis pada regular 

  Contoh Low Level IE, deteksi event pada Apple mail atau Gmail 

  Biasanya berbasis pada regular

  

Low Level IE Low Level IE

  web? web?  Kalau manusia pasti tahu kalau ini adalah buku, 

  Kalau manusia pasti tahu kalau ini adalah buku, Need this price Title A book, Not a toy

  web? web? A book, Not a toy

   Judul tidak dituliskan secara eksplisit sebagai Judul tidak dituliskan secara eksplisit sebagai

  web? web? Title

   Judul tidak dituliskan secara eksplisit sebagai Judul tidak dituliskan secara eksplisit sebagai

  web? web? Need this price

   Untuk harga – ada banyak harga yang ditampilkan,

  Untuk harga – ada banyak harga yang ditampilkan,

How is IE useful? How is IE useful?

  Background: Background:   Plain text Plain text advertisements advertisements

   

  Mengkestrak Mengkestrak

  informasi dari iklan di informasi dari iklan di koran lalu diformat koran lalu diformat menjadi seperti di menjadi seperti di samping. samping.

  

   Lalu bisa ditulis lagi Lalu bisa ditulis lagi dengan menggunakan dengan menggunakan format lain tapi format lain tapi informasinya tetap informasinya tetap

How is IE useful? How is IE useful?

  

   Mengambil informasi alamat rumah di web secara

  Mengambil informasi alamat rumah di web secara

How is IE useful? How is IE useful?

  

   Mengambil informasi alamat rumah di web secara

  Mengambil informasi alamat rumah di web secara

Retrieval Retrieval

  

Information Retrieval

Information Retrieval

   User Query -> Teks/dokumen yang relevan  Pendekatan: keyword matching  Query generality : full

   Information Extraction  Analisis Linguistic yang ditargetkan pada informasi yang relevan  User Query -> Informasi yang relevan

   

   User Query -> Teks/dokumen yang relevan

   Pendekatan: keyword matching

   Query generality : full

  

Information Extraction

   Analisis Linguistic yang ditargetkan pada informasi yang relevan

   User Query -> Informasi yang relevan

  

  (NER) (NER)

   Named Entity Recognition (NER) adalah salah Named Entity Recognition (NER) adalah salah satu Subtask yang sangat penting dalam IE : satu Subtask yang sangat penting dalam IE :

  Menemukan Menemukan dan Mengklasifkasi nama-nama dan Mengklasifkasi nama-nama

  Entitas dalam teks Entitas dalam teks

  

   Nama Entitas apa saja? Tergantung pada Nama Entitas apa saja? Tergantung pada Aplikasinya. Aplikasinya.

    People, places, organizations, times, amounts, etc. People, places, organizations, times, amounts, etc. 

   Names of genes and proteins (Settles 05) Names of genes and proteins (Settles 05)

  

  (NER) (NER)

   

  NER untuk NER untuk menemukan, contoh : menemukan , contoh :   The decision by the independent MP Andrew Wilkie The decision by the independent MP Andrew Wilkie

to withdraw his support for the minority Labor to withdraw his support for the minority Labor

government sounded dramatic but it should not government sounded dramatic but it should not further threaten its stability. When, after the further threaten its stability. When, after the 2010 2010 election, Wilkie, Rob Oakeshott, Tony Windsor and election, Wilkie , Rob Oakeshott , Tony Windsor and the the Greens agreed to support Labor, they gave just Greens agreed to support Labor , they gave just two guarantees: confdence and supply. two guarantees: confdence and supply.

  (NER) (NER)  

  NER untuk NER untuk menemukan dan menemukan dan mengklasifkasi mengklasifkasi, contoh : , contoh :

    The decision by the independent MP Andrew The decision by the independent MP Andrew Wilkie to withdraw his support for the Wilkie to withdraw his support for the

  Person minority minority Labor government sounded Labor government sounded

  Date dramatic but it should not further threaten its dramatic but it should not further threaten its

  Organizatio n stability. When, after the stability. When, after the 2010 election, 2010 election, Wilkie, Rob Oakeshott, Tony Windsor and the Wilkie , Rob Oakeshott , Tony Windsor and the Greens agreed to support Labor, they gave Greens agreed to support Labor , they gave just two guarantees: confdence and supply. just two guarantees: confdence and supply.

  (NER) (NER)

   

  Manfaat: Manfaat:   Melakukan Indeksi Entitas dsb. Melakukan Indeksi Entitas dsb.   Sentiment bisa disematkan pada perusahaan atau Sentiment bisa disematkan pada perusahaan atau produk produk

  

 Banyak relasi IE relations yang menjadi asosiasi Banyak relasi IE relations yang menjadi asosiasi

antar entitas antar entitas

    Untuk question answering, jawaban kebanyakan Untuk question answering, jawaban kebanyakan adalah entitas adalah entitas

  (NER) (NER)

  Tiga pendekatan Standart untuk NER Tiga pendekatan Standart untuk NER

  (dan IE) (dan IE) 1.

  1. Hand-written regular expressions Hand-written regular expressions

  2. Using classifers

    Generative: Naïve Bayes Generative: Naïve Bayes   Discriminative: Maxent models Discriminative: Maxent models 3.

  3. Sequence models Sequence models

    HMMs HMMs   CMMs/MEMMs CMMs/MEMMs

  

Rule Based NER Rule Based NER

Information Extraction & NER Information Extraction & NER

Rule Based NER Rule Based NER

  • Ada 3 cara :
  • Ada 3 cara :
    • – Menggunakan regular expressions
    • – Menggunakan regular expressions
    • – Membuat aturan khusus untuk urutan

      tertentu
    • – Menggunakan context patterns
    • – Membuat aturan khusus untuk urutan tertentu
    • – Menggunakan context patterns

Rule Based NER (1) Rule Based NER (1)

  • Membuat regular expressions untuk mengekstraksi: mengekstraksi:
  • Membuat regular expressions untuk
    • – – Nomor Telephone Nomor Telephone
    • – – E-mail

  E-mail

  • – – Nama yang diawali huruf Kapital

  Nama yang diawali huruf Kapital

  

Regular expressions menyediakan cara yang

feksibel untuk mencocokkan string pada teks.

  

Tidak hanya mencocokkan kata yang memiliki

karakter-karakter yang sama, tapi bisa juga

dengan menggunakan karakter, kata, atau

pola tertentu.

  

Regular expressions menyediakan cara yang

feksibel untuk mencocokkan string pada teks.

  

Tidak hanya mencocokkan kata yang memiliki

karakter-karakter yang sama, tapi bisa juga

dengan menggunakan karakter, kata, atau

pola tertentu.

    Misal, kita ingin mencari sebuah kata Misal, kita ingin mencari sebuah kata yang yang

  1. Diawali huruf besar “P”

  1. Diawali huruf besar “P”

  2. Merupakan Huruf pertama pada sebuah baris baris

  2. Merupakan Huruf pertama pada sebuah

  3. Huruf setelahnya menggunakan huruf kecil 4.

  3. Huruf setelahnya menggunakan huruf kecil

  4. Cuma terdiri dari 3 huruf Cuma terdiri dari 3 huruf 5.

  5. Huruf ketiga adalah huruf vokal Huruf ketiga adalah huruf vokal

  

Misal, kita ingin mencari sebuah kata yang :

  1. Diawali huruf besar “P”

  2. Merupakan Huruf pertama pada sebuah baris

  

3. Huruf setelahnya menggunakan huruf kecil

  4. Cuma terdiri dari 3 huruf

  5. Huruf ketiga adalah huruf vokal  Regular expressionnya : “^P[a-z][aeiou]” di mana :

  ^ - Mengindikasikan awal String [a-z] – semua huruf kecil dari a sampzi z

  

Misal, kita ingin mencari sebuah kata yang :

  1. Diawali huruf besar “P”

  2. Merupakan Huruf pertama pada sebuah baris

  

3. Huruf setelahnya menggunakan huruf kecil

  4. Cuma terdiri dari 3 huruf

  5. Huruf ketiga adalah huruf vokal  Regular expressionnya : “ ^P[a-z][aeiou] ” di mana :

  ^ - Mengindikasikan awal String [a-z] – semua huruf kecil dari a sampzi z

Perl RegEx Perl RegEx

  ? For 0 or 1 occurrences 

  . (wildcard) anything 

  \s (space char) any whitespace 

  \d (digit char) any digit 

  \w (word char) any alpha-numeric 

   \w (word char) any alpha-numeric

  $ end of string 

  

  ^ beginning of string 

   ? For 0 or 1 occurrences

   $ end of string

   ^ beginning of string

   \b word bounday

   . (wildcard) anything

   \s (space char) any whitespace

   \d (digit char) any digit

  \b word bounday 

  • + for 1 or more occurrences
  • + for 1 or more occurrences

   A{1,5} One to fve A’s. 

   specifc range of number of occurrences: {min,max}.

   specifc range of number of occurrences: {min,max}.

   A{1,5} One to fve A’s. 

  A{5,} Five or more A’s

  A{5,} Five or more A’s 

Rule Based NER (1) Rule Based NER (1)

  • Membuat regular expressions untuk
  • Membuat regular expressions untuk

  mengekstraksi: mengekstraksi:

  • – – Nomor Telephone Nomor Telephone

    Contoh : 0341-551611, 0341-565420, 0857-467-45623 Contoh : 0341-551611, 0341-565420, 0857-467-45623   Nomor yang dipisah dengan Hypen (-) Nomor yang dipisah dengan Hypen (-)   RegEx = (\d+\-)+\d+ RegEx = (\d+\-)+\d+

Rule Based NER (2) Rule Based NER (2)

   

Membuat aturan untuk mengkestrak Membuat aturan untuk mengkestrak lokasi lokasi

   

Kata yang diawali huruf besar + {city, center, Kata yang diawali huruf besar + {city, center,

river} menandakan lokasi river} menandakan lokasi

  Ex. New York city Ex. New York city Hudson river Hudson river   {Kota, Desa, Kecamatan, Kabupaten, Kelurahan} + {Kota, Desa, Kecamatan, Kabupaten, Kelurahan} +

  Kata yang diawali huruf besar menandakan lokasi Kata yang diawali huruf besar menandakan lokasi Ex. Kota Kanor Ex. Kota Kanor

Rule Based NER (3) Rule Based NER (3)

   

Menggunakan context patterns Menggunakan context patterns

    [PERSON] earned [MONEY] [PERSON] earned [MONEY] Ex. Frank earned $20 Ex. Frank earned $20

    [PERSON] joined [ORGANIZATION] [PERSON] joined [ORGANIZATION]

  Ex. Sam joined IBM Ex. Sam joined IBM  

  [PERSON],[JOBTITLE] [PERSON],[JOBTITLE] Ex. Mary, the teacher Ex. Mary, the teacher

Rule Based NER (3) Rule Based NER (3)

   

Menggunakan context patterns Menggunakan context patterns

    [PERSON|ORGANIZATION|ANIMAL] fy to [LOCATION| [PERSON|ORGANIZATION|ANIMAL] fy to [LOCATION|

Ex. Jerry few to Japan Ex. Jerry few to Japan

   Sarah fies to the party Sarah fies to the party Delta fies to Europe Delta fies to Europe bird fies to trees bird fies to trees bee fies to the wood bee fies to the wood

  work? work?  Huruf Kapital adalah indikasi yang kuat bahwa Huruf Kapital adalah indikasi yang kuat bahwa kata tersebut adalah sebuah nama, tapi kata tersebut adalah sebuah nama, tapi kadang bisa juga sangat tricky: kadang bisa juga sangat tricky:

    Kata pertama dari kalimat pasti diawali huruf besar Kata pertama dari kalimat pasti diawali huruf besar

    Kadang judul di website semuanya pake huruf besar Kadang judul di website semuanya pake huruf besar   Ada juga yang mengandung huruf kecil Ada juga yang mengandung huruf kecil University of Southern California adalah University of Southern California adalah Organization, of diawali dengan huruf kecil Organization, of diawali dengan huruf kecil

   

  work? work?

   Entitas yang sama bisa jadi memiliki beberapa Entitas yang sama bisa jadi memiliki beberapa variasi variasi

  Pak Bisri Pak Bisri prof. Bisri prof. Bisri Bisri Bisri

    Ada juga ambiguitas Ada juga ambiguitas

  Ahmad Yani orang vs. Ahmad Yani jalan Ahmad Yani orang vs. Ahmad Yani jalan JFK the person vs. JFK the airport JFK the person vs. JFK the airport

  

Naive Bayes Based Naive Bayes Based

NER NER Information Extraction & NER Information Extraction & NER

Naive Bayes Based NER Naive Bayes Based NER

  • D1 : Santika akan pergi ke Bali bersama
  • • D1 : Santika akan pergi ke Bali bersama

  Supriadi Supriadi

  • • D2 : Hotel Santika berada di Jalan Merapi D2 : Hotel Santika berada di Jalan Merapi

  • • D3 : Supriadi menginap di Hotel Santika D3 : Supriadi menginap di Hotel Santika

  sebelum berangkat ke Merapi Center sebelum berangkat ke Merapi Center

  • D4 : Jalan Merapi macet sampai Jalan D4 : Jalan Merapi macet sampai Jalan

  Supriadi Supriadi

Naive Bayes Based NER Naive Bayes Based NER

  • • D1 : Santika akan pergi ke Bali bersama D1 : Santika akan pergi ke Bali bersama

  Supriadi Supriadi

  • • D2 : Hotel Santika berada di Jalan Merapi D2 : Hotel Santika berada di Jalan Merapi

    • D3 : Supriadi menginap di Hotel Santika

  • D3 : Supriadi menginap di Hotel Santika sebelum berangkat ke sebelum berangkat ke Merapi Center Merapi Center
  • D4 : Jalan Merapi macet sampai Jalan D4 : Jalan Merapi macet sampai Jalan

  Supriadi Supriadi

Naive Bayes Based NER Naive Bayes Based NER

  • Supriadi Supriadi

  Nama Person : Santika, Supriadi,

  • Nama Person : Santika, Supriadi,
  • Nama Organisasi : Santika, Santika, Nama Organisasi : Santika, Santika,

  Merapi Merapi

  • Nama Lokasi : Merapi, Merapi, Bali, Nama Lokasi : Merapi, Merapi, Bali,

  Supriadi Supriadi

Naive Bayes Based NER Naive Bayes Based NER

  • • D5 : Supriadi akan menginap di Hotel D5 : Supriadi akan menginap di Hotel

  Santika Santika

Multinomial Naive Bayes Multinomial Naive Bayes

  • Nama Person (P) : Santika, Supriadi, Supriadi Nama Person (P) : Santika, Supriadi, Supriadi
  • >Nama Organisasi (O) : Santika, Santika, Me
  • Nama Organisasi (O) : Santika, Santika, Merapi
  • Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi

  D5 : Supriadi akan menginap di Hotel Santika

  • >D5 : Supriadi akan menginap di Hotel Santika

    Multinomial Naive Bayes Multinomial Naive Bayes

      P w * | c P c    

      P c | w

        P w

       

    • W adalah kata

      W adalah kata

    • C adalah kategori C adalah kategori
    • • P(c I w) : Peluang kategori c dengan syarat muncul

      P(c I w) : Peluang kategori c dengan syarat muncul kata w kata w

    • P(c) : Peluang munculnya kategori c
    • P(c) : Peluang munculnya kategori c

    Multinomial Naive Bayes Multinomial Naive Bayes

    • menjadi cukup : menjadi cukup :

      Karena nilai P(w) selalu sama, bisa juga dituliskan

    • Karena nilai P(w) selalu sama, bisa juga dituliskan

      P(w | c)* P(c) P(w | c)* P(c)

    Multinomial Naive Bayes Multinomial Naive Bayes

        ����� (� , �)

      ( ) � � = ����� ( )

      Untuk menghindari adanya nilai 0 (nol), digunakan Untuk menghindari adanya nilai 0 (nol), digunakan add-one or Laplace smoothing add-one or Laplace smoothing

      ( )

      1 ����� � ,�

    •  

      ( ) =

      � �

    Multinomial Naive Bayes Multinomial Naive Bayes

      ( )

    •  

      1 ����� � ,�

      ( ) � � =

    • )

      ¿ ¿ ¿ ����� ( � �

    • muncul kategori c muncul kategori c
    • P(w|c) : Peluang munculnya kata w dengan syarat P(w|c) : Peluang munculnya kata w dengan syarat
    • P(c) : Peluang kemunculan kategori c
    • P(c) : Peluang kemunculan kategori c
    • Count(w,c) : jumlah kata w pada kategori c Count(w,c) : jumlah kata w pada kategori c
    • >Count (c) : jumlah seluruh kata pada kategori c
    • Count (c) : jumlah seluruh kata pada kategori c

    Multinomial Naive Bayes Multinomial Naive Bayes

      P w * | c P c    

      P c | w

      

        P w

    • Nama Person (P) : Santika, Supriadi, Supriadi

      Nama Person (P) : Santika, Supriadi, Supriadi

       

      Nama Organisasi (O) : Santika, Santika, Merapi Nama Organisasi (O) : Santika, Santika, Merapi

      Nama Lokasi (L) : Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi Merapi, Merapi, Bali, Supriadi

      D5 : Supriadi akan menginap di Hotel Santika D5 : Supriadi akan menginap di Hotel Santika

    • P(P)=1/3, P(O)=1/3, P(O)=1/3, P(L) = 1/3 P(L) = 1/3
    • P(P)=1/3,
    • >P(Supriadi | P) = (2)+1/(3+4) =
    • P(Supriadi | P) = (2)+1/(3+4) = 3/7
    • P(Supriadi | O) = (0)+1/(3+4) = 1/7 P(Supriadi | O) = (0)+1/(3+4) = 1/7
    • >P(Supriadi | L) = (1)+1/(4+4) =
    • P(Supriadi | L) = (1)+1/(4+4) = 2/8

    Multinomial Naive Bayes Multinomial Naive Bayes

    • Nama Person (P) : Santika, Supriadi, Supriadi
    • Nama Person (P) : Santika, Supriadi, Supriadi •
      • | |

    • Nama Organisasi (O) : Santika, Santika, Merapi

      Nama Organisasi (O) : Santika, Santika, Merapi

    • Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi
    • Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi •
    • D5 : Supriadi akan menginap di Hotel Santika

      D5 : Supriadi akan menginap di Hotel Santika

             

      P w P c c w P P w c

        

    • P(P)=1/3, P(O)=1/3, P(L) = 1/3
    • P(P)=1/3, P(O)=1/3, P(L) = 1/3

    Multinomial Naive Bayes Multinomial Naive Bayes

       

      

    Terbukti bahwa Terbukti bahwa P(Supriadi) tidak perlu dihitung untuk P(Supriadi) tidak perlu dihitung untuk

    mencari kelas yang memiliki peluang terbesar. mencari kelas yang memiliki peluang terbesar.

      Sehingga cukup memakai rumus Sehingga cukup memakai rumus

    Multinomial Naive Bayes Multinomial Naive Bayes

       

      Karena kelas P memiliki peluang terbesar, maka Karena kelas P memiliki peluang terbesar, maka

    Multinomial Naive Bayes Multinomial Naive Bayes

    • Nama Person (P) : Santika, Supriadi, Supriadi

      Nama Person (P) : Santika, Supriadi, Supriadi

      Nama Organisasi (O) : Santika, Santika, Merapi

      Nama Organisasi (O) : Santika, Santika, Merapi

      Nama Lokasi (L) : Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi Merapi, Merapi, Bali, Supriadi

      D5 : Supriadi akan menginap di Hotel Santika D5 : Supriadi akan menginap di Hotel Santika

    • P(akan | P) = (0)+1/(3+4) = 1/7 P(akan | P) = (0)+1/(3+4) = 1/7
    • P(akan | O) = (0)+1/(3+4) = 1/7 P(akan | O) = (0)+1/(3+4) = 1/7
    • P(akan | L) = (0)+1/(4+4) = 1/8 P(akan | L) = (0)+1/(4+4) = 1/8

    Multinomial Naive Bayes Multinomial Naive Bayes

    • Nama Person (P) : Santika, Supriadi, Supriadi
    • Nama Person (P) : Santika, Supriadi, Supriadi •
    • Nama Organisasi (O) : Santika, Santika, Merapi

      Nama Organisasi (O) : Santika, Santika, Merapi

    • Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi
    • Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi •
    • D5 : Supriadi akan menginap di Hotel Santika

      D5 : Supriadi akan menginap di Hotel Santika

    • P(P | akan) = P(akan | P) * P(P) = 1/7 *1/3 = 1/21

    • P(P | akan) = P(akan | P) * P(P) = 1/7 *1/3 = 1/21
    • P(O | akan) = P(akan | O) * P(O) = 1/7 *1/3 = 1/21
    • P(L | akan) = P(akan | L) * P(L) = 1/8 *1/3 = 1/24
    • Maka kata akan masuk ke Entitas Person atau
    • P(O | akan) = P(akan | O) * P(O) = 1/7 *1/3 = 1/21
    • P(L | akan) = P(akan | L) * P(L) = 1/8 *1/3 = 1/24

    • Maka kata akan masuk ke Entitas Person atau Organisasi

      Organisasi

    Multinomial Naive Bayes Multinomial Naive Bayes

    • Nama Person (P) : Santika, Supriadi, Supriadi

      Nama Person (P) : Santika, Supriadi, Supriadi

      Nama Organisasi (O) : Santika, Santika, Merapi

      Nama Organisasi (O) : Santika, Santika, Merapi

      Nama Lokasi (L) : Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi Merapi, Merapi, Bali, Supriadi

      D5 : Supriadi akan menginap di Hotel Santika D5 : Supriadi akan menginap di Hotel Santika

    • P(Santika | P) = (1)+1/(3+4) = 2/7 P(Santika | P) = (1)+1/(3+4) = 2/7
    • P(Santika | O) = (2)+1/(3+4) = 3/7 P(Santika | O) = (2)+1/(3+4) = 3/7
    • P(Santika | L) = (0)+1/(4+4) = 1/8 P(Santika | L) = (0)+1/(4+4) = 1/8

    Multinomial Naive Bayes Multinomial Naive Bayes

    • Nama Person (P) : Santika, Supriadi, Supriadi •
    • Nama Person (P) : Santika, Supriadi, Supriadi
    • Nama Organisasi (O) : Santika, Santika, Merapi

      Nama Organisasi (O) : Santika, Santika, Merapi

    • Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi •
    • Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi
    • D5 : Supriadi akan menginap di Hotel Santika

      D5 : Supriadi akan menginap di Hotel Santika

    • P(P | Santika) = P(Santika | P)*P(P) = 2/7 * 1/3 = 2/21
    • P(P | Santika) = P(Santika | P)*P(P) = 2/7 * 1/3 =

      2/21

    • P(O | Santika) = P(Santika | O)*P(O) = 3/7 * 1/3 =

      3/21
    • P(O | Santika) = P(Santika | O)*P(O) = 3/7 * 1/3 =

      3/21

    • P(L | Santika) = P(Santika | L)*P(L) = 1/8 * 1/3 = 1/24
    • P(L | Santika) = P(Santika | L)*P(L) = 1/8 * 1/3 =

      1/24