Teks Mining TINJAUAN PUSTAKA

baik semua teks yang terdapat di dalam dokumen atau hanya sebagian teks saja. Prinsip kerja dari metode dokumen fingerprinting ini adalah dengan menggunakan teknik hashing. Teknik hashing adalah sebuah fungsi yang mengkonversi setiap 9 string menjadi bilangan. Misalnya Rabin-Karp, Winnowing dan Manber c. Kesamaan Kata Kunci. Prinsip dari metode ini adalah mengekstrak kata kunci dari dokumen dan kemudian dibandingkan dengan kata kunci pada dokumen yang lain. Pendekatan yang digunakan pada metode ini adalah teknik dot.

2.3. Teks Mining

Teks mining, yang juga disebut sebagai Teks Data Mining TDM atau Knowledge Discovery in Text KDT, secara umum mengacu pada proses ekstraksi informasi dari dokumen-dokumen teks tak terstruktur unstructured. Teks mining dapat didefinisikan sebagai penemuan informasi baru dan tidak diketahui sebelumnya oleh komputer, dengan secara otomatis mengekstrak informasi dari sumber-sumber teks tak terstruktur yang berbeda. Kunci dari proses ini adalah menggabungkan informasi yang berhasil diekstraksi dari berbagai sumber. Tujuan utama teks mining adalah mendukung proses knowledge discovery pada koleksi dokumen yang besar. Pada prinsipnya, teks mining adalah bidang ilmu multidisipliner, melibatkan information retrieval IR, text analysis, information extraction IE, clustering, categorization, visualization, database technology, natural language processing NLP, machine learning, dan data mining. Dapat pula dikatakan bahwa teks mining merupakan salah satu bentuk aplikasi kecerdasan buatan artificial intelligence AI. Teks mining mencoba memecahkan masalah information overload dengan menggunakan teknik-teknik dari bidang ilmu yang terkait. Teks mining dapat dipandang sebagai suatu perluasan dari data mining atau knowledge-discovery in database KDD, yang mencoba untuk menemukan pola-pola menarik dari basis data berskala besar. Namun teks mining memiliki potensi komersil yang lebih tinggi dibandingkan dengan data mining, karena kebanyakan format alami dari penyimpanan informasi adalah berupa teks. Teks mining menggunakan informasi teks tak terstruktur dan mengujinya dalam upaya mengungkap dalam teks. Perbedaan mendasar antara teks mining dan data mining terletak pada sumber data yang digunakan. Pada data mining, pola-pola diekstrak dari basis data yang terstruktur, sedangkan di teks mining, pola-pola diekstrak dari data tekstual natural language . Secara umum, basis data didesain untuk program dengan tujuan melakukan pemrosesan secara otomatis, sedangkan teks ditulis untuk dibaca langsung oleh manusia.

Teks Mining TINJAUAN PUSTAKA

2.3. Teks Mining

2.4. Ruang Lingkup Teks Mining

Parts

Dokumen yang terkait

Implementasi Algoritma Levenshtein Distance dan Algoritma Knuts Morris Pratt Dalam Fitur Word Complete pada Search Engine

PEMBANGUNAN SISTEM PENGOLAHAN DATAJUMLAH CALON MAHASISWA BARU PEMBANGUNAN SISTEM PENGOLAHAN DATA JUMLAH CALON MAHASISWA BARU MENGGUNAKAN METODE LEVENSHTEIN DISTANCE.

PENDAHULUAN PEMBANGUNAN SISTEM PENGOLAHAN DATA JUMLAH CALON MAHASISWA BARU MENGGUNAKAN METODE LEVENSHTEIN DISTANCE.

LANDASAN TEORI PEMBANGUNAN SISTEM PENGOLAHAN DATA JUMLAH CALON MAHASISWA BARU MENGGUNAKAN METODE LEVENSHTEIN DISTANCE.

KESIMPULAN DAN SARAN PEMBANGUNAN SISTEM PENGOLAHAN DATA JUMLAH CALON MAHASISWA BARU MENGGUNAKAN METODE LEVENSHTEIN DISTANCE.

Sistem Informasi HRD dengan Profile Matching untuk Perekrutan, Penilaian dan Penentuan Jenjang Karir Pegawai.

MELAKUKAN ENTRY DATA DENGAN MENGGUNAKAN

Implementasi Algoritma Levenshtein Distance dan Algoritma Knuts Morris Pratt Dalam Fitur Word Complete pada Search Engine

PERANCANGAN SISTEM PENILAIAN TES KETELITIAN ENTRY DATA UNTUK PEREKRUTAN PEGAWAI DENGAN MENGGUNAKAN ALGORITMA LEVENSHTEIN DISTANCE

NORMALISASI TEKS MEDIA SOSIAL MENGGUNAKAN WORD2VEC, LEVENSHTEIN DISTANCE, DAN JARO-WINKLER DISTANCE SOCIAL MEDIA TEXT NORMALIZATION USING WORD2VEC, LEVENSHTEIN DISTANCE, AND JARO-WINKLER DISTANCE

Dukungan

Links

Teks Mining TINJAUAN PUSTAKA

2.3. Teks Mining

2.4. Ruang Lingkup Teks Mining

Parts

Dokumen yang terkait

Implementasi Algoritma Levenshtein Distance dan Algoritma Knuts Morris Pratt Dalam Fitur Word Complete pada Search Engine

PEMBANGUNAN SISTEM PENGOLAHAN DATAJUMLAH CALON MAHASISWA BARU PEMBANGUNAN SISTEM PENGOLAHAN DATA JUMLAH CALON MAHASISWA BARU MENGGUNAKAN METODE LEVENSHTEIN DISTANCE.

PENDAHULUAN PEMBANGUNAN SISTEM PENGOLAHAN DATA JUMLAH CALON MAHASISWA BARU MENGGUNAKAN METODE LEVENSHTEIN DISTANCE.

LANDASAN TEORI PEMBANGUNAN SISTEM PENGOLAHAN DATA JUMLAH CALON MAHASISWA BARU MENGGUNAKAN METODE LEVENSHTEIN DISTANCE.

KESIMPULAN DAN SARAN PEMBANGUNAN SISTEM PENGOLAHAN DATA JUMLAH CALON MAHASISWA BARU MENGGUNAKAN METODE LEVENSHTEIN DISTANCE.

Sistem Informasi HRD dengan Profile Matching untuk Perekrutan, Penilaian dan Penentuan Jenjang Karir Pegawai.

MELAKUKAN ENTRY DATA DENGAN MENGGUNAKAN

Implementasi Algoritma Levenshtein Distance dan Algoritma Knuts Morris Pratt Dalam Fitur Word Complete pada Search Engine

PERANCANGAN SISTEM PENILAIAN TES KETELITIAN ENTRY DATA UNTUK PEREKRUTAN PEGAWAI DENGAN MENGGUNAKAN ALGORITMA LEVENSHTEIN DISTANCE

NORMALISASI TEKS MEDIA SOSIAL MENGGUNAKAN WORD2VEC, LEVENSHTEIN DISTANCE, DAN JARO-WINKLER DISTANCE SOCIAL MEDIA TEXT NORMALIZATION USING WORD2VEC, LEVENSHTEIN DISTANCE, AND JARO-WINKLER DISTANCE

Dokumen yang Anda mencari sudah siap untuk unduhkan