Penerapan text mining untuk proses ekstraksi dokumen pada search engine
ABSTRAK
Salah satu cara untuk mengatasi kesulitan dalam memahami isi dari dokumen digital yang bentuknya tidak terstruktur atau semi terstruktur dalam proses searching engine adalah dengan cara mengekstrak dokumen pada tahap pre-processing data serta mengubahnya menjadi data yang lebih terstruktur sebelum disimpan di database. Dalam tugas akhir ini, penulis menerapkan metode text mining dalam proses ekstraksi dokumen untuk menghitung bobot frekuensi (tf) kemunculan suatu kata/term di dalam dokumen yang dapat memwakili isi dari dokumen. Dokumen yang digunakan untuk pengujian pada penelitian ini adalah dokumen pdf jurnal-jurnal berbahasa indonesia. Hasil akhir menunjukan bahwa algoritma text mining dapat menghasilkan term/kata dasar dengan nilai presisi keberhasilan pembentukan kata dasar 78 % - 93 %, serta dapat menghitung bobot frekuensi (tf) kemunculan suatu term/kata di dalam dokumen yang dapat mewakili isi dokumen, sehingga dapat mempermudah dalam memahami isi dari dokumen.
Kata Kunci : Search Engine, Proses Preprosesing, Ekstraksi Dokumen, Metode Text Mining, Term Frekuensi.
S13-811 | 81 | Koleksi Skripsi | Tersedia |
Tidak tersedia versi lain