STUDI KOMPARASI METODE AUTOMATIC TERM EXTRACTION: LINGUISTIC, STATISTIK DAN HYBRID PADA MULTIMEDIA CORPUS DOMAIN PARIWISATA BALI | |
---|---|
Semakin cepatnya perkembangan informasi di dalam Internet menuntut suatu ontologi untuk selalu up-to-date. Ontologi merupakan suatu konseptualisasi dari suatu domain yang direpresentasikan dalam class, relation, property dan instance. Salah satu cara untuk menjaga ontologi selalu up-to-date adalah dengan melakukan populasi terhadap ontologi tersebut. Aspek terpenting dalam proses populasi tersebut adalah informasi yang ditambahkan yang didapat dari web (semi-structure). Proses ekstraksi informasi itupun kini mulai beralih dari manual ke otomatis. Dengan kondisi proses populasi ontologi di Indonesia yang masih manual khususnya pada domain pariwisata Bali, penelitian ini berfokus pada komparasi tiga metode automatic extraction engine untuk menentukan mana dari ketiga metode tersebut yang memberikan hasil paling relevan pada domain pariwisata Bali. Precision recall dan f-measure digunakan untuk mengukur relevansi dari tiga metode extraction engine, linguistik, statistik dan hybrid. Hasil penelitian menunjukkan bahwa metode hybrid memberikan hasil yang paling relevan dengan nilai precision tertinggi. Nilai precision yang didapat pada penelitian ini terbatas pada definisi term yang digunakan berdasarkan pada DWIPA ontology. |
|
Statement of Responsibility | |
Author(s) | FahmiLutfiansyahMoechtar (1112002015) - Personal Name |
Edition | |
Call Number | UB/TIK-SIF/15/020 |
Subject(s) | Ontology population extraction engine linguistic method statistic method hybrid method Part of Speech TF-IDF log odds ratio log likelihood specificity Chi2 |
Language | Indonesia |
Publisher | Universitas Bakrie |
Publishing Year | 2015 |
Specific Detail Info | |
File Attachment | LOADING LIST... |
Availability | LOADING LIST... |