Select Language  
Book's Detail
STUDI KOMPARASI METODE AUTOMATIC TERM EXTRACTION: LINGUISTIC, STATISTIK DAN HYBRID PADA MULTIMEDIA CORPUS DOMAIN PARIWISATA BALI

Semakin cepatnya perkembangan informasi di dalam Internet menuntut suatu ontologi untuk selalu up-to-date. Ontologi merupakan suatu konseptualisasi dari suatu domain yang direpresentasikan dalam class, relation, property dan instance. Salah satu cara untuk menjaga ontologi selalu up-to-date adalah dengan melakukan populasi terhadap ontologi tersebut. Aspek terpenting dalam proses populasi tersebut adalah informasi yang ditambahkan yang didapat dari web (semi-structure). Proses ekstraksi informasi itupun kini mulai beralih dari manual ke otomatis. Dengan kondisi proses populasi ontologi di Indonesia yang masih manual khususnya pada domain pariwisata Bali, penelitian ini berfokus pada komparasi tiga metode automatic extraction engine untuk menentukan mana dari ketiga metode tersebut yang memberikan hasil paling relevan pada domain pariwisata Bali. Precision recall dan f-measure digunakan untuk mengukur relevansi dari tiga metode extraction engine, linguistik, statistik dan hybrid. Hasil penelitian menunjukkan bahwa metode hybrid memberikan hasil yang paling relevan dengan nilai precision tertinggi. Nilai precision yang didapat pada penelitian ini terbatas pada definisi term yang digunakan berdasarkan pada DWIPA ontology.

Kata Kunci: Ontology population, extraction engine, linguistic method, statistic method, hybrid method, Part of Speech, TF-IDF, log odds ratio, log likelihood, specificity, Chi2

Statement of Responsibility
Author(s) FahmiLutfiansyahMoechtar (1112002015) - Personal Name
Edition
Call Number UB/TIK-SIF/15/020
Subject(s) Ontology population
extraction engine
linguistic method
statistic method
hybrid method
Part of Speech
TF-IDF
log odds ratio
log likelihood
specificity
Chi2
Language Indonesia
Publisher Universitas Bakrie
Publishing Year 2015
Specific Detail Info
File Attachment
LOADING LIST...
Availability
LOADING LIST...