FernUniversität Hagen

Fakultät für Mathematik und Informatik

Home

Lehre
Lehreveranstaltungen
Masterarbeiten und Bachelorarbeiten
Promotion
Mündliche Prüfungen
Klausuren

Forschung
Projekte
Forschungscluster
Publikationen und Literatursuche
   RSS-Feed unserer Publikationen
   Suche in BibTeX
   Suche in Daffodil

Team

Stellenangebote für unsere Gruppe

Wir über uns (Kontaktadresse, Wegbeschreibung)
KONTAKT
Homepage
Neuigkeiten als RSS-Feed
ENGLISH
Startseite Lehrgebiet Multimedia und Internetanwendungen

Ontology Suitability for Uncertain Extraction of Information from Multi-Record Web Documents

Zitationsschlüssel:
Embley/etal:99
Titel:
Ontology Suitability for Uncertain Extraction of Information from Multi-Record Web Documents
Autor(en):
D. W. Embley
N. Fuhr
C. P. Klas
T. Rölleke
In:
Proceedings ADI'99 (Agenten -- Datenbanken -- Information Retrieval)
Jahr:
1999

Zusammenfassung:
Ontology based data extraction from multi-record Web documents works well, but only if the ontology is suitable for the Web document. How do we know whether the ontology is suitable? To resolve this question, we present an approach based on three heuristics: density, schema, and grouping. We encode the first heuristic as a density function and use probabilistic models for the second and third. We argue that these heuristics and our computational models for these heuristics correctly determine the suitability of a Web document for a given ontology.

BibTeX-Eintrag