FernUniversität Hagen

Fakultät für Mathematik und Informatik

Home

Lehre
Lehreveranstaltungen
Masterarbeiten und Bachelorarbeiten
Promotion
Mündliche Prüfungen
Klausuren

Forschung
Projekte
Forschungscluster
Publikationen und Literatursuche
   RSS-Feed unserer Publikationen
   Suche in BibTeX
   Suche in Daffodil

Team

Stellenangebote für unsere Gruppe

Wir über uns (Kontaktadresse, Wegbeschreibung)
KONTAKT
Homepage
Neuigkeiten als RSS-Feed
ENGLISH
Startseite Lehrgebiet Multimedia und Internetanwendungen

Ein neuer, effektiver Ansatz zur Kategorisierung von Web Dokumenten

Zitationsschlüssel:
Klas:99
Titel:
Ein neuer, effektiver Ansatz zur Kategorisierung von Web Dokumenten
Autor(en):
Claus-Peter Klas
In:
Proceedings ADI'99 (Agenten -- Datenbanken -- Information Retrieval)
Jahr:
1999

Zusammenfassung:
Der vorliegende Artikel beschreibt einen neuen, effektiven Ansatz zum automatischen Kategorisieren von Webdokumenten mittels HySpirit, einer probabilistischen, deduktiven Inferenz-Datenbank. Dieser neue Ansatz fa? Dokumente einer Kategorie zu einem neuen Dokument zusammen und bewertet die ?nlichkeit einer Anfrage zu diesen Dokumenten um die Kategorisierung vorzunehmen. Der Ansatz basiert auf einer textuellen Analyse der Webdokumente, um Terme zu extrahieren. Die Termgewichte werden mit Hilfe von Termvorkommen idf und Term-Dokumentvorkommen tf berechnet. Zur Evaluierung ist der Yahoo-Katalog und die Reuters-Kollektion verwendet worden. Fr den Kategorisierung des Yahoo-Katalogs wurden ca. 13% Treffer im ersten Rang erreicht, fr die Reuters-Kollektion ca. 65%.

BibTeX-Eintrag