FernUniversität Hagen

Fakultät für Mathematik und Informatik

Home

Lehre
Lehreveranstaltungen
Masterarbeiten und Bachelorarbeiten
   Offene Themen
   Reservierte Themen
   Laufende Themen
   Abgeschlossene Themen
   Hinweise für Studierende
Promotion
Mündliche Prüfungen
Klausuren

Forschung
Projekte
Forschungscluster
Publikationen und Literatursuche

Team

Stellenangebote für unsere Gruppe

Wir über uns (Kontaktadresse, Wegbeschreibung)
KONTAKT
Homepage
Neuigkeiten als RSS-Feed
ENGLISH
Startseite Lehrgebiet Multimedia und Internetanwendungen

Abgeschlossene Masterarbeit: Anwendung von Regeln für die Auszeichnung von Testdaten in Learning to Rank Verfahren für die Expertensuche

Betreuer

Bearbeiter

  • Felix Beierle

Abgabetermin

2014-06

Formalia

Voraussetzungen
  • Grundlegendes Verständnis von Konzepten im Bereich der semantischen Suche
  • Kenntnisse im Umgang mit Ontologien und OWIM SemSearch

Aufgabenstellung

Unterschiedliche Verfahren zum Lernen von Hypothesen im Bereich der Maschinenlernverfahren existieren. Eines der gängigen Verfahren ist dabei die Anwendung von Regeln, insbesondere weil Regeln für den Menschen eine einfach nachvollziehbar Beschreibung der zu lernenden Hypothese darstellen. OWIM SemSearch ist eine Software API die externes Wissen über die Anwendung von Instanzen einer semantischen Wissensbasis nutzt um Relevanz-Ranking zwischen einer Anfrageinstanz und einer Menge von Zielinstanzen zu berechnen. In OWIM SemSearch wird dabei für die Berechnung einer solchen Relevanz-Ordnung externes Wissen genutzt, dass mittels Berechnung spezieller Funktionen eingesetzt wird. Berechnetes externes Wissen wird in OWIM SemSearch über einen Merkmalsvektor aggregiert, um über spezifisches Maschinenlernverfahren (Learning To Rank) in einer Rankingfunktion zusammengefasst werden zu können. Wie auch viele andere Verfahren im Bereich des maschinellen Lernens basiert auch Learning to Rank auf der Bereitstellung von ausgezeichneten Testdaten. Manuelle Auszeichnung der Testdaten ist jedoch teuer, da dies manuell von einem Domänenexperten durchgeführt werden muss. Um das Problem der manuellen Auszeichnung von Trainingsdaten durch Experten aufzuweichen befasst sich diese Arbeit insofern mit einem Ansatz zur semiautomatischen Auszeichnungen von Testdaten für den Einsatz in OWIM SemSearch. Dazu sollen in einem theoretischen Teil aktuelle Techniken und Anwendungen im Bereich des Trainings von LTR Ansätzen vorgestellt werden. Aufbauend aus den Erkenntnissen soll ein Modell aufgestellt werden wie über Regeln eine semiautomatische Relevanz-Auszeichnung von Testdaten in OWIM SemSearch vorgenommen werden kann. Die im Modell identifizierten Komponenten sollen in einem praktischen Teil implementiert und in OWIM SemSearch integriert werden. Abschließend soll anhand der Implementierung untersucht werde wie gut sich Anforderungen aus dem Bereich Experten Seeking in das Verfahren zur Expertensuche integrieren lassen. Diese Arbeit umfasst insofern die Bearbeitung folgende Punkte:

Diese Arbeit umfasst insofern:

  • Analyse von Regelbasierten Verfahren zum Lernen von Hypothesen
  • Modellierung eines Verfahrens zur semiautomatischen Auszeichnung von Testdaten zur Anwendung im Expertensuchverfahren
  • Integration der Erkenntnisse in OWIM SemSearch
  • Auswirkung von semi-überwachten Learning Verfahren auf Basis von Relevance Feedback Daten.
  • Analyse und Evaluation anhand der Integration von Expertise Seeking Parametern in das Auszeichnungsverfahren.