FernUniversität Hagen

Fakultät für Mathematik und Informatik

Home

Lehre
Lehreveranstaltungen
Masterarbeiten und Bachelorarbeiten
   Offene Themen
   Reservierte Themen
   Laufende Themen
   Abgeschlossene Themen
   Hinweise für Studierende
Promotion
Mündliche Prüfungen
Klausuren

Forschung
Projekte
Forschungscluster
Publikationen und Literatursuche

Team

Stellenangebote für unsere Gruppe

Wir über uns (Kontaktadresse, Wegbeschreibung)
KONTAKT
Homepage
Neuigkeiten als RSS-Feed
ENGLISH
Startseite Lehrgebiet Multimedia und Internetanwendungen

Abgeschlossene Bachelorarbeit: Entwicklung von Strategien zum Caching und Aufbau von Merkmalsvektoren für Suchanwendungen im Semantic Web Umfeld

Betreuer

Formalia

Voraussetzungen
  • Gute Kenntnisse im Bereich von Semantic Web Anwendungen
    JAVA, Webtechnologien

Aufgabenstellung

Diese Bachelorarbeit ist eingebettet im Rahmen des von der Europäischen Kommission geförderten Projektes Scalable Semantic Product Data Stream Management for Collaboration and Decision Making in Engineering (SMART VORTEX)und einer Dissertation die im Rahmen des SMART VORTEX Projektes umgesetzt wird. Ziel des SMART VORTEX Projektes ist es eine technologische Infrastruktur für das Management von massiven und verteilten Datenströmen bereitzustellen. Dies umfasst insbesondere auch die Bereitstellung einer umfassenden Sammlung von Anwendungen zur Unterstützung von Kollaboration und Entscheidungsprozessen.

In diesem Rahmen wird an der Fernuniversität in Hagen ein Softwaremodul für die Suche nach Experten im Umfeld von semantisch annotierten Unternehmensdaten entwickelt. Das vorhandene Softwaremodul soll dabei um verschiedene funktionale/nichtfunktionale Aspekte erweitert und als Service in die SMART VORTEX Infrastruktur integriert werden. Die Ergebnisse dieser Arbeit fliesen sowohl in das Projekt direkt, als auch in die Evaluation der im diesem Umfeld bearbeiteten Dissertation ein.

OWIMSemSearch ist eine konfigurierbare API zur Relevanzsortierung von Instanzen eines semantisch annotierten Datenbestandes. Die Berechnung der Relevanz von Instanzen, gegeben einer Suchanfrage basiert auf der Auswertung eines Merkmalsvektors, dessen Parameter Zeit und Speicher intensiv berechnet werden. Selbst für kleinere Datenbestände stellen die aktuellen Berechnungen ein Performance Problem dar. Es existiert zwar bereits ein Caching-Mechanismus, welcher das Performance Problem teilweise löst, jedoch noch nicht optimal auf die Anforderung der Verarbeitung größerer Datenmengen abgestimmt ist. Diese Bachelorabeit ist insbesondere mit Entwicklung von Strategien befasst, welche das Performance und Speicherprobleme von OWIMSemSearch, bei der Verarbeitung großer Datenmengen in einem Webservice basiertem Umfeld betreffen.

Die Bachelorarbeit umfaßt konkret folgende Aufgaben:

  • Analyse des aktuellen Standes der vorliegenden Software hinsichtlich der Speicherauslastung und Performance beim Aufbau von Merkmalsvektoren.
  • Integration des letzten Entwicklungsstandes von OWIM.
  • Verwendung effizienter Datenstrukturen
  • Die Entwicklung von Filtermechanismen, welche die zu berechnende Ergebnismenge vor der Berechnung der Merkmalsvektoren eingrenzen
  • Die Berücksichtigung von Schwellwerten, welche zu einem frühzeitigen Abbruch der Merkmalsvektorberechnung führen
  • Die Umsetzung von dynamischen Caching-Mechanismen, um zu verhindern dass der gesamte Datenbestand im RAM vorliegen muss
  • Bereitstellung eines REST-Services der eine Schnittstelle zum lernen und Ranken (+ Filter)
  • Evaluation der angepassten Speicherauslastung und Performance beim Aufbau von Merkmalsvektoren