FernUniversität Hagen

Fakultät für Mathematik und Informatik

Home

Lehre
Lehreveranstaltungen
Masterarbeiten und Bachelorarbeiten
   Offene Themen
   Reservierte Themen
   Laufende Themen
   Abgeschlossene Themen
   Hinweise für Studierende
Promotion
Mündliche Prüfungen
Klausuren

Forschung
Projekte
Forschungscluster
Publikationen und Literatursuche

Team

Stellenangebote für unsere Gruppe

Wir über uns (Kontaktadresse, Wegbeschreibung)
KONTAKT
Homepage
Neuigkeiten als RSS-Feed
ENGLISH
Startseite Lehrgebiet Multimedia und Internetanwendungen

Offene Diplomarbeit: Generierung von Kontextinformationen im Bereich wissenschaftlicher Publikationen durch effiziente Algorithmen und Datenstrukturen.

Betreuer

Verwandte Projekte

SHAMAN
Sustaining Heritage Access through Multivalent ArchiviNg

Aufgabenstellung

Im Rahmen des DFG-Projektes DAFFODIL ist ein nutzerorientiertes Zugangssystem für heterogene digitale Bibliotheken entwickelt. Die Suche findet zur Zeit mittels Wrapper statt, die eine Livesuche durchführt. Diese Suche dauert aufgrund der Suche im Internet extrem lange und führt beim Nutzer im Extremfall zu Suchzeiten von mehreren Minuten. Im Rahmen des EU Projektes SHAMAN wird versucht, den Kontext von wissenschaftlichen Publikationen für den Benutzer zur Suche heranzuziehen. Dazu muss diese Kontext identifiziert, modelliert und gespeichert werden.

Aufgabe dieser Diplomarbeit ist es zum Einen die Suche für den Benutzer zu beschleunigen und zum Anderen Datenstrukturen zu entwickeln, die direkt die kontextbasierten Such- und Browsewerkzeuge von Daffodil unterstützen. Im speziellen sollen folgende Ideen modelliert und implementiert werden:

  • Evaluierung des bestehenden Wrappertoolkits bzgl. der Laufzeiteffizienz und Update auf den State of the Art.
  • Entwicklung einer generischen Polling Funktionalität, die es Ermöglicht, internetbasierte Datenquellen abzufragen und die gefundenen Informationen in einem zentralen Index zu chachen. Hierbei ist auf Effizienz und Effektivität zu achten, sodass die Datenquellen nicht gestört wird. Zu diesen Datenquellen gehören:
    • DBLP, CiteSeer, ACM, Springer Link, IEEE, HCIBIB und LeaBib
  • Aufbau von Datenstrukturen aus den gecachten Daten um Funktionen wie Co-Autoren, Referenzen und Citationen auf diese Datenbasis direkt zu nutzen.

Literatur

Claus-Peter Klas (2007).
Strategische Unterstützung bei der Informationssuche in Digitalen Bibliotheken. PhD thesis

Markus Rupp (2002).
Wrapper für digitale Bibliotheken in Daffodil. Masterthesis