FernUniversität Hagen

Fakultät für Mathematik und Informatik

Home

Lehre
Lehreveranstaltungen
Masterarbeiten und Bachelorarbeiten
Promotion
Mündliche Prüfungen
Klausuren

Forschung
Projekte
Forschungscluster
Publikationen und Literatursuche

Team

Stellenangebote für unsere Gruppe

Wir über uns (Kontaktadresse, Wegbeschreibung)
KONTAKT
Homepage
Neuigkeiten als RSS-Feed
ENGLISH
Startseite Lehrgebiet Multimedia und Internetanwendungen

01920 Die Geometrie des Information Retrieval - Seminar, Sommersemester 2010

Lehrpersonen

Dozent(in)

Formalia

Beschreibung

Geometrische Modelle haben eine lange Tradition im Bereich des Information Retrieval (IR). Eine der bekanntesten und immer noch erfolgreichsten Ansätze, das Vektorraummodell (VRM), sieht Anfragen und Dokumente repräsentiert als Vektoren; Dokumente werden hinsichtlich ihrer Ähnlichkeit zum Anfragevektor in der Resultatliste angeordnet. Das VRM dient als Grundlage zahlreicher weiterer Ansätze nicht nur aus dem Bereich des IR, sondern auch aus verwandten Bereichen wie der Kategorisierung oder der Informationsfilterung. Nicht zuletzt inspiriert durch das Buch "The Geometry of Information Retrieval" von Keith van Rijsbergen wurden in den letzten Jahren weiterführende geometrische Ansätze entwickelt, die teilweise sogar Anleihen bei der Quantenmechanik machen bzw. von dessen Konzepten inspiriert worden sind. Diese Ansätze versuchen u.A., Einschränkungen des VRM zu überwinden und Kontextinformationen oder auch die Möglichkeit der Interaktion mit dem System in den Suchprozess einzubinden. Gerade die enge Beziehung zwischen Wahrscheinlichkeitstheorie, Logik und Geometrie und deren Beschreibung in Hilbert-Räumen, sowie die Anwendung von Konzepten der Quantenmechanik gehören dabei zu den spannenden Aspekten bei der Entwicklung zukünftiger Retrievalmodelle und dem "Google von morgen". Im Seminar sollen bisher vorgeschlagene geometrische Modelle des Information Retrieval erarbeitet und kritisch diskutiert werden. Die benötigten mathematischen Kenntnisse werden dabei überblicksartig bereitgestellt.

Voraussetzungen

Das Seminar richtet sich an Studierende, die an Fragestellungen des Information Retrieval interessiert sind. Hilfreich sind Kenntnisse aus den Kursen Daten- und Dokumentenmanagement im Internet, sowie Informations- und Wissensmanagement im Internet (Kursnummern 01873 und 01874). Grundkenntnisse der linearen Algebra auf dem Niveau der Schulmathematik (Sekundarstufe II) sind hilfreich.

Durchführung

Das Seminar wird als virtuelles Seminar - also vollständig über das Internet - durchgeführt. Seminarbeiträge werden zum Abschluss des Seminars in einem Vortrag präsentiert. Daher sind eine schnelle Internetverbindung (> ISDN) und ein multimediafähiger PC (Mikrofon, Kopfhörer und Soundkarte) unabdingbar. Die Teilnahme an den Vorträgen ist obligatorisch, bitte berücksichtigen Sie die unten angegebenen Termine. Zu jedem Vortrag ist eine schriftliche Ausarbeitung anzufertigen.

Themenvergabe

Bis: 16.3.2010

Abgabe der ersten Version/Gliederung

bis: 8.5.2010

Abgabe der Endversion der Ausarbeitung und Vorträge

bis: 8.6.2010

Themen

  • Das Vektorraummodel
    • Salton G, Wong A, Yang CS. A vector space model for automatic indexing. Communications of the ACM. 1975;18(11). Available at: http://portal.acm.org/citation.cfm?id=361219.361220.
    • Wong SK, Ziarko W, Raghavan VV, Wong PC. On modeling of information retrieval concepts in vector spaces. ACM Transactions on Database Systems (TODS). 1987;12(2). Available at: http://portal.acm.org/citation.cfm?id=22957.
  • Latent Semantic Indexing
    • Deerwester S, Dumais ST, Furnas GW, Landauer TK, Harshman R. Indexing by Latent Semantic Analysis. Journal of the American Society for Information Science. 1990;41:391-407.
  • Negation und Orthogonalität in Vektorräumen
    • Widdows D. Orthogonal negation in vector spaces for modelling word-meanings and document retrieval. In: Proceedings of the 41st Annual Meeting on Association for Computational Linguistics.; 2003. Available at: http://portal.acm.org/citation.cfm?id=1075114.
    • Widdows D. Logic with Vectors: Ambiguous Words and Quantum States. In: Widdows D Geometry and Meaning. CSLI Publications; 2004:200-245.
  • Dokumentrepräsentation
    • Chen L, Zeng J, Tokuda N. A "Stereo" Document Representation for Textual Information Retrieval. Journal of the American Society for Information Science. 2006;57(6):768-774.
  • Die Geometrie des Information Retrieval
    • van Rijsbergen K. Chapter 6: The geometry of IR. In: The Geometry of Information Retrieval. Cambridge, UK: Cambridge University Press; 2004:73-100.
  • Geometrische Modellierung von Kontext
    • Melucci M. A basis for information retrieval in context. ACM Transactions on Information Systems (TOIS). 2008;26(3). Available at: http://portal.acm.org/citation.cfm?id=1361687.
  • Das IQIR-Modell
    • Piwowarski B, Lalmas M. A Quantum-based Model for Interactive Information Retrieval. In: Proceeedings of the 2nd International Conference on the Theory of Information Retrieval (ICTIR 2009). Cambridge, UK; 2009.
    • Piwowarski B, Frommholz I, Moshfeghi Y, Lalmas M, van Rijsbergen K. Filtering documents with subspaces. In: Proceedings of the 32nd European Conference on Information Retrieval (ECIR 2010).; 2010.
    • Piwowarski B, Frommholz I, Lalmas M, van Rijsbergen K. Exploring a Multidimensional Representation of Documents and Queries. In: Proceedings of the 9th RIAO Conference (RIAO 2010). Paris, France; 2010.
  • Das Quantum Probability Ranking Prinzip
    • Zuccon G, Azzopardi L, van Rijsbergen K. The Quantum Probability Ranking Principle for Information Retrieval. In: Advances in Information Retrieval Theory - Proc. of ICTIR 2009.Vol 5766. Lecture Notes in Computer Science. Berlin, Heidelberg: Springer Berlin Heidelberg; 2009:232-240. Available at: http://www.springerlink.com/content/y52m06045224641r.
    • Zuccon G, Azzopardi L. Using the Quantum Probability Ranking Principle to Rank Interdependent Documents. In: Proc. of the 32nd European Conference on Information Retrieval. Milton Keynes; 2010.
  • Spooky Activation At A Distance ? Verschränkung von Wörtern
    • Bruza P, Kitto K, McEvoy D, McEvoy C. Entangling words and meaning. In: Proc. of the Second Quantum Interaction Symposium (QI 2008).Vol 2008.; 2008:118-124. Available at: http://eprints.qut.edu.au/11193/.
    • Bruza P, Kitto K, Nelson D, McEvoy C. Extracting Spooky-Activation-at-a-Distance from Considerations of Entanglement. In: Proc. of the Third Quantum Interaction Symposium (QI 2009).Vol 5494. Lecture Notes in Computer Science. Berlin, Heidelberg: Springer Berlin Heidelberg; 2009:71-83. Available at: http://www.springerlink.com/content/k822826535p7u655.
  • Information Retrieval und Datenbanken
    • Schmitt I. QQL : A DB&IR Query Language. The VLDB journal. 2008;17(1):39-56. Available at: http://cat.inist.fr/?aModele=afficheN&cpsidt=20038185.

Betreuung

Dr. Ingo Frommholz (University of Glasgow) E-Mail: ingo@dcs.gla.ac.uk

Dr. rer. nat. Claus-Peter Klas, Tel.: 02331 / 987-4775 E-Mail: Claus-Peter.Klas@FernUni-Hagen.de

Dipl.-Inform. Felix Engel, Tel.: 02331 / 987-4775 E-Mail: Felix.Engel@FernUni-Hagen.de