Grundbegriffe der Informationswissenschaft(en) WS 2024/25 PDF

Summary

This document is lecture notes on the fundamental concepts of information science, focusing on information retrieval. The lecture was given by Prof. Dr. Antje Michel in winter semester 2024/25 at Fachhochschule Potsdam.

Full Transcript

Grundbegriffe der Informationswissenschaft(en) Prof. Dr. Antje Michel WS 2024/25 Agenda der heutigen Sitzung Das Forschungs- und Arbeitsfeld des Information Retrival 2 Was ist Information Retrieval (IR)? IR umfasst die Entwicklung von Systemen zur...

Grundbegriffe der Informationswissenschaft(en) Prof. Dr. Antje Michel WS 2024/25 Agenda der heutigen Sitzung Das Forschungs- und Arbeitsfeld des Information Retrival 2 Was ist Information Retrieval (IR)? IR umfasst die Entwicklung von Systemen zur Speicherung, Suche, Wiederauffindung und Bereitstellung von Informationen. (nach Wormser-Hacker 2023) “The primary objective [of IR] is to recognize and retrieve information that is associated with the user’s request. Since multiple records may be relevant, the results are frequently ranked according to their similarity score to the user’s query” (Hambarde, Proenca 2023, S. 76581) 3 Praktische Anwendungen ▶ Allgemeine Anwendungen z.B. Websuchmaschinen, Empfehlungssysteme, allgemeine wissenschaftliche Informationssuche ▶ Domänenspezifische Anwendungen z.B. Patentinformationen, medizinische Datenbanken, Datenbank chemischer Strukturformeln 4 Historische Entwicklung ▶ Beginn: Klassifikationssysteme, Thesauri (vor Computern) ▶ Wendepunkt: Cranfield-Experimente (1950er), Fokus auf Datenbanken und Relevanzmetriken (Recall, Precision) ▶ Moderne Ära: Websuchmaschinen, Integration interaktiver Komponenten, semantischer (Verstehensbasierter) Konzepte 5 Interdisziplinäres Forschungs- und Arbeitsgebiet ▶ Informatik (Systementwicklung: Algorithmen, Technologie, KI- Integration) ▶ Data Sciences (Zusammenführung strukturierter und unstrukturierter Daten) ▶ Informationswissenschaft (Nutzungsverhalten und Kontexte, Metadatenmodelle, Informationsstrukturierung der Interfaces) ▶ Design-Disziplinen (User Centered Design der Interfaces) ▶ Computerlinguistik (Textrepräsentation) 6 Ziele von IR-Systemen ▶ Systemperspektive: Optimierung von Algorithmen und Relevanzbewertungen für angemessene Suchergebnisse ▷ Relevanz-Ebene: ‚Systemrelevanz‘ (algorithmus-basierte Auswahl) ▶ Nutzerperspektive: Effektive Interaktion mit Wissensobjekten (Text, Bild, Audio) für Informationsbedarf ▷ Relevanz-Ebene: ‚Situational Relevance‘ (subjektive Nützlichkeit) 7 Konzept des Systemorientierten IR 8 Konzept des kognitiven IR Abb.: Kognitives Konzept des IR (Wormer-Hacker, S. 370) 9 Komponenten im Nutzer*innen- Interface (Auswahl) ▶ Suchfeld ▶ Trefferliste Interaktiv ▶ Facetten zur Eingrenzung der Treffer ▶ Unterstützung bei Anfrageformulierung ▶ Möglichkeiten der Visualisierung der Ergebnisse ▶ Benutzer*innenfreundliche Schnittstellen für Export der Ergebnisse 10 Zentrale Herausforderung des IR Anomalous State of Knowledge (ASK, Nicholas Belkin, 1977) ▶ Nutzer*innen starten Suche oft mit unklaren Problemstellungen ▷ Anomalous = unklar, ggf. unangemessen ▶ Herausforderung IR: Systeme müssen dynamisch & iterativ auf Wissensstand der Nutzer*innen reagieren 11 Technologien und Ansätze ▶ Index-basierte IR-Systeme Boolesche Modelle, Vektorraummodelle, probabilistische Modelle ▶ Modell-basierte IR-Systeme KI, neuronale Netze, semantische, kontextualisierte Sprachmodelle (z. B. BERT) 12 Index-basierte IR-Systeme ▶ invertierte Indexstruktur  Speicherung aller Dokumente und deren in inhaltliche Segemente (Tokens) unterteilten Inhalte in einer Datenbank ▶ Vor-Verarbeitung der Dokumente durch Verfahren wie Tokenisierung ▶ Suchanfragen werden in eine ähnliche Form gebracht, um Übereinstimmung mit Index zu ermöglichen 13 Index-basierte IR-Systeme Vorteile ▶ Effizient bei großen Textmengen, schnelle Ausführung Suchoperationen ▶ geeignet für Boolesches Retrieval, Vektorraummodelle u.ä. ▶ Überschaubare Komplexität in der Implementierung Nachteile ▶ Begrenzte Fähigkeit zur semantischen Interpretation ▶ Schwierigkeiten bei der Modellierung von Abhängigkeiten zwischen Begriffen (z. B. Kontext oder Synonyme) 14 Index-basierte IR-Systeme Vorteile ▶ Effizient bei großen Textmengen, schnelle Ausführung Suchoperationen ▶ geeignet für Boolesches Retrieval, Vektorraummodelle u.ä. ▶ Überschaubare Komplexität in der Implementierung Nachteile ▶ Begrenzte Fähigkeit zur semantischen Interpretation ▶ Schwierigkeiten bei der Modellierung von Abhängigkeiten zwischen Begriffen (z. B. Kontext oder Synonyme) 15 Modell-basierte IR-Systeme ▶ nutzen statistische oder maschinelle Lernmodelle zur Relevanzberechnung für Trefferausgabe ▶ Training von Modellen mit großen Datenmengen, & Nutzerfeedback  Verständnis der Beziehungen zwischen Suchanfragen und Dokumenten ▶ Technische Grundlagen: Neuronale Netze, Latent Dirichlet Allocation (LDA) oder BERT-basierte Sprachmodelle 16 Modell-basierte IR-Systeme Vorteile ▶ Fähigkeit, kontextuelle und semantische Abhängigkeiten zu erfassen ▶ Dynamische Anpassung durch Training auf Nutzerdaten & Korpus ▶ Effektiv bei unstrukturierten Daten, z.B. Multimedia/komplexe Anfragen Nachteile ▶ Höhere Rechenkosten und Komplexität in der Implementierung ▶ Abhängigkeit von großen Datenmengen und Rechenleistung 17 Aktuelle Forschungs- und Entwicklungsthemen ▶ Kollaborative Suche von Teams ▶ Explorative Suche zur Inspiration ▶ Integration von Index- und Modellbasierten IR- Ansätzen für effizienten und semantisch komplexen Funktionsumfang 18 Exemplarische Klausurfrage Was sind Ziele von IR-Systemen? ▶ Die Gewährleistung von effektiven Interaktionen der Nutzenden mit den Wissensobjekten (Text, Bild, Audio) zur Befriedigung ihres Informationsbedarfs ▶ Die Optimierung von Algorithmen und Relevanzbewertungen für die Ausgabe angemessener Suchergebnisse ▶ Die Anreicherung der User-Interfaces von IR-Systemen mit unterhaltenden und dekorativen Elementen 19 Exemplarische Klausurfrage Was sind Ziele von IR-Systemen? ▶ Die Gewährleistung von effektiven Interaktionen der Nutzenden mit den Wissensobjekten (Text, Bild, Audio) zur Befriedigung ihres Informationsbedarfs ▶ Die Optimierung von Algorithmen und Relevanzbewertungen für die Ausgabe angemessener Suchergebnisse ▶ Die Anreicherung der User-Interfaces von IR-Systemen mit unterhaltenden und dekorativen Elementen 20 Quellen und Literatur ▶ Belkin, Nicholas (2005) Anomalous State of Knowledge. In: Karen Fisher, Sanda Erdelez, Lynne McKechnie (Hrsg): Theories of Information Behaviour. Medford, New Jearsey: Information Today Inc. S. 44-48. ▶ Hambarde, Kailash. A., & Proenca, Hugo. (2023). Information retrieval: recent advances and beyond. IEEE Access. ▶ Wormser-Hacker, Christa (2023) Informations-wissenschaftliche Perspektiven des Information Retrieval. In: Rainer Kuhlen, Dirk Lewandowski, Wolfgang Semar, Christa Wormser-Hacker (Hrsg.): Grundlagen der Informationswissenschaft, 7., völlig neu gefasste Ausgabe, Berlin: De Gruyter 21 Danke für Ihre Aufmerksamkeit! Abb.: KI-Vorschlag von Powerpoint zum Prompt “Danke” 22

Use Quizgecko on...
Browser
Browser