Podcast
Questions and Answers
Welche der folgenden Phasen gehört nicht zum Vier-Phasen-Modell der Internetrecherche?
Welche der folgenden Phasen gehört nicht zum Vier-Phasen-Modell der Internetrecherche?
Eine Metasuchmaschine greift auf eine eigene Datenbank zu, um Suchergebnisse zu liefern.
Eine Metasuchmaschine greift auf eine eigene Datenbank zu, um Suchergebnisse zu liefern.
Nennen Sie einen Suchoperator, der verwendet wird, um nach Inhalten zu suchen, in denen sowohl Begriff1 als auch Begriff2 vorkommen.
Nennen Sie einen Suchoperator, der verwendet wird, um nach Inhalten zu suchen, in denen sowohl Begriff1 als auch Begriff2 vorkommen.
Die meisten Suchmaschinen setzen den logischen Operator ______ automatisch zwischen Suchbegriffe.
Die meisten Suchmaschinen setzen den logischen Operator ______ automatisch zwischen Suchbegriffe.
Ordnen Sie die Suchmaschinen-Typen ihrer Funktionsweise zu:
Ordnen Sie die Suchmaschinen-Typen ihrer Funktionsweise zu:
Welche Aussage trifft auf Crawler (Spider, Robots) zu?
Welche Aussage trifft auf Crawler (Spider, Robots) zu?
Webseitenbetreiber können Crawlern grundsätzlich verbieten, ihre Inhalte zu indexieren.
Webseitenbetreiber können Crawlern grundsätzlich verbieten, ihre Inhalte zu indexieren.
Welche Technik wird in der Bildersuche verwendet, um identische Bilddateien anhand einer Art 'Fingerabdruck' zu finden?
Welche Technik wird in der Bildersuche verwendet, um identische Bilddateien anhand einer Art 'Fingerabdruck' zu finden?
Um möglichst schnell Trefferergebnisse zu finden, greifen Suchmaschinen auf die ______ Suche zurück, nachdem die Indexliste alphabetisch sortiert wurde.
Um möglichst schnell Trefferergebnisse zu finden, greifen Suchmaschinen auf die ______ Suche zurück, nachdem die Indexliste alphabetisch sortiert wurde.
Was ist das Hauptziel der Vorüberlegungsphase bei der Internetrecherche im Vier-Phasen-Modell?
Was ist das Hauptziel der Vorüberlegungsphase bei der Internetrecherche im Vier-Phasen-Modell?
Bei der Bildersuche werden immer alle Daten im Internet durchsucht.
Bei der Bildersuche werden immer alle Daten im Internet durchsucht.
Nennen Sie einen Anbieter für die Bildersuche im Internet, der sich ausschließlich auf die Bildersuche konzentriert hat und über eine große Datenbank verfügt.
Nennen Sie einen Anbieter für die Bildersuche im Internet, der sich ausschließlich auf die Bildersuche konzentriert hat und über eine große Datenbank verfügt.
Welche Information ist nicht typischerweise in der Indextabelle einer Suchmaschine enthalten?
Welche Information ist nicht typischerweise in der Indextabelle einer Suchmaschine enthalten?
Wenn der Suchoperator ______
vor einem Begriff in einer Suchanfrage steht, muss dieser Begriff im Ergebnis vorkommen.
Wenn der Suchoperator ______
vor einem Begriff in einer Suchanfrage steht, muss dieser Begriff im Ergebnis vorkommen.
Länderspezifische Suchmaschinen sind bei der Recherche irrelevant, da sie nur regionale Inhalte berücksichtigen.
Länderspezifische Suchmaschinen sind bei der Recherche irrelevant, da sie nur regionale Inhalte berücksichtigen.
Nennen Sie den Begriff für die Recherche in frei zugänglichen Quellen im Internet, der im Text erwähnt wird.
Nennen Sie den Begriff für die Recherche in frei zugänglichen Quellen im Internet, der im Text erwähnt wird.
Welche Funktion hat der Platzhalter (*) bei Suchoperatoren?
Welche Funktion hat der Platzhalter (*) bei Suchoperatoren?
Die KI-basierte Bilderkennung befasst sich mit der Erkennung von Orten, Personen, Objekten, Schriften und ______ innerhalb von Bildern.
Die KI-basierte Bilderkennung befasst sich mit der Erkennung von Orten, Personen, Objekten, Schriften und ______ innerhalb von Bildern.
Die sequentielle Suche ist in jedem Fall schneller als die binäre Suche.
Die sequentielle Suche ist in jedem Fall schneller als die binäre Suche.
Nennen Sie eine in Deutschland angesiedelte Personensuchmaschine, die im Text genannt wird.
Nennen Sie eine in Deutschland angesiedelte Personensuchmaschine, die im Text genannt wird.
Flashcards
Internetrecherche
Internetrecherche
Volltextsuchmaschine
Volltextsuchmaschine
Metasuchmaschine
Metasuchmaschine
Katalogsuchmaschine
Katalogsuchmaschine
Spezialsuchmaschine
Spezialsuchmaschine
Crawler/Spider
Crawler/Spider
Binäre Suche
Binäre Suche
Suchoperatoren
Suchoperatoren
Bildersuche
Bildersuche
Prüfsumme (Hashwert)
Prüfsumme (Hashwert)
Indexierung
Indexierung
Metadaten (Bilder)
Metadaten (Bilder)
Künstliche Intelligenz (KI)
Künstliche Intelligenz (KI)
Study Notes
Einführung
- Die Digitalisierung durchdringt fast alle Lebensbereiche, einschließlich der polizeilichen Arbeit.
- Informationen sind schneller online verfügbar, dank Suchmaschinen und sozialer Medien.
- Neben polizeilichen Abfragesystemen ist die Recherche in freien Quellen im Internet wichtig.
- Die Methodik der Suche und eine strukturierte Vorgehensweise sind entscheidend.
- Professionelle Dokumentation ist wichtig für eine gerichtsfeste Beweissammlung im Bereich Open Source Intelligence (OSINT).
- Es werden Grundlagen der Internetrecherche und Funktionsweise von Suchmaschinen erläutert.
- Die Informationsrecherche nach polizeilich relevanten Informationen über Personen und soziale Netzwerke wird beispielhaft dargestellt.
Lernziele
- Die praktische Internetrecherche anhand des Vier-Phasen-Modells soll dargestellt werden können.
- Die Funktionsweise von Suchmaschinen soll erklärt werden können.
- Suchoperatoren sollen verstanden und praktisch angewendet werden können.
- Die praktische Anwendung und Besonderheiten der Bildersuche und Indexierung sollen verstanden werden.
- Die strukturierte Internetrecherche zu Personen soll praktisch angewendet werden können.
Internetrecherche - Vier-Phasen-Modell
- Eine strukturierte Vorgehensweise ist bei der Internetrecherche wichtig.
- Die Internetrecherche kann in vier Phasen unterteilt werden: Vorüberlegung, Suche, Bewertung und Dokumentation.
Vorüberlegung
- Die Auswahl geeigneter Suchbegriffe ist entscheidend für den Erfolg der Personensuche.
- Neben Vor- und Nachname können auch Spitznamen, Orte, Vereine oder Firmennamen eine Rolle spielen.
- Es ist ratsam, vor der Suche eine Liste mit Suchbegriffen zu erstellen.
- Es sollte geklärt werden, welche Begriffe die Suchergebnisse erweitern oder reduzieren könnten.
Suche
- Je mehr über die Zielperson bekannt ist, desto mehr Suchbegriffe können kombiniert werden.
- Durch Suchabfragen werden neue Kenntnisse erlangt, die zu neuen Suchbegriffen führen können.
Bewertung
- Die recherchierten Ergebnisse müssen auf ihren Zusammenhang zur Zielperson überprüft werden.
- Die Auswertung kann problematisch sein, wenn es mehrere Personen mit demselben Namen gibt.
- Neue Informationen auf einer Webseite können die Suche ausweiten.
- Die gefundenen Daten sollten auf Plausibilität geprüft werden.
Dokumentation
- Die einzelnen Phasen der Suche müssen lückenlos und nachvollziehbar dokumentiert werden.
- Der Inhalt einer Webseite kann sich schnell ändern oder nicht mehr erreichbar sein.
- Relevante Treffer müssen so dokumentiert werden, dass sie später nachvollziehbar sind, auch in Gerichtsverhandlungen.
Typisierung von Suchmaschinen
- Suchmaschinen werden in Kategorien unterteilt, die unterschiedliche Suchergebnisse liefern.
Volltextsuchmaschinen
- Durchsuchen mit automatisierten Programmen (Crawler, Spider, Robots) Millionen von Internetseiten täglich.
- Die Inhalte werden indexiert und auf den Servern der Suchmaschinenanbieter gespeichert.
- Bei einer Suchanfrage greift der Anbieter auf die indexierten Daten seiner Datenbank zu.
- Es wird nicht das gesamte Internet durchsucht, sondern nur die indexierten Daten des Anbieters.
- Google ist der bekannteste Volltextsuchmaschinenanbieter mit über 90% Marktanteil.
- Weitere Anbieter mit eigenem Index sind BING und Yahoo.
- Einige Volltextsuchmaschinen greifen auf die Datenbanken von Google oder Bing zu.
- In China ist Baidu und in Russland YANDEX ein Anbieter.
Metasuchmaschinen
- Nutzen keine eigene Datenbank, sondern greifen auf die Datenbanken mehrerer Suchmaschinenanbieter gleichzeitig zu.
- Die Treffer werden aufbereitet und weitergegeben.
- Die Nutzung von Operatoren kann eingeschränkt sein.
- Metager ist die größte und bekannteste Metasuchmaschine in Deutschland.
Katalogsuchmaschinen
- Nutzen keine automatisierten Programme zur Auswahl der Inhalte für die indexierte Datenbank.
- Datenbanken werden von Menschen gepflegt, die entscheiden, welche Internetseiten aufgenommen werden.
- Es findet keine Wort-für-Wort-Indexierung statt, sondern eine inhaltliche Zuordnung.
- Da das Suchergebnis gering sein kann, ergänzen die meisten Anbieter ihre Ergebnisse mit Anfragen bei Volltextsuchmaschinen.
- Yahoo war ein typischer Vertreter (fügt Trefferergebnisse von Bing hinzu).
Spezialsuchmaschinen
- Konzentrieren sich auf ein Spezialgebiet.
- Zum Beispiel Personensuchmaschinen, die Informationen über eine Person aus verschiedenen Quellen suchen.
- Yasni ist eine in Deutschland angesiedelte Personensuchmaschine.
Grundlegende Funktionsweise von Index-basierten Suchmaschinen
- Suchmaschinen mit einem eigenen Index bestehen aus verschiedenen Komponenten.
- Sie erfüllen wesentliche Aufgaben, wie Datensuche.
Funktionsweise
- Mit Hilfe von Programmen wird das Internet unter Einhaltung bestimmter Kriterien durchsucht
- Diese Programme werden Crawler oder Spider genannt
- Aus den aufgefundenen Webseiten verfolgt der Crawler die enthaltenen Verlinkungen
- Daten werden analysiert und nach Verlinkungen durchsucht.
- Da sich die Daten auf einer Webseite ständig verändern können, werden bereits gefundene Webseiten immer wieder „aufgesucht“ und analysiert.
- Webseiten, die nicht verlinkt sind, werden von einem Crawler grundsätzlich nicht gefunden.
- Neue Webseiten können einer Suchmaschine „gemeldet“ werden, damit diese in den Index aufgenommen werden.
- Ein Webseitenbetreiber kann Crawlern verbieten, den Inhalt zu indexieren.
- Die vom Crawler gesammelten Daten werden indexiert, mit Schlagwörtern (Keywords) versehen und in eine Datenbank eingestellt.
- Der Ersteller einer Webseite kann einen Katalog von Schlagwörtern selbst erstellen: Adresse, Page-Ranking, Schlüsselworte, Querverweise.
- Volltextsuchmaschinen, Katalogsuchmaschinen und ein Teil der Spezialsuchmaschinen haben eine eigene Indextabelle.
Suche im Index und Generierung von Ergebnislisten
- Nach der Anfrage wird eine Ergebnisliste präsentiert
- Diese basiert auf der Bewertung (Page-Ranking)
- Dies wird beeinflusst durch weitere Informationen.
- Der verwendete Algorithmus wird vom jeweiligen Anbieter in der Regel geheim gehalten
- Um schnell Treffer zu finden, wird die binäre Suche verwendet.
- Hier muss die Indexliste alphabetisch sortiert sein: Suchwort gefunden, nicht gefunden (obere/untere Hälfte)
Suchoperatoren
- Bei der Internetsuche werden Suchbegriffe in Suchmaschinen eingegeben.
- Durch Operatoren und Filter wird die Treffermenge beeinflusst.
- Es gibt Standardsuchoperatoren (Boolesche Operatoren).
Suchoperator | Funktion |
---|---|
Begriff1 AND Begriff2 | Suche nach Inhalten, in welchen sowohl Begriff1 als auch Begriff2 vorkommt. Der Operator AND wird von der Suchmaschine automatisch gesetzt |
Begriff1 OR Begriff2 | Suche nach Begriff1 oder Begriff2 |
-Begriff oder NOT Begriff | Der genannte Begriff darf nicht vorkommen |
+Begriff | Der genannte Begriff muss vorkommen |
"Begriff1 Begriff2 Begriff3" | Im Text müssen die Begriffe exakt in der gewählten Reihenfolge erscheinen |
* | Platzhalter |
.. | Suche zwischen zwei Werten. Beispiel: notebook 300..400 Euro |
- Der logische Operator AND wird von den meisten Suchmaschinen automatisch gesetzt.
- Bei der Suchanfrage Gewalt gegen Polizeibeamte setzt Google intern den Operator AND.
- Aus der Anfrage wird Gewalt AND gegen AND Polizeibeamte.
Bildersuche
- Für die Suche nach Bilddateien gibt es verschiedene Suchmaschinen: Google und Bing.
- Jeder Anbieter nutzt verschiedene Techniken zum Aufbau der indexierten Datenbank.
- Unterschiedliche Ergebnisse sind die Regel: Suche nach Bildern sollte nicht auf einen Dienst beschränkt werden.
- Techniken: Indexierung über Dateinamen, Prüfsummen, Farbanteile, Metadaten und Text.
Indexierung über Dateinamen
- Hier wird lediglich der Dateiname indexiert, kein Vergleich des Bildes.
Indexierung über Prüfsummen
- Jede Bilddatei kann durch ein Verfahren (Hashfunktion) eine eindeutige Prüfsumme erstellen.
- Diese ist mit einem Fingerabdruck ist vergleichbar.
Indexierung über Farbanteile
- Bilder werden über Berechnung von Farbanteilen ausgesucht.
Indexierung über Metadaten
- Bilder enthalten Metadaten (GPS-Daten, wenn das Bild mit einem Smartphone und aktiviertem GPS aufgenommen wurde).
Indexierung über Text
- Suchmaschinen betrachten den Text in der Umgebung des Bildes.
Bildererkennung über künstliche Intelligenz.
- Die künstliche Software dient zur Erkennung von Orten, Personen, Objekten, Schriften und Aktionen innerhalb von Bildern.
Mischform
- Moderne Suchmaschinen verwenden Mischformen der Techniken.
Praktische Anwendung der Bildersuche auf - Suche über Google / Bing
- Google und Bing haben einen eigenen Suchindex für Bilder
- Man sollte auf beiden Suchmaschinen nach Bildern suchen.
- Die Bildersuche bei BING unterscheidet sich nur unwesentlich.
- Im Eingabefeld wird ein Suchbegriff eingegeben, Google sucht nun Bilddateien zum Suchbegriff, über das Kamerasymbol stehen weitere Optionen zur Verfügung.
- Nach dem Aufruf des Kamerasymbols kann über den Button „Bild-URL einfügen“ mit einer im Internetbrowser angezeigten Bilddatei eine Recherche durchgeführt werden.
- Hierzu muss der Grafik-Link kopiert und im Eingabefeld eingetragen werden.
- Über die Auswahl „Bild hochladen“ wird eine Recherche zu einer hochgeladenen Bilddatei gestartet.
Trefferliste
- Die angezeigte Trefferliste kann weiter gefiltert werden.
- Das kann zu einer erheblichen Reduktion des sichtbaren Bildmaterials führen.
- Die Bilder werden auf einen Server von Google hochgeladen (steht grundsätzlich im Ausland)
- Die Suche nach Bildern im dienstlichen Kontext bedarf grundsätzlich der Absprache mit der Staatsanwaltschaft.
- Auch bei der Bildersuche werden grundsätzlich nur die Daten in der zur Suchmaschine gehörenden Index-Datenbank abgefragt.
- Weitere Suchmaschinen mit dem Schwerpunkt der Bildersuche: Tineye.
- Tineye ist ein bekannter Anbieter für Bildersuche.
- Tineye versieht die Bilder mit verschiedenen Hashwerten und gleicht diese ab.
- Analog zu Google besteht die Möglichkeit, Bilddateien „hochzuladen“ oder die URL zu vergleichen.
- Rechtlich ist zu beachten, dass die Bilddatei auf einen Server des Anbieters in den USA hochgeladen wird. Tineye speichert diese nach Angaben nicht.
- Hier eine nicht abschließende Aufzählung von weiteren Anbietern: https://www.reverseimagesearch.com/de, https://www.yandex.com/images, https://www.imageidentify.com, https://www.osintcombine.com/reverse-image-analyzer
- Ein Fallbeispiel hierzu finden Sie in ILIAS im elektronischen Studienbrief.
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.