Big Data und KI 6
48 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Welche der folgenden Aussagen beschreibt am besten die datenschutzrechtlichen Herausforderungen im Kontext von Big Data?

  • Die fehlende Transparenz in der Verarbeitung persönlicher Daten führt zu einem Kontrollverlust des Einzelnen und erschwert die Nachvollziehbarkeit algorithmischer Entscheidungen. (correct)
  • Datenschutzrechtliche Bedenken sind irrelevant, da Big Data hauptsächlich auf anonymisierten Daten basiert.
  • Big Data ermöglicht eine stärkere Kontrolle des Einzelnen über seine persönlichen Daten durch transparente Algorithmen.
  • Die Datenschutz-Grundverordnung (DSGVO) hat alle datenschutzrechtlichen Probleme im Bereich Big Data vollständig gelöst.

Warum ist Transparenz im Zusammenhang mit personalisierten Algorithmen von grosser Bedeutung?

  • Transparenz dient lediglich dazu, die Komplexität von Algorithmen zu verschleiern.
  • Transparenz ist nur für Programmierer relevant, nicht für Endnutzer.
  • Transparenz ermöglicht es, Verzerrungen zu analysieren und kritisch zu reflektieren, die zu Diskriminierung führen könnten. (correct)
  • Transparenz ist unwichtig, da Algorithmen immer objektive Entscheidungen treffen.

Welches Kriterium wird verwendet, um Datentypen im Rahmen einer datenschutzrechtlichen Betrachtung zu unterscheiden?

  • Die Unterscheidung, ob Daten explizit vom Nutzer angegeben oder automatisch erzeugt werden. (correct)
  • Die Art der Hardware, auf der die Daten gespeichert sind.
  • Die Größe der Datensätze in Gigabyte.
  • Die Anzahl der Mitarbeiter, die Zugriff auf die Daten haben.

Inwiefern verstärkt Big Data bekannte Risiken im Bereich des Datenschutzes?

<p>Big Data verstärkt Risiken durch die massenhafte Sammlung, Verknüpfung und Analyse von Daten, was zu fehlender Transparenz und Kontrollverlust führen kann. (A)</p> Signup and view all the answers

Welche Rolle spielt die Datenethik im Kontext von Big Data?

<p>Datenethik ergänzt den Datenschutz durch die Reflexion von Werten und moralischen Prinzipien im Umgang mit Daten. (C)</p> Signup and view all the answers

Wie beeinflusst die Erstellung von Nutzerprofilen durch Big Data die Personalisierung von Diensten?

<p>Nutzerprofile ermöglichen eine Personalisierung von Diensten, die eine völlig neue Qualität erreicht. (A)</p> Signup and view all the answers

Was ist eine mögliche Konsequenz fehlender Transparenz bei der Verarbeitung persönlicher Daten durch lernende Algorithmen?

<p>Der Einzelne verliert die Kontrolle über die Sammlung und Verwendung seiner persönlichen Daten. (B)</p> Signup and view all the answers

Welches Beispiel verdeutlicht einen Datentyp, der automatisch erzeugt wird, während ein Nutzer einen Dienst nutzt?

<p>Mobilitätsdaten, die durch das Mitführen eines Smartphones erzeugt werden. (D)</p> Signup and view all the answers

Welche Aussage trifft auf Metadaten im Kontext von Instant Messaging nicht zu?

<p>Sie beinhalten den tatsächlichen Inhalt der ausgetauschten Nachrichten. (A)</p> Signup and view all the answers

Warum unterliegen Inhalts- und Verhaltensdaten im Rahmen von Big-Data-Analysen einem besonderen datenschutzrechtlichen Schutz?

<p>Weil ihre Auswertung tiefer in die Privatsphäre der Nutzer eindringt als die Auswertung von Metadaten. (D)</p> Signup and view all the answers

Was bedeutet Ende-zu-Ende-Verschlüsselung im Kontext von Nachrichtendiensten bezüglich des Datenschutzes?

<p>Der Betreiber des Dienstes kann den Inhalt der Nachrichten nicht mitlesen, hat aber weiterhin Zugriff auf die Metadaten. (B)</p> Signup and view all the answers

Welche der folgenden Datenarten würde nicht unter den Begriff 'Nutzerdaten' fallen?

<p>Der Inhalt einer E-Mail, die ein Nutzer über einen Online-Dienst versendet. (C)</p> Signup and view all the answers

Wie unterscheiden sich Inhaltsdaten von Metadaten im Zusammenhang mit Online-Kommunikation?

<p>Inhaltsdaten umfassen den eigentlichen Inhalt der Nachricht, während Metadaten Informationen über die Nachricht selbst liefern (z.B. Größe, Zeitpunkt). (A)</p> Signup and view all the answers

Ein Fitness-Tracker erfasst Bewegungsdaten und den Kalorienverbrauch eines Nutzers. Zu welcher Kategorie gehören diese Daten?

<p>Verhaltens- und Kontextdaten (C)</p> Signup and view all the answers

Welche der folgenden Aussagen beschreibt am besten die datenschutzrechtliche Herausforderung im Zusammenhang mit 'Big Data'?

<p>Die schiere Menge und Vielfalt der Daten ermöglicht es oft, Rückschlüsse auf Einzelpersonen zu ziehen, auch wenn die Daten zunächst anonymisiert erscheinen. (A)</p> Signup and view all the answers

Ein Unternehmen analysiert die Online-Aktivitäten seiner Kunden, um personalisierte Werbung auszuspielen. Welche Art von Daten wird hierfür wahrscheinlich verwendet?

<p>Vorwiegend Inhalts- und Verhaltensdaten, um ein detailliertes Profil der Kunden zu erstellen. (A)</p> Signup and view all the answers

Welche der folgenden Aussagen beschreibt am besten die Situation vor der Einführung der DSGVO bezüglich der Datenverarbeitung?

<p>Daten durften getrennt pro Dienst und unter individuellen Nutzungsbedingungen verarbeitet werden. (D)</p> Signup and view all the answers

Welches Jahr markiert die Einführung der Datenschutz-Grundverordnung (DSGVO) in der Europäischen Union?

<p>2018 (B)</p> Signup and view all the answers

Unter welcher der folgenden Bedingungen ist die Verarbeitung personenbezogener Daten NICHT zulässig laut DSGVO?

<p>Die Verarbeitung dient der Verfolgung der privaten Interessen des Verantwortlichen, ohne Zustimmung der betroffenen Person. (A)</p> Signup and view all the answers

In welcher der folgenden Situationen wäre die Verarbeitung personenbezogener Daten gemäß DSGVO zulässig?

<p>Ein Krankenhaus verarbeitet Patientendaten, um lebenswichtige Interessen des Patienten zu schützen. (A)</p> Signup and view all the answers

Welche Rolle spielt der Grundsatz der Zweckbindung im Kontext von Big-Data-Analysen und der DSGVO?

<p>Er schränkt die Nutzung von Daten auf den ursprünglichen, bei der Erhebung angegebenen Zweck ein. (B)</p> Signup and view all the answers

Welche Aussage beschreibt am besten den Grundsatz der Zweckbindung im Kontext von personenbezogenen Daten?

<p>Personenbezogene Daten dürfen nur für einen spezifischen, klaren und rechtmäßigen Zweck erhoben und verarbeitet werden. (C)</p> Signup and view all the answers

Warum stellt die Verknüpfung von Daten aus unterschiedlichen Quellen und Kontexten eine Herausforderung für den Grundsatz der Zweckbindung dar?

<p>Weil der ursprüngliche Zweck der Datenerhebung möglicherweise nicht mit dem neuen Verarbeitungszweck vereinbar ist. (B)</p> Signup and view all the answers

Was bedeutet der Begriff 'berechtigte Interessen' im Kontext der DSGVO?

<p>Die Interessen des Verantwortlichen oder eines Dritten, die die Verarbeitung von Daten rechtfertigen können, solange die Interessen der betroffenen Person nicht überwiegen. (B)</p> Signup and view all the answers

Ein Unternehmen möchte Kundendaten für eine neue Marketingkampagne nutzen, die nicht mit dem ursprünglichen Zweck der Datenerhebung übereinstimmt. Was sollte das Unternehmen gemäß DSGVO tun?

<p>Die Kunden über die neue Verwendung informieren und ihre erneute Einwilligung einholen. (A)</p> Signup and view all the answers

Inwiefern beeinflusst die DSGVO Big-Data-Anwendungen, die für statistische Zwecke genutzt werden?

<p>Die DSGVO stellt klar, dass die Ergebnisse der Datenverarbeitung zu statistischen Zwecken keine personenbezogenen Daten enthalten dürfen. (D)</p> Signup and view all the answers

Welche der folgenden Aussagen beschreibt am besten die Bedeutung von Vertrauen im Kontext von Big-Data-Analysen?

<p>Vertrauen ist eine wesentliche Bedingung, die sich auf verschiedene Phasen und Ebenen bezieht, einschließlich des Vertrauens in Systeme, Daten und Algorithmen. (B)</p> Signup and view all the answers

Ein kleines Startup-Unternehmen verarbeitet personenbezogene Daten. Welche Aussage beschreibt die Situation des Unternehmens im Bezug auf die DSGVO korrekt?

<p>Die DSGVO gilt grundsätzlich für alle Unternehmen, die personenbezogene Daten verarbeiten, unabhängig von ihrer Größe. (C)</p> Signup and view all the answers

Was ist ein wesentlicher Grund dafür, dass Nutzer von datenverarbeitenden Anwendungen und sozialen Netzwerken sich oft nicht bewusst sind, welche Daten sie erzeugen und wie diese verarbeitet werden?

<p>Ein fehlendes Verständnis des Geschäftsmodells der Dienste oder der technischen Prozesse ist oft die Ursache. (C)</p> Signup and view all the answers

Warum ist es für Diensteanbieter essenziell, dass Nutzer ihnen vertrauen, dass sie verantwortungsvoll mit ihren Daten umgehen?

<p>Weil Nutzer dem Dienst sonst ihr Vertrauen entziehen und zu einem anderen Anbieter wechseln könnten. (D)</p> Signup and view all the answers

Welche Herausforderung ergibt sich aus der Tatsache, dass viele Big-Data-Anwendungen auf Daten basieren, die aus unterschiedlichen Kontexten stammen?

<p>Die ursprünglichen Zwecke der Datenerhebung sind möglicherweise nicht kompatibel. (B)</p> Signup and view all the answers

Welche Konsequenz kann ein fehlendes Vertrauen in Datenverarbeiter für die Nutzer haben?

<p>Nutzer können zu einem anderen Anbieter wechseln. (D)</p> Signup and view all the answers

Welche der folgenden Optionen beschreibt am besten die datenschutzrechtlichen Bedenken im Zusammenhang mit Big Data?

<p>Verbesserte Algorithmen ermöglichen detailliertere Rückschlüsse auf Personen, wodurch Informationen ableitbar sind, die der Person selbst möglicherweise nicht bekannt sind. (D)</p> Signup and view all the answers

Inwiefern stellt die Wiederverwendung von Daten eine Herausforderung für den Datenschutz im Kontext von Big Data dar?

<p>Da bei der ursprünglichen Sammlung oft nicht klar ist, für welche spezifischen Analysen die Daten später verwendet werden, kann nur eine allgemeine Zustimmung zur Datenverarbeitung eingeholt werden. (C)</p> Signup and view all the answers

Welche Auswirkung hat die Nutzung von Big Data in Bezug auf mögliche Datenschutzverletzungen?

<p>Selbst das Löschen aller Kopien von Daten kann nicht verhindern, dass enthaltene Informationen als Teil eines Lernalgorithmus weiter Verwendung finden. (A)</p> Signup and view all the answers

Welches der folgenden Beispiele verdeutlicht die potenziellen Risiken der Verknüpfung von Daten im Big-Data-Kontext am besten?

<p>Ein Unternehmen kombiniert Mobilitätsdaten, Gesundheitsdaten und Social-Media-Aktivitäten, um detaillierte Profile von Individuen zu erstellen. (D)</p> Signup and view all the answers

Warum ist es wichtig, die Privatsphäre von Personen bei der Verarbeitung von Big Data anzuerkennen?

<p>Weil eine Verarbeitung dieser Daten immer auch die Privatsphäre derjenigen Personen berührt, die an der Erzeugung dieser Daten beteiligt waren. (D)</p> Signup and view all the answers

Welche Rolle spielen explorative Analysen bei der Nutzung von Big-Data-Potenzialen?

<p>Explorative Analysen sind essenziell für die Nutzung von Big-Data-Potenzialen.. (D)</p> Signup and view all the answers

Welche Änderung der Datenschutzrichtlinien von Google im Jahr 2012 wird im Text als Beispiel genannt?

<p>Google hat seine Datenschutzrichtlinien dahingehend geändert, dass eine gemeinsame Nutzung von Daten durch die verschiedenen Dienste des Unternehmens möglich wird. (A)</p> Signup and view all the answers

Was bedeutet der Begriff 'Feingranulare Rückschlüsse auf Personen' im Kontext von Big Data?

<p>Es bedeutet, dass aus Daten heute wesentlich mehr und detailliertere Rückschlüsse auf dahinterstehende Personen abgeleitet werden können als dies vor einigen Jahren noch der Fall war. (B)</p> Signup and view all the answers

Warum ist das Vertrauen in maschinelle Lernverfahren wichtig, insbesondere im Kontext von Deep Learning?

<p>Weil der Mangel an Nachvollziehbarkeit und Kontrolle durch ein hohes Vertrauen in ihre Ergebnisse kompensiert werden muss. (D)</p> Signup and view all the answers

Wie können Verzerrungen in Trainingsdaten die Arbeitsweise von Algorithmen beeinflussen?

<p>Verzerrungen können zu Diskriminierung führen, indem bestimmte Datenausprägungen über- oder unterrepräsentiert werden. (B)</p> Signup and view all the answers

Was war das Hauptproblem bei Amazons experimentellem Software-System zur Bewertung von Jobkandidaten?

<p>Das System bewertete Kandidaten nicht geschlechtsneutral, da es anhand historischer Daten mit männlicher Dominanz trainiert wurde. (A)</p> Signup and view all the answers

Welche der folgenden Aussagen beschreibt am besten das Konzept der 'Erklärbarkeit' (Explainability) im Kontext des maschinellen Lernens?

<p>Die Transparenz und Nachvollziehbarkeit der Entscheidungsfindung von ML-Modellen. (D)</p> Signup and view all the answers

Warum kann die Verwendung von Big Data im Zusammenhang mit maschinellem Lernen problematisch sein?

<p>Big Data kann Verzerrungen enthalten, die zu Diskriminierung führen können. (D)</p> Signup and view all the answers

Was ist das wahrscheinlichste Ergebnis, wenn ein ML-Algorithmus mit Daten trainiert wird, die hauptsächlich eine bestimmte demografische Gruppe repräsentieren (z.B. überwiegend männliche Lebensläufe in der Tech-Industrie)?

<p>Der Algorithmus wird wahrscheinlich Vorhersagen treffen, die diese demografische Gruppe bevorzugen und andere benachteiligen. (C)</p> Signup and view all the answers

Welche Herausforderung entsteht, wenn Deep-Learning-Modelle in kritischen Entscheidungsprozessen eingesetzt werden, die erhebliche Auswirkungen auf Menschen haben?

<p>Die Komplexität von Deep-Learning-Modellen erschwert das Verständnis ihrer Vorhersagen, was zu einem Mangel an Vertrauen führen kann. (D)</p> Signup and view all the answers

Wie können Organisationen das Risiko von Verzerrungen bei der Entwicklung und Anwendung von ML-Modellen minimieren?

<p>Indem sie sicherstellen, dass die Trainingsdaten die Vielfalt der Bevölkerung widerspiegeln und regelmäßig auf Verzerrungen prüfen. (D)</p> Signup and view all the answers

Flashcards

Big Data Erfolgsgrundlage

Big Data Erfolge basieren auf dem Potential, das aus der Datennutzung entsteht.

Nutzerprofil Vorteile

Nutzerprofile ermöglichen eine massgeschneiderte Anpassung von Diensten und Anwendungen.

Kontrollverlust durch Big Data

Das Teilen und die Verarbeitung privater Daten führen zum Verlust der Kontrolle über persönliche Daten.

Transparenz Notwendigkeit

Transparenz ist nötig, um Verzerrungen in Algorithmen zu erkennen und zu beheben.

Signup and view all the flashcards

Algorithmische Verzerrung Folge

Verzerrungen in Algorithmen können zur Diskriminierung von Personengruppen führen.

Signup and view all the flashcards

Explizite Datenangabe

Nutzer gibt Daten explizit an (z.B. demografische Angaben).

Signup and view all the flashcards

Automatisch erzeugte Daten

Automatisch erzeugte Daten entstehen während der Nutzung eines Dienstes (z.B. Betrachtungsdauer eines Bildes).

Signup and view all the flashcards

Beispiel automatisch erzeugter Datentyp

Mobilitätsdaten, die durch Smartphones erzeugt werden.

Signup and view all the flashcards

Was bedeutet Daten-Eindeutigkeit?

Die Eindeutigkeit, mit der Daten einem bestimmten Nutzer zugeordnet werden können, wodurch er eindeutig identifiziert wird.

Signup and view all the flashcards

Was sind Inhalts-, Nutzer- und Nutzungsdaten?

Daten, die eine eindeutige Identifikation eines Nutzers ermöglichen, Nutzungsdaten und Inhaltsdaten.

Signup and view all the flashcards

Was sind Verhaltens- und Kontextdaten?

Daten, die aus der Nutzung von mit Sensorik ausgestatteten Geräten resultieren, wie Bewegungsdaten oder Kalorienverbrauch.

Signup and view all the flashcards

Was sind Metadaten?

Daten über Daten, die primäre Daten um weitere Informationen ergänzen wie wer, wann, mit wem kommuniziert hat.

Signup and view all the flashcards

Was sind Auswertungen über Inhalts- und Verhaltensdaten?

Analysen, die tiefer in die Privatsphäre der Nutzer eindringen und daher einem besonderen datenschutzrechtlichen Schutz unterliegen.

Signup and view all the flashcards

Was bedeutet Ende-zu-Ende-Verschlüsselung?

Eine verschlüsselte Kommunikation, bei der der Inhalt von Nachrichten vom Betreiber des Dienstes nicht mitgelesen werden kann.

Signup and view all the flashcards

Metadaten trotz Verschlüsselung?

Auch bei Verschlüsselung bleiben Metadaten weiterhin zugänglich.

Signup and view all the flashcards

Was sind personenbezogene Daten im Kontext von Big Data?

Informationen, die zumindest einen mittelbaren Bezug zu Einzelpersonen haben, erzeugt durch die Interaktion einer Person mit einem technischen System.

Signup and view all the flashcards

Big Data Beispiele

Daten, die von verschiedenen Quellen stammen, z.B. Mobilität, Gesundheit, soziale Netzwerke, IoT-Geräte.

Signup and view all the flashcards

Big Data & Privatsphäre

Die Verarbeitung von Big Data betrifft oft die Privatsphäre der Datenerzeuger.

Signup and view all the flashcards

Risiken für die Privatsphäre

Massive Datensammlung, die zur Verknüpfung getrennter Datenquellen führt.

Signup and view all the flashcards

Wiederverwendung von Daten

Daten werden für Zwecke verwendet, die bei der Sammlung noch nicht feststanden.

Signup and view all the flashcards

Feingranulare Rückschlüsse

Algorithmen erlauben detailliertere Rückschlüsse auf Personen.

Signup and view all the flashcards

Datenschutzverletzungen

Offengelegte Daten sind schwer zu entfernen oder deren Verbreitung zu kontrollieren.

Signup and view all the flashcards

KI-Lernalgorithmen & Daten

Selbst das Löschen von Daten verhindert nicht, dass Informationen in KI-Lernalgorithmen weiterleben.

Signup and view all the flashcards

Gemeinsame Datennutzung

Dienste können Daten gemeinsam nutzen. Dies wirft Fragen bezüglich des Datenschutzes auf.

Signup and view all the flashcards

DSGVO Zweck

Die DSGVO schützt personenbezogene Daten innerhalb der EU und regelt die Zulässigkeit der Verarbeitung.

Signup and view all the flashcards

DSGVO Bedingung a)

Eine Bedingung für die Datenverarbeitung ist die Einwilligung der betroffenen Person.

Signup and view all the flashcards

DSGVO Bedingung b)

Datenverarbeitung ist zulässig, wenn sie zur Erfüllung eines Vertrags notwendig ist.

Signup and view all the flashcards

DSGVO Bedingung c)

Die Verarbeitung ist erlaubt, wenn sie einer rechtlichen Verpflichtung dient.

Signup and view all the flashcards

DSGVO Bedingung d)

Datenverarbeitung ist zulässig, um lebenswichtige Interessen zu schützen.

Signup and view all the flashcards

DSGVO Bedingung e)

Die Verarbeitung ist erlaubt, wenn sie im öffentlichen Interesse liegt.

Signup and view all the flashcards

DSGVO Bedingung f)

Datenverarbeitung ist zulässig, wenn berechtigte Interessen des Verantwortlichen oder Dritter dies erfordern, sofern die Interessen der betroffenen Person nicht überwiegen.

Signup and view all the flashcards

DSGVO Zweckbindung

Daten dürfen nur für den Zweck verarbeitet werden, für den sie erhoben wurden.

Signup and view all the flashcards

Grundsatz der Zweckbindung

Daten dürfen nur für festgelegte, eindeutige und rechtmäßige Zwecke erhoben und verarbeitet werden.

Signup and view all the flashcards

Informationspflicht bei Datenerhebung

Die betroffene Person muss bei der Datenerhebung über den Zweck informiert werden.

Signup and view all the flashcards

Statistische Zwecke vs. Personenbezug

Ergebnisse der Datenverarbeitung dürfen keine personenbezogenen Daten enthalten.

Signup and view all the flashcards

Vertrauen in System und Dienste

Vertrauen ist notwendig, damit Nutzer Daten teilen.

Signup and view all the flashcards

Vertrauen in die Datenqualität

Vertrauen in die Korrektheit und Zuverlässigkeit der Daten ist notwendig.

Signup and view all the flashcards

Vertrauen in Algorithmen

Vertrauen in die Funktionsweise und Fairness der Algorithmen ist wichtig.

Signup and view all the flashcards

Mangelndes Datenbewusstsein

Nutzer sind sich oft nicht bewusst, welche Daten sie erzeugen und wie diese verarbeitet werden.

Signup and view all the flashcards

Unverständnis von Geschäftsmodellen

Ein fehlendes Verständnis der Geschäftsmodelle von Diensten (z.B. kostenlose Nutzung, Finanzierung über Werbung).

Signup and view all the flashcards

Erklärbarkeit (Explainability) in ML

Schwierigkeit, die Funktionsweise von ML-Modellen zu verstehen und zu erklären.

Signup and view all the flashcards

Neuronale Netze (Deep Learning)

ML-Modelle, deren Entscheidungsfindung schwer nachvollziehbar ist.

Signup and view all the flashcards

Verzerrungen in Trainingsdaten

Annahme von impliziten Annahmen in Daten durch Lernverfahren.

Signup and view all the flashcards

Ursachen von Verzerrungen

Über- oder Unterrepräsentation von Datenausprägungen.

Signup and view all the flashcards

Folgen von Verzerrungen

Risiko der Diskriminierung von Untergruppen der Bevölkerung.

Signup and view all the flashcards

Amazon-Beispiel

KI-System bewertete Jobkandidaten nicht geschlechtsneutral.

Signup and view all the flashcards

Trainingsgrundlage (Amazon)

Lebensläufe, die das Unternehmen über 10 Jahre gesammelt hatte.

Signup and view all the flashcards

Ursache der Verzerrung (Amazon)

Männliche Dominanz in der Tech-Industrie.

Signup and view all the flashcards

Study Notes

Datenschutzrechtliche Aspekte von Big Data

  • Die datenschutzrechtlichen und ethischen Fragen rückten in den letzten Jahren vermehrt in den Fokus, nachdem sie anfänglich wenig Beachtung fanden.
  • Die Erstellung von Nutzerprofilen ermöglicht eine Personalisierung von Diensten mit neuer Qualität.
  • Die Verarbeitung von Daten durch maschinelles Lernen verstärkt bekannte Risiken wie die Sammlung, Verknüpfung und Analyse von Daten.
  • Fehlende Transparenz über die Effekte der Datenverarbeitung hat dazu geführt, dass Einzelpersonen die Kontrolle über ihre persönlichen Daten verlieren.
  • Es wird schwieriger, Entscheidungen von Algorithmen nachzuvollziehen oder Annahmen in Daten zu erkennen.
  • Transparenz ist eine Voraussetzung, um Verzerrungen in Algorithmen zu analysieren, die zu Diskriminierung führen können.

Klassifizierung von Datentypen

  • Je nach Anwendungsfall gibt es verschiedene Datentypen, die datenschutzrechtlich unterschiedlich betrachtet werden müssen.
  • Daten können explizit von Nutzern angegeben werden (z. B. demografische Aspekte, politische Gesinnung, Einkommen).
  • Daten können automatisch erzeugt werden, während ein Dienst genutzt wird (z. B. Zeitspanne, betrachtete Bilder, Mobilitätsdaten).
  • Ein weiteres Kriterium ist, wie eindeutig Daten einem Nutzer zugeordnet werden können.

Datentypen im Detail

  • Es lassen sich folgende Datentypen unterscheiden:
    • Inhalts-, Nutzer- und Nutzungsdaten: Daten zur Identifikation von Nutzern, Nutzungsdaten (wie oft ein Dienst genutzt wurde) und Inhaltsdaten (Inhalt einer versendeten Mail).
    • Verhaltens- und Kontextdaten: Daten aus der Nutzung sensorbestückter Geräte, z. B. Bewegungsdaten, Schrittmessung, Kalorienverbrauch.
    • Metadaten: Daten über Daten, die primäre Daten ergänzen; z. B. wer wann mit wem Nachrichten austauscht, Größe der Nachricht.
  • Metadaten lassen Rückschlüsse über Kommunikations- und Bewegungsverhalten zu.
  • Auswertungen über Inhalts- und Verhaltensdaten dringen tiefer in die Privatsphäre ein und bedürfen besonderem Schutz.
  • Viele soziale Netzwerke bieten Ende-zu-Ende-Verschlüsselung, wodurch der Inhalt der Nachrichten nicht vom Betreiber mitgelesen werden kann.
  • Der Zugriff auf Metadaten bleibt bei Verschlüsselung weiterhin möglich.

Datenschutzrechtliche Herausforderungen bei Big Data

  • Die meisten unter "Big Data" zusammengefassten Daten haben einen mittelbaren Bezug zu Einzelpersonen.
  • Daten entstehen durch die Interaktion mit technischen Systemen, Online-Diensten oder in der physischen Welt.
  • Beispiele hierfür sind Mobilitätsdaten, Gesundheitsdaten, soziale Netzwerke und IoT-Geräte.
  • Eine Verarbeitung dieser Daten berührt immer die Privatsphäre der beteiligten Personen.
  • Sébastien Gambs fasst vier zentrale datenschutzrechtliche Herausforderungen zusammen:
    • Vergrößerung der Risiken für die Privatsphäre durch die Zunahme gesammelter Daten und Verknüpfungsmöglichkeiten.
    • Wiederverwendung von Daten, da bei der Sammlung der Analysezweck oft noch nicht feststeht und nur eine allgemeine Zustimmung vorliegt.
    • Feingranulare Rückschlüsse auf Personen durch verbesserte Algorithmen, auch bezüglich unbekannter Gesundheitszustände.
    • Weitreichende Datenschutzverletzungen: Offengelegte Daten können nicht sicher entfernt werden und finden als Teil von Lernalgorithmen weiter Verwendung.

Rechtliche Regelungen zum Datenschutz

  • Die Datenschutz-Grundverordnung (DSGVO) der EU aus 2018 regelt die Verarbeitung personenbezogener Daten.
  • Sie stellt den Schutz personenbezogener Daten sicher und regelt die Voraussetzungen für eine Verarbeitung.
  • Eine Verarbeitung ist zulässig, wenn:
    • Die betroffene Person eingewilligt hat.
    • Die Verarbeitung zur Vertragserfüllung oder vorvertraglicher Maßnahmen erforderlich ist.
    • Die Verarbeitung zur Erfüllung einer rechtlichen Verpflichtung erforderlich ist.
    • Die Verarbeitung zum Schutz lebenswichtiger Interessen erforderlich ist.
    • Die Verarbeitung zur Wahrnehmung einer öffentlichen Aufgabe erforderlich ist.
    • Die Verarbeitung zur Wahrung berechtigter Interessen erforderlich ist, sofern die Interessen der betroffenen Person nicht überwiegen.
  • Der Grundsatz der Zweckbindung ist ein wichtiges deutsches und europäisches Datenschutzprinzip.
  • Er wendet sich gegen die unbegrenzte Verknüpfung von Datenmengen.

Zweckbindung im Datenschutz

  • Der Grundsatz der Zweckbindung umfasst, dass personenbezogene Daten nur für einen genau festgelegten, eindeutigen und rechtmäßigen Zweck erhoben werden dürfen.
  • Sie dürfen später nicht für einen damit unvereinbaren Zweck verarbeitet werden.
  • Die betroffene Person muss bei der Erhebung der Daten über den Zweck informiert werden und dieser muss bei der Verarbeitung eingehalten werden.
  • Die DSGVO stellt klar, dass das Ergebnis der Datenverarbeitung zu statistischen Zwecken keine personenbezogenen Daten enthalten darf.
  • Viele Big-Data-Anwendungen sind nicht von der Ausnahme des Grundsatzes der Zweckbindung betroffen.

Vertrauen im Rahmen von Big-Data-Analysen

  • Vertrauen ist eine wesentliche Bedingung für die Datenanalyse von Big Data.
  • Es ist Vertrauen in System und Dienste, die Daten selbst, die Ergebnisse und die Arbeitsweise der Algorithmen notwendig.
    • Vertrauen in Datenverarbeiter: Nutzer sind sich oft nicht bewusst, welche Daten sie erzeugen und wie diese verarbeitet werden.
    • Mangelndes Verständnis des Geschäftsmodells oder der technischen Prozesse begründet dies oft.
    • Es ist essenziell, dass Nutzer den Diensten vertrauen, damit sie nicht zu anderen Anbietern wechseln.
    • Vertrauen in maschinelle Lernverfahren: Die Komplexität von Lernmodellen erschwert das Verstehen und Erklären von Vorhersagen.
    • Dies kann zu mangelndem Vertrauen führen, besonders in Entscheidungsprozessen, die Menschen erheblich beeinflussen.
    • Dieser Themenkomplex wird als Erklärbarkeit (Explainability) in der ML-Forschung diskutiert.
    • Neuronale Netze im Deep Learning sind ein Beispiel für Modelle, deren Arbeitsweise schwer nachvollziehbar ist.
    • Ein tiefes Vertrauen ist notwendig um den Mangel an Kontrolle auszugleichen.
    • Vertrauen in die Neutralität von Daten: Algorithmen übernehmen implizite Annahmen in den Daten.
    • Es ist wichtig zu untersuchen, inwiefern Big Data gelernte Verzerrungen die Arbeitsweise der Algorithmen beeinflussen.
    • Verzerrungen können aus Ãœber- oder Unterrepräsentationen von Datenausprägungen resultieren.

Beispiel für fehlende Neutralität von Daten

  • Amazon untersuchte mit KI-Systemen, ob sich Jobkandidaten anhand ihrer Lebensläufe automatisch bewerten lassen.
  • Das System bewertete Kandidaten für Softwareentwickler-Jobs nicht geschlechtsneutral.
  • Das Modell bewertete Bewerber anhand typischer Muster in Lebensläufen.
  • Die Trainingsgrundlage waren Lebensläufe von Amazon über 10 Jahre, die meist von Männern stammten.
  • Das System lernte implizit, männliche Kandidaten zu bevorzugen.
  • Lebensläufe mit dem Wort "Frauen" wurden geringer bewertet.
  • Das System stufte Absolventen von reinen Frauen-Colleges herab.
  • Geschlechterspezifische Muster waren so tief verborgen, dass nur ein neues Training der Modelle auf einem ausgewogenen Datensatz Abhilfe schaffen konnte.
  • Das System wurde von Amazon eingestellt.

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

More Like This

Use Quizgecko on...
Browser
Browser