Podcast
Questions and Answers
Welche der folgenden Aussagen beschreibt am besten die datenschutzrechtlichen Herausforderungen im Kontext von Big Data?
Welche der folgenden Aussagen beschreibt am besten die datenschutzrechtlichen Herausforderungen im Kontext von Big Data?
- Die fehlende Transparenz in der Verarbeitung persönlicher Daten führt zu einem Kontrollverlust des Einzelnen und erschwert die Nachvollziehbarkeit algorithmischer Entscheidungen. (correct)
- Datenschutzrechtliche Bedenken sind irrelevant, da Big Data hauptsächlich auf anonymisierten Daten basiert.
- Big Data ermöglicht eine stärkere Kontrolle des Einzelnen über seine persönlichen Daten durch transparente Algorithmen.
- Die Datenschutz-Grundverordnung (DSGVO) hat alle datenschutzrechtlichen Probleme im Bereich Big Data vollständig gelöst.
Warum ist Transparenz im Zusammenhang mit personalisierten Algorithmen von grosser Bedeutung?
Warum ist Transparenz im Zusammenhang mit personalisierten Algorithmen von grosser Bedeutung?
- Transparenz dient lediglich dazu, die Komplexität von Algorithmen zu verschleiern.
- Transparenz ist nur für Programmierer relevant, nicht für Endnutzer.
- Transparenz ermöglicht es, Verzerrungen zu analysieren und kritisch zu reflektieren, die zu Diskriminierung führen könnten. (correct)
- Transparenz ist unwichtig, da Algorithmen immer objektive Entscheidungen treffen.
Welches Kriterium wird verwendet, um Datentypen im Rahmen einer datenschutzrechtlichen Betrachtung zu unterscheiden?
Welches Kriterium wird verwendet, um Datentypen im Rahmen einer datenschutzrechtlichen Betrachtung zu unterscheiden?
- Die Unterscheidung, ob Daten explizit vom Nutzer angegeben oder automatisch erzeugt werden. (correct)
- Die Art der Hardware, auf der die Daten gespeichert sind.
- Die Größe der Datensätze in Gigabyte.
- Die Anzahl der Mitarbeiter, die Zugriff auf die Daten haben.
Inwiefern verstärkt Big Data bekannte Risiken im Bereich des Datenschutzes?
Inwiefern verstärkt Big Data bekannte Risiken im Bereich des Datenschutzes?
Welche Rolle spielt die Datenethik im Kontext von Big Data?
Welche Rolle spielt die Datenethik im Kontext von Big Data?
Wie beeinflusst die Erstellung von Nutzerprofilen durch Big Data die Personalisierung von Diensten?
Wie beeinflusst die Erstellung von Nutzerprofilen durch Big Data die Personalisierung von Diensten?
Was ist eine mögliche Konsequenz fehlender Transparenz bei der Verarbeitung persönlicher Daten durch lernende Algorithmen?
Was ist eine mögliche Konsequenz fehlender Transparenz bei der Verarbeitung persönlicher Daten durch lernende Algorithmen?
Welches Beispiel verdeutlicht einen Datentyp, der automatisch erzeugt wird, während ein Nutzer einen Dienst nutzt?
Welches Beispiel verdeutlicht einen Datentyp, der automatisch erzeugt wird, während ein Nutzer einen Dienst nutzt?
Welche Aussage trifft auf Metadaten im Kontext von Instant Messaging nicht zu?
Welche Aussage trifft auf Metadaten im Kontext von Instant Messaging nicht zu?
Warum unterliegen Inhalts- und Verhaltensdaten im Rahmen von Big-Data-Analysen einem besonderen datenschutzrechtlichen Schutz?
Warum unterliegen Inhalts- und Verhaltensdaten im Rahmen von Big-Data-Analysen einem besonderen datenschutzrechtlichen Schutz?
Was bedeutet Ende-zu-Ende-Verschlüsselung im Kontext von Nachrichtendiensten bezüglich des Datenschutzes?
Was bedeutet Ende-zu-Ende-Verschlüsselung im Kontext von Nachrichtendiensten bezüglich des Datenschutzes?
Welche der folgenden Datenarten würde nicht unter den Begriff 'Nutzerdaten' fallen?
Welche der folgenden Datenarten würde nicht unter den Begriff 'Nutzerdaten' fallen?
Wie unterscheiden sich Inhaltsdaten von Metadaten im Zusammenhang mit Online-Kommunikation?
Wie unterscheiden sich Inhaltsdaten von Metadaten im Zusammenhang mit Online-Kommunikation?
Ein Fitness-Tracker erfasst Bewegungsdaten und den Kalorienverbrauch eines Nutzers. Zu welcher Kategorie gehören diese Daten?
Ein Fitness-Tracker erfasst Bewegungsdaten und den Kalorienverbrauch eines Nutzers. Zu welcher Kategorie gehören diese Daten?
Welche der folgenden Aussagen beschreibt am besten die datenschutzrechtliche Herausforderung im Zusammenhang mit 'Big Data'?
Welche der folgenden Aussagen beschreibt am besten die datenschutzrechtliche Herausforderung im Zusammenhang mit 'Big Data'?
Ein Unternehmen analysiert die Online-Aktivitäten seiner Kunden, um personalisierte Werbung auszuspielen. Welche Art von Daten wird hierfür wahrscheinlich verwendet?
Ein Unternehmen analysiert die Online-Aktivitäten seiner Kunden, um personalisierte Werbung auszuspielen. Welche Art von Daten wird hierfür wahrscheinlich verwendet?
Welche der folgenden Aussagen beschreibt am besten die Situation vor der Einführung der DSGVO bezüglich der Datenverarbeitung?
Welche der folgenden Aussagen beschreibt am besten die Situation vor der Einführung der DSGVO bezüglich der Datenverarbeitung?
Welches Jahr markiert die Einführung der Datenschutz-Grundverordnung (DSGVO) in der Europäischen Union?
Welches Jahr markiert die Einführung der Datenschutz-Grundverordnung (DSGVO) in der Europäischen Union?
Unter welcher der folgenden Bedingungen ist die Verarbeitung personenbezogener Daten NICHT zulässig laut DSGVO?
Unter welcher der folgenden Bedingungen ist die Verarbeitung personenbezogener Daten NICHT zulässig laut DSGVO?
In welcher der folgenden Situationen wäre die Verarbeitung personenbezogener Daten gemäß DSGVO zulässig?
In welcher der folgenden Situationen wäre die Verarbeitung personenbezogener Daten gemäß DSGVO zulässig?
Welche Rolle spielt der Grundsatz der Zweckbindung im Kontext von Big-Data-Analysen und der DSGVO?
Welche Rolle spielt der Grundsatz der Zweckbindung im Kontext von Big-Data-Analysen und der DSGVO?
Welche Aussage beschreibt am besten den Grundsatz der Zweckbindung im Kontext von personenbezogenen Daten?
Welche Aussage beschreibt am besten den Grundsatz der Zweckbindung im Kontext von personenbezogenen Daten?
Warum stellt die Verknüpfung von Daten aus unterschiedlichen Quellen und Kontexten eine Herausforderung für den Grundsatz der Zweckbindung dar?
Warum stellt die Verknüpfung von Daten aus unterschiedlichen Quellen und Kontexten eine Herausforderung für den Grundsatz der Zweckbindung dar?
Was bedeutet der Begriff 'berechtigte Interessen' im Kontext der DSGVO?
Was bedeutet der Begriff 'berechtigte Interessen' im Kontext der DSGVO?
Ein Unternehmen möchte Kundendaten für eine neue Marketingkampagne nutzen, die nicht mit dem ursprünglichen Zweck der Datenerhebung übereinstimmt. Was sollte das Unternehmen gemäß DSGVO tun?
Ein Unternehmen möchte Kundendaten für eine neue Marketingkampagne nutzen, die nicht mit dem ursprünglichen Zweck der Datenerhebung übereinstimmt. Was sollte das Unternehmen gemäß DSGVO tun?
Inwiefern beeinflusst die DSGVO Big-Data-Anwendungen, die für statistische Zwecke genutzt werden?
Inwiefern beeinflusst die DSGVO Big-Data-Anwendungen, die für statistische Zwecke genutzt werden?
Welche der folgenden Aussagen beschreibt am besten die Bedeutung von Vertrauen im Kontext von Big-Data-Analysen?
Welche der folgenden Aussagen beschreibt am besten die Bedeutung von Vertrauen im Kontext von Big-Data-Analysen?
Ein kleines Startup-Unternehmen verarbeitet personenbezogene Daten. Welche Aussage beschreibt die Situation des Unternehmens im Bezug auf die DSGVO korrekt?
Ein kleines Startup-Unternehmen verarbeitet personenbezogene Daten. Welche Aussage beschreibt die Situation des Unternehmens im Bezug auf die DSGVO korrekt?
Was ist ein wesentlicher Grund dafür, dass Nutzer von datenverarbeitenden Anwendungen und sozialen Netzwerken sich oft nicht bewusst sind, welche Daten sie erzeugen und wie diese verarbeitet werden?
Was ist ein wesentlicher Grund dafür, dass Nutzer von datenverarbeitenden Anwendungen und sozialen Netzwerken sich oft nicht bewusst sind, welche Daten sie erzeugen und wie diese verarbeitet werden?
Warum ist es für Diensteanbieter essenziell, dass Nutzer ihnen vertrauen, dass sie verantwortungsvoll mit ihren Daten umgehen?
Warum ist es für Diensteanbieter essenziell, dass Nutzer ihnen vertrauen, dass sie verantwortungsvoll mit ihren Daten umgehen?
Welche Herausforderung ergibt sich aus der Tatsache, dass viele Big-Data-Anwendungen auf Daten basieren, die aus unterschiedlichen Kontexten stammen?
Welche Herausforderung ergibt sich aus der Tatsache, dass viele Big-Data-Anwendungen auf Daten basieren, die aus unterschiedlichen Kontexten stammen?
Welche Konsequenz kann ein fehlendes Vertrauen in Datenverarbeiter für die Nutzer haben?
Welche Konsequenz kann ein fehlendes Vertrauen in Datenverarbeiter für die Nutzer haben?
Welche der folgenden Optionen beschreibt am besten die datenschutzrechtlichen Bedenken im Zusammenhang mit Big Data?
Welche der folgenden Optionen beschreibt am besten die datenschutzrechtlichen Bedenken im Zusammenhang mit Big Data?
Inwiefern stellt die Wiederverwendung von Daten eine Herausforderung für den Datenschutz im Kontext von Big Data dar?
Inwiefern stellt die Wiederverwendung von Daten eine Herausforderung für den Datenschutz im Kontext von Big Data dar?
Welche Auswirkung hat die Nutzung von Big Data in Bezug auf mögliche Datenschutzverletzungen?
Welche Auswirkung hat die Nutzung von Big Data in Bezug auf mögliche Datenschutzverletzungen?
Welches der folgenden Beispiele verdeutlicht die potenziellen Risiken der Verknüpfung von Daten im Big-Data-Kontext am besten?
Welches der folgenden Beispiele verdeutlicht die potenziellen Risiken der Verknüpfung von Daten im Big-Data-Kontext am besten?
Warum ist es wichtig, die Privatsphäre von Personen bei der Verarbeitung von Big Data anzuerkennen?
Warum ist es wichtig, die Privatsphäre von Personen bei der Verarbeitung von Big Data anzuerkennen?
Welche Rolle spielen explorative Analysen bei der Nutzung von Big-Data-Potenzialen?
Welche Rolle spielen explorative Analysen bei der Nutzung von Big-Data-Potenzialen?
Welche Änderung der Datenschutzrichtlinien von Google im Jahr 2012 wird im Text als Beispiel genannt?
Welche Änderung der Datenschutzrichtlinien von Google im Jahr 2012 wird im Text als Beispiel genannt?
Was bedeutet der Begriff 'Feingranulare Rückschlüsse auf Personen' im Kontext von Big Data?
Was bedeutet der Begriff 'Feingranulare Rückschlüsse auf Personen' im Kontext von Big Data?
Warum ist das Vertrauen in maschinelle Lernverfahren wichtig, insbesondere im Kontext von Deep Learning?
Warum ist das Vertrauen in maschinelle Lernverfahren wichtig, insbesondere im Kontext von Deep Learning?
Wie können Verzerrungen in Trainingsdaten die Arbeitsweise von Algorithmen beeinflussen?
Wie können Verzerrungen in Trainingsdaten die Arbeitsweise von Algorithmen beeinflussen?
Was war das Hauptproblem bei Amazons experimentellem Software-System zur Bewertung von Jobkandidaten?
Was war das Hauptproblem bei Amazons experimentellem Software-System zur Bewertung von Jobkandidaten?
Welche der folgenden Aussagen beschreibt am besten das Konzept der 'Erklärbarkeit' (Explainability) im Kontext des maschinellen Lernens?
Welche der folgenden Aussagen beschreibt am besten das Konzept der 'Erklärbarkeit' (Explainability) im Kontext des maschinellen Lernens?
Warum kann die Verwendung von Big Data im Zusammenhang mit maschinellem Lernen problematisch sein?
Warum kann die Verwendung von Big Data im Zusammenhang mit maschinellem Lernen problematisch sein?
Was ist das wahrscheinlichste Ergebnis, wenn ein ML-Algorithmus mit Daten trainiert wird, die hauptsächlich eine bestimmte demografische Gruppe repräsentieren (z.B. überwiegend männliche Lebensläufe in der Tech-Industrie)?
Was ist das wahrscheinlichste Ergebnis, wenn ein ML-Algorithmus mit Daten trainiert wird, die hauptsächlich eine bestimmte demografische Gruppe repräsentieren (z.B. überwiegend männliche Lebensläufe in der Tech-Industrie)?
Welche Herausforderung entsteht, wenn Deep-Learning-Modelle in kritischen Entscheidungsprozessen eingesetzt werden, die erhebliche Auswirkungen auf Menschen haben?
Welche Herausforderung entsteht, wenn Deep-Learning-Modelle in kritischen Entscheidungsprozessen eingesetzt werden, die erhebliche Auswirkungen auf Menschen haben?
Wie können Organisationen das Risiko von Verzerrungen bei der Entwicklung und Anwendung von ML-Modellen minimieren?
Wie können Organisationen das Risiko von Verzerrungen bei der Entwicklung und Anwendung von ML-Modellen minimieren?
Flashcards
Big Data Erfolgsgrundlage
Big Data Erfolgsgrundlage
Big Data Erfolge basieren auf dem Potential, das aus der Datennutzung entsteht.
Nutzerprofil Vorteile
Nutzerprofil Vorteile
Nutzerprofile ermöglichen eine massgeschneiderte Anpassung von Diensten und Anwendungen.
Kontrollverlust durch Big Data
Kontrollverlust durch Big Data
Das Teilen und die Verarbeitung privater Daten führen zum Verlust der Kontrolle über persönliche Daten.
Transparenz Notwendigkeit
Transparenz Notwendigkeit
Signup and view all the flashcards
Algorithmische Verzerrung Folge
Algorithmische Verzerrung Folge
Signup and view all the flashcards
Explizite Datenangabe
Explizite Datenangabe
Signup and view all the flashcards
Automatisch erzeugte Daten
Automatisch erzeugte Daten
Signup and view all the flashcards
Beispiel automatisch erzeugter Datentyp
Beispiel automatisch erzeugter Datentyp
Signup and view all the flashcards
Was bedeutet Daten-Eindeutigkeit?
Was bedeutet Daten-Eindeutigkeit?
Signup and view all the flashcards
Was sind Inhalts-, Nutzer- und Nutzungsdaten?
Was sind Inhalts-, Nutzer- und Nutzungsdaten?
Signup and view all the flashcards
Was sind Verhaltens- und Kontextdaten?
Was sind Verhaltens- und Kontextdaten?
Signup and view all the flashcards
Was sind Metadaten?
Was sind Metadaten?
Signup and view all the flashcards
Was sind Auswertungen über Inhalts- und Verhaltensdaten?
Was sind Auswertungen über Inhalts- und Verhaltensdaten?
Signup and view all the flashcards
Was bedeutet Ende-zu-Ende-Verschlüsselung?
Was bedeutet Ende-zu-Ende-Verschlüsselung?
Signup and view all the flashcards
Metadaten trotz Verschlüsselung?
Metadaten trotz Verschlüsselung?
Signup and view all the flashcards
Was sind personenbezogene Daten im Kontext von Big Data?
Was sind personenbezogene Daten im Kontext von Big Data?
Signup and view all the flashcards
Big Data Beispiele
Big Data Beispiele
Signup and view all the flashcards
Big Data & Privatsphäre
Big Data & Privatsphäre
Signup and view all the flashcards
Risiken für die Privatsphäre
Risiken für die Privatsphäre
Signup and view all the flashcards
Wiederverwendung von Daten
Wiederverwendung von Daten
Signup and view all the flashcards
Feingranulare Rückschlüsse
Feingranulare Rückschlüsse
Signup and view all the flashcards
Datenschutzverletzungen
Datenschutzverletzungen
Signup and view all the flashcards
KI-Lernalgorithmen & Daten
KI-Lernalgorithmen & Daten
Signup and view all the flashcards
Gemeinsame Datennutzung
Gemeinsame Datennutzung
Signup and view all the flashcards
DSGVO Zweck
DSGVO Zweck
Signup and view all the flashcards
DSGVO Bedingung a)
DSGVO Bedingung a)
Signup and view all the flashcards
DSGVO Bedingung b)
DSGVO Bedingung b)
Signup and view all the flashcards
DSGVO Bedingung c)
DSGVO Bedingung c)
Signup and view all the flashcards
DSGVO Bedingung d)
DSGVO Bedingung d)
Signup and view all the flashcards
DSGVO Bedingung e)
DSGVO Bedingung e)
Signup and view all the flashcards
DSGVO Bedingung f)
DSGVO Bedingung f)
Signup and view all the flashcards
DSGVO Zweckbindung
DSGVO Zweckbindung
Signup and view all the flashcards
Grundsatz der Zweckbindung
Grundsatz der Zweckbindung
Signup and view all the flashcards
Informationspflicht bei Datenerhebung
Informationspflicht bei Datenerhebung
Signup and view all the flashcards
Statistische Zwecke vs. Personenbezug
Statistische Zwecke vs. Personenbezug
Signup and view all the flashcards
Vertrauen in System und Dienste
Vertrauen in System und Dienste
Signup and view all the flashcards
Vertrauen in die Datenqualität
Vertrauen in die Datenqualität
Signup and view all the flashcards
Vertrauen in Algorithmen
Vertrauen in Algorithmen
Signup and view all the flashcards
Mangelndes Datenbewusstsein
Mangelndes Datenbewusstsein
Signup and view all the flashcards
Unverständnis von Geschäftsmodellen
Unverständnis von Geschäftsmodellen
Signup and view all the flashcards
Erklärbarkeit (Explainability) in ML
Erklärbarkeit (Explainability) in ML
Signup and view all the flashcards
Neuronale Netze (Deep Learning)
Neuronale Netze (Deep Learning)
Signup and view all the flashcards
Verzerrungen in Trainingsdaten
Verzerrungen in Trainingsdaten
Signup and view all the flashcards
Ursachen von Verzerrungen
Ursachen von Verzerrungen
Signup and view all the flashcards
Folgen von Verzerrungen
Folgen von Verzerrungen
Signup and view all the flashcards
Amazon-Beispiel
Amazon-Beispiel
Signup and view all the flashcards
Trainingsgrundlage (Amazon)
Trainingsgrundlage (Amazon)
Signup and view all the flashcards
Ursache der Verzerrung (Amazon)
Ursache der Verzerrung (Amazon)
Signup and view all the flashcards
Study Notes
Datenschutzrechtliche Aspekte von Big Data
- Die datenschutzrechtlichen und ethischen Fragen rückten in den letzten Jahren vermehrt in den Fokus, nachdem sie anfänglich wenig Beachtung fanden.
- Die Erstellung von Nutzerprofilen ermöglicht eine Personalisierung von Diensten mit neuer Qualität.
- Die Verarbeitung von Daten durch maschinelles Lernen verstärkt bekannte Risiken wie die Sammlung, Verknüpfung und Analyse von Daten.
- Fehlende Transparenz über die Effekte der Datenverarbeitung hat dazu geführt, dass Einzelpersonen die Kontrolle über ihre persönlichen Daten verlieren.
- Es wird schwieriger, Entscheidungen von Algorithmen nachzuvollziehen oder Annahmen in Daten zu erkennen.
- Transparenz ist eine Voraussetzung, um Verzerrungen in Algorithmen zu analysieren, die zu Diskriminierung führen können.
Klassifizierung von Datentypen
- Je nach Anwendungsfall gibt es verschiedene Datentypen, die datenschutzrechtlich unterschiedlich betrachtet werden müssen.
- Daten können explizit von Nutzern angegeben werden (z. B. demografische Aspekte, politische Gesinnung, Einkommen).
- Daten können automatisch erzeugt werden, während ein Dienst genutzt wird (z. B. Zeitspanne, betrachtete Bilder, Mobilitätsdaten).
- Ein weiteres Kriterium ist, wie eindeutig Daten einem Nutzer zugeordnet werden können.
Datentypen im Detail
- Es lassen sich folgende Datentypen unterscheiden:
- Inhalts-, Nutzer- und Nutzungsdaten: Daten zur Identifikation von Nutzern, Nutzungsdaten (wie oft ein Dienst genutzt wurde) und Inhaltsdaten (Inhalt einer versendeten Mail).
- Verhaltens- und Kontextdaten: Daten aus der Nutzung sensorbestückter Geräte, z. B. Bewegungsdaten, Schrittmessung, Kalorienverbrauch.
- Metadaten: Daten über Daten, die primäre Daten ergänzen; z. B. wer wann mit wem Nachrichten austauscht, Größe der Nachricht.
- Metadaten lassen Rückschlüsse über Kommunikations- und Bewegungsverhalten zu.
- Auswertungen über Inhalts- und Verhaltensdaten dringen tiefer in die Privatsphäre ein und bedürfen besonderem Schutz.
- Viele soziale Netzwerke bieten Ende-zu-Ende-Verschlüsselung, wodurch der Inhalt der Nachrichten nicht vom Betreiber mitgelesen werden kann.
- Der Zugriff auf Metadaten bleibt bei Verschlüsselung weiterhin möglich.
Datenschutzrechtliche Herausforderungen bei Big Data
- Die meisten unter "Big Data" zusammengefassten Daten haben einen mittelbaren Bezug zu Einzelpersonen.
- Daten entstehen durch die Interaktion mit technischen Systemen, Online-Diensten oder in der physischen Welt.
- Beispiele hierfür sind Mobilitätsdaten, Gesundheitsdaten, soziale Netzwerke und IoT-Geräte.
- Eine Verarbeitung dieser Daten berührt immer die Privatsphäre der beteiligten Personen.
- Sébastien Gambs fasst vier zentrale datenschutzrechtliche Herausforderungen zusammen:
- Vergrößerung der Risiken für die Privatsphäre durch die Zunahme gesammelter Daten und Verknüpfungsmöglichkeiten.
- Wiederverwendung von Daten, da bei der Sammlung der Analysezweck oft noch nicht feststeht und nur eine allgemeine Zustimmung vorliegt.
- Feingranulare Rückschlüsse auf Personen durch verbesserte Algorithmen, auch bezüglich unbekannter Gesundheitszustände.
- Weitreichende Datenschutzverletzungen: Offengelegte Daten können nicht sicher entfernt werden und finden als Teil von Lernalgorithmen weiter Verwendung.
Rechtliche Regelungen zum Datenschutz
- Die Datenschutz-Grundverordnung (DSGVO) der EU aus 2018 regelt die Verarbeitung personenbezogener Daten.
- Sie stellt den Schutz personenbezogener Daten sicher und regelt die Voraussetzungen für eine Verarbeitung.
- Eine Verarbeitung ist zulässig, wenn:
- Die betroffene Person eingewilligt hat.
- Die Verarbeitung zur Vertragserfüllung oder vorvertraglicher Maßnahmen erforderlich ist.
- Die Verarbeitung zur Erfüllung einer rechtlichen Verpflichtung erforderlich ist.
- Die Verarbeitung zum Schutz lebenswichtiger Interessen erforderlich ist.
- Die Verarbeitung zur Wahrnehmung einer öffentlichen Aufgabe erforderlich ist.
- Die Verarbeitung zur Wahrung berechtigter Interessen erforderlich ist, sofern die Interessen der betroffenen Person nicht überwiegen.
- Der Grundsatz der Zweckbindung ist ein wichtiges deutsches und europäisches Datenschutzprinzip.
- Er wendet sich gegen die unbegrenzte Verknüpfung von Datenmengen.
Zweckbindung im Datenschutz
- Der Grundsatz der Zweckbindung umfasst, dass personenbezogene Daten nur für einen genau festgelegten, eindeutigen und rechtmäßigen Zweck erhoben werden dürfen.
- Sie dürfen später nicht für einen damit unvereinbaren Zweck verarbeitet werden.
- Die betroffene Person muss bei der Erhebung der Daten über den Zweck informiert werden und dieser muss bei der Verarbeitung eingehalten werden.
- Die DSGVO stellt klar, dass das Ergebnis der Datenverarbeitung zu statistischen Zwecken keine personenbezogenen Daten enthalten darf.
- Viele Big-Data-Anwendungen sind nicht von der Ausnahme des Grundsatzes der Zweckbindung betroffen.
Vertrauen im Rahmen von Big-Data-Analysen
- Vertrauen ist eine wesentliche Bedingung für die Datenanalyse von Big Data.
- Es ist Vertrauen in System und Dienste, die Daten selbst, die Ergebnisse und die Arbeitsweise der Algorithmen notwendig.
- Vertrauen in Datenverarbeiter: Nutzer sind sich oft nicht bewusst, welche Daten sie erzeugen und wie diese verarbeitet werden.
- Mangelndes Verständnis des Geschäftsmodells oder der technischen Prozesse begründet dies oft.
- Es ist essenziell, dass Nutzer den Diensten vertrauen, damit sie nicht zu anderen Anbietern wechseln.
- Vertrauen in maschinelle Lernverfahren: Die Komplexität von Lernmodellen erschwert das Verstehen und Erklären von Vorhersagen.
- Dies kann zu mangelndem Vertrauen führen, besonders in Entscheidungsprozessen, die Menschen erheblich beeinflussen.
- Dieser Themenkomplex wird als Erklärbarkeit (Explainability) in der ML-Forschung diskutiert.
- Neuronale Netze im Deep Learning sind ein Beispiel für Modelle, deren Arbeitsweise schwer nachvollziehbar ist.
- Ein tiefes Vertrauen ist notwendig um den Mangel an Kontrolle auszugleichen.
- Vertrauen in die Neutralität von Daten: Algorithmen übernehmen implizite Annahmen in den Daten.
- Es ist wichtig zu untersuchen, inwiefern Big Data gelernte Verzerrungen die Arbeitsweise der Algorithmen beeinflussen.
- Verzerrungen können aus Über- oder Unterrepräsentationen von Datenausprägungen resultieren.
Beispiel für fehlende Neutralität von Daten
- Amazon untersuchte mit KI-Systemen, ob sich Jobkandidaten anhand ihrer Lebensläufe automatisch bewerten lassen.
- Das System bewertete Kandidaten für Softwareentwickler-Jobs nicht geschlechtsneutral.
- Das Modell bewertete Bewerber anhand typischer Muster in Lebensläufen.
- Die Trainingsgrundlage waren Lebensläufe von Amazon über 10 Jahre, die meist von Männern stammten.
- Das System lernte implizit, männliche Kandidaten zu bevorzugen.
- Lebensläufe mit dem Wort "Frauen" wurden geringer bewertet.
- Das System stufte Absolventen von reinen Frauen-Colleges herab.
- Geschlechterspezifische Muster waren so tief verborgen, dass nur ein neues Training der Modelle auf einem ausgewogenen Datensatz Abhilfe schaffen konnte.
- Das System wurde von Amazon eingestellt.
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.