Data Science Foliensatz 8
38 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Welche der folgenden Optionen beschreibt am besten die Beziehung zwischen Künstlicher Intelligenz (KI), Machine Learning (ML) und Deep Learning?

  • KI ist ein Teilbereich von ML, und ML ist ein Teilbereich von Deep Learning.
  • ML ist ein Teilbereich von KI, und Deep Learning ist ein Teilbereich von ML. (correct)
  • Deep Learning ist ein Teilbereich von KI, und KI ist ein Teilbereich von ML.
  • KI, ML und Deep Learning sind unabhängige Bereiche ohne klare Beziehung zueinander.

Was ist das Hauptziel von Machine Learning im Sinne der "Klassifizierung"?

  • Zuordnung von Objekten zu vordefinierten Kategorien. (correct)
  • Identifizierung von Mustern in sequenziellen Daten.
  • Aufdeckung verborgener Strukturen in ungelabelten Daten.
  • Vorhersage eines kontinuierlichen Wertes basierend auf Eingabedaten.

Was versteht man unter dem Begriff "Supervised Learning" im Kontext von Machine Learning?

  • Ein Modell, das darauf ausgelegt ist, Muster in ungelabelten Daten zu finden.
  • Ein Modell, das ohne jegliche Trainingsdaten lernt.
  • Ein Modell, das auf der Grundlage gelabelter Daten lernt. (correct)
  • Ein Modell, das durch Belohnung und Bestrafung lernt.

Was ist das primäre Ziel des "Unsupervised Learning"?

<p>Aufdeckung von Strukturen und Beziehungen in ungelabelten Daten. (C)</p> Signup and view all the answers

Welche der folgenden Aufgaben wäre am besten für Supervised Learning geeignet?

<p>Vorhersage des Aktienkurses eines Unternehmens basierend auf historischen Daten. (A)</p> Signup and view all the answers

Was ist Regression im Kontext von Machine Learning?

<p>Ein Verfahren zur Vorhersage eines kontinuierlichen Wertes. (B)</p> Signup and view all the answers

Welche der folgenden Optionen stellt ein Beispiel für eine Regressionsaufgabe dar?

<p>Vorhersage der Anzahl der Klicks, die eine Online-Anzeige erhalten wird. (D)</p> Signup and view all the answers

Was sind "Features" im Kontext von Machine Learning?

<p>Die Eingabevariablen, die zur Vorhersage eines Ergebnisses verwendet werden. (C)</p> Signup and view all the answers

Was versteht man unter dem Begriff 'Target' im Zusammenhang mit Machine Learning?

<p>Die Variable, die wir vorhersagen oder klassifizieren wollen. (B)</p> Signup and view all the answers

Welche der folgenden Aussagen beschreibt am besten den Begriff 'In-Sample Prediction'?

<p>Vorhersagen, die auf den gleichen Datenpunkten basieren, die zum Trainieren des Modells verwendet wurden. (B)</p> Signup and view all the answers

Was bedeutet 'Out-of-Sample Prediction' im Kontext von Machine Learning?

<p>Die Anwendung eines trainierten Modells auf neue, bisher ungesehene Daten. (D)</p> Signup and view all the answers

Was sind Residuen im Kontext der linearen Regression?

<p>Die Differenz zwischen den vorhergesagten und den tatsächlichen Werten. (D)</p> Signup and view all the answers

Welches Problem kann entstehen, wenn ein lineares Regressionsmodell zu komplex wird?

<p>Das Modell überanpasst sich an die Trainingsdaten und generalisiert schlecht auf neue Daten. (A)</p> Signup and view all the answers

Was ist das Hauptziel der 'Cross-Validation' in Machine-Learning-Projekten?

<p>Die Modellleistung auf unabhängigen Datensätzen zu bewerten. (A)</p> Signup and view all the answers

Was kennzeichnet die 'k-fold Cross-Validation'?

<p>Die Daten werden in k Teile aufgeteilt, wobei jedes Teil einmal als Testdatensatz dient. (A)</p> Signup and view all the answers

Was ist ein Entscheidungsbaum im Kontext von Machine Learning?

<p>Ein Algorithmus, der Entscheidungen auf Basis von Regeln und Daten trifft. (A)</p> Signup and view all the answers

Welche Aussage beschreibt am besten das Overfitting-Problem bei Entscheidungsbäumen?

<p>Der Baum kann nur mit numerischen Daten umgehen. (B)</p> Signup and view all the answers

Was bedeutet 'Tree Pruning' im Zusammenhang mit Entscheidungsbäumen?

<p>Das Entfernen von Ästen oder Knoten, um Overfitting zu vermeiden. (A)</p> Signup and view all the answers

Was ist das Hauptmerkmal eines neuronalen Netzes?

<p>Es basiert auf einer großen Anzahl miteinander verbundener Knoten, die Neuronen ähneln. (B)</p> Signup and view all the answers

Wie werden die Verbindungen zwischen den Neuronen in einem neuronalen Netz typischerweise gewichtet?

<p>Die Gewichte werden so angepasst, dass sie die Bedeutung der Verbindungen im Lernprozess widerspiegeln. (A)</p> Signup and view all the answers

Bei der "k-NN"-Klassifizierung (k-Nearest Neighbors), was repräsentiert der Wert 'k'?

<p>Die Anzahl der nächsten Nachbarn, die bei der Klassifizierung eines neuen Datenpunkts berücksichtigt werden. (B)</p> Signup and view all the answers

Welchen Effekt hat ein kleiner Wert für 'k' in einem k-NN-Klassifikator?

<p>Komplexere Entscheidungsstrukturen und höhere Wahrscheinlichkeit für Overfitting. (B)</p> Signup and view all the answers

Wie beeinflusst ein geringerer Bias die Performance eines Machine Learning Modells?

<p>Kann zu Overfitting führen, insbesondere bei Entscheidungsbäumen. (A)</p> Signup and view all the answers

Ein Machine-Learning-Modell hat eine hohe Varianz. Welche Maßnahme ist am wahrscheinlichsten geeignet, um die Generalisierbarkeit zu verbessern?

<p>Verwendung eines einfacheren Modells. (A)</p> Signup and view all the answers

Was ist der Hauptvorteil der Verwendung von Cross-Validation bei der Entwicklung von Machine-Learning-Modellen?

<p>Sie reduziert die Wahrscheinlichkeit von Overfitting und liefert eine zuverlässigere Schätzung der Modellperformance. (B)</p> Signup and view all the answers

Welche der folgenden Methoden ist ein geeigneter Ansatz, um den Bias-Variance-Tradeoff in Machine-Learning-Modellen zu adressieren?

<p>Die Verwendung von Cross-Validation, um die Modellperformance auf unabhängigen Datensätzen zu bewerten. (C)</p> Signup and view all the answers

Eine E-Commerce-Firma möchte ein Machine-Learning-Modell verwenden, um vorherzusagen, welche Produkte ein Kunde als Nächstes kaufen wird. Welcher der folgenden Ansätze wäre am besten geeignet, um das Modell zu trainieren?

<p>Analyse der bisherigen Kaufhistorie des Kunden und ähnlicher Kunden, um personalisierte Empfehlungen zu geben. (C)</p> Signup and view all the answers

Welches der folgenden Szenarien stellt am ehesten ein Beispiel für eine Klassifizierungsaufgabe im Machine Learning dar?

<p>Identifizierung von Spam-E-Mails basierend auf ihrem Inhalt. (D)</p> Signup and view all the answers

Eine Marketingfirma möchte Kunden anhand ihrer Kaufgewohnheiten in verschiedene Gruppen einteilen, um personalisierte Werbung zu schalten. Welche Art von Machine-Learning-Ansatz wäre hier am sinnvollsten?

<p>Clustering, um Kunden mit ähnlichen Kaufgewohnheiten zu gruppieren. (D)</p> Signup and view all the answers

Welche der folgenden Optionen beschreibt am besten den Begriff 'Overfitting' im Kontext von Machine Learning?

<p>Das Modell ist zu komplex und lernt auch das Rauschen in den Trainingsdaten, was zu schlechter Leistung bei neuen Daten führt. (C)</p> Signup and view all the answers

Welche der folgenden Aussagen beschreibt am besten den Zweck der 'k-fold Cross-Validation' in Machine Learning?

<p>Um die Leistung des Modells auf unabhängigen Daten zu schätzen und Overfitting zu verhindern. (C)</p> Signup and view all the answers

Sie haben historische Daten über Hausverkäufe (Größe, Lage, Alter usw.) und die entsprechenden Verkaufspreise. Welches Machine-Learning-Verfahren ist am besten geeignet, um den Verkaufspreis eines neuen Hauses vorherzusagen?

<p>Regression. (B)</p> Signup and view all the answers

Ein Einzelhändler möchte herausfinden, welche Produkte oft zusammen gekauft werden, um sie im Laden nebeneinander zu platzieren. Welche Art von Machine-Learning-Technik wäre dafür am besten geeignet?

<p>Assoziationsanalyse. (D)</p> Signup and view all the answers

Was bedeutet der Begriff 'Bias-Variance Tradeoff' im Machine Learning Kontext?

<p>Die Beziehung zwischen der Komplexität eines Modells und seiner Fähigkeit, sowohl Overfitting als auch Underfitting zu vermeiden. (D)</p> Signup and view all the answers

Sie möchten die Leistung eines Machine-Learning-Modells verbessern, indem Sie mehr Features hinzufügen. Was sollten Sie beachten?

<p>Das Hinzufügen von irrelevanten Features kann zu Overfitting führen und die Leistung verringern. (B)</p> Signup and view all the answers

Welche Aussage beschreibt am besten die Beziehung zwischen dem 'Bias' und der Komplexität eines Machine Learning Modells?

<p>Einfachere Modelle haben in der Regel einen höheren Bias. (C)</p> Signup and view all the answers

Was ist der Hauptvorteil der Verwendung von Kreuzvalidierung (Cross-Validation) gegenüber einer einfachen Aufteilung in Trainings- und Testdatensätze?

<p>Kreuzvalidierung liefert eine zuverlässigere Schätzung der Modellleistung, da sie auf mehreren Testdatensätzen basiert. (C)</p> Signup and view all the answers

Welche der folgenden Aussagen beschreibt am besten den Einsatz neuronaler Netze im Bereich der Bilderkennung?

<p>Neuronale Netze können komplexe Muster in Bildern erkennen, indem sie abstrakte Merkmale in ihren Zwischenschichten ableiten. (B)</p> Signup and view all the answers

Flashcards

Maschinelles Lernen

KI-Technologien, die statistische Methoden verwenden, um durch Daten die Performance zu verbessern.

Künstliche Intelligenz

Technologie, die es Maschinen ermöglicht, menschliches Verhalten und Intelligenz nachzuahmen.

KI-Techniken

KI-Techniken, die durch große Datenmengen (Big Data) die Bewältigung einer Aufgabe ermöglichen.

Neuronale Netze

Eine Technologie, die es Algorithmen ermöglicht, selbständig aus großen Datenmengen zu lernen.

Signup and view all the flashcards

Ziel des Machine Learning

Computern die Fähigkeit zu geben, zu lernen, ohne explizit programmiert zu werden.

Signup and view all the flashcards

Logikbasierte Systeme

KI-Techniken, die auf Basis einer Menge von Axiomen und mathematischer Logik beruhen.

Signup and view all the flashcards

E, A und L

Ein Computerprogramm lernt aus Erfahrung (E) in Bezug auf eine Klasse von Aufgaben (A) und ein Leistungsmaß (L), wenn sich seine Leistung bei Aufgaben in A, gemessen durch L, mit der Erfahrung E verbessert.

Signup and view all the flashcards

Supervised Learning

Targets und dazugehörige Features (Eigenschaften) von Datenpunkten sind im Voraus bekannt und werden dem Algorithmus durch Trainingsbeispiele mit den geltenden bekannten Labels vermittelt

Signup and view all the flashcards

Unsupervised Learning

Algorithmen suchen eigenständig nach Mustern und Strukturen in den ungelabelten Daten, ohne auf vordefinierte Targets zurückzugreifen

Signup and view all the flashcards

Gezielte Ausrichtung

Die gezielte Ausrichtung der Anzeige durch den Inserenten

Signup and view all the flashcards

Bias-Variance Tradeoff Lösung

Bestimmung durch Cross-Validation (Aufteilung in Trainings- und Testdaten)

Signup and view all the flashcards

Dichotome Klassifizierung

Entscheidung für eine der Klassen, entweder die eine Klasse oder die andere.

Signup and view all the flashcards

Multinomiale Klassifizierung

Es gibt es mehr als zwei mögliche Klassen. Datenpunkte sind in eine von mehreren Klassen einzuteilen

Signup and view all the flashcards

k-NN

Ein Algorithmus, der auf Trainingsdaten (Trainings-Set) angewandt wird

Signup and view all the flashcards

Datensatz mit Labels

Satz von Datenpunkten, für die wir die richtigen Klassen kennen

Signup and view all the flashcards

Regressionsbaum

Es wird eine Variable gesucht, die den 'feature space' durch einen 'Split' in homogenere Teile teilt

Signup and view all the flashcards

Der Algorithmus lässt den Baum wachsen

Es wird so lange weiter wachsen, bis jeder Datenpunkt der Trainingsdaten erklärt werden kann

Signup and view all the flashcards

Tree Pruning

Der Baum wird beschnitten, um Überanpassung zu vermeiden

Signup and view all the flashcards

In-Sample Prediction

Anpassung eines Modells an vorhandene Daten, um die Beziehung zwischen Features (X) und dem Target (Y) zu beschreiben.

Signup and view all the flashcards

Splitting-Prozess

Eine Modellierung so lange, bis jeder Fall sein eigener Knoten ist (→ hohe „Baumtiefe'") → niedriger Bias – hohe Varianz.

Signup and view all the flashcards

Produktterm

Eine Modellierung des Produktterm (x*z als weiterer Prädiktor) → "Moderierte Regression

Signup and view all the flashcards

Study Notes

Lernziele

  • Nach dieser Vorlesung sollten die Grundlagen des Machine Learnings verstanden und beschrieben werden können.
  • Des Weiteren muss Machine Learning, Künstliche Intelligenz und Deep Learning voneinander abgegrenzt werden können.
  • Die verschiedenen Arten des Machine Learnings sollen unterschieden und erläutert werden.
  • Zudem sollten wichtige Konzepte des Supervised Learnings, wie Overfitting, erklärt werden können.
  • Auch neuronale Netze sollen beschrieben und erklärt werden können.

Was ist Künstliche Intelligenz?

  • Es handelt sich um eine Technologie, die es Maschinen ermöglicht, menschliches Verhalten und Intelligenz nachzuahmen.
  • KI-Techniken (Algorithmen) nutzen statistische Methoden, um durch große Datenmengen (Big Data) die Bewältigung einer Aufgabe zu ermöglichen.
  • Algorithmen lernen selbstständig mittels „Neuronaler Netze“ und großer Datenmengen.

Das Ziel von Machine Learning

  • Nach Arthur L. Samuel, dem Pionier der Forschung im Bereich der Künstlichen Intelligenz, ist das Ziel von Machine Learning Computern „die Fähigkeit zu geben, zu lernen, ohne explizit programmiert zu werden“.

Woher stammt der Begriff „Algorithmus“?

  • Abu Dschaʿfar Muhammad ibn Musa al-Chwārizmī war ein Universalgelehrter in Geografie, Astronomie und Mathematik (9. Jahrhundert, Persien).
  • Er definierte u. a. die Prinzipien des "Reduzierens" und "Ausgleichens" von Gleichungen (al-jabr, lateinisch: Algebra ("Vollendung")).
  • Ein Algorithmus ist eine Reihe von Schritt-für-Schritt-Regeln zur Lösung eines Problems.

Spürbare Auswirkungen von Algorithmen

  • Algorithmen haben spürbare Auswirkungen, z.B. auf Google Maps, Foodforecast und PathAI
  • Algorithmen haben spürbare Auswirkungen, z.B. auf Fake-Obama, London KI-Kameras, Gender Bias bei Amazon
  • Algorithmen haben spürbare Auswirkungen, z.B. Gender Bias bei Google

Wer ist für die potentiellen Diskriminierungsergebnisse verantwortlich?

  • Vermutungen:
    • Die gezielte Ausrichtung der Anzeige durch den Inserenten
    • Google hat das System explizit so programmiert, dass die Anzeige weniger häufig bei Frauen erscheint
    • Männliche und weibliche Verbraucher reagieren unterschiedlich auf Anzeigen, und der Targeting-Algorithmus von Google reagiert auf diesen Unterschied
    • Mehr Wettbewerb bei der Werbung für Frauen, was dazu führt, dass der Werbetreibende weniger Anzeigenplätze für Frauen erhält.

Kurze Geschichte der Künstlichen Intelligenz

  • 1950: Turing Test
  • 1966: ELIZA, erster Chatbot
  • 1972: MYCIN, Expertensystem
  • 1997: Deep Blue gewinnt im Schach
  • 2016: Alpha Go gewinnt Go
  • 2022: ChatGPT
  • 2023: Bard, Gemini

Vier wesentliche Entwicklungen für Machine Learning

  • Notwendige Daten sind verfügbar und nutzbar: Durch die Digitalisierung entstehen Daten ->KI nutzbar sind
  • Die Machine Learning Algorithmen wurden verbessert: durch Deep-Learning-Algorithmen wurden wesentliche Fortschritte erzielt
  • Cloud-Dienste bieten die benötigte Rechenleistung an: ermöglichen eine schnelle, flexible und bezahlbare Nutzung von Rechenressourcen ohne größere Investitionen
  • Die Anwendung von KI ist keine Raketenwissenschaft mehr: Es stehen performante (Open-Source-) Toolkits und Bibliotheken zur Verfügung

1 Mio User

  • Benötigte ChatGPT ca. 1-2 Monate um 50 Mio. Nutzer zu erreichen.
  • Es ist erfraglich wie lange das Radio dafür brauchte.

Auswirkungen von GPTs auf den US-Arbeitsmarkt

  • Bei ca. 80% aller Beschäftigten sind mind. 10% der Aufgaben betroffen.
  • Bei ca. 19% aller Beschäftigten sind mind. 50% der Aufgaben betroffen.
  • Zone 1: Lebensmittelzubereitung, Arbeiter; Ø-Einkommen: 30.000 US-$.
  • Zone 4/5: Anwälte, Grafik Designer, Wirtschaftsprüfer; Ø-Einkommen: 82.000 US-$.

Grundlagen des Machine Learnings

  • Logikbasierte Systeme: KI-Techniken, die auf Basis einer Menge Axiomen und mathematischer Logik beruhen
  • Maschinelles Lernen: KI-Techniken, die statistische Methoden verwenden, um durch mehr Daten (Erfahrung) die Performance in einem Task zu verbessern.
  • Ein Computerprogramm lernt aus Erfahrung (E) in Bezug auf Aufgaben (A) und ein Leistungsmaß (L) -> Leistung bei Aufgaben in A verbessert sich, gemessen durch L, mit der Erfahrung E

Beispiel: Klassifizierung

  • Trainingsdaten (Experience; E): Bilder von Chihuahuas und Muffins.
  • Aufgabe (A): Klassifizierung "Chihuahua oder Muffin?".
  • Klassifikation (L) und Genauigkeit: Muffin (0.977), Chihuahua (0.962).

Regelbasierte Ansätze

  • Regelbasierte Ansätze lange Zeit als dominierende Herangehensweise
  • Grenzen des regelbasierten Ansatzes:
    • Mögliche Regeln für Identifizierung von Tigern:
      • Mehrere benachbarte orangefarbene und dunkle Pixel
      • Oranger Fleck in der Mitte des Bildes
      • Eine große Anzahl von grünen Pixeln
  • Regelbasierter Ansatz nur ca. 75-80 % Accuracy
    1. Eingehende Dokumente
    2. Regelwerk zur Klassifikation
    3. ICR/OCR
    4. Integrierter Lösungsansatz
    5. KI

Paradigmenwechsel in der Programmierung

  • Menschen sind nur zu rund 5% fehlerhaft
  • Die Fehlerquote bei Algorithmen war früher sehr hoch, ist aber gesunken und hat sich an die Menschen angepasst
  • Nun arbeiten Menschen und Algorithmen in ungefährlichen Sphären zusammen

Überblick über Machine Learning

  • Traditionelle Modellierung: Mensch erstellt Regeln und Computer setzt sie ein -> Ergebnis
  • Maschinelles Lernen: Mensch generiert Trainingsdaten -> Computer Modell -> Modell als Ergebnis // neue Daten -> Modell -> Ergebnis "Prädiktion"

Arten des Machine Learnings

  • Supervised Lernen: Klassifizierung und Regression
  • Unsupervised Lernen: Clustering und Assoziation

Supervised Learning

  • Ausgangspunkt: Targets und Features (Eigenschaften) von Datenpunkte sind im Voraus bekannt / gelten
  • Algorithmen verwenden Beispiele aus der Vergangenheit, um Vorhersagen für die Zukunft zu treffen

Arten des Machine Learnings mit Supervised Learning

  • Klassifizierung: eine historische Daten um neue Nachrichten als Spam oder Nicht-Spam zu klassifizieren
  • Regression: historische Daten über Immobilien (Features) um vorherzusagen, wie viel eine neue Immobilie Wert sein wird.

Unsupervised Learning

  • Ausgangspunkt: Targets und Features der Datenpunkte sind nicht im Voraus bekannt
  • Algorithmen suchen eigenständig nach Mustern und Strukturen in ungelabelten Daten
  • Daten nicht vordefiniert: Hauptziel ist die Organisation/Strukturierung der Daten

Lineare Regression

  • In-Sample Prediction: Anpassung eines Modells an vorhandene Daten, um die Beziehung zwischen Features (X) und dem Target (Y) zu beschreiben; Vorhersage der abhängigen Variable (Y) basierend auf bekannten Daten.
  • Out-of-Sample Prediction: Treffen von Vorhersagen für neue, unbekannte Datenpunkte, für die Y-Werte nicht bekannt sind; Vorhersage von Y für neue, unbekannte Daten nur auf Basis der bekannten Features (X) → Predicted values.

Ursachen und Konsequenzen von Residuen:

Ursachen:

  • Weiteren/nicht-einbezogenen Einflussfaktoren
  • Zufallsfehler

Konsequenzen:

  • Faktisch (Fehlentscheidung, Kosten etc.)
  • Ethische Relevanz
  • Zentrale Frage: Was ist die Alternative?

Möglichkeiten zur Reduktion von Residuen:

  • Weitere Prädiktoren (die Informationen liefern)
  • Besseres Modell (z.B. nicht-linear, Interaktionen)
  • Gefahr des Overfittings

Residuen und Regressionen

  • Bei folgender Verteilung von Datenpunkten wird die Regressionsform anhand des Fit beurteilt.
  • Ein besserer Fit kann jedoch zur Gefahr von Overfitting führen.

Lineare Modelle und Interaktionen

  • Lineare Modelle können moderate Interaktionen und nichtlineare Beziehungen abbilden.
  • Produktterm (x*z als weiterer Prädiktor) → "Moderierte Regression„
  • Nicht-Lineare Funktionen: Polynome modellieren (z.B. X2 oder X3)
  • Die Interaktion ist zwar noch einfach, aber bei kurvenlinenarer Funktion ist es nicht mehr einfach handhabbar.

Flexibilität und Overfitting

  • Machine-Learning-Modelle passen sich flexibler den Daten an -> Geringer Bias -> Hohe Varianz -> Guter Datenfit -> Schlechte zukünftige Nutzbarkeit
  • Die Lösung: Empirische Bestimmung der nötigen Flexibilität

Bias-Variance Tradeoff

  • Bias: beschreibt wie gut ein Modelle die Daten anpasst -> (Niedrige MSE = niedriger Bias)
  • Varianz: beschreibt wie stabil das Modell gegenüber unterschiedlichen Datensätzen ist -> (Geringe Abweichungen = niedrige Varianz)
  • Tradeoff: Optimales Gleichgewicht zwischen Bias und Varianz -> (relevant bei jedem ML-Verfahren)
  • Lösung: Bestimmung durch Cross-Validation (Aufteilung in Trainings- und Testdaten)

Crossvalidation

  • Datenset wird in Trainings- und Testdaten geteilt
  • Das Modell wird am Trainings-Set trainiert
    • Im Trainings-Set kann man die Flexibilität variieren
  • Das Modell wird am Test-Set evaluiert
    • dies dient zur Bias-Variance Tradeoff

Arten der Crossvalidation

  • Training-Testing-only (TT only):
    • Split in Train Set und Test Set
    • Problem: Der Split ist zufällig und kann die performance beeinflussen
  • kfold / vfold Cross-validation:
    • Gesamtdaten werden in gleichgroße Teile zerlegt (folds)
    • Modell wird in Training folds trainiert und im Test fold evaluiert
    • Durch wiederholte Anwenung wird Zufallseinfluss minimiert
    • Jeder Fold ist einmal Testgrundlage

Klassifizierung

  • Aus einer Menge von Datenpunkten und deren zugehörigen Labels lernen.
  • Das Supervised Learning bestimmt die Anzahl der Klassen in der Klassifizierung
  • Es gibt die Zwei-Klassen- bzw. dichotome Klassifizierung und Mehrklassen- bzw. multinomiale Klassifizierung

Klassifizierung mit k-NN

  • k-NN (k = k-nearest neighbor) ist ein Algorithmus, der auf Trainingsdaten (Trainings-Set) angewandt wird.
    1. Datensatz mit bekannten Labels: Satz von Datenpunkten, für die wir die richtigen Klassen kennen
    2. Vergleich der neuen Datenpunkten mit den bestehenden: Ein neu dazukommender Datenpunkt wird mit den vorhanden Datenpunkten verglichen, um Ähnlichkeiten zu finden
    3. Wahl der k nearest neighbors: Wir wählen die k Datenpunkte aus, die dem neuen Datenpunkt am ähnlichsten sind, seine k-nearest neighbors
    4. Mehrheitsentscheidung: Aus diesen k-nearest neighbors wird die Mehrheit der Labels ermittelt. Das gewählte Label ist das die Klasse des neuen Datenpunkts

K-nearest neighbor (k-NN)

  • K ist ein Hyperparameter und bestimmt die Feingranuliertheit der Klassifikation:
    • k = 1
      • Der nächstliegende Wert wird herangezogen
      • Decision boundary ist sehr "wiggly"
      • Guter Fit (niedriger Bias) aber geringe Nutzbarkeit für zukünftige Daten (Variant)
    • k = 100
      • Die umliegenden 100 Nachbarn werden herangezogen
      • Decision boundary wird gröber -Schlechterer Fit, aber höhere Generalisierbarkeit
  • Bias-Variance Tradeoff: optimaler Wert bzgl. Fit und Generalisierbarkeit muss empirisch bestimmt werden

Entscheidungsbaum

  • Ein Entscheidungsbaum im Machine Learning ist ein Algorithmus, der für Klassifizierungs- und Regressionsaufgaben verwendet wird.
  • Entscheidungsbäume nutzen verfügbare Daten, um Vorhersagen über neue Datenpunkte treffen zu können
  • Es gibt verschiedene Algorithmen für Entscheidungsbäume, wir fokussieren uns auf einen einfachen Regressionsbaum

Logik eines einfachen Regressionsbaumes

  • Target: Einkommen von US-Footballspielern (→ quantitativ)
  • 2 Features
    • Jahre als Prof
    • Anzahl der „Hits"
  • Logik:
    • Es wird eine Variable gesucht, die den Feature Space durch einen Split in homogenere Teile teilt
    • Diese homogenen Teile nennt man Knoten
    • Anschließend ein neuer Split mit einem anderen oder demselben Feature

Overfitting Problem bei Entscheidungsbäumen

  • Das Splitting wiederholt sich so lange, bis maximale Baumtiefe erreicht ist.
  • In diesem Fall sieht der Baum wie gefolgt aus:
  • das Modell wird durch Tree pruning durch das Herausschneiden einzelner Knoten verbessert.

Entscheidungbaum: Probleme und ihre Lösung

  • Problem: Splitting-Prozess läuft, bis jeder Fall sein eigener Knoten wird, was in hoher „Baumtiefe“ resultiert; das führt zu niedrigerem Bias aber hoher Varianz
  • Lösung: Tree pruning
  • Vorteile von einfachen Bäumen:
  • Intuitive Visualisierung/ Verständlichkeit
  • Bedeutung der Unterteilungen sichtbar
  • Nachteile von einfachen Bäumen:
  • Geringere prediction accuracy als andere Methoden
  • Bei zu vielen Unterteilungen wird Modell unübersichtlich

Neuronale Netze

  • Ein neuronales Netz besteht aus Neuronen.
  • Layer: 0 (input), 1 (hidden), 2 (hidden), 3 (output)
  • Die Neuronen im neuronalen Netz erhalten Inputs, gewichten diese, senden sie durch eine Activation Function und geben ein Ergebnis aus

Erkennung von Zeichen und Mustern

  • Computer haben evtl. Probleme Zeichen / Handschriften zu erkennen, da
    • es viele Möglichkeiten gibt Zeichen darzustellen
    • Zeichen unfertig und miteinander verbunden sind
    • es unterschiedlichen Winkel gibt
  • Beispiel: MNIST Dataset - Ziffernerkennung
    • Die Ausgabeschicht besteht in diesem Beispiel aus 10 Ziffern
    • In der Ausgabeschicht wird nun das Ergebnis angegeben dargestellt
  • Das ML-System lernt wie diese Zeichen aussehen können / entscheidet auf Basis der Prädiktion
  • das ist mit großem Datenset (Variationsvielfalt der Zeichen = Höhere Genauigkeit in der Mustererkennung machbar
  • Das Gelernte kann die Mustererkennung dann auf einen neuen Datensatz anwenden
  • Selbstfahrende Autos:
    • Voraussetzung: identifizieren von Objekten (Sky, Building, Pole, Road Marking, Road, Pavement, Tree, Sign Symbol, Fence, Vehicle, Pedestrian, Bike)

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

More Like This

Use Quizgecko on...
Browser
Browser