Texte Maschinelles Lernen.docx
Document Details

Uploaded by BrainyConnemara
Tags
Related
- CS488-Ch-9A Machine Learning PDF
- Artificial Intelligence with Machine Learning (Unit 1) PDF
- Unit 1 - Introduction to Machine Learning PDF
- Artificial Intelligence PDF
- DST301 Artificial Intelligence Applications Lecture 02 - Machine Learning PDF
- CPCS-335 Introduction to Artificial Intelligence Lecture 8 PDF
Full Transcript
**Übersicht ML** Betrachte zuerst nochmals die Ausführungen bei diesem Thema: [[Einführung ins maschinelle Lernen]](https://lernumgebung.efachausweis.ch/Kurse/kuenstliche-intelligenz/Lektionen/einfuehrung-kuenstliche-intelligenz/Themen/einfuehrung-ins-maschinelle-lernen/). **Übersicht** Die folge...
**Übersicht ML** Betrachte zuerst nochmals die Ausführungen bei diesem Thema: [[Einführung ins maschinelle Lernen]](https://lernumgebung.efachausweis.ch/Kurse/kuenstliche-intelligenz/Lektionen/einfuehrung-kuenstliche-intelligenz/Themen/einfuehrung-ins-maschinelle-lernen/). **Übersicht** Die folgende Grafik bildet Dir eine detailliertere Struktur der verschiedenen Kategorien von maschinellem Lernen. Du befasst Dich in diesem Block mit den einzelnen Elementen dieser Darstellung. Ein Bild, das Text, Screenshot, Schrift, Logo enthält. Automatisch generierte Beschreibung Falls Du kein Englisch verstehst sind hier die Übersetzungen entlang der obigen Grafik: **Machine Learning (Maschinelles Lernen)** - **Supervised Learning (Überwachtes Lernen)** - Classification (Klassifikation) - Image Classification (Bildklassifikation) - Identity Fraud Detection (Erkennung von Identitätsbetrug) - Customer Retention (Kundenbindung) - Diagnostics (Diagnostik) - Regression (Regression) - Advertising Popularity Prediction (Vorhersage der Werbebeliebtheit) - Weather Forecasting (Wettervorhersage) - Market Forecasting (Marktvorhersage) - Estimating Life Expectancy (Schätzung der Lebenserwartung) - Population Growth Prediction (Vorhersage des Bevölkerungswachstums) - **Unsupervised Learning (Unüberwachtes Lernen)** - Clustering (Clustering) - Recommender Systems (Empfehlungssysteme) - Targeted Marketing (Gezieltes Marketing) - Customer Segmentation (Kundensegmentierung) - Dimensionality Reduction (Dimensionsreduktion) - Big Data Visualization (Visualisierung von großen Datenmengen) - Meaningful Compression (Sinnvolle Kompression) - Feature Elicitation (Merkmalsermittlung) - Structure Discovery (Strukturerkennung) - **Reinforcement Learning (Verstärkendes Lernen)** - Real-time Decisions (Echtzeit-Entscheidungen) - Robot Navigation (Roboternavigation) - Game AI (Spiel-KI) - Skill Acquisition (Fähigkeitserwerb) - Learning Tasks (Lernaufgaben) **Deskriptive Statistik** Beim maschinellen Lernen werden Daten analysiert. Das kann sehr komplex werden und wir gehen nicht auf die komplizierten statischen Berechnungen ein, welche teilweise angewendet werden. Allerdings ist es sicherlich hilfreich, wenn du deine Kenntnisse zu einige wenigen zentralen statistischen Merkmalen auffrischst: **Algorithmus** Im folgenden Video werden Algorithmen erklärt. Diese bilden eine Grundlage für maschinelles Lernen. Beachte, dass wir auf das am Schluss erwähnte Thema Big Data an anderer Stelle eingehen. **Überwachtes Lernen: Klassifikation** Klassifikation ist ein Bereich des maschinellen Lernens, bei dem Daten in vordefinierte Gruppen oder Klassen eingeteilt werden. Ein Modell lernt dabei aus bekannten Daten und kann dann neue Daten korrekt einordnen. Dies sind die Schritte der Klassifikation: 1. **Datenvorbereitung**: - **Datensammlung**: Daten werden gesammelt und in einer Tabelle organisiert. Jede Zeile ist ein Datenpunkt (z.B. eine E-Mail oder ein Bild), und jede Spalte ist ein Merkmal (z.B. die Anzahl bestimmter Wörter in einer E-Mail oder die Farbe eines Blattes). - **Datenaufbereitung**: Die gesammelten Daten werden bereinigt und vorverarbeitet, z.B. durch Entfernen von Fehlern oder Normalisieren von Werten. 2. **Modelltraining**: - Ein Algorithmus wird verwendet, um ein Modell zu trainieren. Das Modell lernt aus den vorliegenden Daten, welche Merkmale zu welcher Klasse gehören. Dies geschieht durch die Analyse der Muster und Beziehungen in den Daten. 3. **Modellbewertung**: - Das Modell wird getestet, um zu sehen, wie gut es funktioniert. Dazu wird eine andere Gruppe von Daten verwendet, die das Modell noch nicht gesehen hat. Metriken wie Genauigkeit und Präzision helfen dabei, die Leistung des Modells zu beurteilen. 4. **Anwendung des Modells**: - Das trainierte Modell wird benutzt, um neue Daten in die richtigen Klassen einzuordnen. Dies ermöglicht automatisierte Entscheidungen und Vorhersagen. **Ein Beispiel** **Spam-Erkennung bei E-Mails** - **Datenvorbereitung**: E-Mails werden gesammelt. Merkmale könnten die Anzahl bestimmter Wörter, Absenderadressen oder Betreffzeilen sein. Jede E-Mail ist entweder \"Spam\" oder \"Nicht-Spam\". - Schau Dir als Beispiel diese Tabelle an: [[Beispiel Datensatz Mails]](https://lernumgebung.efachausweis.ch/wp-content/uploads/Beispiel-Datensatz-Mails.xlsx) - **Modelltraining**: Ein Algorithmus lernt aus bekannten E-Mails, welche Merkmale typisch für Spam und welche typisch für Nicht-Spam sind. - **Modellbewertung**: Das Modell wird mit neuen E-Mails getestet, um zu prüfen, ob es richtig erkennt, welche E-Mails Spam sind. - **Anwendung des Modells**: Das Modell wird verwendet, um eingehende E-Mails automatisch als \"Spam\" oder \"Nicht-Spam\" zu markieren. Zur Veranschaulichung des Trainings und der Bewertung arbeiten wir mit den Daten aus dem Beispiel Datensatz Mails. Die Daten werden in Trainings- und Testdaten aufgeteilt. In Excel könnten wir die ersten 80 Zeilen als Trainingsdaten und die letzten 20 Zeilen als Testdaten verwenden. Das sieht dann wie folgt aus: [[Beispiel Mails Training]](https://lernumgebung.efachausweis.ch/wp-content/uploads/Beispiel-Mails-Training.xlsx). Die Datei enthält zwei Tabellenblätter: 1. **Spam\_Erkennung\_Training**: Enthält die ersten 80 Zeilen der Daten, die für das Training verwendet werden. 2. **Spam\_Erkennung\_Test**: Enthält die letzten 20 Zeilen der Daten, die für das Testen verwendet werden. Zusätzlich enthält dieses Blatt eine Spalte \"Predicted\_Label\", die die Vorhersagen des Modells basierend auf einer einfachen Entscheidungsregel (Anzahl\_Links \> 3 und Anzahl\_Wörter \< 20) zeigt. Wir testen nun das Modell, indem wir die Testdaten durch die erstellten Regeln laufen lassen und die Vorhersagen mit den tatsächlichen Labels vergleichen. Wenn Du zum Beispiel die E-Mail-ID 82 betrachtest, siehst Du, dass der vorhergesagte Wert nicht mit dem manuell klassifizierten Wert übereinstimmt. Das ist also eine falsche Einschätzung. Nachfolgend findest Du die Übersicht der Trainingsdaten mit dem Ergebnis (richtige Einschätzung Ja oder Nein). Email\_ID Tatsächlicher Wert Vorhersage Richtig ----------- -------------------- ------------ --------- 81 Nicht-Spam Nicht-Spam Ja 82 Nicht-Spam Spam Nein 83 Spam Nicht-Spam Nein 84 Nicht-Spam Nicht-Spam Ja 85 Spam Nicht-Spam Nein 86 Spam Nicht-Spam Nein 87 Nicht-Spam Nicht-Spam Ja 88 Spam Nicht-Spam Nein 89 Spam Nicht-Spam Nein 90 Nicht-Spam Nicht-Spam Ja 91 Nicht-Spam Nicht-Spam Ja 92 Spam Nicht-Spam Nein 93 Nicht-Spam Nicht-Spam Ja 94 Nicht-Spam Spam Nein 95 Nicht-Spam Nicht-Spam Ja 96 Nicht-Spam Spam Nein 97 Nicht-Spam Nicht-Spam Ja 98 Nicht-Spam Nicht-Spam Ja 99 Spam Nicht-Spam Nein 100 Nicht-Spam Nicht-Spam Ja Die Genauigkeit des Modells auf den Testdaten beträgt 50% (10 x Ja). Das bedeutet, dass das Modell in 50% der Fälle die richtige Klassifikation (Spam oder Nicht-Spam) vorhersagen konnte. Eine Genauigkeit von 50% zeigt, dass das Modell nicht besser als Zufall arbeitet, da man mit einem Münzwurf dieselbe Trefferquote erreichen würde. Um die Leistung des Modells zu verbessern, könnten komplexere Algorithmen oder zusätzliche Merkmale verwendet werden. **Überwachtes Lernen: Regression** Bei der Regression geht es darum, den Zusammenhang zwischen einer abhängigen Variable (Zielvariable) und einer oder mehreren unabhängigen Variablen (Merkmalen) zu finden. Das Ziel ist es, Vorhersagen zu treffen, wenn neue Daten vorliegen. Hier sind die Schritte der Regression erklärt: 1. **Datenvorbereitung**: - **Datensammlung**: Daten werden gesammelt und in einer Tabelle organisiert. Jede Zeile ist ein Datenpunkt, und jede Spalte ist ein Merkmal (z.B. Alter, Einkommen). - **Datenaufbereitung**: Die gesammelten Daten werden bereinigt und vorverarbeitet, z.B. durch Entfernen von Fehlern oder Normalisieren von Werten. 2. **Modelltraining**: - Ein Algorithmus wird verwendet, um ein Regressionsmodell zu trainieren. Das Modell lernt aus den vorliegenden Daten, welche Beziehungen zwischen den Merkmalen und der Zielvariable bestehen. Ein einfaches Beispiel ist die lineare Regression, bei der eine gerade Linie die Beziehung beschreibt. 3. **Modellbewertung**: - Das Modell wird getestet, um zu sehen, wie gut es funktioniert. Dazu wird eine andere Gruppe von Daten verwendet, die das Modell noch nicht gesehen hat. Metriken wie der mittlere quadratische Fehler (Mean Squared Error) helfen dabei, die Leistung des Modells zu beurteilen. 4. **Anwendung des Modells**: - Das trainierte Modell wird benutzt, um neue Daten zu vorhersagen. Dies ermöglicht Vorhersagen über zukünftige Ereignisse oder Werte. **Ein Beispiel** **Hauspreisvorhersage**: - **Datenvorbereitung**: Daten über verkaufte Häuser werden gesammelt. Merkmale könnten die Quadratmeterzahl, Anzahl der Zimmer, Lage und Baujahr sein. Die Zielvariable ist der Verkaufspreis. - Betrachte dazu diese Tabelle mit Daten: [[Beispiel Hauspreis]](https://lernumgebung.efachausweis.ch/wp-content/uploads/Beispiel-Hauspreis.xlsx) - **Modelltraining**: Ein Algorithmus lernt aus den Daten, wie die Merkmale mit den Verkaufspreisen zusammenhängen. - **Modellbewertung**: Das Modell wird mit Daten von neuen Häusern getestet, um zu prüfen, wie genau es die Verkaufspreise vorhersagen kann. - **Anwendung des Modells**: Das Modell wird verwendet, um den Verkaufspreis eines neuen Hauses basierend auf seinen Merkmalen vorherzusagen. Zur Veranschaulichung des Trainings und der Bewertung arbeiten wir mit den Daten aus dem obigen Datensatz. Die Daten werden auch hier in Trainings- und Testdaten aufgeteilt. In Excel könnten wir die ersten 80 Zeilen als Trainingsdaten und die letzten 20 Zeilen als Testdaten verwenden. Das sieht dann wie folgt aus: [[Beispiel Hauspreis Training]](https://lernumgebung.efachausweis.ch/wp-content/uploads/Beispiel-Hauspreis-Training.xlsx). Die Datei enthält zwei Tabellenblätter: 1. **Hauspreis\_Training**: Enthält die ersten 80 Zeilen der Daten, die für das Training verwendet werden. 2. **Hauspreis\_Test**: Enthält die letzten 20 Zeilen der Daten, die für das Testen verwendet werden. Zusätzlich enthält dieses Blatt eine Spalte \"Predicted\_Preis\", die die vorhergesagten Verkaufspreise basierend auf einer einfachen linearen Regressionsgleichung zeigt. Wir testen nun das Modell, indem wir die Testdaten durch die erstellten Regeln laufen lassen und die Vorhersagen mit den tatsächlichen Labels vergleichen. Wenn Du zum Beispiel die Haus-ID 82 betrachtest, siehst Du, dass der vorhergesagte Wert sich um CHF 417\'367 vom tatsächlichen Wert unterscheidet. Das ist also eine erhebliche Abweichung. Nachfolgend findest Du die Übersicht der Trainingsdaten mit der Abweichung. Haus\_ID Verkaufspreis Predicted\_Preis Abweichung ---------- --------------- ------------------ ------------ 81 249459 502000 -252541 82 947367 530000 417367 83 815925 762000 53925 84 601733 988000 -386267 85 975996 364000 611996 86 113704 520000 -406296 87 806219 754000 52219 88 240846 738000 -497154 89 698016 622000 76016 90 697352 998000 -300648 91 592211 814000 -221789 92 867526 532000 335526 93 490233 906000 -415767 94 512147 834000 -321853 95 323970 748000 -424030 96 168219 406000 -237781 97 255991 830000 -574009 98 705280 892000 -186720 99 827891 990000 -162109 100 653242 568000 85242 Das Modell weist einen mittleren absoluten Fehler von CHF 300.962,75 auf. Das bedeutet, dass die vorhergesagten Verkaufspreise im Durchschnitt um diesen Betrag von den tatsächlichen Verkaufspreisen abweichen. Das ist relativ hoch, was darauf hindeutet, dass das Modell nicht besonders genau ist. Um die Genauigkeit des Modells zu verbessern, könnten komplexere Algorithmen, zusätzliche Merkmale oder eine bessere Datenvorverarbeitung eingesetzt werden. **Zusammenfassung** Du hast die zwei Methoden des überwachten Lernens kennengelernt. Zusammengefasst können wir festhalten: Klassifikation kategorisiert Daten in vordefinierte Kategorien, während Regression Werte vorhersagt. **Vertiefung** Wenn dich das interessiert, kannst du das Thema Regression vertiefen. Das geht über den Stoff in diesem Lehrgang hinaus, aber wir möchten dir das nicht vorenthalten, falls du dich gerne mit Statistik beschäftigst: In unserem Beispiel wurde eine lineare Regression angewandt. Dies ist eine einfache und häufig verwendete Methode im maschinellen Lernen, um die Beziehung zwischen einer abhängigen Variable (hier: Verkaufspreis) und einer oder mehreren unabhängigen Variablen (hier: Quadratmeterzahl und Zimmeranzahl) zu modellieren. **Unüberwachtes Lernen: Clustering** Clustering ist ein Bereich des unüberwachten Lernens im maschinellen Lernen. Beim Clustering geht es darum, Datenpunkte in Gruppen (Cluster) zu unterteilen, sodass Datenpunkte innerhalb eines Clusters einander ähnlicher sind als Datenpunkte in verschiedenen Clustern. Hier sind die Schritte des Clustering erklärt: 1. **Datenvorbereitung**: - **Datensammlung**: Daten werden gesammelt und in einer Tabelle organisiert. Jede Zeile ist ein Datenpunkt, und jede Spalte ist ein Merkmal (z.B. Alter, Einkommen, Interessen). - **Datenaufbereitung**: Die gesammelten Daten werden bereinigt und vorverarbeitet, z.B. durch Entfernen von Fehlern oder Normalisieren von Werten. 2. **Clustering-Algorithmus**: - Ein Algorithmus wird verwendet, um die Daten in Cluster zu unterteilen. 3. **Clusterbewertung**: - Die Qualität der Cluster wird bewertet. 4. **Anwendung des Clustering**: - Die Cluster können zur Mustererkennung, Datenkomprimierung oder als Vorverarbeitungsschritt für andere maschinelle Lernmethoden verwendet werden. **Ein Beispiel** **Kundensegmentierung**: - **Datenvorbereitung**: Daten über Kunden werden gesammelt. Merkmale könnten das Alter, das Einkommen und die Kaufhistorie sein. - Betrachte diesen Datensatz: [[Beispiel Kundensegmentierung]](https://lernumgebung.efachausweis.ch/wp-content/uploads/Beispiel-Kundensegmentierung.xlsx) - **Clustering-Algorithmus**: Ein Algorithmus wird verwendet, um die Kunden in verschiedene Gruppen zu unterteilen, z.B. basierend auf ähnlichem Kaufverhalten. - **Clusterbewertung**: Die Qualität der Cluster wird geprüft. - **Anwendung des Clustering**: Die resultierenden Cluster werden verwendet, um gezielte Marketingkampagnen für verschiedene Kundengruppen zu erstellen. Zur Veranschaulichung des Trainings und der Bewertung arbeiten wir mit den Daten aus dem obigen Datensatz. Statistisch werden ähnliche Kunden in denselben Cluster zusammengeführt. In unserem Beispiel arbeiten wir mit 3 Clustern. Dies ergibt folgende Zuordnung: [[Beispiel Kundensegmentierung Cluster]](https://lernumgebung.efachausweis.ch/wp-content/uploads/Beispiel-Kundensegmentierung-Cluster.xlsx). Graphisch sieht das wie folgt aus:  Dieses Beispiel zeigt, wie Clustering im maschinellen Lernen funktioniert, indem Datenpunkte in ähnliche Gruppen eingeteilt werden, um Muster zu erkennen und Entscheidungen zu treffen (hier z.B. Marketingkampagnen). **Unüberwachtes Lernen: Dimensionsreduktion** Dimensionsreduktion ist ein Bereich des maschinellen Lernens, bei dem die Anzahl der Merkmale in einem Datensatz reduziert wird, während die wesentlichen Informationen beibehalten werden. Dies hilft, die Komplexität zu verringern, die Verarbeitung zu beschleunigen und visuelle Darstellungen zu erleichtern. Hier sind die Schritte der Dimensionsreduktion erklärt: 1. **Datenvorbereitung**: - **Datensammlung**: Daten werden gesammelt und in einer Tabelle organisiert. Jede Zeile ist ein Datenpunkt, und jede Spalte ist ein Merkmal (z.B. Alter, Einkommen, Interessen). - **Datenaufbereitung**: Die gesammelten Daten werden bereinigt und vorverarbeitet, z.B. durch Entfernen von Fehlern oder Normalisieren von Werten. 2. **Anwendung eines Dimensionsreduktionsalgorithmus**: - Ein Algorithmus wird verwendet, um die Dimensionen der Daten zu reduzieren. 3. **Visualisierung**: - Die reduzierten Dimensionen werden visualisiert, um Muster oder Strukturen in den Daten zu erkennen. **Ein Beispiel** **Merkmalsermittlung**: - **Datenvorbereitung**: Daten mit vielen irrelevanten oder redundanten Merkmalen werden gesammelt. - Beispiel: [[Beispiel Merkmalsermittlung]](https://lernumgebung.efachausweis.ch/wp-content/uploads/Beispiel-Merkmalsermittlung.xlsx) - **Dimensionsreduktionsalgorithmus**: Eine Methode wird verwendet, um die wichtigsten Merkmale zu identifizieren. - **Anwendung**: Die ausgewählten Merkmale werden für nachfolgende maschinelle Lernmodelle verwendet, um die Leistung zu verbessern. Zur Veranschaulichung des Trainings und der Bewertung arbeiten wir mit den Daten aus dem obigen Datensatz. In der Tabelle werden die ursprünglichen Merkmale (Feature\_1 bis Feature\_10) durch die Methodik der sogenannten Hauptkomponentenanalyse (PCA) auf zwei Dimensionen reduziert, die als PCA1 und PCA2 bezeichnet werden. PCA ist eine Technik zur Dimensionsreduktion, die darauf abzielt, die Anzahl der Merkmale in einem Datensatz zu reduzieren, während die wesentlichen Informationen beibehalten werden. Daraus resultieren die grün markierten Werte in dieser Tabelle: [[Beispiel Merkmalsermittlung reduziert.]](https://lernumgebung.efachausweis.ch/wp-content/uploads/Beispiel-Merkmalsermittlung-reduziert.xlsx) Diese zwei Dimensionen können nun wieder graphisch dargestellt werden, z.B. so: Ein Bild, das Text, Screenshot, Diagramm, Reihe enthält. Automatisch generierte Beschreibung **Verstärkendes Lernen** Verstärkendes Lernen (Reinforcement Learning, RL) ist ein Bereich des maschinellen Lernens, bei dem ein Agent durch Interaktion mit einer Umgebung lernt, bestimmte Aufgaben zu erfüllen. Der Agent erhält Belohnungen oder Bestrafungen basierend auf seinen Aktionen und versucht, seine Strategie (Politik) zu optimieren, um langfristig maximale Belohnung zu erzielen. Hier sind die Schritte des verstärkenden Lernens erklärt: 1. **Agent und Umgebung**: - Der Agent ist das lernende System (z.B. ein Roboter, ein Spielprogramm). - Die Umgebung ist alles, womit der Agent interagiert (z.B. ein Spielbrett, eine physische Welt). 2. **Aktionen und Zustände**: - Der Agent kann verschiedene Aktionen ausführen, die ihn von einem Zustand in einen anderen bringen. - Jeder Zustand repräsentiert eine spezifische Situation in der Umgebung. 3. **Belohnungen und Bestrafungen**: - Der Agent erhält Belohnungen oder Bestrafungen basierend auf den Konsequenzen seiner Aktionen. - Das Ziel des Agenten ist es, eine Strategie zu entwickeln, welche die Belohnung maximiert. 4. **Strategie (Politik)**: - Eine Strategie ist ein Plan, den der Agent verwendet, um Aktionen basierend auf den Zuständen auszuführen. - Der Agent lernt und optimiert diese Strategie über die Zeit. **Ein Beispiel** Für dieses Beispiel simulieren wir einen einfachen Agenten, der lernt, Entscheidungen beim Autofahren zu treffen, um die maximale Belohnung zu erzielen: [[Beispiel Echtzeitentscheidungen]](https://lernumgebung.efachausweis.ch/wp-content/uploads/Beispiel-Echtzeitentscheidungen.xlsx) Die folgende Excel-Datei zeigt die Ergebnisse der simulierten Lernepisoden: [[Bespiel Echtzeitentscheidungen Belohnung]](https://lernumgebung.efachausweis.ch/wp-content/uploads/Bespiel-Echtzeitentscheidungen-Belohnung.xlsx). Die Tabelle erklärt: - **Episode**: Die Nummer der Episode. - **Position**: Die Position des selbstfahrenden Autos. - **Geschwindigkeit**: Die Geschwindigkeit des Autos. - **Aktion**: Die vom Agenten gewählte Aktion (Beschleunigen, Bremsen, Lenken). - **Belohnung**: Die Belohnung für die gewählte Aktion. - **Total\_Belohnung**: Die kumulierte Belohnung für die gesamte Episode. Diese Tabelle zeigt, wie der Agent durch Interaktionen mit der Umgebung lernt, seine Entscheidungen zu optimieren, um die Gesamtbelohnung zu **Weitere Ansätze** Neben diesen drei klassischen Kategorien gibt es weitere Ansätze des maschinellen Lernens. Wir gehen in der Folge im Sinne einer Übersicht darauf ein. **Semi-Supervised Learning (Halbüberwachtes Lernen)** Semi-Supervised Learning ist eine Lernmethode, bei der das Modell mit einer Kombination aus beschrifteten und unbeschrifteten Daten trainiert wird. Diese Methode verwendest Du, wenn nur ein kleiner Teil der Daten beschriftet ist, aber der Grossteil unbeschriftet ist. **Beispiel**: Stell Dir vor, Du hast eine grosse Sammlung von Bildern von Katzen und Hunden, aber nur wenige dieser Bilder sind korrekt als \"Katze\" oder \"Hund\" beschriftet. Mit Semi-Supervised Learning kannst Du die wenigen beschrifteten Bilder verwenden, um das Modell zu trainieren, und die unbeschrifteten Bilder, um das Modell weiter zu verbessern, indem es lernt, Muster und Merkmale in den Bildern zu erkennen. **Self-Supervised Learning (Selbstüberwachtes Lernen)** Self-Supervised Learning ist eine Methode, bei der das Modell Lernsignale aus den Daten selbst extrahiert, ohne dass explizite Beschriftungen benötigt werden. Das Modell generiert automatisch Aufgaben und nutzt diese, um zu lernen. **Beispiel**: Ein Beispiel ist die Textvorhersage, bei der das Modell aus einem Teil eines Textes lernt, den nächsten Teil vorherzusagen. Wenn Du beispielsweise einen Satz hast, bei dem einige Wörter fehlen, kann das Modell lernen, die fehlenden Wörter basierend auf dem Kontext vorherzusagen. **Transfer Learning (Transferlernen)** Transfer Learning ist eine Methode, bei der ein Modell, das für eine bestimmte Aufgabe trainiert wurde, auf eine andere, aber verwandte Aufgabe angewendet wird. Dies ist besonders nützlich, wenn nicht genügend Daten für die Zielaufgabe vorhanden sind. **Beispiel**: Ein Modell, das zur Bilderkennung von Tieren trainiert wurde, kann für die Erkennung von verschiedenen Vogelarten verwendet werden. Das Modell hat bereits grundlegende Merkmale wie Formen und Farben gelernt und kann dieses Wissen auf die neue Aufgabe übertragen. **Active Learning (Aktives Lernen)** Active Learning ist eine Methode, bei der das Modell gezielt die Datenpunkte auswählt, von denen es lernen möchte. Das Modell identifiziert die Datenpunkte, die am informativsten sind, um seine Leistung zu maximieren. **Beispiel**: Stell Dir vor, Du trainierst ein Modell zur Erkennung von medizinischen Anomalien in Röntgenbildern. Das Modell kann die schwierigsten und unsichersten Bilder identifizieren und diese zur Beschriftung durch Experten auswählen, um gezielt seine Genauigkeit zu verbessern. **Online Learning (Online-Lernen)** Online Learning ist eine Methode, bei der das Modell kontinuierlich aus eintreffenden Daten lernt, anstatt nur einmalig aus einem statischen Datensatz. Dies ist besonders nützlich in dynamischen Umgebungen, in denen sich die Daten kontinuierlich ändern. **Beispiel**: Ein Modell, das den Aktienmarkt vorhersagt, kann kontinuierlich neue Daten über Marktbewegungen, Nachrichten und andere relevante Informationen aufnehmen und seine Vorhersagen entsprechend anpassen. **Generative Models (Generative Modelle)** Generative Modelle sind Modelle, die lernen, die Verteilung der Daten zu modellieren, sodass sie neue Datenpunkte generieren können, die ähnlich wie die Trainingsdaten sind. **Beispiel**: Ein GAN (Generative Adversarial Networks) kann verwendet werden, um neue, realistisch aussehende Gesichter zu generieren, die nicht von echten Menschen unterschieden werden können. **Few-Shot Learning (Lernen mit wenigen Beispielen)** Few-Shot Learning ist eine Methode, bei der das Modell mit nur wenigen Beispielen lernen kann. Dies ist besonders nützlich in Situationen, in denen es schwierig oder teuer ist, viele beschriftete Daten zu sammeln. **Beispiel**: Ein Modell, das zur Erkennung von seltenen Vogelarten trainiert wird, kann aus nur wenigen Bildern jeder Vogelart lernen, diese korrekt zu identifizieren.