Testing and Scoring

Was sind die drei Eigenschaften, die wir von Klassifikationsmodellen erwarten?

Verständlichkeit, Komplexität, Fehler
Verständlichkeit, Einfachheit, Genauigkeit (correct)
Verständlichkeit, Komplexität, Genauigkeit
Verständlichkeit, Einfachheit, Fehler

Warum bevorzugen wir oft einfachere Modelle?

Weil sie weniger Rechenleistung benötigen als komplexe Modelle
Weil sie genauer sind als komplexe Modelle
Weil sie weniger anfällig für Überanpassung sind und besser generalisieren können (correct)
Weil sie leichter zu trainieren sind als komplexe Modelle

Was ist die Hauptanforderung an ein Klassifikationsmodell?

Einfachheit
Komplexität
Verständlichkeit
Genauigkeit (correct)

Welche Metrik gibt den Prozentsatz der korrekten bzw. inkorrekten Vorhersagen an?

Vorhersagegenauigkeit / Fehler (A) Signup and view all the answers

Welche Metrik misst die Fähigkeit des Modells, positive Fälle zu identifizieren?

Recall (A) Signup and view all the answers

Welche Metrik misst die Genauigkeit bei der Identifizierung von positiven Fällen?

Precision (D) Signup and view all the answers

Welche spezifischeren Fehlermaße werden neben der Vorhersagegenauigkeit verwendet?

Recall, Precision, Sensitivity, Specificity (A) Signup and view all the answers

Was ist die zentrale Frage bei der Bewertung eines Klassifikationsmodells?

Wie genau und zuverlässig ist das Modell? (C) Signup and view all the answers

Welche Art von Daten wird verwendet, um die Leistung des Modells auf neuen Daten zu simulieren?

Testdaten (B) Signup and view all the answers

Warum ist es wichtig, dass die Testdaten unabhängig von den Trainingsdaten sind?

Damit das Modell auf neuen Daten zuverlässig arbeitet (B) Signup and view all the answers

Was ist die Resubstitution Estimate?

Eine Methode zur Schätzung der Genauigkeit auf dem Trainingsdatensatz (A) Signup and view all the answers

Welche Methode liefert in der Praxis oft keine zuverlässigen Schätzungen der Genauigkeit?

Resubstitution Estimate (B) Signup and view all the answers

Was ist ein 'Holdout-Set'?

Ein unabhängiger Datensatz, der nicht in den Trainingsdaten enthalten ist (B) Signup and view all the answers

Warum ist es wichtig, das Modell auf unabhängigen Testdaten zu testen?

Um die Vorhersagequalität des Modells zu bewerten (C) Signup and view all the answers

Was ist das Ziel des Bewertungsprozesses für Klassifikatoren?

Die Leistung verschiedener Klassifikatoren auf unabhängigen Testdaten zu vergleichen und den besten Classifier auszuwählen. (B) Signup and view all the answers

Warum ist es wichtig, die Genauigkeit eines Klassifikationsmodells im Vergleich zur Default-Genauigkeit zu betrachten?

Um festzustellen, ob das Modell wirklich besser als einfaches Raten ist. (D) Signup and view all the answers

Welche Methode teilt die Daten in Trainings- und Testsets auf und verwendet diese mehrmals für verschiedene Tests?

Zufällige Stichprobenziehung (A) Signup and view all the answers

Welche Methode verwendet ein Beispiel gleichzeitig für Tests und trainiert das Modell mit den restlichen Beispielen?

Leave-One-Out (B) Signup and view all the answers

Warum ist die Methode 'Test auf Trainingsdaten' keine gute Methode?

Weil das Modell bereits die Antworten kennt und fast immer falsche Ergebnisse liefert. (D) Signup and view all the answers

Was ist die Fläche unter der ROC-Kurve?

Eine Zusammenfassung der Fähigkeit des Modells, Dinge richtig zu klassifizieren. (C) Signup and view all the answers

Was zeigt uns die Klassifikationsgenauigkeit?

Wie oft das Modell richtig liegt. (A) Signup and view all the answers

Was ist der F1-Wert?

Ein Mittelwert zwischen Präzision und Rückruf. (B) Signup and view all the answers

Was zeigt uns die Präzision?

Wie oft das Modell richtig sagt, dass etwas passiert. (B) Signup and view all the answers

Was ist die Wiederholte Holdout-Tests-Methode?

Eine Methode zur Schätzung der Genauigkeit oder des Fehlers eines Modells durch wiederholtes Mischen und Aufteilen der Daten in Trainings- und Testsets. (C) Signup and view all the answers

Was ist die K-Fache Kreuzvalidierung-Methode?

Eine Methode zur Schätzung der Genauigkeit oder des Fehlers eines Modells durch Aufteilung des Datensatzes in k Teilmengen und wiederholtes Trainieren und Testen des Modells auf verschiedenen Teilmengen. (A) Signup and view all the answers

Was ist die stratifizierte Kreuzvalidierung?

Eine Variante der k-fachen Kreuzvalidierung, bei der sichergestellt wird, dass jede Klasse angemessen in sowohl Trainings- als auch Testsets vertreten ist. (C) Signup and view all the answers

Was ist die 'Leave-One-Out'-Kreuzvalidierung?

Eine Variante der k-fachen Kreuzvalidierung, bei der nur ein Beispiel im Testset ist und es n Durchläufe gibt. (C) Signup and view all the answers

Was ist die 'NN % Genauigkeit'?

Eine Metrik, die angibt, welcher Prozentsatz der Vorhersagen eines Klassifikationsmodells korrekt ist. (A) Signup and view all the answers

Was ist die Default-Genauigkeit?

Die Genauigkeit, die ein Klassifikator erreichen würde, wenn er einfach immer die häufigste Klasse vorhersagt. (D) Signup and view all the answers