Popular Regression and Classification Algorithms

UnrestrictedAlgorithm avatar
UnrestrictedAlgorithm
·
·
Download

Start Quiz

Study Flashcards

8 Questions

Co oznacza skrót GINI w kontekście analizy ryzyka?

Minimalizacja różnicy między dystrybuantą modelu a dystrybuantą danych obserwowanych

Co oznacza skrót KS w analizie ryzyka?

Test Kolmogorova-Smirnova

Co obejmuje analiza wielowymiarowa w kontekście budowy modelu ryzyka?

Ocena, które zmienne mogą występować obok siebie w modelu

Czym jest IV w kontekście analizy ryzyka?

Informacyjną wartością

Co jest istotne podczas oceny modelu ryzyka?

Stabilność modelu

Jakie czynniki uwzględnia analiza korelacji w budowie modelu ryzyka?

Możliwość występowania zmiennych obok siebie w finalnym modelu

Dlaczego stabilność modelu jest istotna podczas oceny modelu ryzyka?

Zapobiega overfittingowi

Co obejmuje etapy analizy wielowymiarowej w kontekście budowy modelu ryzyka?

Budowę kilku alternatyw finalnego modelu

Study Notes

Algorytmy Regresji i Klasyfikacji

  • Regresja liniowa, regresja wielomianowa, SVR – Support Vector Regression, regresyjne drzewa decyzyjne, regresyjne lasy losowe są algorytmami regresji
  • Regresja logistyczna, Support Vector Machines, drzewa decyzyjne, lasy losowe, metoda k-najbliższych sąsiadów, gradient boosting są algorytmami klasyfikacji

Budowa Modelu - Niezbalansowana Próba

  • Metody estymacyjne mogą być wrażliwe na stosunek klas/kategorii w badanym zbiorze
  • Stosunek 90:10 do 10:90 jest optymalny dla wiarygodnego oszacowania parametrów
  • Oversampling, undersampling to metody zdezgenerowania niezbalansowanej próby

Budowa Modelu - Wybór Zmiennych

  • Analiza jednowymiarowa (univariate analysis) ocenia indywidualny wpływ "risk driverów" na zmienną objaśnianą
  • Outliers to wartości odstające, które różnią się od pozostałych
  • Zmienne kategoryczne to zmienne opisowe, np. płeć, wykształcenie, zawód
  • gotowe pakiety i funkcje do analizy danych to Dataframe.info(), Dataframe.describe(), Ydata profiling

Budowa Modelu - Działanie z Brakującymi Danymi

  • Metody obsługi brakujących danych to usunięcie wartości, zastępowanie wartości
  • LabelEncoder(), OneHotEncoder() są używane do obsługi zmiennych kategorycznych
  • WoE (Weight of Evidence) jest stosowany do prezentacji riskdriverów

Budowa Modelu - Dobór Próby

  • Standardowy sposób podziału próby to próba treningowa, próba testowa OOS (Out of sample), próba testowa OOT (Out of time)
  • Próba treningowa to próba, na której modelarz tworzy model
  • Próba testowa OOS składa się z tych samych okresów obserwacji, co próba treningowa
  • Próba testowa OOT składa się z innych okresów, niż próba treningowa

Budowa Modelu - Wybór Modelu

  • Modele regresji służą do określania wartości ciągłych
  • Modele klasyfikacji służą do prognozowania lub klasyfikowania wartości dyskretnych
  • Statystyki pomocne w ramach tej analizy to GINI, KS (Kolmogorov-Smirnoff), IV (Information Value)

Budowa Modelu - Wybór Zmiennych

  • Analiza wielowymiarowa (multivariate analysis) ocenia, które zmienne mogą, a które nie powinny występować obok siebie w finalnym modelu

Test your knowledge on well-known regression and classification algorithms in machine learning. Explore linear regression, support vector machines, decision trees, random forests, logistic regression, and more.

Make Your Own Quizzes and Flashcards

Convert your notes into interactive study material.

Get started for free

More Quizzes Like This

Use Quizgecko on...
Browser
Browser