Regresja Liniowa: Wprowadzenie

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson
Download our mobile app to listen on the go
Get App

Questions and Answers

Jaki jest główny cel regresji w uczeniu maszynowym, w odróżnieniu od klasyfikacji?

  • Przypisanie obiektu do jednej z kategorii.
  • Przewidywanie wartości dyskretnych.
  • Przewidywanie wartości liczbowych na podstawie danych wejściowych. (correct)
  • Grupowanie danych w klastry o podobnych cechach.

Który z wymienionych typów regresji nie jest typowo stosowany w uczeniu maszynowym?

  • Regresja geometryczna. (correct)
  • Regresja wielomianowa.
  • Regresja logistyczna.
  • Regresja liniowa.

Co oznacza, że regresja liniowa jest modelem parametrycznym?

  • Model opiera się na zbiorze parametrów, które są uczone na podstawie danych. (correct)
  • Model jest niezależny od zmiennych wejściowych.
  • Model nie wymaga danych wejściowych do działania.
  • Model może być używany tylko do przewidywania kategorii, a nie wartości liczbowych.

W kontekście regresji liniowej, czym są 'parametry modelu'?

<p>Współczynniki kombinacji liniowej, które określają, jak model dopasowuje się do danych. (A)</p>
Signup and view all the answers

Która z poniższych koncepcji odgrywa kluczową rolę w regresji uczenia maszynowego?

<p>Overfitting i Underfitting. (D)</p>
Signup and view all the answers

Jaki jest cel minimalizacji błędu średniokwadratowego w uczeniu regresji liniowej?

<p>Znalezienie parametrów modelu, które najlepiej pasują do danych treningowych. (A)</p>
Signup and view all the answers

Jak obliczana jest predykcja dla nowego przykładu xk w modelu regresji liniowej?

<p>Wykorzystując funkcję modelu F(xk). (D)</p>
Signup and view all the answers

W kontekście statystyki, czym jest regresja?

<p>Sposobem na ustalenie zależności między zmiennymi. (A)</p>
Signup and view all the answers

Które z poniższych stwierdzeń najlepiej opisuje odkrycie Galtona dotyczące regresji w kierunku przeciętności?

<p>Dzieci skrajnie wysokich lub niskich rodziców mają tendencję do posiadania cech bliższych średniej populacji. (C)</p>
Signup and view all the answers

W kontekście regresji liniowej, co reprezentuje wyraz wolny (θ₀) w równaniu yo(x) = θ₀ + θ₁x₁ + θ₂x₂?

<p>Wartość przewidywaną, gdy wszystkie cechy mają wartość zerową. (C)</p>
Signup and view all the answers

Co oznacza 'liniowość modelu' w kontekście regresji liniowej?

<p>Model danych jest liniowy względem parametrów θ. (C)</p>
Signup and view all the answers

W jaki sposób liczba cech (n) wpływa na model regresji liniowej?

<p>Określa, ile cech będzie branych pod uwagę w modelu. (D)</p>
Signup and view all the answers

Kiedy możemy stosować model regresji liniowej?

<p>Gdy cechy (zmienne losowe) są liniowo zależne. (C)</p>
Signup and view all the answers

Jaki zakres wartości współczynnika korelacji wskazuje na dość silną zależność między zmiennymi?

<p>Od 0.7 do 0.9. (A)</p>
Signup and view all the answers

Która z wymienionych dziedzin nie jest typowym zastosowaniem regresji?

<p>Sztuka. (B)</p>
Signup and view all the answers

Co oznacza stwierdzenie, że korelacja nie implikuje wynikania?

<p>Dwie zmienne mogą być ze sobą powiązane, ale nie oznacza to, że jedna zmienna powoduje drugą. (C)</p>
Signup and view all the answers

W jaki sposób regresję liniową można zapisać w zwartym matematycznie zapisie, używając iloczynu skalarnego?

<p>y = θ ⋅ x, gdzie θ to wektor parametrów. (A)</p>
Signup and view all the answers

Do czego sprowadza się trenowanie modelu regresji w kontekście równania macierzowego Xθ = y?

<p>Do rozwiązania równania dla niewiadomej θ. (B)</p>
Signup and view all the answers

Jaką właściwość ma pseudoinwersja Moore'a-Penrose'a macierzy?

<p>Może być policzona dla macierzy nieodwracalnych. (C)</p>
Signup and view all the answers

Która z metod jest bardziej stabilna numerycznie przy rozwiązywaniu równań regresji liniowej, zwłaszcza dla macierzy osobliwych i niekwadratowych?

<p>Rozkład według wartości osobliwych (SVD). (C)</p>
Signup and view all the answers

Który element jest dodawany w regresji grzbietowej (ridge regression) w celu regularyzacji modelu?

<p>Regularyzacja L2. (C)</p>
Signup and view all the answers

Z czym utożsamiana jest regresja liniowa ze względu na minimalizację funkcji celu?

<p>Z metodą najmniejszych kwadratów. (D)</p>
Signup and view all the answers

Kiedy metoda najmniejszych kwadratów działa poprawnie i prowadzi do wiarygodnych wyników?

<p>Gdy reszty mają rozkład normalny. (A)</p>
Signup and view all the answers

Co to są 'reszty' w kontekście regresji?

<p>Różnice między przewidywaniami modelu a obserwacjami. (C)</p>
Signup and view all the answers

Jaki warunek musi być spełniony, aby regresja liniowa działała poprawnie w kontekście rozkładu reszt?

<p>Reszty muszą pochodzić z tego samego rozkładu. (C)</p>
Signup and view all the answers

Co daje maksymalizacja wiarygodności w kontekście uczenia regresji?

<p>Funkcję celu wykorzystywaną do uczenia regresji. (B)</p>
Signup and view all the answers

Co określa funkcja celu w metodzie najmniejszych kwadratów?

<p>Odległość modelu od przykładów (danych treningowych). (A)</p>
Signup and view all the answers

Jaki jest pierwszy krok w metodzie gradientu prostego (gradient descent) w optymalizacji?

<p>Wybranie (losowego) punktu startowego θ₀. (B)</p>
Signup and view all the answers

Jak nazywa się najbardziej ogólna, iteracyjna metoda optymalizacji opisana w tekście?

<p>Metoda gradientu prostego (gradient descent). (A)</p>
Signup and view all the answers

Co jest istotne dla skuteczności algorytmu gradientu prostego?

<p>Wybór odpowiednich parametrów uczenia i warunku stopu. (B)</p>
Signup and view all the answers

W jakiej sytuacji może być stosowana metoda gradientowa?

<p>Gdy mamy do analizy wielowymiarową przestrzeń cech. (A)</p>
Signup and view all the answers

Która z wymienionych polityk nie jest wariantem metody gradientowej?

<p>Random gradient descent. (C)</p>
Signup and view all the answers

Co oznacza, że funkcja kosztu jest funkcją parametrów modelu?

<p>Wartość funkcji kosztu zależy od wartości parametrów modelu. (C)</p>
Signup and view all the answers

Które z poniższych założeń nie jest wymagane do tego, aby metoda najmniejszych kwadratów działała poprawnie?

<p>Zależność między zmiennymi jest nieliniowa. (A)</p>
Signup and view all the answers

Podczas trenowania regresji metodą gradientu prostego, co należy zrobić, jeśli wartość funkcji celu f(xk+1) jest większa lub równa wartości f(xk)?

<p>Zmniejszyć wartość kroku ak i powtórzyć obliczenia dla k-tego kroku. (B)</p>
Signup and view all the answers

Flashcards

Regresja w uczeniu maszynowym

Klasa algorytmów służących do przewidywania wartości liczbowych na podstawie zbioru danych wejściowych.

Liniowa kombinacja

Model, który wykorzystuje liniową kombinację funkcji regresorów do przewidywania wartości.

Parametry modelu

Współczynniki w równaniu regresji, które są wyznaczane w procesie uczenia modelu.

Cel uczenia regresji

Znalezienie takich wartości parametrów, które minimalizują błąd między wartościami rzeczywistymi a przewidywanymi przez model.

Signup and view all the flashcards

Uczenie regresji

Proces minimalizacji błędu średniokwadratowego przybliżenia.

Signup and view all the flashcards

Predykcja

Wyliczenie wartości etykiety dla nowego przykładu danych przy użyciu nauczonego modelu.

Signup and view all the flashcards

Regresja

Ustalenie zależności między zmiennymi w statystyce.

Signup and view all the flashcards

Regresja do średniej

Tendencja, gdzie skrajnie wysokie lub niskie cechy u rodziców nie są w pełni dziedziczone przez dzieci, prowadząc do wartości bliższych średniej populacji.

Signup and view all the flashcards

Wyraz wolny

Wyraz wolny w modelu, który określa wartość przewidywaną, gdy wszystkie cechy mają wartość zerową.

Signup and view all the flashcards

Model regresji liniowej

Model, w którym wynik procesu jest liniową kombinacją cech wejściowych.

Signup and view all the flashcards

Podstawowe założenie regresji

Cechy (zmienne losowe) są liniowo zależne.

Signup and view all the flashcards

Współczynnik korelacji Pearsona

Miarą siły związku liniowego między dwiema zmiennymi.

Signup and view all the flashcards

Brak zależności między zmiennymi

Są praktycznie niezwiązane.

Signup and view all the flashcards

Słaba lub umiarkowana zależność

Pewna zależność istnieje, ale nie jest bardzo wyraźna.

Signup and view all the flashcards

Dość silna zależność

Zmienne są mocno skorelowane, ale nadal może występować wpływ innych czynników.

Signup and view all the flashcards

Bardzo silna zależność

Zmienne są niemal idealnie skorelowane liniowo.

Signup and view all the flashcards

Iloczyn skalarny

Metoda zapisu zależności w regresji liniowej, szeroko stosowana w implementacji w językach programowania.

Signup and view all the flashcards

Macierz obserwacji

Macierzowy zapis obserwacji i wyników, używany do trenowania regresji.

Signup and view all the flashcards

Równanie normalne

Rozwiązanie równania macierzowego dla regresji.

Signup and view all the flashcards

SVD (Singular Value Decomposition)

Bardziej stabilną metodą niż klasyczne rozwiązanie równania normalnego, ponieważ działa nawet dla macierzy osobliwych i niekwadratowych.

Signup and view all the flashcards

Minimalizacja funkcji celu

Minimalizacja wyrażenia ||Xθ – y||²

Signup and view all the flashcards

Norma l₂

Ma postać Σ(θixi – yi)².

Signup and view all the flashcards

Regresja a metoda najmniejszych kwadratów

Utożsamienie regresji liniowej z metodą minimalizacji sumy kwadratów błędów.

Signup and view all the flashcards

Kiedy działa metoda najmniejszych kwadratów?

Zmienne są liniowo zależne, obserwacje są niezależne i reszty mają rozkład normalny.

Signup and view all the flashcards

Reszty

Są różnice między przewidywaniami modelu a obserwacją.

Signup and view all the flashcards

Funkcja celu

Żeby ocenić poprawność do danych czyli dopasowanie do naszych danych (wiedzy).

Signup and view all the flashcards

Metoda gradientu prostego

Ma punkt startowy, oblicza się wartość dla kolejnych punktów iteracyjnie.

Signup and view all the flashcards

Study Notes

Regresja Liniowa w Uczeniu Maszynowym

  • Regresja to klasa algorytmów używana do przewidywania wartości liczbowych na podstawie danych wejściowych.
  • W przeciwieństwie do klasyfikacji, celem regresji jest przewidywanie wartości ciągłych, a nie przypisywanie do kategorii.

Typy Regresji w Uczeniu Maszynowym

  • Regresja Liniowa
  • Regresja Wielomianowa
  • Regresja Ridge i Lasso
  • Regresja Logistyczna
  • Regresja Wielowymiarowa
  • Regresja Drzew Decyzyjnych
  • Regresja oparta na metodzie Lasów Losowych (Random Forest)
  • Regresja wspierana przez Maszyny Wektorów Nośnych (Support Vector Regression) (SVR)
  • Regresja bazująca na Sieciach Neuronowych.

Regresja Liniowa - Model Parametryczny

  • Jest jednym z najpopularniejszych modeli w uczeniu nadzorowanym.
  • Model jest uczony na zbiorze przykładów (x1,y1),(x2,y2),…,(xm,ym), gdzie xi to zmienne wejściowe, a yi to wartości wyjściowe.
  • Model opiera się na założeniu zależności: Yi = F(xi) = ao + a₁Xi, gdzie Ê to model.
  • W ogólności może być funkcją wielu zmiennych (x1, x2,..., xn), czyli regresorów (regresja wielokrotna).
  • Otrzymany model to liniowa kombinacja funkcji regresorów.
  • Współczynniki kombinacji liniowej (ao, a₁) są parametrami modelu.
  • Parametry te są wyznaczane w procesie uczenia i określają sposób, w jaki model dopasowuje się do danych.

Kluczowe Koncepcje w Regresji Uczenia Maszynowego

  • Overfitting i Underfitting
  • Regularizacja
  • Funkcja Kosztu
  • Feature Engineering

Cel i Uczenie Regresji Liniowej

  • Podstawowym zadaniem modelu regresyjnego jest znalezienie takich wartości parametrów a0, a1,..., które minimalizują błąd pomiędzy wartościami rzeczywistymi yi a wartościami przewidywanymi przez model F(xi).
  • Uczenie regresji polega na minimalizacji błędu średniokwadratowego przybliżenia, gdzie suma przebiega po danych treningowych.

Predykcja w Regresji Liniowej

  • Dla nowego przykładu xk, etykieta jest wyliczana jako Ук =Ê(xk).

Regresja w Statystyce

  • Ustalenie zależności między zmiennymi, gdzie y = f(x; θ) ≈ F(x), x to zmienne opisujące, a θ to parametry modelu.
  • Jest to uczenie nadzorowane.

Pochodzenie Terminu "Regresja"

  • Francis Galton wprowadził pojęcie "regresji w kierunku przeciętności" (regression towards mediocrity) w 1886 roku.
  • Badał zależność między wzrostem rodziców a ich potomków.
  • Zauważył, że skrajnie wysokie lub niskie cechy rodziców nie są w pełni dziedziczone przez dzieci.
  • Tendencja ta prowadziła do wartości bliższych średniej populacji.

Regresja - Model Liniowy (Przykład)

  • Najprostszy model, w którym odległość jest zadana funkcją liniową cech pojazdów: yo(x) = θο + 01x1 + 02x2
  • Współczynniki θi to parametry modelu.
  • θ0: wyraz wolny (stała), określa wartość przewidywaną, gdy cechy mają wartość zerową.
  • θ1: współczynnik wpływu masy samochodu na odległość.
  • θ2: współczynnik wpływu mocy silnika na odległość.

Znaczenie Liniowości w Regresji

  • Liniowość modelu oznacza, że ye jest liniową funkcją θ.
  • Liniowość regresji oznacza, że zależność między zmiennymi jest liniowa.

Zastosowanie Regresji Liniowej

  • Regresję liniową można stosować, gdy spełnione jest podstawowe założenie, że cechy (zmienne losowe) są liniowo zależne.
  • Decyzję o użyciu regresji liniowej podejmuje się na podstawie współczynnika korelacji liniowej Pearsona.

Współczynnik Korelacji Liniowej Pearsona

  • Określa relacje między wektorami x - x i y - ӯ, które są proporcjonalne.
  • Jest to r= cov(x, y) / (√var(x) x √var(y))

Zakres Wartości Współczynnika Korelacji

  • < 0.2: brak zależności między zmiennymi.
  • 0.2 - 0.7: słaba lub umiarkowana zależność.
  • 0.7 - 0.9: dość silna zależność.
  • > 0.9: bardzo silna zależność.
  • Dane w przedziałach 0.7 - 0.9 i >0.9, są zależne do zastosowania regresji liniowej

Zalety Regresji

  • Prostota
  • Szybkość predykcji
  • Powszechność wykorzystania w różnych dziedzinach (fizyka, technika, biologia, ekonomia, socjologia, astronomia)
  • Elastyczność

Najstarsze Zastosowanie Regresji

  • Astronomia
  • Adrien-Marie Legendre (1805)
  • Carl Friedrich Gauss (1809)

Korelacja a Wynikanie

  • Korelacja i wynikanie to dwie różne sprawy.

Trenowanie Regresji

  • Regresję liniową można przedstawić w bardziej zwartym i wygodnym matematycznie zapisie.
  • Zależność y = 0.x, gdzie xo=1, jest szeroko stosowana w implementacji regresji liniowej w językach programowania (np. Python z NumPy czy TensorFlow).
  • Taki zapis pozwala na łatwiejszą optymalizację obliczeń, szczególnie w uczeniu maszynowym, gdzie można go zapisać w postaci macierzowej dla wielu przykładów naraz.

Trenowanie Regresji – Równanie Normalne

  • Wyniki obserwacji zapisujemy w postaci macierzowej.
  • Trenowanie modelu regresji sprowadza się do rozwiązania równania macierzowego Xθ = y dla niewiadomej θ.
  • Przy odpowiednich założeniach i przemnożeniu przez XT, otrzymujemy XTXθ = XTy.

Pseudoinwersja Moore'a-Penrose'a Macierzy

  • X+ = (XTX)-1 XT
  • Może być policzona dla macierzy nieodwracalnych.
  • Spełnia warunek AA+A = A.

SVD (Singular Value Decomposition)

  • Dowolna macierz A ∈ Rmxn o elementach rzeczywistych może być przedstawiona jako A = UΣVT.
  • Σ ∈ Rmxn jest diagonalna, U ∈ Rmxm i V ∈ Rnxn są macierzami ortogonalnymi.
  • Niezerowe elementy Σ to wartości osobliwe macierzy A.
  • SVD jest bardziej stabilną metodą niż klasyczne rozwiązanie równania normalnego dla macierzy osobliwych i niekwadratowych.
  • Stosowana w regresji liniowej, redukcji wymiarów (PCA) i kompresji danych.

Metoda Najmniejszych Kwadratów

  • Minimalizacja funkcji ||Xθ – y||^2.
  • Jest to podstawa regresji liniowej, ale można ją rozszerzyć do innych wariantów.
  • Regresja grzbietowa (ridge regression) dodaje regularyzację L2.
  • Regresja LASSO stosuje regularyzację L1.
  • Podejście może być rozwiązane numerycznie przy użyciu algorytmów optymalizacji (np. metod gradientowych).

Warunki Działania Metody Najmniejszych Kwadratów (OLS)

  • Zmienne są liniowo zależne.
  • Obserwacje są niezależne.
  • Reszty mają rozkład normalny.

Kiedy Stosować Regresję

  • Reszty (różnice między przewidywaniami a obserwacją) określają, jak model różni się od rzeczywistości.
  • Reszty powinny pochodzić z tego samego rozkładu.
  • Funkcja wiarygodności jest określona jako p(y|x;θ).
  • Maksymalizacja wiarygodności daje funkcję celu, którą wykorzystujemy do uczenia regresji.
  • Funkcja celu dla metody najmniejszych kwadratów ocenia poprawność dopasowania do danych.

Algorytm Gradientowy

  • Metoda gradientu prostego (ang. gradient descent) jest iteracyjną metodą optymalizacji.
  • Wybór losowego punktu startowego θ0.
  • Obliczanie θk+1 = θk - αk∇f(xk), czyli kroków w kierunku minimalizacji funkcji kosztu.
  • Gradient descent jest podstawą optymalizacji w uczeniu maszynowym i sieciach neuronowych.
  • Działa dobrze w regresji liniowej i minimalizuje funkcję celu.
  • Wybór odpowiednich parametrów (learning rate, warunek stopu) jest bardzo ważny dla skuteczności algorytmu.
  • Metoda gradientowa może być stosowana, gdy mamy do analizy wielowymiarową przestrzeń cech.
  • Najczęściej wykorzystywane polityki to batch gradient descent, stochastic gradient descent, i mini-batch gradient descent.

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

More Like This

Linear Models for Regression
5 questions
Linear Regression Model Selection Quiz
18 questions
L1 Regularization in Linear Models
26 questions

L1 Regularization in Linear Models

InfallibleLawrencium3753 avatar
InfallibleLawrencium3753
Regression Modelling in Machine Learning
48 questions
Use Quizgecko on...
Browser
Browser