Segmentacja i Architektura U-Net

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Jakie są kluczowe etapy funkcjonowania modelu językowego wykorzystującego zewnętrzne źródła informacji?

Wyszukiwanie, wzbogacenie, generowanie (correct)
Wykrywanie, dostosowanie, wygenerowanie
Zbieranie, nadawanie, prezentowanie
Wyszukiwanie, przetwarzanie, generowanie

Czym charakteryzuje się metoda LoRA w kontekście modeli językowych?

Zastosowanie małych macierzy adaptacyjnych (correct)
Wymaga dużej mocy obliczeniowej
Zwiększa liczbę parametrów do trenowania
Nie pozwala na fine-tuning dużych modeli

Jaką funkcję pełni evaluacja w kontekście modeli językowych?

Zmniejsza liczbę parametrów w modelach
Ocenia jakość generowanych odpowiedzi innych modeli (correct)
Testuje wydajność sprzętu używanego do treningu
Wspiera w samodzielnym nauczaniu modeli językowych

Jakie znaczenie ma prompt engineering dla odpowiedzi modelu językowego?

Zawiera kontekst i precyzyjne instrukcje (C) Signup and view all the answers

Co to jest kwantyzacja modelu w kontekście dużych modeli językowych?

Zmniejszenie precyzji liczb (A) Signup and view all the answers

Co oznacza 'dziura' w kontekście autoenkoderów wariacyjnych?

Obszar bez żadnych danych (C) Signup and view all the answers

Jakie jest główne zadanie modeli dyskryminacyjnych?

Rozróżnianie na podstawie cech (A) Signup and view all the answers

Jakie pytania zadaje model generatywny w odniesieniu do zdjęcia?

Jak bardzo zdjęcie przypomina typowego psa lub kota? (A) Signup and view all the answers

Jakie są elementy GAN?

Generatory i klasyfikatory (C) Signup and view all the answers

Co jest jednym z głównych wyzwań w trenowaniu GAN-ów?

Trenowanie generatora i klasyfikatora (B) Signup and view all the answers

Jakie właściwości ma autoenkoder wariacyjny?

Wprowadza regularyzację do przestrzeni ukrytej (A) Signup and view all the answers

Jakie cechy różnią modele generatywne od dyskryminacyjnych?

Modele generatywne uczą się, jak wyglądają typowe klasy (C) Signup and view all the answers

Co oznacza, że przestrzeń ukryta staje się bardziej 'ciągła' w autoenkoderze wariacyjnym?

Reprezentacje danych są uporządkowane (C) Signup and view all the answers

Jakie znaczenie mają stop wordy w analizie morfologicznej?

Zwykle są usuwane, ponieważ nie niosą istotnego znaczenia. (C) Signup and view all the answers

Co należy zrobić przed podziałem tekstu na tokeny?

Usunąć nadmiarowe spacje i interpunkcję. (D) Signup and view all the answers

Jak działa podejście one-hot encoding?

Każdemu słowu przypisany jest unikalny wektor one-hot. (B) Signup and view all the answers

Co reprezentuje model Bag of Words?

Reprezentuje tekst jako suma wektorów typu one-hot dla tokenów. (D) Signup and view all the answers

Jakie operacje są zazwyczaj stosowane w preprocessingu tekstu?

Usuwanie tagów HTML i interpunkcji. (A) Signup and view all the answers

Na czym bazuje model TF-IDF?

Na metodzie Bag of Words. (D) Signup and view all the answers

Jakie jest jednogłośne podejście do segmentacji tekstu?

Podział na kropkach, znakach zapytania i wykrzyknikach. (A) Signup and view all the answers

Jakie są wady podejścia one-hot encoding?

Nie bierze pod uwagę kontekstu słów. (C), Generuje zbyt dużą ilość danych. (D) Signup and view all the answers

Jaką funkcję pełnią tokeny w procesie przetwarzania języka naturalnego?

Są elementami, które ułatwiają algorytmom zrozumienie tekstu (D) Signup and view all the answers

Jakie jest główne założenie tokenizacji z użyciem algorytmu BPE?

Zamienia najczęściej występujące pary znaków na tokeny (D) Signup and view all the answers

Który z poniższych algorytmów jest zamkniętym algorytmem używanym do tokenizacji subword?

WordPiece (C) Signup and view all the answers

Jak wygląda przykład wektora reprezentującego słowo 'kot' w procesie zanurzania tokenów?

[0.2, -0.5, 0.8] (B) Signup and view all the answers

Jaka jest różnica między stemmingiem a lematyzacją?

Stemming polega na ucinaniu końcówek słów, lematyzacja na zamianie na formy podstawowe (D) Signup and view all the answers

Czym różni się tokenizacja subword od tradycyjnej tokenizacji?

Tokeny w tokenizacji subword są fragmentami słów (C) Signup and view all the answers

Jakie znaczenie ma kontekst w przetwarzaniu języka naturalnego?

Kontekst pomaga w lepszym rozpoznawaniu polisemicznych słów (D) Signup and view all the answers

Do jakiego celu służy proces zwany 'word embedding'?

Przekształca tokeny w wektory liczbowe reprezentujące znaczenie (C) Signup and view all the answers

Jaki jest główny cel modelu języka?

Przewidywanie prawdopodobieństwa kolejnego słowa w sekwencji (B) Signup and view all the answers

Czym jest OOV w kontekście przetwarzania języka naturalnego?

Tokenem używanym do reprezentacji rzadkich słów (C) Signup and view all the answers

Jakie n-gramy są zwykle preferowane w praktyce?

Trigramy i 4-gramy (A) Signup and view all the answers

Czym jest perplexity w ewaluacji modeli języka?

Znormalizowaną odwrotnością prawdopodobieństwa testowej sekwencji (C) Signup and view all the answers

Jakie podejście stosuje naiwny klasyfikator bayesowski przy analizie wydźwięku?

Sprawdza, czy dane słowo występuje (B) Signup and view all the answers

Jakie zastosowanie ma ukryty model Markowa (HMM)?

Oznaczanie części mowy (D) Signup and view all the answers

Który z wymienionych modeli nie jest klasycznym modelem NLP?

Sztuczna sieć neuronowa (B) Signup and view all the answers

Dlaczego używa się logarytmów w n-gramowych modelach języka?

Aby uniknąć problemów numerycznych (A) Signup and view all the answers

Jakie jest główne zastosowanie warstw kodujących w autoenkoderze?

Rekonstrukcja danych z mniejszej reprezentacji (C) Signup and view all the answers

Jakie jest zadanie warstw dekodujących w autoenkoderze?

Rekonstrukcja danych z mniejszej reprezentacji (D) Signup and view all the answers

Dlaczego skip connections nie są stosowane w enkoderze?

Ułatwiają modelowi naukę kompresji (D) Signup and view all the answers

W jakim przypadku U-Net wykorzystuje skip connections?

Podczas odbudowy oryginalnego obrazu (B) Signup and view all the answers

Jakie jest zasadnicze różnice między autoenkoderem a U-Net?

Autoenkoder ma tę samą liczbę kanałów wejściowych i wyjściowych (D) Signup and view all the answers

Jakie jest główne zastosowanie Autoenkodera Wariacyjnego (VAE)?

Tworzenie bardziej ciągłej przestrzeni ukrytej (B) Signup and view all the answers

Jakie ograniczenie związane jest z przestrzenią latentną w standardowym autoenkoderze?

Brak kontroli nad rozmieszczeniem punktów w niej (B) Signup and view all the answers

Jakie podejście stosuje VAE w porównaniu do podstawowego autoenkodera?

Generuje dane poprzez próbkowanie (A) Signup and view all the answers

Flashcards

Tokenizacja

Proces rozdzielania tekstu na mniejsze jednostki znaczeniowe (tokeny), które mogą być pojedynczymi słowami, częściami słów lub znakami. W zależności od przyjętej metody tokenizacji, tokeny mogą być różne.

Tokenizacja subword

Algorytm tokenizacji, który tworzy tokeny z fragmentów słów (subword), zamiast całych słów. Przykładowo, słowo "kota" może zostać podzielone na tokeny "kot", "a".

Byte Pair Encoding (BPE)

Algorytm tokenizacji subword, który analizuje dane i tworzy nowy token dla najczęściej występującej pary znaków w tekście. Następnie zastępuje tę parę nowym tokenem, powtarzając proces. W efekcie powstają tokeny o różnej długości, zależnie od częstości występowania.

Zanurzanie Tokenów (word embedding)

Proces przekształcania tokenów (słów lub części słów) w wektory liczbowe o ustalonej długości. Te wektory reprezentują znaczenie i kontekst słów w przestrzeni wielowymiarowej. Podobne słowa mają podobne wektory.