자동 인코더와 행렬 완성

Podcast

Play an AI-generated podcast conversation about this lesson

Download our mobile app to listen on the go

Get App

Questions and Answers

행렬 완성(Matrix Completion, MC)의 주요 목적은 무엇입니까?

행렬의 차원 축소
행렬의 역행렬 계산
행렬의 고유값 분해
결측치(missing entries) 추정 (correct)

퓨전 학습(fusion learning)에서 모든 유형의 데이터에 대해 항상 충분한 수의 예제를 얻을 수 있다.

False (B)

행렬 완성(MC) 기법이 유용하게 활용될 수 있는 퓨전 학습(fusion learning)에서의 문제점은 무엇입니까?

결측 데이터(missing data) 처리

최근 행렬 완성(MC) 방법 중 하나는 ______를 이용하는 것이다.

오토인코더(autoencoder) Signup and view all the answers

다음 오토인코더의 종류와 특징을 연결하시오:

디노이징 오토인코더(DAE) = 잡음(noise)에 강하도록 학습된 오토인코더 생성적 적대 신경망(GAN) = 생성 모델 대규모 언어 모델(LLM) = 생성 모델 Signup and view all the answers

디노이징 오토인코더(DAE)의 주요 동기는 무엇입니까?

차원 축소(Dimensionality reduction) (D) Signup and view all the answers

디노이징 오토인코더(DAE)는 잡음을 제거하는 능력 덕분에 행렬 완성(MC)에도 활용될 수 있다.

True (A) Signup and view all the answers

디노이징 오토인코더(DAE)에서 입력에 잡음을 추가하는 주요 이유는 무엇입니까?

내부 특징(internal features)이 핵심 패턴을 잘 포착하도록 장려하기 위해 Signup and view all the answers

디노이징 오토인코더(DAE)에서 사용되는 잡음의 유형 중 하나는 입력의 일부를 임의로 가리는 ______이다.

랜덤 마스킹(random masking) Signup and view all the answers

다음은 디노이징 오토인코더(DAE)에서 사용되는 잡음 유형입니다. 각 잡음 유형을 설명에 맞게 연결하시오:

Additive Gaussian noise = 입력 데이터에 가우시안 분포를 따르는 잡음을 더하는 방식 Random Masking = 입력 데이터의 일부를 임의로 가리는 방식 Signup and view all the answers

행렬 완성(MC)을 위해 디노이징 오토인코더(DAE)를 어떻게 활용할 수 있습니까?

결측치가 있는 예를 DAE의 입력으로 사용하여 완전한 버전을 출력하도록 한다. (C) Signup and view all the answers

디노이징 오토인코더를 훈련할 때, 모든 데이터 항목에 대해 손실 함수를 계산해야 한다.

False (B) Signup and view all the answers

디노이징 오토인코더 기반 행렬 완성(MC) 모델을 훈련하기 위한 간단한 방법은 무엇입니까?

관찰된 항목(observed entries)에 대한 손실을 최소화 Signup and view all the answers

오토인코더는 생성 모델(generative model)로 사용될 수 있으며, 이를 기반으로 하는 더 강력한 생성 모델은 ______이다.

생성적 적대 신경망(Generative Adversarial Networks, GANs) Signup and view all the answers

다음 용어와 설명을 연결하시오:

생성 모델(generative model) = 데이터의 분포를 학습하여 새로운 데이터를 생성하는 모델 GAN(Generative Adversarial Networks) = 두 개의 신경망(생성자, 판별자)이 서로 경쟁하며 학습하는 모델 LLM(Large Language Model) = 대량의 텍스트 데이터로 학습된 대규모 언어 모델 Signup and view all the answers

생성적 적대신경망(GAN)에서 감별자(discriminator)의 역할은 무엇입니까?

실제 데이터와 생성자가 생성한 가짜 데이터를 구별 (B) Signup and view all the answers

GAN에서 생성자(generator)는 판별자(discriminator)가 실제 데이터라고 판단하도록 가짜 데이터를 생성하려고 시도한다.

True (A) Signup and view all the answers

GAN의 학습 과정에서 생성자(generator)와 판별자(discriminator)는 어떤 방식으로 상호작용하는가?

적대적 경쟁(adversarial competition) Signup and view all the answers

GAN의 판별자(discriminator)는 입력이 실제 데이터일 경우 높은 값을, 생성된 데이터일 경우 ______값을 출력하도록 의도된다.

낮은(small) Signup and view all the answers

다음 GAN 관련 용어와 설명을 연결하시오:

생성자(Generator) = 무작위 잡음을 입력받아 가짜 데이터를 생성하는 신경망 판별자(Discriminator) = 입력 데이터가 진짜인지 가짜인지 판별하는 신경망 Signup and view all the answers

GAN의 목적 함수(objective function)를 최적화하기 위해 일반적으로 어떤 방법을 사용합니까?

교대 경사 하강법(alternating gradient descent) (B) Signup and view all the answers

GAN의 학습은 항상 convex-concave 문제이므로, 전역 최적해를 쉽게 찾을 수 있다.

False (B) Signup and view all the answers

GAN 학습 시, min-max 문제 해결을 위해 실제로 사용하는 방법은 무엇입니까?

교대 경사 하강법(alternating gradient descent) Signup and view all the answers

GAN 학습 시, 판별자(discriminator)를 학습할 때 사용하는 손실 함수(loss function)는 ______ 손실 함수와 유사하다.

교차 엔트로피(cross-entropy) Signup and view all the answers

GAN에서 생성자(generator) 학습 시 발생할 수 있는 문제점은 무엇입니까?

초기 학습 시 생성자가 생성하는 데이터가 너무 현실적이지 못해 판별자가 쉽게 구별하여 학습이 어렵다. (A) Signup and view all the answers

GAN 학습 시, 생성자(generator)의 손실 함수로 판별자(discriminator)가 생성된 데이터를 얼마나 잘 속이는지를 직접 사용하는 것이 항상 효과적이다.

False (B) Signup and view all the answers

GAN 학습 초기 단계에서, 생성자 학습을 안정화하기 위해 사용하는 방법은 무엇입니까?

프록시 손실(proxy loss) 사용 Signup and view all the answers

GAN에서 생성자(generator)의 학습을 위해 프록시 손실(proxy loss)을 사용하는 이유는 초기 학습 시 ______ 기울기(gradient) 문제를 완화하기 위해서이다.

소실되는(vanishing) Signup and view all the answers

다음은 얕은 데이터(small-data) 기법입니다. 각 기법을 설명에 맞게 연결하시오:

준지도 학습(Semi-supervised learning) = 레이블이 있는 데이터와 없는 데이터를 함께 사용하여 학습하는 방법 전이 학습(Transfer learning) = 사전 학습된 모델을 가져와 다른 작업에 사용하는 방법 시뮬레이터 기반 학습(simulator-based learning) = 시뮬레이터를 사용하여 합성 데이터를 생성하고 학습하는 방법 Signup and view all the answers

준지도 학습(semi-supervised learning)의 핵심 아이디어는 무엇입니까?

레이블이 없는 데이터를 활용하여 모델의 성능을 향상시키는 것 (B) Signup and view all the answers

준지도 학습(semi-supervised learning)은 레이블이 있는 데이터만 사용하는 지도 학습보다 항상 성능이 좋다.

False (B) Signup and view all the answers

준지도 학습(semi-supervised learning)에서 오토인코더는 어떤 역할을 할 수 있을까요?

특징 추출(feature extraction) Signup and view all the answers

고급 준지도 학습(SSL) 방법은 지도 손실(supervised loss) 외에 ______ 손실과 특징 매칭(feature matching) 손실을 추가적으로 사용한다.

일관성(consistency) Signup and view all the answers

준지도 학습(SSL)에서 일관성 손실(consistency loss)의 목적은 무엇입니까?

근처에 있는 데이터 포인트들이 유사한 예측을 하도록 규제하는 것 (B) Signup and view all the answers

일관성 손실(consistency loss)을 계산하기 위해, 원본 데이터 포인트에 동일한 잡음을 여러 번 적용하여 얻은 예측 값들의 편차를 최소화한다.

True (A) Signup and view all the answers

준지도학습에서 특징 매칭 손실(feature matching loss)은 무엇을 최소화합니까?

같은 예측(same prediction)을 하는 데이터 포인트이지만, 멀리 떨어진 특징(far-apart features)을 갖는 경우를 줄임 Signup and view all the answers

특징 매칭 손실(feature matching loss)을 계산하기 위해 ______ 그래프가 사용될 수 있다.

유사도(similarity) Signup and view all the answers

전이 학습(transfer learning)의 핵심 아이디어는 무엇입니까?

한 작업에서 학습한 지식을 다른 작업에 적용하는 것 (B) Signup and view all the answers

전이 학습(transfer learning)은 항상 목표 작업(target task)의 성능 향상으로 이어진다.

False (B) Signup and view all the answers

전이 학습(transfer learning)에서 사전 학습된 네트워크의 초기 가중치를 사용하는 방법은 무엇이라고 하나요?

미세 조정(fine-tuning) Signup and view all the answers

전이 학습(transfer learning)에서 사전 학습된 모델의 일부 레이어는 고정하고, 나머지 레이어만 학습하는 방법을 ______ 튜닝이라고 한다.

부분(partial) Signup and view all the answers

전이 학습(transfer learning)이 효과적인 시나리오는 무엇입니까?

원본 작업에 대해 풍부한 데이터로 사전 학습된 모델이 있고, 목표 작업의 데이터가 제한적인 경우 (C) Signup and view all the answers

이미지 데이터에 대한 전이 학습 시, 사전 학습된 모델의 후반부 레이어(post layers)는 일반적으로 이미지의 일반적인 특징을 추출하는 데 사용된다.

False (B) Signup and view all the answers

이미지 데이터에 대한 전이 학습 시, 일반적으로 어떤 레이어를 고정하고 어떤 레이어를 재학습합니까?

초기 레이어(early layers) 고정, 후반 레이어(post layers) 재학습 Signup and view all the answers

자연어 처리(Natural Language Processing)에서 전이 학습을 위해 사전 학습된 ______는 매우 유용하며, 다양한 언어에 적용될 수 있다.

단어 임베딩(word embedding) Signup and view all the answers

다음 사전 학습된 이미지 모델과 해당 모델의 이름을 연결하시오.

VGG = 이미지넷 1000 클래스 분류에서 사용된 모델 ResNet = 이미지넷 1000 클래스 분류에서 사용된 모델 Inception = 이미지넷 1000 클래스 분류에서 사용된 모델 Signup and view all the answers

시뮬레이터 기반 학습(simulation-based learning)이 필요한 이유는 무엇입니까?

현실 데이터 수집이 어렵거나 위험한 경우 (B) Signup and view all the answers

시뮬레이션 기반 학습은 항상 실제 환경에서 모델의 성능을 보장한다.

False (B) Signup and view all the answers

자율 주행 시스템 개발에서 데이터 부족 문제를 해결하기 위해 사용할 수 있는 시뮬레이터의 예시를 두 가지 이상 들어보세요.

Grand Theft Auto V, CARLA Signup and view all the answers

교통사고 예측 시스템 구축을 위해 ______를 활용하여 합성 데이터를 생성할 수 있다.

Grand Theft Auto V Signup and view all the answers

차량 충돌 예측 연구에서 GTA V를 활용하는 아이디어는 무엇입니까?

GTA V = 현실에서 수집하기 어려운 교통사고 관련 데이터를 합성 데이터로 생성 차량 충돌 예측 = 합성 데이터를 바탕으로 학습 Signup and view all the answers

Flashcards

행렬 완성 (MC)

행렬 완성은 일부 항목이 누락된 행렬의 누락된 항목을 추정하는 프로세스입니다.

융합 학습

서로 다른 유형의 입력을 동시에 활용하는 학습 방법론입니다.