LSTM, 활성화 함수, 그리고 텐서플로우

Podcast

Play an AI-generated podcast conversation about this lesson

Download our mobile app to listen on the go

Get App

Questions and Answers

_______은(는) 과거 정보를 기억하여 시계열 데이터를 처리하는 데 유용한 신경망 구조이다.

RNN

다음 중 LSTM의 핵심 구성 요소가 아닌 것은 무엇인가?

Output Gate
Batch Normalization (correct)
Input Gate
Cell State

Transfer Learning은 대규모 데이터셋으로 학습된 모델을 사용하여 다른 유사한 작업에 적용하는 방법이다.

True (A)

다음 중 Gradient Descent의 단점을 보완하기 위해 사용되는 Optimizer가 아닌 것은 무엇인가?

SGD (A) Signup and view all the answers

Binary Classification 문제에서 주로 Softmax Activation Function이 사용된다.

False (B) Signup and view all the answers

TensorFlow에서 MNIST 데이터셋을 로드하기 위해 사용되는 함수는 무엇인가?

keras.datasets.mnist.load_data() (B) Signup and view all the answers

DNN 모델을 학습할 때 모델의 성능을 측정하기 위해 사용하는 지표들을 무엇이라고 하는가?

Metrics Signup and view all the answers

`train_test_split` 함수는 머신러닝 모델의 과적합을 방지하기 위해 데이터를 훈련 세트와 검증 세트로 나누는 데 사용된다.

True (A) Signup and view all the answers

Batch Normalization의 주요 효과는 무엇인가?

학습 속도 향상 및 안정화 (A) Signup and view all the answers

LSTM에서 과거 정보를 선택적으로 망각하는 역할을 하는 gate의 이름은?

Forget Gate Signup and view all the answers

CNN에서 Receptive Field는 입력 데이터에 대한 특정 뉴런이 '볼' 수 있는 영역의 크기를 나타낸다.

True (A) Signup and view all the answers

다음 중 CNN에서 Receptive Field 크기를 증가시키는 방법이 아닌 것은?

Skip Connection 사용 (A) Signup and view all the answers

CNN에서 층이 깊어질수록 Gradient가 소실되는 문제를 무엇이라고 하는가?

Gradient Vanishing Signup and view all the answers

Feature Map은 CNN에서 Convolution Layer를 통과한 결과로 얻어지는 이미지의 특징을 나타낸다.

True (A) Signup and view all the answers

다음 중 RNN의 Vanishing Gradient 문제를 해결하기 위해 제시된 구조가 아닌 것은?

CNN (B) Signup and view all the answers

Truncated BPTT는 RNN 학습 시 전체 Time Step을 사용하는 대신 일정 길이의 Time Step만 사용하는 방법이다.

True (A) Signup and view all the answers

Transformer 모델에서 Self-Attention을 계산하는 데 필요한 요소가 아닌 것은?

Bias (B) Signup and view all the answers

Transformer 모델에서 Attention Weights 계산 시 Softmax 함수를 적용하는 이유는 무엇인가?

확률 분포로 만들기 위해 Signup and view all the answers

Language Model은 주어진 문맥에서 다음에 나올 단어를 예측하는 모델이다.

True (A) Signup and view all the answers

다음 중 LLM(Large Language Model)의 Attention Output을 계산하는 데 필요한 요소가 아닌 것은?

Loss Function (A) Signup and view all the answers

Inference는 학습된 모델을 사용하여 새로운 데이터에 대한 예측을 수행하는 과정이다.

True (A) Signup and view all the answers

GPU는 LLM의 학습 속도를 향상시키는 데 중요한 역할을 한다. GPU는 무엇의 약자인가?

Graphics Processing Unit Signup and view all the answers

다음 중 RAG(Retrieval Augmented Generation)의 핵심 구성 요소가 아닌 것은?

Fine-tuning (C) Signup and view all the answers

LLM 파인튜닝은 특정 작업에 맞게 LLM을 추가적으로 학습하는 과정이다.

True (A) Signup and view all the answers

RLHF는 무엇의 약자인가?

Reinforcement Learning from Human Feedback Signup and view all the answers

다음 중 RLHF의 학습 단계가 아닌 것은?

Adversarial Training (A) Signup and view all the answers

Auto-encoder는 주로 이상 탐지(Anomaly Detection)에 사용될 수 있다.

True (A) Signup and view all the answers

GAN에서 생성자는 어떤 역할을 하는가?

가짜 데이터 생성 Signup and view all the answers

GAN에서 판별자는 어떤 역할을 하는가?

진짜와 가짜 데이터 구별 (A) Signup and view all the answers

GAN에서 Latent Vector는 생성자가 가짜 데이터를 생성하는 데 사용하는 무작위 벡터이다.

True (A) Signup and view all the answers

GAN 학습 시 생성자와 판별자의 성능이 균형을 이루지 못하고 한쪽으로 치우치는 현상을 무엇이라고 하는가?

Mode Collapse (D) Signup and view all the answers

강화학습에서 Agent는 어떤 역할을 하는가?

행동 수행 Signup and view all the answers

강화학습에서 Environment는 Agent가 상호작용하는 대상이다.

True (A) Signup and view all the answers

강화학습에서 State는 무엇을 나타내는가?

환경의 현재 상태 (B) Signup and view all the answers

강화학습에서 Action은 Agent가 Environment에 대해 수행하는 것을 의미한다. Action의 예시를 들어보시오.

이동, 공격 Signup and view all the answers

강화학습에서 Reward는 Agent의 행동에 대한 긍정적 또는 부정적 피드백이다.

True (A) Signup and view all the answers

강화학습에서 Policy는 무엇을 나타내는가?

Agent가 상태에 따라 어떤 행동을 할지 결정하는 규칙 (C) Signup and view all the answers

강화학습에서 Value Function은 무엇을 예측하는 함수인가?

기대 보상 Signup and view all the answers

DQN(Deep Q-Network)은 Q-Value를 추정하는 데 딥러닝을 사용하는 강화학습 알고리즘이다.

True (A) Signup and view all the answers

PPO(Proximal Policy Optimization)는 무엇을 최적화하는 강화학습 알고리즘인가?

정책 (D) Signup and view all the answers

DQN에서 Replay Buffer는 무엇을 저장하는 데 사용되는가?

경험 Signup and view all the answers

DQN의 Loss Function은 Q-Value와 Target Q-Value의 차이를 최소화하는 방향으로 학습된다.

True (A) Signup and view all the answers

다음 중 DQN에서 Target Network를 사용하는 주된 이유는 무엇인가?

학습 안정성 확보 (D) Signup and view all the answers

Flashcards

RNN이란?

과거 데이터의 순차적 정보를 처리하는 인공 신경망 모델

LSTM이란?

RNN의 한 종류로, Cell State와 Gate를 사용하여 장기 의존성 문제를 해결