머신러닝 개론
11 Questions
2 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

비지도 학습의 주요 알고리즘 중 클러스터링의 예로 알맞은 것은?

  • 주성분 분석 (PCA)
  • K-평균 클러스터링 (correct)
  • t-SNE
  • Q-러닝 (Q-Learning)

비지도 학습의 정의로 올바른 것은?

  • 레이블이 있는 데이터로부터 학습하는 방법
  • 레이블이 없는 데이터로부터 패턴을 학습하는 방법 (correct)
  • 환경의 상태를 무시하고 행동을 선택하는 방법
  • 에이전트가 보상을 최대화하기 위해 학습하는 방법

강화 학습의 주요 구성 요소에 포함되지 않는 것은?

  • 손실 함수 (correct)
  • 환경
  • 에이전트
  • 보상

강화 학습에서 '상태'의 정의로 올바른 것은?

<p>환경의 현재 상황 (D)</p> Signup and view all the answers

차원 축소의 목적 중 하나로 알맞은 것은?

<p>시각화 및 효율성을 높이기 위해 (D)</p> Signup and view all the answers

다음 중 심층 강화 학습의 특징이 아닌 것은?

<p>환경에 대한 레이블이 필요하다 (D)</p> Signup and view all the answers

강화 학습에서 '정책(Policy)'의 역할은 무엇인가?

<p>특정 상태에서 어떤 행동을 선택할지를 결정한다. (D)</p> Signup and view all the answers

Q-러닝의 주요 특징은 무엇인가?

<p>상태-행동 쌍에 대한 가치 함수를 학습하여 최적 정책을 찾는다. (C)</p> Signup and view all the answers

강화 학습에서 '보상(Reward)'의 역할은 무엇인가?

<p>에이전트의 행동에 대한 피드백을 제공한다. (A)</p> Signup and view all the answers

SARSA 알고리즘의 특징으로 맞는 것은?

<p>미래의 행동 선택을 고려하여 정책을 업데이트한다. (B)</p> Signup and view all the answers

강화 학습에서 '탐색과 착취의 균형' 문제는 무엇을 의미하는가?

<p>새로운 행동을 시도하는 것과 이미 알고 있는 최선의 행동을 선택하는 것 사이의 균형을 맞추는 것이다. (A)</p> Signup and view all the answers

Flashcards

Machine Learning

Algorithms that learn from data to automatically make predictions or decisions.

Unsupervised Learning

Learning patterns from unlabeled data.

Clustering

Grouping data points based on similarity.

Dimensionality Reduction

Reducing the number of variables in a dataset.

Signup and view all the flashcards

Reinforcement Learning

Learning by interacting with an environment to maximize rewards.

Signup and view all the flashcards

Agent (Reinforcement Learning)

The learner within the environment.

Signup and view all the flashcards

Environment (Reinforcement Learning)

The external world the agent interacts with.

Signup and view all the flashcards

Reward (Reinforcement Learning)

Feedback given to the agent after an action.

Signup and view all the flashcards

Q-Learning

Learning by evaluating values for taking certain actions

Signup and view all the flashcards

Exploration vs. Exploitation

Balancing trying new actions and taking the best known action, crucial in RL.

Signup and view all the flashcards

Delayed Rewards

Rewards received after a delay, making RL more complex.

Signup and view all the flashcards

Study Notes

머신러닝

  • 머신러닝은 데이터로부터 학습하여 자동으로 예측이나 결정을 내리는 알고리즘이다.
  • 주로 통계학, 컴퓨터 과학, 인공지능 분야에서 활용되며, 다양한 산업에서 중요성이 증가하고 있다.

비지도 학습 (Unsupervised Learning)

  • 비지도 학습은 레이블이 없는 데이터로부터 패턴을 학습하는 기법이다.
  • 주요 알고리즘:
    • 클러스터링 (Clustering):
      • 데이터 포인트를 유사성에 따라 그룹화하는 방법이다.
      • 예시: K-평균 클러스터링, 계층적 클러스터링.
    • 차원 축소 (Dimensionality Reduction):
      • 데이터의 차원을 줄여 시각화와 처리 효율성을 높인다.
      • 예시: 주성분 분석 (PCA), t-SNE.
  • 응용 분야:
    • 고객 세분화, 이상 탐지, 데이터 탐색 등 다양한 분야에 활용된다.

강화 학습 (Reinforcement Learning)

  • 강화 학습은 에이전트가 환경과 상호작용하며 보상을 최대화하는 방식으로 학습하는 방법이다.
  • 주요 구성 요소:
    • 에이전트: 학습하는 주체.
    • 환경: 에이전트가 상호작용하는 대상.
    • 행동 (Action): 에이전트의 선택 과정.
    • 상태 (State): 환경의 현재 상황을 나타낸다.
    • 보상 (Reward): 행동에 대한 피드백으로, 학습의 기준이 된다.
  • 주요 알고리즘:
    • Q-러닝 (Q-Learning): 가치 기반의 학습 방법으로, 에이전트가 최적의 행동 선택을 학습한다.
    • 심층 강화 학습 (Deep Reinforcement Learning): 신경망을 활용하여 복잡한 문제 해결에 접근한다.
  • 응용 분야:
    • 게임 (알파고와 같은 바둑 프로그램), 로봇 공학, 자율주행차 등 다양한 분야에서 혁신을 이루고 있다.

강화 학습 개요

  • 에이전트가 환경과 상호작용하며 보상을 최대화하는 기계 학습의 분야
  • 강화 학습은 행동의 결과를 통해 지속적으로 학습하며 최적의 전략을 개발

주요 구성 요소

  • 에이전트: 환경 내에서 행동을 수행하는 주체
  • 환경: 에이전트가 상호작용하는 외부 세계
  • 상태 (State): 에이전트가 현재 위치한 환경의 상황
  • 행동 (Action): 에이전트가 선택할 수 있는 조치
  • 보상 (Reward): 특정 행동 후 에이전트가 받는 피드백
  • 정책 (Policy): 특정 상태에서 취할 행동을 결정하는 전략

학습 과정

  • 상태를 관찰 후 가능한 행동 중 하나 선택
  • 선택한 행동을 수행하고 보상을 받음
  • 새로운 상태로 전이되며, 보상에 따라 정책을 업데이트

주요 알고리즘

  • Q-러닝: 상태-행동 쌍에 대한 가치 함수를 학습하여 최적 정책을 찾는 방법
  • SARSA: 행동 선택 과정에서 얻은 가치에 따라 정책을 업데이트하는 방법
  • 딥 Q-러닝: Q-러닝을 심층 신경망과 결합해 복잡한 환경 처리 능력 향상

응용 분야

  • 게임 AI: 체스, 바둑, 비디오 게임 등의 AI 개발
  • 로봇 공학: 자율주행차 및 로봇 동작 계획
  • 자동화된 거래 시스템: 금융 시장 내 최적 거래 전략 개발

도전 과제

  • 탐색과 착취의 균형: 새로운 행동 시도와 최선 행동 유지의 균형 맞추기
  • 긴 시간 지연 보상: 보상이 지연될 경우 결과 예측의 어려움
  • 대규모 상태 공간: 복잡한 환경에서 학습 효율성 문제 발생

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Description

이 퀴즈에서는 머신러닝의 기초 개념에 대해 다룹니다. 비지도 학습과 강화 학습의 정의, 주요 알고리즘 및 응용 분야를 포함하여 머신러닝의 다양한 측면을 이해할 수 있습니다.

Use Quizgecko on...
Browser
Browser