Summary

이 문서는 인공지능에 대한 강의 자료입니다. 인공지능의 정의, 역사, 주요 개념 등을 다루고 있습니다. 특히 2024년 노벨상 수상자와 관련된 내용도 포함되어 있습니다.

Full Transcript

인공지능 2024. 12. 6 인공지능이란 인공지능의 정의 인공지능은 인간의 학습능력, 추론능력, 지각능력 외에 인공적으로 구현한 컴퓨터 프로그램 또는 이를 포함한 컴퓨터 시스템을 말한다. 지능을 갖고 있는 컴퓨터 시스템이며, 인간의 지능을 기계 등에 인공적으로 구현한 것이다. 지능이란? 지능Intelligenc...

인공지능 2024. 12. 6 인공지능이란 인공지능의 정의 인공지능은 인간의 학습능력, 추론능력, 지각능력 외에 인공적으로 구현한 컴퓨터 프로그램 또는 이를 포함한 컴퓨터 시스템을 말한다. 지능을 갖고 있는 컴퓨터 시스템이며, 인간의 지능을 기계 등에 인공적으로 구현한 것이다. 지능이란? 지능Intelligence은 인간의 지적 능력을 말한다. 지능은 ‘심리학적으로 새로운 대상이나 상황에 부딪혀 그 의미를 이해하고 합리적인 적응 방법을 알아내는 지적 활동으로 정의할 수 있다. ChatGPT-4o 출시 (2024.5.13) 사람의 목소리를 듣고 답을 하는데 걸리는시간: 320ms 텍스트, 오디오, 이미지의 모든 조합을 입력으로 받아들이고 출력할수 있음 https://www.youtube.com/watch?v=c2DFg53Zhvw https://www.youtube.com/watch?v=RI-BxtCx32s 인공지능 스피커 번역 알파고(2016) 로봇기자 스마트진단 무인자동차 무인자동차 번역 스마트진단 2024 노벨물리학상 존 홉필드, 제프리 힌턴 “인공 신경망을 통한 기계학습의 발명” 2024 노벨 화학상 데이비드 베이커, 데미스 허사비스, 존 M. 점퍼 “단백질의 구조 예측” 앨런 튜링 (Alan Turing, 1912~1954) 기계는 생각할 수 있는가? Can Machines Think? ‘생각’의 정의를 내리는 대신 ‘생각’하는 행위를 만족스럽게 흉내낼 수 있다면 ‘생각’을 하는 것으로 판정하자. – 흉내놀이(Imitation game) 인공지능의 시작 1950년 영국 수학자 앨런 튜링은 “계산 기계와 지능Computing Machinery and Intelligence”이라는 논문을 발표. 이 논문에서 기계가 생각할 수 있는 방법 ‘튜링 테스트’를 고안하였다. 이후, 존 폰 노이만 교수에게 영향을 주어 현대 컴퓨터 구조의 표준이 됨 튜링 테스트 기계가 지능을 가졌는가? 응답자 질문자와 응답자와의 대화에서 평가자가 기계와 인간을 확실하게 구분할 수 없는 경우 기계는 시험에 합격한다. 질문자 최초의 튜링 테스트 통과한 AI – 유진 구스트만(2014) 5분간 대화후 심사단의 33%는 유진이 컴퓨터가 아닌 진짜 인간이라고 판단 IDG: 안녕? 오늘 기분은 좀 어때? 그러나 실제 국내 기자와의 대화결과;; 유진 구스트만: 오늘은 기분이 매우 좋아. 출처 itworld 2014.6.10 IDG: 왜 기분이 좋은데? 유진 구스트만: 그 말을 들으니 기뻐! 오늘 날씨 괜찮은 것 같아? IDG: 아니. 너무 더워서 싫어. 너는? 유진 구스트만: 우리 동네 사람들은 기상학자들이 군대에서 공병이랑 다를 게 없대. 둘 다 만날 삽질만 하니까. 오늘 날씨 괜찮은 것 같아? IDG: 그 질문에 대한 답은 이미 한 것 같은데. 유진 구스트만: 이봐, 이게 최선이야? 날 헷갈리게 만들려면 좀 더 수준 높은 질문을 해야 할 걸? IDG: 이미 널 충분히 헷갈리게 만들고 있는 것 같다만? 유진 구스트만: 맞아! 오늘 정말 날씨 좋다. 영화 “Her” 에서 주인공은 인공지능 운영체제인 ‘사만다’와 대화하며 사랑이라는 감정을 느끼게 된다. 인공지능 기술의 본격적 시작 1956년 여름, 다트머스 대학에서 인공지능이라는 분야를 확립한 다트머스 회의Dartmouth Conference가 열렸다. 이 학술 회의를 개최한 존 매카시John MacCarthy는 인공지능Artificial Intelligence이란 용어를 처음으로 사용 인공지능이란 “기계를 인간 행동의 지식에서와 같이 행동하게 만드는 것” “학습이나 기타 지능의 특징은 컴퓨터를 이용해 시뮬레이션이 가능하다” → 인공지능의 1차 봄으로 연결 (1958) 로젠블랫(Frak Rosenblatt) 퍼셉트론 초기모델 발표 (1969) 마빈 민스키는 ‘단일 퍼셉트론 모델의 한계점을 발표 첫번째 AI의 겨울이 찾아옴 전문가 시스템(Expert System) 전문지식 데이터 베이스를 바탕으로 정해진 규칙에 기반하여 사용자의 질문에 답을 하고 복잡한 문제에 대한 의사 결정을 내리는 컴퓨팅 시스템 (Ex: 단어 교정 프로그램) 전문가의 지식을 컴퓨터 시스템에 구현하여 누구든지 전문가의 도움을 쉽게 받을 수 있도록 하는 것이다. 전문가 시스템에는 자문 시스템, 진단 시스템, 의사결정 시스템, 감시 시스템, 의학 시스템, 법률 시스템, 주식 거래등 실용적인 분야에 폭 넓게 사용 가능 전문가 시스템(ES)의 구성요소 구성요소 설명 설명 모듈 ES가 내는 결론에 대해 설명 추론 엔진 지식기반으로 정보를 추론하여 전달 전문가와의 인터뷰 자료, 문헌자료 수집, 지식획득시스템 정리하여 컴퓨터에 입력 사실과 규칙을 나타냄 지식 베이스 관련된 문제, 절차, 고유 데이터를 해결 하기 위한 규칙 사용자 인터페이스 비 전문가 사용자를 위한 인터페이스 인간과 전문가 시스템(ES)의 비교 인간 평가요소 전문가 시스템 제한적 시간 항상 제한적 공간 어디서나 회복 불능 안정성 교체가능 사멸가능 사멸사능성 사멸불가 변화함 성능 일정 또는 향상가능 변화함 속도 빠름, 향상 가능 높음 비용 낮음 전문가 시스템(ES)의 예 마이신(Mycin) (1972) ⚫ 감염성 질병을 진단하고, 항생제를 처방하고, 그 추론을 자세히 설명할 수 있는 대화형 프로그램 ⚫ 규칙베이스 추론엔진이 backward-chaining 또는 goal-directed, control strategy 에서 구축 ⚫ 의학분야가 빠르게 발전하기 때문에, 그 지식베이스는 쉽게 확대되도록 (augmentation) 설계 ⚫ 사용된 규칙들은 확신도 (Certainty Factor) 를 포함시켜서 결론의 중요성 (즉, 개연성과 리스크 (likelihood and risk)) 을 적시 덴드럴(Dendral) (1960) ⚫ 스탠퍼드 대학에서 개발된 화학 전문가 시스템 ⚫ 알려지지 않은 분자의 분광적 분석을 통하여 분자의 구조를 예측할 수 있도록 고안된 시스템 ⚫ 여기서 사용된 자료는 화학 전문가가 사용하는 경험적 지식에 대한 규칙의 집합으로 이루어져 있다. ⚫ 전문가 시스템이 지엽적이고 제한적인 부분에서만 좋은결과를 만들어냄 ⚫ 지식을 구현할수 있지만 그것의 의미를 구현하기 어려움 (심볼 그라운딩 문제) ⚫ 컴퓨터의 성능이 제한적 ⚫ 학습할 수 있는 데이터도 적음 두번째 AI의 겨울이 찾아옴 딥러닝 성과 도출 다트머스 컨퍼런스 계산기능 한계 논리체계 한계 모라벡의 역설: 인간이 잘하는 일은 기계는 어렵고 기계가 잘하는 일은 인간이 하기 어렵다. 이것을 모라벡의 역설Moravec’s Paradox 이라 한다. 딥러닝 전성기 시작! 100만장의 이미지를 1000 개의 카테고리로 분류하는 시각 인식 챌린지(ILSVRC) 대회 에서 토론토 대학의 제프리 힌튼 교수팀이 딥러닝 기술을 이용하여 84.7%의 압도적인 정확도를 보이며 우승 ⚫ 1997년 IBM 딥블루 세계 체스 챔피언 카스파로프와의 체스 대결에서 승리 ⚫ 2011년 IBM 왓슨, 제퍼디 퀴즈쇼 참가하여 사회자의 질문을 음성으로 인식하고 이를 분석하여 음성으로 답하였다. 이 대회에서 왓슨이 우승 2016년 기계학습을 기반으로한 AlphaGo 가 인간 최고 바둑 프로기사인 이세돌을 4:1로 이김 딥러닝의 열풍을 불어일으킴 딥러닝이 발전할 수 있었던 이유 ⚫ 딥러닝 알고리즘의 발달 ⚫ 인터넷의 발달과 함께 빅데이터 구축 ⚫ GPU, NPU의 발달 ⚫ AI의 대중적 관심 (왓슨의 제퍼디쇼 우승) 인공지능의 학습 ⚫ 좁은(약한) 인공지능 (Artificial Narrow Intelligence) - 특화된 범위에서만 뛰어난 성능 발휘 의료, 법률, 산업 전반에서 골고루 활약, ex: 딥페이크, 알파고, 왓슨 ⚫ 범용(강한) 인공지능 (Artificial General Intelligence) - 인간의 뇌와 같은 사고가 가능 아직 개발되지 못함. 머신러닝(ML, Machine Learning) 인공지능(AI) 인간이 가지고 있는 지적 능력을 컴퓨터에서 구현하는 다양한 기술이나 소프트웨어, 인공지능(AI) 컴퓨터 시스템 머신러닝(ML) 알고리즘을 이용하여 데이터를 머신러닝(ML) 분석하고, 이러한 분석 결과를 스스로 학습한 후에 이를 기반으로 어떠한 판단이나 예측을 하는 것 딥러닝 딥러닝(Deep Learning) 인공신경망을 여러 개 연결하여 인간의 뇌와 유사한 정보 입출력 계층을 만듦으로써 데이터를 학습하는 시스템 머신러닝 – 기계가 스스로 학습한다. 머신러닝은 기계를 학습시키는 알고리즘이다 머신러닝의 분류 머신러닝의 동작방식 1. 일정량 이상의 샘플 데이터를 입력한다. 2. 입력받은 데이터를 분석하여 일정한 패턴과 규칙을 찾아낸다. 3. 찾아낸 패턴과 규칙을 가지고 의사결정 및 예측 등을 수행한다. 특징추출(feature extraction) 데이터별로 어떤 특징을 가지고 있는지를 찾아내고, 그것을 토대로 데이터를 벡터로 변환하는 작업 여러 특징 중에서 어떤 특징을 추출할지 결정하는 것이 머신러닝 알고리듬의 핵심 (예: 장미꽃학습의 경우, 색상, 꽃잎수, 모양을 특징으로 함) 회귀분석(regression analysis) 여러 자료들 간의 관계성을 수학적으로 추정하고 분석하는 데이터 분석 방법 종속변수란 우리가 알고 싶어 하는 결과값을 나타냄, 독립변수란 이러한 결과값에 영향을 주는 입력값 머신러닝의 분류 1. 지도 학습(Supervised Learning) 여러 문제와 답을 같이 학습함으로써 미지의 문제에 대한 올바른 답을 예측하고자 하는 방법. 지도 학습을 위한 데이터에는 문제와 함께 그 정답까지 함께 알고 있는 데이터가 선택됨 분류(classification) 모델 - SVM , 의사결정트리, 레이블이 달린 학습 데이터로 학습한 후에 새로 입력된 데이터가 학습했던 어느 그룹에 속하는 지를 찾아내는 방법입니다(영상, 의료분야). 주가나 환율 분석 등과 같이 연속적인 범위 내의 값에서 그 결괏값을 예측하는 문제에 일반적으로 많이 활용됩 의사 결정 트리(Decision tree) 데이터를 분석하여 이들 사이에 존재하는 패턴을 시각적이고도 명시적인 방법으로 보여주는 지도 학습 알고리즘 환자의 과거 진료 기록을 토대로 증상을 유추하거나 대출을 위한 신용평가, 고객의 소비 행동 예측 등 다양한 분야에서 활용 서포트 벡터 머신(Support Vector Machine, SVM) SVM은 학습 데이터가 벡터 공간에 위치하고 있다고 생각하며 학습 데이터의 특징(feature) 수를 조절함으로써 2개의 그룹을 분류하는 경계선을 찾고, 이를 기반으로 패턴을 인식하는 방법 주로 다루려는 데이터가 2개의 그룹으로 분류될 때 많이 사용 필기체 인식 or 이미지 분류 에서 이용 2. 비지도 학습(Unsupervised Learning) 문제는 알려주되 정답까지는 알려주지 않는 학습 방식 즉, 여러 문제를 학습함으로써 해당 데이터의 패턴, 특성 및 구조를 스스로 파악하여, 이를 통해 새로운 데이터에서 일정한 규칙성을 찾는 방법 구체적인 결과에 대한 사전 지식은 없지만 해당 결과 데이터를 통해 유의미한 지식을 얻고자 할 때 사용되며, 사람도 제대로 알 수 없는 본질적인 문제나 데이터에 숨겨진 특징이나 구조 등을 연구할 때 많이 활용된다. ⚫ 군집화 – 비슷한 데이터끼리 그룹화 ⚫ 차원축소 – 고차원 데이터를 저차원 데이터로 ⚫ 표현학습 – 데이터의 핵심정보를 낮은 차원의 데이터로 표현 ⚫ 데이터 생성 ⚫ 연관 규칙 발견 ⚫ 협업 필터링 – 사람의 행동을 분석하여 관심 항목 추천 군집화 레이블이 없는 학습 데이터들의 특징(feature)을 분석하여 서로 동일하 거나 유사한 특징을 가진 데이터끼리 그룹화 함으로써 레이블이 없는 학습 데이터를 군집(cluster, 그룹)으로 분류합니다. 그리고 새로운 데이터가 입력되면 지도 학습의 분류 모델처럼 학습한 군집을 가지고 해당 데이터가 어느 군집에 속하는지를 분석하는 것입니다. 의학 분야: 특정 질병에 대한 공간 군집 분석을 통해 질병의 분포 면적과 확산 경로 등을 파악하는 역학 조사 홍보 분야: 고객 세분화 K-means 군집화(K-means clustering) 1) k개의 중심 임의로 할당 2) 각 중심점에서 가까운 점들을 각 그룹으로 할당 3) 군집내의 모든 점으로 평균을 내어 새로운 그룹별 중심을 찾는다. 4) 새로운 중심에서 새로운 그룹으로 할당 5) 변화가 없을 때까지 2~4 반복 시장 분석, 이미지 작업, 지질 통계학, 천문학 등 광범위한 분야에서 활용 다른 알고리즘을 수행하기 전에 학습 데이터를 전처리(pre-processing)하는 용도로도 많이 사용 3. 강화 학습(Reinforcement Learning) 어떤 환경 안에서 정의된 주체(agent)가 현재의 상태(state)를 관찰하여 선택할 수 있는 행동(action)들 중에서 가장 최대의 보상(reward)을 가져다주는 행동이 무엇인지를 학습하는 것 이용(exploitation)과 탐험(exploration) 사이의 균형을 적절히 맞춰야 한다. 마르코프 결정 프로세스(Markov Decision Process, MDP) 강화 학습에서 보상을 최대화할 수 있는 방향으로 행동을 취할 수 있도록 이용과 탐험 사이의 적절한 균형을 맞추는데 사용되는 의사결정 프로세스 행위의 주체(agent) 어떤 상태(state)를 만남 정책(policy): 상태와 행동을 연결해 주는 함수 행동(action)을 취함 행동에 대한 가치(value)를 평가 가장 좋은 의사결정 정책(policy) 즉 행동에 따른 가치(value)의 합이 가장 큰 의사결정 정책을 찾아내는 것 강화 학습의 활용 프로세스 제어, 네트워크 관리, 로봇공학 등 현재 다양한 분야에서 활용 알파고도 바둑의 기본 규칙과 자체 경기를 통해 습득한 3,000만 개의 기보를 학습한 후 스스로 대국하며 훈련하는 강화 학습 알고리즘을 사용하여 개발 자율 주행 자동차와 드론 분야 등에서도 강화 학습을 활용한 다양한 연구 및 시도가 활발히 진행 딥러닝 인간의 뇌처럼 복잡한 문제를 해결하기 위해 인공 신경망을 겹겹이 쌓은 것이 딥러닝이다. 딥러닝에 사용된 알고리즘을 특별히 ‘모델’ 이라고 한다. 딥러닝은 점차 발전하여 합성곱 신경망CNN, 순환 신경망RNN, 생성적 적대 신경망GAN으로 발전한다. CNN RNN GAN 인공신경망(Artificial Neural Network, ANN) 뉴럴 네트워크는 인간의 두뇌를 모방해서 만든 기계 학습이다. 인간의 뇌에는 뉴런이 촘촘히 연결되어 있는데 이를 신경망이라 한다. 신경망을 인공적으로 만들었기에 인공 신경망Artificial Neural Network이라 부른다 입력층(input layer)를 통해 학습하고자 하는 데이터를 입력 여러 단계의 은닉층(hidden layer)을 지나면서 처리 출력층(output layer)을 통해 최종 결과가 출력 퍼셉트론(perceptron) 1957년 미국의 심리학자 프랑크 로젠블라트(Frank Rosenblatt)에 의해 고안된 인공신경망 이론을 설명한 최초의 알고리즘 단층 퍼셉트론 1. 각 노드의 입력치와 가중치를 서로 곱하여 모두 합한다. 2. 이렇게 합한 값을 활성화 함수가 가지고 있는 임계치(선택의 기준이 되는 값)와 서로 비교한다. 3. 만약 그 값이 임계치보다 크면 뉴런은 활성화되고, 만약 임계치보다 작으면 뉴런은 비활성화 된다. 결정경계 𝑤1 𝑥1 + 𝑤𝑤 𝑥2 + 𝑏 = 0 선형 분류기 퍼셉트론의 출력을 풀어 헤쳐보면 하나의 직선 방적이라는 것을 확인할 수 있다. 일반적으로 w_1 ~ w_d는 초평면의 방향, w_0은 절편 즉, 바이어스를 나타낸다. XOR 문제 (1969, 마빈 민스키) 신경망 알고리즘으로 XOR 문제를 풀수 없음을 증명 → 인공지능의 암흑기 도래 1986년 럼멜하트, 힌튼, 그리고 심층 신경망 윌리엄스에 의해 개발되었는데 미분공식 중 (DNN) 하나인 연쇄법칙(chain rule)에서 유도 손실함수: 1 2 𝐽 𝑦 = ∑ 𝑡−𝑦 𝑁 𝑤𝑛𝑚 : 가중치 가중합산 출력변수: 𝑧𝑛 = 𝑤1𝑚 𝑥1 + 𝑤2𝑚 𝑥2 + ⋯ + 𝑤𝑛𝑚 𝑥𝑛 활성함수 출력변수: 𝑎𝑚 = ReLU(zm ) 예측값: 𝑦 = 𝑤1 𝑎1 + 𝑤2 𝑎2 + ⋯ + 𝑤𝑛 𝑎𝑚 경사 하강법을 이용하여 손실함수가 최소인 가중치 값을 찾는다. 다층 퍼셉트론은 비선형 계산을 구현할 수 있어서 XOR 문제를 풀수 있다. 경사 하강법을 적용할 때 같은 미분을 여러 번 역전파 알고리즘 반복하는 비효율성 문제 발생 → 이를 효과적으로 해결하는 방법 손실 함수에서 시작해서 입력 계층 방향으로 계산된 미분값을 역방향으로 전파해준다. 순전파 → 역전파 → 가중치 업데이트 → 순전파 … 반복하면서 오차가 0으로 수렴한다. 딥러닝 알고리즘 컨볼루션 신경망(Convolutional Neural Network, CNN) CNN은 인간의 시신경 구조를 모방하여 만들어졌으며, 특징(feature)을 추출하는 일종의 필터인 컨볼루션 커널(convolution kernel)을 도입하여 입력된 이미지를 분류하기 위한 변별적 학습을 수행 이미지 인식에서 다층 퍼셉트론(MultiLayer Perceptoron, MLP)의 문제점 2차원으로 된이미지(채널까지 포함해서 3차원)를 1차원배열로 바꾼 뒤FC(FullyConnected) 신경망으로 학습시키는 방법 ⚫ 2차원 → 1차원 바꾸는 과정에서 공간적 정보 손실 ⚫ 많은 양의 학습데이터가 필요 ⚫ 학습시간이 길어짐 ⚫ 이미지의 위치, 각도, 크기 변화에 새로 학습 Convolution 컨볼루션을 통해 이미지의 특징을 추출한다. 이미지에서 특징을 추출해내는Filter는 CNN의 신경망 학습을 통해 자동으로 찾게된다. 풀링 (Pooling) 일정 크기의 블록을 통합하여 하나의 대표값으로 대체하는 연산으로 컨볼루션 층에서 출력된 특징 지도를 압축하여 특정 데이터를 강조하는 역할 실제 뉴런이 가장 큰 자극에 반응하듯이 CNN 모델에서도 이 기법을 사용할 경우 노이즈가 줄고 학습 속도가 증가하기 때문 Recurrent Neural Network(RNN) 과거의 정보를 사용하여 현재 및 미래의 입력에 대한 신경망의 성능을 개선하는 딥러닝 신경망 - 자연어 문장과 같이 단어의 순서에 따라 의미가 달라지는 순차 데이터(Sequential Data)를 다룰 때 주로 사용 자연어 처리 신호 분류 비디오 분석 음성인식, 번역, 챗봇, 작곡 등에 쓰임 RNN 수식 RNN 구조 일 대 다: 이미지 캡셔닝등에 활용 다 대 일: 다 대 다: 감정분류(긍정/부정), 스팸메일 분류 기계번역, 챗봇 GAN (Generative Adversarial Network, 생성적 적대 신경망) 생성자와 식별자가 서로 경쟁(Adversarial)하며 데이터를 생성(Generative)하는 모델(Network) Generator(생성자) : 생성된 z를 받아 실제 데이터와 비슷한 데이터를 만들어내도록 학습 Discriminator(구분자) : 실제 데이터와 생성자가 생성한 가짜 데이터를 구별하도록 학습 생성자(Generator)와 구분자(Discriminator)의 성능이 점차 개선되고 궁극적으로는 구분자(Discriminator)가 실제 데이터와 가짜 데이터를 구분하지 못하게 만드는 것 GAN 알고리즘의 발전 결론 ⚫ 인공지능의 개발은 무서운 속도로 가속화 되어지고 있다. ⚫ 인공지능은 4차산업혁명 기술의 핵심을 이루고 있다. ⚫ 인공지능 기술은 모든 산업분야에 광범위하게 사용되어진다. ⚫ 인공지능의 원리를 알고 활용할 수 있는 능력이 요구되어 진다

Use Quizgecko on...
Browser
Browser