본문 바로가기

머신러닝

[머신러닝] 지도학습(Supervised Learning), 비지도학습(Unsupervised Learning), 강화학습(Reinforcement Learning)

인공지능은 머신러닝을 통해 학습하고 결과를 예측한다.

머신러닝을 학습시키기 위한 방법으로는 일반적으로 3가지가 있는데 

각각 지도학습(Supervised Learning), 비지도학습(Unsupervised Learning), 강화학습(Reinforcement Learning)이다.

 

1. 지도학습(Supervised Learning)

Supervised Learning

지도학습은 올바른 정답을 사전에 알려주고 학습을 시키는 방법이다.

데이터(Input)와 이 데이터가 무엇인지 기록한 레이블(label)을 함께 학습하여 인공지능에게 올바른 정답(Output)이 무엇인 지 알려준다. 데이터와 정답 레이블을 함께 학습한 인공지능은 이를 토대로 다양한 데이터를 식별할 수 있게 된다.

 

지도학습의 대표적인 방법으로는 분류(Classification)와 회귀(Regression) 등이 있다.

 

2. 비지도학습(Unsupervised Learning)

Unsupervised Learning

비지도학습은 학습시킬 데이터(Input)은 존재하지만 결과 값(Output)이 무엇인지는 알지 못하는 학습방법이다.

지도학습과 다르게 정답 데이터를 알려줄 레이블(label)이 존재하지 않기 때문에 학습시키는 데이터의 특징과 패턴을 파악하고 식별해내야 한다. 

 

비지도학습의 대표적인 방법으로는 차원 축소(Dimension Reduction)와 군집화(Clustering) 등이 있다.

 

3. 강화학습(Reinforcement Learning)

Reinforcement Learning

강화학습은 인공지능이 선택한 행동의 옳은 정도에 따라 보상을 주는 학습방법이다.

매 출력 결과마다 보상이 결정되고 인공지능은 모든 과정이 끝났을 때 가장 높은 보상을 얻는 방향으로 행동한다.

인공지능은 모든 행동이 완료됐을 때 가장 높은 보상을 목표로 하기 때문에 중간 과정에서 선택한 행동의 이유를 예측하기 힘들다는 점이 있다.

 

강화학습을 사용한 예로는 구글의 AlphaGo가 있다. 바둑의 매 수마다 보상이 존재하고 최종적으로 가장 높은 보상을 얻기 위해 바둑을 두게 된다.

 

 

 

 

 

 

이미지 출처) https://docs.paperspace.com/machine-learning/