본문 바로가기
  • AI와 함께 세상을 아름답게
인공지능(AI)이란? - 기초 개념 및 이론

머신러닝 학습 방법과 몇 가지 개념 (1)

by neo-Lee 2023. 5. 13.

1. 머신러닝(Machine Learning)의 학습 방법

    머신러닝에는 다양한 학습 방법(기술)이 있습니다. 대표적인 몇 가지 학습 방법과 개념을 아래 도표로 소개합니다. 구체적이고 깊이 있는 내용은 이후 개별적으로 보다 깊이 있게 공부해 보겠습니다.

 

머신러닝(Machine Learning)의 대표적인 학습 방법

방법의 명칭 개념 설명
K-인접기법 분류 지식의 학습 방법. 특정 공간에 배치된 데이터세트를 분류하기 위한 지식으로 이용한다. 주어진 표본에서 거리가 가까운 순으로 k개의 데이터세트를 조사해서 다수를 차지하는 데이터세트가 속하는 클래스를 분류 결과의 클래스로 삼는다.
결정트리 두 갈래로 나뉜 나무 구조에 따라 특정 분류 순서를 기술한 데이터 구조. 복수의 특징을 통해 성질이나 분류를 결정할 수 있다
서포트 벡터 머신 주어진 데이터를 두 종류로 분류하기 위해 특정 공간에 배치된 데이터군에 적당한 변수를 두어 데이터군을 두 종류로 구분하는 평면을 구하는 방법
신경망 뉴런이 상호 연결된 네트워크. 계층형, 순환형, 전결합형 등 다양한 형태가 있다.
딥러닝 신경망 중에서도 특히 대규모의 복잡한 구조를 가진 딥 뉴럴 네트워크를 이용한 머신러닝의 학습 방법
강화학습 어떤 목적을 이루기 위한 일련의 행동 지식을 획득하는데 있어 개개의 행동이 아닌 일련의 행동 결과의 좋고 나쁨에 근거하여 행동 지식을 러닝하는 방법
유전 알고리즘 생물의 진화를 모델로 한 알고리즘으로, 조합 최적화 문제의 해를 점차적으로 변형하여 더 좋은 해를 만들어 내는 방법
떼지능 생물 군집의 행동을 시물레이션하여 최적화 문제를 해결하는 방법

 

2. 학습 방법에 적용되는 몇 가지 개념

    머신러닝의 여러 가지 학습 방법에서 공통적으로 적용되는 몇 가지 개념을 알아보겠습니다.

 

    위의 도표에서 보듯이 머신러닝에는 다양한 학습 방법이 있습니다. 이 방법들을 개념적으로 구분하면, 지도학습(supervised learning), 비지도학습(unsupervised learning, 강화학습(reinforcedment learning) 등으로 나눌 수 있습니다.

 

1) 지도학습(supervised learning)은 학습 대상인 학습 데이터세트(training data set)에 정확한 학습 데이터(레이블: Label)가 포함된 경우에 활용할 수 있는 방법입니다. 이미지 인식인 경우를 예를 들면, 학습 데이터에 포함된 가각의 이미지에 대한 인식 결과의 정답(레이블)이 미리 주어질 경우 이미지의 정답을 얻을 수 있게  학습을 진행하는 것이 지도학습입니다. 지도학습K-인접기법, 결정트리, 서포트 벡터 머신, 대부분의 신경망, 딥러닝, 유전 알고리즘, 떼지능 등으로 구현됩니다. 이 방법들에 대해서는 앞으로 하나하나 깊이 있게 공부하고자 합니다.

2) 비지도학습(unsupervised learning)에는 학습 데이터세트에 정답이 되는 레이블(정답 학습 데이터)이 포함되지 않습니다. 비지도학습은 학습 데이터세트가 주어지면 미리 결정된 규칙에 따라 학습 데이터세트를 분류하거나 학습 데이터가 가진 성질에 따라 모델을 만들어냅니다. 비지도학습은 자기 조직화 지도(Self-organizing Map)나 자기 부호화기(Auto Encorder)로 대표되는 일부 신경망이나 통계를 기반으로 한 군집분석(cluster analysis) 또는 주성분분석(principal component analysis) 등으로 구현된다.

 

기계 학습  중 컴퓨터가 입력값만 있는 훈련 데이터를 이용하여 입력들의 규칙성을 찾는 학습 방법

 

 

3) 강화학습(Reinforcement learning)은 제3의 영역으로 로봇의 동작 지식이나 보드게임에서 전략 지식의 획득과 같은 개개 동작에 대한 적합성 여부는 알려주지 않지만, 일련의 행동 후에 나타나는 결과가 학습 데이터로 주어질 경우에 활용하는 방법입니다.

 

강화형 기계 학습은 지도형/비지도형 기계 학습에 이용되는 훈련 데이터 대신, 주어진 상태에 맞춘 행동의 결과에 대한 보상(reward)을 준다. 컴퓨터는 보상을 이용하여 성능을 향상시킨다. 주로 게임이나 로봇 제어 등에 적용된다.

    강화학습을 이족보행 로봇의 동작지식을 예로 들어 설명하겠습니다. 로봇은 두발에 장착된 모터를 적절한 타이밍에 제어하면서 보행을 구현합니다. 이족보행 로봇의 동작 지식은 환경에 따라 모터를 제어하기 위해 보내지는 제어신호로 이루어진 지식의 집합체입니다. 이와 같은 지식은 원리적으로는 지도학습을 통해 획득할 수 있습니다. 이족보행 로봇의 자세나 중심 위치 또는 관절의 각도 등에 따라 상태가 설정되면 그 상태에 대응하기 위해 모터에 학습 데이터로 제어신초를 줍니다. 이와 같은 작업을 무수한 상태에서 반복하여 동작 지식을 획득하는 것입니다. 그러나 어떤 상황에 대응하는 모터의 제어신호를 구체적인 학습 데이터로 입력하는 일은 쉬운 일이 아닙니다. 무수한 상황에 대응해 하나씩 데이터를 입력하는 것은 굉장한 노력이 필요한 일입니다. 그래서 강화학습이 활용되는 것입니다. 강화학습에서는 각 상태에 대응하는 모터의 제어신호를 학습 데이터로 입력하지 않습니다. 그 대신 일련의 동작이 종료된 후에 이족보행의 평가값을 받아서 그 평가에 따라 세부적으로 좋고 나쁨을 평가합니다. 이때 '일련의 동작이 종료했다'는 말은 보행이 시작된 다음에 넘어져서 종료할 때까지를 말합니다. 이때 넘어질 때까지 보행을 연속한 시간을 행동 전체의 평가값으로 정할 수 있습니다. 이런 평가값을 강화학습에서는 보상(reward)이라고 합니다. 이족보행의 경우 처음에서 보행에 필요한 지식이 형성되지 않아서 보행을 지속하지 못하면 보상을 받을 수 없습니다. 그러나 우연히 한걸음이라도 다리를 내디디면 보행이 지속된 것을 인정되어 다소의 보상을 받을 수 있습니다. 이때 발을 움직이게 하는데 기여한 지식의 평가가 높아집니다. 이러한 행동을 반복하는 동안 이족보행에 필요한 지식 평가가 높아지고, 마침내 안정된 이족보행이 가능해지면 이족보행의 동작 지식 학습이 완성되는 것입니다.

 

    이상으로 간략하게 세 가지 학습 개념을 정리해 보았습니다. 머신러닝(Machine Learning)에서는 이러한 학습의 개념이 단독 또는 조합되어서 이용됩니다. 그중 준지도학습 다중작업에 대해 추가로 간략하게 알아보겠습니다.

 

4) 준지도학습(semi-supervised learning)소량의 데이터를 바탕으로 학습 데이터에 없는 데이터도 지도학습의 범주에 포함시키는 학습 방법입니다. 강화학습은 지도학습의 학습 데이터를 작성하지 않고 학습한 방법이지만, 준지도학습은 데이터에 입력된 소량의 학습 데이터를 이용해서 데이터에 입력되지 않은 학습 데이터까지도 학습의 범주에 포함시켜 이용하는 학습 방법입니다. 준지도학습은 지도학습과 비교해 학습이 어렵지만 대규모의 데이터를 다루는 경우에 이용하면 데이터를 입력하는 수고를 덜 수 있어서 유용합니다. 준지도 학습 응용의 예로는 이후에 다루게 될 GAN(Generative Adversarial Network)이 있습니다.

 

5) 다중작업(multitasking)복수의 다른 대상을 표현한 학습 데이터를 정리해서 하나의 머신러닝 시스템으로 취급하여 학습 정밀도를 높이는 학습 방법입니다. 앞서 설명한 학습에서의 대상은 어떤 좁은 대상의 영역에 대한 학습 데이터를  다루는 것을 전제로 했습니다. 다중작업은 그와 달리 비슷하긴 해도 성질이 조금씩 다른 대상에 대해 학습 데이터세트를 준비하여 그것을 정리하고 학습 알고리즘을 만들면 각각에 대해 학습하는 것보다 정밀한 학습이 가능하기도 합니다. 예를 들어 화학분야에서 화합물의 활성을 예측하는 문제는 각각의 예측을 하나씩 학습하기보다는 여러 경우를 하나로 묶어 학습하는 편이 더 효율적일 수 있습니다. 다중작업에서는 이와 같은 학습을 잘 처리할 수 있는 틀을 제공합니다.

 

(다음 편에 계속해서 머신러닝 학습 방법과 관련된 몇 가지 개념을 추가해서 정리합니다)

 

2023.05.11 - [인공지능(AI; Artificial Intelligence)] - 머신러닝 (Machine Learning)

728x90

댓글