랜덤포레스트2 머신러닝 학습 방법: K-인접기법, 결정트리와 랜덤 포레스트 & 서포트 벡터 머신(SVM) 여기서는 앞서 머신러닝(Machine Learning)에서 언급되었던 학습 방법들 중에서 데이터를 분류하는 기법들에 대해 개념 위주로 학습하고자 합니다. 1. K-인접기법(K-nearest neighbor method: KNN) K-인접기법(KNN)은 미리 주어진 학습 표본(데이터)과 새로운 데이터의 특징을 비교하고 비슷한 것을 찾아내어 새로운 데이터로 분류하는 방법입니다. 학습 표본을 기반으로 변수 간의 관계를 기반으로 분류 규칙을 생성하고 새로운 데이터를 특정 범주에 분류하는 기법입니다. 따라서 K-인접기법에서는 미리 학습데이트를 예시로 줘야 합니다. 그리고 데이터 세트에는 학습데이터의 특징을 나타내는 변수들과 그에 따른 분류 레이블인 클래스가 포함됩니다. K-인접기법은 어떤 특정한 공간 내에서 새로.. 2023. 5. 18. 머신러닝 학습 방법과 몇 가지 개념 (2) 3. 학습 데이터세트와 검증 데이터세트 1) 학습 데이터세트와 학습 방법 머신러닝 모델의 학습 단계에서는 다양한 방법을 이용하여 학습 데이터세트에서 지식(knowledge)을 추출합니다. 이때 학습 데이터세트 이용방법의 차이에 따라 학습과정을 다음과 같이 분류할 수 있습니다. a) 배치학습(batch learning): 배치 학습(Batch Learning)은 모든 학습 데이터를 한 번에 가져와서 모델을 학습시키는 머신 러닝 방법입니다. 모델이 모든 데이터를 한 번에 볼 수 있기 때문에, 배치 학습은 대규모 데이터셋에서 매우 유용합니다. 학습의 순서는 아래와 같습니다. 1. 초기 모델 설정: 모델을 초기화하고, 초기 가중치를 설정합니다. 2. 모든 데이터 수신 및 전처리: 모든 학습 데이터를 가져와서 전.. 2023. 5. 14. 이전 1 다음 728x90