데이터 분리1 [머신러닝] 지도학습 (학습/테스트/검증 데이터 분리) 데이터를 분리하는 이유 위 그림을 보면 왼쪽부터 과소적합, 적절, 과대적합 입니다. 과소적합이란, 데이터를 충분히 학습시키지 않은 상태를 의미합니다. Train data를 잘 맞추지 못 한다면 과소적합상태입니다. 과대적합이란, 너무 훈련데이터에 맞춰진 모델을 의미합니다. 훈련데이터를 지나치게 학습시켜 다른 데이터가 들어오면 잘 맞추지 못하는 상태입니다. Train data의 정확도는 좋지만 Test data를 잘 맞추지 못한다면 과대적합니다. Data Split 위의 문제점을 해결하기위해 데이터를 분리 해야 합니다. 훈련, 검증, 테스트 데이터로 분리합니다. 훈련데이터는 학습에 사용되는 데이터이고, 검증데이터는 학습이 완료된 모델을 검증하기 위한 데이터입니다.(학습에는 사용되지 않음) 테스트데이터는 최종.. 2022. 5. 3. 이전 1 다음