반응형
시험데이터셋
-
[머신러닝] Training (훈련) vs. Validation (검증) vs. Test (시험) 데이터셋 비교 분석하기!카테고리 없음 2019. 12. 12. 23:51
1. Training (훈련) 데이터셋 훈련 데이터셋은 아래에 보이듯이 모델을 적합하기 위해서 사용되는 데이터 샘플을 의미한다. 여기서 중요한 표현은 적합할 때 사용된다는 부분이다. 왜냐하면 다른 데이터셋들도 우리가 가진 데이터 샘플이긴 마찬가지지만, 용도가 다르기 때문이다. 모델을 학습하다는 것은 결국 웨이트와 바이어스 계수 값들을 추정하는 것이고, 이것을 하기 위해서 실제로 우리가 보고(see) 학습하는(learn) 데이터를 훈련 데이터셋이라고 한다. 2. Validation (검증) 데이터셋 검증 데이터셋에서 중요한 표현은 모델의 하이퍼파라미터를 미세조정(Fine-Tuning) 할 때, 훈련 데이터셋에 적한된 모델의 바이어스가 없는 평가 지표를 제공하는 데이터 샘플이라는 것이다. 그리고 추가로 검증..