머신러닝 모델의 타당성을 검증하는 방법 중의 하나로 "크로스 밸리데이션(Cross-validation)"
이란게 있습니다. 한국어로는 “교차 검증”이라고 부릅니다.
크로스 밸리데이션이란 특정 데이터를 훈련 전용 데터와 테스트 전용 데이터로 분할한 뒤 훈련 데이터를 활용해 학습하고, 테스트 데이터로 테스트해서 학습의 타당성을 검증하는 방법입니다.
크로스 밸리데이션에는 여러 가지 방법이 있는데, K 분할 교차 검증은 다음과 같이 합니다.
예로 집합 X를 3개로 분할해 A/B/C로 만드는 경우를 생각해봅시다.
위의 예처럼 3개로 분할하는 방법을 3-fold cross validation이라고 부릅니다.