[AI/ML] CatBoost 완벽 가이드 (정의, 특징 및 장단점, 모델 학습 과정)
·
ML & DL
1. 들어가며안녕하세요! 머신러닝 알고리즘 완전 정복 시리즈, 그 마지막 열 번째 시간입니다.지난 8편과 9편에서 부스팅의 양대 산맥인 XGBoost와 LightGBM을 다뤘습니다. 두 모델 모두 훌륭하지만, 공통적인 골칫거리가 하나 있었죠. 바로 **"범주형 데이터(Categorical Feature)를 숫자로 바꿔줘야 한다"**는 것입니다.(예: "서울", "부산" $\rightarrow$ 0, 1)이 귀찮은 작업을 알아서 해주고, 심지어 성능까지 더 좋은 모델이 있다면 어떨까요?Yandex가 개발한 부스팅의 신흥 강자, **CatBoost (Categorical Boosting)**를 소개합니다."전처리 귀찮아!"를 외치던 데이터 과학자들에게 한 줄기 빛과 같은 CatBoost의 매력을 낱낱이 파헤..