House Prices - Advanced Regression Techniques 경진대회에서 제출한 모델의 성능을 향상시키고자 부스팅을 사용해보았습니다. 랜덤포레스트는 배깅기반이라 분산을 줄이는데 유리하고, 부스팅은 편향을 줄이는데 유리하다고 알고있습니다. 제가 직접 적용해 보니 부스팅의 RMSE가 더 낮게 나왔는데, 혹시 이런 성능 향상이 주어진 데이터의 복잡한 비선형성 때문인지 아니면 부스팅 자체의 규제가 과적합을 효과적으로 막아주었기 때문인지 질문드립니다.
