Skip to content

(장*우)(Kaggle 경진대회) 부스팅의 성능 향상 요인 #66

@glok1d

Description

@glok1d

House Prices - Advanced Regression Techniques 경진대회에서 제출한 모델의 성능을 향상시키고자 부스팅을 사용해보았습니다. 랜덤포레스트는 배깅기반이라 분산을 줄이는데 유리하고, 부스팅은 편향을 줄이는데 유리하다고 알고있습니다. 제가 직접 적용해 보니 부스팅의 RMSE가 더 낮게 나왔는데, 혹시 이런 성능 향상이 주어진 데이터의 복잡한 비선형성 때문인지 아니면 부스팅 자체의 규제가 과적합을 효과적으로 막아주었기 때문인지 질문드립니다.

Image

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions