이 블로그에서는 두 가지 커스텀 loss function과 XGBoost 패키지로 median regression 을 수행하는 방법을 배워보겠다. 왜 median regression 이 유용한걸까? least squares loss 함수는 가장 널리 사용되는 오류 측정법이며 대부분의…
Author
Jay Kim
이전에는 Gini 불순물에 대해 논의했다. 엔트로피 불순도 (Entropy Impurity) 또한 결정 트리가 사용하는 분할 기준 중 하나이다. 이 불순도를 더 잘 이해하기 위해 Log likelihood와 KL divergence의 관점에서 해석하여 보자.…
지니 불순도 측정(Gini Impurity Measure)은 Classification Problem에서 사용 가능한 결정 트리(Decision Tree)의 분할 기준 (Split Criteria) 중 하나이다. 첫째, 지니 불순도 측정치가 결정 트리에서 사용되는 방법과는 독립적으로 다양한 각도에서 동기를…