아래의 글은 필자의 의견이고 회사의 의견을 반영하지 않고 있습니다. [요약] Product Analytics 데이터 사이언스 인터뷰 질문들은 크게 세 분야로 나누어진다: Product Sense (제품 이해도): 데이터로 제품의 전략적인 문제를 푸는 구간이다.…
Category:
DATA SCIENCE
이 블로그에서는 두 가지 커스텀 loss function과 XGBoost 패키지로 median regression 을 수행하는 방법을 배워보겠다. 왜 median regression 이 유용한걸까? least squares loss 함수는 가장 널리 사용되는 오류 측정법이며 대부분의…
테크에서 데이터 사이언티스트는 무슨 일을 하죠? 아래의 글은 필자의 의견이고 회사의 의견을 반영하지 않고 있습니다. [요약] 구글, 페이스북 같은 실리콘 밸리 테크 회사에서 제품을 개발하는 팀들은 보통 이렇게 구성되어있다: Product…
전 블로그 글에서 수요 예측의 목적으로 많이 사용되는 시계열 모델 (Time Series Model) 을 사용하기 위한 과정과 (링크) 사용전 확인해야 하는 부분들에 (링크) 대해 소개 했다. 이번 글은 자주 사용되는…
이전에는 Gini 불순물에 대해 논의했다. 엔트로피 불순도 (Entropy Impurity) 또한 결정 트리가 사용하는 분할 기준 중 하나이다. 이 불순도를 더 잘 이해하기 위해 Log likelihood와 KL divergence의 관점에서 해석하여 보자.…
전 블로그 글에서 수요 예측 등의 목적으로 많이 사용되는 Time Series Model (시계열 모델) 을 사용하기 위한 전체적인 과정을 소개 했다. 이번 글은 구체적으로 시계열 모델을 사용하기 위해 사전에 점검해야하는…
시계열 모델 (Time Series Model) 은 많은 회사들이 비용 관리를 위해 보편적으로 활용하는 수요 예측 모델 중 하나다. 수요 예측 모델은 제품을 얼마만큼 생산하고 각 매장에 비치해야하는지 결정할 떄 뿐만…
- 1
- 2