아래의 글은 필자의 의견이고 회사의 의견을 반영하지 않고 있습니다. [요약] Product Analytics 데이터 사이언스 인터뷰 질문들은 크게 세 분야로 나누어진다: Product Sense (제품 이해도): 데이터로 제품의 전략적인 문제를 푸는 구간이다. …
Category:
DATA SCIENCE
이 블로그에서는 두 가지 커스텀 loss function과 XGBoost 패키지로 median regression 을 수행하는 방법을 배워보겠다. 왜 median regression 이 유용한걸까? least squares loss 함수는 가장 널리 사용되는 오류 측정법이며 대부분의 …
테크에서 데이터 사이언티스트는 무슨 일을 하죠? 아래의 글은 필자의 의견이고 회사의 의견을 반영하지 않고 있습니다. [요약] 구글, 페이스북 같은 실리콘 밸리 테크 회사에서 제품을 개발하는 팀들은 보통 이렇게 구성되어있다: Product …
전 블로그 글에서 수요 예측의 목적으로 많이 사용되는 시계열 모델 (Time Series Model) 을 사용하기 위한 과정과 (링크) 사용전 확인해야 하는 부분들에 (링크) 대해 소개 했다. 이번 글은 자주 사용되는 …
이전에는 Gini 불순물에 대해 논의했다. 엔트로피 불순도 (Entropy Impurity) 또한 결정 트리가 사용하는 분할 기준 중 하나이다. 이 불순도를 더 잘 이해하기 위해 Log likelihood와 KL divergence의 관점에서 해석하여 보자. …
전 블로그 글에서 수요 예측 등의 목적으로 많이 사용되는 Time Series Model (시계열 모델) 을 사용하기 위한 전체적인 과정을 소개 했다. 이번 글은 구체적으로 시계열 모델을 사용하기 위해 사전에 점검해야하는 …
시계열 모델 (Time Series Model) 은 많은 회사들이 비용 관리를 위해 보편적으로 활용하는 수요 예측 모델 중 하나다. 수요 예측 모델은 제품을 얼마만큼 생산하고 각 매장에 비치해야하는지 결정할 떄 뿐만 …
- 1
- 2