“데이터 사이언스 직장 을 다니면서 학생일 때 이것을 알았더라면 지금 훨씬 수월했을 텐데 하는 것이 있나요?” 얼마 전 졸업을 앞두고 있는 데이터 사이언스 직장 을 구하고자 하는 취준생이 필자에게 질문했다.…
이전에는 Gini 불순물에 대해 논의했다. 엔트로피 불순도 (Entropy Impurity) 또한 결정 트리가 사용하는 분할 기준 중 하나이다. 이 불순도를 더 잘 이해하기 위해 Log likelihood와 KL divergence의 관점에서 해석하여 보자.…
전 블로그 글에서 수요 예측 등의 목적으로 많이 사용되는 Time Series Model (시계열 모델) 을 사용하기 위한 전체적인 과정을 소개 했다. 이번 글은 구체적으로 시계열 모델을 사용하기 위해 사전에 점검해야하는…
시계열 모델 (Time Series Model) 은 많은 회사들이 비용 관리를 위해 보편적으로 활용하는 수요 예측 모델 중 하나다. 수요 예측 모델은 제품을 얼마만큼 생산하고 각 매장에 비치해야하는지 결정할 떄 뿐만…
지니 불순도 측정(Gini Impurity Measure)은 Classification Problem에서 사용 가능한 결정 트리(Decision Tree)의 분할 기준 (Split Criteria) 중 하나이다. 첫째, 지니 불순도 측정치가 결정 트리에서 사용되는 방법과는 독립적으로 다양한 각도에서 동기를…
데이터 사이언스 컨설팅 은 무엇을 하는 업종인가요? 컨설팅 회사에 왜 데이터 사이언티스트가 필요한가요? 데이터 사이언스 컨설팅 업계에서 일한다고 말할 때 자주 받는 질문이다. 흔히 데이터 사이언티스트라고 하면 큰 Tech 회사에서…
정부가 XXX님의 H-1b 취업 비자 신청서를 승인했습니다. 군대 전역할 때도 무덤덤했던 필자가 2일 전 회사 Immigration team으로부터 H-1b 취업 비자 합격 메일을 받고 울컥했다. 냉정하게 생각해보면 종이 쪼가리 한 장에…