dECISION tree 모델의 갱신 시점 모니터링 2008104399 윤상미 - QUAD 연구실(진창호 교수님)
1. 연구 분야 CRM(customer relationship management) DATA MINING 고객과 관련된 기업의 내·외부 자료를 분석·통합하여 고객특성에 기초한 마케팅 활동을 계획·지원·평가하는 과정 DATA MINING CRM은 고객과 관련된 기업의 내, 외부 자료를 분석, 통합하여 고객특성에 기초한 마케팅 활동을 계획하고, 지원하며, 평가하는 과정입니다. 조직들은 고객에 대한 막대한 양의 데이터를 모으고 저장합니다. 데이터마이닝은 이러한 막대한 양의 데이터 속에 숨겨진 정보를 발견하는데 도움을 줍니다. 막대한 양의 데이터 숨겨진 정보
2. 연구 대상 분류 분석 - 의사결정트리 분류기 과거 데이터 의사결정 트리 생성 종속변수-독립변수 관계 설명(결과값 별 미래 속성의 조합 ) 의사결정트리 분류기를 이용한 분류분석은 CRM분야에서 가장 많이 쓰이는 단순한 방법의 데이터마이닝 기법입니다. 과거에 수집된 데이터의 레코드들을 분석하여 이들 사이에 존재하는 패턴, 즉 결과값 별 특성을 고객속성의 조합으로 나타내는 분류모형을 나무의 형태로 만드는 것이다. 이 결과값 별 속성의 조합은 종속변수와 독립변수간의 관계를 설명해줍니다. 이렇게 만들어진 분류모형은 미래의레코드를 분류하고 해당 결과값을 예측하는 데 사용된다. 미래 데이터 결과값 예측 의사결정 트리 분류기
2. 연구 대상 분류 분석 - 의사결정트리 분류기 CRM분야에의 적용 : 고객확인 – 고객세분화, 타겟 고객분석 고객유치 – 다이렉트 마케팅 고객유지 – 로열티프로그램, 1:1마케팅 고객개발 – 고객생애가치 예) 자동차 용품 판매를 위해 어떤 특성을 가지는 사람들을 대상으로 홍보를 하면 좋을 것인가. 독립변수 : 나이, 성별 종속변수 : 차 소유 여부 30대~40대, 40대 이상의 남자 나이 30대 미만 40대 이상 30대 ~40대 성별 여 차 소유X 차 소유 남 이러한 분류기법은 슬라이드에서 보시는 것과 같이 CRM분야의 다양한 목적을 위해 쓰일 수 있습니다. 예를 들면 자동차 용품 판매를 위한 타겟 고객을 알아내기 위해서 나이와 성별을 독립변수로 하고 차 소유 여부를 종속변수로 하는 의사결정트리 분류기를 만들어 냅니다. 이를 통해서 어떤 속성을 가지고 있는 사람이 차를 소유하고 있는지를 알 수 있는데 보시는 것과 같이 30대~40대, 40대 이상의 남자에게 집중적으로 마케팅을 할 수 있습니다. 차 소유 차 소유X 의사결정 트리 분류기
3. 문제점 의사결정 트리 모델 과거 데이터 미래 데이터 예측률 보장 종속변수-독립변수 관계 종속변수-독립변수 관계 생성된 의사결정 트리 모델은 과거 데이터의 속성간의 관계가 미래 데이터의 속성에도 그대로 적용된다는 가정 하에 적용될 수 있습니다. 그러나 고객의 특성은 빠르게 변화하기 때문에 예측률 보장
3. 문제점 모델 갱신이 필요! 의사결정 트리 모델 과거 데이터 미래 데이터 예측률 보장 종속변수-독립변수 관계 시간이 지나면 그 속성간의 관계는 변화하고 이미 변화된 속성을 가지는 미래 데이터에 구식 모델을 적용하는 것은 타당하지 않습니다. 따라서 일정수준의 예측률을 보장하기 위해서는 적시에 모델 갱신이 필요합니다. 모델 갱신이 필요! 예측률 보장
Decision Tree 모델 갱신 시점 파악 4. 연구 방법 Decision Tree 모델 갱신 시점 파악 EWMA 관리도를 이용 지수가중 이동평균 관리도(exponentially weighted moving average : EWMA) : 관측치의 평균값에 가중치를 주는 이동평균을 관리하는 관리도 (이동평균 : 추세의 변동을 알 수 있도록 구간을 옮겨 가면서 구하는 평균) 과거 데이터일수록 가중치가 줄어드는 효과 관측치의 평균값의 미세한 이동을 탐지하는데 효과적 이러한 배경으로부터 저의 연구 주제는 의사결정모델의 갱신 시점 파악을 목적으로 합니다. 그리고 이를 위한 연구 방법으로는 예측률을 관리하기 위해서 EWMA 관리도를 이용할 것입니다. EWMA 관리도는 지수가중 이동평균 관리도를 말하는데 이는 관측치의 평균값에 가중치를 주는 이동평균을 관리하는 관리도 입니다. 여기서 이동평균 : 추세의 변동을 알 수 있도록 구간을 옮겨 가면서 구하는 평균을 말합니다. EWMA관리도는 과거 데이터일수록 가중치가 줄어드는 효과를 가지며 관측치의 평균값의 미세한 이동을 탐지하는데 효과적입니다. (가중치 값을 조절 급속도로 변화하는 것에 대한 모델이나 모델변화에 따른 손실이 막대하다면 가중치를 낮춘다. 완만하게 변화하는 것에 대한 모델이나 모델변화에 따른 손실이 약하다면 가중치를 높인다.) 모델 갱신 필요 : 고객 특성 변화 고객관리 전략의 필요
5. 참고문헌 E.W.T.외 2명. 2009. Application of data mining techniques in customer relationship management: A literature review and classification. Expert Systems with Applications 36. 2592–2602. Chen,Y.L외 2명. 2003. Constructing a multi-valued and multi-labeled decision tree. Expert Systems with Applications 25. 199-209. Wu, C.H외 3명. 2005. Targeting Customers via discovery knowledge for the insurance industry. Expert Systems with Application 29. 291-299. Yu, J.K. 외 3명. 2005. Identifying interesting visitors through web log classification. IEEE Intelligent Systems 20. 55-59.
Thank you for listening. THE END Thank you for listening.