Chapter4. 연관성 분석.

Slides:



Advertisements
Similar presentations
비즈쿨 - 정 성 욱 - - 금오공고 비즈쿨 - 정 성 욱 1. 나는 각 단원들의 활동들에 성실하게 참여 하겠습니다. 우리의 다짐 2. 나는 나와 전체의 발전을 위해 각 멘토들의 지도에 순종하겠습니다. 3. 나는 각 단원들을 숙지함으로써 비즈니스 마인드를 함양하고 자신의.
Advertisements

내 마음의 버 스 이천신하교회 청년부. 이름 : 한상훈 나이 : 30 살 종교 : 기독교 ( 모태신앙 ) 생활신조 : 인생은 한방 ! 로또나 사자 이상형 : 청순 가련한 모태미녀 특이사항 : 걸그룹 노래에 환장함 식스팩을 갖기엔 슬픈 몸을 타고 남.
10장. 시기별 학급경영 11조 염지수 이 슬 권용민 신해식.
일본 근세사. (1) 에도막부의 개창 ( ㄱ ) 세키가하라의 전투 (1600) - 히데요시의 사후 다섯 명의 다이로 ( 大老 ) 가운데 최대 영지 (250 만석 ) 를 보유하고 있던 도쿠가와 이에야스가 급부상. 이에 이에야스와 반목해 온 이시다 미쓰나리 ( 石田三成 ),
학년도 1 학기 마케팅 강의안 Copyright 2005 Kichan Kim, Jiyun Park & Hyunju Cha CHAPTER 11 Product and Brand Strategy 1What is Product? 2Product Classifications.
아니마 / 아니무스 송문주 조아라. 아니마 아니마란 ? 남성의 마음속에 있는 여성적 심리 경향이 인격화 한 것. 막연한 느낌이나 기분, 예견적인 육감, 비합리적인 것에 대 한 감수성, 개인적인 사랑의 능력, 자연에 대한 감정, 그리.
대구가톨릭대학교 체육교육과 06 학번 영안중학교 체육교사 신웅섭 반갑습니다. 반야월초등학교 축구부 대륜중학교 축구부 대륜고등학교 대구가톨릭대학교 차석 입학 대구가톨릭대학교 수석 졸업 2014 년 경북중등임용 체육 차석 합격 영안중학교 체육교사 근무 소개.
우리테크 녹색경영을 달성하기 위한 녹색경영 방침 □ 우리테크는 파워 드레인트탭을 제조, 판매하는 회사로써 오랜경험과 축적된 노하우를 통해 독 자적인제품 개발에 주력하고 있다. □ 또한 우리테크는 안정적이고 친환경적인 제품 생산을 위해 항상 연구와.
2015 Product design 산업디자인과 Kim Dong Hyun.
일장 - 1 일 24 시간 중의 명기 ( 낮 ) 의 길이 ( 밤은 암기, 낮은 명기 ) 광주기성 - 하루 중 낮의 길이의 장단에 따라 식물의 꽃눈 형성이 달라지는 현상 일장이 식물의 개화현상을 조절하는 중요한 요인 단일식물 - 단일조건에서 개화가 촉진되는 식물 장일식물.
2 학년 6 반 1 조 고은수 구성현 권오제 김강서.  해당 언어에 본디부터 있던 말이나 그것에 기초하여 새로 만들어진 말  어떤 고장 고유의 독특한 말  Ex) 아버지, 어머니, 하늘, 땅.
Association Rule Sequential Pattern Classification Clustering Data Mining A B C D 2.
2014년도 교원 및 기간제교사 성과상여금 전달교육 개 회 국기에 대한 경례 - 인사말
전남행복수업 design 독서ㆍ토론 수업 지원 자료 활용 목포유달초등학교 김미향.
연관규칙기법과 분류모형을 결합한 상품 추천 시스템:
목차 1. CRM의 개념 2. CRM의 기대 효과 3. CRM의 구축/실행 4. CRM 추진의 걸림돌
전남행복수업 design, 독서·토론수업 연구의 개요를 말씀드리겠습니다..
선진 고양교육 “유아교육 행정 업무 연수” 유치원 회계실무 및 유아학비 연수 경기도고양교육청.
Design, market을 생각하다.
Chapter 2 정보시스템 아키텍처 (IS Architecture)
묵자 겸애, 비명, 비공, 상현, 상동, 천지, 명귀, 삼표 법.
▣ 금연 프로그램 운용(안) 구 분 실 시 내 용 일 정 사전조사 교육프로그램실시
내 아이를 위한 구강관리.
Database Marketing(DBM)의 효율적 활용방안 연구 (B to C 및 금호그룹의 서비스산업 중심으로)
제16장 원무통계 • 분석 ☞ 통계란 특정의 사실을 일정한 기준에 의하여 숫자로 표시한 것을 말한다.통계로서 활용할 수 있는 조건으로는 ① 동질성을 지녀야 하고 ② 기준이 명확하고 ③ 계속성이 지속되어야 하며 ④ 숫자로 표시하여야 한다 경영실적의.
2014년 가을학기 손시운 지도 교수: 문양세 교수님 연관 규칙 2014년 가을학기 손시운 지도 교수: 문양세 교수님.
4장 CRM 방법론.
서울지방세무사회 부가세 교육 사진클릭-자료 다운 세무사 김재우.
사외내방객 사이트매뉴얼.
치매의 예방 김 은민 윤금 노인요양원 치매의.
데이터마이닝의 소개 Data Mining Introduction
미래 예측 3가지 방법론.
원가회계의 기초 & 분류.
연관관계 분석을 통한 스마트폰과 기능의 융합 분석 서강대학교 경영전문대학원 노미정, 김진화, 이재범.
생산/재고관리 기본 목 차 생산관리 재고관리.
Data Mining.
마산에 대하여 만든이 : 2204 김신우, 2202 권성헌.
제주닷컴 매뉴얼 (실시간 예약시스템) 2013년 10월.
1. 논리적이란? 논리적이지 못하다 말이나 글에 두서가 없다. 1. 논리적이란? 논리적이지 못하다 말이나 글에 두서가 없다.
[ 포털 사이트 연관검색어/자동완성 등록 서비스 ]
세일즈분석/분석CRM을 위한 데이터마이닝 활용방안
Copyright © 2012 Pearson Education, Inc. Publishing as Prentice Hall
제 18 장 교류 분석.
정보 추출기술 (Data Mining Techniques ) : An Overview
New Product is Available
마케팅 기초 이해 장 흥 섭 1.
칼빈의 생애와 개혁자로의 변모 사학과 김종식.
국제의료관광 관련 법, 제도.
Cyber Shopping Mall 구축 - CD New - 안소연,박지윤,박종봉,정영은.
마케팅 개념과 마케팅 전략 영업관리팀.
이행점검/현장점검관리.
이것만은 기억해라!! (크리에이티브한 광고 만드는 방법 3가지) 광고 홍보 학과 박태진.
지구 온난화 원재환.
6장 마케팅 조사 박소현, 김중호, 박기찬.
한밭대학교 창업경영대학원 회계정보학과 장 광 식
CHAPTER 9-1 한국의 사회복지정책 - 사회보험제도 -
전문몰과의 대화 ( 비누나라 대표이사:김정준 중소기업진흥공단 전자상거래지원센터.
음양오행과 물리학 조 원 : 김용훈, 양범길, 박수진, 윤진희, 이경남, 박미옥, 박지선 (11조)
한양인 주차정기권 신청 안내 2018년 2학기 관리처 관재팀.
이야기 치료에 대하여 <8조 학문적 글쓰기 발표> 주희록 최은지
How to “Think” as a Consultant
(Association Rules Mining)
Analysis of Customer Behavior and Service Modeling Final Team Project
전류는 자계에서 힘을 받는다 기계공학교육 박지훈 황인석 한만혁 이덕균.
7월 중 여사원 교육 과정 안내 ㈜한국비즈니스정보원 원 장 임 경 진
웰빙시대! 두부의 대변신 행정학과 고전경 행정학과 박소혜 행정학과 송다예
(4)잎의 구조와 기능 학습목표 잎의 구조와 기능을 설명할수 있다. 기공의 구조와 증산의 조절 작용을 설명할 수 있다.
교 육 순 서 화재예방과 진화요령 긴급상황 시 대처요령 소방시설 사용 화재진화 및 피난 기타 당부 및 질문.
중국문학개론 한부와 겅건안문학 중어중국학과 ㅇ이진원 한부와 건안문학.
경찰학 세미나 제 5 강 경찰관직무집행법 2조 5호의 의미 신라대학교 법경찰학부 김순석.
Presentation transcript:

Chapter4. 연관성 분석

데이터의 탐색 1) 연관성규칙발견(Support, Confidence, Lift) 2) 순차적 패턴발견 3) 군집분석의 기본원리 4) 군집분석의 활용

연관성 규칙 (Association Rule)

목차 What? : Market Basket Analysis Association Rule 적용분야 Result Pattern How to use ? : Market Basket Analysis Association Rule Analysis - Probability The Basic Steps in Market Basket Analysis 장단점 사용예제

시장 바구니 분석 (연관성 규칙 발견) 이란 ? Window 청정재 clear 오렌지 주스 우유 바나나 하나의 거래나 사건에 포함되어 있는 항목들의 경향을 파악해서 상호 연관성을 발견 하는 것 EX) Products in Shop Cart (One trip, Together) 1) 구매자가 제품을 구매할 때 이웃의 영향이 있었는가? 2) 오렌지 주스와 청정재 구입시 윈도우 클리너를 같이 구입하는가? 3) 우유를 바나나 구입시 함께 구입하는가? 또한 구입 할 때 특정 브랜드를 구입 하는가? 4) 청정재를 어는 곳에 위치시켜야지만 판매고를 최대화하는가? Window clear 청정재 우유 바나나 오렌지 주스

거래(transaction)와 항목(item) - Market Basket Analysis는 하나 또는 여러 개 의 product 나 service offering 의 거래와 이 거래에 대한 정보에서 시작. Ex) 마크로의 Point-Of-Sale Transaction customer Set of products 오렌지 주스, 바나나 오렌지 주스, 우유 청정제, Window Cleaner 1 2 3 transaction item

연관성 규칙 (Association Rule) - 어떤 Item 집합의 존재가 다른 Item 집합의 존재를 암시하는 것을 의미하며 다음과 같이 표시한다. - 함께 구매하는 상품의 조합이나 서비스 패턴 발견하는데 이용 - 특정 제품 또는 사건들이 동시에 발생 하는 패턴을 파악하는데 이용 EX) 가정 용품 판매 기간 동안 같이 판매해야 하는 상품의 패턴 발견 (Item set A) (Item set B ) ( if A then B : 만일 A 가 일어나면 B 가 일어난다. )

연관성 규칙 적용분야 교차 판매 ( Cross Selling ) 상품 진열 ( Inventory Display ) 연관성 규칙 적용분야 교차 판매 ( Cross Selling ) 상품 진열 ( Inventory Display ) Catalog Design - 상품의 배치문제, 패키지 상품의 구성, 쿠폰 발행, 카탈로그의 구성, 신상품의 카테고리 선정

연관성 규칙 결과 유형 Useful Result - 마케팅 전략상 유용한 결과가 나온 경우 - 마케팅 전략상 유용한 결과가 나온 경우 EX) 주말을 위해, 목요일 소매점에 기저귀를 사러 온 아빠들은 맥주도 함께 사 간다. - 주말에 FOOTBALL을 보면서 마심 Trivial Result - 기존의 마케팅 전략에 의해 연관성이 높게 나온 경우 EX) 정비계약을 맺은 소비자들은 많은 설비를 구매 할 것 같다. - 정비계약은 대개의 경우 따로 맺어지는 것이 아니라, 많은 설비 구입시 함께 제시된다. Inexplicable Result - 의미를 발견하기 위해 많은 고민이 필요한 경우 EX) 새로 철물점을 개업하면, 대개 화장실 문고리를 많이 사 간다.

Co-occurrence of Product(횟수) 시장 바구니 분석의 기본 개념 고객의 구매 상품 List Co-occurrence of Product(횟수) 1 소주 , 콜라 ,맥주 ID 판매 상품 2 소주 , 콜라 , 와인 3 소주 , 주스 4 콜라 , 맥주 6 주스 1 소주 , 콜라 , 맥주 5 소주 , 콜라 ,맥주 , 와인 소주 맥주 콜라 주스 와인 4 2 3 1 2 2 2 3 0 1 3 3 4 0 2 1 0 0 2 0 2 2 2 0 2

1. 단순 패턴의 발견 - 소주와 콜라 , 맥주와 콜라가 다른 combination보다 많이 발생 - 주스는 맥주, 콜라, 와인 과는 결코 함께 구매되지 않는다. 연관성 규칙 발견 2. 연관성 규칙의 예 - 맥주를 구입한 사람들 모두는 콜라도 구매한다. 위에서 제시된 연관성 규칙은 얼마나 유용할까? 이 질문을 해결하기 위해 수치적으로 나타내는 것이 필요하고 , 이 수치적인 계산에는 확률을 사용한다.

연관성 규칙 측량화 방법 지지도 (Support) 연관성 규칙 측량화 방법 지지도 (Support) - 전체 거래 중 항목 X와 항목 Y를 동시에 포함하는 거래가 어느 정도인가 ? - 전체적 구매도에 대한 경향을 파악 - Reflexive(재귀 법칙) :

- 항목 X를 포함하는 거래 중에서 항목 Y가 포함될 확률은 어느 정도인가 ? 신뢰도(Confidence) - 항목 X를 포함하는 거래 중에서 항목 Y가 포함될 확률은 어느 정도인가 ? - 조건부확률 - 연관성의 정도 - not symmetric

리프트 ( Lift / improvement ) - 항목 X를 구매한 경우 그 거래가 항목 Y를 포함하는 경우와 항목 Y가 임의로 구매되는 경우의 비는 ? Lift 의 미 1 두 품목이 서로 독립적인 관계 두 품목이 서로 양의 상관 관계 두 품목이 서로 음의 상관 관계 > 1 < 1 과자와 후추 빵과 버터 지사제,변비약 예

1. 신뢰도의 값이 크면 좋지만 신뢰도가 크다고 최선의 연관성 규칙이라고 볼 수는 없다. 고려 사항 1. 신뢰도의 값이 크면 좋지만 신뢰도가 크다고 최선의 연관성 규칙이라고 볼 수는 없다. - 두 항목의 기본적인 구매율이 어느 정도 수준이 되어야만 의미가 있다. 즉, 지지도가 어는 정도 수준에 도달 해야만 한다. 2. 신뢰도와 지지도는 자주 구매되는 항목에 대해서는 연관성 때문이 아니라 우연하게 높게 나올 수도 있다 - Lift를 본다. 3. 신뢰도가 높을 경우에는 X  Y에서 항목 Y의 확률이 커야지 이 연관성 규칙에 의미가 있다. - Lift 값이 1보다 커야 유용한 정보가 된다.

The Basic Steps in Market Basket Analysis choosing the right set of item and right level - taxonomy(관리도)를 이용 co-occurrence matrix 작성과 확률 ( 지지도, 신뢰도, Lift ) 계산 확률 분석과 유용한 연관성 규칙 결정

장 / 단점 장점 1. 결과가 명확하고 이해하기 쉽다. 2. 자료구조와 계산과정이 간단하다. 단점 1. 항목의 수를 결정하기가 어렵다. 2. 드물게 발생하는 항목에 대해서 처리가 어렵다. 3. DBMS등과 같은 전산화 작업이 없을 시는 동일한 거래를 추적하기가 힘들다. 4. 항목의 수가 증가하면 계산시간이 급격히 증가한다.

Lift = P(콜라|맥주) / P(콜라) = 1/ (4/6) = 1.5 시장 바구니 분석 예제 고객의 구매 상품 List 지지도가 50% 이상인 연관성 규칙 1 소주 , 콜라 , 맥주 ID 판매 상품 2 소주 , 콜라 , 와인 3 소주 , 주스 4 콜라 , 맥주 5 소주 , 콜라 ,맥주 , 와인 6 주스 1 소주 , 콜라 ,맥주 지지도 50% 이상인 규칙 해당 Transaction 신뢰도 소주 => 콜라 1,2,5 75 % 콜라 => 맥주 1,4,5 75 % 맥주 => 콜라 1,4,5 100 % Lift = P(콜라|맥주) / P(콜라) = 1/ (4/6) = 1.5 * 연관성 규칙 : 맥주를 구입한 사람들 모두는(100%) 콜라도 구매한다 - 그리고 이러한 경향을 가지는 사람들은 전체의 절반(50%) 정도이다 - 맥주 구매 시 콜라를 구입하게 될 가능성은 맥주 구매가 전제되지 않았을 경우보다 1.5배나 높아진다.

기 타 Sequences Association Rules Discovery Dissociation Rules Discovery A B : A라는 사건이 발생한 후 B가 발생 예제 : 새 컴퓨터를 구입한 사람 중 25%는 그 다음날에 레이저 프린터를 구입할 것이다. Dissociation Rules Discovery If ~A and ~B then ~C If ~A and B then ~C If A and ~B then ~C If ~A and ~B then C If ~A and B then C If A and ~B then C

시장 바구니 분석 예제 #2 7,991명의 고객의 고객에 대한 은행의 상품과 서비스 자료

당좌예금계좌 보통예금계좌 - 지지도(Support) 54.17% - 신뢰도(Confidence) 87.56% - 향상도(Lift) 1.02

보통예금계좌와 당좌예금계좌는 독립적인 사건으로서 지지도와 신뢰도가 높은 것은 연관성에 의해서 아닌 대다수 고객들이 신청했기 때문

Disassociation Rule 보통예금계좌 - 지지도(Support) 54.14% - 신뢰도(Confidence) 87.50% - 향상도(Lift) 1.06 단기금융저축예금계좌가 없는 고객

ATM 상품 정책

당좌예금계좌 보통예금계좌

The End 감사합니다