Marketing Research 1  군집분석의 개념과 적용  군집분석 (cluster analysis) : 다수의 대상들 ( 소비자, 제품, 기타 ) 을 그들이 소유하는 특 성을 토대로 유사한 대상들끼리 그룹핑하는 다변량 통계기법 → 군집내의 구성원들은 가급 적.

Slides:



Advertisements
Similar presentations
법의 이념과 철학의 이해 법의 이념은 무엇일까 ? 정의 : 각자에게 각자의 몫을 주는 것 - 평등의 의미가 내포되어 있음 법적 안정성 : 법의 규정이 명확하고 잦은 변경 이 없어야 함 개인의 자유와 권리를 공공복지와 조화롭게 추구 – 사회질서와 안전유지 + 사회정의.
Advertisements

유클리드 이후의 그리스 수학. 아르키메데스 ( 기원전 ) 죽은 뒤 묘비위에 원기둥에 내접한 구 모형을 만 들어 달라고 저서 : 평면기하에 관한 것 ① 원의 측정 - π 를 계산 하는 고전적인 방법을 처음시도 ② 포물선의 구적법 - 24 개의 명제로 구성,
열왕기 상하는 중요하다 ! 왜 ? 시가 3 권 예언서 12 원 열왕기 상하는 중요하다 ! 대라느스 단겔학슥말.
 수학 10- 나  1 학년 2 학기  Ⅰ. 도형의 방정식 1. 평면좌표 (1/24) 두 점 사이의 거리 수업 계획 수업 활동.
대구 영적 도해 도시를 위한 연합기도 모임. 고조선과 삼한 BC 2166 : 아브라함 탄생 BC 1500 : 모세 부르심 BC 1000 : 다윗 왕국 BC 587 : 남 유다 멸망 BC 108 : 고조선 멸망 고조선 후기에 남쪽지방은 삼한시대 : 마한, 변한, 진한 진한은.
성결 어린이 영등포교회 유년부 정답은 뒷면에 제 11-31호 2011월 8월 14일 어디로 가세요?
청년일자리, 어떻게 해결할 것인가? 이 병 훈 (중앙대 사회학과) 사회경제정책포럼 발제문
지적기초측량 경일대학교/부동산지적학과.
(2) 고대 국가의 성립  1) 고대 국가의 성격    ① 중앙 집권 체제      - 국왕의 지위 강화, 부족장 세력의 통합,
연꽃회 회보 [격주刊] 연꽃회 불기 2550년 5월 3일 (음 2006년 4월 6일) 선문답 깨달음은 무엇과 비슷합니까?
이탈리아 피자스파게티올리브등.
고입특강 과학 중학교 1학년 단원 1. 지구의 구조 대기권 지구의 내부.
교과서 재구성 5조 신승재 홍문연 조수현 김재현.
목 차 PART 1 : 하나님나라로 성경관통 PART 2 : 하나님나라로 구약관통 PART 3 : 하나님나라로 구약 권별 관통
Ⅵ. 빛(단원학습목표).
한국 영화계 네트웍 분석.
2015 담당 강사 : 정세진 중국 명문 감상 2015 담당 강사 : 정세진
해시 함수.
암 보다 더 무서운 당뇨 2010년 [아시아경제 강경훈 기자 ].
동북공정(東北工程) -고구려사를 중심으로
통로이미지㈜ 마케팅실 신입/경력 모집 ◎ 모집부분 및 자격요건 ◎ 채용인원 ◎ 전형절차 ◎ 제출서류 ◎ 연봉 ◎ 사전인터뷰
데이터 마이닝을 이용한 분류 분석.
빛과소금의교회 바이블스쿨 교재 8시간 만에 끝내는 성경의 맥(脈) 잡기 장창영 목사.
2D 게임프로그래밍 프로젝트 2차 발표 유제원.
요한계시록 진행과정 장 차 될 일 천년왕국(20:4-6)/흰보좌(20:11-15) 20
1. 약물통태에 속하는 것은. a. 흡수 b. 분포 c. 대사 d
제2절 법인세의 계산구조와 세무조정 1. 각 사업연도소득에 대한 법인세 계산구조 회계와 사회 결산서상 당기순이익
예수님 탄생 목자.박사들 경배 (마2:1-12, 눅 2:1-7).
수학 I 2. 방정식과 부등식.
영덕풍력발전단지 준공 기념식 행사(안) 경영기획실.
관능검사 기법.
인류의 분산 언어의 대 혼잡시기 창조,타락 홍수 바벨탑사건 아브라함 모세 BC 고조선 하/은/주 (창 11:7,9) 『[7] 자, 우리가.
에너지 운동량 방법: 일과 에너지법칙 1. 상자들이 초기속도 vo로 컨베이어 벨트로 운반되어 A에서 미끄러져서 B에서 떨어진다. μk= 0.40이고, 상자가 2.4m/s로 B점에서 떨어질 때 컨베이어 벨트의 속도를 구하라.
Cluster Analysis (군집 분석)
도덕 1학년 1학기 2. 개성신장과 인격 도야:인물학습 석가모니 인물학습 -석가모니.
제 11장 교락법과 일부실시법.
7장: 빛의 간섭과 회절 빛의 간섭 단일슬릿과 회절 회절격자 – 더 선명해진 간섭무늬.
2014년 가을학기 손시운 지도 교수: 문양세 교수님 군집 2014년 가을학기 손시운 지도 교수: 문양세 교수님.
우리생활속의 확률 이용사례탐구 한림초등학교영재학급 6학년 김수민.
알기쉬운 시설공사(2) 경상북도교육청 이형주.
3. 게이트레벨 최소화.
평행사변형의 성질 사각형 ABCD 사각형 ABCD → 기호: □ABCD 대변: 마주 보는 변 대각: 마주 보는 각
김포 한강베네치아 상가분양 3층~5층 오피스텔 226세대 1층~2층 상가 분양문의 : 이효철( )
군집분석 (Cluster analysis)
Ⅶ. 원 의 성 질 1. 원 과 직 선 2. 원 주 각 3. 원 과 비 례.
탐구하는 수학연습문제 수학 8나 대한 114쪽 Ⅲ. 도형의 닮음
쿰란 쿰란 와디 항공촬영 .
제12주제 갈보리언덕에서 누가복음 23:33-49.
수업활동 안내 탐구 학습 1. 전시학습 2. 학습목표 3. 도입 4. 기초 내용 학습 5. 문제 제기
보라 처녀가 잉태하여 아들을 낳을 것이요 그 이름은 임마누엘이라 하리라 (이사야7:14)
Chapter 5. 자료의 연산과 논리회로 e-learning Computers.
발표: G2 박진수 사도요한 준비: G2 박진수 사도요한 T3 김택준 미카엘
평 면 도 형 도형의 작도 삼각형의 작도와 결정조건 도형의 합동 작도와 삼각형의 합동 학습내용을 로 선택하세요
7세그먼트 표시기.
耽羅國 建國神話 허남춘(제주대 국문학과 교수)
제 9 장 경쟁시장.
요한 계시록 2:12~17 버가모 교회 : 예수님의 모습-좌우에 날썬 검을 가진자 13절-예수님께서 사는 곳을 아신다.
동양의 색채 1.인 도 인더스 강 유역에서 고대(B.C 2000 ~ 3000)의 청동기시대에 문화가 이미 발달하였고, 메소포타미아와 유사하고 이는 신에 관한 것이 많고, 도시계획이 이루어져 있었으며, 이 시대부터 모자이크 타일이나 돌에 의한 다채로운 재료가 사용되었다.
제7장 수학과에서의 평가 7.1 평가과정의 본질 7.2 평가과정의 단계
물체 나타내기 기술ㆍ가정 1학년 Ⅳ . 제도의 기초 〉 1.물체를 나타내는 방법 (7 / 8) 1. 제작의도 2. 활용방법
기술가정 2학년 1학기 2.재료의 이용>1) 목재,플라스틱,금속재료의 특성>11/15제품의 구상
진리 나무 Truth-tree  ∧ ∨ → ↔  =.
Basic Function 김윤성 박로빈 이지호 천영재
엔화 대환/대출 자금용도 대상 이자 차액 효과 (A,B,C) 환율 리스크 헷징 (A,B) 엔화의 평균환율 (A,B,C)
8단계 3층을 완성한다 Case 1 Case 2 Case 3 Case 4
2012년 9월 16일 바벨탑 사건과 셈의 후손들의 족보 ▣말씀:창세기 11:1-32 예 수 복 된 교 회.
논증의 타당성/부당성 검증 Verification/Falsification
베트남.
매스펀 문제 2.
Presentation transcript:

Marketing Research 1  군집분석의 개념과 적용  군집분석 (cluster analysis) : 다수의 대상들 ( 소비자, 제품, 기타 ) 을 그들이 소유하는 특 성을 토대로 유사한 대상들끼리 그룹핑하는 다변량 통계기법 → 군집내의 구성원들은 가급 적 유사하게, 군집들간에는 가급적 상이하게 대상들을 그룹핑.  군집 (cluster) : 군집분석에 의해 형성되는 각 그룹.  마케팅에서의 사용 : 시장세분화, 유사브랜드 그룹핑 → 어느 브랜드와 직접적 경쟁관계에 있는지 알 수 있음. 제 17 장 군집분석 ( 참고 ) 자료의 구조를 평가한다는 점에서 요인분석에 비유될 수 있으나, 요인분석은 변수들을 그 룹핑하는데 비해 군집분석은 대상들을 그룹핑한다는 점에서 근본적으로 다르다. 대상들을 분류한다는 점에서 판별분석에 비유될 수 있으나, 판별분석은 분석 이전에 집단 이 이미 나누어져 있으며 기본과업이 집단들간의 차별적 특성을 설명하는 변수들을 발견하 는데 있는데 비해 군집분석은 사전에 집단이 나누어져 있지 않으며 기본과업이 여러 변수 들에 걸쳐 유사한 대상들끼리 집단화한다는 점에서 다르다.

Marketing Research 2  군집분석을 위한 자료  군집분석을 위해 흔히 사용되는 자료 : 간격척도 / 비율척도로 측정된 거리값 (distance measure) 이며 경우에 따라서는 명목척도 또는 비율척도로 측정된 값들로도 군집분석이 가능 ( 대부분의 군집분석 : 거리로 나타낸 값들을 대상으로 이루어짐 ).  거리의 종류 Minkowski 거리 도시블럭 거리 제곱 Euclidian 거리 Euclidian 거리 : 두 지점간의 거리를 계산할 때 직각 삼각형의 원리를 이용하는 것으로 가장 흔히 사용됨. 대상 2(x 2, y 2 ) 대상 1(x 1, y 1 ) y 2 – y 1 x 2 – x 1 군집방법 중 단일결합법, 완전결합법, 평균결합법 을 사용하는 경우 흔히 Euclidian 거리를 사용하고 Ward 법을 사용하면 제곱 Euclidian 거리를 많이 사용. 군집분석을 위해 변수들의 단위가 다르면 원자료를 사용해서는 안 된다. → 여러 변수들이 동일한 단위 로 측정된 경우가 아니면 표준화된 값을 사용해야 한다.

Marketing Research 3  군집분석을 위한 가정  표본의 통계량으로부터 모집단의 모수를 추정하는것이 아니며, 주어진 자료의 구조를 파악 하여 기술하므로 기술통계기법임. 따라서 모집단의 정규성이나 집단간 공분산의 동일성과 같은 가정이 요구되지 않는다.  경우에 따라 다중공선성 (multicollinearity) 이 결과에 크게 영향을 미칠 수 있다.  군집의 추출  계층적 군집화 (hierarchical clustering) : 처음 각 대상이 독립군집으로 출발하는데 ( 예 를 들어 대상이 10 개이면 군집이 10 개 ), 거리가 가장 가까운 어느 두 대상 ( 즉, 두 군집 ) 이 군 집을 이루기 시작하여 가까운 군집들끼리 계속적인 군집화가 이루어지는 방법으로 이 과정 에서 계속적으로 군집의 수가 감소. 군집추출방식 계층적 군집화 비계층적 군집화 단일결합법 완전결합법 평균결합법 Ward 법 K – 평균법

Marketing Research 4 단일결합법 (single linkage) : 최단거리 기준. ● ● ● ● ●●●● ● ABCDE 대상들간의 거리를 행렬로 나타내면 다음과 같다. ABCD B2.0 C D E 덴드로그램 ● ● ● ● ● A B C D E  B, C 결합 : BC 군집형성.  최단거리 기준으로 BC 군집으로 부터 A 까지의 거리는 2.  D, E 거리는 1.5 이므로 D 와 E 가 결합하여 DE 군집형성.  BC 군집과 A 의 거리는 2 이나 BC 군집과 DE 군집의 거리는 2.5 이므로 BCA 군집이 이루어지 고 BCA 군집과 DE 군집이 결합.

Marketing Research 5 완전결합법 (complete linkage) : 형성된 군집과 다른 군집의 거리를 계산할 때 최장거 리를 기준으로 한다.  평균결합법 (average linkage) : 형성된 군집과 다른 군집의 거리를 계산할 때 한 군 집의 모든 구성원들로부터 다른 군집의 모든 구성원들까지 거리의 평균을 기준으로 함. »BC 군집과 A 의 거리는 2.5( ) 이며, BC 군집과 DE 군집의 거리는 3.75( ). » 극단값을 사용하지 않고 각 군집에 포함된 모든 구성원들의 값을 사용한다는 점에서 보다 합리적. Ward 법 : 최단거리를 기준으로 군집화가 진행되는 것은 동일하나 군집간의 거리를 계산 하는 방식에서 차이가 있는데 두 군집간의 거리는 각 군집을 구성하는 대상들이 평균으로 부터 떨어진 정도, 즉 “ 편차 ” 의 제곱을 그 군집을 구성하는 대상들에 걸쳐 합한 것으로 거 리를 계산 ( 다음은 변수가 한 개인 경우 ). ● ● ● ●  BC 군집과 A 의 거리는 3 이며, BC 군집과 DE 군집의 거리는 5. = 각 군집의 i 번째 대상의 속성치 = 그 군집을 구성하는 대상들의 평균치 = 각 군집을 구성하는 대상들의 수

Marketing Research 6  4 개에서 두 개씩 추출할 수 있는 조합의 수는 6 개 ( 4 C 2 ) 이며, 각각의 편차의 제곱값의 합계 를 계산하면, AB = (0 - 1) 2 + (2 - 1) 2 = 2 AC = ( ) 2 + ( ) 2 = 4.5 AD = ( ) 2 + (5.5 – 2.73) 2 = BC = (2 – 2.5) 2 + ( ) 2 =.5 BD = (2 – 3.75) 2 + (5.5 – 3.75) 2 = CD = ( ) 2 + ( ) 2 =  편차의 제곱값의 합계 6 개 중 가장 짧은 거리를 갖는 B 와 C 가 결합하여 BC 의 군집이 형성되 고 BC 는 하나의 군집이 되었으므로 다음과 같이 계산됨. ABC = ( ) 2 + (2 – 1.67) 2 + (3 – 1.67) 2 = BCD = (2 – 3.5) 2 + (3 – 3.5) 2 + (5.5 – 3.5) 2 = 6.5 따라서 BC 군집에 가장 가까운 거리를 갖는 A 가 결합된다.  끝으로 ABC 군집에 D 가 결합되어 ABCD 의 군집 형성. ABC B2 C4.5.5 D ABC D ● ●●● A BCD

Marketing Research 7  비계층적 군집화 ((nonhierarchical clustering) : 군집의 수가 한 개씩 감소하는 것이 아니라 사전에 정해진 군집의 숫자에 따라 대상들이 군집들에 할당되는 것. 계층적 군집화 : 6 개의 군집해 (six-cluster solution) 는 7 개 군집해에서 어느 두 군집들 이 결합하는 것. 비계층적 군집화 : 6 개 군집해는 가능한 모든 6 개 군집해들 중에서 최상의 것이됨. 방법 : 가장 널리 이용되는 것이 K- 평균법 (K-means) 으로 K 는 군집의 수를 의미. 한 군집씨앗 (cluster seed) 이 선택되고 사전에 명시된 한정거리 (threshold distance) 이내에 있는 대상들이 그 군집씨앗을 중심으 로 군집화. 또다른 군집씨앗이 정해지고 같은 방식 으로 군집화가 진행 되나 어떤 대상이 사 전에 한 군집에 속해 져 있더라도 새로운 군집씨앗에 보다 가 까우면 이 대상은 새 로운 군집에 할당. 사전에 정해진 K 개의 군집씨앗을 중심으로 K 개의 군집이 도출될 때 까지 계속 진행되며, 군집화가 진행 됨에 따라 각 군집의 중심점 (centroid) 이 달라진다.

Marketing Research 8 SPSS 프로그램에 의한 계층적 군집화 : computer output 의 dendrogram 은 대상들 이 군집화되는 순서를 보여주나 비계층적 군집화를 하면 각 대상이 어느 군집에 속하는지 최종결과만 나타나며 그 과정은 나타나지 않는다.  계층적 군집화 vs 비계층적 군집화 계층적 군집화 방법 중에서는 일반적으로 Ward 법과 평균결합법이 널리 이용됨. 계층적 군집화 방법의 한계점  한 대상이 일단 어느 군집에 소속되면 다른 군집으로 이동될 수 없다.  예외값 (outlier) 이 제거되지 않고 반드시 어느 군집에 속하게 된다 ( 예외값의 영향력 은 완전결합법의 경우 더욱 크게 나타나므로 이러한 문제를 해결하기 위해서는 예외값 을 갖는 대상을 제거해야 함 ).  표본의 크기가 큰 경우 컴퓨터 처리 용량이 상당히 커야 한다. 비계층적 군집화는 최근 보다 널리 이용되고 있음.  계층적 군집화가 갖는 문제점은 없으나 군집의 수를 사전에 지정해 주어야 함. » 연구자가 사전에 몇 개로 정하는 것이 바람직하다는 신념을 갖지 않는 경우 군집의 수를 달리하여 여러 번 실행 후 한 가지 결과를 선택. » 계층적 방법에 의해 군집화를 한 다음, 그 결과로부터 가장 적절한 수의 군집 수를 결정하여, 다시 비계층적 방법에 의해 분석하면서 이때 그 수를 지정하는 것으로 계 층적 군집화에서 나타나는 예외값을 이때 제거하는 것이 바람직 ( 현실적으로 많이 이용되는 방법 ). » 각 군집의 명칭과 관리적 시사점을 가장 명확히 할 수 있는 수준에서 군집의 수를 결 정하는 것이 바람직.

Marketing Research 9  군집의 해석  군집분석 결과에 따라 도출되는 각 군집의 명칭을 부여하면 그 결과를 보는 사람들이 각 군 집의 특징을 보다 잘 이해 → 표준화시키지 않은 원자료의 값의 중심값 (centroid) 을 이용 / 표준화시킨 자료를 군집화분석하였다면 각 군집의 각 변수의 원자료 값을 역으로추적하여 해석.  군집분석의 예 군집분석 자료 사교성직무성적  계층적 군집분석 : Ward 법 사용, 제곱 Euclidian 거리 사용.

Marketing Research 10 근접성 행렬 제곱 유클리디안 거리 케이스 이것은 상이성 행렬입니다. ↑ 판매원들 (case) 간의 근접성행렬  근접성 행렬

Marketing Research 11 군집화 일정표 단계 조합된 군집 계수 최초출현 군집단계 다음 단계 군집 1 군집 2 군집 1 군집 시작되는 부분

Marketing Research 12  수직 고드름표와 Dedrogram 수직 고드름도표 케이스 군집의 수 ××××××××××××××××××× 2×××××××××××××××××× 3××××××××××××××××× 4×××××××××××××××× 5××××××××××××××× 6×××××××××××××× 7××××××××××××× 8×××××××××××× 9×××××××××××

Marketing Research 13 군집의 수를 3 개로 한 경우 cases 8, 7, 3 ; 5, 6, 4, 2 ; 10, 9, 1 이 각각 군집화됨을 알수 있음. Dendrogram using Ward Method C A S E Label Num Rescaled Distance Cluster Combime

Marketing Research 14 최종군집표 : 각 군 집에 cases 가 추가 됨에 따라 중심값 (centroid) 이 달 라졌음을 보여준다 → 군집 1 에 속한 cases 1, 9 의 사교 성 중심값은 27.5( ) 인데, 반올림하여 28 로 나타나 있다.  비계층적 군집분석 (K- 평균법에 의한 분석결과 : 계층적 군집분석에서 3 개의 군집이 적절하 다고 판단했으므로 군집의 수를 3 개로 지정 ) 초기군집중심 군집 123 사교성 직무성적 소속군집 케이스 수군집거리 최종군집중심 군집 123 사교성 직무성적 cluster seed 번호 각 군집의 케이스 수 군집 유효 결측.000