제14장 요인분석.

Slides:



Advertisements
Similar presentations
價値 시장을 잘 파악하기 위해서는 소비자의 상호작용에 대하여 관심을 가져야 한다. 이 제품의 사용자는 누구이며, 무엇을 하고, 어떤 환경에 있는지, 그리고 왜 그런 행동을 하는지에 대한 관찰을 통해 소비자의 생활 패턴을 파악해야.
Advertisements

Big Data & Hadoop. 1. Data Type by Sectors Expected Value using Big Data.
1. 2 차원 배열  배열은 동일한 데이터 유형으로 여러 개의 변수를 사용할 경우 같은 이 름으로 지정하여 간편하게 사용할 수 있도록 하는 것으로서 앞에서 1 차원 배열을 공부하였습니다.  2 차원 배열은 바둑판을 생각하면 되며, 1 차원 배열에서 사용하는 첨자를 2.
제3장제3장 제3장제3장 이산균등분포  확률질량함수 :  평균 :  분산 : 공정한 주사위를 한 번 던지는 경우 나온 눈의 수를 확률변수 : X 확률질량함수 : 평균 : 분산 :
제 15 장 요인분석 요인분석의 개념 요인분석(factor analysis) : 다수 변수들간의 관계(상관관계)를 분석하여 변수들의 바탕을 이루는 공통차원들(common underlying dimensions)로써 이 변수들을 설명하는 통계기법 목적 : 다수의 변수들을.
제13장 로지스틱회귀분석.
과학 과제물 양파실험 5학년1반 박채빈.
DMAIC 기본 Tools A-6. 상관분석 및 회귀 분석.
구간추정 (Interval Estimation)
3일차 - 가설검정.
Samsung Electronics 5 forces
요인 분석 신뢰도 분석 Copyright © 2012 by Lee, Jae-Hee.
컴퓨터 프로그래밍 기초 [Final] 기말고사
제9장 샘플링과 오차 표본: 시료, Sample 모집단 : 공정, Lot Sampling
통계분석 특강(속성) 서구원 한양사이버대학교 미디어MBA.
제12주 회귀분석 Regression Analysis
윤성우의 열혈 C 프로그래밍 윤성우 저 열혈강의 C 프로그래밍 개정판 Chapter 12. 포인터의 이해.
비모수 분석 및 복습.
11장. 포인터 01_ 포인터의 기본 02_ 포인터와 Const.
제 10장 주성분 분석(PCA) 주성분 분석(PCA)이란? 여러 개의 양적변수들 사이의 분산-공분산 관계를
행렬 기본 개념 행렬의 연산 여러가지 행렬 행렬식 역행렬 연립 일차 방정식 부울행렬.
상관분석 (p , p ).
제 7장 연관성분석 화장품과학과 홍보람.
상관관계 양윤권.
PPL : Product Placement (간접광고)
제4장 제어 시스템의 성능.
제1장 통계학이란 무엇인가 제2장 자료와 수집 제3장 자료 분석 방법
Keller: Stats for Mgmt & Econ, 7th Ed
군집 분석.
Linear Mixed Model을 이용한 분석 결과
Java의 정석 제 5 장 배 열 Java 정석 남궁성 강의 의
Quiz #7 다음 수들을 합병 정렬과 퀵 정렬 알고리즘을 이용하여 오름 차순으로 정렬하였을 때, 데이터 이동 회수를 각각 구하라. 여러분은 정렬 과정을 단계별로 보이면서 이동 회수를 추적해야 한다. 단, 퀵 정렬시에 피봇으로 배열의 왼쪽 첫 번째 원소를 선택한다. 5.
(independent variable)
Association between two measurement variables Correlation
1. 비모수 검정 모수 통계학과 비모수 통계학 모수통계학 (Parametric Statistics) 에서는 표본이 추출된 모집단의 분포에 대한 가정이 꼭 필요 하지만 질적자료나 모집단의 분포에 대한 가정이 필요 없는 양적 자료의 경우에는 모수통계학을 적용할 수 없음 이때는.
마케팅 조사론 1학년 A반 차진우( ) 허성원( ) 김혜진( )
Amos를 이용한 요인분석.
회귀분석(Regression).
컴퓨터 프로그래밍 기초 - 10th : 포인터 및 구조체 -
2장. 변수와 타입.
8장. spss statistics 20의 데이터 변환
두 모집단에 대한 검정.
Frequency distributions and Graphic presentation of data
하이스코 기업문화 실행 프로그램의 실태조사 2조- 노라조.
제 11장 인자분석(Factor Analysis)
논문작성을 위한 연구모형 설정 양동훈.
Keller: Stats for Mgmt & Econ, 7th Ed 회귀모형의 정형화 Model Building
이차방정식과 이차함수의 관계 이차함수의 그래프와 축의 위치 관계 이차방정식 의 그래프와 축이 만나는 점의 좌표는 이차방정식
Sampling Distributions
자녀의 심리적 안정도에 미치는 부모요인 분석.
제 5장 제어 시스템의 성능 피드백 제어 시스템 과도 성능 (Transient Performance)
DA :: 퀵 정렬 Quick Sort 퀵 정렬은 비교방식의 정렬 중 가장 빠른 정렬방법이다.
제 8장. 클래스의 활용 학기 프로그래밍언어및실습 (C++).
계량경제학 1.관광수요의 결정요인 2.관광수입과 환율의 상관 관계..
최소의 실험 횟수에서 최대의 정보를 얻기 위한 계획방법 분석방법: 분산분석(Analysis of Variance, ANOVA)
11장 배열 1. 배열이란? 1.1 배열의 개요 1.2 배열의 선언과 사용.
비교분석 보고서 Template 2015.
상관계수.
Numerical Analysis Programming using NRs
Week 4: 다변수(2변수) 데이터분석 5장_1(산포도: scatter plot) 동영상 1,2,3,4,5
통계학 R을 이용한 분석 제 2 장 자료의 정리.
텍스트 분석 ㈜ 퀀트랩.
제 8장 일반화 선형모형 회귀분석, 분산분석, 다변량분산분석 및 부분 상관분석이 가능 GLM 절차
수치해석 ch3 환경공학과 김지숙.
2007 겨울 통계강좌 중급과정 제12강 판별함수 분석의 이해 및 실전.
 6장. SQL 쿼리.
제4장 다중회귀분석 1절 다중회귀모형과 기본가정 다중회귀모형 기본가정 2절 추정방법 최소제곱추정량과 가우스-마르코프 정리
문제의 답안 잘 생각해 보시기 바랍니다..
7 생성자 함수.
Survey Sampling Sangji University.
Presentation transcript:

제14장 요인분석

요인분석 요인분석 요인분석(factor analysis)은 관련성이 많은 변수나 유사한 케이스들을 묶어 자료의 구조를 요약하고 압축하는 통계기법이다. R형 요인분석(R type factor analysis) 관련성이 많은 변수를 묶는 요인분석 Q형 요인분석(Q type factor analysis) 관련성이 많은 케이스를 묶는 요인분석 cf) Q형 요인분석보다는 군집분석을 더 많이 사용함

변수들 중에는 직접 측정하여 그 값을 구할 수 있는 변수도 있고, 그럴 수 없는 변수도 있음 [예] 체중, 신장 – 직접 측정하여 그 값을 구할 수 있는 변수 소비자 만족 – 직접 측정하여 그 값을 구할 수 없는 변수 제품의 품질, 가격, 디자인, 애프터서비스 등 제품과 소비자를 연결하는 요소들이 총체적으로 결합된 개념적인 변수

분석자료의 적합성 변수 한두 개의 변수에서 한 요인이 도출되는 현상은 자료의 압축이 목적인 요인분석의 효과가 적으므로 5개 이상 다수의 변수에서 한 요인이 도출되는 것이 바람직함 표본 일반적으로 표본의 수는 변수의 수의 최소 5배 이상의 기준을 적용하고 있으나 이 비율은 높을수록 좋음 표본은 또한 분석대상의 변수와 관련해서 동질적이어야 함

상관관계 검토 바트렛의 구형성 검정 KMO표본적합성

바트렛의 구형성 검정 바트렛(Bartlett)이 제시한 구형성 검정(Bartlett test of sphericity) 변수가 다변량정규분포를 이룬다는 가정하에 변수간의 상관계수행렬이 항등행렬(identity matrix)인지를 검정하는 기법 상관계수 행렬을 검토하여 0.3이상이 되는 상관계수의 비율이 높지 않으면 요인분석의 사용을 재검토해야 함

KMO표본적합성 Kaiser-Meyer-Olkin이 제시한 표본적합성 분석대상의 변수가 요인분석에 적합하려면 변수간의 상관계수는 크고, 편상관계수는 작아야 함 KMO값이 1에 가까울수록 요인분석에 적합한 변수들로 구성되어 있다고 할 수 있으며, 0에 가까울수록 부적합하다고 할 수 있다. 요인분석의 효과가 나타나려면 이 값이 최소한 0.6이상은 되어야 한다.

요인분석 모형 변수는 다른 변수와 공유하고 있는 공통요인과 그 변수만이 가지고 있는 고유요인으로 구성되어 있다 Uj는 그 변수만이 가진 고유요인이므로 다른 변수의 고유요인뿐만 아니라 다른 변수와 공유하고 있는 공통요인과도 상관관계가 없어야 함

요인의 도출 요인도출 방법 주성분분석(principal component analysis) 공통요인분석(common factor analysis) 고유값(latent root 또는eigenvalue) 요인이 전체 변수의 총 분산을 설명하는 양 cf) 공통성(communality) 공통요인에 의해 설명된 분산의 정도 요인은 고유값의 크기 순서로 도출 고유값이 가장 큰 요인이 첫 번째로 도출되고, 두 번째 요인으로는 먼저 도출된 요인이 설명하지 못한 분산을 가장 많이 설명하는 요인이 도출되고, 같은 방식으로 차례로 요인이 도출됨.

요인수의 결정 고유값 기준 설명된 분산비율 기준 스크리 도표

고유값 기준 고유값이 1보다 큰 요인만을 선택하는 것 요인분석에서는 모든 변수를 표준화하여 사용하고 있으므로 각 변수의 분산은 1이 된다. 고유값이 1보다 작으면 변수의 분산을 설명하는 데 그 요인의 공헌도가 변수 하나보다 못하다는 것이 이 기준의 논리

설명된 분산비율 기준 선택된 요인들이 설명하는 분산 비율의 합이 일정한 수준을 초과해야 한다는 것으로, 일반적으로 사회과학에서는 0.6을 적용 스크리 도표(scree plot 또는 산비탈그림) 요인의 수를 횡축으로, 고유값을 종축으로 한 꺾은선그래프 경사의 변화가 거의 없는 점이 선택할 수 있는 최대한의 요인의 수

요인행렬 요인패턴행렬(factor pattern matrix) 요인구조행렬(factor structure matrix)

요인패턴행렬 요인적재값(factor loading) 요인적재값은 원래의 변수를 종속변수로, 도출된 요인을 독립변수로 하여 회귀분석한 베타계수

요인구조행렬(factor structure matrix) 요인과 변수 간의 상관계수로 구성된 행렬 도출된 요인간에 상관관계가 없으면 요인패턴행렬과 요인구조행렬은 동일 요인분석에서는 먼저 상관관계가 없는 요인을 도출하므로 요인을 회전하기 전의 두 행렬은 동일 요인의 해석을 용이하게 하기 위하여 요인을 회전(요인의 회전에 대해서는 뒤에 설명함)할 때 직교회전(orthogonal rotation)하는 경우에도 요인간에 상관관계가 없으므로 두 행렬은 동일하다. 그러나 상관관계가 있을 것으로 가정하여 사각회전(oblique rotation)을 하는 경우 두 행렬의 원소는 다르다. 두 행렬이 동일한 경우 분석결과에는 요인행렬(factor matrix)이라는 이름으로 하나만 제시

변수의 공통성과 요인적재값간의 관계 변수j의 공통성은 공통요인에 의해 설명된 분산의 정도 cf) 변수j의 고유성(uniqueness) : 1 - 공통성 고유값과 요인적재값간의 관계

상관계수와 요인적재값  도출된 요인이 변수를 설명하는데 적합하다면 추정한 상관계수가 관측된 상관계수와 비슷해야 할 것임. 차이가 많이 난다면 요인의 적합도가 낮다는 의미.

요인회전의 목적 요인의 구조를 단순하게 하기 위함 요인의 구조를 단순하게 한다는 것은 변수가 하나의 요인에 높게 적재되 도록 한다는 의미.

요인을 회전하면 요인의 고유값은 변한다. 그러나 변수의 공통성은 변하지 않는다. 요인회전 직교회전(orthogonal rotation) 사각회전(oblique rotation)

요인점수