Presentation is loading. Please wait.

Presentation is loading. Please wait.

데이터 탐색 및 분석 요령 백동열.

Similar presentations


Presentation on theme: "데이터 탐색 및 분석 요령 백동열."— Presentation transcript:

1 데이터 탐색 및 분석 요령 백동열

2 AMOS 중심분석단계 <분석 7단계> 1단계 :모델개념화 및 경로도 작성 2단계 : 자료수집 및 자료점검
3단계 : 모델설정 4단계 : 모델식별 5단계 : 모델추정 6단계 : 모델적합성 및 해석 7단계 : 모델수정

3 1단계 :모델개념화 및 경로도 작성 변수 1. 독립변수 2. 매개변수(설명력 증가) 3. 종속변수
4. 조절변수(집단차이 분석) 가설 1. 기술형가설 : 단일변수 (올해 경제성장률은 4.5%넘을 것이다.) 2. 관계형가설 : 두변수사이의 관계 1) 상관가설 : 자동차보유율이 높아지면 사망률이니 높아질것이다. 2) 인과가설 : 자동차보유율은 사망률에 영향을 미칠것이다 (1) 방향성가설 : 자동차보유율은 사망률에 정의 영향을 미칠것이다. (2) 무방향성가설 : 자동차보유율이 사망률에 (+ 혹은 -)영향을 미칠것이다. 상관관계 재규모델

4 1단계-1 데이터 탐색 SPSS 1. 신뢰성(내적일관성) : 분석> 척도화분석(신뢰성 크론바알파)
2. 타당성 분석(탐색적) : 분석 > 데이터축소(요인분석) AMOS 1. 다중상관분석: 신뢰도 분석(0.5이상)0.4 (표준화 추정 (SMC) ) 2. 상관행렬 (SAMPLE MOMENT)

5 2단계 : 자료수집 및 자료점검 자료수집 1. 표본크기 : 모수가 20개이면 표본수 5배수 (100-200)
1). 관측변수 13개인 경우 = 15*(관측변수*(관측변수+1)/10 데이터의 유형 특징 1. 다변량 정규성 추정 2. 최대우도 추정 3. 표본의 크기가 크면 적합도는 작아짐.(적당수준이상이 되면 약 ) 결측치 이상치 및 정규성

6 2단계-1 사전점검 자료점검 1. 자료의 가정: 정규성충족, 등분산성, 선형성
1. 원자료(AMOS에서는 무응답, 결측치가 있는 경우 복잡성 및 에러) 2. 공분산행렬(비표준화) : 모수적합성, 모수추정 가능, 해석이 어려움(단위의 차이) 3. 상관행렬(공분산을 표준화) : 잘못된 모형, 모수추정 가능 자료점검 1. 자료의 가정: 정규성충족, 등분산성, 선형성 2. 다중공성선 : 독립변수들의 상관관계가 너무 높아 발생 0.8~0.9 3. 이상점 점검 : 특별히 다른 분포를 보이는 자료(데이터 탐색에서 확인)

7 2단계-2 데이터 변환 <상관행렬전환> 1. 새로만들기 명령문(syntax)
Corr variables=변수명(예: x1 x2)/ Missing=listwise/ Matrix out(*). <공분산행렬전환> 2. 새로만들기 명령문(syntax) Mconvert/ Matrix =in(*) out(*).

8 2단계-3 결측치 종류와 처리방법 오류처리 결측치처리 1. 결측치 분석 : 분석 > 결측값 분석(평균.제거)
빈도분석을 통하여 기본검사(오류입력) 편집에서 찾기를 하여 수정 결측치처리 1. 결측치 분석 : 분석 > 결측값 분석(평균.제거) EM. 회귀로 분석 2. 결측치 변환 : 변환 > 결측치 바꾸기(계열평균법)

9 2단계-4 데이터 탐색 (SPSS) (분석 기술통계 데이터탐색 통계량, 도표에서 지정) 1. 이상성(줄기와잎 그림, 이상값)
(분석 기술통계 데이터탐색 통계량, 도표에서 지정) 1. 이상성(줄기와잎 그림, 이상값) 상자도표를 이용하여 범위 밖의 이상점이(0, *)표시된 숫자 2. 정규성(히스토그램, 검정과 정규성 도표) - 리커트 척도의 특성상 정규성을 통계적으로 찾기가 어려움 (0.05이상) - 히스토그램과 Q-Q도표를 이용하여 너무 왜도가 심하지 않은 경우 정규성 만족으로 보고 사용함

10 2단계-5 데이터 탐색 (AMOS) - ASSESSMENT OF NORMALLTY를 확인하여 왜도(CR1.96)와
분석과정 : - 보기 > 분석속성 > 아웃풋 > TESTS FOR NORMALLTY AND OUTLIERS을 선택 2. 결과보기 : output - ASSESSMENT OF NORMALLTY를 확인하여 왜도(CR1.96)와 첨도(CR1.96)를 검토하여 이상이되면 정규성을 벗어난것으로 판단 - OBSERVATIONS FARTHEST 에서 먼거리를 기준으로 판단 하 며 P값이 0.05이상을 기준으로 판단함

11 3단계 : 모델설정 상관관계 자유모수 : 모델에서 추정해야하는 모수 고정모수(0.1) : 제약모수 재규모델

12 4단계 : 모델식별 자유모수가 정상적으로 값을 추정할수 있는 가를 판단하는 것(예: X + Y = 20 의 경우 값은 무수히 많다.) 이중 가장 기대값에 가까운값을 찾는 것 정보의 수= N(N+1)/2 추정해야 할 모수가 많은 경우 제약모수를 두어야 한다. 자유도 : 알려진정보 - 추정해야할 모수 1. 과소식별모델 : 추정모수가 많은 경우 (자유도-) 모델이 식별이 되지 않음 2. 과대식별모델 : 알려진 정보가 추정모수보다 많은 경우(자유도+) 모델식별이 됨 3. 자유도가 0인 모델 =적정모델 또는 포화모델이라 함

13 4단계-1 표준오차가 2.5이상인 경우 삭제 검토 > 추정계수 가운데 일부를 고정모수로 전환하는 등 더 많은 제약을 가함
정보행렬이 역행렬을 계산하지 못하는 경우 > 최소한의 계수를 가진 이론모델로 변경 음오차(-) 분산과 부적한 모수 추정치가 존재하는 경우 > 잠재변수의 측정오차 분산을 고정 추정계수 사이에 매우높은 상관관계(0.9이상)를 보이는 경우 > 문제변수 제거(PAIRWISE확인)

14 5단계 : 모델추정 모델에 포함한 자유모수와 제약모수의 값을 추정하는 것
예측공분산행렬과 관측공분산행렬의 차이(잔차)가 최소화 되도록 추정하는 것(기본50회 NUMERICAL에서 선택) 분석속성에서 추정에서 선택 하여 사용 ML=최대우도법(정규성) - 확률밀도가 가장 크도록 추정 - 표본이 큰 경우 사용 - 일반적으로 사용하는 방법 ULS=비가중최소자승법(비정규성) - 관측변수의 척도에 따라 가중치가 달라짐 - 통계적 검증에는 문제가 있음 GLS=일반최소자승법(정규성) - 비편향적,효율적, 일관성이 방법 - 척도불변의 특징

15 6단계 : 모델적합성 및 해석 목차 속성 지수 기준 절대적합지수 이론모델과 측정모델 모두에서 적합평가 카이스퀘어 GFI RMR
RMSEA ECVI 작아야 함 0.9이상 0.05이하 증분적합지수 대안모델과 다른 대안모델의 적합도 비교 TLI,NNFI NFI RNI, BFI,CFI IFI, RFI 간명적합지수 추정계수에 의하여 달성된 적합도의 양을 결정할 목적으로 각기 다른 추정계수와 비교 측정치를 조정 AGFI PNFI PGFI Normed 카이 CAIC 커야함 2.0이하 작아야함

16

17 7단계 : 모델수정 조건 모델을 개선하기 위하여 모델을 변화시키는 것(추정모수를 제거하거나 추가)
경로를 추가하거나 제거하는 것 * 이론을 바탕으로 이루어져야 함 조건 1. 모수 수정지수 4.0 이하 2. 모든 T-VALUE(CR값) 2.0 이상 3. 모든 잔차 행렬 원소값이 작아야 함 4. 모든 다중제곱상관이 커야 함(R2) 5. 모든 부적해(위반추정치)의 값이 없어야 함 6. 같은 변수 끼리 상관관계 판단(오차변수와 오차변수)


Download ppt "데이터 탐색 및 분석 요령 백동열."

Similar presentations


Ads by Google