김 진 흠 jinhkim@suwon.ac.kr 구조방정식모형 구조방정식모형 2011-06-23 김 진 흠 jinhkim@suwon.ac.kr
Outline Terminology Confirmatory factor analysis Path analysis Structural equation models Real example Practice with R Floor discussion 구조방정식모형 2011-06-23
구조방정식의 표현방법 LISREL(Linear Structural RELationship): Jöreskog & Sörbom (1997) COSAN(COvariance Structure ANalysis): McDonald (1980) RAM(Reticular Action Model): McArdle & McDonald (1984) EQS(EQuationS): Bentler & Weeks (1980) 구조방정식모형 2011-06-23
Explanatory approach vs. Confirmatory approach 탐색적 방법: 사전지식 없이 자료만으로 의미 있 는 정보를 끄집어 내는 방법 확증적 방법: 기존 연구 결과나 경험을 바탕으로 가설을 세우고 자료를 통해 그 기설을 확증하는 방법 Remarks 두 방법이 반복적으로 구조방정식 연구의 흐름 초기 탐색적 연구 점차 확증적 연구로, 잠재변수 간에 인과관계를 도입 구조방정식모형 2011-06-23
측정변수 vs. 잠재변수 측정변수(관찰변수): 직접 측정이나 관찰이 가능한 변수 Eg, 실어증의 정도, 무력증의 정도, 교육년수, 사회경제지수 등 Manifest variable, indicator 등으로도 부름 잠재변수(latent variable): 직접 측정이나 관찰이 불가능한 변 수, 측정변수 저변에 깔려있는 변수 Eg, 소외감, 사회경제적 상태 등 Underlying variable or common factor, construct 등으로도 부름 Remarks 관찰변수는 잠재변수의 내용이 외부로 표출된 것이고, 측정변수들을 통해 잠재변수를 비춰봄 구조방정식모형 2011-06-23
Typical Example: 사회적 소외감 구조방정식모형 2011-06-23
Exogenous variable vs. Endogenous variable 외생(외인성,外因性)변수: 다른 변수의 원인이 되는 변수 Eg, 사회경제적 상태 내생(內生)변수: 외생변수나 내생변수의 영향을 받는 변수 Eg, 소외감(‘67), 소외감(‘71) 오차변수: 모형에 포함된 인과관계로 설명되지 못하는 부분 외생변수의 일종 Eg, 그외: 내생변수나 외생변수의 측정(관찰)오차 구조방정식모형 2011-06-23
구조방정식 모형의 형태I 구조방정식모형 2011-06-23
구조방정식 모형의 형태II 구조방정식모형 2011-06-23
구조방정식 모형의 형태III 구조방정식모형 2011-06-23
확증적 인자모형
확증적 인자모형 잠재변수들 간 의 상관계수만 고려, 인과관계 는 고려하지 않음 모형: p개 측정변수, m개 인자 가정 구조방정식 모형의 일종 모형: p개 측정변수, m개 인자 가정 구조방정식모형 2011-06-23
공분산 행렬 공분산 행렬의 관계식 Remarks: (탐색적)직교인자모형 모수 는 에 포함된 모수를 통칭함 모수 는 에 포함된 모수를 통칭함 Remarks: (탐색적)직교인자모형 (공통)인자들이 서로 독립, 표준화되었음, 즉 오차(특수인자)들이 서로 독립, 즉 대각행렬 구조방정식모형 2011-06-23
적용 예: Refer to slide #8 모형: 6 indicators & 3 constructs 공분산 행렬 Objective: To test our model is appropriate using a sample data 구조방정식모형 2011-06-23
Another representation: Either approach yields exactly the same model fit 구조방정식모형 2011-06-23
Evaluating model fit Hypothesis: vs. Use LR(likelihood ratio) chi-square test LR chi-square =2{log max L( )-log max L( )} 상수 는 자유모수(free parameter)의 총 개수임 If large, reject our model is appropriate 구조방정식모형 2011-06-23
Likelihood Data: drawn from a p-variate normal distribution with mean 0 and covariance matrix Likelihood: Log likelihood: Final form: 구조방정식모형 2011-06-23
Maximum likelihood estimates(MLE): a illustration Coin tossing with the probability, p, of obtaining a head Four times outcome: H, H, H, T Outcomes: independent, No change of p Likelihood(joint probability) Likelihood equation 구조방정식모형 2011-06-23
Remarks on chi-square test 자료의 크기에 민감! 대표본이면 작은 차이에도 귀무가설을 기각! 따라서 연구자에게는 불리! 다른 길을 모색? 검증 가능한 다른 가설: How? 귀무가설 하에서 max L( )을 계산 두 LR chi-square 통계량의 차이가 자유도가 3인 카이 제곱 분포라는 사실을 이용 구조방정식모형 2011-06-23
Heuristic measures of model fit Based on the residual matrix, Goodness-of-fit index(GFI) GFI= Adjusted GFI(AGFI) AGFI= The less parsimonious the model, the larger the tuning term and the smaller the value of AGFI relative to GFI 얼마나 커야? 보통 0.8 구조방정식모형 2011-06-23
적합도 지표(계속) RMSR(root mean square residual) Other fit indices RMSR= Scale-dependent and no upper bound, so interpreted relative to the RMSR of other competing models Other fit indices NCP(rescaled non-centrality parameter): unbounded MDN(McDonald’s transformation of the non-centrality parameters): bounded TLI(Tucker-Lewiss index). RNI(relative non-centrality index): relative fit indices to the null model 구조방정식모형 2011-06-23
Modification index 모형 적합이 좋지 않을 때 자유모수를 추가하여 모형 에 대한 제약을 완화시킴 고정모수를 자유모수로 바꿨을 때 카이제곱 통계량의 값이 얼마나 감소하는지를 표시 과 비교 This procedure seems to work well in practice, BUT is recommended for use only when relaxing a parameter makes substantive sense and when the values of this parameter can be clearly interpreted 구조방정식모형 2011-06-23
모수 추정 ML estimates Statistical significance: Use t-statistic Are the indicators good measures of the construct? Squared multiple correlations Total variance of any indicator=Variance (common with the latent construct)+variance due to error SMC=(Variance common with the latent construct)/ (Total variance) Rule of thumb: at least 50% Total coefficient of determination: overall measure, 구조방정식모형 2011-06-23
Assumption Multivariate normal distribution Use kurtosis, skewness Biased chi-square statistic and standard error of the parameter estimates, BUT parameter estimates are not affected Use kurtosis, skewness Alternative estimation method: Generalized least squares,… 구조방정식모형 2011-06-23
적용 예 측정변수 X1(수학), X2(물리), X3(화학), X4(영어), X5(역사), X6( 불어) 두 가지 모형 1-인자 모형 2-인자 모형 w/and w/o correlated constructs 공분산 행렬 구조방정식모형 2011-06-23
sem package sem fits general structure equation models (with both observed and unobserved variables) by the method of maximum likelihood, assuming mutinormal errors Usage: sem(ram,S,N,,….) ram: RAM specification, which is a simple encoding of the path diagram for the model S: covariance matrix among observed variables N: number of observations on which the covariance matrix is based … 구조방정식모형 2011-06-23
3 columns of symbolic RAM matrix Arrow specification For a regression coefficient, A->B For a variance, A<->A For a covariance, A<->B Parameter name Name of the regression coefficient, variance, and covariance specified by the arrow NA: fixed parameter Same name: equality constraint Value Start value for a free parameter Value for a fixed parameter Use specify.model() function Usage: specify.model(file=“ “)` 구조방정식모형 2011-06-23
1-인자 모형 적합: R 프로그램 구조방정식모형 2011-06-23
1-인자 모형: 결과 구조방정식모형 2011-06-23
1-인자 모형 적합: another model specification 구조방정식모형 2011-06-23
표준화 계수 비교 구조방정식모형 2011-06-23
Two-factor model without correlated constructs 구조방정식모형 2011-06-23
Two-factor model with correlated constructs 구조방정식모형 2011-06-23
Two-factor model with correlated constructs (SAS version) 구조방정식모형 2011-06-23
Two-factor model with correlated constructs (SAS version) 구조방정식모형 2011-06-23
Practice I It’s your turn! 구조방정식모형 2011-06-23
경로분석모형
경로분석모형 잠재변수 없음 외생(관측)변수와 내생(관측)변수들 간의 구조 관계만을 분석하는 모형 구조방정식모형 2011-06-23
Structural models with observable constructs 2 endogenous variables & 1 exogenous variable Implied covariance matrix: 오차항이 구인들과 독립이라고 가정 구조방정식모형 2011-06-23
Saturated model Why? 6 parameters & 6 equations Perfect fit: df=0 But, does not imply that all the variance of an endogenous construct can be estimated by the exogenous and/or other endogenous constructs 구조방정식모형 2011-06-23
Total effect 내생변수 : 구인 의 영향을 직접적으로 받음 내생변수 : 구인 의 영향을 직접적으로 받음 내생변수 : 구인 의 직접적인 영향과 구인 를 통해 구인 의 간접적인 영향을 받음 첫 번째 항은 직접효과=0.4 두 번째 항은 간접효과=0.64 총효과=1.04 총효과에서 직접효과와 간접효과가 차지하는 비율은 각각 38.5%, 61.5% 구조방정식모형 2011-06-23
Model effects Three type of effects Structural model : an illustration Effects among the endogenous constructs Effects of the exogenous constructs on the endogenous constructs Effects of the constructs on the indicators Structural model : an illustration 구조방정식모형 2011-06-23
내생변수들 간 효과 직접효과: Effect of the column construct on the row construct : matrix of beta coefficients 간접효과: length or order 2, 3, 4, … 총효과: 구조방정식모형 2011-06-23
나머지 두 가지 효과 외생변수가 내생변수에 미치는 효과 외생(내생)변수가 indicator에 미치는 효과 직접효과: 간접효과: 총효과: 외생(내생)변수가 indicator에 미치는 효과 간접효과: 없음( ) 총효과: ( ) 구조방정식모형 2011-06-23
Implementation with R 구조방정식모형 2011-06-23
Partial results of SAS output 구조방정식모형 2010-06-29
구조방정식모형
구조방정식모형 Two parts 구조모형: 잠재구인들 간의 관계를 묘사 측정모형: 구인과 지표를 연결하는 모형 구조방정식모형 2011-06-23
Structural models with unobservable constructs 구조방정식모형 2011-06-23
RAM formulation in R Vector v: indicator variables, directly observed exogenous variables, latent exogenous and endogenous variables Vector u: directly observed and latent exogenous variables, measurement error variables, and structural-error variables Equation: Matrix A: regression coefficients matrix(factor loadings + structural parameters) Matrix P: covariances among the elements of u 구조방정식모형 2011-06-23
v=Av+u, P=Var(u) 구조방정식모형 2011-06-23
Implied covariance matrix: 구조모형 구조방정식모형 2011-06-23
Implied covariance matrix: 측정모형 구조방정식모형 2011-06-23
Implementation in R 구조방정식모형 2011-06-23
Results from R 구조방정식모형 2011-06-23
Results from SAS 구조방정식모형 2011-06-23
적용 예: 사회적 소외감 Wheaton et al. (1977)에 의해 연구된 사회적 소외 감에 대한 자료 미국 Illinois 주 농촌지역에 거주하는 사람을 대상 으로 1967년과 1971년 두 해 측정된 패널자료 측정변수로는 1967년과 1971년에 측정한 실어증 (anomia), 무기력증(powerlessness), 교육년수, 사 회경제적 지수(socio-economic index, SEI) 외생구인에 대한 측정변수와 내생 구인에 대한 측 정변수들의 오차가 서로 상관되어 있음 즉, anomia 67는 anomia 71과, powerlessness 67은 powerlessness 71과 서로 상관되어 있다고 가정 구조방정식모형 2011-06-23
LISREL 개념도 구조방정식모형 2011-06-23
Implementation with R 구조방정식모형 2011-06-23
Results from R 구조방정식모형 2011-06-23
Results from SAS 구조방정식모형 2011-06-23
Practice II It’s your turn! 구조방정식모형 2011-06-23
Summary Terminology Confirmatory factor analysis Path analysis Structural equation models Real example 구조방정식모형 2011-06-23
참고문헌 허명회 (1999). <사회과학을 위한 다변량자료분석>. 서울: 자유아카 데미. 강현철 등 (2005). <디변량자료분석 입문>. 서울: 자유아카데미. Fox, J. (2006). Structural equation modelling with the sem package in R. Structural Equation Modelling, 13, 465-486. Package sem (2010). http://socserv.socsci.mcmaster.ca/jfox. SAS Institute. (2004). SAS 9.1.3 help and documentation. Cary, NC: Author. Sharma, S. (1995). Applied Multivariate Techniques. New York: Wiley. Wheaton, B., Muthén, B., Alwin, D.F., & Summers, G.F. (1977). Assessing reliability and stability in panel models. In D. R. Heise (Ed.), Sociological methodology 1977 (pp. 84–136). San Francisco: Jossey-Bass. 구조방정식모형 2011-06-23
Thank you!