요인분석
목적 질문 문항들, 변수들 혹은 측정 대상들간의 상관관계를 고려해서 이들 측정치 사이에 공유하는 구조를 파악해 내는 기법을 말함. 자료 및 변수의 감축 기법으로 변수가 독립변수/ 종속변수인가를 구분하지 않는다. 요인분석의 구체적 목적 자료 요약 불필요한 자료 제거 변수의 구조 파악 측정도구의 타당성을 평가한다.
1. 요인분석의 활용 요인분석은 새로운 모델의 개발과 기존의 모델에 대한 적합성을 판정하고, 새로운 측정치를 얻기 위한 목적에서 사용된다. 다변량 통계기법 중의 하나가 요인분석이다.
2. 요인분석의 단계 1단계; 연구문제의 설정-변수의 형태가 무엇이며, 연구에 포함된 변수의 수는 몇 개인지 그리고 표본의 수는 충분한 지를 결정하는 단계 2단계; 연구의 목적에 따르는 R-type 또는 Q-TYPE을 이용한 상관관계 행렬의 계산. 3단계: 요인을 추출하기 위한 분석모델을 결정하는 단계 4단계: 요인회전 방식을 결정하는 단계 5단계: 최초의 요인의 추출단계 6단계: 추출요인에 대한 해석단계 7단계 추후분석에 이용할 수 있는 요인점수의 계산과 이를 저장하는 단계
3. 상관관계 행렬의 검토 요인분석 수행을 위해 측정변수들 간의 상관관계를 고려, 계산된 상관관계 매트릭스를 검토하여야 함. 요인분석의 목적은 측정변수들 간의 동질적이거나 유사한 진단으로 묶는 것이므로 어느 한 특정변수는 유사한 다른 변수와 높은 상관관계를 가져야 함. 변수들간의 상관관계가 높다는 것은 하나의 요인으로 나타난 다는 것을 의미하고, 측정변수들간의 상관관계가 낮다는 것은 하나의 요인으로 묶이지 않는다는 것을 의미한다.
4. 요인분석 모델 사용자들이 요인이해를 얻기 위해 이용할 수 있는 요인분석 모델은 주성분 요인분석과 공통 요인분석이 있다. 이 두가지 방법은 폭 넓게 사용되지만 (1)요인분석을 사용하는 사용자의 목적 (2)측정변수의 분산에 대한 사전지식의 정도에 따라 적절한 벙법을 선택할 수 있다. 측정변수의 분산은 공통분산, 고유분산, 오차분산으로 구분되어있다. 전체분산중 분석에 이용하는 분산의 형태에 따라 요인분산 모델이 달라진다. 주성분 요인분석은 변수가 가지는 공통분산, 고유분산, 오차분산을 모두 분석에 포함시킨 총분산에 기초하여 요인을 추출하는 방법이다. 따라서 대각선의 분산은 항상 “1”이됨 최소한의 요인의 집합을 이용하며 예측하거나 고유분산과 오차분산이 적을 때 사용 주성분 요인분석 공통 요인분석은 측정변수가 가지는 고유분산과 오차분산을 제외한 다른 변수들과 공유되어 있는 공통분산에 기초하여 요인을 추출하는 방식 변수들의 집합에 내재되어 있는 고유분산 또는 오차분산에 대한 사전지식이 없는 경우 사용 한다. 공통 요인분석
5. 요인회전방식 요인분석의 중요한 개념은 요인의 회전이다. 주성분요인 또는 공통요인에 의해 얻어진 최초 요인행렬은 측정변수들의 분산을 어느 정도 설명할 수 있으나, 대부분 각 변수들과 요인들간의 관계가 명확하게 나타나지 않는다. 회전되지 않는 요인은 단순히 자료를 감축시키는 과정으로 요인들의 중요성에 따라 요인들을 추출하기 때문에 변수의 형태에 따른 의미있는 정보를 얻기 어렵다. 첫번째 추출되는 요인은 거의 모든 변수에 대해 유의적인 요인적재량을 보인다. 두번째 요인과 나머지 요인은 설명된 분산을 제외한 나머지 분산을 이용하여 추출되지 때문에 해석하기가 어렵다. 요인회전의 궁극적인 목적은 요인을 해석하기 쉽고 의미있는 요인패턴을 갖도록 분산을 재분배시키는 과정이다. 요인을 회전시키는 방법에는 직각회전방식과 비직각 회전방식이 있다.
(1) 직각회전(Orthogonal Rotation) 요인들간의 상관관계가 없도록 요인을 회전시키는 방법으로 각 요인간의 각도를 90°로 유지하면서 회전시킨다. 이 방식은 변수들간의 독립성을 유지시키면서 회전시킨다. 여기에 Varimax 방식 Quartimax방식이 있다. 요인행렬의 열을 단순화시키는 방식으로 대부분 이 방법을 사용함 요인행렬의 각 열에 1 또는 0에 가가운 요인적재량을 보인다. 변수와 요인간의 관계가 명확해지고 해석하기에 용이하기 때문에 단순한 요인구조를 산출할때 사용한다. Varimax 방식 요인행렬의 행을 단순화시키는 방식 한 변수가 어떤 요인에 대해 높은 요인적재량을 가지면 다른 요인에 대해서는 낮은 요인적재량을 갖게한다. 단순한 요인구조를 얻는데는 문제가 있는 반면, 많은 변수에 대해 문항간 높은 적재량을 갖는 변수들의 일반적 요인을 만들어 낼 수 있다. Quartimax방식
회전 전의 요인 요인의 회전
(2) 비직각 회전 이 방식은 요인들간의 상관관계가 있을 경우에 사용함 요인간의 각도를 90°이외의 사각을 유지하면서 변수를 회전시키는 방법임 요인간의 상관관계를 인정하기 때문에 다소 설득력이 떨어지지만 경험적인 근거를 가지고 요인구조를 만들어 낼 수 있기 때문에 사회현상 분석에 많이 사용할 수 있다.
6. 추출 요인수의 결정 최초 요인행렬의 결과를 토대로 몇 개의 요인을 추출할 것인가를 결정 하지만 분석에 사용될 요인의 수를 결정하는 절대적 기준이 없다. 또한 분석의 목적, 분석의 방법 등에 따라 요인의 수를 결정할 수 있다. 최종 요인의 수를 결정하는 방식에는 고유값의 절대치, 스크리테스트, 최대분산퍼센트 등이 이용된다.
6. 추출 요인수의 결정 요인을 설명하고, 변량의 크기를 나타내는 고유값을, 변수의 수를 선택하는 기준으로 이용하는 방법이다. 이 방법을 이용하는 경우 보통 고유값이 1 이상이 되어야 한다. 고유값의 절대치 가장 중요한 요인에서부터 고유값이 하락하다가 급격한 하락에서 완만한 하락으로 추세가 바뀌는 지점에서 요인의 수를 결정하는 방식 스크리 테스트 연구자가 필요로 하는 분산의 부분만큼 설명하는 요인의 수를 추출하는 방식이며, 보통75~85%의 분산 이상을 설명할 수 있도록 요인의 수를 결정한다. 최대 분산 퍼센트
7. 요인분석의 경로 탑메뉴 분석 데이터 축소 요인분석(F)
8. 요인분석의 실행 기술통계(D)옵션은 다음과 같다. 요인분석 대화상자에서 분석에 필요한 기술통계량(D), 요인추출(E), 요인회전(T), 요인점수(S),옵션(O)등을 지정한다. 의학적 이상 소견이 없는 신체 건강한 65세 이상 여자 노인의 체력 요인을 분석하기 위하여 10개 항목을 측정하였다. 10개의 변수를 화살표 화살표를 이용하여 변수(V)로 이동 기술통계(D)옵션은 다음과 같다.
기술통계 옵션 내용 통계량 단일변량 기술통계 표본 개수, 평균, 표준편차를 출력 상관랭렬 초기 해법 상관계수 초기 커뮤넬리티, 고유치를 출력 초기 해법 상관관계 행렬의 계수에 대한 유의수준을 출력 유의수준(S) 요인에 의해 추정된 상관관계 행렬을 출력 재연된 상관행렬® 상관계수 행렬의 행렬식의 값을 출력 행렬식(D) Anti-image covariance행렬과 anti-image correlation 역-이미지(A) 전체 자료와 개별자료의 적합도 출력, Barrlett의 단위 행렬 검사결과를 출력 KMO와 Bartlett의 구형성 검정(k) 상관랭렬 변수들간의 상관관계 행렬을 출력 상관계수 역상관 관계 행렬과 공분산 행렬을 출력 역 모형
요인추출 방식은 주성분 요인방식으로 지정하고 요인분석에 이용될 상관관계 행렬과 공분산 행렬을 지정한다. 요인추출(E)의 옵션은 다음과 같다. 요인추출 방식은 주성분 요인방식으로 지정하고 요인분석에 이용될 상관관계 행렬과 공분산 행렬을 지정한다. 출력형식은 비회전 요인해법과 스크리도표를 지정하고 계속 버튼을 누른다.
방법(M) 요인추출의 옵션 내용 주성분 요인분석 변수들의 전체분산을 이용해 요인을 추출하는 방식 비가중 최소 제곱법 표본으로부터 관찰된 상관행렬과 요인행렬 형태로부터 계산된 상관행렬간의 차의 제곱의 합이 최소가 된 요인추출법 비가중 최소 제곱법 일반화된 최소 제곱법 최우추정 요인 추출법 최대우도 주축 요인추출법 주축 요인 추출 변수를 분석하여 얻은 결론을 모집단에 일반화시킬 수 있는 추정치를 찾을 때 유용한 방법 알파요인 추출 이미지 요인 추출법
추출 분석 상관행렬® 변수들간의 상관관계 행렬 공분산 행렬(V) 변수들간의 공분산 행렬 고유값 기준 지정한 고유치 이상의 값을 가진 요인만을 추출 고유값 기준 요인수를 사전에 지정하여 지정된 요인수 만큼 출력 요인의 수(N)
출력 SUBJECT 요인회전(T)의 옵션은 다음과 같다. 요인의 회전방식은 Varimax방식과 회전 후 요인해법®를 지정하고 계속 버튼을 누른다. 회전하지 않는 요인 해법 출력 비회전 요인 해법(F) 요인의 수를 그래프로 표시 스크리 도표 최대 반복 회수를 지정 수렴에 대한 최대 반복 계산수 25
요인회전의 옵션 내용 출력 회전 해법(R) 회전된 요인의 출력 적재값 도표(L) 요인별로 적재되는 적재치를 출력 추출된 요인을 회전시키지 않음-주성분 분석인 경우 지정 지정않음(n) 각 요인이 서로 독립성을 유지하도록 하는 직각회전 방식, 각 열의 요인적재량을 제곱한 값의 분산이 최대화시켜 각 요인을 설명(기본으로 지정)-요인분석인 경우 지정 베리멕스(v) 직각회전방식, 각 행의 요인적재량이 높은 요인의 수를 최소화시키는 방법 쿼티멕스(Q) 직각회전 방식이며 베리멕스와 쿼티멕스의 혼합형 이쿼멕스(P) 사각회전 방식, 변수들간의 상관관계를 인정하는 방식 직접 오블리민(O) 사각회전/ 먼저 직교회전을 시킨 다음 사각회전을 시키는 방식 프로멕스(P) 출력 회전된 요인의 출력 회전 해법(R) 요인별로 적재되는 적재치를 출력 적재값 도표(L) 최종 요인해를 찾기 위해 요인회전 반복 회수를 지정 수렴에 대한 최대반복 계산 수(X)
여기에서는 회귀분석®을 지정하고 계속 버튼을 누른다. 추가분석에 이용할 변수를 만들 요인점수를 지정한다. 요인점수(S)의 옵션은 다음과 같다
요인점수의 옵션 내용 변수로 저장(S) 회귀분석® 동분산과 평균을 가지며 개개의 요인값과 추정된 요인값 간의 차이를 제곱한 값이 최소가 되도록 한다. 회귀분석® 요인들의 제곱한 값의 합이 최소가 되도록 한다. Bartlett(B) 무상관관계를 검정하기 위하여 Barrlett 값을 수정한다. Anderson-Rubin(A) 요인계수 행렬 출력 요인점수 계수행렬 출력(D)
요인분석 옵션(o)은 다음과 같다. 대화상자처럼 옵션을 지정하고 계속 버튼을 누른다
옵션 내용 결측값 계수출력형식 크기순 정렬(S) 크기순으로 정렬 출력 다음값보다 작은 절대값 출력않음(U) 모든 변수에 대해 유효한 사례만을 분석에 사용 목록별 결측값 각 변슈의 대응쌍에 유효한 사례만을 분석에 사용 대응별 결측값 제외(P) 결측치가 있는 변수는 그 문항의 평균으로 대체 평균으로 바꾸기® 크기순으로 정렬 출력 크기순 정렬(S) 제시된 기준보다 작은 요인 적재치는 제외 다음값보다 작은 절대값 출력않음(U)
9. 요인분석결과해설 요인분석 결과 해설1. 요인분석에 사용된 문항들의 평균과 표준편차 그리고 표본의 개수가 나타나 있다. 예를 들면 65세 여성 노인의 배근력은 평균28.3856kg,표준편차 16.42200 그리고 사례수 90명으로 나타나있다.
a. 행렬식=3.115E-0.2 요인분석에 투입된 변수들 간의 상관관계 행렬이다. 근력을 측정하고 았는 변수인 왼쪽 악력과 오른쪽 악력 및 배근력은 변수간의 상관관계는 높게 나타나 있고, 유의수준(p<0.001)도 모두 유의한 것으로 나타나고 있다. 요인분석에서 상관관계 행렬을 분석할 때 유의할 점은 측정하고 있는 개념과 관련된 변수들 끼리 높은 상관관계가 있어야 하며,관련되지 않은 변수들 끼리는 상관관계가 낮거나 없어야 한다. 만약 모든 변수에서 상관관계가 높게 나타났다면 측정하고자 하는 개념의 조작적 정의가 잘못됐거나 측정오류가 생긴것으로 판단해야 한다.
요인분석 결과 해설3. Kaiser-Meyer-Olkin의 KMO 통계량은 전체 자료와 개별 자료의 표본 적합도를 평가한다. 일반적으로 표본 적합도의 적용 기본은 0.6이상이면 요인분석에 적합한 표본으로 판단할 수 있다. Bartltt의 단위행렬 점검은 요인분석에 이용될 변수들 의 상관행렬이 단위 행렬인지 아닌지를 평가한다. 즉 변수들이 서로 독립적인지 아닌지를 점검한다. 단위행렬=상호독립적이며 변수간의 상관이 없다.
요인분석 결과 해설4. 공통성은 공통분산, 공통성 또는 공통요인분산이라고도 하며 공통성은 요인들로 설명되어지는 각 변수들의 백분율로 나타낸 것으로 공통분산을 관찰함으로서 요인들에 의해 설명되는 각 변수의 분산의 양을 알 수 있다. 공통성은 각 요인의 적재량의 값을 제곱하여 더한 값이다. 공통성이0.4이하이면 평가분석에서 제외
요인분석결과 해설5 추출된 3 요인의 고유치는 각각 제1요인 3.890, 제2요인 1.196, 제3요인 1.028로 요인 고유치가 1이상인 요인만이 추출되었다. 근력을 측정하고 있는 제 1요인은 38.897%, 유연성을 측정하고 있는 제 2요인은 11.963%, 민첩성을 측정하고 있는 제3요인은 10.278%를 설명함으로써 전체 61.138%를 설명하고 있다.
요인분석 결과 해석6. 분석결과 각 변수들은 3개의 요인으로 추출되었다. 제1요인에는 왼쪽,오른쪽(악력), 배근력, 체후굴, 하지업, 써전트점프, 한발서기가 적재되었고, 제2요인에는 앉아 체전굴과 전신반응이 적재되었다. 또한 제3요인에서는 기립시간이 적재되는 것으로 나타났다.
요인분석 결과 해설7 요인분석의 최종결과분석부분이다. 측정된 각 요인들의 특성을 효과적으로 이해하기 위해서 베리멕스 회전을 시킨 후의 요인행렬을 보면 회전전과 약간 다른점을 볼 수 있다. 요인회전의 초기와는 달리 각 변수들은 측정변수에는 높게 적재되고 나머지 변수에는 낮게 적재된다. 따라서 회전후의 적재량은 바탕으로 변수를 집단화하여 요인을 해석하게 된다.
요인분석 결과 해설8 스크리 테스트는 각 요인의 고유치를 Y-축에, 요인의 개수를 X-축으로 표시하여 요인의 수가 증가할 수 있도록 고유치는 줄어드는 형태로 보여주며 초기에는 급격히 감소하다가 점점 감소폭이 줄어들게 된다. 스크리 검정을 이용하여 요인의 수를 결정 할 수 있다. 분석결과를 보면 고유치가 3번째 요인까지는 급격하게 감소하다가 4번째 요인에서 완만하게 감소하고 있다. 추출된 요인이 3요인이라는 것을 알 수 있다.
질문하세요~ 그동안 수고~ㅋㅋ