데이터 탐색 및 분석 요령 백동열.

Slides:



Advertisements
Similar presentations
구분날 짜일 정주요내용비 고 국내 교육 10/20(월)13:00-18:00 오리엔테이션 중국 저작권 비즈니스 이해 중국 문화 콘텐츠 시장 코엑스 무역아카데미 10/22(수)13:00-18:00 한중FTA와 쿤화콘텐츠 중국 비즈니스 인문학 특강 10/24(금)13:00-18:00장르별.
Advertisements

신도초 김민희.  어렸을 때 많이 불었던 비눗방울을 다시 불 어보자 너무 빨리 사라지는 게 아쉬워서, 무 슨 방법이 있으면 오랫동안 비눗방울이 남 아있을 수도 있을 것 같다는 생각이 좋아서 연구를 시작하였다.
물메초등학교 6 학년 홍민선. 1. 탐구 동기 2. 탐구 기간 및 탐구 목적 3. 가설설정 4. 이론적 배경 5. 탐구의 실제 6. 탐구 결과 7. 프로젝트 탐구를 마치며 8. 참고 문헌.
5 조 - 음악학과 이수영 5 조 - 음악학과 이수영 사회복지학과 김원미 사회복지학과 김원미 신민지 신민지 이정원
구급차 지원 업무 제휴서 ( 주 ) 전국 응급 환자 이송단 지역 센터장 이형규. 소 개 안녕하십니까. 전국 응급 환자 이송단 지역 센터장 이형규입니다. 저희 전국 응급 환자 이송단은 환자분을 최고의 의료장비와 의료진으로 안전하고 신속・정확하게 최상의 의료서비스를 제공하기.
최근 기상이변으로 겨울에 눈이 평균 이상으로 와 제설제 또한 많이 사용되어 가로수가 고사현상까지 보였다. 우리는 이 현상에 관심을 가지게 되어 이 주제로 창의적 산출물 대회를 준비하였다.
객혈의 원인과 치료 국립목포병원 흉부외과 김 대 연 2010 년 9 월 28 일. 국립목포병원 대기중의 공기를 호흡하여 기도를 통하여 기관지를 거쳐 폐포에 이르게 하여 모세혈관을 통하여 산소는 흡수하고 이산화 탄소는 배출하는 가스교환의 과정을 거치게 된다. 이러한 일련의.
3 월 월 례 회 / 개원 8 주년 행사 드리겠습니다 사랑을, 만들겠습니다 기적을. 개 회부 서 별 업 무 보 고부 서 별 업 무 보 고직 장 금 연 선 포폐 회국 민 의 례 차 례 신 규 직 원 소 개 개 원 기 념 행 사 원 장 인 사공 지 사 항.
지도교사 : 김은이 선생님 연현초등학교 5 학년 조인해 연현초등학교 5 학년 최지원 우리는 항상 먹기 싫은 쓴 약을 먹을 때 달콤한 주스 나 탄산음료와 함께 마시면 쓴 약을 쉽게 먹을 수 있 을 텐데, 사람들은 감기약, 두통약, 영양제등과 같은 알약을 먹을 때 너무나.
생활 속의 확률과 진실성 하안북중 1학년 서동조.
3조- 크리스마스의 초대 김세란 김예림 박혜진 안치민
통계의 이해 및 통계적 문제해결 제 3 장
데이터 파일 열기 데이터 편집기 상에서 새로운 데이터 파일을 만들거나, 혹은 기존의 파일을 불러올 수 있음.
안녕? 자두야 5학년 5반 17번 김서연 달콤한 머핀체,달콤한 머핀체.
빛을 가장 잘 받는 색깔은? 물메초등학교 6학년 홍민선.
팀명 : 정효가현팀 팀원 : 김효진, 이가현, 이정민
양성평등 리더만들기 조.
2011 전국 학교폭력 실태조사 -청소년폭력예방재단(청예단)
제 2장: 광고의 경제적 효과 및 규제 광고론.
4월 임신*출산부 영양관리.
Top Management Team Internationalization: Construct Development and Empirical Test 이승재 ∙ 손 윤 ∙ 윤상흠.
2 세상 이해 02. 다양한 자료를 통한 사회 현상의 이해 지도 활용 및 문제점 통계 활용 및 문제점 신문 활용 및 문제점
빈 그릇 희망 캠페인 그릇을 비우면 자연이 깨끗해 집니다.
비뇨계통.
Structural Equation Modeling
다 와서 찬양해 다 와서 찬양해 - 사랑을 주신 주 찬양해- G Bm 1. 다 와서 찬양해 2. 사랑의 우리 주님
아파트관리비 청구서 이용 프로세스 안내 ㈜한국전산기술.
교육 일정표 시 간 1일차 2일차 09:00-10:00 품질 경영에 대한 이해 품질 도구 활용 _원인분석 2
후 공진향 피부 비책 마스크 3종 Beauty. 컨텐츠 개발팀.
LCD - CF 제조 공정.
SPSS 소개 서울대학교 보건대학원 김 호.
AHP에 대하여 AHP는 한명 혹은 여러 명의 의사결정자가 참여하는 다기준 의사결정(Multiple-criteria decision-making) 문제에서 평가기준과 대안을 계층적인 구조로 파악하여 최적 대안을 선택하는 방법이다. (Thomas Saaty(1980)에 의해.
조치원YWCA-Y틴 EM으로 천연비누 만들기.
BLACK OUT 신개념 연합동아리 블랙아웃에서 1기를 모집합니다!
시설채소 육묘기술 국립원예특작과학원 이 준구.
사업 계획서 위기의 남자.
제주북초등학교 영재학급 심화반 6학년 14번 오정훈
Ⅳ. 소화, 순환, 호흡, 배설 2. 소화가 필요해요!.
(신)비취가인천비방진연3종기획1 182,000 ▶ 91,000 (신)비취가인 천비방 진연수
산과 염기 적정.
소금물과 물의 부력 차이 실험 작성자 - 백민준.
아버지 기 - 다 립-니 다- 나 에게 귀- 기울 - 이 사 - Am D Bm Em 1. 아버지 기다립니다
흑연 블록 시료 전처리 장비 소개 100년 습식분해의 문제점을 보완한 제품입니다. ODLAB.
내부 표준법과 표준물 첨가법 목포대학교 화학과 남상호.
사과는 왜 갈변 할까? 조장: 31017유수빈 조원:31024이지은.
지구를 살리는 미생물 EM 안녕하세요 조치원 YWCA 에 김선미 입니다.
통계방법의 이해.
원자모형의 변천과정 조원:20804 김민우 김재익 백선준.
표면장력에 대한 탐구 조원: 이정민, 장 예서, 김연우, 최현준.
펀비어킹 수입병맥주 설명매뉴얼.
온도는 반응 속도에 어떤 영향을 미칠까? 과학 1 학년 1 학기
어떤 금속이 열전도가 빠른지 찾기 평택여자중학교 김수민.
일본개호보험제도의 특징 ー정책과정에서 본 과제ー
정부 R&D와 민간 R&D의 상호작용 김 선 근 대 전 대 학 교 제134회 STEPI Forum 발표자료
[고객불만 관리의 성공 포인트].
과학 1 학년 2 학기 생명> 04.태아의 발생 과정은 어떻게 진행될까?[ 4 / 6 ] 수정과 착상 수업계획 수업활동.
<2013 과학탐구 보고서> 우유와 발효유가 일정온도에서 만나면?
대한공중보건의사협의회 구강보건사업단 심 수 영
Amos 17.0 구조방정식모델링 원리와 실제 제7장 모델의 적합도 평가 및 결과의 해석.
9. 수행평가 유아교육과 김아미 김연우 안홍진 한은실.
주간 콜센터 운영현황 보고 주간 인입콜 동향 주간 주요 Focus 고객민원 (콜+게시판) 요청사항 금주 진행 사항 차주 계획
6-2. 전해질과 비전해질 구별해 보기 학습 주제 < 생각열기 >
가. 4대 가이드라인 도입 및 운용 ② 협력업체 선정 ∙ 운용 가이드라인.
P 보일의 법칙 - 생각열기 – 기포가 수면으로 올라가면 크기는 어떻게 될까?
Ⅱ. 물질의 특성 물질의 끓는점.
시민이 체감하는 편리한 건축인허가 절차 개선 추진.
천연 염색 30401강설미 30402강슬기 30403김동희 30401강설미 30402강슬기 30403김동희.
농도가 달라지면 반응속도는 어떻게 변할까? 과학 1 학년 1 학기
후 스파 바디 에센스 오일 왕후의 궁중 목욕비방을 담아 비단결 바디피부를 만들리라_ 세요설부(細腰雪膚)의 조건_
걱정 고민 가득 할 때 - 어떻게 해결 하나요 - C Em Dm G 1. 걱정 고민 가득 2. 슬픈 마음 심술 3. 괜찮아요
Presentation transcript:

데이터 탐색 및 분석 요령 백동열

AMOS 중심분석단계 <분석 7단계> 1단계 :모델개념화 및 경로도 작성 2단계 : 자료수집 및 자료점검 3단계 : 모델설정 4단계 : 모델식별 5단계 : 모델추정 6단계 : 모델적합성 및 해석 7단계 : 모델수정

1단계 :모델개념화 및 경로도 작성 변수 1. 독립변수 2. 매개변수(설명력 증가) 3. 종속변수 4. 조절변수(집단차이 분석) 가설 1. 기술형가설 : 단일변수 (올해 경제성장률은 4.5%넘을 것이다.) 2. 관계형가설 : 두변수사이의 관계 1) 상관가설 : 자동차보유율이 높아지면 사망률이니 높아질것이다. 2) 인과가설 : 자동차보유율은 사망률에 영향을 미칠것이다 (1) 방향성가설 : 자동차보유율은 사망률에 정의 영향을 미칠것이다. (2) 무방향성가설 : 자동차보유율이 사망률에 (+ 혹은 -)영향을 미칠것이다. 상관관계 재규모델

1단계-1 데이터 탐색 SPSS 1. 신뢰성(내적일관성) : 분석> 척도화분석(신뢰성 크론바알파) 2. 타당성 분석(탐색적) : 분석 > 데이터축소(요인분석) AMOS 1. 다중상관분석: 신뢰도 분석(0.5이상)0.4 (표준화 추정 (SMC) ) 2. 상관행렬 (SAMPLE MOMENT)

2단계 : 자료수집 및 자료점검 자료수집 1. 표본크기 : 모수가 20개이면 표본수 5배수 (100-200) 1). 관측변수 13개인 경우 = 15*(관측변수*(관측변수+1)/10 데이터의 유형 특징 1. 다변량 정규성 추정 2. 최대우도 추정 3. 표본의 크기가 크면 적합도는 작아짐.(적당수준이상이 되면 약150-200) 결측치 이상치 및 정규성

2단계-1 사전점검 자료점검 1. 자료의 가정: 정규성충족, 등분산성, 선형성 1. 원자료(AMOS에서는 무응답, 결측치가 있는 경우 복잡성 및 에러) 2. 공분산행렬(비표준화) : 모수적합성, 모수추정 가능, 해석이 어려움(단위의 차이) 3. 상관행렬(공분산을 표준화) : 잘못된 모형, 모수추정 가능 자료점검 1. 자료의 가정: 정규성충족, 등분산성, 선형성 2. 다중공성선 : 독립변수들의 상관관계가 너무 높아 발생 0.8~0.9 3. 이상점 점검 : 특별히 다른 분포를 보이는 자료(데이터 탐색에서 확인)

2단계-2 데이터 변환 <상관행렬전환> 1. 새로만들기 명령문(syntax) Corr variables=변수명(예: x1 x2)/ Missing=listwise/ Matrix out(*). <공분산행렬전환> 2. 새로만들기 명령문(syntax) Mconvert/ Matrix =in(*) out(*).

2단계-3 결측치 종류와 처리방법 오류처리 결측치처리 1. 결측치 분석 : 분석 > 결측값 분석(평균.제거) 빈도분석을 통하여 기본검사(오류입력) 편집에서 찾기를 하여 수정 결측치처리 1. 결측치 분석 : 분석 > 결측값 분석(평균.제거) EM. 회귀로 분석 2. 결측치 변환 : 변환 > 결측치 바꾸기(계열평균법)

2단계-4 데이터 탐색 (SPSS) (분석 기술통계 데이터탐색 통계량, 도표에서 지정) 1. 이상성(줄기와잎 그림, 이상값) (분석 기술통계 데이터탐색 통계량, 도표에서 지정) 1. 이상성(줄기와잎 그림, 이상값) 상자도표를 이용하여 범위 밖의 이상점이(0, *)표시된 숫자 2. 정규성(히스토그램, 검정과 정규성 도표) - 리커트 척도의 특성상 정규성을 통계적으로 찾기가 어려움 (0.05이상) - 히스토그램과 Q-Q도표를 이용하여 너무 왜도가 심하지 않은 경우 정규성 만족으로 보고 사용함

2단계-5 데이터 탐색 (AMOS) - ASSESSMENT OF NORMALLTY를 확인하여 왜도(CR1.96)와 분석과정 : - 보기 > 분석속성 > 아웃풋 > TESTS FOR NORMALLTY AND OUTLIERS을 선택 2. 결과보기 : output - ASSESSMENT OF NORMALLTY를 확인하여 왜도(CR1.96)와 첨도(CR1.96)를 검토하여 이상이되면 정규성을 벗어난것으로 판단 - OBSERVATIONS FARTHEST 에서 먼거리를 기준으로 판단 하 며 P값이 0.05이상을 기준으로 판단함

3단계 : 모델설정 상관관계 자유모수 : 모델에서 추정해야하는 모수 고정모수(0.1) : 제약모수 재규모델

4단계 : 모델식별 자유모수가 정상적으로 값을 추정할수 있는 가를 판단하는 것(예: X + Y = 20 의 경우 값은 무수히 많다.) 이중 가장 기대값에 가까운값을 찾는 것 정보의 수= N(N+1)/2 추정해야 할 모수가 많은 경우 제약모수를 두어야 한다. 자유도 : 알려진정보 - 추정해야할 모수 1. 과소식별모델 : 추정모수가 많은 경우 (자유도-) 모델이 식별이 되지 않음 2. 과대식별모델 : 알려진 정보가 추정모수보다 많은 경우(자유도+) 모델식별이 됨 3. 자유도가 0인 모델 =적정모델 또는 포화모델이라 함

4단계-1 표준오차가 2.5이상인 경우 삭제 검토 > 추정계수 가운데 일부를 고정모수로 전환하는 등 더 많은 제약을 가함 정보행렬이 역행렬을 계산하지 못하는 경우 > 최소한의 계수를 가진 이론모델로 변경 음오차(-) 분산과 부적한 모수 추정치가 존재하는 경우 > 잠재변수의 측정오차 분산을 고정 추정계수 사이에 매우높은 상관관계(0.9이상)를 보이는 경우 > 문제변수 제거(PAIRWISE확인)

5단계 : 모델추정 모델에 포함한 자유모수와 제약모수의 값을 추정하는 것 예측공분산행렬과 관측공분산행렬의 차이(잔차)가 최소화 되도록 추정하는 것(기본50회 NUMERICAL에서 선택) 분석속성에서 추정에서 선택 하여 사용 ML=최대우도법(정규성) - 확률밀도가 가장 크도록 추정 - 표본이 큰 경우 사용 - 일반적으로 사용하는 방법 ULS=비가중최소자승법(비정규성) - 관측변수의 척도에 따라 가중치가 달라짐 - 통계적 검증에는 문제가 있음 GLS=일반최소자승법(정규성) - 비편향적,효율적, 일관성이 방법 - 척도불변의 특징

6단계 : 모델적합성 및 해석 목차 속성 지수 기준 절대적합지수 이론모델과 측정모델 모두에서 적합평가 카이스퀘어 GFI RMR RMSEA ECVI 작아야 함 0.9이상 0.05이하 증분적합지수 대안모델과 다른 대안모델의 적합도 비교 TLI,NNFI NFI RNI, BFI,CFI IFI, RFI 간명적합지수 추정계수에 의하여 달성된 적합도의 양을 결정할 목적으로 각기 다른 추정계수와 비교 측정치를 조정 AGFI PNFI PGFI Normed 카이 CAIC 커야함 2.0이하 작아야함

7단계 : 모델수정 조건 모델을 개선하기 위하여 모델을 변화시키는 것(추정모수를 제거하거나 추가) 경로를 추가하거나 제거하는 것 * 이론을 바탕으로 이루어져야 함 조건 1. 모수 수정지수 4.0 이하 2. 모든 T-VALUE(CR값) 2.0 이상 3. 모든 잔차 행렬 원소값이 작아야 함 4. 모든 다중제곱상관이 커야 함(R2) 5. 모든 부적해(위반추정치)의 값이 없어야 함 6. 같은 변수 끼리 상관관계 판단(오차변수와 오차변수)