자료분석 및 통계활용 I 2006. 6 국 립 서 울 병 원 (강사 : 이 현 경 보건연구관)

Slides:



Advertisements
Similar presentations
신진영 현지 조사 방법 및 보고서 작성법 제 7 강 - 자료 수집과 설문지 작성 -
Advertisements

6σ 관련 기초 통계 (1) -. 통계적사고 -. 모집단과 표본. 통계적 사고 모든 작업은 상호연관된 프로세스의 시스템 예 ) 열처리 작업 공정 원료 투입 공정가열 공정 냉각 공정 모든 프로세스에는 산포가 존재 가피원인 불가피원인 동일 원료동일 생산공정 동일 작업자동일.
사회복지학과 7 조 장호 성 윤미영 김연경 전은현 짱쭝민.
제 7 장 표본분포. 표본분포 통계량의 확률분포 표본분포 (sampling distribution) 통계량 (statistic) 표본자료의 함수 즉 모집단 … … 표본 표본추출 … … 통계량 계산.
거짓말에 대한 경북대생들의 의식 조사 사회복지자료분석론 연구계획서 5조 - 음악학과 이수영
제 7 장 함수 사용을 통해 엑셀 정복하기.
수문통계분석 담당교수명 : 서 영 민 연 락 처 :
표본분포 Sampling Distribution
구간추정 (Interval Estimation)
4.3.3 초기하분포 (Hypergeometric distribution)
3일차 - 가설검정.
추론통계.
표본 이론.
Ⅱ. 측정(Measure) (2) Gage R&R (Crossed) – ANOVA 방법 [1] Data 입력
자료분석 및 통계활용.
제12주 회귀분석 Regression Analysis
제 19 장 유의성 검정 가설검정의 원리 귀무가설과 대립가설 검정통계량과 유의수준 제1종 오류와 제2종 오류 유의성 검정절차
경영통계학 통계학은 어떤 학문인가? What is Statistics? 1.1.
Keller: Stats for Mgmt & Econ, 7th Ed 표본분포 Sampling Distributions
비모수 분석 및 복습.
제 3장. 수치를 통한 연속형 자료의 요약.
최현진 정경대학 정치외교학과 국제정치론 2014 가을학기 제1주(2) 최현진 정경대학 정치외교학과
22장 통계적 품질관리(SQC) 1. 품질의 통계적 관리 2. 통계적 공정관리 3. 샘플링검사
Graph 개론 통계분석을 위한 Excel Chart 기초.
제3부 표본추출법과 자료분석 준비 제6장 표본 추출 제7장 추정과 가설 제8장 분석자료 준비와 통계기법의 개요.
멀티미디어 시스템 (아날로그 이미지,신호를 디지털로 변환 방법) 이름 : 김대진 학번 :
SPSS 이용한 논문 통계 강좌 우송대학교 IT 경영학과 하임숙
Chapter 07. 기본 함수 익히기.
CH 4. 확률변수와 확률분포 4.1 확률 확률실험 (Random Experiment, 시행, Trial) : 결과를 확률적으로 예측 가능, 똑 같은 조건에서 반복 근원사상 (Elementary Event, e) : 시행 때 마다 나타날 수 있는 결과 표본공간.
제1장 통계의 기본개념.
ANOVA.
상관분석 (p , p ).
제1장 통계학이란 무엇인가 제2장 자료와 수집 제3장 자료 분석 방법
1장 생활과 통계학 2019년 2월 25일 오전 9시 37분2019년 2월 25일 오전 9시 37분
(independent variable)
1. 비모수 검정 모수 통계학과 비모수 통계학 모수통계학 (Parametric Statistics) 에서는 표본이 추출된 모집단의 분포에 대한 가정이 꼭 필요 하지만 질적자료나 모집단의 분포에 대한 가정이 필요 없는 양적 자료의 경우에는 모수통계학을 적용할 수 없음 이때는.
ITQ 정보기술자격 국가공인 Excel 2007 Ⅱ 함수- 11회차 강사 : 박영민.
자료의 표현.
강의 목차 1주차 통계학의 기본개념 7주차 통계적 추정 8주차 종합정리 및 중간고사 9주차 10주차 통계적 검정(1) 11주차
젠트리피케이션에 대한 인식 분석 경영학부 최은지 경영학부 이창현
8장. spss statistics 20의 데이터 변환
두 모집단에 대한 검정.
데이터 베이스 DB2 관계형 데이터 모델 권준영.
논문작성을 위한 연구모형 설정 양동훈.
Keller: Stats for Mgmt & Econ, 7th Ed 회귀모형의 정형화 Model Building
Week 3-2: 데이터분포 3_2장_1(백분율:Percentile)에서 동영상 1,2
Excel 일차 강사 : 박영민.
제3장 함수와 배열수식 전진환
Sampling Distributions
Intelligent Systems and Control Lab. Dept. of EE, Yeungnam Univ.
ITQ 정보기술자격 국가공인 Excel 2007 Ⅱ 함수- 15회차 강사 : 박영민.
3장, 마케팅조사의 일번적 절차 마케팅 조사원론.
Chapter2. 기술통계(Descriptive Statistics)
척도의 속성 - 목 차- 자료수집과정 척도의 속성 -명목척도 -서열척도 -등간척도 -비율척도 -리커트척도 3.Data(자료)
제2장 자료의 정리 및 기술통계 Min Gyoung Chan Ph.Dr..
최소의 실험 횟수에서 최대의 정보를 얻기 위한 계획방법 분석방법: 분산분석(Analysis of Variance, ANOVA)
비교분석 보고서 Template 2015.
상관계수.
2015년도 2학기 제 10 장 기술통계와 도수분포 마케팅조사.
통계학 R을 이용한 분석 제 2 장 자료의 정리.
실습 : Sampling / Excel macro
추리통계학의 기본개념.
제 16장 비율의 정확성 머리말 신뢰구간 신뢰구간의 해석.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
In-house Consultant Training
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
현지조사 방법 및 보고서 작성법 현지조사(field working)란?
문제의 답안 잘 생각해 보시기 바랍니다..
(Analysis of Variation, ANOVA)
Survey Sampling Sangji University.
Presentation transcript:

자료분석 및 통계활용 I 2006. 6 국 립 서 울 병 원 (강사 : 이 현 경 보건연구관)

< 강의 목표 > 궁극적 목적 (제1강, 제2강 공통) : 구체적 목적 (제1강) : 1) 통계 기초 이론 습득 1) 통계의 중요성 및 필요성 인식 ! 2) 통계에 대한 자신감 고취 ! [ 3) 고객(강의 수강자)의 요구 충족 및 만족도 증진 ! ] 구체적 목적 (제1강) : 1) 통계 기초 이론 습득 2) 실습 : EXCEL을 활용한 자료분석

< 강의 목차 > 제 1 장 통계학의 이해 제 2 장 모집단과 표본 제 3 장 자료의 수집과 정리 제 4 장 자료의 통계적 측정(기술통계 분석) 제 5 장 확률분포와 정규분포 제 6 장 추정과 가설검정 (T-test) * 보건복지부와 통계청간의 MOU 체결 소개 *

제1장 통계학의 이해 ex) 통계를 군주가 파악하고 있어야 통치 및 계획 가능 - 땅의 면적, 인력 현황, 생산량 등 - 통계학(Statistics)의 어원 : “국가(state)의 상태(state)를 살핀다”는 의미에서 출발 ex) 통계를 군주가 파악하고 있어야 통치 및 계획 가능 - 땅의 면적, 인력 현황, 생산량 등 - 통계학(statistics)의 정의 : 주어진 문제에 대하여 합리적인 답을 줄 수 있도록 숫자로 표시되는 자료(data)를 수집, 정리, 분석하여 신뢰성 있는 결론을 도출하는 과학의 한 분야

< 통계의 중요성 > 부실 통계 -> 정책 혼선 -> 예산낭비 등 국가적 손실 부실통계 사용으로 인한 손실 사례 Ex. 1) IMF 직전 가용 외환 보유고가 사실상 바닥났음에도 부정확한 파악으로, 300억 달러 이상 남아 있다고 발표함으로 IMF를 맞이하여 국민 경제에 어려움 초래 2) 한일어업협상 당시, 기초통계 부족으로 잘못된 협상을 함으로 어민들에게 피해 초래 3) 출산정책의 경우 1983년에 합계 출산율이 2.1명 이하였음에도 불구, 1996년까지 출산 억제정책을 시행한 결과 우리나라가 세계 최저 출산국으로 전락함. (통계활용 능력의 중요성)

▲ 3) 의사결정 시스템에 필요한 통계 인프라 강화 등 과학적 근거에 기반한 정책 ( Evidence- Based Policy) 의 중요성 부각 정책의 과학적 기조를 확립하기 위해서는 ▲ 1) 전문인력 양성 및 확대   ▲ 2) 정책결정 집단의 과학적 마인드 제고  ▲ 3) 의사결정 시스템에 필요한 통계 인프라 강화 등 과학적 인프라 구축 등이 필요함.

보건통계학(health statistics, biostatistics) 통계학의 사용 분야 : 행정학, 경영학, 사회학, 심리학, 교육학, 의학, 보건학 등 거의 모든 학문 분야에서 자료를 정리하고 분석하는 데 통계방법이 적용되고 있음. 보건통계학(health statistics, biostatistics) : 건강이나 질병 등 보건과 관련된 여러 현 상을 기술하고 추론하는 학문 병원통계(hospital statistics) : 병원의 환자 진료 및 진료 수익 등을 분석하여 병원 경영 및 기획 등에 필요한 자료를 제공하는 원무통계를 말함. : 원무통계는 목적에 따라 내원 형태별, 환자 종류별, 수가 유형별, 진료 의사별, 검사 항목별 등으로 다양하게 진료 수익 및 실적들을 정리하고 분석함.

제 2 장 모집단과 표본 모집단(Population)과 표본(Sample)의 정의 모집단 : 관심을 갖는 대상이 구성하고 있는 모든 관측치들을 모은 집합 표본 : 모집단으로 부터 추출된 일부분 추출 표 본 모집단

표본조사를 실시하는 이유 및 장점 1) 모집단을 전수조사하는 것이 불가능한 경우가 많다. 2) 전수조사에 비해서 표본조사는 인력, 경비, 시간 등이 절약된다. 3) 비표본오차를 줄일 수 있다. 조사수가 많아지면 측정오차 이외에도 기획, 조사, 관리, 분석 등의 단계에 걸쳐 오차가 많아진다. 4) 특이성이 변하지 않는 시점에서 속히 조사를 할 필요가 있을 경우 순간적인 특성을 파악할 수 있다. (여름철 유행성 전염병 발생률 등) 5) 조사행위가 대상의 성격과 형질을 변형 시킬때 표본조사를 한다. 등이 있을 수 있다.

확률추출법(Probability Sampling)의 종류 및 방법 1) 단순임의추출법(simple random sampling) : 무작위 추출방법, 난수표(확률수표) 사용 2) 층화추출법(stratified sampling) : 모집단이 이질적인 단위로 구성되어 있을 때, 표본이 각 계층을 고루 대표하도록 추출하는 방법 3) 집락추출법(cluster sampling) : 모집단이 집단(cluster)으로 구성된 경우, 일부 집단을 임의로 선택하여 집단 내에서 임의표본추출방법 4) 계통추출법(systematic sampling) : 모집단에서 표본을 추출할 때 일정한 간격을 두고 표본 추출하는 방법 5) 다단계추출법(multi-stage sampling) : 몇 단계의 표본 추출을 거쳐서 표본 추출하는 방법, 각 단계에서 위와 같은 추출법을 사용

제 3 장 자료의 수집과 정리 1) 질적 변수 또는 범주형 변수 자료의 종류 1) 질적 변수 또는 범주형 변수 (Qualitative, Categorical Variable) : 명목 척도(Nominal Scale) - 숫자의 의미는 전혀 없음. (예) 성별, 결혼상태, 교육수준 등 : 서열 척도(Ordinal Scale) – 순위는 있으나, 간격은 없음 2) 양적 변수 또는 연속 변수 (Quantitative, Continuous Variable) : 구간 척도(Interval Scale) – 간격이 같고, 순위가 있음. (예) 온도, 리커트 척도 : 비 척도(Ratio Scale) – 숫자의 직접적인 비교 가능, 실제 숫자의 형태, 수학적 조작 가능, 가장 수준이 높은 변수 형태 (예) 연령, 신장, 체중 등 Ex 1) 예제 파일에서 질적변수와 양적변수 파악하기.

Ex) 연령 : 현재 양적 변수를 질적 변수로 표현하기 자료의 형태 – 예제 파일 (엑셀) 질적 변수 양적 변수가 수준이 더 높다. : 양적 변수가 더 많은 정보를 가지고 있음. : 양적 변수(수치 자료) 질적 변수(범주형 자료) 변환 가능 : 질적 변수(범주형 자료) 양적 변수(수치 자료) 변환 불가 Ex) 연령 : 현재 양적 변수를 질적 변수로 표현하기 자료의 형태 – 예제 파일 (엑셀)

Garbage in => Garbage out !! 독립변수 (X : Independent Variable) : 다른 변수에 영향을 주는 변수 종속변수 (Y : Dependent Variable) : 독립변수에 의해 영향을 받는 변수 * 통계에 있어 Data의 중요성 * : 통계 분석에 있어 정확한 원 자료 (Raw Data)의 수집이 가장 중요함. Gold in => Gold out !! Garbage in => Garbage out !!

질적 자료의 정리 양적 자료의 정리 EXCEL 실습 : 자료입력, 그래프 그리기, 함수사용 등

엑셀의 화면구성 및 자료 입력

Sheet 이름 지정, Sheet 추가, 삭제 가능 (더블클릭)

챠트 마법사 클릭

클릭

범례표시 지정 데이터 이름표 지정 데이터 테이블 작성 챠트 제목 지정

제 4 장 자료의 통계적 측정 (기술통계 분석) 중심위치의 측정 Ex. 실습 : 평균(Mean) – 일반적인 산술평균을 의미, 극단적인 값(outlayer)에 의해 영향을 많이 받음. : 중앙값(Median) – 자료를 일렬로 나열하였을 때, 중앙에 위치하는 값 : 최빈값(Mode) – 자료 중 가장 빈번히 나타나는 값 산포도의 측정 : 분산과 표준편차(Variance & Standard Deviation), (표준 편차)2= 분산 : 범위(Range) = 최대값-최소값 Ex. 실습

< 25명 학생의 통계학 시험성적 >  75  63  49  86  53  80  70  72  81  80  69  76  85  95  66  77  77  63  58  74  68  90  82  59  60

< SPSS 및 EXCEL 실습 화면 >

a 여러 최빈값이 있습니다. 가장 작은 값이 나타납니다. 통계량 N 유효 25 결측 평균 72.3200 중위수 74.0000 최빈값 63.00(a) 표준편차 11.6000 분산 134.5600 왜도 -.131 왜도의 표준오차 .464 첨도 -.475 첨도의 표준오차 .902 범위 46.00 최소값 49.00 최대값 95.00 백분위수 63.0000 50 75 80.5000 a 여러 최빈값이 있습니다. 가장 작은 값이 나타납니다.

제 5 장 확률분포 및 정규분포 분포(Distribution) : 자료의 흩어진 형태 확률분포(Probability Distribution) : 확률변수 형태에 따라 이산확률분포, 연속확률분포 정규분포(Normal Distribution)의 특징 : 좌우대칭 모양, 정규곡선의 모양과 위치는 분포의 분산(또는 표준편차)과 평균에 의해 결정됨 등 표본분포(Sample Distribution)

제 6 장 추정과 가설검정 추정 : 점추정(Point Estimation), 구간추정(Interval Estimation) 가설(Hypothesis)이란? 1) 귀무 가설(H0), : 영 가설 2) 대립 가설(H1 또는 HA) : 연구자의 가설, 귀무 가설의 반대 * 가설 검정 *

- 가설 검정의 절차 : 가설 설정(귀무 가설 및 대립 가설 설정) -> 통계적 분석 -> p 값 도출 및 해석 -> 결론(대립가설 또는 귀무가설 채택) p<0.05 : 귀무가설 기각 (대립가설 채택) : 5% 유의수준(옳은 귀무가설을 기각할 오류가 5%임을 의미)을 보통 많이 사용, : 기타 1%, 10% 의 유의수준도 사용

< 가설 검정 예제 > H0 : 입원 전·후 환자의 정신건강 수준에는 통계적으로 유의한 차이가 없다. 1) 가설 설정 H0 : 입원 전·후 환자의 정신건강 수준에는 통계적으로 유의한 차이가 없다. H1 : 입원 전·후 환자의 정신건강 수준에는 통계적으로 유의한 차이가 있다. 2) 통계분석 : 변수의 형태에 따라 통계분석 방법을 선택 3) P 값 해석 : 통계 팩키지(SPSS 등)가 P 값 산출 4) 결론 : p<0.05 이면 => 귀무가설 기각, 대립가설 채택

* 국가 통계(Official Statistics) * 일부 소개

< 보건복지부와 통계청 간의 MOU 체결 >

< 보건복지부와 통계청간의 MOU 체결 > 2005. 7. 25(월)

< MOU 약정서 주요 내용 > ㅇ 통계 공동 조사 및 통계품질 관리 협조 □ 협력 분야 ㅇ 통계담당 인사교류  □ 협력 분야 ㅇ 통계담당 인사교류   ㅇ 통계업무협력위원회 설치․운영   ㅇ 특정 임무수행을 위한 T/F 구성․운영 등 □ 통계업무협력위원회의 주요 기능   ㅇ 새로운 수요에 부응한 통계개발․자문   ㅇ 통계 공동 조사 및 통계품질 관리 협조   ㅇ 통계교육프로그램 공동 개발 및 강사의 교류 등

< 통계청과 주요 협력 분야> * 보건복지부와 통계청간의 실무회의 결과 산출 * 1) 승인통계업무 및 분류 정비 2) 사망원인통계 및 생명표 개선 3) 사회통계(장애통계 등) 개발 4) 행정자료(국민연금 등) 협조 5) 센서스 유병통계 등 추가 6) 지역통계생산 협의체 구성 7) 통계 교육 8) 통계 품질관리 등

통계업무 협력 MOU 체결 기념

* 제 언 * 만족할 때까지, 통계 개선 및 개발을 위한 품질관리는 계속되어야 합니다. ~ * 제 언 * ★ 통계를 이용하는 내·외부 고객들이 만족할 때까지, 통계 개선 및 개발을 위한 품질관리는 계속되어야 합니다. ~

감 사 합 니 다 !!