추리통계학의 기본개념
표본으로부터 모집단에 대한 추리 통계적 유의성 검증 표본의 관찰을 통해 얻은 결론이 그 표본이 추출된 모집단에서도 사실로 성립될 수 있는가 하는 합당한 추리를 하게 해준다. 모집단으로부터 많은 경우의 표본들이 존재할 수 있는데, 그 중에 하나를 연구에서 사용한다.
추리통계학의 소개 논의의 초점에 따른 구분 논의의 초점을 해당 주제에 부여하는 방식 논의의 초점을 해당 분포에 부여하는 방식 단일평균에 대한 검증 두 평균간의 차이에 대한 검증 두 변수간의 연관관계의 검증 둘 이상 복수의 평균간의 차이에 대한 검증 변수들의 인과 관계에 대한 검증 논의의 초점을 해당 분포에 부여하는 방식 정규분포(z 분포), t-분포, 카이제곱 분포, F-분포 논의의 초점을 구체적 검증기법에 부여하는 방식 Z 검증, t 검증, 카이제곱 검증, 변량분석, 회귀분석
정의 추리통계학이란? 표본에서 얻어진 자료를 바탕으로 해당표본이 추출된 모집단의 특성에 대한 통계적 추정을 행하는 통계학의 한 분야이다. 가설의 형태 통계적 결정오류 및 통계적 유의도 가설검증의 절차
가설의 형태 Yi fi(%) Y1=1 46(3.0) Y2=2 288(18.9) Y3=3 683(44.8) Y4=4 S병원 작업치료실 내원 환자들의 삶의 만족도에 대한 빈도분포 Yi fi(%) Y1=1 46(3.0) Y2=2 288(18.9) Y3=3 683(44.8) Y4=4 394(25.8) Y5=5 115(7.5) N 1,526(100.0) 평균(Y)는 3.16이며 표준편차(s)는 0.92이다. 이 경우에 H0 : u = 2.50 H1 : u ≠ 2.50
가설 H0: 영가설 H1: 대립가설 기준이 2.50인 이유는 H0과 H1의 관계는 모집단의 삶의 만족도의 평균이 2.50일 것이라는 의미 H1: 대립가설 모집단의 삶의 만족도 평균이 2.50이 아닐 것이라는 의미 기준이 2.50인 이유는 특별한 의미가 있는 것은 아니고 삶의 만족도의 범위가 1 ~5이므로 그의 중간 수치 값인 2.50을 선택한 것임 H0과 H1의 관계는 항상 상호배타적인 관계에 있기 때문에 H0을 부정하는 것은 곧 H1을 수용하는 것이다. 또 그 역이 되는 것이다.
1. 가설에서 모수를 추정함에 있어서 모수의 값이 특정한 수치와 같다고 진술되는 형태를 정확한 가설이라고 한다. 2. 영가설은 항상 등호로 표시된다. 3. 대립가설은 부등호(<, >)와 ≠로 표시된다. -부등호는 모수들의 방향성을 알고 있는 경우이며, 단측검정이라고 함 -≠는 모수들의 방향성을 알지 못하는 경우이며, 양측검정을 사용함
실습1 본인이 평소에 관심 있는 실험가설(experimental hypothesis)을 적어보고, 여기에 포함되는 두 가지 이상의 변수를 찾아보자. 예> S병원에서 환자들의 회복 후 평균수명이 15년이 였고 표준편차가 25였다. 한편, A병원에서 뇌졸중환자들의 평균수명이 20년으로 조사되었다. H0: u=15 H1: u>15
통계적 결정오류 통계적 결정 실 제 상 황 베타 오류를 줄임으로써 통계적 검증력을 향상 시키는 방법 -수행된 통계적 검증이 어느정도 설득력을 지니는가를 나타내는 수치 -표본의 전체 사례수(N)를 늘린다. -동일한 연구를 상이한 시점에서 상이한 표본을 대상으로 반복한다.
가설의 수용 여부를 결정하는 과정에서 항시 어느 정도 그릇된 결정을 내릴 가능성이 상존하기 마련인데, 이 같은 오류를 일컬어 통계적 결정오류라고 한다. 두 가지 종류 제 1종 오류 혹은 알파 오류 알파 오류는 통상, 0.05, 0.01 혹은 0.001로 설정되는 것이 일반적이다. 예> 만약에 알파 오류를 0.05로 설정하였다면, 이는 가설 검증과정에서 5%의 오류가 있을 수 있음을 연구자가 스스로 미리 인정하는 것이다. 이는 가설검증이 이루어지기 전에 미리 설정해야 한다.
통계적 유의도 S 병원의 입원환자들의 일상생활 수행능력 평균점수를 바탕으로 가설을 검증한 결과 영가설이 기각됨으로써 모집단의 평균이 70점이 아니라는 통계적 결정을 내렸을 경우, 이러한 결정은 100% 완벽한 결정일 수 없는 것이므로 통계적 유의도를 반드시 밝혀야 하는 것이다. 예> S 병원 전체 입원환자들의 일상생활 수행능력의 평균은 70점이 아니다(X) ∝=0.05 수준에서 S 병원 전체 입원환자들의 일상생활 수행능력의 평균은 70점이 아니다(O). **확률적 표집이 이루어져야 유의도를 기준으로 해석을 할 수 있다.
가설검증의 일반적 절차 H0을 진술한다. H1을 진술한다. 알파-오류를 설정한다. 표본 통계치를 계산한다. 기각치를 구한다. 통계적 결론을 내린다. 실질적 결론을 내린다.
정규분포 곡선 평균=0 표준편차=1 인 곡선을 이룬다. 정규곡선의 모양은 -모집단 평균과 분산에 의해결정됨 -분산이 작을수록, 평균을 중심으로 몰려있고 꼬리부분에는 별로 없다
정규곡선 안의 면적
중앙집중한계정리
중앙집중한계정리를 적용하기 위해서는 N이 충분히 커야 한다고 했으나, 표본의 크기가 얼마나 커야 하는가? 표본의 크기가 100이상이면 평균들의 표집분포는 거의 정규분포를 이룬다. 표본의 크기가 30~100사이인 경우 모집단이 극단적으로 이상한 형태가 아니라면, 중앙집중한계정리를 조심스럽게 적용할 수 있다.
표본의 점추정치와 신뢰구간 점추정치(point estimate) 신뢰구간(confidence interval) 상위신뢰한계 하위신뢰한계