T-test
T-test Z-test T-test 단일 평균에 대한 검증을 목적으로 사용됨 단일 평균에 대한 검증 두 집단간의 평균 차이에 대한 검증을 위한 목적으로 주로 사용
σ를s로 추정할 때에는 t를 사용 건양대학교 작업치료학과 2학년들의 보건통계학 중간고사 시험 성적에서 점수 다섯의 표본을 뽑아보니, 58, 60, 53, 81, 73으로 나타났다. 학급 전체의 평균 μ의 95% 신뢰구간을 구하라.
두 평균간의 차이(μ₁- μ₂)
모집단 분산이 알려진 경우 모집단 분산이 알려져 있지 않은 경우
짝지워진 표본 중간고사와 기말고사의 점수들을 비교하고자 할 때, 우리가 두 표본 모두에서 같은 사람을 이용하기를 원한다고 하자. 이렇게 되면 D=X1-X2
**이 공식을 자세히 살펴보면, z-score는 일정한 분포내의 각 범주값(X)과 준 값을 의미한다는 사실을 알 수 있다. -이러한 방식으로 계산된 z-score는 당연히 해당 범주값이 전체 분포에서 차지하는 상대적 위치를 보여주게 된다. -z score가 작으면 작을수록 해당 분포의 원래 범주값(X)의 크기 또한 작게 되며, 반대로 z-score가 크면 클 수록 해당 분포의 원래 범주값(X)의 크기 또한 크게 된다는 사실을 알 수 있다.
T-수치 및 t-분포의 특성 위의 공식을 살펴보면, -표본평균과 모집단 평균간의 차이를 나타내며, -분포는 표준오차를 나타낸다. -이 공식은 Z의 수치와 거의 흡사하다고 할 수 있다 *표준오차에 대한 계산에서 다르다. >Z의 수치는 모집단의 편차를 N으로 나누지만, >T의 수치는 표본의 표준 편차를 N으로 나눈다는 것이다. 어떻게 위의 교환들이 가능한가? -우리가 모집단의 편차를 알지 못하므로 대처할 것이 필요했으며, 표본의 표준편차가 가장 적절했다. -단, 이때의 조건이 N이 충분히 클 때 이런 교환이 가능하다.
T-test가 사용되는 경우 정규분포를 이루는 모집단으로부터 작은 크기의 표본이 추출된 경우이다. 모집단의 분포형태와 관계없이 큰 크기의 표본이 추출된 경우이다.
T-분포의 특성 연속형변수의 확률을 제시하는 이론적 분포 좌우대칭적인 종모양 t분포와 z분포의 모양은 상당히 흡사하여 두 분포 모두 0이라는 평균값을 지닌다. t분포와 z분포의 차이는 N이 일정하다고 할 때(N<50), T분포가 z분포에 비하여 변량 혹은 표준오차가 약간 더 크다는 것이다. 하지만, N이 점차 커질수록(N≥50) t분포와 z분포간에는 모양의 차이가 전혀 없어지게 되며, 이는 곧 통계적 추리를 행함에 있어서도 차이가 전혀 없음을 뜻하는 것이다.
Z-분포 T-분포 T분포와 z분포의 형태비교
자유도 만약에, 이용할 수 있는 관찰이 단지 n=1개뿐이면 평균은 계산할 수 있으나, 산점도는 계산할 길이 없다. 그러므로, n이 1을 넘는 경우에만 분산에 대한 정보를 얻을 수 있다. 분산에 대해서는 필연적으로 정보가 단지 (n-1)개만 존재하게 되며, 그것이 적절한 분모가 된다. 정보의 개수는 관례적으로 자유도(degrees of freedom; d.f.)
자유도 자유도란 무엇인가? 표본특성치를 계산함에 있어서 자유로운 값을 취할 수 있는 관찰수를 의미한다. T-분포에서 자유도의 계산은 N-1이다. 구체적인 예를 들면, N=4인 표본분포에서 평균이 3이며, 세가지 범주값들이 각각 1(X1), 2(X2), 4(X3)로 정해져 있다고 한다면, 나머지 한 가지 범주값은 자동적으로 5라는 값을 갖게 된다. 이 경우에 X4를 제외한 나머지 세 가지 범주들은 자유로운 변화할 수 있는 값들을 가질 수 있게 되는데, 이처럼 자유로운 값을 취할 수 있는 관찰수를 자유도라고 한다.
T-검증의 문제점 N의 크기가 가설 기각에 직접적인 영향 단측검증이냐? 양측검증이냐가 가설 검증에 영향
단일 평균에 대한 t-검증
예제1 A 병원의 척수손상환자들(1,256)의 작업수행능력이 평균은 3.16이었으며, 표준편차는 0.92였다. 이 경우 연구자는 과연 모집단의 평균이 2.50일 것인가, 아닐 것인가 하는 관심을 지닐 수 있을 것이다. 이를 검증하시오.
예제2 정상적인 식이로 사육한 쥐의 몸무게는 정규분포를 하며, 평균 25g, 분산은 9g이다. 9마리 쥐를 대상으로 특별한 식이로 사육한 쥐의 평균몸무게는 23g이고 분산은 8g이었다. 특별한 식이방법을 사용하였을 경우 쥐의 몸무게에 영향을 주는지 알아보아라.
가설검증의 일반적 절차 H0을 진술한다. H1을 진술한다. 알파-오류를 설정한다. 표본 통계치를 계산한다. 기각치를 구한다. 통계적 결론을 내린다. 실질적 결론을 내린다.
영가설 대립가설 유의수준(알파) 통계치계산 기각치설정(95%) 통계적 결론 실질적 결론 U1=U0 ; U=25g ∝=0.05 통계치계산 Z=-2.0 기각치설정(95%) Z≤-1.96 또는 Z≥1.96 통계적 결론 Z 값이 -2.0은 유의수준 0.05에서 기각역에 포함되므로 영가설을 기각한다. 실질적 결론 95% 유의수준에서 통계학적으로 유의미한 차이가 있다. 즉, 특별한 식이방법이 정상식이에 비하여 쥐의 몸무게를 감소시킨다.
T-test process 예제) 목을 다쳐서 승모근에 근경축이 심한 환자들에게 바이오피드백 훈련을 하고, 승모근의 활동전위를 측정하였다고 하자. 대조군은 승모근에 근경축이 심한 환자들에게 플라시보 치료를 받았다고 하자. 가설설정
두 집단간 평균차이에 대한 t-검증 두 가지의 평균차이란? 두 가지 상이한 집단에서 각기 얻어진 평균들이 통계적으로 유의미한 차이를 보이는가를 검증함을 뜻한다. 평균차검증(Mean Difference Test)
T-평균차 검증을 위한 전제조건 두 모집단으로부터 추출된 두 표본들이 모두 무작위표본이어야 한다는 것이며 두 표본들이 추출된 두 모집단의 변량들이 같은 값을 지녀야 한다. 일반적으로는 특별한 검증과정을 거치지 않고 단순히 전제된 상태에서 검증이 진행되지만, 정밀한 검증을 요하는 연구에서는 반드시 검증을 해야 한다. 위의 두 조건들이 만족되지 않은 상태에서 평균차 검증은 결과가 무의미하게 된다.
중앙한계의 정리
표준오차에 대한 추정치 표본에서 구한 변량들과 표본 크기에 의해서 구해지는데, 두 가지 방법이 사용된다. 합치기 방법(pooled estimate of standard error) 두 모집단의 변량들은 동일하다고 가정하는 것 합지지 않는 방법(separate estimate of standard error) 모집단들의 변량이 동일하다고 추정할 만한 근거가 없는 경우에 사용된다.
T-test Lab S병원에 외래로 내원하고 있는 뇌졸중 환자 21명을 대상으로 SS-QOL 점수를 측정하였다. 그 결과 두 집단의 평균 값들은 아래의 표와 같이 나타났다. 즉, 여성(2.951±0.702)이 남성(2.889±0.856) 보다 삶의 질이 높은 것으로 나타났다. 그리고 이들의 표준오차는 여성이 0.203이고 남성이 0.285이다. Q: 여기에서 과연, S병원 전체 내원하는 뇌졸중 환자들의 삶의 질이 여성들이 높다고 할 수 있는가?
T-test Lab Answer: ①영가설을 기각한다 ②영가설을 받아들인다. 결론적으로…….
사례4 B병원에 입원하고 있는 뇌졸중 환자 남성의 일상생활동작 수행력 여성의 일상생활동작 수행력 평균이 3.208이고 표준편차가 0.830, N=1,276 여성의 일상생활동작 수행력 평균이 3.264이고 표준편차가 0.775, N=250이다. 이상의 자료를 바탕으로 여성이 남성보다 수행력이 다소 높은 것으로 조사되었다. 그러면 모집단에서도 이 같은 차이가 존재하는가?