Z-test -Z 검증은 추리 통계의 여러 가지 검증 기법들 가운데 가장 기본적인 형태의 검증방식이다.

Slides:



Advertisements
Similar presentations
학번 이름 김정현 1차 프로젝트 발표 2D 게임프로그래밍. 목차 1. 게임 컨셉 2. 게임 설명 2/10 3. 개발 범위 4. 개발 일정 5. 자체 평가.
Advertisements

작품을 통해 살펴본 전통사회와 현대사회의 갈등 인문학부 손명학 공학계열 김능배 사회체육 김영수 현대사회와 사회학.
폭력. 폭력이란 무엇인가 우상의 눈물 물리적인 폭력 ( 최기표 ) VS 지능적인 폭력 ( 임형우, 담임선생님 )
1 통계를 왜 공부해야 하나 ? Dept. of Public Administration Chungnam National University.
1 박 2 일 !!! 인천마장초등학교 유수아. 1 박 2 일 멤버 인기순 위 1 위 이승기 2 위 엄태웅 3 위 은지원 4 위 김종민, 이수근 ※인터넷에서 본것이기 때문에 사람에따라 서 다를 수 있다. ※
다초점렌즈의 oh 설계
정보 사회의 역기 능과 대처 01 인터넷 중독, 어떻게 예방할까
성공취업! 지금부터… 면접편.
석관중앙교회 5남전도회 석 관 중 앙 교 회 회원 소식 통권 05-04호 발행일 : 2005년 04월 회 장 : 장진호 집사
한국경제교육협회 일반인 표준 경제 개념 9. 인플레이션과 실업
효과적인 면접 준비 청주종합고용지원센터.
직장인의 논리적 대화 습관.
지역사회복지론 1조. 요양보호시설에 대해서 황성국 임재형 이동영
- 예∙결산 및 기본재산 운영 신뢰도 제고를 위한 실태점검, 결산지원사업 -
좋은 강의 국제관계학과 정연식.
학교교육제도 이해하기 천안청룡초등학교 교사 임 병 현.
2014학년도 중학교 교육과정 편성시 유의사항 울산광역시교육청 교육과정운영과 한 상 철.
14주차 1교시 강화계획 [학습목표] 1. 강화계획의 정의를 안다 [학습내용] 1. 단순한 강화계획 2. 간헐적 강화 3. 복합 계획 4. 선택과 대응법칙 [사전학습] 강화계획이 일어날 수 있는 사례를 생각해본다.
2. 일과 여가 일과 직업 1.
연장근로와 야간·휴일근로 김영호 노무사 나눔 노사관계연구소 소장 연세대 일반대학원 박사 수료 고려사이버대 법학과 외래교수
I 문학의 개념과 역할 1. 문학의 개념 (1) 언어 예술로서의 문학 (2) 소통 활동으로서의 문학
성경퀴즈 대회 출애굽기.
Premier Test 초급 이름 : • 속진 레이아웃(버전3)
4. 목적론적 윤리와 의무론적 윤리 01. 경험주의와 이성주의 01. 경험주의와 이성주의 02. 결과론적 윤리와 공리주의
논문을 위한 통계 집단간 평균 차이: t-test, ANOVA 하성욱 한성대학교 대학원.
CHAPTER 21 UNIVARIATE STATISTICS
Chap 3. 표본조사 3.1 표본추출(Sampling)의 기초 3.2 단순임의표본추출 3.3 표본으로부터 모집단 추정
논문을 위한 통계 논문과 통계의 기초 개념 하성욱 한성대학교 대학원.
pl x pr pl pr pl pr pr pl 피벗 이하 피벗 이상
프렌차이즈 성공사례 피 자 헛 주성대학 창업경영학과 안 철 환.
개항기 조선과 동아시아 박 범 한국역사입문Ⅱ.
한밭대학교 산업경영공학과 강진규 ( jkkang.com.ne.kr)
Association between two measurement variables Correlation
Inferences concerning two populations and paired comparisons
Association between two measurement variables Correlation
사회복지법제론 제4장 사회복지급여 수급권.
무역과 마케팅 전략 국제마케팅의 의의와 유형 국제마케팅 전략.
Statistical inference I (통계적 추론)
The normal distribution (정규분포)
대구의 부도심 대구의 주요축 동대구 부도심 4조 강민석 / 박성균 / 최은지/ 황재현/김예지.
사용자 경험 측정 (Measuring User Experience)
미래유망직업.
꼰대와 멘토.
광주대교구 대성동 본당 ‘사랑의 샘’ 꾸리아 소속 ‘사도의 모후pr.‘2000차주회
홈페이지 제작 스토리 보드 제작 방식 : 맞춤형 제작.
기업회생 절차.
이론적 확률분포 앞서: 확률변수의 임의의 확률분포 수학의 이론으로부터 도출될 확률분포 이항분포, Poisson 분포, 정규분포
2. 윤리학의 원리와 적용 가. 상대주의와 절대주의.
Chapter Ⅱ. 연구 설계.
통계방법의 이해.
Ⅲ. 세계의 자연환경 -열대기후와 주민생활.
강의 프레젠테이션 현대 사회와 미디어 11강. 매스 미디어와 정치.
강의 프레젠테이션 현대 사회와 미디어 12강. 미디어 문화.
제2장 통계학의 기초 1절 확률 기본정의 확률의 기본 공리와 법칙 2절 확률변수와 확률분포 3절 정규분포와 관련 분포 정규분포
기술 진화와 진보.
사도행전 13장 22절 말씀 –아멘 다 윗 을 왕 으 로 세 우 시 고 증 언 하 여 이 르 시 되 내 가 이 새 의 아 들
법인과 개인의 조세 (법인세, 소득세, 부가가치세)
일본의 실버산업 패션 비즈니스클럽.
천국 가는 길 천국 가는 길 ♧ 천국 가는 길 ♧ 1. 죄와 사망(지옥) 1) 사람의 3가지 공통점 - 죄인, 죽음, 심판
경찰행정과 세미나 결과를 공개해야한다. VS 비공개로 해야한다. 경찰의 근무성적평정 제도.
에듀팟-자기소개서작성.
2강 Creo Parametric 3.0 스케치 컴퓨터 응용 설계 Tel. :
8장 가족과 건강가족기본법 제정배경 주요내용 분석.
표본분포 개요 랜덤추출법 표본분포 모양과 CLT.
영상으로 읽는 한국사 02 삼국은 서로를 한 ‘민족’으로 생각했나? - 삼국통일의 의미-.
1. 행복한 삶과 직업 행복한 삶의 조건을 이해한다. 개인의 삶에서 직업이 차지하는 사회적, 경제적,
삶을 풍요롭게 만드는 의사소통.
시민으로서의 권리와 의무 사회(일반사회) 중학교 2학년 2학기 Ⅶ. 사회생활과 법규범
Progress Seminar 이준녕.
Presentation transcript:

Z-test -Z 검증은 추리 통계의 여러 가지 검증 기법들 가운데 가장 기본적인 형태의 검증방식이다. -단일 평균에 대한 검증으로써 정규분포(normal distribution)라 불리는 이론적 분포를 전제로 한 검증 방법이며, 정규분포는 다시 z-수치(z-score)를 전제로 구성되어지는 분포이다.

모수검증 vs. 비모수검증 모수검증(parametric tests) 비모수검증(nonparametric test) 표본이 추출되는 모집단의 모수(parameter)에 대한 몇 가지 가정들에 근거한 통계 검증방법 표본이 추출되는 모집단은 정상분포를 이루어야 하며 변수들은 적어도 등간척도 이상을 사용하여 측정된 것이어야 한다. 비모수검증(nonparametric test) 모수 검증에 필요한 가정들을 전제하지 않는 검증 방법이다. 적용하기는 쉬우나, 모수 검증 방법들에 비해 강력하지 못하다는 단점이 있다.

Z-score 만약에, 평균이 서로 다르고, 표준편차(혹은 변량)도 서로 다른 두 가지 분포를 서로 비교하여야 할 경우가 발생하게 된다. 두 분포의 평균 및 표준편차가 각기 상이할 경우, 동일한 범주값이라고 하더라도 그 범주값이 각 분포에서 갖는 의미는 전혀 다를 수가 있다. 이상의 경우에 서로 다른 두 분포를 비교하고자 할 때, 각 분포내의 각 점수를 일정한 기본을 적용하여 변형시켜 볼 필요가 생긴다. 이렇게 각 점수(혹은 범주값)를 정해진 기준을 사용해서 변형시키는 행위를 표준화시킨다고 하며, 그 결과로 생겨난 새로운 점수를 z-score 혹은 표준화된 수치(standardized score)라고 한다.

**이 공식을 자세히 살펴보면, z-score는 일정한 분포내의 각 범주값(X)과 준 값을 의미한다는 사실을 알 수 있다. -이러한 방식으로 계산된 z-score는 당연히 해당 범주값이 전체 분포에서 차지하는 상대적 위치를 보여주게 된다. -z score가 작으면 작을수록 해당 분포의 원래 범주값(X)의 크기 또한 작게 되며, 반대로 z-score가 크면 클 수록 해당 분포의 원래 범주값(X)의 크기 또한 크게 된다는 사실을 알 수 있다.

Z-score의 특징 해당 범주들마다 z-score들을 모두 계산 할 수 있으므로 일정한 분포내에서 산출될 수 있는 z-score들의 총수는 범주값의 총수와 항상 같다. 일정한 분포내에서 z-수치들의 총합은 항상 0이 되는데, 그 이유는 z-수치를 계산하기 위한 분자값들을 각 범주마다 더하면 그 값이 항상 0과 같기 때문이다. z-수치의 계산에 있어서 자료가 집단화되었는가 아닌가의 여부는 산출되는 z-수치의 총수에 있어서의 차이만을 지닐 뿐 공식의 차이는 전혀 존재하지 않는다. Z-수치가 분포내의 원래의 범주값(X)이 해당 분포의 평균 위로 혹은 아래로 몇 표준편차의 거리만큼 떨어져 있는가를 나타낸다는 사실이다.

Z-score에 대한 공식을 변형하면 위의 그림과 같이 제시할 수 있을 것이다. 이때 z 값이 -2라는 것은 해당범주값(Y)=평균-2표준편차의 거리만큼 떨어져 있음을 나타낸다.

연속분포 여기에서 우리는 신장과 같은 연속변수가 상대도수를 나타내는 그래프를 보고 있다. 모든 상대도수들의 합-즉, 모든 막대 높이들의 합-은 물론, [1]이다. 이제, 신장을 인치보다는 피트로 나타내고, 더 나아가서, Y축을 X축과 마찬가지의 척도로 줄인다.

표본 크기가 증가함에 따라 계급의 크기가 축소됨에 따라 연속 무작위 변수의 상대도수 밀도 변화를 확인 그러나, 표본 크기가 증가함에 따라, 우연적 효과들은 평준화되고 상대도수는 확률에 접근하게 된다. 동시에, 표본 크기의 증가는 계급을 좀 더 자세하게 나눌 수 있도록 한다. 면적은 1에 고정되어 있지만, 상대도수 밀도는 대충 하나의 곡선이 된다 ; 확률분포, p(X)라고 부르는 확률밀도 함수 최종적으로 이는 정규분포를 이루는 곡선이 된다(정규곡선)

표준 정규분포 평균=0, 표준편차=1 인 곡선을 이룬다. 종모양의 곡선이며, 단일최빈치를 지니고 완벽히 대칭적인 형태의 분포를 이룬다. 정규분포의 모양은 평균과 표준편차에 의하여 결정된다.

정규분포에 대한 계산 예제 Pr (Z>1.64) Pr (Z<-1.64) Pr (1.0<Z<1.5)

예제 2 작업치료사가 Manual Dexterity 검사결과 평균이 10점이고, 표준편차가 2.5점인 것으로 알려져 있다. 어떤 사람이 확률적으로 추출되어 검사를 받았을 때 15점 이상을 받을 확률은 얼마인가?

미국 남자의 모집단의 신장 X들을 도수분포로 배열시키면, 그 모양은 위의 그림과 같이 평균이 69인치이고 표준편차가 3인치인 정규분포를 나타낸다. 이 남자들 가운데 75인치가 넘는 사람의 비율은 얼마나 되나? 즉, Pr (X>75)= ?

학력고사 성적이 평균 60점이고, 표준편차가 20점인 정규분포를 그린다고 하자. 점수가 (1) 85점 이상 (2) 50점 미만 일 확률은 각각 얼마나 될까?

신뢰구간

표집 분포(sampling distribution)

표집분포(sampling distribution) 표본통계치 및 표본분포는 표본자료를 바탕으로 산출함으로써 연구자가 아록 있는 수치 혹은 분포임에 반하여, 모수 및 모집단 분포는 연구자가 모르고 있는 수치 혹은 분포이다. 여기에서 본질적인 의문점 하나 “그렇다면 연구자가 모르는 모집단의 수치 및 분포를 어떻게 파악하여 표본 통계치와 비교하는 통계적 검증을 행하는가?”하는 점이다. 결론적으로 모수와 표본통계치를 직접 비교하는 것은 불가능하다. 그러므로 우리는 모집단의 특성을 잘 대변할 수 있는 대체적 분포를 필요로 하게 되는데, 이것이 바로 표집분포이다.

표집분포를 개념적으로 정의한다면, 모집단으로부터 일정한 크기를 지니는 모든 가능한 무작위표본들을 추출하여 각 표본들마다 표본통계치를 산출하였을 때 그 같은 표본통계치들이 새롭게 형성하는 이론적, 가상적 분포를 의미한다. 예를 들면, 1,000명의 뇌졸중 환자의 전체사례수를 지닌 모집단이 존재한다고 생각해보자. 이때 모집단으로부터 표본사례수(N)가 50인 표본들을 하나도 빠짐없이 모두 무작위적으로 추출한다고 할 경우 그 표본들의 수는 가히 천문학적인 수일 것이다. 추출된 모든 표본들마다 특정한 표본통계치들을 빠짐없이 계산한다면, 그 수 또한 추출된 표본들의 수와 동일한 천문학적 수일 것이다. 이러한 방식으로 구해진 천문학적 수의 표본통계치들은 그 나름대로의 분포를 형성하게 되는데, 이것이 표집분포라고 한다.

기각치(critical value) 정의 표집분포에 제시되어 있는 수치들이 통계검증을 위하여 사용될 경우 그 수치들을 일컬어 기각치라고 부른다. 표집분포에 제시된 통계치로써, 가설검증과정에서 연구자로 하여금 귀무가설(또는 영가설: H0)을 기각할지의 여부를 판단케하는 기준이 되는 수치이다. 가설검증에 있어서 표본 통계치는 모수와 비교되는 것이 결코 아니라 표집 분포에 제시된 기각치와 비교된다는 사실을 알 수 있다. 가설검증 혹은 통계검증 과정에서 표집분포를 바탕으로 기각치를 구할 때, 일정한 조건이 없는 상태에서 어떠한 경우에나 일률적으로 기각치가 구해지는 것이 아니라는 것이다.

표집분포 예제 1. 모집단의 크기가 N=4이고, 변수값이 각각 2, 4, 6, 8인 모집단이 있다. 이 모집단의 모수인 평균, 분산, 표준편차를 계산하라. 2. 모집단으로부터 중복을 허락하는 방법으로 표본의 크기 n=2인 확률표본 을 추출한다면 추출가능한 표본의 수는 모집단의 크기가 N=4이고 표본의 크기가 n=2이므로 16이다(이를 나열하시오!).

표준오차