5. 가설 검정 5.1 표본분포 5.2 용어의 개념 5.3 가설 검정 절차 5.4 양측 검정과 단측검정 5.5 오류의 종류

Slides:



Advertisements
Similar presentations
연천 새둥지마을 체재형 주말농장 준공식 초청장 오시는 길 주제 일시 장소 21C 경기농촌희망심기 2005년 제1기 교육수료마을
Advertisements

SPARCS Wheel Seminar Mango X Sugoi
출석수업 자료 교과서 범위: 제1장-4장.
10월 충북노회 남선교회 순회 헌신예배 묵 도 기 도 성 경 봉 독 특 송 찬 양 설 교 찬양 / 봉헌 봉 헌 기 도
글에 나타난 시대적 사회적 배경을 파악할 수 있다. 배경 지식과 의미 해석의 관련성을 이해할 수 있다.
패널자료 분석
라오디게아 교회의 교훈 본문 계 3: ○라오디게아 교회의 사자에게 편지하라 아멘이시요 충성되고 참된 증인이시요 하나님의 창조의 근본이신 이가 이르시되 15. 내가 네 행위를 아노니 네가 차지도 아니하고 뜨겁지도 아니하도다 네가 차든지 뜨겁든지 하기를 원하노라.
한알Ⅱ「더불어 살기」전국대회 일정표 날짜 시간 7월 26일(목) 7월 27일(금) 7월 28일(토) 7월 29일(일)
2013학년도 전라북도고등학교신입생 입학전형 기본계획
선거관리위원회 위원 공개모집 4차 공고 제4기 선거관리위원회를 구성하는 위원 모집의
2015학년도 1학기 버디 프로그램 오리엔테이션 (목) 16:00.
열왕기하 1장을 읽고 묵상으로 예배를 준비합시다..
오늘의 학습 주제 Ⅱ. 근대 사회의 전개 4. 개항 이후의 경제와 사회 4-1. 열강의 경제 침탈 4-2. 경제적 구국 운동의 전개 4-3. 사회 구조와 의식의 변화 4-4. 생활 모습의 변화.
전도축제 계획서 *일시 : 2013년 4월 21, 28일 주일 (연속 2주)
2009학년도 가톨릭대학교 입학안내.
한국 상속세 및 증여세 과세제도 한국 국세공무원교육원 교 수 최 성 일.
중세시대의 의복 학번 & 이름.
다문화가정의 가정폭력의 문제점 연세대학교 행정대학원 정치행정리더십 2학기 학번 이름 홍 진옥.
이공계의 현실과 미래 제조업 立國 / 이공계 대학생의 미래 준비
신앙의 기초를 세우는 중고등부 1부 대 예 배 : 11 : 00 ~ 12 : 층 본당
신앙의 기초를 세우는 중고등부 1부 대 예 배 : 11 : 00 ~ 12 : 층 본당
◆ 지난주 반별 출석 보기 ◆ 제 56 권 26호 년 6월 26일 반 선생님 친구들 재적 출석 5세 화평 김성희 선생님
第1篇 자치입법 개론.
교직원 성희롱·성폭력·성매매 예방교육 벌교중앙초등학교 박명희
제5장 새로운 거버넌스와 사회복지정책 사회복지정책이 어떤 행위자에 의해 형성되고 집행되는지, 어떤 과정에서 그러한 일들이 이루어지는지, 효과적인 정책을 위해서는 어떤 일들이 필요한지 등을 본 장에서 알아본다 개인들이 생활을 개선하는 가장 효과적인고 궁극적인 방법은 개별적.
임상시험 규정 (최근 변경 사항 중심으로) -QCRC 보수 교육 과정 전달 교육
서울특별시 특별사법경찰 수사 송치서류 유의사항 서울특별시 특별사법경찰과 북부수사팀장 안   진.
특수학교용 아동학대! 제대로 알고 대처합시다..
사회복지현장의 이해 Generalist Social Worker 사회복지입문자기초과정 반포종합사회복지관 김한욱 관장
학교보건 운영의 실제 한천초등학교 이 채 금.
제 출 문 고용노동부 귀중 본 보고서를 ’ ~ ‘ 까지 실시한 “근로감독관 직무분석 및 교육프로그램 개발에 관한 연구”의 최종보고서로 제출합니다  연구기관 : 중앙경영연구소  프로젝트 총괄책임자 : 고병인 대표.
학습센터란? 기도에 관해 배울 수 있는 다양한 학습 코너를 통하여 어린이들이 보다 더 쉽게 기도를 알게 하고, 기도할 수 있게 하며, 기도의 사람으로 변화될 수 있도록 하는 체험학습 프로그램이다. 따라서 주입식이지 않으며 어린이들이 참여할 수 있는 역동적인 프로그램으로.
Digital BibleⅢ 폰속의 성경 디지털 바이블 2008년 12월 ㈜씨엔커뮤니케이션 ㈜씨엔엠브이엔오.
후에 70인역(LXX)을 좇아 영어 성경은 본서의 중심 주제인 “엑소도스”(출애굽기)라 하였다.
성 김대건 피츠버그 한인 성당 그리스도왕 대축일 공지사항
예배에 대하여.
말씀 듣는 시간입니다..
하나님은 영이시니 예배하는 자가 신령과 진정으로 예배할지니라.
지금 나에게 주신 레마인 말씀 히브리서 13장 8절.
예수의 제자들 담당교수 : 김동욱.
Lecture Part IV: Ecclesiology
KAINOS 날마다 더하여지는 Kainos News 이번 주 찬양 20 / 300 – 20개의 셀, 300명의 영혼
예배의 외부적인 틀II - 예배 음악 조광현.
영성기도회 렉시오 디비나와 묵상기도 2.
성인 1부 성경 공부 지도목사: 신정우 목사 부 장: 오중환 집사 2010년. 5월 9일
남북 탑승객 150명을 태운 디젤기관차가 2007년 5월 17일 오전 경의선 철길을 따라 남측 최북단 역인 도라산역 인근 통문을 통과하고 있다. /문산=사진공동취재단.
성경 암송 대회 한일교회 고등부 (일).
천주교 의정부교구 주엽동본당 사목협의회 사목활동 보고서
III. 노동조합과 경영자조직 노동조합의 이데올로기, 역할 및 기능 노동조합의 조직형태 노동조합의 설립과 운영
여수시 MICE 산업 활성화 전략 ( 중간보고 )
1. 단위사업 관리, 예산관리 사업설정 (교직원협의/의견수렴) 정책 사업 학교 정책 사업 등록 사업 기본정보 목표 설정
※과정 수료자에 한하여 수강료의 80~100% 차등 환급함
평생학습중심대학 프로그램 수강지원서 접수안내 오시는 길 관악구&구로구민을 위한 서울대학교 -- 접수 일정 및 방법 안내--
서비스산업의 선진화, 무엇이 필요한가? 김 주 훈 한 국 개 발 연 구 원.
기존에 없던 창업을 하고 싶은데, 누구의 도움을 받아야 할지 모르겠어요
전시회 개요 Ⅰ. 전시명칭 개최기간 개최장소 개최규모 주 최 참 관 객 현 지 파 트 너 General Information
Homeplus 일 家 양 득 프로그램 소개 2015년 12월.
Home Network 유동관.
통신이론 제 1 장 : 신호의 표현 2015 (1학기).
I. 기업과 혁신.
Chapter 4 – 프로그래밍 언어의 구문과 구현 기법

ESOCOM – IPIX 고정IP서비스 제안서 Proposer ㈜이소컴.
화장품 CGMP 한국콜마㈜.
초화류 종자 시장 규모 100억원 이상(추정, 생산액의 10%정도 차지)
COMPUTER ARCHITECTIRE
[ 한옥 실측 ] 1. 약실측 2. 정밀실측 조선건축사사무소.
14. 컴파일러 자동화 도구 스캐너 생성기 파서 생성기 코드 생성의 자동화
A제조용수/B환경관리/C시설관리 ㈜ 에이플러스 코리아
Introduction to Network Security
Presentation transcript:

5. 가설 검정 5.1 표본분포 5.2 용어의 개념 5.3 가설 검정 절차 5.4 양측 검정과 단측검정 5.5 오류의 종류 5.6 t-분포 5.7 모평균의 검정 5.8 Goodness-of-fit Tests 5.9 비모수적 검정

5.1 표본분포 • 확률 표본 : 모집단으로부터 추출된 f(x)의 확률밀도함수를 갖는 서로 독립인 확률변수들 • 통계량 : 확률표본의 함수 예) 표본평균, 표본분산   • 표본 분포 : 통계량의 확률분포 예) 60년간 7월 일평균 기온의 집단으로부터 7월 평균 온도(31일 평균)의 확률분포

표본평균의 분포 X₁, … ,Xn 이 정규 분포 N( μ, σ2)로부터의 확률표본일 때 표본 평균 에 대하여 모집단의 분포가 정규분포 N(μ, σ2)인 경우에 𝑋 의 분포는 N( μ, )를 따른다.

표본 분산의 분포 카이제곱분포의 정의: 확률변수 Z1, Z2, ….Zk가 각각 표준 정규분포 N(0,1)을 따르고 서로 독립일 때 𝑍 1 2 + 𝑍 2 2 + 𝑍 3 2 ⋯ 𝑍 𝑘 2 의 분포를 자유도 k인 카이제곱 분포라 함 𝑍 1 2 + 𝑍 2 2 + 𝑍 3 2 ⋯ 𝑍 𝑘 2 ~ 𝜒 2 (𝑘)

정규모집단에서 표본 분산의 분포 X₁, … ,Xn 이 정규 분포 N( μ, σ2)로부터의 확률표본일 때 표본 분산 𝑆 2 = 𝑖=1 𝑛 𝑋 𝑖 − 𝑋 2 /(𝑛−1) 에 대하여 𝑛−1 𝑆 2 𝜎 2 ~ 𝜒 2 (𝑛−1) 이 성립함

◦ 중심극한정리(Central Limit Theorem) 평균이 μ이고 분산이 σ2인 임의의 모집단으로부터의 크기 n인 확률표본에서의 표본평균은 n이 충분히 크면 근사적으로 정규분포 N( μ, 𝜎 𝑛 )을 따른다. 즉 n이 충분히 클 때

5.2 용어의 개념 ① 대립가설(alternative hypothesis) : 자료로부터의 강력한 증거에 의하여 입증하고자 하는 가설 예) H1 :올해의 7월 기온은 평년과 같지 않다. ② 귀무가설(null hypothesis) : 이에 상반되는 가설 예) H0 : 올해의 7월 기온은 평년과 같다. ③ 검정통계량(test statistic) : 귀무가설과 대립가설 중 어느 하나를 택하는데 사용되는 통계량 ④ 기각역(rejection region) : 귀무가설 H0를 기각하게 되는 검정통계량의 관측 값의 영역

⑤ 유의수준(significance level) : 제1종 오류를 범할 확률의 최대 허용한계 α=0.01, α=0.05, α=0.1 등 ⑥ 유의확률(p-value) : 검정통계량의 관측 값에 대하여 귀무가설 H0을 기각할 수 있는 최소의 유의수준

5.3 가설 검정 절차 ① 검정통계량을 설정한다. ② 귀무가설을 정의한다. ③ 대립가설을 정의한다. ④ 검정통계량의 표본분포를 구한다. ⑤관측된 검정통계량과 표본분포를 비교한다.

5.4 양측검정과 단측 검정 양측검정: 기각역이 양측에 있는 경우 대립가설: 귀무가설: 기각역: 단측검정: 기각역이 어느 한쪽에 있는 경우

5.5 오류의 종류 실제현상 검정결과 H0가 사실 H1이 사실 H0를 채택 옳은 결정 제2종 오류 H1을 채택 제1종 오류

예제 어느 리조트에서 이 지역은 늦여름에 7일 중에 6일이 맑은 날이라고 광고를 하였다. 어떤 사람이 이 주장이 사실인지를 조사하기 위하여 관측을 수행하여 25개의 독립사건을 수집하고 맑은 날의 수를 조사하였더니 15일이 나왔다. 관측값에 근거하여 리조트의 주장을 반박할 수 있을까?

이항분포에 근거해서 조사하기 위해서 자료가 이항분포의 조건에 맞아야 함. 개별 사건이 독립이고 확률이 일정해야 함 그러므로 조사자는 리조트의 주장을 검증하기 위해서 25개의 독립 사건에 대한 관측을 수행해야 하므로 연속 날에 대해서 자료를 수집하면 안되고 연속되지 않은 날들에 대해서 25개의 자료를 수집해야 함. 왜냐하면 기상자료는 serial correlation을 갖고 있기 때문임.

관측으로부터 해당변수는 15/25가 됨 1. 검정 통계량을 맑은 날의 확률로 정함 2. 그 다음 귀무가설은 리조트의 주장이 맞다면 P>6/7=0.857 왜냐하면 리조트의 주장은 맑은 날의 확률이 낮을 때 틀리는 것이므로 단측검정 사용 3. 대립가설은 P<6/7 4. 검정 통계량에 대한 귀무가설이 참인 조건에서 표본 분포를 구함 B(25, 0.857) Pr{X15}= 𝑥=0 15 25 𝑥 0.857 𝑥 (1−0.857) 25−𝑥

이항분포의 정규근사 이항분포 B(n,p)를 하는 확률변수 X에 대해, n 이 충분히 크고 p가 0 또는 1에 가깝지 않다면 표준화된 확률 변수 𝑥−𝑛𝑝 𝑛𝑝𝑞 의 분포는 근사적으로 표준 정규 분포 N(0,1)을 따른다. 이항분포의 평균 𝑛𝑝=25*0.857=21.4 이항분포의 분산 𝑛𝑝𝑞=25*0.857*(1-0.857)=1.75 Pr 𝑋≤15 = Pr 𝑍≤ 15−21.4 1.75 =0.00012 맑은 확률이 0.857에서 맑은 날이 15일 이하로 나올 확률은 매우 낮음 관측값은 귀무가설을 기각할 강력한 증거를 제시함

5.6 t-분포 • X₁, … ,Xn 이 정규 모집단 N( μ, σ2)로부터의 확률표본일 때 𝑋 는 𝑁 𝜇, 𝜎 2 𝑛 ~𝑁(0,1) 이 성립함. σ가 미지인 경우 표본표준편차 𝑆를 대입하여 스튜던트화된 확률변수 𝑋−𝜇 𝑆/ 𝑛 의 분포를 t분포라 부름.

t-분포의 정의 : 표준 정규 분포 N(0,1)을 따르는 확률 변수 Z라 하고 이와는 독립이며 자유도 k인 카이제곱 분포를 따르는 확률 변수를 V라 하면 𝑇= 𝑍 𝑉/𝑘 의 분포를 자유도 k인 t 분포라 한다. 이 때 기호로 나타내면 𝑇~𝑡(𝑘)

• 0을 중심으로 좌우 대칭형이지만 표준 정규분포에 비하여 두터운 꼬리를 갖고 있는 것이 특징 자유도가 큰 경우 t-분포는 정규분포에 가까워 짐 (예: 자유도 30 -3% 차이, 자유도 100 – 1% 차이) 붉은 선: 정규분포 푸른 선: t-분포 (자유도 3)

Basu의 정리 X₁, … ,Xn ~ N( μ, σ2)일 때 𝑋 와 𝑆 2 은 서로 독립이다. 스튜던트화된 확률변수의 분포 𝑋 −𝜇 𝑆/ 𝑛 = ( 𝑋 −𝜇)/( 𝜎 𝑛 ) 𝑛−1 𝑆 2 𝜎 2 /(𝑛−1) = 𝑍 𝑉/(𝑛−1) ~𝑡(𝑛−1)

5.7 모평균의 검정 H0 : μ = μ0 H1 : μ ≠ μ0 유의수준 α :   기각역 R 양측검정의 경우

• 모평균의 검정 : 모분산 σ2이 알려진 정규모집단에서 아래의 가설들에 대한 검정통계량은 정규검정 • 모평균의 검정 : 모분산 σ2이 알려진 정규모집단에서 아래의 가설들에 대한 검정통계량은 이며, 기각역은 다음과 같다.   귀무가설 대립가설 유익수준 α인 기각역 a) H0 : μ  μ0 H1 : μ > μ0 b) H0 : μ  μ0 H1 : μ < μ0 c) H0 : μ = μ0 H1 : μ ≠ μ0

모분산이 알려지지 않은 정규모집단에서 아래의 가설들에 대한 검정통계량은 T= 𝑋 −𝜇 𝑆/ 𝑛 기각역은 다음과 같다. • t-test 모분산이 알려지지 않은 정규모집단에서 아래의 가설들에 대한 검정통계량은 T= 𝑋 −𝜇 𝑆/ 𝑛 기각역은 다음과 같다.   귀무가설 대립가설 유익수준 α인 기각역 a) H0 : μ ≤ μ0 H1 : μ > μ0 b) H0 : μ ≥ μ0 H1 : μ < μ0 c) H0 : μ = μ0 H1 : μ ≠ μ0

• 표본크기가 큰 경우에 임의의 모집단에서 아래의 가설들에 대한 검정통계량은 σ2을 알 때 σ2을 모를 때

기각역은 다음과 같다. 귀무가설 대립가설 유익수준 α인 기각역 a) H0 : μ ≤ μ0 H1 : μ > μ0 b)   귀무가설 대립가설 유익수준 α인 기각역 a) H0 : μ ≤ μ0 H1 : μ > μ0 b) H0 : μ ≥ μ0 H1 : μ < μ0 c) H0 : μ = μ0 H1 : μ ≠ μ0

예제 대기 중 이산화탄소의 농도가 두 배가 되었을 때와 현재 상태의 겨울철 500hPa의 고도선의 변화를 분석하기 위해서 표본 수를 각각 30개씩을 취하여 평균과 표준편차를 계산하였다. 평균값의 차이는 50m 가 나타났고 표준편차는 50m로 같게 나타났다. 대기 중 이산화탄소의 농도 변화가 겨울철 500hPa의 고도선의 현저한 변화를 유발했다고 말할 수 있는가?

검정 통계량: 𝑥 1 − 𝑥 2 귀무가설: 차이가 없다. 대립가설: 차이가 있다. 표본분포: 귀무가설에 근거해서 표본분포를 구함 𝐸 𝑥 1 − 𝑥 2 =0 Var 𝑥 1 − 𝑥 2 =𝑉𝑎𝑟 𝑥 1 +𝑉𝑎𝑟 𝑥 2 = 𝑠 1 2 𝑛 1 + 𝑠 2 2 𝑛 2

𝑧= 𝑥 1 − 𝑥 2 [ 𝑠 1 2 𝑛 1 + 𝑠 2 2 𝑛 2 ] 1/2 n1과 n2 가 충분히 큰 경우 Gaussian 근사 적용가능 예) 𝑥 1 − 𝑥 2 =50m 𝑠 1 2 𝑛 1 + 𝑠 2 2 𝑛 2 = 50 2 30 + 50 2 30 =166.6 𝑧= 50 166.6 =3.8

3.8 유의 수준 5% 양측검정 3.8>Z0.025 =1.96

5.8 Goodness-of-fit test 이론 분포가 얼마나 관측값과 잘 맞는지를 정량적으로 평가하는 방법 one-sample Kolmogorov-Smirnov (K-S) test 관측값이 이론분포로부터 취해졌다는 귀무가설하에 한 표본에 대해서 경험 누적 확률분포와 이론 누적확률분포를 비교하는 것 충분히 큰 차이가 귀무가설을 기각시킴 원래 방법의 조건은 이론분포의 매개변수가 자료표본으로부터 추정되지 않아야 함 -> 실제 사용할 때 제약조건으로 작용 매개변수가 data에 tuning 되어짐.

누적 분포 함수 ( Cumulative distribution function; CDF) 확률밀도함수 ( Probability density function; PDF)

수정된 KS 방법 : Lilliefors test 검정통계량 𝐷 𝑛 =max⁡| 𝐹 𝑛 𝑥 −𝐹 𝑥 | 𝐹 𝑛 𝑥 : empirical cumulative probability 𝐹 𝑥 : theoretical cumulative probability 검정을 통과하기 위해서 𝐷 𝑛 의 기준값은 표본 크기와 유의수준, 이론 분포에 의존함

예제 1933 년부터 1982년까지 Ithaca 1월 강수량의 분포에 대하여 Gaussian과 Gamma 분포의 적합성 조사

단측검정 왜냐하면 차이가 클수록 귀무가설을 기각할 근거를 제시하는 것이므로 Gaussian 분포의 경우 𝐷 𝑛 =0.131 Sample size: 50

5% 유의수준의 기준값 0.886 𝑛 = 0.886 50 =0.125 1% 유의수준의 기준값 1.031 𝑛 = 1.031 50 =0.146 1% 유의수준에서는 Gaussian 분포 적합하지만 5% 유의수준에서는 적합하지 않음

Gamma 분포의 경우 𝐷 𝑛 =0.068 Sample size: 50, 𝛼=3.76 20% 유의수준의 기준값 0.75 𝑛 = 0.75 50 =0.106 20% 유의수준에서는 Gamma 분포 적합

2) 카이 제곱 검정 ( 𝝌 𝟐 test) 자료의 히스토그램을 이론 본포와 비교함 𝜒 2 = 𝑐𝑙𝑎𝑠𝑠 (# 𝑜𝑏𝑠𝑒𝑟𝑣𝑒𝑑−# 𝑒𝑥𝑝𝑒𝑐𝑡𝑒𝑑) 2 # 𝑒𝑥𝑝𝑒𝑐𝑡𝑒𝑑 # 𝑒𝑥𝑝𝑒𝑐𝑡𝑒𝑑=𝑛𝑃𝑟{𝑑𝑎𝑡𝑎 𝑖𝑛 𝑐𝑙𝑎𝑠𝑠} 자료가 이론함수로부터 취해졌다는 가설하에서 검정통계량은 자유도𝜈=(# 𝑜𝑓 𝑐𝑙𝑎𝑠𝑠−# 𝑜𝑓 𝑝𝑎𝑟𝑎𝑚𝑒𝑡𝑒𝑟−1)를 갖는 카이제곱 분포를 따름. 검정은 단측검정

카이제곱 분포(k)와 감마분포의 관계 자유도가 k를 갖는 카이제곱분포는 𝛼=𝑘/2이고 𝛽=2인 감마분포임

예제 카이제곱검정을 이용한 Gaussian과 Gamma분포의 적합성 판정

Gaussian 분포: 𝜒 2 =14.96, 자유도= 6-2-1=3 Gamma 분포: 𝜒 2 =5.05, 자유도 =6-2-1=3 카이제곱 분포는 𝛼= 𝜈 2 , 𝛽=2 인 감마분포임 그러므로 𝛼= 𝜈 2 =1.5, 𝛽=2 인 감마분포 표준 검정량은 𝛽=1일 때 주어지므로 𝜉= 14.96 2 =7.48 Gaussian 𝜉= 5.05 2 =2.53 Gamma

0.826 0.998 유의확률1-0.826=0.174 1-0.998=0.002

5.9 비모수적 검정 모수적 검정: 특정 이론 분포가 자료를 표현하기에 적절하다는 가정하에 수행하는 검정 자료가 정규분포를 만족한다거나 t-분포를 만족한다 등 비모수적 검정: 자료의 분포를 가정하지 않고 수행하는 검정 고전적인 방법: 자료의 순위에 대한 분포를 이용함 resampling 방법: 자료로부터 재 표본과정을 통해 자료의 분포를 만들어냄 모수적 검정과 비모수적 검정의 차이는 null distribution을 어떻게 얻느냐이다.

고전적인 비모수적 검정법 Wilcoxon 의 순위합 검정 Wilcoxon 과 Mann and Whitney에 의해서 독립적으로 1940년대에 개발됨 두 집단을 합쳐서 혼합 자료 값의 순위를 매긴 후 순위 합을 통계적 검정량으로 사용 𝑛= 𝑛 1 + 𝑛 2 𝑅 1 : 𝑛 1 개의 자료로 구성된 집단의 순위의 합 𝑅 2 : 𝑛 2 개의 자료로 구성된 집단의 순위의 합 𝑅 1 + 𝑅 2 =1+2+ ⋯𝑛= 𝑛(𝑛+1) 2 𝑛 개의 자료가 𝑛 1 , 𝑛 2 로 나누어질 경우의 수 𝑛! 𝑛 1 ! 𝑛 2 !

예) X: X1, X2, X3 Y: Y1, Y2 혼합자료: X1, X2, X3, Y1, Y2 순위: 1, 3, 5, 2, 4 Y 자료의 순위의 합: 2+4=6 5개의 자료를 2와 3개의 자료를 갖는 두 집단으로 나눌 경우의 수 5! 2!3! =10

X와 Y가 같은 평균을 갖는다면 순위의 합은 5개의 자료에서 2개를 취했을 때 갖는 순위의 합의 분포를 갖게 됨 X와 Y가 같은 평균을 갖는다면 순위의 합은 5개의 자료에서 2개를 취했을 때 갖는 순위의 합의 분포를 갖게 됨. Y 의 순위 W 확률 1,2 3 0.1 1,3 4 0.1 1,4 5 0.1 1,5 6 0.1 2,3 5 0.1 2,4 6 0.1 2,5 7 0.1 3,4 7 0.1 3,5 8 0.1 4,5 9 0.1 W=6인 경우 W=9 인 경우

자료의 개수가 많은 경우: 모든 경우의 수를 다 계산할 필요 없이 다음의 검정 통계량을 사용함 𝑈 1 = 𝑅 1 − 𝑛 1 2 ( 𝑛 1 +1) 𝑛 1 이 충분히 큰 경우 (10이상) U1은 정규분포를 만족함 U의 평균과 표준편차는 다음과 같이 주어짐 𝜇 𝑈 = 𝑛 1 𝑛 2 2 𝜎 𝑈 = [ 𝑛 1 𝑛 2 𝑛 1 + 𝑛 2 +1 12 ] 1/2

예제 구름 씨뿌리기 실험 평가 구름씨를 뿌렸을 때 번개 발생률이 변화가 있는지 여부를 평가함

𝑛 1 =12 𝑈 1 = 𝑅 1 − 𝑛 1 2 𝑛 1 +1 =108.5−6 12+1 =30.5 𝜇 𝑈 = 𝑛 1 𝑛 2 2 = 12×11 2 =66 𝜎 𝑈 = [ 𝑛 1 𝑛 2 𝑛 1 + 𝑛 2 +1 12 ] 1/2 =16.2 Z= 30.5−66 16.2 =−2.19 P-value: 0.014 전체 조합: 23! 12!11! =1,352,078 중에 해당순위 합이 나올 확률은 1.4%임

Resampling Tests Rerandomization test 또는 Monte-Carlo test로 알려짐 실제 자료와 같은 크기를 갖는 인위적인 자료집단을 만들고 인위적인 자료 집단으로 부터 검정 통계량을 계산함 Random number generator를 이용함 Resampling test의 장점 자료에 대해 이론분포를 가정할 필요가 없음 물리적으로 중요하다고 생각되는 임의의 통계값을 자료로부터 계산될 수 만 있다면 검정 통계량으로 사용할 수 있음

예제 1933년부터 1982년까지 Ithaca지역의 1월 강수량의 로그의 표준편차 50년의 자료로부터 계산된 값: 0.537 자료로부터 n=50인 자료를 10000쌍을 만들어냄