R활용 통계실습 보충자료.

Slides:



Advertisements
Similar presentations
연천 새둥지마을 체재형 주말농장 준공식 초청장 오시는 길 주제 일시 장소 21C 경기농촌희망심기 2005년 제1기 교육수료마을
Advertisements

SPARCS Wheel Seminar Mango X Sugoi
출석수업 자료 교과서 범위: 제1장-4장.
10월 충북노회 남선교회 순회 헌신예배 묵 도 기 도 성 경 봉 독 특 송 찬 양 설 교 찬양 / 봉헌 봉 헌 기 도
글에 나타난 시대적 사회적 배경을 파악할 수 있다. 배경 지식과 의미 해석의 관련성을 이해할 수 있다.
패널자료 분석
라오디게아 교회의 교훈 본문 계 3: ○라오디게아 교회의 사자에게 편지하라 아멘이시요 충성되고 참된 증인이시요 하나님의 창조의 근본이신 이가 이르시되 15. 내가 네 행위를 아노니 네가 차지도 아니하고 뜨겁지도 아니하도다 네가 차든지 뜨겁든지 하기를 원하노라.
한알Ⅱ「더불어 살기」전국대회 일정표 날짜 시간 7월 26일(목) 7월 27일(금) 7월 28일(토) 7월 29일(일)
2013학년도 전라북도고등학교신입생 입학전형 기본계획
선거관리위원회 위원 공개모집 4차 공고 제4기 선거관리위원회를 구성하는 위원 모집의
2015학년도 1학기 버디 프로그램 오리엔테이션 (목) 16:00.
열왕기하 1장을 읽고 묵상으로 예배를 준비합시다..
오늘의 학습 주제 Ⅱ. 근대 사회의 전개 4. 개항 이후의 경제와 사회 4-1. 열강의 경제 침탈 4-2. 경제적 구국 운동의 전개 4-3. 사회 구조와 의식의 변화 4-4. 생활 모습의 변화.
전도축제 계획서 *일시 : 2013년 4월 21, 28일 주일 (연속 2주)
2009학년도 가톨릭대학교 입학안내.
한국 상속세 및 증여세 과세제도 한국 국세공무원교육원 교 수 최 성 일.
중세시대의 의복 학번 & 이름.
다문화가정의 가정폭력의 문제점 연세대학교 행정대학원 정치행정리더십 2학기 학번 이름 홍 진옥.
이공계의 현실과 미래 제조업 立國 / 이공계 대학생의 미래 준비
신앙의 기초를 세우는 중고등부 1부 대 예 배 : 11 : 00 ~ 12 : 층 본당
신앙의 기초를 세우는 중고등부 1부 대 예 배 : 11 : 00 ~ 12 : 층 본당
◆ 지난주 반별 출석 보기 ◆ 제 56 권 26호 년 6월 26일 반 선생님 친구들 재적 출석 5세 화평 김성희 선생님
第1篇 자치입법 개론.
교직원 성희롱·성폭력·성매매 예방교육 벌교중앙초등학교 박명희
제5장 새로운 거버넌스와 사회복지정책 사회복지정책이 어떤 행위자에 의해 형성되고 집행되는지, 어떤 과정에서 그러한 일들이 이루어지는지, 효과적인 정책을 위해서는 어떤 일들이 필요한지 등을 본 장에서 알아본다 개인들이 생활을 개선하는 가장 효과적인고 궁극적인 방법은 개별적.
임상시험 규정 (최근 변경 사항 중심으로) -QCRC 보수 교육 과정 전달 교육
서울특별시 특별사법경찰 수사 송치서류 유의사항 서울특별시 특별사법경찰과 북부수사팀장 안   진.
특수학교용 아동학대! 제대로 알고 대처합시다..
사회복지현장의 이해 Generalist Social Worker 사회복지입문자기초과정 반포종합사회복지관 김한욱 관장
학교보건 운영의 실제 한천초등학교 이 채 금.
제 출 문 고용노동부 귀중 본 보고서를 ’ ~ ‘ 까지 실시한 “근로감독관 직무분석 및 교육프로그램 개발에 관한 연구”의 최종보고서로 제출합니다  연구기관 : 중앙경영연구소  프로젝트 총괄책임자 : 고병인 대표.
학습센터란? 기도에 관해 배울 수 있는 다양한 학습 코너를 통하여 어린이들이 보다 더 쉽게 기도를 알게 하고, 기도할 수 있게 하며, 기도의 사람으로 변화될 수 있도록 하는 체험학습 프로그램이다. 따라서 주입식이지 않으며 어린이들이 참여할 수 있는 역동적인 프로그램으로.
Digital BibleⅢ 폰속의 성경 디지털 바이블 2008년 12월 ㈜씨엔커뮤니케이션 ㈜씨엔엠브이엔오.
후에 70인역(LXX)을 좇아 영어 성경은 본서의 중심 주제인 “엑소도스”(출애굽기)라 하였다.
성 김대건 피츠버그 한인 성당 그리스도왕 대축일 공지사항
예배에 대하여.
말씀 듣는 시간입니다..
하나님은 영이시니 예배하는 자가 신령과 진정으로 예배할지니라.
지금 나에게 주신 레마인 말씀 히브리서 13장 8절.
예수의 제자들 담당교수 : 김동욱.
Lecture Part IV: Ecclesiology
KAINOS 날마다 더하여지는 Kainos News 이번 주 찬양 20 / 300 – 20개의 셀, 300명의 영혼
예배의 외부적인 틀II - 예배 음악 조광현.
영성기도회 렉시오 디비나와 묵상기도 2.
성인 1부 성경 공부 지도목사: 신정우 목사 부 장: 오중환 집사 2010년. 5월 9일
남북 탑승객 150명을 태운 디젤기관차가 2007년 5월 17일 오전 경의선 철길을 따라 남측 최북단 역인 도라산역 인근 통문을 통과하고 있다. /문산=사진공동취재단.
성경 암송 대회 한일교회 고등부 (일).
천주교 의정부교구 주엽동본당 사목협의회 사목활동 보고서
III. 노동조합과 경영자조직 노동조합의 이데올로기, 역할 및 기능 노동조합의 조직형태 노동조합의 설립과 운영
여수시 MICE 산업 활성화 전략 ( 중간보고 )
1. 단위사업 관리, 예산관리 사업설정 (교직원협의/의견수렴) 정책 사업 학교 정책 사업 등록 사업 기본정보 목표 설정
※과정 수료자에 한하여 수강료의 80~100% 차등 환급함
평생학습중심대학 프로그램 수강지원서 접수안내 오시는 길 관악구&구로구민을 위한 서울대학교 -- 접수 일정 및 방법 안내--
서비스산업의 선진화, 무엇이 필요한가? 김 주 훈 한 국 개 발 연 구 원.
기존에 없던 창업을 하고 싶은데, 누구의 도움을 받아야 할지 모르겠어요
전시회 개요 Ⅰ. 전시명칭 개최기간 개최장소 개최규모 주 최 참 관 객 현 지 파 트 너 General Information
Homeplus 일 家 양 득 프로그램 소개 2015년 12월.
Home Network 유동관.
통신이론 제 1 장 : 신호의 표현 2015 (1학기).
I. 기업과 혁신.
Chapter 4 – 프로그래밍 언어의 구문과 구현 기법

ESOCOM – IPIX 고정IP서비스 제안서 Proposer ㈜이소컴.
화장품 CGMP 한국콜마㈜.
초화류 종자 시장 규모 100억원 이상(추정, 생산액의 10%정도 차지)
COMPUTER ARCHITECTIRE
[ 한옥 실측 ] 1. 약실측 2. 정밀실측 조선건축사사무소.
14. 컴파일러 자동화 도구 스캐너 생성기 파서 생성기 코드 생성의 자동화
A제조용수/B환경관리/C시설관리 ㈜ 에이플러스 코리아
Introduction to Network Security
Presentation transcript:

R활용 통계실습 보충자료

# 난수발생과 모의실험

R에서의 분포함수 d 확률밀도함수 (density) 값 d = f(x) p 누적확률 (probabililty)   p 누적확률 (probabililty) p = P(X ≤ x) lower.tail = TRUE인 경우 (default) p = P(X > x) lower.tail = FALSE인 경우 q 분위수 (quantile) 값 −∞ 𝜎 𝑓 𝑥 𝑑𝑥= 𝑝 를 만족하는 q 값 r 난수 발생

## (1) 연속분포 # (1.1) 정규분포 # (1.2) t 분포 # (1.3) 균일분포 # (1.4) 지수분포 지수함수: 평균=1/r 인 지수분포에 대한 밀도함수 f(x) = 𝑟𝑒 −𝑟𝑥 (- ∞ <x< ∞) (단, r은 발생비율 (rate))

## (2) 이산분포 # (2.1) 베르누이 분포와 이항분포 # (2.2) Poisson 분포 f(x) = 1 𝑥! 𝜆 𝑥 𝑒 −𝜆 (x = 0,1,2, …)

## (3) 정규성 검정 # (3.1) Histogram을 이용한 정규성 검토 # (3.2) 정규확률그림 Shapiro 검정; 검정통계량을 이용한 정규성 검정 H0: 정규분포를 따른다 Ha: 정규분포를 따르지 않는다.

## (4) simulation # (4.1) 이항분포의 정규분포 근사 # (4.2) 중심극한정리와 모의실험 np ≥ 5, np(1-p) ≥ 5 인 경우 이항분포의 정규분포 근사가 유효 # (4.2) 중심극한정리와 모의실험 “표본크기가 충분히 크면 동일 분포에서 얻어진 확률표본 평균과 합은 정규분포에 근사”

# 일변량 데이터와 기술통계량

## (1) 범주형 데이터 # (1.1) 분할표 # (1.2) 막대그래프 # (1.3) Pie 그림 # (1.4) 점그림 (dot chart)

## (2) 숫자형 데이터 # (2.1) 줄기-잎-그림 (stem-and-leaf plot) # (2.2) 상자그림 (boxplot) # (2.3) 히스토그램 # (2.4) 중심경향 측도: 평균, 중앙값 # (2.5) 퍼짐경향 측도: 분산, 표준편차, 사분위수범위 (IQR)

# (2.6) 표준화점수 평균과 표준편차를 이용해 변수를 표준화 (standardization) Zi = 𝑥 𝑖 − 𝑥 𝑠 1 𝑛 𝑖 𝑛 𝑍 𝑖 =0, 1 𝑛−1 𝑖 𝑛 (𝑍 𝑖 −1 ) 2 =1

# (2.7) 신뢰구간 (confidence interval) 모수 추정시 90%, 95%, 99% 신뢰구간을 구해 구간추정. θ에 대한 근사적인 95% 신뢰구간은 𝜃 ±1.96 𝑥 𝑠𝑑( 𝜃) (단, 𝜃 은 θ에 대한 추정량, 𝑠𝑑( 𝜃) 는 𝜃 의 표준편차) {x1, x2, ..xn}~N() 경우 평균 μ에 대한 95% 신뢰구간은 𝑋 ± 𝑡 𝑛−1 ∝ 2 𝑥 𝑆 𝑛 (단, 𝑋 는 표본평균, S는 표본의 표준편차)

# 이변량 데이터

## (1) 범주형 데이터의 이원분할표 [예제] 부모와 아이의 안전벨트 착용여부에 대한 빈도 부모의 안전벨트 착영여부 착용   부모의 안전벨트 착영여부 착용 착용 안함 부모의 안전벨트 착용여부 54 7 3 12

[예제] 니코틴 중독환자 데이터를 빈도를 중심으로 정리 환자번호 니코틴 패치 사용여부 금연여부 patient nicotin stopsmoke 1 Y 2 3 N 4 5 6 7 8 9 10

# 상관계수

상관관계에 대하여 다음과 같이 통계적 가설 검정하려면: H0: 두 변수간의 Pearson 상관계수가 0 Ha: 두 변수간의 Pearson 상관계수가 0이 아님

[예제] 15명의 남자 어른에 대해 기계와 간호사가 잰 혈압을 분석하세요 id machine expert 1 68 72 2 82 84 3 94 89 4 106 100 5 92 97 6 80 88 7 76 8 74 70 9 110 103 10 93 11 86 12 65 63 13 69 14 87 15

[예제] 신체데이터에 대한 Pearson 상관계수와 산점도. id age weight height gender 1 58 38 M 2 103 87 43 3 50 48 4 138 98 61 5 82 47 F 6 52 30 24 7 28 29 8 79 45 9 107 144 59 10 11 40 12 15 27 13 20 26 14 19

# 유의성 검정

통계적 가설검정 <표 7-2> p-값 범위와 유의수준 통계적 결정 귀무가설 () 참 거짓 H0를 기각함 제 1종 오류 = σ 옳은 결정 = 1 - β H0를 채택함 =1 - σ 제2종 오류 =β p-값 범위 R 결과에서 별 표시 일반적 설명 [0, .001] *** 극단적으로 유의함 (extremely significant) [.001, .01] ** 매우 유의함 (highly significant) [.01, .05] * 통계적으로 유의함 (statistically significant) [.05, .10] . 유의할 수 있음 (could be significant) [.10, 1.0]   유의하지 않음 (not significant)

## (1) 일집단 t-검정 # (1.1) 소표본 (n ≤ 30)이며 모분산 σ2을 모르는 경우 (예제) 데이터: 암컷 원숭이의 몸무게 (단위 Kg). 원숭이의 몸무게는 정규분포를 따른다고 할 때 암컷원숭이의 평균 몸무게가 8.5 kg이라고 할 수 있는지 검정하라. 8.30 9.50 9.60 8.75 8.40 9.10 8.15 8.80 통계적 가설: H0 : μ = 8.5 H1: μ ≠ 8.5 t =

# (1.2) 모분산 σ2을 아는 경우 (예제) (앞의) 암컷 원숭이의 몸무게에서 분산이 1.0인 정규분포를 따른다고 할 때 암컷원숭이의 평균 몸무게가 8.5 kg이라고 할 수 있는지 검정. 8.30 9.50 9.60 8.75 8.40 9.10 8.15 8.80 통계적 가설: H0 : μ = 8.5 H1: μ ≠ 8.5 Z =

## (2) 이집단 t-검정 # (2.1) 일변량 소표본 (n ≤ 30)에서 모분산을 모르며 σ21 ≠ σ22 경우

## (3) 이집단 분산비 F-검정 H0 : σ12 = α22 H1: σ12 ≠ α22 ; 만일 F ≥ 또는 F ≤ 이면 H0 를 기각한다. H0 : σ12 ≤ α22 H1: σ12 > α22 ; 만일 F ≥ 이면 H0 를 기각한다.

## (4) matched sample에 대한 t-검정 (예 7-6) 10명의 학생을 대상 학습법 강좌 수강 전후의 B과목 시험점수에 대하여.. H0 : 강좌수강 전후 점수 차이가 없다. H1: 강좌수강 전후 점수 차이가 있다. <표> 강좌 수강 전후의 시험 점수 시험 점수 pre-test 77, 56, 64,60,58,72, 67, 78,67, 79 post-test 99, 80, 78, 65, 59, 67,65, 85, 74, 80

## (5) 일집단 비율 검정 [예제] A 살충제는 한 번 살포에 85% 살충효과가 있다고 선전한다. 150마리 모기에게 A 살충제를 살포하였더니 110마리가 죽었다. A살충제의 선전이 믿을만한지 유의성 검정을 하라

## (6) 이집단 비율에 대한 검정 (예제 7-8) A 도시에서 300명 중 100명이, B 도시에서는 400명 중 170명이 D 후보를 지지한다고 조사되었다. A도시와 B 도시의 D 후보 지지 비율이 같다고 할 수 있는지 통계적 검정을 하고자 한다. (1) 가설 H0: p1 = p2 H1: p2 ≠p2

# χ2 검정

## (1) χ2 독립성 검정 # (1.1) 데이터가 빈도표로 주어진 경우 예제: 고등학교 졸업 여부와 수입의 독립성 여부 > chisq.test() H0: 고교 졸업 여부와 수입은 서로 독립이다. (관련이 없다.) H1: 고교 졸업 여부와 수입은 서로 독립이 아니다. (관련이 있다.) χ2 = (단, 자유도 df = (r-1)(c-1)   고등학교 졸업 여부 yes no 고수입 (high income) 54 45 저수입(low income) 63 65

데이터가 개체에 대한 정보로 주어진 경우 (예) A 학과 지원생에 대한 데이터로 입학여부와 성별 간에 관계가 있다고 할 수 있는지 검사.   성별 입학여부 1 M Y 2 3 4 N 5 6 7 F 8 9 10 11 12

예: 직장인을 대상 음주와 흡연에 대해 조사한 데이터이다. 음주 빈도와 흡연 빈도가 서로 관련 있다고 할 수 있는가? 빈도 수준 변수로 1은 매일 또는 매우 자주, 5는 전혀 이용하지 않음을 나타낸다 음주빈도 수준 흡연빈도수준 1 20 30 25 2 35 37 31 3 16 29 40 45 4 9 10 5 26 39

## (2) χ2 적합도 검정 (예) 알사탕 100개가 들어 있는 한 봉지에서 빨강(1), 노랑(2), 파랑(3), 초록색(4) 각각의 사탕 개수를 세어보니 30, 20, 27, 23 이었다. 다음과 같은 가설에 대해 χ2검정을 한다. H0: p1 =0.25, p2 =0.25, p3 =0.25, p4 =0.25 H1: 적어도 한 개의 pi ≠ , (단, i=1,…,4)

# 분산분석법

## (1) 일원배치 분산분석 예 3 종류의 건전지 수명에 차이가 있는지 알아보고자 한다. 각 회사에서 5개씩 건전지를 선택하여 수명실험으로 다음의 데이터를 얻었고 이들은 정규분포를 따른다고 할 수 있다고 한다. 제품 A B C 100 76 108 96 80 98 101 84 92 78

## (2) 이요인 분산분석 예; 디자인 종류와 광고 요인 별로 매출액을 조사한 데이터이다 2요인 분석을 하세요. 광고 디자인 디자인 종류와 광고 요인 별로 매출액을 조사한 데이터이다 2요인 분석을 하세요. 광고 디자인 A B C 광고 했을 경우(1) 23 15 18 광고 하지 않을 경우(0) 16 9 11