기초 통계학 지도위원 이광희.

Slides:



Advertisements
Similar presentations
Statistics 상지대학교 1 / 22 추정 개요 점추정과 구간추정 표본크기 두 모집단의 비교.
Advertisements

제 7 장 표본분포. 표본분포 통계량의 확률분포 표본분포 (sampling distribution) 통계량 (statistic) 표본자료의 함수 즉 모집단 … … 표본 표본추출 … … 통계량 계산.
1. 도형의 연결 상태 2. 꼭지점과 변으로 이루어진 도형 Ⅷ. 도형의 관찰 도형의 연결상태 연결상태가 같은 도형 단일폐곡선의 성질 연결상태가 같은 입체도형 뫼비우스의 띠.
제3장제3장 제3장제3장 이산균등분포  확률질량함수 :  평균 :  분산 : 공정한 주사위를 한 번 던지는 경우 나온 눈의 수를 확률변수 : X 확률질량함수 : 평균 : 분산 :
경영통계 제 1 장 통계란 무엇인가 도수분포표. 도수분포 도수분포 상대도수분포 상대도수분포 누적 도수 누적 도수 분석 도구 - 히스토그램 분석 도구 - 히스토그램.
Add Your Text 5. 지수함수와 로그함수 1. 지수함수 2. 로그함수 · 지수함수와 그 그래프 · 지수방정식과 지수부등식 · 로그 함수와 그 그래프 · 로그방정식과 로그부등식.
출석수업 과제 – 총 5문제, 10월 25일 제출 정보통계학과 장영재 교수.
5. 통계 1. 산포도와 표준편차.
2015 개정교육과정 (제2차 수학교육 종합계획).
이항분포와 정규분포 이항분포 정규분포.
재료수치해석 HW # 박재혁.
제 4 장 정규분포로의 근사 단위변환 정규분포곡선 표준정규분포곡선 아래의 영역 찾기 자료에 대한 정규 근사 백분위수
제 7 장 함수 사용을 통해 엑셀 정복하기.
수문통계분석 담당교수명 : 서 영 민 연 락 처 :
확률분포의 개념 미분과 적분의 개념을 사전에 공부한다.
표본분포 Sampling Distribution
구간추정 (Interval Estimation)
4.3.3 초기하분포 (Hypergeometric distribution)
3일차 - 가설검정.
Ⅱ. 측정(Measure) (2) Gage R&R (Crossed) – ANOVA 방법 [1] Data 입력
컴퓨터 프로그래밍 기초 [Final] 기말고사
제12주 회귀분석 Regression Analysis
Keller: Stats for Mgmt & Econ, 7th Ed 표본분포 Sampling Distributions
제2장 기술통계학Ⅰ: 표와 그래프적 방법.
전기에 대해 알아보자 영화초등학교 조원석.
제 3장. 수치를 통한 연속형 자료의 요약.
11장. 포인터 01_ 포인터의 기본 02_ 포인터와 Const.
제 13 장 정규분포곡선과 확률히스토그램 동전던지기와 정규분포 개념이 다른 두 히스토그램 : 경험적 히스토그램과 확률히스토그램
Z-test -Z 검증은 추리 통계의 여러 가지 검증 기법들 가운데 가장 기본적인 형태의 검증방식이다.
표 본 분 포 7 1 모집단분포와 표본분포 2 표본평균의 분포 3 정규모집단에 관련된 분포의 응용 4 표본비율의 분포.
Chapter 11 위험과 수익률, 기회자본비용의 개요.
CH 4. 확률변수와 확률분포 4.1 확률 확률실험 (Random Experiment, 시행, Trial) : 결과를 확률적으로 예측 가능, 똑 같은 조건에서 반복 근원사상 (Elementary Event, e) : 시행 때 마다 나타날 수 있는 결과 표본공간.
상관분석 (p , p ).
제9 강 표준정규분포 학습목표: 표준정규분포의 이해 학습내용: 표준정규분포의 계산방법과 실습 지난강의
Ⅲ. 이 차 방 정 식 1. 이차방정식과 그 풀이 2. 근 의 공 식.
수학10-가 Ⅳ. 통 계 백암고등학교 수학교사 : 양상옥.
제1장 통계학이란 무엇인가 제2장 자료와 수집 제3장 자료 분석 방법
Keller: Stats for Mgmt & Econ, 7th Ed
군집 분석.
(independent variable)
학습 주제 p 일률 측정하기.
1. 비모수 검정 모수 통계학과 비모수 통계학 모수통계학 (Parametric Statistics) 에서는 표본이 추출된 모집단의 분포에 대한 가정이 꼭 필요 하지만 질적자료나 모집단의 분포에 대한 가정이 필요 없는 양적 자료의 경우에는 모수통계학을 적용할 수 없음 이때는.
두 모집단에 대한 검정.
P 등속 직선 운동 생각열기 – 자동차를 타고 고속도로를 달릴 때, 속력계 바늘이 일정한 눈금을 가리키며 움직이지 않을 때가 있다. 이 때 자동차의 속력은 어떠할까? ( 속력이 일정하다 .)
Fitting / Matrix / Excel
5강. 배열 배열이란? 배열의 문법 변수와 같이 이해하는 배열의 메모리 구조의 이해 레퍼런스의 이해 다차원 배열
Week 3-2: 데이터분포 3_2장_1(백분율:Percentile)에서 동영상 1,2
제3장 함수와 배열수식 전진환
수학10-나 1학년 2학기 Ⅱ.부등식의 영역 1. 부등식의 영역(2/5) 부등식 영역 수업계획 수업활동.
이차방정식과 이차함수의 관계 이차함수의 그래프와 축의 위치 관계 이차방정식 의 그래프와 축이 만나는 점의 좌표는 이차방정식
감마분포 gamma distribution
Sampling Distributions
수학10-나 1학년 2학기 Ⅰ. 도형의 방정식 1. 평면좌표 (2~3/24) 선분의 내분점과 외분점 수업계획 수업활동.
통계해석 및 오차의 제거.
Chapter 3: 확률변수와 분포함수 Pilsung Kang
1. 접선의 방정식 2010년 설악산.
신문에서의 그래프 사용 이상미 김정석 김종찬 임성규.
척도의 속성 - 목 차- 자료수집과정 척도의 속성 -명목척도 -서열척도 -등간척도 -비율척도 -리커트척도 3.Data(자료)
최소의 실험 횟수에서 최대의 정보를 얻기 위한 계획방법 분석방법: 분산분석(Analysis of Variance, ANOVA)
11장 배열 1. 배열이란? 1.1 배열의 개요 1.2 배열의 선언과 사용.
비교분석 보고서 Template 2015.
상관계수.
2015년도 2학기 제 10 장 기술통계와 도수분포 마케팅조사.
통계학 R을 이용한 분석 제 2 장 자료의 정리.
제 16장 비율의 정확성 머리말 신뢰구간 신뢰구간의 해석.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
수학10-나 1학년 2학기 Ⅱ.부등식의 영역 3. 부등식의 영역에서 최대, 최소(5/5) 부등식 영역 수업계획 수업활동.
문제의 답안 잘 생각해 보시기 바랍니다..
Survey Sampling Sangji University.
Presentation transcript:

기초 통계학 지도위원 이광희

1. 통계학이란? 표본이 되는 정보를 통해 모집단의 상황을 유추해 내는 학문

1-1. 통계학이란? Tip 모집단: 조사 대상으로 삼아야 할 집단 표본: 모집단에서 추출된 몇몇 개체 집단 예를 들면 국회지지율 조사를 하는 과정에서 우리나라 전체 유권자를 “모집단”이라고 하고 몇몇 인원을 추출하여 즉 2천명의 서울시에 거주하는 20~30대 유권자를 대상으로 하여 조사했다고 하면 이 인원이 “표본”이다.

2. 데이터의 종류 데이터에는 ‘측정불가’ 데이터와 ‘측정가능’데이터로 분류한다. 또한 측정불가 데이터는 “카테고리 데이터” 측정가능 데이터는 “수량 데이터”라고 한다. 생각해 보기 a. 몸무게 f. 날씨 b. 키 g. 잡지의 발행부수 c. 영어 능력시험 급수 h. 기온 d. 출신지 i. 선호도 e. 유도의 단수 j. 제품의 두께

3. 도수분포표와 히스토그램 “맛있는 라면 BEST 50에 나와 있는 라면가격” 가격(원) 라면가게1 7,000원 라면가게2 8,500원 3 6,000원 4 6,500원 5 9,800원 6 7,500원 7 5,000원 8 8,900원 9 8,800원 10 11 12 7,200원 13 6,800원 가격(원) 라면가게 14 4,500원 15 7,900원 16 6,700원 17 6,800원 18 9,000원 19 8,800원 20 7,200원 21 8,500원 22 7,000원 23 7,800원 24 26 27 5,900원

3. 도수분포표와 히스토그램 “맛있는 라면 BEST 50에 나와 있는 라면가격” 가격(원) 라면가게 28 6,500원 29 5,800원 30 7,500원 31 8,000원 32 5,500원 33 34 7,000원 35 6,000원 36 37 38 8,800원 39 7,900원 가격(원) 라면가게 40 7,900원 41 7,800원 42 6,000원 43 6,700원 44 6,800원 45 6,500원 46 8,900원 47 9,300원 48 49 7,770원 50 7,000원

이렇게 구별해 놓는 것을 통계학에서는 ‘계급’이라고 함. 3. 도수분포표와 히스토그램 각각의 가게에는 라면이 1종류만 있다. 층(계급) 이상~ 미만 5층 9,000~10,000원 5 18 47 4층 8,000~9,000원 그리고 각층은 라면의 가격의 범위에 따라 구별 24 31 36 37 38 46 2 8 9 11 19 21 3층 7,000~8,000원 26 30 33 34 39 40 1 6 10 12 15 20 41 49 50 22 23 25 이렇게 구별해 놓는 것을 통계학에서는 ‘계급’이라고 함. 2층 6,000~7,000원 3 4 13 14 16 17 43 44 45 48 28 35 42 1층 5,000~6,000원 7 27 29 32

3. 도수분포표와 히스토그램 각층에서 파는 라면의 평균가격을 ‘계급 값’이라고 한다. 각층에 속해 있는 가게의 수를 ‘도수’라고 한다. 상대도수= 각급에 속한 데이터의 개수/ 전체 데이터 개수 그렇다면 3층의 상대도수는 얼마인가? 3층의 가게가 18개가 있고 전체 개수가 50개이므로 18/50=0.36임 즉 계급 값이 7,500인 상대도수는 0.36이고 36%임

3. 도수분포표와 히스토그램 계급 계급 값 도수 상대도수 5,000이상~6,000 미만 6,000이상~7,000미만 7,000이상~8,000미만 8,000이상~9,000미만 9,000이상~10,000미만 5,500 6,500 7,500 8,500 9,500 4 13 18 12 3 0.08 0.26 0.36 0.24 0.06 계 50 1.00

3. 도수분포표와 히스토그램 5500 7500 8500 9500 6500 15 20 10 5

4. 평균 볼링대회 결과 A팀 점수 별이 별이 준희 유미 수지 다해 재희 86 73 124 111 90 38 B팀 점수 동미 지아 하나 몽실 나미 아영 84 71 103 85 90 89 C팀 점수 지현 경희 미옥 진숙 가영 수진 229 77 59 95 70 88

5. 확률 확률밀도 함수: 히스토그램의 계급의 크기를 극한까지 작게 한 곡선의 식을 ‘확률밀도함수’라고 한다.

6. 정규분포 정규분포 식의 확률밀도 함수 참고: “e”는 ‘초월 수’라고도 하며 그 값은 2.7182….. 로 무리수이다. X-X의 평균/ X의 표준편차 2 정규분포 식의 확률밀도 함수 참고: “e”는 ‘초월 수’라고도 하며 그 값은 2.7182….. 로 무리수이다. 말하자 면 ∏와 같은 종류라고 생각하면 됨.

6. 정규분포 이 확률밀도 함수의 그래프는 ‘평균을 중심으로 좌우대칭이다’, 평균과 표준편차의 영향을 받는다.’의 특징이 있다.

6. 정규분포 20 40 60 80 0.02 0.04 0.06 0.08 평균이 53, 표준편차가 15 20 40 60 80 0.02 0.04 0.06 0.08 평균이 53, 표준편차가 5 X의 확률밀도 함수 일 때, 이를 “x는 평균이 53이고 표준편차가 15인 정규분포를 따른다.’라고 표현한다.

6. 정규분포 평균이 30, 표준편차가 5 0.08 0.06 0.04 0.02 20 40 60 80 X의 확률밀도 함수 일 때, 이를 “x는 평균이 OO이고 표준편차가 XX인 정규분포를 따른다.’라고 표현한다.

( ) 7. 표준정규분포 1 = f x e s p 2 X ( ) X의 확률밀도 함수가 1 é X - m ù - ê s ú 2 ë û s p 2 X 2

7. 표준정규분포 일 때, 통계학에서 “x는 평균이 0이고 표준편차가 1인 정규분포를 따른다고 하지 않고 “x는 표준정규분포를 따른다”고 한다.

7. 표준정규분포표 표준정규분포표 z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.0 0.1 0.2 . 1.8 1.9 0.0000 0.0398 0.0793 0.4641 0.4714 0.0040 0.0438 0.0832 0.4649 0.4719 0.0080 0.0478 0.0871 0.4656 0.4726 0.0120 0.0517 0.0910 0.4664 0.4732 0.0160 0.0557 0.0948 0.4671 0.4738 0.0199 0.0596 0.0987 0.4678 0.4744 0.0239 0.0636 0.1026 0.4686 0.4750 0.0279 0.0675 0.1064 0.4693 0.4756 0.0319 0.0714 0.1103 0.4699 0.4761 0.0359 0.0753 0.1141 0.4706 0.4767

7. 표준정규분포표 Z 이 부분의 넓이를 나타낸 표이다.

7. 표준정규분포표 1.96 0.4750 Z= 1.96이라고 하면 Z= 1.9+00.6이라고 할 수 있다.

7. 표준정규분포 1 표준정규분포든 혹은 확률밀도함수의 그래프는 곡선과 가로축이 만나서 생긴 면의 넓이는 언제나 ‘1’이다.

7. 표준정규분포 0.5

7. 표준정규분포 B마을에 사는 고등학교 1학년 학생 전원이 한 학원에서 수학시험을 보았다. 채점결과 수학점수는 평균이 45점이고 표준편차가 10점인 표준정규분포를 따른다고 한다면 수학점수가 63점 이상인 학생의 비율을 구하시오

7. 표준정규분포 0.05 0.04 63 0.03 0.02 0.01 5 10 15 20 25 25 30 35 45 50 55 60 65 70 75 80 85 90 95 100

이 값을 표준 정균 분포표에서 찾아보면 0.4671 이라는 것을 알 수 있다. 7. 표준정규분포 각 데이터-평균/표준편차= 63-45/10 = 1.8 0.5-0.4671=0.0359(=3.59%) 를 차지하는 것을 알 수 있다. 넓이=비율=확률이라는 부분으로 이해할 수 있다. 이 값을 표준 정균 분포표에서 찾아보면 0.4671 이라는 것을 알 수 있다.

8. 카이제곱분포 1 X>0 인 경우에는 자유도 2 2 = f x 일 때, 통계학에서는 이를 “ x는 자유도 OO의 카이제곱 분포를 따른다” 고 표현한다.

8. 카이제곱 분포 자유도가 ‘2’인 경우 0 5 10 15 20 0.5 0.4 0.3 0.2 0.1

8. 카이제곱분포 자유도가 ‘10’인 경우 0.5 0.4 0.3 0.2 0.1 0 5 10 15 20

8. 카이제곱분포 f f 자유도란? (x)= ax+b에서 a의 의미와 같다. (x)= ax+b b 여기서 ‘a’는 기울기를 의미한다. ‘a’값의 변동에 따라 그래프의 기울기도 변한다.

(=넓이=비율) P에 대응하는 가로축의 눈금 X 의 수치를 기록한 표를 8. 카이제곱분포표 이 부분의 확률 (=넓이=비율) P에 대응하는 가로축의 눈금 X 의 수치를 기록한 표를 말한다. 2 P ‘카이제곱’이라고 한다. 2 X

8. 카이제곱분포표 0.995 0.99 0.975 0.95 0.05 0.025 0.01 0.005 1 2 3 4 5 6 7 8 9 10 0.000039 0.0100 0.0717 0.2070 0.4118 0.6757 0.9893 1.3444 1.7349 2.1558 . 0.0002 0.0201 0.1148 0.2971 0.5543 0.8721 1.2390 1.6465 2.0879 2.5582 0.0010 0.0506 0.2158 0.4844 0.8312 1.2373 1.6899 2.1797 2.7004 3.2470 0.0039 0.1026 0.3518 0.7107 1.1455 1.6354 2.1673 2.7326 3.3251 3.9403 3.8415 5.9915 7.8147 9.4877 11.0705 12.5916 14.0671 15.5073 16.9190 18.3070 5.0239 7.3778 9.3484 11.1433 12.8325 14.4494 16.0128 17.5345 19.0228 20.4832 6.6349 9.2104 11.3449 13.2767 15.0863 16.8119 18.4753 20.0902 21.6660 23.2093 7.8794 10.5965 12.8381 14.8602 16.7496 18.5475 20.2777 21.9549 23.5893 25.1881 P 자유도