Presentation is loading. Please wait.

Presentation is loading. Please wait.

기초 통계학 지도위원 이광희.

Similar presentations


Presentation on theme: "기초 통계학 지도위원 이광희."— Presentation transcript:

1 기초 통계학 지도위원 이광희

2 1. 통계학이란? 표본이 되는 정보를 통해 모집단의 상황을 유추해 내는 학문

3 1-1. 통계학이란? Tip 모집단: 조사 대상으로 삼아야 할 집단 표본: 모집단에서 추출된 몇몇 개체 집단
예를 들면 국회지지율 조사를 하는 과정에서 우리나라 전체 유권자를 “모집단”이라고 하고 몇몇 인원을 추출하여 즉 2천명의 서울시에 거주하는 20~30대 유권자를 대상으로 하여 조사했다고 하면 이 인원이 “표본”이다.

4 2. 데이터의 종류 데이터에는 ‘측정불가’ 데이터와 ‘측정가능’데이터로 분류한다. 또한 측정불가 데이터는 “카테고리 데이터” 측정가능 데이터는 “수량 데이터”라고 한다. 생각해 보기 a. 몸무게 f. 날씨 b. 키 g. 잡지의 발행부수 c. 영어 능력시험 급수 h. 기온 d. 출신지 i. 선호도 e. 유도의 단수 j. 제품의 두께

5 3. 도수분포표와 히스토그램 “맛있는 라면 BEST 50에 나와 있는 라면가격” 가격(원) 라면가게1 7,000원 라면가게2
8,500원 3 6,000원 4 6,500원 5 9,800원 6 7,500원 7 5,000원 8 8,900원 9 8,800원 10 11 12 7,200원 13 6,800원 가격(원) 라면가게 14 4,500원 15 7,900원 16 6,700원 17 6,800원 18 9,000원 19 8,800원 20 7,200원 21 8,500원 22 7,000원 23 7,800원 24 26 27 5,900원

6 3. 도수분포표와 히스토그램 “맛있는 라면 BEST 50에 나와 있는 라면가격” 가격(원) 라면가게 28 6,500원 29
5,800원 30 7,500원 31 8,000원 32 5,500원 33 34 7,000원 35 6,000원 36 37 38 8,800원 39 7,900원 가격(원) 라면가게 40 7,900원 41 7,800원 42 6,000원 43 6,700원 44 6,800원 45 6,500원 46 8,900원 47 9,300원 48 49 7,770원 50 7,000원

7 이렇게 구별해 놓는 것을 통계학에서는 ‘계급’이라고 함.
3. 도수분포표와 히스토그램 각각의 가게에는 라면이 1종류만 있다. 층(계급) 이상~ 미만 5층 9,000~10,000원 5 18 47 4층 8,000~9,000원 그리고 각층은 라면의 가격의 범위에 따라 구별 24 31 36 37 38 46 2 8 9 11 19 21 3층 7,000~8,000원 26 30 33 34 39 40 1 6 10 12 15 20 41 49 50 22 23 25 이렇게 구별해 놓는 것을 통계학에서는 ‘계급’이라고 함. 2층 6,000~7,000원 3 4 13 14 16 17 43 44 45 48 28 35 42 1층 5,000~6,000원 7 27 29 32

8 3. 도수분포표와 히스토그램 각층에서 파는 라면의 평균가격을 ‘계급 값’이라고 한다.
각층에 속해 있는 가게의 수를 ‘도수’라고 한다. 상대도수= 각급에 속한 데이터의 개수/ 전체 데이터 개수 그렇다면 3층의 상대도수는 얼마인가? 3층의 가게가 18개가 있고 전체 개수가 50개이므로 18/50=0.36임 즉 계급 값이 7,500인 상대도수는 0.36이고 36%임

9 3. 도수분포표와 히스토그램 계급 계급 값 도수 상대도수 5,000이상~6,000 미만 6,000이상~7,000미만
7,000이상~8,000미만 8,000이상~9,000미만 9,000이상~10,000미만 5,500 6,500 7,500 8,500 9,500 4 13 18 12 3 0.08 0.26 0.36 0.24 0.06 50 1.00

10 3. 도수분포표와 히스토그램 5500 7500 8500 9500 6500 15 20 10 5

11 4. 평균 볼링대회 결과 A팀 점수 별이 별이 준희 유미 수지 다해 재희 86 73 124 111 90 38 B팀 점수 동미
지아 하나 몽실 나미 아영 84 71 103 85 90 89 C팀 점수 지현 경희 미옥 진숙 가영 수진 229 77 59 95 70 88

12 5. 확률 확률밀도 함수: 히스토그램의 계급의 크기를 극한까지 작게 한 곡선의 식을 ‘확률밀도함수’라고 한다.

13 6. 정규분포 정규분포 식의 확률밀도 함수 참고: “e”는 ‘초월 수’라고도 하며 그 값은 2.7182….. 로 무리수이다.
X-X의 평균/ X의 표준편차 2 정규분포 식의 확률밀도 함수 참고: “e”는 ‘초월 수’라고도 하며 그 값은 2.7182….. 로 무리수이다. 말하자 면 ∏와 같은 종류라고 생각하면 됨.

14 6. 정규분포 이 확률밀도 함수의 그래프는 ‘평균을 중심으로 좌우대칭이다’, 평균과 표준편차의 영향을 받는다.’의 특징이 있다.

15 6. 정규분포 20 40 60 80 0.02 0.04 0.06 0.08 평균이 53, 표준편차가 15 20 40 60 80 0.02 0.04 0.06 0.08 평균이 53, 표준편차가 5 X의 확률밀도 함수 일 때, 이를 “x는 평균이 53이고 표준편차가 15인 정규분포를 따른다.’라고 표현한다.

16 6. 정규분포 평균이 30, 표준편차가 5 0.08 0.06 0.04 0.02 20 40 60 80 X의 확률밀도 함수 일 때, 이를 “x는 평균이 OO이고 표준편차가 XX인 정규분포를 따른다.’라고 표현한다.

17 ( ) 7. 표준정규분포 1 = f x e s p 2 X ( ) X의 확률밀도 함수가 1 é X - m ù - ê s ú 2
ë û s p 2 X 2

18 7. 표준정규분포 일 때, 통계학에서 “x는 평균이 0이고 표준편차가 1인 정규분포를 따른다고 하지 않고 “x는 표준정규분포를 따른다”고 한다.

19 7. 표준정규분포표 표준정규분포표 z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.0 0.1 0.2 . 1.8 1.9 0.0000 0.0398 0.0793 0.4641 0.4714 0.0040 0.0438 0.0832 0.4649 0.4719 0.0080 0.0478 0.0871 0.4656 0.4726 0.0120 0.0517 0.0910 0.4664 0.4732 0.0160 0.0557 0.0948 0.4671 0.4738 0.0199 0.0596 0.0987 0.4678 0.4744 0.0239 0.0636 0.1026 0.4686 0.4750 0.0279 0.0675 0.1064 0.4693 0.4756 0.0319 0.0714 0.1103 0.4699 0.4761 0.0359 0.0753 0.1141 0.4706 0.4767

20 7. 표준정규분포표 Z 이 부분의 넓이를 나타낸 표이다.

21 7. 표준정규분포표 1.96 0.4750 Z= 1.96이라고 하면 Z= 이라고 할 수 있다.

22 7. 표준정규분포 1 표준정규분포든 혹은 확률밀도함수의 그래프는 곡선과 가로축이 만나서 생긴 면의 넓이는 언제나 ‘1’이다.

23 7. 표준정규분포 0.5

24 7. 표준정규분포 B마을에 사는 고등학교 1학년 학생 전원이 한 학원에서 수학시험을 보았다. 채점결과 수학점수는 평균이 45점이고 표준편차가 10점인 표준정규분포를 따른다고 한다면 수학점수가 63점 이상인 학생의 비율을 구하시오

25 7. 표준정규분포 0.05 0.04 63 0.03 0.02 0.01

26 이 값을 표준 정균 분포표에서 찾아보면 0.4671 이라는 것을 알 수 있다.
7. 표준정규분포 각 데이터-평균/표준편차= 63-45/10 = 1.8 =0.0359(=3.59%) 를 차지하는 것을 알 수 있다. 넓이=비율=확률이라는 부분으로 이해할 수 있다. 이 값을 표준 정균 분포표에서 찾아보면 이라는 것을 알 수 있다.

27 8. 카이제곱분포 1 X>0 인 경우에는 자유도 2 2 = f x 일 때, 통계학에서는 이를 “ x는 자유도 OO의 카이제곱 분포를 따른다” 고 표현한다.

28 8. 카이제곱 분포 자유도가 ‘2’인 경우 0.5 0.4 0.3 0.2 0.1

29 8. 카이제곱분포 자유도가 ‘10’인 경우 0.5 0.4 0.3 0.2 0.1

30 8. 카이제곱분포 f f 자유도란? (x)= ax+b에서 a의 의미와 같다. (x)= ax+b b
여기서 ‘a’는 기울기를 의미한다. ‘a’값의 변동에 따라 그래프의 기울기도 변한다.

31 (=넓이=비율) P에 대응하는 가로축의 눈금 X 의 수치를 기록한 표를
8. 카이제곱분포표 이 부분의 확률 (=넓이=비율) P에 대응하는 가로축의 눈금 X 의 수치를 기록한 표를 말한다. 2 P ‘카이제곱’이라고 한다. 2 X

32 8. 카이제곱분포표 0.995 0.99 0.975 0.95 0.05 0.025 0.01 0.005 1 2 3 4 5 6 7 8 9 10 0.0100 0.0717 0.2070 0.4118 0.6757 0.9893 1.3444 1.7349 2.1558 . 0.0002 0.0201 0.1148 0.2971 0.5543 0.8721 1.2390 1.6465 2.0879 2.5582 0.0010 0.0506 0.2158 0.4844 0.8312 1.2373 1.6899 2.1797 2.7004 3.2470 0.0039 0.1026 0.3518 0.7107 1.1455 1.6354 2.1673 2.7326 3.3251 3.9403 3.8415 5.9915 7.8147 9.4877 5.0239 7.3778 9.3484 6.6349 9.2104 7.8794 P 자유도


Download ppt "기초 통계학 지도위원 이광희."

Similar presentations


Ads by Google