Download presentation
Presentation is loading. Please wait.
Published byBodil Gustavsen Modified 6년 전
1
제 13 장 정규분포곡선과 확률히스토그램 동전던지기와 정규분포 개념이 다른 두 히스토그램 : 경험적 히스토그램과 확률히스토그램
제 13 장 정규분포곡선과 확률히스토그램 동전던지기와 정규분포 개념이 다른 두 히스토그램 : 경험적 히스토그램과 확률히스토그램 경험적 히스토그램과 확률히스토그램의 관계 확률히스토그램과 정규분포곡선: 중심극한정리 정규분포곡선으로서의 근사 정규분포곡선의 사용 범위 맺음말
2
INDEX 1 2 3 4 동전 던지기와 정규분포 개념이 다른 두 히스토그램: 경험적 히스토그램과 확률히스토그램
경험적 히스토그램과 확률히스토그램의 관계 4 확률히스토그램과 정규분포곡선: 중심극한정리
3
1. 동전 던지기와 정규분포 동전 던지기를 반복할 때 앞면이 나오는 비율은 점차 50%에 가까워진다.
Ex) 동전을 다섯 번 던진 경우 앞면이 나오는 회수 경우의 수 1 5 2 10 3 4 동전을 백 번 던지면?
4
동전 던지기와 정규분포 동전을 백 번 던지면... 경우의 수 앞면이 정확히 50번 나오는 경우의 수
정확히 앞면이 50번 나올 확률 앞면이 50회 나오는 경우의 수 총 경우의 수
5
동전던지기와 정규분포 위와 같은 방식으로 동전을 100번 던졌을 때 앞면이 정확히 50번 나올 확률을 계산하기는 불편하다.
대안은? 동전을 많이 던지는 경우 전체 시행횟수 가운데 앞면이 나오는 횟수 또는 앞면이 나오는 비율은 그 분포가 정규분포에 의해서 잘 근사된다. 뒤에서 정규분포곡선을 이용하여 이 문제를 다시 푼다. 답은 7.96%가 나온다. 앞에서 이항분포를 이용해 구한 정답 8%와 거의 같다.
6
INDEX 1 2 3 4 동전 던지기와 정규분포 개념이 다른 두 히스토그램: 경험적 히스토그램과 확률히스토그램
경험적 히스토그램과 확률히스토그램의 관계 4 확률히스토그램과 정규분포곡선: 중심극한정리
7
2. 개념이 다른 두 히스토그램 확률히스토그램 경험적 히스토그램 둘 간의 관계:
경험적 히스토그램과 확률히스토그램 확률히스토그램 상자의 내용물 및 추출횟수로부터 합이 각각의 값으로 실 현될 확률을 계산하여 이를 그래프로 나타낸 것. 경험적 히스토그램 관찰한 자료를 구간별로 분류하고 도수를 계산한 뒤 도수 를 밀도단위로 바꾸어 그래프로 표현한 것 둘 간의 관계: 모집단과 표본의 관계와 같다.
8
INDEX 1 2 3 4 동전 던지기와 정규분포 개념이 다른 두 히스토그램: 경험적 히스토그램과 확률히스토그램
경험적 히스토그램과 확률히스토그램의 관계 4 확률히스토그램과 정규분포곡선: 중심극한정리
9
3. 경험적 히스토그램과 확률히스토그램의 관계 경험적 히스토그램과 확률히스토그램 동전을 실제로 던진 (경험적) 자료를 가지고 히스토그램을 그리면 던진 횟수가 증가함에 따라 상대 도수를 나타내는 이 경험적 히스토그램은 확률을 나타내는 확률히스토그램 으로 수렴하게 된다. 평균의 법칙 경험적 히스토그램 확률히스토그램 n → ∞
10
경험적 히스토그램: 두 개의 주사위를 던져 그 합을 기록하는 시행
3. 경험적 히스토그램과 확률히스토그램의 관계 경험적 히스토그램: 두 개의 주사위를 던져 그 합을 기록하는 시행 (a) 시행을 100 번 반복한 경우 (b) 시행을 1000 번 반복한 경우 (c) 시행을 번 반복한 경우
11
3. 경험적 히스토그램과 확률히스토그램의 관계 합의 확률히스토그램
확률 히스토그램 합의 확률히스토그램 두 주사위를 무한히 많이 던져 그 합에 대한 경험적 히스토그램의 극한으로 얻어낼 수 있다. 두 주사위를 던졌을 때 나타나는 모든 경우의 수를 고려하여 머리를 써서 계산해 낼 수 있다. 확률히스토그램
12
INDEX 1 2 3 4 동전던지기와 정규분포 개념이 다른 두 히스토그램: 경험적 히스토그램과 확률히스토그램
경험적 히스토그램과 확률히스토그램의 관계 4 확률히스토그램과 정규분포곡선: 중심극한정리
13
동전을 백 번 던질 때 앞면이 나올 횟수의 확률히스토그램과 정규분포곡선
4. 확률히스토그램과 정규분포곡선 중심극한정리 앞면이 나올 횟수의 기대값 : 50 앞면의 나올 횟수의 표준오차 : 5 정규분포곡선과 매우 비슷하다. 동전을 백 번 던질 때 앞면이 나올 횟수의 확률히스토그램과 정규분포곡선
14
4. 확률히스토그램과 정규분포곡선 중심극한정리
100회 던질 때 확률히스토그램은 시행횟수가 증가함에 따라 그 모습이 점점 더 정규분포곡선과 닮아간다. 400회 던질 때
15
4. 확률히스토그램과 정규분포곡선 무한히 많이 던지면?
중심극한정리 관측치 수가 증가함에 따라 합이나 평균은 그 확률히스토그램이 정규분포곡선으로 수렴해 간다. 이를 중심극한정리라고 한다. 900회 던질 때 무한히 많이 던지면?
16
INDEX 5 정규분포곡선으로의 근사 정규분포곡선의 사용 범위 6 7 맺음말
17
5. 정규분포곡선으로의 근사 동전을 100번 던진다. 다음을 계산하라. 앞면이 정확히 50번 나올 확률
보기 1 동전을 100번 던진다. 다음을 계산하라. 앞면이 정확히 50번 나올 확률 앞면이 45이상 55이하로 나올 확률 앞면이 45초과 55미만으로 나올 확률
18
5. 정규분포곡선으로의 근사 앞면이 정확히 50번 나올 확률 ☞ 기대값은 50이고, 표준오차는 5이다. 보기 1
정확히 50번 나오는 경우는 밑변이 49.5에서 50.5인 직사각형의 면적을 구하면 된다. 정규분포 이 용 정규분포 곡선을 이용하여 구한 근사값인 7.96%는 앞 절에서 구한 8%와 별 차이가 없다. 7.96%
19
5. 정규분포곡선으로의 근사 (b) 앞면이 45이상 55이하로 나올 확률 (c) 앞면이 45초과 55미만으로 나올 확률
보기 1 (b) 앞면이 45이상 55이하로 나올 확률 (c) 앞면이 45초과 55미만으로 나올 확률
20
INDEX 5 정규분포곡선으로의 근사 정규분포곡선의 사용 범위 6 7 맺음말
21
6. 정규분포곡선의 사용 범위 정규분포곡선의 사용범위 동전던지기와는 달리 내용물의 분포가 대칭이 아닌 일반적인 상자로부터 숫자를 추출하더라도, 추출횟수만 충분히 크면 추출된 숫자의 합은 상자의 내용물에 관계없이 정규분포곡선으로 잘 근사 된다. 다만, 상자의 내용물에 따라 합의 확률히스토그램이 정규분포곡선으로 닮아가는 속도는 다르다. 상자의 내용물을 히스토그램으로 나타냈을 때 그 모양이 정규분포곡선과 비슷할수록 합의 확률히스토그램이 정규분포곡선으로 닮아가는 속도는 빨라진다.
22
6. 정규분포곡선의 사용 범위 0 이 9장, 1 이 1장 들어 있는 상자의 확률히스토그램 0 1 상자의 분포 25회 추출
0 1 100 50 상자의 분포 25회 추출 100회 추출 400회 추출
23
6. 정규분포곡선의 사용 범위 50 % 상자의 분포 상자의 내용물이 대칭인 경우 25회 추출 50회 추출
24
6. 정규분포곡선의 사용 범위 상자의 내용물이 비대칭인 경우 1 2 3 4 5 6 7 8 9 상자의 분포 25회 추출
50 % 상자의 분포 25회 추출 100회 추출
25
6. 정규분포곡선의 사용 범위 중심극한정리는 곱에 대해서는 성립하지 않는다. ☞ 곱의 히스토그램은 정규분포곡선과 다르다.
시행횟수를 증가시켜도 곱의 확률히스토그램은 정규분 포곡선에 가까와지지 않는다. 곱의 히스토그램은 정규분포곡선으로 수렴하지 않는다.
26
곱의 확률히스토그램은 표본크기가 커져도 정규분포로 수렴하지 않는다!
6. 정규분포곡선의 사용 범위 곱의 확률히스토그램은 표본크기가 커져도 정규분포로 수렴하지 않는다!
27
INDEX 5 정규분포곡선으로의 근사 6 정규분포곡선의 사용 범위 7 맺음말
28
7.맺음말 중심극한정리 중심극한정리 상자로부터 무작위로 복원추출할 때 추출횟수가 증가함에 따라 합 또는 평균에 대한 확률히스토그램은 정규분포곡선과 닮아간다. 이는 상자의 내용물에 관계없이 항상 성립한다. 다만 확률히스토그램을 정규분포곡선으로 근사시킬 때 근사에 필요한 최소한의 추출횟수가 달라진다. 상자의 내용물 분포가 정규분포곡선과 비슷하면 추출횟수가 적어도 근사가 잘 되나 그렇지 않으면 추출횟수가 많아야 한다.
29
7.맺음말 기대값은 확률히스토그램의 중심을 나타내고, 표준오차는 그 퍼진 정도를 나타내 준다.
기대값과 표준오차 확률히스토그램이 정규분포곡선을 따르면 그 전체 모양은 기대값과 표준오차만으로 완벽하게 묘사된다. 합의 기대값과 표준오차는, 상자의 평균 상자의 표준편차 추출횟수로부터 구할 수 있다. 기대값은 확률히스토그램의 중심을 나타내고, 표준오차는 그 퍼진 정도를 나타내 준다.
30
7.맺음말 히스토그램의 수렴 (1)
31
7. 맺음말 히스토그램의 수렴 (2)
Similar presentations