Statistics (First Term/2009) Sangji University
Why do you learn statistics ? 통계학 ? 자료 확률과 확률분포 이항분포와 정규분포 표본분포 추정과 검정 상관분석과 회귀분석 범주형 자료분석 표본조사 성적처리 중간(30%) + 기말(30%) + 숙제(20%) + 출석(20%)
통계학 통계(분석 ?)의 대상이 갖추어야 할 조건 응용분야 융복합화 관심대상에 대하여 관련된 자료를 수집하고 그 자료를 요약 정리한 것으로부터 불확실한 사실에 대한 결론이나 일반적인 규칙성을 추구하는 학문(예습) 통계(분석 ?)의 대상이 갖추어야 할 조건 첫째 대상은 항상 구체적으로 현실에 존재하는 것이어야 한다. 둘째 관심현상은 변수로 나타낼 수 있어야 한다. 리커드 척도 셋째 현상은 항상 유동적이며 변동성이 있어야 한다. 결과가 하나밖에 나타나지 않는 기정사실이어서는 안 된다. 넷째 유동성과 변동성에는 규칙성과 일반성이 있어야 한다. 응용분야 여론조사, 후보자 당선 예측율 분석, 공장의 경영, 교통량분석, 암치료의 효과분석, 교육방법의 평가, 식단연구, 수명연구 등등 융복합화 방대한 수치적, 계량적 자료계산의 편리함을 위하여 컴퓨터의 사용이 익숙해 지도록 프로그래밍 분야와 연계
개요(1)
개요(2)
개요(3)
History of Statistics 시대 통계학자 연구분야 고대그리스 철학자 Ideas - no quantitative analyses 17세기 Graunt, Petty 인구통계학 연구 Pascal, Bernoulli 도박, 게임을 통한 확률 연구 18세기 Laplace, Gauss 천문학을 통한 정규곡선, 회귀 연구 19세기 Quetelet 생태학에 통계학적 분석을 처음으로 적용한 천문학자 Galton 인간의 genetic variation을 회귀와 상관을 이용하여 분석 20세기 (전반) Pearson 상관을 이용하여 자연도태 연구 Biometrika journal 창립 카이제곱 분석 개발 Gossett (Student) 양조과정 연구 소표본에 관한 문제를 statistics community에 제기 Student's test 개발 Fisher evolutionary biologists ANOVA 개발 실험계획법의 중요성 강조
20세기 (후반) Wilcoxon 살충제를 연구한 생화학자 two-sample tests의 비모수적 방법 연구 Kruskal, Wallis ANOVA의 비모수적 방법을 연구한 경제학자 Spearman 상관계수의 비모수적 방법을 연구한 심리학자 Kendall 상관계수의 비모수적 방법을 연구한 통계학자 Tukey 다중비교를 연구한 통계학자 Dunnett 살충제를 연구한 생화학자 control groups에 대한 다중비교를 연구 Keuls 다중비교를 연구한 농업경제학자 Computer Technology 수작업과 계산기에 의한 계산의 복잡성을 극복 stimulated the growth of investigation into new techniques
1. 직종별 월 임금수준의 최근 동향을 알고자 한다. 어떻게 ? - 자료의 양(직종, 나이, 성별, …) ? 1. 통계학이란?(P 2) - 관심의 대상에 대한 자료를 수집하고 정리, 요약하며, 제한된 자료나 정보를 토대로 불확실한 사실에 대하여 과학적인 판단을 내릴 수 있도록 그 방법을 제시하여 주는 학문 1. 직종별 월 임금수준의 최근 동향을 알고자 한다. 어떻게 ? - 자료의 양(직종, 나이, 성별, …) ? 2. 전구의 평균수명은 어떻게 알 수 있을까? - 공장에서 생산되는 모든 전구의 수명을 테스트 한다? - 공장에서 생산된 일부 전구의 수명을 테스트 한다 - 각각의 장단점은 무엇인가? 3. 생선 통조림 회사의 미래는? - 미래의 사업 계획을 세우기 위하여 앞으로의 어획량과 시장 점유율 등을 알고 싶어 한다. 방법은? - 정확히 안다는 것은 가능할까? 불가능 할까? 여러 가지 관련된 자료들을 과학적으로 분석하여 가능한 진실에 가깝게 이러한 것들을 예측할 수 있는 방법을 제시
우리나라 어종 별 월 먹이 섭취량을 모든 어류에 대해서 다 알고 있다고 하자. - 만약 여러분 이라면 이 자료를 가지고 무엇을 할 수 있을까? - 혹시 라도 분석상의 문제점 (한계)은 없을까? 4 1 6 2 4 2 5 3 3 1 1 2 6 4 3 어떤 결론을 내리기 힘들다? 6 6 2 5 1 3 방대함 4 4 5 2 1 2 무수히 많은 숫자들 중에서 어떠한 특성을 찾아내기가 힘들다? 4 4 1 3 3 6 6 6 5 5 2 무수히 많은 숫자들을 가지고 타인에게 내가 뜻하는 결과를 설명하기가 어렵다? 1 4 6 4 6 4 5 3 6 6 1 1 1 3 2 3 4 5 2 2 6 2 1 2 1 1
새로운 어류양식 사료를 개발할 때 신상품에 대한 광어의 선호도를 알고 싶다. 조사자의 불성실, 응답자의 불성실, 집계 과정에서의 사무적 오차 등을 고려 선택된 표본의 대표성, 표본수의 적합성 등을 고려 모집단과 표본?-P 3 새로운 어류양식 사료를 개발할 때 신상품에 대한 광어의 선호도를 알고 싶다. - 양식장 내의 모든 광어를 대상으로 선호도를 조사한다. - 전체 광어 중 일부분을 선별하여 정확히 조사한다. - 각 안의 장 단점은 무엇인가? 생선 통조림, 양식 사료의 예에서 나타난 공통점은 무엇인가? 전체 관심의 대상 중 일부분을 뽑아서 통계 처리 관심의 대상이 대는 모든 개체의 관측값이나 측정값의 집합을 모집단(population)이라 함 추출기법 모집단 표본 모집단(population)에서 실제로 추출한 관측값이나 측정값의 집합을 표본 (sample)이라 함 표집
모집단(population): - 전체대학 유권자 각각이 선호하는 결과(후보자)를 모두 모은 것 상지대학교 학생 예) 4명의 미스 상지 후보자 갑순, 을순, 병순, 정순에 대하여 전체 유권자들의 지지성향을 알아보기 위하여 각 단과대학(이공, 농생, 사회과학 등) 별로 50명의 유권자들을 뽑아서 조사를 실시하려고 한다. 이때 모집단과 표본은 무엇인가? 이때 단과대학별로 50명씩 배분(할당?)하는 것이 타당한가? 모집단(population): - 전체대학 유권자 각각이 선호하는 결과(후보자)를 모두 모은 것 표본 (sample): - 추출된 250명 대하여 실제로 조사된 값들을 모은 것 모집단(P 4) 유한모집단 : 원소의 수가 유한한 경우 무한모집단 : 원소의 수가 무한한 경우 기술통계학 & 추측통계학(P 5) 모집단으로부터 표본의 개수 미 대통령선거(1948) 듀이(공화) & 투르먼(민주) How survey 객관적 → 주관적 절차(선택) 가정방문 조사 → 전화조사(86부터) : 전화번호 생성 실제결과 확률표본 할당표본 Dewey 42.7 46.0 52.0 Truman 52.6 50.5 45.3 Wallace 3.5 2.9 2.5