경영통계학 통계학은 어떤 학문인가? What is Statistics? 1.1
수업소개 및 교재 교수: 박석강 손전화:010-3101-7001 mail. augustpark@gmail.com 연락:facebook –seok-gang.park 강의안:daum blog: 경제학이야기 교재 :켈러의 경영경제통계학(구내서점에 구입) 성적:중간(35),기말(35),과제(20),출석(10)
통계학의 정의 통계학이란 관심의 대상이 되는 자료를 수집,정리,분석하여 올바른 정보를 추출하고 이를 토대로 불확실한 사실에 대해 합리적인 판단을 내리며 미래를 예측하는 방법을 연구하는 학문이다.
통계학의 정의 및 구성
통계학과 통계분석 – 통계 분석의 5단계 자료의 수집 대상 집단의 특성을 잘 대표하도록 자료 수집 방법 : 표본 조사와 실험 수집된 자료의 요약·정리 모수의 추정 검정 모형 분석 대상 집단의 특성을 잘 대표하도록 자료 수집 방법 : 표본 조사와 실험 -그래프를 이용하는 방법 : 이산형 – 기둥 그림표, 원그림표 : 연속형 – 줄기와 잎 그림, 상자그림, 산포도 -숫자 요약 방법 : 평균, 중위수, 최빈값, 분산, 범위 -모집단 : 대상집단 -모수 : 모집단의 특성을 나타내는 값 -자료 수집을 통해 알려져 있지 않은 모수를 추정 -가설 검정 : 모집단에 대해 가설을 설정한 후 그 가설의 타당성 여부를 검정 : 서로 다른 2개의 가설 중 하나를 선택 : 모수적 방법, 비모수적 방법 -자료의 형태에 따라 다양한 형태의 분석 방법 존재 예) 회귀분석, 분산분석, 범주형 자료분석, 시계열 분석
“통계학은 데이터로부터 정보를 얻는 하나의 방법 론이다” 통계학이란 통계학(Statistics) 데이터(Data) 정보(Information) “통계학은 데이터로부터 정보를 얻는 하나의 방법 론이다” 1.2
기술통계학(Descriptive Statistics) -기술통계학은 데이터를 편리하고 정보를 나타내는 방식으로 정리, 요약, 설명하는 방법을 다룬다. -기술통계학의 한 가지 형태는 통계전문가들이 유용한 정보 를 추출하기 쉽게 데이터를 설명하는 그래프 기법 (graphical techniques)이다. -제2장에서는 다양한 그래프 기법들이 제시된다. 1.9
기술통계학(Descriptive Statistics) -기술통계학의 다른 형태는 데이터를 요약하는 수치 기법 (numerical techniques)이다. -평균(mean)과 중앙값(median)은 데이터의 중심 위치를 나 타내기 위해 널리 사용되는 척도이다. -범위(range), 분산(variance), 표준편차(standard deviation)은 데이터의 변동성을 나타내기 위해 사용되는 척 도이다. -제3장에서는 데이터의 다른 특성들을 나타내는 수치 통계 척도들이 제시된다. 1.10
기술통계학(Descriptive Statistics)
통계학의 개념 모집단(Population) -모집단(population ) 은 통계전문가가 관심을 가지고 있는 모 든 항목들의 그룹(집합)이다. -일반적으로 매우 크고 종종 무한히 클 수 있다. 표본(Sample) -표본(sample) 은 모집단으로부터 추출된 데이터 집합이다. -매우 크기도 하지만 모집단보다는 작다. 1.23
통계학의 개념 모수(Parameter) -모집단(population)의 기술적 척도. 통계량(Statistic) -표본(sample)의 기술적 척도 1.24
주요통계학의 개념 Population Sample Statistic Parameter 부분집합 Statistic Parameter 모집단은 모수들을 가지고 있다. 표본은 통계량들을 가지고 있다. 1.25
추론통계학 -기술통계학은 분석되는 데이터를 설명해주나 모집단에 관한 결론을 내리거나 추론을 할 수 없다. 따라서 통계학의 다른 분야인 추론통계학(inferential statistics)이 필요하다. -추론통계학도 다양한 방법을 가지고 있으나 표본데 이터에 기초하여 모집단의 특성에 관한 결론을 내리 거나 또는 추론하기 위해 사용된다.
표본의 통계량에 기초하여 모집단의 모수에 관하여 무엇을 추론할 수 있는가? 통계적 추론 -통계적 추론(Statistical inference) 은 표본데이터에 기초하여 모집단에 관한 추정,예측, 의사결정을 하는 과정(process)이다. Sample 통계적 추론 Statistic Parameter 표본의 통계량에 기초하여 모집단의 모수에 관하여 무엇을 추론할 수 있는가? 1.28
통계적추론 -모수(parameters)에 관한 추론을 하기 위해 통계량 ( statistics)이 사용된다. -표본(sample)데이터에 기초하여 모집단(population)에 관 한 추정, 예측, 결론을 얻을 수 있다. 1.29
통계적 추론 논거: • 대모집단에서는 모든 구성원 각각을 조사하는 일이 가능 하지도 않고 비용이 많이 든다. • 표본을 추출하고 표본으로부터 모집단에 관한 추정치를 구하는 것이 더 쉽고 비용이 덜 든다. 그러나: 표본으로 구해지는 결론과 추정치들은 항상 옳은 것이 아니다. 이와 같은 이유로, 통계적 추론에 신뢰의 척도, 즉 신뢰수 준(confidence level) 과 유의수준(significance level)이 도입된다. 1.30
신뢰수준과 유의수준 -신뢰수준(confidence level )은 표본추출이 매우 많은 수로 반복되는 경우 추정과정이 정확한 결과를 제공하는 표본의 비율이다. 예. 95%의 신뢰수준은 표본추출이 매우 많이 반복되는 경우 추정치가 정확한 결과를 제공하는 표본의 비율이 95%라는 것을 의미한다. -통계적 추론의 목적이 모집단에 관한 결론을 도출하는 것일 때, 유의수준(significance level )은 표본추출이 매우 많이 반 복되는 경우 결론이 잘못인 경우가 발생되는 표본의 비율이다. 예. 5%의 유의수준은 표본추출이 매우 많이 반복되는 경우 결론이 잘못된 결과를 제공하는 표본의 비율이 5%라는 것 을 의미한다. 1.31
신뢰수준과 유의수준 신뢰수준(Confidence Level) + 유의수준(Significance Level) = 1 - 만일 α (Greek letter “alpha”)가 유의수준을 나타낸 다면, 신뢰수준은 1 – α 이다. -이와 같은 관계는 다음과 같이 나타낼 수 있다. 신뢰수준(Confidence Level) + 유의수준(Significance Level) = 1 1.32