제 1 장 통계학이란 어떤 학문인가?
학 습 목 표 (1) 왜 통계학을 배우는지에 대해 이해할 수 있다 (2) 기술통계학과 추측통계학의 차이점을 설명할 수 있다 학 습 목 표 (1) 왜 통계학을 배우는지에 대해 이해할 수 있다 (2) 기술통계학과 추측통계학의 차이점을 설명할 수 있다 (3) 질적변수와 양적변수를 구분할 수 있다 (4) 이산변수와 연속변수가 서로 어떻게 다른지 서술할 수 있다 (5) 명목척도, 서열척도, 등간척도, 비율척도를 구분할 수 있다 통계학 가장 재미있는 과목!!!
서 론 1. 의사결정(Decision Making)의 도구 - 인간의 의사결정을 지원하는 학문으로서 통계학 서 론 1. 의사결정(Decision Making)의 도구 - 인간의 의사결정을 지원하는 학문으로서 통계학 의사결정 과정 문제 및 상황 인식 → 정보 수집 및 분석→ 최선 해결책 선정과 평가 → 해결책 적용 일상 생활에서의 의사결정 샤워용 물 온도, 피자 맛보기, E-mart에서 샘플 맛보기 경영활동에서의 의사결정 제품 디자인, 중량, 광고효과, 불량품 발생 여부 파악 자료를 정리하고, 분석하고, 가공하여 정보를 제공하는 지식과 기법 필요 이를 수행하는 학문 통계학 경영학도로서 자료를 정리하고, 분석하고, 가공하고, 정보를 제공하는 지식과 기법 필요
참조 : 의사결정과정 1. 의사결정(Decision Making)의 도구 - 인간의 의사결정을 지원하는 학문으로서 통계학 의사결정단계 1 문제나 상황 인식 : 의사결정의 필요를 낳게 한 문제나 상황을 이해 의사결정단계 2 정보 수집 및 분석 : 문제가 생긴 원인이나 문제해결의 가능한 방법에 대한 정보를 수집하여 분석 의사결정단계 3 해결(방)책 선정과 평가 : 가능한 여러 대안을 확인하고, 시행과정에서 예상되는 결과를 비교 해결책을 선정하고 평가하는 과정에서 “합리적 경제인 가정” 최종 대안의 선정에서 결정에 의해 영향을 받을 사람들에게 받아들여질 수 있는 최선의 결정을 내리는 단계 의사결정단계 4 해결책 적용 : 문제 해결 → 종료, 문제 해결실패 → 정보 수집 혹은 해결책 선정 환류
참조 : 의사결정구조 OODA OODA 주기, 보이드 주기 Orientation Decide Observation Action 상황변화, 외부정보/데이터 주시, 기다림 행동하지 않음 행동한다 신속한 대응 OODA 주기, 보이드 주기 보이드 1927-1997 20
OODA, 보이드 주기가 빠른 F-86이 Mig-15에 승리 의사결정과정이 경쟁기업보다 빨라야 의사결정에서 올바른 의사결정 중요 빠른 의사결정 중요 위의 사례는 의사결정 구조와 과정에서 데이터가 있는 경우와 없는 경우 데이터 있는 경우 활용 데이터 없는 경우 -> 데이터 수집 필요 오류, 잘못된 의사결정에 빠지는 것 방지 필요 OODA, 보이드 주기가 빠른 F-86이 Mig-15에 승리 격추비율 : Mig-15 10대당 F-86 1대 손실 20
왜 통계학을 공부하는가? 1. 통계학을 필수적으로 요구하는 이유? - 첫째, 어디에나 수치(숫자, 계량화 된)적인 정보의 존재 → 수치 정보가 없다면 일상생활 어려움 → 수치가 없다면 정보로서의 가치가 떨어진다 - 둘째, 통계적인 기법들이 우리 일상생활에 영향을 주는 의사결정에 활용 → 보험회사들의 보험료률 결정을 위한 통계적 분석 → 예) 인간의 기대수명, 사고발생률 등 - 셋째, 통계적 방법을 이해함으로써 의사결정이 어떻게 이루어지는지 이해 하게 되고, 이것이 우리들에게 어떠한 영향을 주는지를 보다 잘 이해할 수 있도록 해 주기 때문 정보의 획득으로 많은 정보를 가지는 것은 불확실성을 감소시킨다. 정보는 의사결정에 필요한 새로운 사실들을 알려주기 때문에 어떤 의사결정을 내릴 때 불확실성을 감소시켜 주고 합리적인 결정을 내릴 수 있도록 도와주는 기능 “합리적인 경제인 가정” 불확실한 상황에서의 의사결정 잘못된 의사결정을 내릴 가능성이 높다. 의사결정에는 자료 수집 및 정보 필요
왜 통계학을 공부하는가? 2. 의사결정을 위한 절차 - 첫째, 기존의 정보가 적절한지 아니면 추가적 정보가 요구되는지 판단 - 둘째, 잘못된 결과를 유도하지 않도록 만약 필요하다면 추가적인 정보의 수집 - 셋째, 정보를 유용하고 유익한 방법으로 요약 - 넷째, 활용 가능한 정보를 분석 - 다섯째, 부정확한 결론에 대한 위험을 평가, 결론을 도출하고, 추론 수치(숫자, 계량)적 자료의 존재 최종적으로 의사결정을 효과적으로 할 수 있음 의사결정을 위한 통계적 기법 사용 자료를 수반하는 전문적인 의사결정
①자료 수집, ②정리, ③제시, ④분석 및 해석하는 과학 수치 자료(Data)가 없으면 통계학도 없다 통계란 무엇을 의미하는가? 1. 통계? - 첫째, 수치 정보 → 대학 졸업자의 평균 초임, 알코올 중독 사망자의 수 - 둘째, 특정 값이나 비율 → 코스피 지수의 변화 통계 : 수치정보의 집합, 주의 집중, 대량의 정보 보여주는데 유용 통계학 보다 효과적인 의사결정을 도와주기 위해서 ①자료 수집, ②정리, ③제시, ④분석 및 해석하는 과학 수치 자료(Data)가 없으면 통계학도 없다
통계학의 정의 모집단 관심의 대상이 되는 집단의 자료 수집/정리/분석하여 모집단 자료 수집 및 측정 표본자료 분 석 정 보 모집단 의사결정 및 추론을 위한 유용한 자료 샘플 기술통계 추론통계 통계학 관심의 대상이 되는 집단의 자료 수집/정리/분석하여 올바른 정보 추출하고, 이를 토대로 불확실한 사실에 대해 합리적인 판단 내리며 미래 예측하는 방법을 연구하는 학분
기술 통계학 (Descriptive Statistics) 통계적 추론, 추측 통계학 (Statistical Inference) 통계학의 유형 표나 그래프 또는 수치로 조사 대상의 자료들을 분류, 정리, 요약하는 통계학의 영역 예) 신문, 정기 간행물 기업 보고서 등 - 일반인이 이해하기 쉬움 기술 통계학 (Descriptive Statistics) 모집단 전체 대상 모집단으로부터 추출한 표본의 자료를 이용하여 모집단의 특성에 대한 가설을 추정하고 검정하는 통계학의 영역 예) 논문 작성, 대통령 지지율 등 - 일반인이 이해하기 조금 어려움 - 오차율, 신뢰구간 등 통계적 추론, 추측 통계학 (Statistical Inference) 표본 통해 모집단 특성 유추 앞으로 주요 강의 진행 방향
의미 있는 자료의 시작 : 도수분포표(Frequency Table) 통계학의 유형 1. 기술통계학(Descriptive Statistics) - 정의 : 자료를 유용한 정보를 주는 방법으로 정리, 요약, 제시하는 방법 으로서 통계학 - 주요 역할 → 정리되지 않은 자료 : 쓸모(의미) 없음 → 정리되지 않은 자료를 의미 있는 형태로 정리할 수 있는 통계적 기법 의미 있는 자료의 시작 : 도수분포표(Frequency Table) 가장 기본적인 통계의 시작 : 기술 통계학
통계학의 유형 2. 추측통계학(Inferential Statistics, Statistical Inference) - 정의 : 모집단에서 추출된 표본으로부터 모집단에 대한 무엇인가를 알아내는 것 - 주요 역할 → 모집단에서 추출된 표본으로부터 모집단에 대한 무엇인가를 알아 내는 것 핵심용어 모집단(Population) : 관심 있는 사람, 사건의 전체 집합 표본(Sample) : 관심 있는 모집단의 부분 혹은 일부 추측 통계학 = 통계적 추론 표본에 기초하여 모집단의 특성을 추정하기 위해 사용되는 방법 : 추측 통계학
통계학의 유형 2. 추측통계학(Inferential Statistics, Statistical Inference) - 주요 역할 → 모집단에서 추출된 표본으로부터 모집단에 대한 무엇인가를 알아 내는 것 관심 있는 연구대상 모집단 샘플 추측 통계학 = 통계적 추론 실제 연구(처리)대상
변수의 유형 변수의 유형 질적변수 양적변수 이산변수 연속변수 PC의 상표 결혼상태 머리카락 색깔 가구당 자녀의 수 홀당 골프 타수 소유 TV 세트의 수 납부한 소득세 금액 학생의 체중 플로리다 주 Tempa시의 연중 강우량
변수의 유형 1. 변수 유형의 구분 - 질적 변수와 연속 변수 → 질적 변수 : 조사되는 특성이 수치(숫자)가 아닌 경우 성별, 종교, 소유 차종, 출생국, 눈동자 색깔 등 도표나 막대그래프로 표현 → 양적 변수 : 조사되는 특성을 수치(숫자)로 나타낼 수 있을 때 이산적(discrete)이거나 연속적(continuous) → 이산 변수 : 특정의 값만을 취할 수 있고, 값과 값 사이에 간격 존재 주택의 침실 수(0, 1, 2, 3, …), 학생 수(0, 1, 2, 3, …) 소수점으로 나타낼 수 없다(침실 수 : 3.2456개 표현 불가) → 연속 변수 : 관측치는 특정 구간에서 어떠한 값도 취할 수 있다 타이어 공기압, 토마토 개당 중량, 비행시간 등 소수점으로 나타낼 수 있다(공기압 : 52.5698…) (셈, 세어본 결과) 추측 통계학 = 통계적 추론 (측정한 결과)
결과에 대한 자연적인 순서 없음 : 연산결과 의미 없음 측정의 수준 1. 명목척도 자료 - 질적 변수의 명목수준 측정은 분류하거나 셈하기 위한 것 - 유일한 측정은 계수, 퍼센트로 변환시키기도 함 - 예) 머리카락의 색깔, 성별 등 - 같은 자료의 처리를 위하여 정보에 수치적인 코드 부여 관심 있는 변수는 범주나 결과로 분류 결과에 대한 자연적인 순서 없음 : 연산결과 의미 없음
아주 높은 5단계에서부터 가장 낮은 1단계의 위험수준 자료는 상대적인 값을 가지는 표식이나 명칭의 집합 측정의 수준 2. 서열척도 자료 - 하나의 분류가 다음 것 혹은 다른 것보다 우위에 있거나 우월하다는 것 - 그룹 간 차이의 크기는 알 수 없음 테러행위의 위험에 대한 정보 아주 높은 5단계에서부터 가장 낮은 1단계의 위험수준 위험수준의 순위(서열)만을 알 수 있음 달리기의 1위, 2위, 3위의 구분 만 있는 경우 자료는 상대적인 값을 가지는 표식이나 명칭의 집합 (높음, 중간, 낮음)으로 이루어짐 상대적인 값 때문에 구분된 자료들은 서열 혹은 순위만 가짐(달리기 1위, 2위, 3위, …)
동일한 특성 차이를 동일한 측정 차이로 나타낼 수 있음 측정의 수준 3. 등간척도 자료 - 서열척도가 가지는 특성을 모두 가지면서 각 값간의 차이가 일정하다는 특성을 가짐 - 수치 간의 간격은 동일하나 비율이 존재하지 않을 때 - 예) 온도계의 눈금 값, 여성복 사이즈 등 자료들은 특성의 양에 따라 순위를 매길 수 있다 동일한 특성 차이를 동일한 측정 차이로 나타낼 수 있음
자료가 가지고 있는 특성에 따라 순서를 부여할 수 있음 특성에 부여된 동일한 수치의 차이로 나타낼 수 있음 측정의 수준 4. 비율척도 자료 - 등간척도의 모든 특성을 가지고 있으면서 동시에 영점이 의미가 있고 두 수치 간의 비율도 의미가 있음 - 예) 임금, 생산량, 중량, 주가변동, 지점 간의 거리 등 성명 부(父) 자(子) Lahey 80000 40000 Nale 90000 30000 Rho 60000 120000 Steel 75000 130000 자료가 가지고 있는 특성에 따라 순서를 부여할 수 있음 특성에 부여된 동일한 수치의 차이로 나타낼 수 있음 두 수치 간의 비율에도 의미가 있다
척도의 주요 특징 요약 척 도 명목척도 서열척도 등간척도 비율척도 자료는 구분될 뿐이다 자료는 서열이 있다 값 간의 차이가 척 도 명목척도 서열척도 등간척도 비율척도 자료는 구분될 뿐이다 자료는 서열이 있다 값 간의 차이가 의미가 있다 영점과 값 간의 비율이 의미가 있다 축구선수들의 배번 자동차 메이커 학급의 석차 KBO리그 순위 온도 여성복 사이즈 환자수 마케팅 전화 통수 학교까지의 거리
척도의 주요 특징 요약 5. 척도(Scales)의 종류 (1) 명목(Nominal) 척도 : 개체속성의 구분이나 분류이름값 (2) 서열(Ordinal) 척도 : 속(특)성이 순서나 순위의 의미 (3) 구간(등간 : Interval) 척도 : 속성에 숫자 간격을 동일하게 부여 (4) 비율(Ratio) 척도 : 구간(등간) 척도의 속성 + 절대영점(0)이 존재 질 적:연산 불가능 양 적:연산 가능 구 분 분 류(Category) 순 위(Order) 동일간격(Equal Interval) 절대영점(Absolute Zero) 명 목 ○ X 서 열 구간(등간) 비 율 척 도 숫자부여방법 적용가능분석 적용 사례 명 목 확인 분류 빈도, 비모수 통계, 교차분석 성별 분류, 유형 분류, 시장구역 분류 서 열 순위 비교 서열상관, 비모수 통계 상표선호순위, 상품품질순위 등 간 상대적 크기, 간격 비교 모수 통계 태도, 의견, 광고인지도, 상표인지도, 주가지수 비 율 절대적 크기 비교 방송청취율, 구매확률, 나이, 무게, 신문구독률
제 1 장 요 약 1. 의사결정의 구조 2. 통계학의 공부 이유 3. 통계학의 정의와 유형 4. 변수의 유형 제 1 장 요 약 1. 의사결정의 구조 - 문제나 상황인식, 정보수집 및 분석, 해결책 선정과 평가, 해결책 적용 - O-O-D-A 주기 2. 통계학의 공부 이유 3. 통계학의 정의와 유형 - 기술통계학, 추론통계학 4. 변수의 유형 - 질적변수, 양적변수, 이산변수, 연속변수 5. 척도의 주요 특징 - 명목척도, 서열척도, 등간척도, 비율척도