제 5 장 두 변수의 관계 직선화의 방법 두 변수사이에 어떤 관계가 있는가?

Slides:



Advertisements
Similar presentations
2. 속력이 일정하게 증가하는 운동 Ⅲ.힘과 운동 2.여러 가지 운동. 도입 Ⅲ.힘과 운동 2. 여러 가지 운동 2. 속력이 일정하게 증가하는 운동.
Advertisements

6 장. printf 와 scanf 함수에 대한 고찰 printf 함수 이야기 printf 는 문자열을 출력하는 함수이다. – 예제 printf1.c 참조 printf 는 특수 문자 출력이 가능하다. 특수 문자의 미 \a 경고음 소리 발생 \b 백스페이스 (backspace)
1. 도형의 연결 상태 2. 꼭지점과 변으로 이루어진 도형 Ⅷ. 도형의 관찰 도형의 연결상태 연결상태가 같은 도형 단일폐곡선의 성질 연결상태가 같은 입체도형 뫼비우스의 띠.
1.3.1 원의 방정식. 생각해봅시다. SK 텔레콤에서는 중화동에 기지국을 세우려고 한다. 이 기지국은 중화고, 중화우체국, 뚝방에 모두 전파를 보내야 한다. 기지국은 어디에 세워야 할까 ? 중화동의 지도는 다음과 같다 원의 방정식.
Add Your Text 5. 지수함수와 로그함수 1. 지수함수 2. 로그함수 · 지수함수와 그 그래프 · 지수방정식과 지수부등식 · 로그 함수와 그 그래프 · 로그방정식과 로그부등식.
재료수치해석 HW # 박재혁.
제 7 장 함수 사용을 통해 엑셀 정복하기.
DMAIC 기본 Tools A-6. 상관분석 및 회귀 분석.
제 9 장 2변량 자료의 탐색적 분석 왜 그래프를 쓰는가? 그래프처럼 효과적인 통계적 정보의 전달수단이 없기 때문
4.3.3 초기하분포 (Hypergeometric distribution)
3일차 - 가설검정.
(Numerical Analysis of Nonlinear Equation)
수치해석 6장 예제문제 환경공학과 천대길.
제12주 회귀분석 Regression Analysis
통계자료의 탐색적 분석(EDA) 84 제 6 장 확률모형과의 비교 1. 그룹 데이터, 도수 자료
11장. 포인터 01_ 포인터의 기본 02_ 포인터와 Const.
제 3 장 수치요약 ∙ 상자그림 다섯 수치 요약 평균(Mean) – 어떤 경우에는 상당히 불확실 하다. 예를 들면
6장. printf와 scanf 함수에 대한 고찰
3차원 객체 모델링.
일차방정식의 풀이 일차방정식의 풀이 순서 ① 괄호가 있으면 괄호를 먼저 푼다.
Trigonometric Function
제4장 제어 시스템의 성능.
제 1 장 서 론 1. 탐색적 자료분석 - EDA- 1 ◈ EDA(Exploratory Data Analysis) 란?
Ⅲ. 이 차 방 정 식 1. 이차방정식과 그 풀이 2. 근 의 공 식.
Keller: Stats for Mgmt & Econ, 7th Ed
프로그래밍 개요
제 3 장 수치요약 ∙ 상자그림 다섯 수치 요약 평균(Mean) – 어떤 경우에는 상당히 불확실 하다. 예를 들면
자료구조: CHAP 7 트리 –review 순천향대학교 컴퓨터공학과 하 상 호.
제 10 장 다변량 자료의 탐색적 분석 산점도 행렬과 상관계수 행렬
4. 도표 다루기.
(independent variable)
Frequency distributions and Graphic presentation of data
단순회귀분석 (Simple Linear Regression Analysis)
P 등속 직선 운동 생각열기 – 자동차를 타고 고속도로를 달릴 때, 속력계 바늘이 일정한 눈금을 가리키며 움직이지 않을 때가 있다. 이 때 자동차의 속력은 어떠할까? ( 속력이 일정하다 .)
삼각형에서 평행선에 의하여 생기는 선분의 길이의 비
학습 주제 p 운동 에너지란 무엇일까?(2).
1. 2진 시스템.
⊙ 이차방정식의 활용 이차방정식의 활용 문제 풀이 순서 (1)문제 해결을 위해 구하고자 하는 것을 미지수 로 정한다.
논문작성을 위한 연구모형 설정 양동훈.
미분방정식.
Keller: Stats for Mgmt & Econ, 7th Ed 회귀모형의 정형화 Model Building
이차방정식과 이차함수의 관계 이차함수의 그래프와 축의 위치 관계 이차방정식 의 그래프와 축이 만나는 점의 좌표는 이차방정식
선 그리기.
2장. 일차원에서의 운동 2.1 평균 속도 2.2 순간 속도 2.3 분석 모형: 등속 운동하는 입자 2.4 가속도
통계해석 및 오차의 제거.
제 5장 제어 시스템의 성능 피드백 제어 시스템 과도 성능 (Transient Performance)
5장. 선택 알고리즘.
원의 방정식 원의 방정식 x축, y축에 접하는 원의 방정식 두 원의 위치 관계 공통접선 원과 직선의 위치 관계
학 습 목 표 직선의 방정식 직선의 방정식 두 직선의 위치 관계 두 직선의 교점을 지나는 직선 점과 직선 사이의 거리.
1. 접선의 방정식 2010년 설악산.
도함수의 활용 -(4) 함수의 최댓값과 최솟값.
1. 정투상법 정투상법 정투상도 (1) 정투상의 원리
쉽게 배우는 알고리즘 2장. 점화식과 점근적 복잡도 분석
최소의 실험 횟수에서 최대의 정보를 얻기 위한 계획방법 분석방법: 분산분석(Analysis of Variance, ANOVA)
3.3-2 운동 에너지 학습 목표 1. 운동에너지의 정의를 설명할 수 있다. 2. 운동에너지의 크기를 구할 수 있다.
비교분석 보고서 Template 2015.
상관계수.
기체상태와 기체분자 운동론!!!.
7. 힘과 운동 속력이 변하지 않는 운동.
Week 4: 다변수(2변수) 데이터분석 5장_1(산포도: scatter plot) 동영상 1,2,3,4,5
통계학 R을 이용한 분석 제 2 장 자료의 정리.
문장제 쉽게 풀기 -최소공배수 응용 문제.
제 12장  원가추정 강사: 정재을 과목: 원가회계.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
프로그래밍 개론 Ⅰ-실습 2장 데이터와 식①.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
회로 전하 “펌핑”; 일, 에너지, 그리고 기전력 1. 기전력(electro-motive force: emf)과 기전력장치
전류의 세기와 거리에 따른 도선 주변 자기장 세기 변화에 대한 실험적 고찰
강화학습: 기초.
Ch8.기본적인 RL, RC 회로 자연응답, 강제응답, 시정수, 계단입력과 스위치 회로
Presentation transcript:

제 5 장 두 변수의 관계 71 1. 직선화의 방법 두 변수사이에 어떤 관계가 있는가? 통계자료의 탐색적 분석(EDA) 71 제 5 장 두 변수의 관계 1. 직선화의 방법 두 변수사이에 어떤 관계가 있는가? X(독립•설명변수), Y(종속•반응변수) X Y 가 직선인 경우 함수가 볼록 함수인 경우 : (재표현의 사다리를 내려가는 방향으로 Y를 변환) 또는 (올라가는 방향으로 X를 변환) 함수가 오목 함수인 경우 : (재표현의 사다리를 내려가는 방향으로 X를 변환) 또는 (올라가는 방향으로 Y를 변환)

자동차 속도 X와 급제동에 실제 요구되는 거리 Y에 관한 자료 <원 자료> 통계자료의 탐색적 분석(EDA) 72 <직선화에 관한 사례> 자동차 속도 X와 급제동에 실제 요구되는 거리 Y에 관한 자료 <원 자료> < X와 Y의 자료 Dot plot > Y - - 2 - x x 80+ x x - x x - x x x - x 2 x x - x x x x 40+ x x x x x - x x x 2 x x x - x x 2 x x 2 - x x x x - x x x 0+ x ------+---------+---------+---------+---------+---------+X 5.0 10.0 15.0 20.0 25.0 30.0

원 자료의 plot이 곡선 형태를 뛰고 있다. 즉, 일 가능성을 제시 으로 설명변수 변환 직선형태로 변환(산포가 커짐) 통계자료의 탐색적 분석(EDA) 73 - 120+ x Y - - 2 - x x 80+ x x - x x - x x x - x 2 x x - x x x x 40+ x x x x x - xx x2 x x x - x x 2x x 2 - x xx x - x x x 0+ x +---------+---------+---------+---------+--X2 0 150 300 450 600 - 6.0+ - x Y/X - x - x - x x 4.0+ 2 - x x x x x - x x x - x 2 x 2 x - x x x x x x x x x x 2.0+ x x x x x x x x - x x x x - x x x - x x 0.0+ ------+---------+---------+---------+---------+----X 5.0 10.0 15.0 20.0 25.0 원 자료의 plot이 곡선 형태를 뛰고 있다. 즉, 일 가능성을 제시 으로 설명변수 변환 직선형태로 변환(산포가 커짐) 분산의 성질 에서 제동거리 Y 대신 속도당 제동거리 Y/X를 세로축으로 변환(산포의 균일성, 직선형태 확보)

회귀직선의 추정방법(최소제곱법 : least square method) 을 최소화 하는 방법 통계자료의 탐색적 분석(EDA) 74 2. 세 그룹 저항성 직선의 초기 추정 직선 경향의 두 변수간의 회귀식 회귀직선의 추정방법(최소제곱법 : least square method) 을 최소화 하는 방법 계산이 간단하고, 정규성의 가정 아래에서 통계적 추론 문제점) 특이점에 영향을 크게 받는다. EDA의 관점에서는 적합하지 않다. 해결책) 자료점에 저항성이 큰 세 그룹 저항성 직선(three-group resistant line : RLINE) 1) 세 그룹(three group) 자료 점들을 크기 순으로 나열 을 세 그룹 – 왼쪽그룹, 가운데 그룹, 오른쪽 그룹으로 나눈다. 자료수의 할당 그룹 L M R

각 그룹에서의 자료점들로 부터 x와 y의 중위수를 구한다. 통계자료의 탐색적 분석(EDA) 75 2) 요약점 각 그룹에서의 자료점들로 부터 x와 y의 중위수를 구한다. 예를들면, (1,8), (2,6), (3,9), (4,1), (5,10) 요약점(3,8) 왼쪽 그룹(L 그룹), 가운데 그룹(M 그룹), 오른쪽 그룹(R 그룹)의 요약점 3) 기울기 b외 절편 a의 초기 추정 회귀직선 에서의 기울기 는 L 그룹과 R 그룹의 요약점 과 을 연결하는 직선의 기울기 즉, 세 요약점에서의 잔차 의 합을 0으로 하도록 절편 를 정함 따라서

그린버그의 1953년 연구에서 나온 사립 초등학교 학생의 나이와 키에 관한 연구 통계자료의 탐색적 분석(EDA) 76 수치 예 : 사립초등학교 학생 자료 그린버그의 1953년 연구에서 나온 사립 초등학교 학생의 나이와 키에 관한 연구 나이의 변수 : x (측정단위 : 달수), 키의 변수 : y (측정단위 : cm) n=18명 학생번호 나이(x) 키(y) 잔차 r (r=y-83.11-0.4933x) L 1 109 137.6 0.72 2 113 147.8 8.95 3 115 136.8 -3.04 4 116 140.7 0.37 5 119 132.9 -9.11 6 120 145.4 3.09 M 7 121 135.0 -7.80 8 124 133.0 -11.28 9 126 148.5 3.23 10 129 148.3 1.55 11 130 147.5 0.26 12 133 148.8 0.08 R 13 134 133.2 -16.01 14 135 148.7 -1.01 15 137 152.0 1.31 16 139 150.6 -1.08 17 141 165.3 12.63 18 142 149.9 -3.26

x의 중위수는 (126+129)/2=127.5, y의 중위수는 (147.5+148.3)/2=147.9 세 그룹의 요약점 통계자료의 탐색적 분석(EDA) 77 세 그룹 중 M 그룹의 중위수를 구해보자 x의 중위수는 (126+129)/2=127.5, y의 중위수는 (147.5+148.3)/2=147.9 세 그룹의 요약점 기울기 b와 절편 a의 초기 추정치는 결국, 세 그룹 저항성 직선 RLINE의 초기 추정식은 잔차 r은 잔차 1. 6 - * 1 0. 97 - * 3113 + 0 * 00331001 . 8 + 1 * 2 .

가 된다. 이 관계로 부터 절편 와 기울기 의 새로운 추정치 통계자료의 탐색적 분석(EDA) 78 3. 미니탭에서의 저항성 직선 RLINE 좀 더 적합도가 나은 직선을 구해보자. 와 의 초기 추정치를 와 라고 하자. 그 때의 잔차 를 구하게 되는데 이 때 자료 에 세 그룹 저항성 직선을 같은 방법으로 적합 가 된다. 이 관계로 부터 절편 와 기울기 의 새로운 추정치 를 얻게 된다. 새로운 잔차를 구하고, 이들 잔차에 새 저항성 직선을 적합시켜 와 의 추정치 수정 반복 계산을 계속하되 추정치의 변화량이 아주 작으면 더 이상의 작업을 정지

Stat > EDA > Resistant Line…. 79 [미니탭 활용] 저항성 직선 RLINE명령 사용 Stat > EDA > Resistant Line…. Resistant Line Fit: y versus x(OUTPUT) Slope = 0.4286 Level = 91.0071 Half-slope ratio = 0.307 Half-slope ratio=

@ 잔차의 줄기 그림(Graph > Character Graphs > Stem and Leaf….) 통계자료의 탐색적 분석(EDA) 80 @ 잔차의 줄기 그림(Graph > Character Graphs > Stem and Leaf….) Stem-and-leaf of RESI1 N = 18 Leaf Unit = 1.0 1 -1 5 2 -1 1 4 -0 97 9 -0 31000 9 0 0002223 2 0 8 1 1 3 @ 상자 그림 (Graph > Character Graphs > Boxplot….) ----------- * -------------I + I---------- * +---------+---------+---------+---------+---------+------RESI1 -18.0 -12.0 -6.0 0.0 6.0 12.0 최종적인 저항성 직선의 적합식은

<자동차의 속도와 제동거리의 자료> 통계자료의 탐색적 분석(EDA) 81 <자동차의 속도와 제동거리의 자료> 위 자료를 이용한 저항성 직선 (Stat > EDA > Resistant Line ) <출력> Resistant Line Fit: Y/X versus X Slope = 0.0667 Level = 1.4500 Half-slope ratio = 0.920 적합 된 회귀식 : Y/X = 1.4500 + 0.0667X Y = 1.4500 + 0.0667X^2

Manip > Display Data…. --------------- 통계자료의 탐색적 분석(EDA) 82 <잔차 줄기 그림과 상자 그림> Stem-and-leaf of RESI1 N = 50 Leaf Unit = 0.10 6 -1 332110 15 -0 987766555 25 -0 3333222110 25 0 000012223344 13 0 7788 9 1 1222 5 1 599 2 2 0 1 2 1 3 3 <자료의 표현> Manip > Display Data…. --------------- -------I + I------------ * -------+---------+---------+---------+---------+--------RESI1 -1.0 0.0 1.0 2.0 3.0 Data Display Row X Y/X RESI1 FITS2 1 4 0.50000 -1.21667 1.71667 2 7 0.57143 -1.34524 1.91667 3 4 2.50000 0.78333 1.71667 4 7 3.14286 1.22619 1.91667 5 8 2.00000 0.01667 1.98333 25 13 3.53846 1.22179 2.31667 26 14 5.71429 3.33095 2.38333 27 16 2.00000 -0.51667 2.51667 28 17 1.88235 -0.70098 2.58333 47 25 3.40000 0.28333 3.11667 48 24 3.83333 0.78333 3.05000 49 24 3.87500 0.82500 3.05000 50 24 5.00000 1.95000 3.05000

(재표현의 사다리를 내려가는 방향으로 Y를 변환) 또는 (올라가는 방향으로 X를 변환) 변환(재표현) 오목 함수인 경우 : 통계자료의 탐색적 분석(EDA) 83 4. 요약 변환(재표현) 볼록 함수인 경우 : (재표현의 사다리를 내려가는 방향으로 Y를 변환) 또는 (올라가는 방향으로 X를 변환) 변환(재표현) 오목 함수인 경우 : (재표현의 사다리를 내려가는 방향으로 X를 변환) 또는 (올라가는 방향으로 Y를 변환) 세 그룹 저항성 직선 RLINE를 하는 EDA의 절차 1) 자료를 크기가 가급적 같은 세 그룹으로 나누고 2) 각 그룹의 요약 점을 정한다 3) 세 요약 점 중 양끝 점을 이용하여 기울기를 구하고, 세 점의 잔차의 합이 0이되도록하여 절편을 구한다. 4) 잔차를 구하고, 같은 방법으로 잔차를 회귀시켜 얻은 결과를 이용하여 보다 나은 추정치를 구한다. 잔차를 분석하여 회귀분석에서의 특이점을 식별해 낸다.(EDA 기법)