Linear Model.

Slides:



Advertisements
Similar presentations
신도초 김민희.  어렸을 때 많이 불었던 비눗방울을 다시 불 어보자 너무 빨리 사라지는 게 아쉬워서, 무 슨 방법이 있으면 오랫동안 비눗방울이 남 아있을 수도 있을 것 같다는 생각이 좋아서 연구를 시작하였다.
Advertisements

폭력. 폭력이란 무엇인가 우상의 눈물 물리적인 폭력 ( 최기표 ) VS 지능적인 폭력 ( 임형우, 담임선생님 )
2009 년 & 4/4 분기 건 설 정 보 실건 설 정 보 실. 2 목 차 1. 국민경제에서 건설업의 위치 1) 산업별 경제성장률 ) 산업별 경제성장 기여도 ) GDP 중 건설업 생산비중
0 동일제지에 투자하고픈 이유  골판지업종은 과점화 추세 및 공장가동율 93% 이상으로 가격경쟁 지양 가능성  내년에는 농산물 포장화로 매출 확대 가능성  동일제지 기업군은 골판지 분야에서 거대 세력화 및 점유율 점차 증대  영업이익율 동종업종내 최고  탁월한.
Ch.4 수요관리와 수요예측 Ch.2 수요예측생산 ∙ 운영관리 1. 제 1 절 수요관리의 개념과 중요성 1. 수요관리의 필요성 정확한 수요예측은 사업의 성과를 좌우하는 매우 중요한 과제이다. – 수요는 판매량과 다르다. – 하지만 온갖 불확실성 요소가 난무하는 사업환경에서.
언어의 자서전 소단원 (1) 단원. 언어의 특성 기호성 자의성 사회성 규칙성 창조성 역사성.
지도교사 : 김은이 선생님 연현초등학교 5 학년 조인해 연현초등학교 5 학년 최지원 우리는 항상 먹기 싫은 쓴 약을 먹을 때 달콤한 주스 나 탄산음료와 함께 마시면 쓴 약을 쉽게 먹을 수 있 을 텐데, 사람들은 감기약, 두통약, 영양제등과 같은 알약을 먹을 때 너무나.
2008 년 7 월 24 일 신문기사 자동 분류 시스템 한국과학기술정보연구원 최성필 목차 문서분류시스템의 예시와 정의 자동문서분류시스템의 구조 문서분류 모델 및 알고리즘의 종류 문서분류 모델 별 정확도 실험결과 실험결과에 대한 단상 세 가지 분류모델.
1 박 2 일 !!! 인천마장초등학교 유수아. 1 박 2 일 멤버 인기순 위 1 위 이승기 2 위 엄태웅 3 위 은지원 4 위 김종민, 이수근 ※인터넷에서 본것이기 때문에 사람에따라 서 다를 수 있다. ※
석관중앙교회 5남전도회 석 관 중 앙 교 회 회원 소식 통권 05-04호 발행일 : 2005년 04월 회 장 : 장진호 집사
팀명 : 정효가현팀 팀원 : 김효진, 이가현, 이정민
지역사회복지론 1조. 요양보호시설에 대해서 황성국 임재형 이동영
4월 임신*출산부 영양관리.
Machine Learning to Deep Learning_2
Neural Network - Perceptron
비뇨계통.
금창호(한국지방행정연구원, 자치행정연구실장)
I 문학의 개념과 역할 1. 문학의 개념 (1) 언어 예술로서의 문학 (2) 소통 활동으로서의 문학
분류 (Classification) 2014년 가을학기 강원대학교 컴퓨터과학전공 문양세.
해야 할일 (To-Do List)  해결내용
REC 가격예측 분석 발표자: 김주철.
경제활동인구조사 1997년 실업률 조사의 설계 표본추출방법 가중치 부여 표준오차 편의
김승연(사회복지학 박사, 서울복지시민연대 사회행동위원장)
4. 목적론적 윤리와 의무론적 윤리 01. 경험주의와 이성주의 01. 경험주의와 이성주의 02. 결과론적 윤리와 공리주의
상관분석(Correlation Analysis)
4-4 Comparison of Standard Deviations with the F test
제4장 자연언어처리, 인공지능, 기계학습.
제 7장 회귀분석 회귀분석의 목적 여러변수사이의 관계를 알아본기 위함 단순회귀모형과 다항회귀모형
단순(선형)회귀분석.
Technological Forecasting & social change(2014)
시스템 분석 및 설계.
머신 러닝 2 ㈜ 퀀트랩.
Parallel software Lab. 박 창 규
기 초 통 계 인하대학교 통계학과.
추정의 기본원리 Introduction to Estimation
개항기 조선과 동아시아 박 범 한국역사입문Ⅱ.
월 정례조회.
(신)비취가인천비방진연3종기획1 182,000 ▶ 91,000 (신)비취가인 천비방 진연수
회귀분석.
소금물과 물의 부력 차이 실험 작성자 - 백민준.
제1장 계량경제 이야기 1절 계량경제학이란? 2절 계량경제분석은 왜 필요한가? - 경제현상의 발견 - 경제 이론의 검증
세안의 모든 것 세안의 중요성 세안 용품 종류 폼 클렌징 종류.
인공지능 소개 및 1장.
사과는 왜 갈변 할까? 조장: 31017유수빈 조원:31024이지은.
대구의 부도심 대구의 주요축 동대구 부도심 4조 강민석 / 박성균 / 최은지/ 황재현/김예지.
시간을 거스르는 환유의 비밀 ‘환유 2014’ Beauty. 컨텐츠개발팀.
Sentiment Analysis 유재명.
표면장력에 대한 탐구 조원: 이정민, 장 예서, 김연우, 최현준.
추정의 이론.
온도는 반응 속도에 어떤 영향을 미칠까? 과학 1 학년 1 학기
제2장 통계학의 기초 1절 확률 기본정의 확률의 기본 공리와 법칙 2절 확률변수와 확률분포 3절 정규분포와 관련 분포 정규분포
사도행전 13장 22절 말씀 –아멘 다 윗 을 왕 으 로 세 우 시 고 증 언 하 여 이 르 시 되 내 가 이 새 의 아 들
과학 1 학년 2 학기 생명> 04.태아의 발생 과정은 어떻게 진행될까?[ 4 / 6 ] 수정과 착상 수업계획 수업활동.
<2013 과학탐구 보고서> 우유와 발효유가 일정온도에서 만나면?
후원단체 참여제안서.
6-2. 전해질과 비전해질 구별해 보기 학습 주제 < 생각열기 >
경찰행정과 세미나 결과를 공개해야한다. VS 비공개로 해야한다. 경찰의 근무성적평정 제도.
상황별/유형별 고객응대법.
K Nearest Neighbor.
P 보일의 법칙 - 생각열기 – 기포가 수면으로 올라가면 크기는 어떻게 될까?
Ⅱ. 물질의 특성 물질의 끓는점.
제 12 장 안정화정책.
교육행정 및 경영 제13장 교육재정 (화) 안 봉 직.
(Ⅰ) 독서와 언어의 본질 언어의 본질 1 2 [고등 국어] – 독서와 문법 독서의 본질 (1) 독서의 특성
텍스트 분석 ㈜ 퀀트랩.
다가올 미래는 신흥시장의 시대.
농도가 달라지면 반응속도는 어떻게 변할까? 과학 1 학년 1 학기
CH 5. 반복이 있는 이원 배치법 랜덤化 vs 분할법 (Split-Plot design) 교호작용 (AⅹB) A x B
이제는 의사들이 움직여야 합니다. 의료개혁쟁취투쟁위원회.
ECMiner를 이용한 데이터마이닝 기본교육
Presentation transcript:

Linear Model

ML의 주요 기법 KNN Linear Model SVM Kernel Trick Decision Tree Ensemble

1인당 GDP와 삶 만족 (1)

1인당 GDP와 삶 만족 (2)

1인당 GDP와 삶 만족 (3)

Linear model 전체 데이터의 추세를 나타내는 하나의 직선(평면)을 찾음 가장 오차가 적은 평면을 선택 global method

kNN vs. Linear Model

Bias-Variance 문제 오차(Error) = 편향(Bias)2 + 분산(Var) 편향: 모형이 실제 패턴에서 벗어나서 생김  underfitting 분산: 모형이 잡음에 민감해서 생김  overfitting

LM에서 Bias-Variance 문제 2차원(평면)  점 2개를 잇는 직선이 반드시 존재 3차원(공간)  점 3개를 포함하는 평면이 반드시 존재 차원이 커지면 어떤 데이터도 선형 모형으로 설명(overfitting) 선형 모형은 Bias ↓, Variance ↑ 심지어 데이터의 오차도

BLUE 회귀에서 선형 모형은 RMSE를 최소화 OLS 또는 Least-Square BLUE(Best Linear Unbiased Estimator) 편향되지 않은 선형 모형 중에는 Variance가 가장 작음 Gauss-Markov 정리

LM에서 Bias-Variance 문제 해결책 subset selection shrinkage dimensionality reduction

subset selection 일부 차원(변수)만 사용 best subset: 사용할 변수의 수(차원의 크기)를 미리 정한 상태 에서 가장 좋은 조합을 찾음 stepwise: 모형에서 변수를 하나씩 추가(forward)하거나 제외 (backward)해 나가다가 더 이상 좋아지지 않으면 중단

shrinkage subset selection은 변수를 통째로 넣거나 뺌 shrinkage는 변수의 영향력을 줄이는(shrink) 방법 딥러닝에서도 많이 사용

LM에서 shrinkage method RMSE만 최소화하는 대신 RMSE + (계수의 크기)를 동시에 최적화

Lasso q = 1 w의 절대값의 합도 함께 최소화 w를 0으로 만드는 경향이 있음 변수 선택의 기능

Lasso

Ridge q = 2 w의 제곱의 합도 함께 최소화 대체로 Lasso에 비해 예측력이 좋음 변수 선택 X

Ridge

Elastic Net RMSE + Lasso + Ridge Lambda: 정규화항의 가중치 Alpha: 정규화항에서 Lasso의 비중  CV로 결정