Regularization 과적합(overfitting) 문제 Machine Learning.

Slides:



Advertisements
Similar presentations
학번 이름 김정현 1차 프로젝트 발표 2D 게임프로그래밍. 목차 1. 게임 컨셉 2. 게임 설명 2/10 3. 개발 범위 4. 개발 일정 5. 자체 평가.
Advertisements

©2004 by South-Western/Thomson Learning 1 베이커리소비자 개인소비가치에 따른 유기농제품의 소비태도가 구매 후 만족도에 미치는 영향 이 윤 희이 윤 희 지도교수 : 진양호 교수님.
제10주제. 해방정국과 신탁통치문제 8.15는 일제의 식민지에서 해방된 기쁨의 상징으로 일컬어짐.
Introduction of Deep Learning
Training Neural Networks
Machine Learning to Deep Learning_2
Multiple features Linear Regression with multiple variables (다변량 선형회귀)
Lec 4 Backpropagation & Neural Network
Neural Network - Perceptron
판별분석의 개념과 적용(→ 추계통계적 성격)
REC 가격예측 분석 발표자: 김주철.
Chapter 5. Q-LEARNING & DEEP SARSA
(Statistical Modeling)
단순(선형)회귀분석.
Computational Finance
11장. 적응 신호처리 11.1 랜덤신호처리 11.2 적응 시스템 11.3 적응 신호처리의 예 11.4 적응 알고리즘
제7장 손익분기점분석 1. 들어가기 학습목표 - 손익분기점의 개념을 이해할 수 있다. - 영업레버리지와 BEP분석의 관계를 알 수 있다. - 손익분기점을 산출하는 방법을 습득할 수 있다. 학습내용 - 손익분기점의 의의 - 영업레버리지 분석으로서의 BEP분석 - BEP 측정공식.
2016년 9월 전자전기컴퓨터공학부 김한준 소프트웨어시스템 실습 2016년 9월 전자전기컴퓨터공학부 김한준
제 3 장 신경회로망 (Neural Networks)
5. 비제약 최적설계의 수치해법 (Numerical Methods for Unconstrained Optimum Design)
위험물 제조소 등의 종류 주식회사 한국소방엔지니어링.
위험물 제조소 등의 종류 구재현 목원대학교 소방안전관리학과.
머신 러닝 2 ㈜ 퀀트랩.
Machine Learning to Deep Learning
개요 신경회로망(Neural Networks)
호스피스간호.
인공 신경망의 종류 Hopfield Self-Organizing Map Perceptron
Optimization for Training Deep Models
Problem-Based Learning
노출영역 노출영역의 해당 배너들 클릭 시 실제 기획전 페이지로 이동됩니다..
Parallel software Lab. 박 창 규
교육방법 및 교육공학 (컴퓨터 보조 수업; CAI)
AI 전문 인력 양성 교육 교육명 : Embedded Deep Learning (CNN을 이용한 영상인식)
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
경제통계학 개요 사공 용 서강대학교 경제학과.
(제8강) 기술로드맵 발표 및 신기술/신제품 기획
Tensorboard Lecture 데이터 마이닝 최 현영 컴퓨터학부.
딥러닝의 개념들.
Ch06_인공 신경망.
정품 라이센스.
Trajectory Optimization for Full-Body Movements with Complex Contacts
직인생략 두하우컨설팅주식회사 대 표 이 사 조 광 남 주요 학습 내용(1차와 2차 내용 동일) 시간
Sentiment Analysis 유재명.
Contents 선물거래의 개요 15.1 선물거래의 구조 15.2 선물가격의 결정 15.3.
데이터 사이언스 실무 시계열 분석 기초 유재명.
사형제도 반대합니다. 만든이: (네이버)jm5522.
시공 계획 및 계약 관리.
제 10장 인터넷 소비자 비용.
제16장 투자 제1절 신고전학파 투자이론 제2절 토빈의 q이론 제3절 옵션이론 제4절 건축투자 제5절 재고투자 제6절 맺음말.
3장 인터넷 마케팅의 개념 및 특징.
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
진행상황 박노열.
탄력성과 그 응용.
Neural Networks & Deep Learning
제8장. 입지계획과 분석 (CHAPTER 08. Location Planning and Analysis)
K Nearest Neighbor.
성전기공식(안) 식 순 1. 기공미사 2. 기 공 식 3. 축 하 연 천주교 수원교구 퇴촌성당.
Linear Model.
사용자 선호도를 고려한 머신러닝 기반의 천연 클렌징오일 제조
다층 퍼셉트론의 학습과 최적화 알고리즘 부산대학교 전자전기컴퓨터공학과 김민호.
신경망 (Neural Networks) (Lecture Note #23)
선물 1 선물거래의 기초개념 2 선물시장의 구조와 증거금제도 3 선물거래자의 유형과 선물시장의 경제적 기능 4 선물의 가격결정
품사 분류의 기준과 실제.
Progress Seminar 선석규.
Progress Seminar 신희안.
[ 딥러닝 기초 입문 ] 2. 통계적이 아니라 시행착오적 회귀분석 by Tensorflow - Tensorflow를 사용하는 이유, 신경망 구조 -
Python 라이브러리 딥러닝 강의소개 정성훈 연락처 : 이메일 :
Deep Learning Basics Junghwan Goh (Kyung Hee University)
Model representation Linear regression with one variable
제11장 파생금융시장 선물시장 옵션시장.
Presentation transcript:

Regularization 과적합(overfitting) 문제 Machine Learning

예: 선형회귀(집 가격) Price Price Price Size Size Size 과적합(Overfitting): 특징이 너무 많으면, 학습된 가설(hypothesis)은 훈련자료에 아주 잘 일치할 것이다, ( ), 그러나, 새로운 자료에 대한 일반화 (새로운 자료에 대한 가격예측)는 실패한다.

예: 로지스틱 회귀 x1 x2 x1 x2 x1 x2 ( = sigmoid function)

과적합(overfitting) : 집 크기 방의 개수 Price 층의 개수 집의 나이 이웃의 평균 수입 Size 부엌 크기

Addressing overfitting: Options: 특징 개수 줄이기. 사용할 특징들은 인위적으로 선택한다. 모델 선택 알고리즘(later in course). 정규화(Regularization). 모든 특징들을 유지하지만, 파라메타 의 크기/값을 감소시킨다. 각각의 특징들이 를 예측하는데 조금씩 기여하는 많은 특징들을 가질 때 잘 작동된다.

Regularization Cost function Machine Learning

Intuition 우리가 벌칙을 가하여 를 정말 작게 만든다고 가정하자. Price Price Size of house 우리가 벌칙을 가하여 를 정말 작게 만든다고 가정하자.

정규화(Regularization). Housing: Features: Parameters: 파라메타들 에 대하여 작은 값들 파라메타들 에 대하여 작은 값들 “더 단순한” 가설(hypothesis) 과적합될 경향이 더 적음 Housing: Features: Parameters:

Regularization. Price Size of house

정규화된 선형회귀에서, 우리는 다음을 최소화하는 를 선택한다. 만약, 가 지극히 큰 값으로 설정되면 (아마도 우리 문제에 너무 큰, 예를 들어 )? 알고리즘은 잘 동작한다; 를 매우 크게 설정함은 해를 줄 수 없다. 알고리즘은 과적합을 제거하는데 실패한다. 알고리즘은 저적합(underfitting)을 낳는다. (훈련자료에 잘 일치시키는데 실패한다). 경사하강법은 수렴에 실패한다.

정규화된 선형회귀에서, 우리는 다음을 최소화하는 를 선택한다 정규화된 선형회귀에서, 우리는 다음을 최소화하는 를 선택한다 만약, 가 지극히 큰 값으로 설정되면 (아마도 우리 문제에 너무 큰, 예를 들어 )? Price Size of house

Regularized linear regression Regularization Regularized linear regression Machine Learning

Regularized linear regression

Gradient descent Repeat

Normal equation

Non-invertibility (optional/advanced). Suppose , (#examples) (#features) If ,

Regularized logistic regression Regularization Regularized logistic regression Machine Learning

Regularized logistic regression. x1 x2 Cost function:

Gradient descent Repeat

Advanced optimization function [jVal, gradient] = costFunction(theta) jVal = [ ]; code to compute gradient(1) = [ ]; code to compute gradient(2) = [ ]; code to compute gradient(3) = [ ]; code to compute gradient(n+1) = [ ]; code to compute