데이터 사이언스 실무 시계열 분석 기초 유재명
시계열 자료 시계열 = time series time 시간에 따라 (보통 일정 간격으로) 예) 가격, 고객 수, 방문자, 매출 등
교재 Montgomery, Jennings & Kulahci “Introduction to Time Series Analysis and Forecasting” (2nd ed.) Wiley
시계열 분석의 활용 운영/생산 관리 마케팅 금융/재무 경제 인구
시계열 자료의 특징들
랜덤워크(random walk) 의약품 판매량
자기상관(autocorrelation) 화학 공정에서 측정된 점도
선형 추세(linear trend) 미국 연간 치즈 생산량
주기성 또는 계절성(seasonality) 미국 월별 음료 출고량
추세의 변화 전세계 이상 기온
비정상(nonstationary) 주가
복합적 패턴 실업률
이상점 공장 화재
이상점 센서 고장
평활(smoothing)
평활 smoothing 데이터에서 단기적인 변화를 제거하고 매끄럽게 만드는 것 전반적인 추세를 보고 싶을 때 사용한다
미국 의류 판매량 (1992~2003)
이동 평균 moving average 가장 흔히 쓰이는 평활법 일정 기간 간격(예: ±2개월)으로 평균
5개월 이동 평균
이동 중간값 moving median 이동 평균과 동일하나 평균 대신 중간값 사용
5개월 이동 중간값
국소 회귀 local regression 시계열에서 일부를 회귀, 회귀선을 이어붙여 평활
국소 가중 회귀
자기상관
ACF AutoCorrelation Function 1간격, 2간격, 3간격으로 상관계수를 구하는 것
정상 시계열의 ACF
랜덤워크의 ACF
비정상 시계열의 ACF