Presentation is loading. Please wait.

Presentation is loading. Please wait.

Technological Forecasting & social change(2014)

Similar presentations


Presentation on theme: "Technological Forecasting & social change(2014)"— Presentation transcript:

1 Technological Forecasting & social change(2014)
Pre-launch new product demand forecasting using the bass model: A statistical and machine learning-based approach Technological Forecasting & social change(2014) Hakyeon Lee Sang Gook Kim Hyun-woo Park Pilsung Kang 혁신경영연구실 강전학

2 목차 Introduction Bass model and pre-launch forecasting Methodology
Results Illustrative example: demand forecasting of 3D TV Conclusions

3 Introduction 연구 배경 연구 동기 시장의 불확실성 증가
신제품 수요 예측은 더욱 어려워지고 있지만 제품 수명의 단축으로 신제품의 수요예측을 과거보다 자주 시행 해야함 충분한 데이터가 있는 기존 제품에 비해 데이터가 적은 신제품에 대한 미래 수요 예측은 어려움 출시 전 예측이 가장 중요, 자본 설비 구입이나 Capacity planning과 같은 사전 의사결정을 도출 과한 수요예측은 지나친 재고, 적은 수요 예측은 기회비용 손실과 점유율 하락을 야기 사전 예측의 중요성에도 불구하고 연구의 발전이 미미 연구 동기 제품 수요 예측은 주로 혁신 확산의 맥락 내에서 주로 수행 혁신이 사회 시스템 내의 구성원들 사이에서 시간이 흐름에 따라 특성 채널을 통해 퍼지는 것 확산 모델의 주요 연구 중 Bass 연구가 기초 Bass 모델의 기본적인 가정은 두 가지 채널(mass media/word-of-mouth)을 통해 확산된다는 것

4 Introduction 연구 동기(계속) 출시 전 예측에서도 주로 Bass 모델이 사용
3가지 접근법으로 구분(Bayesian / subjective / Analogical) Bayesian 출시 전 예측의 시작단계 추가 데이터를 통해 예측 업데이트 가능 초기 출시 전 예측 값이 필요, 출시 후 예측을 업데이트 하는 방법에 초점 Subjective 경영적 판단을 근거로 대수적 추정 절차를 통해 파라미터 추정 적절한 판단을 통해 정확한 파라미터 값을 추정 Analogical 신제품은 유사한 기존 제품과 유사한 확산 형태를 가질 것 신제품과 유사제품들 사이의 유사도를 통해 가중치를 계산, 유사 제품들의 파라미터의 가중합을 통해 신제품 의 파라미터를 도출 유사 제품을 선정할 가이드라인부족,전문가의 주관에 의해 유사도가 좌우 유사 제품들의 파라미터와 속성 사이의 과거 실증적 관계를 이용하여 해결 많은 연구가 진행되고 잇지만 체계화 되어 있지 않음

5 (Input-Output 변수, 알고리즘, 성능 평가 기준) Train Data를 사용하여 알고리즘 최적화
Introduction 연구 목적 통계적 기법과 머신러닝 기법을 통해 Analogical approach가 가지는 한계를 극복 변수들 사이의 고유하거나, 예측 불가능한 관계를 발견해는 것 모델설정 (Input-Output 변수, 알고리즘, 성능 평가 기준) 데이터 수집 및 분할 (Train / Test Data) Train Data를 사용하여 알고리즘 최적화 성능평가 기준을 통해 최적의 모델 정의

6 Introduction 연구 의의 통계적 기법과 머신러닝 기법을 기반으로 출시 전 수요예측을 하는 것은 여러 장점이 존재
기존 제품의 속성과 확산 특징 사이의 신뢰할만한 관계를 발견함으로써, 인간의 조작없이 오로지 이러한 속성 들 만으로 신제품 수요 예측을 가능하게 함 Extrapolation뿐만 아니라 Interpolation을 위해서도 설계되었기 때문에 예측의 정확도가 향상 Bass 확산 모형과 통계적, 머신러닝 기반의 regression 알고리즘을 활용하는 신제품 출시 전 수요예 측의 새로운 접근법 정확도 향상을 위해 Ensemble 모델을 사용

7 Bass model and Pre-launch forecasting
외부적으로 mass media, 내부적으로 word-of-mouth ℎ 𝑡 = 𝑓(𝑡) 1−𝐹(𝑡) =𝑝+𝑞𝐹(𝑡) 𝒉 𝒕 : t시점에서 채택 확률 𝒇(𝒕): 채택의 변화율 𝒏(𝒕): t시점에서의 채택자수 𝑭(𝒕): t시점에 채택한 사람들의 누적비율 𝑵(𝒕): t시점까지의 누적 채택자수 𝒑: 혁신계수(외부효과-’mass media’) 𝒒: 모방계수(내부효과-’word-of-mouth’) 𝒎: 잠재시장 크기 f 𝑡 = 𝑑𝐹(𝑡) 𝑑𝑡 = 𝑝+𝑞𝐹 𝑡 [1−𝐹 𝑡 ] n 𝑡 = 𝑑𝑁(𝑡) 𝑑𝑡 = 𝑝+ 𝑞 𝑚 𝑁 𝑡 [𝑚−𝑁 𝑡 ] F 𝑡 = 1− 𝑒 − 𝑝+𝑞 𝑡 1+ 𝑞 𝑝 𝑒 − 𝑝+𝑞 𝑡 N 𝑡 =𝑀 1− 𝑒 − 𝑝+𝑞 𝑡 1+ 𝑞 𝑝 𝑒 − 𝑝+𝑞 𝑡

8 Bass model and Pre-launch forecasting
외부적으로 mass media, 내부적으로 word-of-mouth Bass 모델 파라미터(m,p,q)를 추정하기위한 방법으로 최소자승법(OLS), 최대우도추정법(MLE), 비 선형 최소자승법(NLS)를 사용 충분한 데이터가 있어야하기때문에 출시 전 신제품 수요예측에 적합하지 않음 ℎ 𝑡 = 𝑓(𝑡) 1−𝐹(𝑡) =𝑝+𝑞𝐹(𝑡) f 𝑡 = 𝑑𝐹(𝑡) 𝑑𝑡 = 𝑝+𝑞𝐹 𝑡 [1−𝐹 𝑡 ] n 𝑡 = 𝑑𝑁(𝑡) 𝑑𝑡 = 𝑝+ 𝑞 𝑚 𝑁 𝑡 [𝑚−𝑁 𝑡 ] F 𝑡 = 1− 𝑒 − 𝑝+𝑞 𝑡 1+ 𝑞 𝑝 𝑒 − 𝑝+𝑞 𝑡 N 𝑡 =𝑀 1− 𝑒 − 𝑝+𝑞 𝑡 1+ 𝑞 𝑝 𝑒 − 𝑝+𝑞 𝑡

9 Bass model and Pre-launch forecasting
Estimating the parameter 데이터가 없는 상황에서 파라미터를 추정하기 위한 방법으로 Bayesian / subjective / Analogical 있음 유사 제품들의 파라미터와 속성 간의 관계를 파악하여 문제를 해결할 수 있으나, 아직 체계적인 방 법이 없음(Sultan et al.(1990); Gatignon et al.(1989); Srivastava et al.(1985)) Bayesian Subjective Analogical Lilien et al.(1981) Rao and Yamada(1988) Lenk and Rao(1990) Xie et al.(1997) Sultan et al.(1990) Lee et al.(2012) 초기 출시 전 예측 값이 필요 예측 값을 통해 출시 후 예측을 업데이트하는 방법 Mahajan and Sharma(1986) Lawrence and Lawton(2012) 시장 잠재력, 최고 판매치 시기, 최고 판매치 등이 필요 값들을 정하는 것 자체가 하나의 문제 Thomas(1985) Ilonen et al.(2006) Bayus(1993) 유사 상품에 대한 명확한 기준이 없음 전문가나 소비자의 판단으로 유사도를 정의

10 Methodology Input Target Overall procedure
Identify the relationship between input and target

11 Methodology Data 87개의 제품에 대하여 판매 데이터 DB 구성
CE historical data: 60개 제품(미국) 각종 논문 및 보고: 21개 제품(미국) 각종 협회 자료: 40개 제품의 판매 기록이 12개 이하인 제품은 삭제 최소자승법을 통해 Bass의 파라미터인 p,q를 추정 평균값으로 P=0.0087, q=0.3273 기존 연구를 통해 제품 속성 DB를 구성할 17개 변수를 선정

12 Methodology Experimental design 과거 판매 기록이 제한적인 상품 제거
87개의 상품 중 파라미터 추정 값이 이상치인 7개 제거 >0.0063, >0.2783 Nominal variable은 Dummy variable로 변환 17개의 변수에서 24개로 증가 Stepwise 방법을 통해 변수 선정

13 Methodology Regression algorithm
6가지의 알고리즘 사용(MLR, k-NN, ANN, SVR, CART, GPR) MLR(Multivariate linear regression) 독립변수와 종속변수의 관계를 선형으로 가정 𝒚 𝒊 는 i번째 상품의 목표 변수, 𝒙 𝒊𝒋 는 i번째 상품의 j번째 변수 회귀계수 𝜷는 최소자승법을 통해 산출 최적의 설명변수를 탐색하기 위해 Stepwise 기법 사용

14 Methodology Regression algorithm k-NN(k- Nearest Neighbor regression)
유사도를 기반으로 가장 인접해 있는 객체로 예측 특정거리 함수를 통해 유사도를 측정, 높을 수록 가중치를 할당 선택된 인접객체의 가중치와 목표 변수의 평균 가중치로 예측 𝑵𝑵 (𝒙𝒕) 는 𝒙 𝒕 의 인접객체, 𝒘 𝒋 는 j번째 인접객체에 할당된 가중치 인접 객체의 수와 가중치 할당 방법이 필요

15 Methodology Regression algorithm ANN(Artificial Neural Network)
Nonparametric regression algorithm 입력 변수와 출력 변수 간의 관계가 비선형이더라도 파악 가능 3개의 Layer로 구성된 Neural Network사용 𝒘 𝒒𝒑 (𝟏) 는 input-hidden 가중치, 𝒘 𝒒 (𝟐) 는 hidden-output 가중치, 𝒈(∙)는 활성함수를 표현 실제 값과 예측 값의 차이의 제곱을 최소화 최적의 가중치를 통해 L을 최소화하는 것 𝒘 𝟏𝟏 (𝟏) 𝒘 𝟏 (𝟐) 𝒘 𝟐 (𝟐) 𝒘 𝟐𝟏 (𝟏) 𝒘 𝟑 (𝟐) 𝒘 𝒒 (𝟐)

16 Methodology Regression algorithm SVR(Support Vector Regression)
Structural risk를 최소화하는 것을 기반 비선형을 ∅(𝒙)을 통해 데이터를 저차원에서 고차원으로 변환해서 표현 Input 벡터 간의 내적 값은 최적화가 필요 Kernel trick K( 𝒙 𝒊 , 𝒙 𝒋 ) = ∅( 𝒙 𝒊 )∙∅( 𝒙 𝒋 ) 가상 공간에서 계산

17 Methodology Regression algorithm
CART(Classification And Regression Tree) 조건에 따라 반복적으로 분할하는 방법 Information gain을 최대화하는 동시에 분할 전과 후의 에러를 최소화 분할 후의 Information gain이 없을 때까지 반복 진행 Over-fitting을 방지하기 위한 가지치기(Pruning)를 수행 새로운 Instance가 속한 Leaf node의 타겟 변수들의 평균값으로 새로운 Instance예측

18 Methodology Regression algorithm GPR(Gaussian Process Regression)
MLR에 베이지안 접근법과 kernel trick을 적용 Y는 input의 선형결합과 Gaussian noise로 표현 Likelihood 결정 데이터를 가장 잘 표현하는 회귀계수의 사후 확률을 산출하여 예측에 사용 테스트 인스턴스 𝒙 𝒕 에서 𝒇 𝒕 의 예측 분포를 가지는 Gaussian posterior 가능한 선형 모델의 결과를 평균으로 하여 산출 SVR,GPR은 kernel trick을 사용함으로 비선형관계까지 파악할 수 있음

19 Methodology Ensemble model
Single prediction model을 training 후 예측력을 높이기 위해서 사용 다양한 알고리즘이나 매개변수, 동일한 알고리즘에 다른 매개변수, 두 방법을 혼용하는 방법 전문가가 선정한 값을 Ensemble의 예측 값으로 사용 회귀분석 알고리즘 조합을 사용, 비교를 통한 검증 분석을 시행

20 Methodology Validation method and performance measure
Analogical prediction model M= 유사 제품의 수, n= 유사성 평가의 차원 수, 𝒘 𝒊 = 차원 i에 대한 중요도 가중치, 𝒙 𝒊𝒋 = 유사도 가중치 𝒑 𝒊𝒋 , 𝒒 𝒊𝒋 = j 제품의 내∙ 외부 영향력 계수 제품 속성은 industry, market, technology, use 중요도 가중치는 쌍대 비교법을 사용 Leave-one-out 검증방법을 통해 예측모델을 평가 상대적으로 적은 데이터의 양을 보완 데이터가 충분한 경우 k-fold cross validation MAE, RMSE를 통해 예측모델 평가 Y는 목표 값, 𝒚 는 예측 값 낮을 수록 좋은 모델

21 Results Variable selection Stepwise기법을 통해서 변수 선정
유의수준 0.05일 때 유의미한 변수 7개 P의 경우 3개, q의 경우 4개의 변수가 양의 관계

22 Results Variable selection Stepwise기법을 통해서 변수 선정 NCG, DDC, EI는 모두 등장
유의수준 0.05이상일 때 유의미한 변수 7개 P의 경우 3개, q의 경우 4개의 변수가 양의 관계 NCG, DDC, EI는 모두 등장 DDC 내 외부적으로 양의 영향을 미침 NCG는 내부, EI는 외부적으로 양의 영향을 미침

23 Results Variable selection Stepwise기법을 통해서 변수 선정 NCG, DDC, EI는 모두 등장
유의수준 0.05이상일 때 유의미한 변수 7개 P의 경우 3개, q의 경우 4개의 변수가 양의 관계 NCG, DDC, EI는 모두 등장 Mass media에서는 DN_R이 양의 영향 Word-of-mouth에서는 IC_O, DN_I가 양의 영향

24 Results Variable selection Analogical prediction model
M= 유사 제품의 수, n= 유사성 평가의 차원 수, 𝒘 𝒊 = 차원 i에 대한 중요도 가중치, 𝒙 𝒊𝒋 = 유사도 가중치 𝒑 𝒊𝒋 , 𝒒 𝒊𝒋 = j 제품의 내 외부 영향력 계수

25 Results Forecasting performances: single models MLR이 가장 좋은 성능을 보임
P에서는 평균보다 42%, q에선 25% 낮은 결과를 보임 P에선 CART, q에선 ANN과 약 두 배의 차이 80개의 상품으로 CART, ANN 모형에 적용하기엔 적음

26 Results Forecasting performances: single models p,q Analogical method
p-SVR과 GPR, q-k-NN과 GPR이 뒤를 이음 충분한 데이터양이 있어야 하지만 80개의 제품에 한정되어 있기 때문에 더 떨어질 수 있음 Analogical method MLR에 비해 p, q 모두 두 배정도의 크기를 가짐 대부분의 기법들이 Analogical method보다 좋은 예측력을 보임

27 Results Forecasting performances: single models 좋은 예측 모델의 조건
0에 가까운 잔차의 평균 잔차의 분산 값이 최대한 좁아야함 Analogical method는 조건에 부합하지 않음 q에선 k-NN, SVR, GPR이 MLR보다 나음 분산 값의 형태에는 큰 차이가 없음 MLR보다 잔차의 평균이 0에 가까움

28 Results Forecasting performances: ensemble models 가장 우수한 조합
57개의 Ensemble 조합 중 MLR+GPR 조합이 가장 우수 MAE, RMSE 모두에서 90%의 향상을 보임 MLR과 비교해서 많은 향상을 보임

29 Results Forecasting performances: ensemble models
𝒑 𝒊𝒋 , 𝒒 𝒊𝒋 = j 제품의 내 외부 영향력 계수 X= bass, y= prediction outcomes Analogical method 랜덤하게 이루어진 분포 특정 구간에 몰려 있음 MLR Analogical에 비해서 개선 되었음 특정 구간 이상부터는 over fitting Q의 값이 음수로 나옴

30 Results Forecasting performances: ensemble models Ensemble model 결과
앞서 나타났던 대부분의 문제들을 해결 결과 회귀 알고리즘이 정확한 예측 값을 나타내었으므로 제품 속성 환경은 유효함 Analogical 보다 통계 및 머신러닝 기반의 회귀 알고리즘의 예측력이 더 좋음 Ensemble의 경우 나타났던 문제들을 해결 추정 값과 실제 값 간의 낮은 상관관계 범위를 넘어선 과잉 예측 음의 결과 생성

31 Illustrative example: demand forecasting of 3D TV
전문가에 의해 7개의 속성값을 선정 MLR과 Ensemble model을 비교 Take off(T1), Peak(T*) 시기를 비교하면 MLR이 살짝 앞섬 연간 수요를 예측하기 위해 잠재 시장의 크기(m)를 평가해야함 이전에는 소비자 조사를 통해 구매의도를 가지고 평가 북미 총 가구수를 사용, 개발된 예측모델을 어떻게 적용할 것인가에 중점

32 Illustrative example: demand forecasting of 3D TV
2010~2014년까지 15년 동안 수요가 발생할 것 첫 해 실 판매량과 예측 판매량을 비교해 예측모델의 타당성을 지지 실-11년 4.5m, 12년 8.4m 예-11년 4.2m, 12년 8.5m 10년엔 과잉 평가되었지만 대체로 비슷하게 나타남

33 Conclusions Conclusions 논문 요약 연구 기여도
통계 및 머신 러닝 알고리즘을 기반으로 출시 전 제품의 수요를 예측 Input-Product attribute DB, Output-Product diffusion DB 6가지의 회귀분석 알고리즘과 예측력을 높이기 위해 Ensemble 모델을 구현 Analogical 모델이 가장 낮은 성능을 보이고 Ensemble 모델이 가장 좋은 성능을 나타냄 북미 3D TV 수요예측을 통해 검증 연구 기여도 통계 및 머신 러닝 기반 회귀 알고리즘을 통해 제품 출시 전 예측하는 새로운 접근법을 제안 해당 알고리즘을 통해 제품의 확산 특징과 속성 간의 관계를 나타냄 제품의 속성 만으로 신제품 수요 예측 제품 출시 전 의사결정으로 발전

34 Conclusions Conclusions(계속) 연구 한계점 상품의 DB가 충분하고 적절하게 유지 되어야함
예측모델에 사용되는 데이터는 통계 및 머신러닝 알고리즘에 적합하지 않을 수도 있음 가능한 많은 데이터를 모으기 때문에 Data의 유효성이 의심 접근법의 성능은 예측모델에 사용되는 상품 DB에 의존 17개의 변수를 사용했지만 적을 수 있음 국가나 산업의 상황에 따라 변수가 변할 수 있음 제품 확산에 상황 별 요인을 파악하는 연구가 필요 Data


Download ppt "Technological Forecasting & social change(2014)"

Similar presentations


Ads by Google