Presentation is loading. Please wait.

Presentation is loading. Please wait.

의사결정분석과 게임 이론 Decision Analysis and Game Theory

Similar presentations


Presentation on theme: "의사결정분석과 게임 이론 Decision Analysis and Game Theory"— Presentation transcript:

1 의사결정분석과 게임 이론 Decision Analysis and Game Theory

2 의사결정분석과 게임 이론 15.1 확실성하의 의사결정-계층분석과정 15.2 위험하의 의사결정 15.3 불확실성하의 의사결정 15.4 게임 이론

3 Decision Analysis : Wikipedia
In  Decision analysis(DA) is the discipline comprising the philosophy, theory, methodology, and professional practice necessary to address important decisions in a formal manner. The Decision analysis includes many procedures, methods, and tools for identifying, clearly representing, and formally assessing important aspects of a decision, for prescribing a recommended course of action by applying the maximum expected utility action axiom to a well-formed representation of the decision, and for translating the formal representation of a decision and its corresponding recommendation into insight for the decision maker and other stakeholders.. 

4 15.1 확실성하의 의사결정-계층분석과정(AHP)
AHP (Analytic Hierarchy Process) : Wikipedia The analytic hierarchy process (AHP) is a structured technique for organizing and analyzing complex decisions, based on mathematics and psychology. It has particular application in group decision making, and is used around the world in a wide variety of decision situations, in fields such as government, business, industry, healthcare, and education. Rather than prescribing a "correct" decision, the AHP helps decision makers find one that best suits their goal and their understanding of the problem.

5 15.1 확실성하의 의사결정-계층분석과정 예제 15.1-1 (AHP의 개요)
고 3 Martin Hans : A, B, C 대학에 전액 장학생으로 합격 대학 선택 기준:지리적 위치(Location)와 학문적 평판(Reputation) Martin : 학문적 평판이 지리적 위치보다 5배 만큼 중요 ⇒ 가중치 : 학문적 평판 (83%), 지리적 위치 (17%) 퍼센트 가중치 추정치 기준 A 대학 B 대학 C 대학 위치 12.9 27.7 59.4 평판 54.5 27.3 18.2

6 Martin Hans의 대학 선택 과정

7 (Martin, Jane) Hans의 대학 선택 과정

8 15.1 확실성하의 의사결정-계층분석과정 가중치의 결정 – AHP의 핵심, 대안의 우선 순위 결정
의사 결정자의 시각에 따라 계량화 한 것 𝑎 𝑖𝑗 : 행렬 A의 요소 (𝑖, 𝑗), 1부터 9까지 숫자로 표시 𝑎 𝑖𝑗 = 1 𝑖와 𝑗가 똑 같이 중요하다 𝑖가 𝑗보다 상당히 더 중요하다. 9 𝑖가 𝑗보다 극도로 더 중요하다. 판단의 일관성(consistency), 𝑎 𝑖𝑗 =𝑘 → 𝑎 𝑗𝑖 = 1 𝑘 𝑎 𝑖𝑖 = ( ? )

9 15.1 확실성하의 의사결정-계층분석과정 예제 15.1-2 (비교 행렬 A 및 가중치 구하기) Martin의 의사결정문제
위치(Location, L)와 평판(Reputation, R) Martin : R이 L보다 상당히 중요하다. 𝑎 21 =5, 𝑎 12 = 1 5 ⇒ 𝐴= 𝐿 𝑅 𝐿 𝑅 행렬 A를 표준화(정규화) ⇒ 가중치 행렬 N 생성 𝑁= 𝐿 𝑅 𝐿 𝑅 ⇒ 행 평균 𝑤 𝐿 = ( ) 2 =.17 𝑤 𝑅 = ( ) 2 =.83

10 15.1 확실성하의 의사결정-계층분석과정 예제 15.1-2 (비교 행렬 A 및 가중치 구하기) Martin의 의사결정문제
3개 대학의 상대적 중요성 Martin : R이 L보다 상당히 중요하다. 𝐴 𝐿 = 𝐴 𝐵 𝐶 𝐴 𝐵 𝐶 , 𝐴 𝑅 = 𝐴 𝐵 𝐶 𝐴 𝐵 𝐶 𝐴 𝐿 열의 합 = (8, , ), 𝐴 𝑅 열의 합 = ( , , 5.5)

11 15.1 확실성하의 의사결정-계층분석과정 예제 15.1-2 (비교 행렬 A 및 가중치 구하기) Martin의 의사결정문제
3개 대학의 상대적 중요성 Martin : R이 L보다 상당히 중요하다. 𝑁 𝐿 = 𝐴 𝐵 𝐶 𝐴 𝐵 𝐶 , 행 평균 𝑊 𝐿𝐴 = 𝑊 𝐿𝐵 = 𝑊 𝐿𝐶 = ( ) 3 =.594 𝑁 𝑅 = 𝐴 𝐵 𝐶 𝐴 𝐵 𝐶 , 행 평균 𝑊 𝐿𝐴 = 𝑊 𝐿𝐵 = 𝑊 𝐿𝐶 =

12 15.1 확실성하의 의사결정-계층분석과정 비교 행렬의 일관성
𝑁= 𝐿 𝑅 𝐿 𝑅 , 𝑁 𝐿 = 𝐴 𝐵 𝐶 𝐴 𝐵 𝐶 , 𝑁 𝑅 = 𝐴 𝐵 𝐶 𝐴 𝐵 𝐶 , A와 𝐴 𝑅 와 일관성이 있다. 𝐴 𝐿 은 일관성이 없다. 행렬 A가 일관성이 있다. ⇒ 𝑎 𝑖𝑗 𝑎 𝑗𝑘 = 𝑎 𝑖𝑘 , 모든 𝑖, 𝑗, 𝑘에 대해

13 15.1 확실성하의 의사결정-계층분석과정 비교 행렬의 일관성 행렬 A가 일관성이 있는 경우
𝑎 𝑖𝑗 𝑎 𝑗𝑘 = 𝑎 𝑖𝑘 , 모든 𝑖, 𝑗, 𝑘에 대해 𝑁= 𝑤 1 𝑤 1 ⋯ 𝑤 1 𝑤 2 𝑤 2 ⋯ 𝑤 2 ⋮ 𝑤 𝑛 ⋮ 𝑤 𝑛 ⋯ ⋮ 𝑤 𝑛 , 𝐴= 1 𝑤 1 𝑤 2 ⋯ 𝑤 1 𝑤 𝑛 𝑤 2 𝑤 ⋯ 𝑤 2 𝑤 𝑛 ⋮ 𝑤 𝑛 𝑤 ⋮ 𝑤 𝑛 𝑤 ⋯ ⋮ 1 ,

14 15.1 확실성하의 의사결정-계층분석과정 비교 행렬의 일관성 행렬 A가 일관성이 있는 경우
𝑨𝒘= 1 𝑤 1 𝑤 2 ⋯ 𝑤 1 𝑤 𝑛 𝑤 2 𝑤 ⋯ 𝑤 2 𝑤 𝑛 ⋮ 𝑤 𝑛 𝑤 ⋮ 𝑤 𝑛 𝑤 ⋯ ⋮ 𝑤 1 𝑤 2 ⋮ 𝑤 𝑛 = 𝑛𝑤 1 𝑛𝑤 2 ⋮ 𝑛𝑤 𝑛 =𝑛 𝑤 1 𝑤 2 ⋮ 𝑤 𝑛 𝑨𝒘=𝑛 𝒘

15 15.1 확실성하의 의사결정-계층분석과정 비교 행렬의 일관성 행렬 A가 일관성이 없는 경우
가중치 행렬 N의 열 𝑖에 속한 𝑛개 원소들의 평균 : 𝑤 𝑖 𝒘 = ( 𝑤 1 , 𝑤 2 ,⋯, 𝑤 𝑛 ) 𝑇 , 𝑨 𝒘 = 𝑛 𝑚𝑎𝑥 𝒘 , 𝑛 𝑚𝑎𝑥 ≥𝑛 𝑛 𝑚𝑎𝑥 가 𝑛에 가까울수록 비교행렬 A가 보다 더 일관성이 있다. 일관성 비율 (Consistency Ratio) : 𝐶𝑅= 𝐶𝐼 𝑅𝐼 A의 일관성 지표 : 𝐶𝐼= ( 𝑛 𝑚𝑎𝑥 −𝑛) (𝑛−1) A의 무작위 일관성 지표 : 𝑅𝐼= 1.98(𝑛−2) 𝑛 , 경험적 값

16 15.1 확실성하의 의사결정-계층분석과정 비교 행렬의 일관성 행렬 A가 일관성이 없는 경우
𝐶𝑅≤0.1이면 일관성의 수준이 수용 가능 𝑛 𝑚𝑎𝑥 값 구하기 𝑨 𝒘 = 𝑛 𝑚𝑎𝑥 𝒘 ⇒ 𝑗=1 𝑛 𝑎 𝑖𝑗 𝑤 𝑗 = 𝑛 𝑚𝑎𝑥 𝑤 𝑖 , 𝑖=1,2,⋯,𝑛 𝑖=1 𝑛 𝑤 𝑖 =1 ⇒ 𝑖=1 𝑛 ( 𝑗=1 𝑛 𝑎 𝑖𝑗 𝑤 𝑗 )= 𝑛 𝑚𝑎𝑥 𝑖=1 𝑛 𝑤 𝑖 = 𝑛 𝑚𝑎𝑥

17 15.1 확실성하의 의사결정-계층분석과정 예제 𝑁 𝐿 = 𝐴 𝐵 𝐶 𝐴 𝐵 𝐶 ⇒ 𝐴 𝐿 = 𝐴 𝐵 𝐶 𝐴 𝐵 𝐶 일관성(X) 𝒘 구하기 ⇒ 𝑤 1 =0.129, 𝑤 2 =0.277, 𝑤 3 =0.594 𝑛 𝑚𝑎𝑥 구하기 ⇒ 𝐴 𝐿 𝑤 = 1 1/2 1/ / = 𝑛 𝑚𝑎𝑥 = =3.0013

18 15.1 확실성하의 의사결정-계층분석과정 예제 𝐶𝐼= ( 𝑛 𝑚𝑎𝑥 −𝑛) (𝑛−1) = ( )/(3-1)= 𝑅𝐼= 1.98(𝑛−2) 𝑛 =1.98(3-2)/3=0.66 𝐶𝑅= 𝐶𝐼 𝑅𝐼 = /0.66= 𝐶𝑅 < 0.1

19 15.2 위험하의 의사결정 위험(risk) 조건하에서 의사결정 대안을 선택한 결과(성과, payoff) ∝ 확률분포
의사결정은 기대치 기준(expected value criterion)에 근거 최대 기대 이윤 or 최소 기대 비용

20 15.2 위험하의 의사결정 15.2-1 의사결정나무에 의한 기대치 기준 기대(평균)이윤의 최대화 또는 기대비용의 최소화
의사결정에 따르는 성과(혹은 비용)은 확률적 의사결정나무 분석

21 15.2 위험하의 의사결정 예제 15.2-1) 주식투자 . $10,000 투자에 대한 1년 동안의 수익 의사결정대안
상승장($) 하락장($) A회사 주식 5,000 -2,000 B회사 주식 1,500 500 발생확률 0.6 0.4

22 15.2 위험하의 의사결정 예제 15.2-1) 주식투자 – 의사결정나무(decision tree) 2200 1100
which stock do you choose? 2200 확률적 사건 (chance event) 의사결정시점 (decision point) 1100

23 15.2 위험하의 의사결정 보조설명 확률적인 상승장과 하락장 ⇒ 자연상태(states of nature)
의사결정문제 = {n개의 자연상태, m개의 의사결정대안} 𝑝 𝑗 (>0) = 상태 𝑗의 발생확률 𝑎 𝑖𝑗 = 상태 𝑗에서 대안 𝑖의 성과 (𝑖=1,2,⋯,𝑚;𝑗=1,2,⋯,𝑛) 대안 𝑖의 기대성과 𝐸𝑉 𝑖 = 𝑎 𝑖1 𝑝 1 + 𝑎 𝑖2 𝑝 2 +⋯+ 𝑎 𝑖𝑛 𝑝 𝑛 𝑖=1,2,⋯,𝑛 / 𝑝 1 + 𝑝 2 +⋯+ 𝑝 𝑛 =1 최선의 대안 이윤 : 𝐸𝑉 ∗ = 𝑚𝑎𝑥 𝑖 𝐸𝑉 𝑖

24 15.2 위험하의 의사결정 15.2-2 기대치 기준의 변형 사후확률(posterior probability)의 결정 : 실험
화폐의 실제 가치와 효용(utility) 사후확률(posterior probability) 추가 실험으로 추정의 정확도를 높이는 경우

25 15.2 위험하의 의사결정 예제 15.2-2) (전문가) 친구의 조언 재무자료 ⇒ (사전확률) 상승장:하락장 = 0.6:0.4
(전문가)친구의 조언 ⇒ 개인적인 조사 추가 수행 친구는 찬성/반대(for/against)의 투자 추천 상승장에서 추천이 ‘찬성’일 확률 90% 하락장에서 추천이 ‘찬성’일 확률 30% 친구의 추가적인 정보가 의사결정에 미치는 영향

26 15.2 위험하의 의사결정 예제 15.2-2) (전문가) 친구의 조언
ν 1 =‘찬성’ 추천, ν 2 =‘반대’ 추천, 𝑚 1 =‘상승장’, 𝑚 2 =‘하락장’ 친구의 조언을 확률로 표시 𝑃 ν 1 | 𝑚 1 =0.9, 𝑃 ν 2 | 𝑚 1 =0.1 𝑃 ν 1 | 𝑚 2 =0.5, 𝑃 ν 2 | 𝑚 2 =0.1 의사결정문제 만일 친구의 조언이 ‘찬성’이라면 주식 A와 B중 어디에 투자? 만일 친구의 조언이 ‘반대’이라면 주식 A와 B중 어디에 투자

27 15.2 위험하의 의사결정 예제 15.2-2) 상승장:하락장 상황 마디 주식 A:B 선택 점(단계)
(decision point) 찬성:반대 상황 마디 (chance event)

28 15.2 위험하의 의사결정 예제 15.2-2) (전문가) 친구의 조언
단계 1. 조건부 확률 𝑃 ν 𝑗 | 𝑚 𝑗 은 다음 표와 같다. 단계 2. 결합확률(joint probability)를 구한다. 𝑃 𝑚 𝑖 , ν 𝑗 =𝑃 ν 𝑗 | 𝑚 𝑖 𝑃 𝑚 𝑖 , For all 𝑖, 𝑗 & P 𝑚 1 =0.6, P 𝑚 1 =0.4 𝑃 ν 𝑗 | 𝑚 𝑗 ν 1 ν 2 𝑚 1 0.9 0.1 𝑚 2 0.5 𝑃 𝑚 𝑗 , ν 𝑗 ν 1 ν 2 𝑚 1 0.54 0.06 𝑚 2 0.20

29 15.2 위험하의 의사결정 예제 15.2-2) (전문가) 친구의 조언
단계 3. 절대확률(absolute probabilities)는 다음과 같다. 𝑃 ν 𝑗 = 𝑎𝑙𝑙 𝑖 𝑃 𝑚 𝑖 , ν 𝑗 for all 𝑗 𝑃 ν 1 = 0.74, 𝑃 ν 2 = 0.26 단계 4. 사후확률은 다음과 같이 구한다. 𝑃 𝑚 𝑖 ν 𝑗 =𝑃 𝑚 𝑖 , ν 𝑗 /𝑃{ ν 𝑗 } 𝑃 𝑚 𝑖 ν 𝑗 ν 1 ν 2 𝑚 1 0.730 0.231 𝑚 2 0.270 0.769

30 15.2 위험하의 의사결정 예제 )

31 Petersburg paradox Toss a fair coin. Toss the coin until the first occurrence of tails. Payoff=2 the number of heads Expected payoff=

32 15.2 위험하의 의사결정 효용함수(utility function) 실제 (화폐)가치보다 효용(utility)을 분석에 사용
예) $20,000 투자 ($40,000 이윤, 투자금 전부 손실)=(0.5, 0.5) 기대 이윤 = ( ) 위험을 감수하는 투자자 : 보수적인 투자자 위험에 대한 주관적인 태도 ⇒ 효용함수 (계량화) $40,000:(-$20,000) ⇒ U($40,000)=100, U(-$20,000)=0

33 15.2 위험하의 의사결정 효용함수(utility function) risk averse(위험 회피적)
risk neutral(위험 중립적) risk seeker(위험 선호적)

34 15.2 위험하의 의사결정 효용함수(utility function) 다양한 현금 수준에 대한 의사 결정자의 위험 성향 계량화
⇒ 유사한 효용함수 U($40,000)=100, U(-$20,000)=0, 범위(-$20,000~$40,000) 현금 가치(-$10000, $0, $10000, $20000, $30000) 효용 계산 현금가 x인 복권 (lottery) ⇒ 기대 효용 𝑈 𝑥 =𝑝𝑈 − −𝑝 𝑈 , 0≤𝑝≤1 = 100 −100𝑝

35 15.2 위험하의 의사결정 효용함수(utility function) U(x) 결정하기 보장된 금액 x
복권 (-$20000 손실 발생 확률 p, $40000 이득 발생 확률 1-p) 1과 2 중에서 어느 것을 선호하는지를 밝혀야 함. p의 값 : 의사 결정자의 위험에 대한 중립도(무선호) 반영 예) 현금 $20000 : p =0.8 (or 0.2)복권의 선호 정도 같음 ⇒ U($20000)= ⅹ0.8=20 (80)

36 15.3 불확실성(uncertainty)하의 의사결정
n 개의 자연 상태와 m 개의 선택 대안 성과 행렬 상태 대안 𝑠 1 𝑠 2 𝑠 𝑛 𝑎 1 ν( 𝑎 1 , 𝑠 1 ) ν( 𝑎 1 , 𝑠 2 ) ν( 𝑎 1 , 𝑠 𝑛 ) 𝑎 2 ν( 𝑎 2 , 𝑠 1 ) ν( 𝑎 2 , 𝑠 2 ) ν( 𝑎 2 , 𝑠 𝑛 ) 𝑎 𝑚 ν( 𝑎 𝑚 , 𝑠 1 ) ν( 𝑎 𝑚 , 𝑠 2 ) ν( 𝑎 𝑚 , 𝑠 𝑛 )

37 15.3 불확실성(uncertainty)하의 의사결정
의사결정기준 (unknown pdf) – 불확실성에 대한 성향 라플라스 (Laplace) 최소최대 (Minimax) 새비지 (Savage) 후르비치 (Hurwicz)

38 15.3 불확실성(uncertainty)하의 의사결정
의사결정기준 (unknown pdf) – 불확실성에 대한 성향 라플라스 (Laplace) 불충분이유의 원칙 (principle of insufficient reason) 모든 상태가 일어날 확률이 같다. 𝑃 1 𝑠 1 = 𝑃 2 𝑠 2 =⋯= 𝑃 𝑛 𝑠 𝑛 = 1 𝑛 가장 좋은 대안 max 𝑎 𝑖 𝑛 𝑗=1 𝑛 ν 𝑎 𝑖 , 𝑠 𝑗

39 15.3 불확실성(uncertainty)하의 의사결정
의사결정기준 (unknown pdf) – 불확실성에 대한 성향 최대최소 이윤(최소최대 손실) – 보수적인 태도 발생 가능한 최악의 조건들 중 가장 좋은 것을 선택 이윤 ⇒ max 𝑎 𝑖 min 𝑠 𝑗 ν 𝑎 𝑖 , 𝑠 𝑗 손실 ⇒ min 𝑎 𝑖 max 𝑠 𝑗 ν 𝑎 𝑖 , 𝑠 𝑗

40 15.3 불확실성(uncertainty)하의 의사결정
의사결정기준 (unknown pdf) – 불확실성에 대한 성향 새비지 (Savage)의 후회(regret) 성과행렬 ν 𝑎 𝑖 , 𝑠 𝑗 를 손실(혹은 후회) 행렬 𝑟 𝑎 𝑖 , 𝑠 𝑗 로 변경 𝑟 𝑎 𝑖 , 𝑠 𝑗 = ν 𝑎 𝑖 , 𝑠 𝑗 − min 𝑎 𝑘 ν 𝑎 𝑘 , 𝑠 𝑗 만약 ν가 손실이면 max 𝑎 𝑘 ν 𝑎 𝑘 , 𝑠 𝑗 −ν 𝑎 𝑖 , 𝑠 𝑗 만약 ν가 이득이면

41 15.3 불확실성(uncertainty)하의 의사결정
의사결정기준 (unknown pdf) – 불확실성에 대한 성향 새비지 (Savage)의 후회(regret) 손실 행렬(최소최대기준) 𝑠 1 𝑠 2 행 최대 ν 𝑎 𝑖 , 𝑠 𝑗 = 𝑎 1 $11,000 $90 𝑎 2 $10,000 후회 행렬(새비지기준) 𝑠 1 𝑠 2 행 최대 ν 𝑎 𝑖 , 𝑠 𝑗 = 𝑎 1 $1,000 $0 𝑎 2 $9,910

42 15.3 불확실성(uncertainty)하의 의사결정
의사결정기준 (unknown pdf) – 불확실성에 대한 성향 후르비치 (Hurwicz) 낙관적(optimistic)부터 비관적(pessimistic) 모두 포함 0≤𝛼≤1, 낙관주의 지수 (index of optimism) α=0, α=1, α=0.5 인 경우 max 𝑎 𝑖 𝛼 max 𝑠 𝑗 ν 𝑎 𝑖 , 𝑠 𝑗 +(1−𝛼) min 𝑠 𝑗 ν 𝑎 𝑖 , 𝑠 𝑗 만약 ν가 이득이면 min 𝑎 𝑖 𝛼 min 𝑠 𝑗 ν 𝑎 𝑖 , 𝑠 𝑗 +(1−𝛼) max 𝑠 𝑗 ν 𝑎 𝑖 , 𝑠 𝑗 만약 ν가 손실이면

43 15.4 게임 이론 (game theory) Game Theory : wikipedia
Game theory is a study of strategic decision making. Specifically, it is "the study of mathematical models of conflict and cooperation between intelligent rational decision-makers". An alternative term suggested "as a more descriptive name for the discipline" is interactive decision theory. Game theory is mainly used in economics, political science, and psychology, as well as logic and biology. The subject first addressed zero-sum games, such that one person's gains exactly equal net losses of the other participant(s).

44 Summer campsite: cost matrix
5 10 18 25 58 a2 8 7 12 23 50 a3 21 72 a4 30 22 19 15 86 A: campsite size S: level of attendance Laplace: 58/4=14.5,50/4=12.5,72/4=18,86/4=21.5 Minimax: 25,23,21,30

45 Regret matrix Hurwicz: s1 s2 s3 s4 Max a1 5: 0 10:3 18:6 25:10 10 a2
8:3 7:0 12:0 23:8 8 a3 21:16 18:11 21:6 6 a4 30:25 22:15 19:7 15:0 25 Hurwicz: min max a=0.5 a1 5 25 25-20a 15 a2 7 23 23-16a a3 12 21 21-9a 16.5 a4 30 30-15a 22.5

46 15.4 게임 이론 (game theory) 𝐵 1 𝐵 2 ⋯ 𝐵 𝑛 𝐴 1 𝑎 11 𝑎 12 𝑎 1𝑛 𝐴 2 𝑎 21
지성을 갖춘(intelligent) 두 사람 / 상충된(conflict) 목표 상대방과 승부를 놓고 경쟁하는 의사결정 상황 두 경기자 A(m개의 전략), B(n개의 전략) 성과 𝐵 1 𝐵 2 𝐵 𝑛 𝐴 1 𝑎 11 𝑎 12 𝑎 1𝑛 𝐴 2 𝑎 21 𝑎 22 𝑎 2𝑛 𝐴 𝑚 𝑎 𝑚1 𝑎 𝑚2 𝑎 𝑚𝑛

47 15.4 게임 이론 (game theory) 𝐵 1 𝐵 2 𝐵 3 𝐵 4 𝐴 1 𝐴 2 𝐴 3
인 Zero-sum 게임의 최적해 이론 예제 ) 독감약 판매 회사 A, B /(라디오, 텔레비전, 신문) 광고 시장점유율 𝐵 1 𝐵 2 𝐵 3 𝐵 4 행 최소 𝐴 1 8 -2 9 -3 𝐴 2 6 5 𝐴 3 4 -9 열 최대 순수 안장점 (pure saddle-point)

48 Another example: No pure strategy Mixed strategy:
B1 B2 min A1 1 -1 A2 max No pure strategy Mixed strategy: P(A1)=p B1 expected 2p-1 B2 expected 1-2p

49 15.4 게임 이론 (game theory) 15.4.2 혼합 전략 게임의 해
그래프를 이용한 해 ⇒ 2개의 순수 전략 만이 존재하는 게임 선형계획 ⇒ 모든 2인 영합게임(two-person zero-sum game) 그래프를 이용한 게임 해법 경기자 A 𝐴 1 , 𝐴 2 전략 2ⅹn 게임 확률 𝑦 1 𝑦 2 𝑦 𝑛 전략 𝐵 1 𝐵 2 𝐵 𝑛 𝑥 1 𝐴 1 𝑎 11 𝑎 12 𝑎 1𝑛 1−𝑥 1 𝐴 2 𝑎 21 𝑎 22 𝑎 2𝑛

50 15.4 게임 이론 (game theory) 𝑎 1𝑗 − 𝑎 2𝑗 𝑥 1 + 𝑎 2𝑗 , 𝑗=1,2,⋯,𝑛
혼합 전략 게임의 해 그래프를 이용한 게임 해법 경기자 A 𝐴 1 , 𝐴 2 전략 2ⅹn 게임 B의 j번째 순수 전략에 대한 A의 기대 성과 𝑎 1𝑗 − 𝑎 2𝑗 𝑥 1 + 𝑎 2𝑗 , 𝑗=1,2,⋯,𝑛 경기자 A의 전략 : 최소 기대 성과 최대로 하는 𝑥 1 추구 max 𝑥 min 𝑗 𝑎 1𝑗 − 𝑎 2𝑗 𝑥 1 + 𝑎 2𝑗

51 15.4 게임 이론 (game theory) 15.4.2 혼합 전략 게임의 해 예제 15.4.-3) 𝐵 1 𝐵 2 𝐵 3
𝐵 4 𝐴 1 2 3 -1 𝐴 2 4 6 B의 순수 전략 A의 기대 성과 1 −2 𝑥 1 +4 2 − 𝑥 1 +3 3 𝑥 1 +2 4 −7 𝑥 1 +6

52 15.4 게임 이론 (game theory) 혼합 전략 게임의 해 예제 )

53 15.4 게임 이론 (game theory) 15.4.2 혼합 전략 게임의 해 예제 15.4.-3)
𝑥 1 ∗ =0.5에서 최대 최소해가 됨 ⇒ 𝐴 1 과 𝐴 2 를 같은 확률로 선택 게임값(ν)는 3번, 4번 함수에 𝑥 1 =0.5 대입 ⇒ ν = 5/2 경기자 B는 𝐵 3 과 𝐵 4 를 혼합 ⇒ 𝑦 1 = 𝑦 2 =0, 𝑦 4 =1− 𝑦 3 A의 순수 전략 B의 기대 성과 1 4 𝑦 3 −1 2 − 4𝑦 3 +6 4 𝑦 3 −1=−4 𝑦 3 +6 ⇒ 𝑦 3 = 7 8 , ν=5/2

54 15.4 게임 이론 (game theory) 15.4.2 혼합 전략 게임의 해 선형계획을 이용한 게임 해법
max x i { min ( i=1 n a i1 x i , i=1 n a i2 x i , ⋯, i=1 n a in x i )} x 1 + x 2 +⋯+ x m =1 x i ≥0, i=1,2,⋯, n ν= min 𝑖=1 𝑛 𝑎 𝑖1 𝑥 𝑖 , 𝑖=1 𝑛 𝑎 𝑖2 𝑥 𝑖 , ⋯, 𝑖=1 𝑛 𝑎 𝑖𝑛 𝑥 𝑖 𝑖=1 𝑛 𝑎 𝑖𝑗 𝑥 𝑖 ≥ν,𝑗=1,2,⋯,𝑛

55 15.4 게임 이론 (game theory) 15.4.2 혼합 전략 게임의 해 선형계획을 이용한 게임 해법
Maximize z=ν subject to ν- 𝑖=1 𝑛 𝑎 𝑖𝑗 𝑥 𝑖 ≤0 ,𝑗=1,2,⋯,𝑛 𝑥 1 + 𝑥 2 +⋯+ 𝑥 𝑚 =1 𝑥 𝑖 ≥0, 𝑖=1,2,⋯, 𝑚, ν : 자유변수

56 경기자 B는 최소최대문제(dual problem)
경기자 B의 최적 확률 𝑦 1 , 𝑦 2 ,⋯,𝑦n 구하기 / 최대최소문제 Maximize w=ν subject to ν- 𝑖=1 𝑛 𝑎 𝑖𝑗 𝑦 𝑖 ≤0 ,𝑗=1,2,⋯,𝑚 𝑦 1 + 𝑦 2 +⋯+ 𝑦 𝑛 =1 𝑦 𝑗 ≥0, 𝑗=1,2,⋯, 𝑛, ν : 자유변수

57

58

59 게임의 예(non-cooperative game)
용의자 2 부인 자백 용의자 1 3,3 0,5 5,0 1,1 B 광고자제 광고공세 A 50,50 20,60 60,20 30,30 Dominant strategy and dominated strategy

60 게임의 예-2 사냥꾼 2 사슴 토끼 사냥꾼 1 3,3 0,1 1,0 1,1 B 광고자제 광고공세 A 50,50 20,60
60,20 30,30

61 기초문제 12 연예인들의 사생활에 대한 기사를 주로 다루는 잡지사에 유명 인사의 열애 소문이 포착되었다. 이 스캔들을 기사화하면 다음 호의 판매부수가 증가하여 2억원 정도의 수익증가가 예상된다. 그러나 소문이 사실이 아닐 가능성이 있으며, 이 경우는 명예훼손에 의한 손해배상을 하여야 할 수도 있다. 다양한 경험에 근거하여 추정하여 볼 때 소문이 사실일 확률은 20% 정도는 될 것으로 추정된다. 만일 유명인사는 소문이 사실일 경우 20%, 소문이 거짓인 경우 90% 고소할 것으로 예상된다. 고소된 경우 소문이 사실일 경우는 80%, 거짓일 경우 40% 정도는 잡지사가 승소할 것으로 판단된다. 패소하는 경우 손해규모는 3억원 정도가 될 것이다. 그럼 현재 상황에서 소문을 기사화하여야 하는가?

62 기초문제 12-계속 좀 더 정확한 정보를 얻기 위하여 이 분야 전문가의 도움을 청하고자 한다. 지금까지의 전문가의 신뢰도는 소문이 사실일 경우는 100% 사실이라고 주장하였으며 거짓의 경우도 10%는 사실이라고 잘못된 정보를 주었던 것으로 분석되었다. 이 전문가에게 정보의 대가로 지불할 수 있는 사례금은 어느 정도가 적절한가?

63 Home works 15.6 : A professor of political science wants to predict the outcome of a school board election. 15.17 TriStar plans to open a new plant in Arkansas. 15.37 An investment of 10,000 in a high-risk venture has a chance over the next year of increasing to 15.49 Consider the following two-person, zero sum game: (a) verify that the strategies (1/6,0,5/6)….


Download ppt "의사결정분석과 게임 이론 Decision Analysis and Game Theory"

Similar presentations


Ads by Google