Download presentation
Presentation is loading. Please wait.
1
Team behavior learning using GP
윤 보경 김 광수 이 근섭
2
단계적 학습 상위 수준과 하위 수준 High level decision dribble goto seize kick turn
3
알고리즘 1. 현재 수준을 상위 수준으로 정한다 2. 서버로부터 세계에 대한 정보를 얻는다.
3. 현재 수준이 상위 수준이면 어느 기본 기술을 사용할 지 택한다. 아니면 그대로 4번으로 간다. 4. 기본 기술을 실행한다. 기본 기술이 계속 수행 중이면 2 번으로, 목표를 달성하거나 실패 했을 때 1 번으로
4
GP 의 구현 Boolean function Vector function Action function
kickable() , seizable() , closest() , passable() , shootable() , background() Vector function our goal, peer goal_l , peer goal_r , ball , back , open , teammate , strategic point Action function goto v , dribble v , kick v , turn v , seize
5
GP Tree Kickable ? kick Seizable ? (5, 7) seize turn (4, -1)
7
Evaluation 공의 소유자 변화 전략적 지역 개념 A : 우리편 볼, B: 상대편 볼 C : 어느 쪽의 볼도 아니다.
D : 골이 들어간 경우 전략적 지역 개념 strategic area background
Similar presentations