Team behavior learning using GP 윤 보경 김 광수 이 근섭
단계적 학습 상위 수준과 하위 수준 High level decision dribble goto seize kick turn
알고리즘 1. 현재 수준을 상위 수준으로 정한다 2. 서버로부터 세계에 대한 정보를 얻는다. 3. 현재 수준이 상위 수준이면 어느 기본 기술을 사용할 지 택한다. 아니면 그대로 4번으로 간다. 4. 기본 기술을 실행한다. 기본 기술이 계속 수행 중이면 2 번으로, 목표를 달성하거나 실패 했을 때 1 번으로
GP 의 구현 Boolean function Vector function Action function kickable() , seizable() , closest() , passable() , shootable() , background() Vector function our goal, peer goal_l , peer goal_r , ball , back , open , teammate , strategic point Action function goto v , dribble v , kick v , turn v , seize
GP Tree Kickable ? kick Seizable ? (5, 7) seize turn (4, -1)
Evaluation 공의 소유자 변화 전략적 지역 개념 A : 우리편 볼, B: 상대편 볼 C : 어느 쪽의 볼도 아니다. D : 골이 들어간 경우 전략적 지역 개념 strategic area background