Skip to content. | Skip to navigation

Personal tools

Navigation

You are here: Home / Papers / 연속 행동공간에서의 몬테-카를로 트리 탐색에 관한 연구

이종민, 김건형, and 김기응 (2019)

연속 행동공간에서의 몬테-카를로 트리 탐색에 관한 연구

한국통신학회 하계종합학술발표회.

몬테-카를로 트리 탐색 (Monte-Carlo Tree Search; MCTS)은 온라인 계획 알고리즘으로 다양한 이산 행동공간 문제에서 큰 성공을 거둔 바 있지만, 연속행동공간에서는 우선하여 고려되는 방법론은 아니었다. 이는 트리 탐색을 가능하게 만들기 위해 행동공간을 거칠게 이산화하는 작업이 불가피하기 때문이다. 본 논문에서는 연속 행동공간에서 UCT의 전역적 탐색과 환경의 미분 정보를 활용한 지역적 탐색을 결합하는 방법에 대해 다루고자 한다. 연속 행동공간의 제어문제의 벤치마크 실험 결과는 제안하는 방법론이 다양한 비교 대상 알고리즘의 성능을 능가함을 보여준다.